De cuong(1-11)

96
Chương 1:Định nghĩa Hệ trợ giúp quyết định 1.Định nghĩa hệ hỗ trợ quyết định Có nhiều định nghĩa khác nhau về một hệ DSS, nhưng tất cả đều có 3 điểm chung: (1) Được áp dụng cho các bài toán không có cấu trúc,bán cấu trúc (2) Chỉ hỗ trợ chứ không thay thế quá trình ra quyết định, (3) luôn được đặt dưới sự giám sát của con người. Các đặc trưng của hệ trợ giúp quyết định Được sử dụng trong ngữ cảnh quyết định phi/hoặc nửa cấu trúc Thiên về hỗ trợ chứ không thay thế người ra quyết định Hỗ trợ tất cả các pha của quá trình ra quyết định Chú trọng tới hiệu quả của quá trình hơn là hiệu suất Luôn đạt dưới sự kiểm soát của người dùng DSS Sử dụng các dữ liệu và mô hình của bài toán đặt ra Làm cho quá trình học từ quá khứ của người ra quyết định trở nên dẽ ràng hơn Tương tác một cách thân thiện với người dùng Thông thường được phát triển bởi quá trình lặp và tiến hóa Có khả năng hố trợ nhiều quyết định độc lập hoặc phụ thuộc lẫn nhau Hố trợ việc ra quyết định của nhóm hoặc cá nhân 2. Khả năng của hệ trợ giúp quyết định Các hệ DSS được kỳ vọng là sẽ mở rộng khả năng của người ra quyết định trong việc xử lý thông tin. Các hệ DSS sẽ giải các phần việc tốn kém thời gian của bài toán để tiết kiệm thời gian cho người dùng. Việc sử dụng các DSS có thể cung cấp cho người dùng các lựa chọn mà người dùng có thể không quan sát được. Tuy nhiên, các hệ này luôn bị giới hạn bởi các tri thức được cung cấp. Mỗi DSS đều có số lương tiến trình lập luận giới hạn.

Transcript of De cuong(1-11)

Page 1: De cuong(1-11)

Chương 1Định nghĩa Hệ trợ giuacutep quyết định1Định nghĩa hệ hỗ trợ quyết địnhCoacute nhiều định nghĩa khaacutec nhau về một hệ DSS nhưng tất cả đều coacute 3 điểm chung (1) Được aacutep dụng cho caacutec bagravei toaacuten khocircng coacute cấu truacutecbaacuten cấu truacutec (2) Chỉ hỗ trợ chứ khocircng thay thế quaacute trigravenh ra quyết định (3) luocircn được đặt dưới sự giaacutem saacutet của con người

Caacutec đặc trưng của hệ trợ giuacutep quyết định Được sử dụng trong ngữ cảnh quyết định phihoặc nửa cấu truacutec Thiecircn về hỗ trợ chứ khocircng thay thế người ra quyết định Hỗ trợ tất cả caacutec pha của quaacute trigravenh ra quyết định Chuacute trọng tới hiệu quả của quaacute trigravenh hơn lagrave hiệu suất Luocircn đạt dưới sự kiểm soaacutet của người dugraveng DSS Sử dụng caacutec dữ liệu vagrave mocirc higravenh của bagravei toaacuten đặt ra Lagravem cho quaacute trigravenh học từ quaacute khứ của người ra quyết định trở necircn dẽ ragraveng hơn Tương taacutec một caacutech thacircn thiện với người dugraveng Thocircng thường được phaacutet triển bởi quaacute trigravenh lặp vagrave tiến hoacutea Coacute khả năng hố trợ nhiều quyết định độc lập hoặc phụ thuộc lẫn nhau Hố trợ việc ra quyết định của nhoacutem hoặc caacute nhacircn

2 Khả năng của hệ trợ giuacutep quyết định Caacutec hệ DSS được kỳ vọng lagrave sẽ mở rộng khả năng của người ra quyết định trong

việc xử lyacute thocircng tin Caacutec hệ DSS sẽ giải caacutec phần việc tốn keacutem thời gian của bagravei toaacuten để tiết kiệm

thời gian cho người dugraveng Việc sử dụng caacutec DSS coacute thể cung cấp cho người dugraveng caacutec lựa chọn magrave người

dugraveng coacute thể khocircng quan saacutet được Tuy nhiecircn caacutec hệ nagravey luocircn bị giới hạn bởi caacutec tri thức được cung cấp Mỗi DSS đều coacute số lương tiến trigravenh lập luận giới hạn Vagrave cần nhấn mạnh rằng khocircng tồn tại một ldquoDSS vạn năngrdquo

3Thagravenh phần của DSS Người ta phacircn lọai caacutec thagravenh phần của DSS thagravenh 7 nhoacutem phụ thuộc vagraveo ảnh

hưởng của chuacuteng tới quyết định như thế nagraveo Caacutech tiếp cận khaacutec hướng vagraveo ngocircn ngữ xử lyacute dữ liệu magrave DSS cung cấp Trecircn cơ sở đoacute caacutec thagravenh phần cơ bản của một DSS coacute thể gồm

1 Hệ thống quản lyacute dữ liệu gồm một cơ sở dữ liệu chứa caacutec dữ liệu cần thiết của tigravenh huống vagrave được quản lyacute bởi một hệ quản trị cơ sở dữ liệuPhacircn hệ nagravey coacute thể được kết nối với nhagrave kho dữ liệu của tổ chứcndash lagrave kho chứa dữ liệu của tổ chức coacute liecircn đới đến vấn đề ra quyết định

2 Hệ thống quản lyacute mocirc higravenh cograven được gọi lagrave hệ quản trị cơ sở mocirc higravenh (MBMS) lagrave goacutei phần mềm gồm caacutec thagravenh phần về thống kecirc tagravei chaacutenh khoa học quản lyacute hay caacutec phương phaacutep định lượng nhằm trang bị cho hệ

thống năng lực phacircn tiacutech cũng coacute thể coacute caacutec ngocircn ngữ mocirc higravenh hoacutea ở đacircy Thagravenh phần nagravey coacute thể kết nối với caacutec kho chứa mocirc higravenh của tổ chức hay ở becircn ngoagravei nagraveo khaacutec

3 Một cocircng cụ tri thức coacute thể hỗ trợ caacutec phacircn hệ khaacutec hay hoạt động độc lập nhằm đưa ra tiacutenh thocircng minh của quyết định đưa ra Noacute cũng coacute thể được kết nối với caacutec kho kiến thức khaacutec của tổ chức

4Giao diện người dugraveng giuacutep người sử dụng giao tiếp với vagrave ra lệnh cho hệ thống Caacutec thagravenh phần vừa kể trecircn tạo necircn HHTQĐ coacute thể kết nối với intranetextranet của tổ chức hay kết nối trực tiếp với Internet

5Chiacutenh caacutec người dugraveng

4Dữ liệu vagrave mocirc higravenh quản lyacute Mối quan tacircm ngagravey cagraveng tăng về giaacute trị dữ liệu đối với một tổ chức chỉ ra rằng

chất lượng vagrave cấu truacutec của CSDL lagrave yếu tố cơ bản xaacutec định sự thagravenh cocircng của DSS

CSDL sẽ tổ chức dữ liệu dưới dạng phacircn cấp logic dưa trecircn mức độ mịn hoacutea dữ liệu

Sự phacircn cấp chứa 4 thagravenh phần tử cơ bản 1CSDL 2 Tập tin 3Bản ghi 4Dữ liệu

Hệ thống quản lyacute CSDL Dữ liệu trong mỗi file coacute cấu truacutec giống nhau (bản ghi) caacutec files coacute thể hoagraven

togravean khaacutec nhau DBMS giữ vai trograve quan trọng trong việc tổ chức files vagrave CSDL DBMS coacute 2 traacutech nhiệm chiacutenh

1 Phối hợp caacutec cocircng việc liecircm quan tới lưu trữ vagrave truy cập thocircng tin2 Duy trigrave sự phụ thuộc logic giữa dữ liệu trong CSDL của DSS vagrave ứng dụng

DSS Caacutec hagravem chức năng trong DBMS

Định nghĩa dữ liệu - cung cấp ngocircn ngữ định nghĩa dữ liệu vagrave cho pheacutep tương quan dữ liệuThao taacutec dữ liệu - cung cấp một ngocircn ngữ truy vấn cho pheacutep nắm bắt vagrave khai thaacutec dữ liệuToagraven vẹn dữ liệu - cho pheacutep người sử dụng để mocirc tả caacutec quy tắc duy trigrave tiacutenh toagraven vẹn vagrave kiểm tra caacutec lỗi

Cơ sở mocirc higravenh Mocirc higravenh lagrave sự đơn giản hoacutea của sự kiện nagraveo đoacute được xacircy dựng để nghiecircn cứu

sự kiện

Cơ sở mocirc higravenh lagrave một biến thể của CSDL Noacute lưu trữ vagrave tổ chức caacutec mocirc higravenh khaacutec nhau magrave DSS sử dụng khi phacircn tiacutech chuacuteng

MBMS lagrave biến thể của DBMS Cơ sở mocirc higravenh chiacutenh lagrave caacutei thể hiện sự khaacutec biệt của một DSS với caacutec hệ

thống thocircng tin khaacutec Tổng quan chức năng của MBMS

Modeling language ndash Cho pheacutep tạo lập caacutec mocirc higravenh quyết định vagrave cung cấp cơ chế liecircn kết nhiều mocirc higravenh để tạo mocirc higravenh phức tạp hơn Model library ndash Lưu trữ vagrave quản lyacute tất cả caacutec mocirc higravenh cung cấp một catalog cugraveng với mocirc tả Model manipulation ndash Cho pheacutep quản lyacute vagrave xử lyacute cơ sở mocirc higravenh với caacutec chức năng (run store query etc) tương tự như caacutec chức năng trong một DBMS

5Cơ sở tri thức của DSS Mọi quyết định đuacuteng đắn đều đogravei hỏi quaacute trigravenh lập luận vagrave quaacute trigravenh nagravey lại

đogravei hỏi thocircng tin Cơ sở tri thức lagrave nơi lưu trữ tất cả caacutec thocircng tin dạng nagravey trong DSS Tri thức coacute thể đơn giản chỉ lagrave caacutec thocircng tin thocirc caacutec quy tắc caacutec heuristics

caacutec ragraveng buộc hoặc kết quả của quaacute khứ Tri thức nagravey khaacutec với thocircng tin cả trong CSDL vagrave cơ sở mocirc higravenh ở chỗ noacute

mang đặc trưng của bagravei toaacuten Nội dung kiến thức cơ sở

Tri thức trong cơ sở tri thức coacute thể được phacircn lagravem 2 loại Facts thể hiện điều chuacuteng ta coi lagrave đuacuteng tại thời điểm cho trước Hypotheses thể hiện caacutec quy tắc hoặc caacutec quan hệ magrave chuacuteng ta tin lagrave tồn tại giữa caacutec facts

Kiến thức thu nhận vagrave truy hồi Một hoặc một vagravei người sẽ thu thập thocircng tin cho cơ sở tri thức Đacircy lagrave những

người được đagraveo tạo đặc biệt về caacutec kỹ thuật để thu thập thocircng tin từ caacutec chuyecircn gia lĩnh vực

Mocirc tơ suy diễn (inference engine) lagrave một phần của cơ sở tri thức Noacute aacutep dụng caacutec quy tắc để lấy ra thocircng tin dưới dạng magrave người dugraveng mong muốn

6Giao diện người dugraveng Giao diecircn người dugraveng lagrave một thagravenh phần được thiết kế để cho pheacutep người

dugraveng truy cập tới caacutec thagravenh phần becircn trong của hệ thống

Thocircng thường giao diện cagraveng gần gũi thigrave cagraveng iacutet đogravei hỏi việc huấn luyện người dugraveng Hatildey suy nghĩ xem coacute bao nhiecircu chương trigravenh Windows dugraveng cugraveng cấu truacutec menu như Microsoft Word

Caacutec chức năng chiacutenh của một giao diện của DSS Communication language vagrave Presentation language

Communication language ndash Cho pheacutep tương taacutec với DSS theo nhiều caacutech xaacutec định caacutec dạng input cung cấp caacutec hỗ trợ cho người dugraveng thu giữ caacutec hội thoại đatilde qua để cải thiện caacutec tương taacutec trong tương lai

Presentation language ndash Cung cấp khả năng thể hiện dữ liệu theo nhiều caacutech cho pheacutep sinh caacutec baacuteo caacuteo chi tiết cung cấp nhiều khung nhigraven khaacutec nhau về dữ liệu

7Vai trograve người dugraveng Trong một DSS người dugraveng cũng lagrave một thagravenh phần của hệ thống giống như

hardware vagrave software User roles Người dugraveng được phacircn thagravenh 5 lớp (decision maker

intermediary maintainer operator and feeder) Patterns of DSS use Lagrave sự phacircn loại tiến theo của caacutec user roles khaacutec nhau

thagravenh 1 trong 4 basic patterns of use Slide tiếp theo sẽ mocirc tả caacutec patterns nagravey

8Caacutec mocirc higravenh sử dụng DSS Subscription mode _nhagrave sản xuất quyết định nhận caacutec baacuteo caacuteo thường

xuyecircn theo dự kiến Terminal mode_ nhagrave sản xuất quyết định tương taacutec trực tiếp với DSS Clerk mode - nhagrave sản xuất quyết định sử dụng hệ thống trực tiếpnhưng

khocircng trực tuyến Đầu ra phản hồi coacute thể mất một thời gian Intermediary mode - nhagrave sản xuất quyết định tương taacutec thocircng qua việc sử

dụng mộthoặc nhiều mocirc higravenh trung gian9Danh mục vagrave lớp của DSSCoacute nhiều phương phaacutep để cố gắng phacircn loại caacutec DSSs

Data-centric and model-centric Formal and ad hoc systems Directed versus nondirected DSSs Procedural and nonprocedural systems Hypertext systems Spreadsheet systems Individual and group DSSs

Caacutec đặc trưng thống nhất của mỗi lược đồ cụ thể giữ vai trograve quan trọng trong việc xaacutec định caacutech tiếp cận tốt nhất để thiết kế một hệ thống mới

Chương 2Quyết định vagrave quyết định của nhagrave sản xuất10Quaacute trigravenh ra quyết định

Quaacute trigravenh ra quyết định gồm coacute 3 giai đoạn (Simon 1977)bull Tigravem hiểu bagravei toaacuten dẫn đến quyết định

+Xaacutec định mục tiecircu tổ chức+Tigravem kiếm vagrave tập hợp dữ liệu+Nhận diện xaacutec định chủ thể bagravei toaacuten+phacircn loại vagrave phaacutet biểu vấn đề

bull Thiết kế (design) phacircn tiacutech vagrave xacircy dựng caacutec diễn trigravenh hagravenh động+Thiết lập mocirc higravenh+Lập bảng tiecircu chuẩn chọn lựa+Tigravem kiếm caacutec phương aacuten+Tiecircn đoaacuten vagrave đo lường caacutec kết cục

bull Chọn lựa (choice) chọn một diễn trigravenh trong tập diễn trigravenh+Giải phaacutep cho mocirc higravenh+Phacircn tiacutech độ nhạy+Chọn (caacutec) phương aacuten tốt nhất+Hoạch định việc hiện thực

tiếp theo giai đoạn chọn lựa lagrave giai đoạn hiện thực (implementation)11Người ra quyết định

Người ra quyết định (decision maker) giữ một vai trograve tacircm thần phacircn liệt vigrave vừa được coi lagrave một bước trong quaacute trigravenh vagrave cũng lại lagrave người tham gia

Phacircn lớp người ra quyết định-Quyết định caacute nhacircn coacute thể lagrave 1 người hoặc một hệ thống maacutey tiacutenh đơn lẻ-Nhiều người ra quyecirct định coacute thể lagrave

+Nhoacutem (group)trong đoacute mọi thagravenh viecircn đều coacute tiếng noacutei trong việc ra quyết định

+Đội(team) Caacutec thagravenh viecircn hỗ trợ một người ra quyết định duy nhất+Tổ chứcTrong đoacute cần sự thỏa thuận chung

12Caacutec kiểu ra quyết định Style lagrave caacutech magrave người quản lyacute ra quyết định

Hiệu lực của mỗi style riecircng biệt phụ thuộc vagraveo ngữ cảnh bagravei toaacuten nhận thức của người ra quyết định vagrave tập caacutec giaacute trị caacute nhacircn của bản thacircn họ

Độ phức tạp của caacutec điều đoacute liecircn kết lại với nhau trong việc higravenh thagravenh decision style

Caacutec kiểu ra quyết định Directive ndash kết hợp đogravei hỏi về cấu truacutec bagravei toaacuten cao với mức độ nhập nhằng thấp

Thocircng thường đacircy lagrave caacutec quyết định coacute bản chất kỹ thuật vagrave đogravei hỏi iacutet thocircng tin Analytical ndash Mức độ nhập nhằng lớn hơn vagrave đogravei hỏi nhiều thocircng tin hơn Conceptual ndash Mức độ nhập nhằng cao vagrave thường gần gũi với caacutech ra quyết định

của con người Behavioral ndash đogravei hỏi lượng dữ liệu nhỏ vagrave thể hiện caacutei nhigraven ngắn hạn Thường

xảy ra xung đột necircn phải dựa vagraveo sự đồng thuận Caacutec kiểu ra quyết định trong thiết kế hệ trợ giuacutep quyecirct định

Những cản trở lớn chiacutenh lagrave phản ứng của người ra quyết định trước aacutep lực vagrave phương phaacutep dugraveng để giải bagravei toaacuten

Viacute dụ đối với những người khocircng chịu được aacutep lực trong dạng directive thigrave giao diện cần cho pheacutep người ra quyết định kiểm soất được hệ thống với khocircng coacute quaacute nhiều dữ liệu đầu vagraveo

Đối với kiểu analytic DSS cần cho pheacutep truy cập tới nhiều nguồn dữ liệu magrave người ra quyết định sẽ phacircn tiacutech

13Khoacute khăn khi xacircy dựng DSS

- Thocircng tin mocirc higravenh cấu truacutec -gt iacutet thocircng tin

- Khả năng của con người (khả năng hiểu biết) chỉ xử lyacute được từ 5-gt9 quaacute trigravenh thocircng tin khaacutec nhau

- Khocircng chắc chắn ( mức độ hoagraven thagravenh vagrave tiacutenh chiacutenh xaacutec)

- Coacute nhiều lựa chọn vagrave đa mục tiecircu

Chương 3Quyết định trong tổ chức

14Tổ chức lagrave gigrave Tổ chức Lagrave 1 hệ thống thống nhất caacutec nguồn tagravei nguyecircnĐược cấu thagravenh bởi caacutec

hệ thống nhỏ hơn ragraveng buộc với nhau bởi caacutec mục tiecircu đề ra

Tổng thể 1 tổ chức sẽ mạnh mẽ hơn rất nhiều so với tất cả caacutec thagravenh phần của noacute cộng lại

Mối liecircn hệ của caacutec quyecirct định Mục điacutech chiacutenh của caacutec tổ chức lagrave đưa ra caacutec quyết định trong mocirci trường kinh doanh Caacutec Quyết định phải phugrave hợp với giới hạncaacutec chiacutenh saacutech caacutec thủ tục vagrave lĩnh vực hoạt động Noacute khocircng phụ thuộc vagraveo người đưa ra quyết định lagrave ai Đoacute coacute thể lagrave 1 caacute nhacircn1 nhoacutem hay thậm chiacute DSSs

Độ đo của quyết địnhNăm khiacutea cạnh ảnh hưởng tới Quyết định

Kết cấu nhoacutem (Group Structure) Vai trograve trong nhoacutem(Group Roles) Quaacute trigravenh lagravem việc(Group Processes) Taacutec phong(Group Style) Quy tăc nhoacutem(Group Norm)

Kết cấu nhoacutem Trong 1 nhoacutem chuẩn caacutec thagravenh viecircn coacute traacutech nhiệm vagrave thẩm quyền ra quyết định như nhau Vai trograve trong nhoacutemTrong nhoacutem caacutec thagravenh viecircn đều coacute vai trograve riecircng vagrave

lagrave 1 phần quan trong trong cả tiến trigravenh Quaacute trigravenh lagravem việcQuaacute trigravenh dugraveng người trong nhoacutem ảnh hưởng tới loại

quyết định gacircy hiệu quả vagrave ảnh hưởng tới cả tiến trigravenh Taacutec phong Coacute phải taacutec phong của người ra quyết định coacute ảnh hưởng tới

chất lượng quyết định cuối khocircng Quy tắc nhoacutemQuy tắc nhoacutem lagrave cực kỳ quan trọng trong việc xaacutec định

hagravenh vi caacutec thagravenh viecircn nhoacutem trong caacutec tigravenh huống xatilde hội Phacircn cấp quyết định trong tổ chức3 cấp

Chiến lược Ban latildenh đạo cấp cao hoặc nhagrave quản lyacute Caacutec quyết định mang tiacutenh lacircu dagravei nhất

Chiến thuật Quản lyacute tầm trung Thực thi caacutec quyết định chiến lược đề ra

Thực hiện

Caacute nhacircn chuyecircn ngagravenh Tự đưa ra caacutec quyết định từng ngagravey

15Năng lực của hệ HTQD

1 HHTQĐ cơ bản hỗ trợ caacutec nhagrave ra quyết định trong caacutec tigravenh huống nửa cấu truacutec vagrave phi cấu truacutec bằng caacutech kết hợp phaacuten xử của con người vagrave xử lyacute thocircng tin bằng maacutey tiacutenh Caacutec bagravei toaacuten như vậy khocircng thểkhocircng thuận tiện giải quyết được chỉ bằng caacutec cocircng cụ maacutey tiacutenh hoacutea hay caacutec phương phaacutep định lượng 2 Phugrave hợp cho caacutec cấp quản lyacute khaacutec nhau từ cao đến thấp 3 Phugrave hợp cho caacute nhacircn lẫn nhoacutem Caacutec bagravei toaacuten iacutet coacute tiacutenh cấu truacutec thường liecircn đới đến nhiều caacute nhacircn ở caacutec đơn vị chức năng hay mức tổ chức khaacutec nhau cũng như ở caacutec tổ chức khaacutec 4 Hỗ trợ cho caacutec quyết định tuần tự liecircn thuộc được đưa ra một lần vagravei lần hay lặp lại 5 Hỗ trợ cho caacutec giai đoạn của quaacute trigravenh ra quyết định tigravem hiểu thiết kế lựa chọn vagrave hiện thực 6 Phugrave hợp cho một số caacutec phong caacutech vagrave quaacute trigravenh ra quyết định 7 Coacute thể tiến hoacutea theo thời gian Người dugraveng coacute thể thecircm bỏ kết hợp thay đổi caacutec phần tử cơ bản của hệ thống 8 Dễ dugraveng vagrave thacircn thiện với người dugraveng 9 Nhằm vagraveo nacircng cao tiacutenh hiệu dụng của quyết định (chiacutenh xaacutec thời gian tiacutenh chất lượng) thay vigrave lagrave tiacutenh hiệu quả (giaacute phiacute của việc ra quyết định) 10 Người ra quyết định kiểm soaacutet toagraven bộ caacutec bước của quaacute trigravenh ra quyết định HHTQĐ chỉ trợ giuacutep khocircng thay thế người ra quyết định 11 Người dugraveng cuối cugraveng coacute thể tự kiến tạo vagrave sửa đổi caacutec hệ thống nhỏ vagrave đơn giản 12 Thường dugraveng mocirc higravenh để phacircn tiacutech caacutec tigravenh huống ra quyết định 13 Cung ứng caacutec truy đạt dữ liệu từ nhiều nguồn dạng thức vagrave kiểu khaacutec nhau 14 Coacute thể dugraveng như một cocircng cụ độc lập hay kết hợp với caacutec HHTQĐứng dụng khaacutec dugraveng đơn lẻ hay trecircn một mạng lưới maacutey tiacutenh (intranet extranet) bất kỳ với cocircng nghệ WEB

16Văn hoacutea tổ chứcVăn hoacutea của tổ chức lagrave tập hợp của rất nhiều thứ (lograveng tin biểu tượng đặc trưng regraven luyện) được phaacutet triển qua thời gian dagravei

Noacute gacircy ra ảnh hưởng mạnh mẽ cograven hơn cả những hoạt động của tổ chức đoacute 10 đặc điểm văn hoacutea của tổ chức

Điều khiển Hệ thống khen thưởng Sự đồng nhất Chịu đựng xung đột Mocirc higravenh giao tiếp Hỗ trợ quản lyacute Sự hogravea nhập Định hướng Chịu đựng rủi ro Caacute nhacircn khởi xướng

Mối quan hệ của văn hoacutea với hiệu năng lagravem việc1 tổ chức thagravenh cocircng phải coacute xu hướng hogravea hợp giữa văn hoacutea với mocirci trường trong vagrave ngoagravei tổ chức

Phugrave hợp trong nội bộ cho thấy một sự kết hợp giữa văn hoacutea của tổ chức với những cocircng nghệ của chiacutenh noacute

Phugrave hợp với becircn ngoagravei cho thấy một nền văn hoacutea phugrave hợp với chiến lược thị trường

Văn hoacutea vagrave sự thay đổi 1 tổ chức magrave khocircng biết thay đổi văn hoacutea sẽ khocircng thể giữ được vị triacute của migravenh trecircn thị trường Caacutec cocircng ty xuất sắc luocircn biết caacutech tiacutech cực tiếp cận khaacutech hagraveng động viecircn đầu tư

17Quyền lực vagrave chiacutenh trịQuyền lực vagrave chiacutenh trị luocircn đi liền với nhau

aQuyền lựclagrave khả năng ảnh hưởng đến việc phacircn phối caacutec nguồn lực trong tổ chứcGồm 5 yếu tố cơ bản

Phacircn quyền Uy quyền Quyền lực caacute nhacircn Sức ảnh hưởng Chiacutenh trị

Một vagravei thagravenh phần của quyền lực ra quyết định Quyết định việc nagraveo coacute sẵn

Quyết định sản phẩm nagraveo được sản xuất Quyết định đầu tư vagraveo đacircu Quyền đặt vagrave quản lyacute quản lyacute giaacute Thanh toaacuten vagrave khấu trừ tiền latildei

bChiacutenh trị Yếu tố cốt lotildei trong quaacute trigravenh higravenh thagravenh chiến lược ra quyết định Chiacutenh trị liecircn quan tới việc ra quyết định thocircng qua đagravem phaacutenảnh hưởngvagrave higravenh

thagravenh sự nhất triacute Trong nhiều trường hợp noacute coacute thể cho ta sự linh hoạt hơn

18Hệ trợ giuacutep quyết định trong tổ chức DSS của 1 tổ chức hỗ trợ cocircng nghệ tập trung vagraveo caacutec quyết định ảnh hưởng tới

rất nhiều người 1 hệ thống DSS hiện đại coacute thể chấp nhận nhiều quyết định vượt qua những giới

hạn phacircn cấp truyền thống aCaacutec hoạt động gần DSS

Giải quyết caacutec nhiệm vụ đặc biệt Thu thập thocircng tin Liecircn lạc qua caacutec chi nhaacutenh Động thaacutei chiacutenh trị

Phacircn loại tư duy chiến lược cho DSS Sắp xếp quyết địnhXếp hạng quyết định sao cho thứ tự đứng trước thigrave được

ưu tiecircn trước Chia sẻ thocircng tinCaacutec quyecirct định coacute thể độc lập nhưng người ra quyết định

phải chia sẻ caacutec thocircng tin liecircn quan Lựa chọn đagravem phaacutenVagravei quyết định coacute thể xaacutec lập thocircng qua đagravem phaacuten vagrave kết

quả được lagravem đồng thờiKhocircng phải cocircng nghệ tự noacute coacute thể đưa ra quyết định magrave noacute nằm ở trigravenh độ cocircng nghệ hỗ trợ caacutec chiến lược quyết định quyền lực vagrave chiacutenh trị cugraveng phối hợp với nhau

Chương 4Mocirc higravenh hoacutea quaacute trigravenh ra quyết định

(Cấu truacutec của hệ HTQD)19Vấn đề Mocirc higravenh

bull Lagrave phần tử chủ chốt trong hầu hết hệ hỗ trợ quyết định vagrave lagrave điều kiện cần trong hệ hỗ trợ quyết định dựa vagraveo mocirc higravenh (model-based DSS)

bull Coacute nhiều lớp mocirc higravenh kegravem theo lagrave caacutec kỹ thuật xử lyacute thao taacutec mocirc higravenh đặc thugrave tương ứng

bull Caacutec vấn đề chiacutenh nhận diện bagravei toaacuten vagrave phacircn tiacutech mocirci trường nhận diện biến số dự baacuteo đa mocirc higravenh caacutec phạm trugrave mocirc higravenh quản lyacute mocirc higravenh vagrave mocirc higravenh hoacutea dựa vagraveo kiến thức

bull Mocirc higravenh hoacutea lagrave taacutec vụ khocircng đơn giản Người xacircy dựng mocirc higravenh phải cacircn bằng giữa tiacutenh đơn giản của mocirc higravenh với caacutec yecircu cầu biểu diễn để mocirc higravenh coacute thể nắm bắt đủ thực tại cần thiết cho người ra quyết định

bull Mocirc phỏng lagrave kỹ thuật mocirc higravenh hoacutea thocircng dụng dugraveng để tigravem hiểu vấn đề tuy khocircng nhất thiết phải tigravem ra được caacutec giải phaacutep biến thể mở rộng quaacute trigravenh ra quyết định của tổ chức vagrave cho pheacutep tổ chức xem xeacutet taacutec độngảnh hưởng của caacutec chọn lựa tương lai

bull Mocirc phỏng tiết kiệm rất nhiều chi phiacute vagrave thời gian ndash rất dễ thay đổi mocirc higravenh hoạt động của một hệ thống vật lyacute bằng mocirc higravenh hoacutea maacutey tiacutenh

bull Mocirc higravenh coacute thể được phaacutet triển vagrave cagravei đặt bằng một số caacutec ngocircn ngữ lập trinh (thế hệ 3 4 ) vagrave hệ thống phần mềm khaacutec nhau

Mocirc higravenh tĩnh vagrave động

bull Mocirc higravenh tĩnh thể hiện bức tranh tại thời điểm của tigravenh huống Caacutec khiacutea cạnh của bagravei toaacuten được xeacutet một thời kỳ nhất định trong một khung thời gian nhất định (coacute thể ldquocuốnrdquo về tương lai) Caacutec tigravenh huống được giả sử lagrave sẽ lập lại với tập caacutec điều kiện đồng nhất

1048713 Giả định coacute được tiacutenh ổn định của dữ liệu 1048713 Mocirc phỏng quaacute trigravenh dạng tĩnh - lagravem việc trecircn caacutec trạng thaacutei ổn định để tigravem ra caacutec

thocircng số tối ưu ndash thường được dugraveng như cocircng cụ chủ yếu để thiết kế quaacute trigravenh 1048713 vd quyết định sản xuấtmua 1 sản phẩm baacuteo caacuteo thu nhập hagraveng quyacutenăm bull Mocirc higravenh động biểu diễn caacutec kịch bản thay đổi theo thời gian 1048713 Phụ thuộc thời gian caacutec trạng thaacutei thay đổi theo thời gian 1048713 Thường dugraveng để tạo sinh vagrave biểu diễn caacutec xu hướng vagrave khuocircn mẫu theo thời gian 1048713 Mocirc phỏng động thể hiện caacutec diễn tiến khi caacutec điều kiện theo thời gian khaacutec với caacutec

trạng thaacutei ổn định ndash thường được dugraveng để thiết kế việc kiểm soaacutet caacutec hệ thống 1048713 VD dự baacuteo lời-lỗ trong 5 năm với caacutec nhập lượng như giaacute phiacute số lượng thay đổi

theo từng năm

Mocirc higravenh chắc chắn tương đối dễ phaacutet triển giải quyết vagrave coacute thể sinh ra caacutec giải phaacutep tối ưu 1048713 Caacutec bagravei toaacuten coacute một số lớnvocirc hạn caacutec giải phaacutep khả thi đặc biệt quan trọng 1048713 Caacutec mocirc higravenh tagravei chaacutenh được xacircy dựng trong điều kiện chắc chắn

Mocirc higravenh bất địnhbằng caacutech thu thập thecircm thocircng tin cố gắng đưa bagravei toaacuten trở về dạng chắc chắn hay dạng

rủi ro Mocirc higravenh rủi ro caacutec quyết định kinh doanh được đưa ra dưới caacutec rủi ro giả định

1048713 Đocirci khi biết được xaacutec suất của caacutec sự kiện xảy ra trong tương lai 1048713 Caacutec trường hợp khaacutec (bất định) ước lượng caacutec rủi ro vagrave giả sử caacutec tigravenh huống rủi ro

xảy ra 20Mocirc higravenh hoacutea

MOcirc HIgraveNH HOacuteA BẰNG BẢNG TIacuteNH bull Bảng tiacutenh phần mềm mạnh linh hoạt vagrave dễ dugraveng cho pheacutep tạo sinh caacutec ứng dụng trong kinh doanh kỹ thuật toaacuten vagrave khoa học với tập caacutec hagravem mạnh về tagravei chaacutenh thống kecirc toaacuten bull Kegravem theo lagrave caacutec thagravenh phần cộng thecircm (add-ins) giuacutep xacircy dựng vagrave giải caacutec lớp mocirc higravenh đặc thugrave bull Lagrave cocircng cụ mocirc higravenh hoacutea thocircng dụng nhất của người dugraveng cuối cugraveng bull Coacute caacutec chức năng về phacircn tiacutech ldquowhat-ifrdquo dograve tigravem mục tiecircu quản lyacute dữ liệu vagrave lập trigravenh (dạng macro) bull Coacute khả năng đọc ghi caacutec cấu truacutec tập tin thocircng dụng để giao tiếp được với caacutec CSDL vagrave cocircng cụ khaacutec bull Coacute thể xacircy dựng mocirc higravenh tĩnh vagrave động bull Dugraveng trecircn maacutey tiacutenh caacute nhacircn vagrave maacutey tiacutenh lớn

bull Cơ sở để xacircy dựng caacutec bảng tiacutenh đa chiều vagrave caacutec cocircng cụ xử lyacute phacircn tiacutech trực tuyến (OLAP) MOcirc HIgraveNH HOacuteA BẰNG PHAcircN TIacuteCH QUYẾT ĐỊNH bull Tiếp cận mocirc higravenh hoacutea caacutec tigravenh huống quyết định coacute một số hữu hạnkhocircng quaacute nhiều caacutec phương aacuten ndash mỗi phương aacuten được trigravenh ra dưới dạng bảng hay đồ thị - caacutec kết quả tương ứng (dự baacuteo được kegravem xaacutec suất) theo mục tiecircu bagravei toaacuten ndash từ đoacute chọn phương aacuten tốt nhất bull Đơn mục tiecircu bảng quyết định hay cacircy quyết định bull Đa mục tiecircu AHP (analytic hierarchy process) khaacutec

MOcirc HIgraveNH HOacuteA BẰNG QUY HOẠCH TOAacuteN

bull Quy hoạch toaacuten học (mathematical programming) lagrave họ caacutec cocircng cụ giải quyết caacutec bagravei toaacuten quản lyacute theo đoacute người ra quyết định phải cấp phaacutet caacutec tagravei nguyecircn khan hiếm cho caacutec hoạt động cạnh tranh nhau (caacutec phương aacuten) nhằm tối ưu hoacutea mục tiecircu coacute khả năng đo lường được bull Caacutec mocirc higravenh quy hoạch tuyến tiacutenh (linear programming) thocircng dụng nhất trong quy hoạch toaacuten coacute nhiều ứng dụng trong thực tế được dugraveng nhiều trong caacutec hệ hỗ trợ quyết định bull Bagravei toaacuten quy hoạch tuyến tiacutenh 1048713 Caacutec biến quyết định (cần tigravem giaacute trị) 1048713 Hagravem mục tiecircu (hagravem toaacuten học dạng tuyến tiacutenh xaacutec định quan hệ giữa biến quyết định vagrave mục tiecircu đo lường mức độ đạt đạt mục tiecircu vagrave cần được tối ưu hoacutea) 1048713 Caacutec hệ số của hagravem mục tiecircu (cho biết mức đoacuteng goacutep vagraveo mục tiecircu của 1 đơn vị biến quyết định) 1048713 Ragraveng buộc (biểu thức tuyến tiacutenh cho biết giới hạn tagravei nguyecircn vagravehay caacutec quan hệ giữa caacutec biến số) 1048713 Dung lượng (mocirc tả cận trecircn vagrave dưới của caacutec biến vagrave ragraveng buộc) 1048713 Hệ số (cocircng nghệ) vagraveo-ra (cho biết mức độ sử dụng tagravei nguyecircn của biến quyết định) bull Đặc điểm của bagravei toaacuten quy hoạch tuyến tiacutenh 1048713 Tagravei nguyecircn kinh tế của bagravei toaacuten lagrave coacute hạn vagrave sẵn sagraveng 1048713 Coacute nhiều caacutech (gt2 caacutech) sử dụng tagravei nguyecircn được gọi lagrave giải phaacutep hay chương trigravenh 1048713 Mỗi hoạt động dugraveng tagravei nguyecircn đều sinh ra kết quả dưới dạng mục tiecircu đatilde phaacutet biểu trước 1048713 Việc cấp phaacutet nằm trong caacutec ragraveng buộc cho trước bull Giả định của bagravei toaacuten quy hoạch tuyến tiacutenh 1048713 Caacutec kết quả của caacutec cấp phaacutet coacute thể đem so saacutenh với nhau coacute thể đo lường bằng một đơn vị chung

1048713 Caacutec cấp phaacutet độc lập với nhau về mặt kết quả 1048713 Kết quả cuối cugraveng lagrave tổng của caacutec kết quả từ caacutec hoạt động riecircng rẽ khaacutec nhau 1048713 Dữ liệu coacute tiacutenh chắc chắn 1048713 Tagravei nguyecircn được dugraveng một caacutech kinh tế nhất 1048713 Thường coacute một số lớn caacutec giải phaacutep với kết quả khaacutec nhau 1048713 Trong số caacutec giải phaacutep coacute thể coacute 1 giải phaacutep tốt nhất ndash mức độ đạt được mục tiecircu cao nhất ndash gọi lagrave giải phaacutep tối ưu được tigravem ra bằng một giải thuật đặc biệt MOcirc HIgraveNH HOacuteA BẰNG HEURISTIC bull Việc tigravem giải phaacutep tối ưu của một số bagravei toaacuten quyết định phức tạp coacute thể tốn nhiều thời gian chi phiacute hay khocircng thể tigravem ra được Cograven nếu dugraveng tiếp cận mocirc phỏng cũng coacute thể keacuteo dagravei phức tạp khocircng thiacutech hợp hay thậm chiacute khocircng chiacutenh xaacutec

bull Lagrave một tiếp cận giuacutep tigravem ra caacutec giải phaacutep khả thithỏa matildenđủ tốt cho caacutec bagravei toaacuten phức tạp Coacute thể coacute giải phaacutep đủ tốt (90-999 giaacute trị của lời giải tối ưu) nhanh choacuteng vagrave đỡ tốn keacutem hơn bằng caacutech dugraveng heuristics bull Quaacute trigravenh heuristic lagrave datildey caacutec bước xacircy dựng caacutec quy luật giải quyết vấn đề thocircng qua việc tigravem kiếm caacutec con đường hứa hẹn nhất dẫn đến lời giải tigravem kiếm caacutech thức thu thập vagrave phacircn giải thocircng tin theo quaacute trigravenh giải vagrave phaacutet triền caacutec phương phaacutep dẫn đến một giải thuật tiacutenh toaacuten hay một lời giải tổng quaacutet đatilde coacute bull Aacutep dụng chủ yếu cho bagravei toaacuten cấu truacutec yếu cũng dugraveng để tigravem ra giải phaacutep chấp nhận được cho bagravei toaacuten cấu truacutec chặt bull Khocircng đủ tổng quaacutet như caacutec giải thuật thường chỉ dugraveng cho tigravenh huống đặc thugrave đang xeacutet bull Coacute thể dẫn đến một giải phaacutep dở - caacutec thủ tục từng bước giải quyết vấn đề khocircng đảm bảo tigravem ra giải phaacutep tối ưu bull Heuristic coacute thể lagrave định lượng vigrave vậy coacute thể đoacuteng vai trograve quan trọng trong cơ sở mocirc higravenh của hệ hỗ trợ quyết định bull Heuristic coacute thể lagrave định tiacutenh vigrave vậy coacute thể đoacuteng vai trograve quan trọng trong cung ứng kiến thức cho hệ chuyecircn gia bull Quaacute trigravenh heuristic liecircn quan đến tigravem kiếm học tập ước lượng phacircn xử vagrave lặp lại caacutec hoạt động nagravey dọc theo tiến trigravenh bull Kiến thức thu được dugrave thagravenh cocircng hay thất bại trong quaacute trigravenh đều được phản hồi vagrave sửa đổi chiacutenh quaacute trigravenh nhờ đoacute coacute thể định nghĩa lại mục tiecircu hay bagravei toaacuten 1048713 Giải thuật di truyền bắt đầu bằng tập caacutec giải phaacutep được sinh ngẫu nhiecircn taacutei kết hợp caacutec cặp giải phaacutep một caacutech ngẫu nhiecircn bull Tigravenh huống necircn dugraveng heuristics 1048713 Dữ liệu đầu vagraveo khocircng chiacutenh xaacutec hay coacute giới hạn 1048713 Thực tế quaacute phức tạp đến nỗi khocircng dugraveng được caacutec mocirc higravenh tối ưu 1048713 Chưa coacute được giải thuật chiacutenh xaacutec vagrave đủ tin cậy 1048713 Bagravei toaacuten phức tạp necircn sẽ khocircng kinh tế nếu dugraveng tối ưu hay mocirc phỏng hoặc tốn quaacute nhiều thời gian tiacutenh toaacuten 1048713 Coacute thể cải thiện tiacutenh hiệu quả của quaacute trigravenh tối ưu (tức coacute thể sinh ra caacutec giải phaacutep ban đầu tương đối tốt) 1048713 Liecircn quan đến xử lyacute kyacute hiệu chứ khocircng phải xử lyacute kyacute số (như hệ chuyecircn gia) 1048713 Cần coacute quyết định nhanh vagrave caacutec xử lyacute dựa vagraveo maacutey tiacutenh đều khocircng khả thi (một số heuristic khocircng cần đến maacutey tiacutenh) bull Thuận lợi 1048713 Dễ hiểu dễ giải thiacutech vagrave dễ cagravei đặt 1048713 Nacircng cao tiacutenh saacuteng tạo vagrave năng lực heuristic cho caacutec vấn đề khaacutec 1048713 Tiết kiệm thời gian xaacutec lập vấn đề 1048713 Tiết kiệm yecircu cầu về bộ chứa vagrave xử lyacute maacutey tiacutenh

1048713 Tiết kiệm thời gian tiacutenh toaacuten vagrave do vậy tiết kiệm thời gian thực trong ra quyết định Một số vấn đề phức tạp đến nỗi chỉ coacute thể giải được bằng heuristics 1048713 Thường sinh ra nhiều giải phaacutep chấp nhận được 1048713 Thường coacute thể phaacutet biểu lyacute thuyết hay đo lường thực nghiệm về chất lượng của giải phaacutep (tức giaacute trị mục tiecircu của giải phaacutep gần với giaacute trị tồi ưu đến mức nagraveo dugrave giaacute trị tối ưu chưa biết được) 1048713 Coacute thể kết hợp tiacutenh thocircng minh vagraveo để hướng dẫn pheacutep tigravem kiếm (tigravem kiếm tabu) Năng lực thocircng minh đoacute coacute thể lagrave đặc thugrave theo bagravei toaacuten hoặc dựa trecircn yacute kiến chuyecircn gia được cấy trong hệ chuyecircn gia hoặc cơ chế tigravem kiếm 1048713 Coacute thể dugraveng heuristic hiệu quả vagraveo caacutec mocirc higravenh coacute thể giải bằng quy hoạch toaacuten học Đocirci khi heuristic lagrave phương phaacutep được ưa thiacutech hơn khi khaacutec giải phaacutep heuristics được dugraveng như giải phaacutep ban đầu cho caacutec phương phaacutep quy hoạch toaacuten học bull Hạn chế 1048713 Khocircng đảm bảo coacute được giải phaacutep tối ưu 1048713 Caacutec quy luật coacute rất nhiều ngoại lệ 1048713 Caacutec lựa chọn quyết định tuần tự coacute thể khocircng tiecircn đoaacuten được caacutec kết cục tương lai của mỗi chọn lựa 1048713 Sự liecircn thuộc giữa caacutec phần trong hệ thống đocirci khi coacute thể gacircy ra caacutec ảnh hưởng lớn lao lecircn toagraven hệ thống bull Phacircn loại caacutec giải thuật heuristic 1048713 Heuristic xacircy dựng xacircy dựng giải phaacutep khả thi bằng caacutech cộng thecircm từng thagravenh phần một VD bagravei toaacuten người baacuten hagraveng ndash luocircn gheacute thagravenh phố chưa viếng thăm kế tiếp gần nhất

1048713 Heuristic cải tiến bắt đầu bằng một giải phaacutep khả thi vagrave cố gắng cải tiến liecircn tục trecircn đoacute VD trecircn thử hoaacuten đổi 2 thagravenh phố 1048713 Quy hoạch toaacuten aacutep dụng vagraveo caacutec mocirc higravenh chứa iacutet ragraveng buộc nhằm coacute được thocircng tin về thỏa hiệp tốt nhất với mocirc higravenh nguyecircn gốc Thường được dugraveng trong tối ưu hoacutea nguyecircn (integer optimization) 1048713 Chia giai đoạn giải quyết một vấn đề theo từng giai đoạn VD ở PampG trecircn đacircy bagravei toaacuten phacircn phối được giải quyết trước sau đoacute dugraveng giải quyết bagravei toaacuten chiến lược sản phẩm 1048713 Phacircn ratilde chia bagravei toaacuten thagravenh caacutec phần nhỏ hơn coacute thể giải quyết được sau đoacute kết hợp caacutec giải phaacutep đoacute lại VD chia latildenh thổ baacuten hagraveng thagravenh 4 vugraveng khaacutec nhau giải quyết cho từng vugraveng sau đoacute kết nối caacutec giải phaacutep

21Mocirc phỏngbull Giả định caacutec đặc điểm của thực tạibull Lagrave kỹ thuật tiến triển caacutec thực nghiệm (như phacircn tiacutech ldquowhat-ifrdquo) - bằng maacutey tiacutenh -trecircn một mocirc higravenh của hệ thocircng tin quản lyacute

bull Khocircng thực sự lagrave một mocirc higravenh vigrave khocircng biểu diễn thực tại magrave lagrave cố gắng bắtchước thực tạibull Một trong những phương phaacutep thocircng dụng nhất trong HHTQĐbull HHTQĐ lagravem việc với caacutec bagravei toaacuten phi cấu truacutec vagrave cấu truacutec yếu tigravenh huống thực tếphức tạp ndash khocircng dễ biểu diễn bằng mocirc higravenh tối ưu hay caacutec dạng mocirc higravenh khaacutecnhưng lại thường coacute thể xử lyacute được bằng mocirc phỏngbull Đặc điểm1048713 Iacutet đưa ra caacutec đơn giản hoacutea về thực tại hơn caacutec mocirc higravenh khaacutec1048713 Do triển khai caacutec thực nghiệm necircn noacute coacute thể kiểm thử caacutec giaacute trị cụ thể của caacutecbiến quyết địnhbiến khocircng kiểm soaacutet được của mocirc higravenh vagrave xem xeacutet ảnh hưởnglecircn caacutec biến kết quả1048713 Phương phaacutep coacute tiacutenh mocirc tả (như vậy khaacutec với phương phaacutep danh định)1048713 Khocircng tự động tigravem kiếm giải phaacutep tối ưu ndash noacute mocirc tảtiecircn đoaacuten caacutec đặc tiacutenh của hệthống đatilde cho dưới caacutec điều kiện khaacutec nhau từ đoacute coacute thể chọn ra phương aacuten tốtnhất1048713 Quaacute trigravenh mocirc phỏng thường lặp lại một thực nghiệm nhiều lần để coacute được ướclượng về hiệu ứng tổng quaacutet của một số hagravenh động nhất định1048713 Mocirc phỏng maacutey tiacutenh thiacutech hợp cho hầu hết caacutec tigravenh huống mặc dugrave cũng coacute một sốmocirc phỏng thủ cocircng thagravenh cocircng1048713 Thường chỉ được dugraveng khi bagravei toaacuten quaacute phức tạp khocircng thể xem xeacutet bằng caacutec kỹthuật tối ưu dạng số Tiacutenh phức tạp theo nghĩa bagravei toaacuten khocircng thể cocircng thức hoacuteacho tối ưu (do khocircng thotildea caacutec giả định) hoặc cocircng thức quaacute lớn quaacute nhiều tươngtaacutec giữa caacutec biến hoặc về bản chất bagravei toaacuten lagrave bất định hay rủi roPhương phaacutep mocirc phỏng thiết lập mocirc higravenh của hệ thống thực vagrave tiến hagravenh caacutec thựcnghiệm lặp lại trecircn mocirc higravenh

bull Thuận lợi1048713 Lyacute thuyết tương đối trực tiếp hiệu ứng dagravei hạn của nhiều chiacutenh saacutech -gt neacuten thờigian lớn1048713 Do tiacutenh chất mocirc tả (khaacutec với danh định)1048713 Coacute thể thấy được nhanh choacuteng coacute thể đặt ra caacutec cacircu hỏi ldquowhat-ifrdquo coacute thể dugravengtiếp cận thử-vagrave-sai vagraveo giải quyết vấn đề một caacutech nhanh choacuteng rẻ chiacutenh xaacutec iacutetrủi ro hơn1048713 Thử nghiệm được biến quyết định phần nagraveo của mocirci trường thực sự quan trọngvới caacutec phương aacuten khaacutec nhau1048713 Yecircu cầu kiến thức riecircng biệt về bagravei toaacuten vigrave thế buộc người xacircy dựng mocirc higravenh phảilagravem việc thường xuyecircn với nhagrave quản lyacute ndash đối tượng mong muốn của HHTQĐ để

từ đoacute bản chất bagravei toaacuten vagrave caacutec quyết định được hiểu tốt hơn1048713 Mocirc higravenh được xacircy dựng từ viễn cảnhcaacutech nhigraven của nhagrave quản lyacute1048713 Mocirc higravenh chỉ cho một bagravei toaacuten riecircng biệt thường khocircng thể dugraveng giải caacutec bagravei toaacutenkhaacutec Như vậy mỗi thagravenh phần của mocirc higravenh ứng với một phần của hệ thống thựcdo đoacute sẽ khocircng yecircu cầu nhagrave quản lyacute phải tổng quaacutet hoacutea caacutec hiểu biết của migravenh1048713 Phổ bagravei toaacuten giải được rất rộng tồn kho nhacircn sự hoạch định chiến lược 1048713 Coacute thể chứa caacutec phức tạp thực sự của bagravei toaacuten khocircng cần caacutec đơn giản hoacutea (TDdugraveng caacutec phacircn phối xaacutec suất thực thay vigrave phacircn phối lyacute thuyết xấp xỉ)1048713 Coacute thể tự động sinh ra nhiều đo lường hiệu năng quan trọng1048713 Thường lagrave phương phaacutep duy nhất của HHTQĐ coacute thể xử lyacute caacutec bagravei toaacuten tương đốiphi cấu truacutec1048713 Coacute một số caacutec goacutei phần mềm mocirc phỏng (Monte Carlo) tương đối dễ dugravengbull Điểm yếu1048713 Tuy thường tigravem được caacutec phương aacuten đủ tốt nhưng khocircng đảm bảo lời giải tối ưu1048713 Quaacute trigravenh xacircy dựng mocirc higravenh thường dagravei vagrave tốn keacutem1048713 Giải phaacutep vagrave suy diễn từ nghiecircn cứu mocirc phỏng thường khocircng thể chuyển sang bagraveitoaacuten khaacutec vigrave mocirc higravenh kết hợp caacutec yếu tố đặc thugrave1048713 Đocirci khi do mocirc higravenh quaacute dễ giải thiacutech cho nhagrave quản lyacute necircn caacutec phương phaacutep phacircntiacutech thường xem nhẹ1048713 Phần mềm mocirc phỏng đocirci khi yecircu cầu caacutec kỹ năng đặc biệt do độ phức tạp củaphương phaacutep giải higravenh thứcbull Caacutec loại mocirc phỏng1048713 Mocirc phỏng xaacutec suất một hay nhiều biến độc lập mang tiacutenh xaacutec suất với 2 loạiphacircn phối ndash thường dugraveng kỹ thuật Monte Carlo1048713 Phacircn phối rời rạc tigravenh huống coacute một số giới hạn caacutec biến cố (biến) với hữu hạncaacutec giaacute trị cho mỗi biến cố (biến)1048713 Phacircn phối liecircn tục tigravenh huống coacute số lượng khocircng giới hạn caacutec biến cố tuacircn theocaacutec hagravem mật độ xaacutec suất như phacircn phối chuẩn1048713 Mocirc phỏng độc lậpphụ thuộc theo thời gian1048713 Độc lập khocircng cần thiết phải biết chiacutenh xaacutec thời điểm xảy ra biến cố (nhu cầutiecircu thụ lượng sản phẩm trong ngagravey khocircng biết chiacutenh xaacutec thời điểm tiecircu thụ)1048713 Phụ thuộc cần biết chiacutenh xaacutec thời điểm xảy ra sự kiện (bagravei toaacuten hagraveng đợi)1048713 Mocirc phỏng tương taacutec trực quan1048713 Mocirc phỏng hướng đối tượng dugraveng tiếp cận hướng đối tượng để xacircy dựng mocirc higravenhmocirc phỏng Chuacute yacute ngocircn ngữ mocirc higravenh hoacutea nhất thể UML (unified modelinglanguage) kể cả khi mocirc phỏng caacutec hệ thời gian thựcMOcirc HIgraveNH HOacuteA ĐA CHIỀU ndash XỬ LYacute PHAcircN TIacuteCH TRỰC TUYẾNbull Người ra quyết định thường phải xem xeacutet nhiều chiều của dữ liệu (TD caacutec chiềucủa dữ liệu baacuten hagraveng lagrave sản phẩm vugraveng thời gian người baacuten ) dữ liệu cần đượcphacircn tiacutech trực tiếp bằng caacutec cocircng cụ chuẩn hay phacircn tiacutech tự động bằng caacutec

phương phaacutep khai mỏ dữ liệu (data mining)bull Hầu hết caacutec hệ thống phacircn tiacutech đa chiều được nhuacuteng trong caacutec hệ xử lyacute phacircn tiacutechtrực tuyến (HXLPTTT ndash online analytic processing - OLAP)bull Mục tiecircu của XLPTTT nắm bắt cấu truacutec của dữ liệu thực để hỗ trợ ra quyết địnhbull Trong HHTQĐ coacute sự gắn nối tự nhiecircn giữa mocirc higravenh hoacutea dữ liệu mocirc higravenh hoacutea kyacutehiệu vagrave caacutec khiacutea cạnh của phacircn tiacutech ldquowhat-ifrdquobull Caacutec baacuteo caacuteo của HXLPTTT đều coacute tiacutenh tương taacutec dễ khai thaacutec sử dụng đặc biệtphugrave hợp cho caacutec baacuteo caacuteo về chỉ số hiệu năng chủ yếu (key performance indicators- KPI) baacuteo caacuteo về đo lường hiệu năng kinh doanh bull Thế hệ hiện tại của HXLPTTT vagrave hệ khai mỏ dữ liệu (data mining) tiacutech hợp caacutecđặc tiacutenh của hệ thocircng tin latildenh đạo (executive information system ndashEIS- nhiềucaacutech nhigraven dữ liệu chi tiết hoacutea theo nhu cầu) vagrave caacutec hệ đồ họa khaacutec ndash thường coacutegiao diện người dugraveng dạng kiểu WEBbull Caacutec hệ thống như trecircn cograven được gọi lagrave caacutec cocircng cụ triacute tuệ kinh doanh (businessintelligence - BI) vigrave coacute caacutec đặc trưng về mocirc higravenh hoacutea vagrave tối ưu hoacutea nhưng lạitrong suốt đối với ngươigrave dugravengbull Hiện caacutec cocircng cụ được đưa ra bởi caacutec nhagrave cung cấp về CSDL về hoạch định tagraveinguyecircn tổ chức (ERP) về nhagrave kho dữ liệu (data warehouse) về HXLPTTT MOcirc HIgraveNH HOacuteA VAgrave MOcirc PHỎNG TƯƠNG TAacuteC TRỰC QUANbull Iacutech lợi Người ra quyết định tham gia vagraveo quaacute trigravenh phaacutet triển mocirc higravenh vagrave thựcnghiệm mocirc phỏng vigrave vậy sẽ tin tưởng khi sử dụng mocirc higravenhbull Mocirc higravenh hoacutea tương taacutec trực quan (visual interactive modeling - VIM) dugraveng caacutecbiểu diễn đồ họa maacutey tiacutenh để trigravenh bagravey caacutec ảnh hưởng của caacutec quyết định quản lyacutekhaacutec nhau ở một thời điểm (tĩnh) hay tiến triển theo thời gian (động với kỹ thuậthoạt higravenh)bull Mocirc phỏng tương taacutec trực quan (visual interactive simulation - VIS) cho pheacutepngười dugraveng theo dotildei tiến trigravenh xacircy dựng vagrave sử dụng khai thaacutec mocirc higravenh mocirc phỏngdưới dạng hoạt higravenhbull Mocirc higravenh hoacutea tương taacutec trực quan coacute thể kết hợp với tiếp cận triacute tuệ nhacircn tạo đểđưa ra caacutec khả năng mới thay đổi từ xacircy dựng hệ thống dạng đồ họa đến tigravem hiểuvề động học của hệ thốngbull Cần đến caacutec hệ thống maacutey tiacutenh xử lyacute song song tốc độ cao để xacircy dựng caacutec mocircphỏng - phức tạp quy mocirc lớn dạng hoạt higravenh - mang tiacutenh khả thi ở thời gian thực

22Caacutec dạng hệ thống hỗ trợ ra quyết địnhHệ hỗ trợ quyết định nhoacutemRa quyết định nhoacutem giao tiếp vagrave cộng taacutec- Caacutec đặc điểm của cocircng việc nhoacutem+ Một nhoacutem thực hiện một nhiệm vụ thỉnh thoảng ra quyết định thỉnh thoảngkhocircng ra quyết định+ Caacutec thagravenh viecircn trong nhoacutem coacute thể ở những nơi khaacutec nhau

+ Caacutec thagravenh viecircn trong nhoacutem coacute thể lagravem việc ở những thời gian khaacutec nhau+ Caacutec thagravenh viecircn trong nhoacutem coacute thể lagravem việc cugraveng nhau hoặc ở caacutec tổ chức khaacutecnhau+ Nhoacutem coacute thể vĩnh viễn hoặc tạm thời+ Nhoacutem coacute thể ở bất kỳ mức quản lyacute nagraveo hoặc mức thời gian nagraveo+ Coacute sự điều phối (quaacute trigravenh vagrave nhiệm vụ đạt được) hoặc macircu thuẩn trongnhoacutem+ Coacute sự đạt được hoặcvagrave mất maacutet năng suất trong tổ chức+ Nhiệm vụ phải hoagraven thagravenh rất nhanh+ Khocircng thể hoặc quaacute đắt cho tất cả caacutec thagravenh viecircn trong nhoacutem cugraveng hợp ở mộtnơi+ Một số dữ liệu thocircng tin hoặc kiến thức cần thiết nằm ở nhiều nơi một sốkhaacutec ở ngoagravei tổ chức+ Chuyecircn mocircn của caacutec thagravenh viecircn khocircng coacute trong nhoacutem lagrave cần thiết- Caacutec hoạt động vagrave caacutec quaacute trigravenh miecircu tả caacutec cuộc họp+ Cuộc họp lagrave hoạt động chung liecircn quan bởi một nhoacutem người coacute địa vị bằngnhau hoặc gần bằng nhau+ Kết quả của cuộc họp phụ thuộc một phần vagraveo kiến thức yacute kiến caacutec đaacutenh giaacutecủa caacutec thagravenh viecircn+ Kết quả của cuộc họp cũng phụ thuộc vagraveo sự kết hợp của nhoacutem vagrave phụ thuộcvagraveo quaacute trigravenh ra quyết định được sử dụng bởi nhoacutem đoacute+ Giải quyết caacutec yacute kiến khaacutec nhau bởi người coacute quyền hạn hoặc thương lượnghoặc phacircn xửHỗ trợ giao tiếp- Giao tiếp lagrave thagravenh phần quan trọng cho hỗ trợ quyết định Khocircng coacute giao tiếp thigravekhocircng coacute cộng taacutec Những người ra quyết định caacute nhacircn phải giao tiếp với caacutecđồng nghiệp chuyecircn gia cơ quan chiacutenh phủ khaacutech hagraveng đối taacutec kinh doanh hellipHọ cũng cần dữ liệu vagrave thocircng tin (vagrave kiến thức) từ nhiều nơi trecircn thế giới Caacutecnhoacutem ra quyết định phải giao tiếp cộng taacutec vagrave thương lượng trong cocircng việcHầu hết caacutec tổ chức sẽ nhanh trở thagravenh khocircng coacute chức năng nếu khocircng coacute caacutec hệthống giao tiếp Thương mại điện tử coacute thể hiệu quả chỉ qua caacutec kỹ thuật giao tiếphiện đại- Caacutec kỹ thuật thocircng tin hiện đại cung cấp caacutec phương tiện hỗ trợ giao tiếp rẻnhanh coacute khả năng coacute thể tin cậy Nền tảng hỗ trợ giao tiếp lagrave caacutec hệ thống maacuteytiacutenh mạng+ Bắt đầu bằng điện baacuteo điện thoại radio vagrave ti vi+ Trong 100 năm chuacuteng ta phaacutet triển maacutey fax thư điện tử chương trigravenh chatnhoacutem tin tức hệ thống hội nghị truyền higravenh Hầu hết caacutec kỹ thuật nagravey đềuhoạt động trecircn internet+ Sự phaacutet triển giao tiếp sau cugraveng lagrave hệ thống họp điện tử caacutec dịch vụ vagrave hệ

thống hội nghị điện tử thường sử dụng internet để kết nối caacutec người ra quyếtđịnh- Caacutec thuận lợi aacutep dụng caacutec phương phaacutep giao tiếp cải tiến trong caacutec tổ chức+ Cải tiến năng suất của nhacircn viecircn+ Liecircn quan đến nhiều người ra quyết định chiacutenh+ Khocircng quan tacircm nhiều đến đường biecircn giới địa lyacute+ Tạo nền văn hoacutea hợp taacutec nhất quaacuten+ Cải tiến chất lượng cuộc sống của nhacircn viecircnHỗ trợ cộng taacutec Maacutey tiacutenh hỗ trợ cộng taacutec- Khung thời giannơi chốn+ Sự hiệu quả của kỹ thuật tiacutenh toaacuten cộng taacutec phụ thuộc vagraveo vị triacute của caacutec thagravenhviecircn trong nhoacutem vagrave phụ thuộc vagraveo thời gian chia sẽ thocircng tin gởi vagrave nhận+ Chia sự giao tiếp thagravenh bốn ocirc vagrave tổ chức bốn ocirc dọc theo 2 chiều thời gian vagravenơi chốn1048713 Thời gian Khi gởi vagrave nhận thocircng tin hầu như đồng thời giao tiếp lagrave đồngthời Viacute dụ Điện thoại ti vi vagrave caacutec cuộc họp gặp mặt nhau Giao tiếp bấtđồng bộ xảy ra khi người nhận nhận thocircng tin ở thời điểm khaacutec thời điểmgởi thocircng tin đoacute1048713 Nơi chốn Người gởi vagrave người nhận coacute thể ở cugraveng phograveng hoặc khocircng+ Bốn ocirc lagrave1048713 Cugraveng thời giancugraveng nơi chốn Caacutec thagravenh viecircn gặp mặt nhau cugraveng một luacutecgiống như phograveng quyết định hoặc gặp mặt truyền thống1048713 Cugraveng thời giankhaacutec nơi chốn Caacutec thagravenh viecircn ở caacutec nơi khaacutec nhau nhưnggiao tiếp cugraveng nhau Viacute dụ hội nghị truyền higravenh (videoconferencing)1048713 Khaacutec thời giancugraveng nơi chốn Nhiều người lagravem việc theo ca Ca nagravey để lạithocircng tin cho ca khaacutec1048713 Khaacutec thời giankhaacutec nơi chốn Caacutec thagravenh viecircn ở caacutec nơi khaacutec nhau Caacutecthagravenh viecircn nagravey gởi vagrave nhận thocircng tin ở những lần khaacutec nhau

23Thực thi hệ DSSHệ thống hỗ trợ quản lyacute (MSS) khocircng phải luacutec nagraveo cũng luocircn thagravenh cocircng Nhiều trường hợpthất bại của ES khocircng hoagraven toagraven lagrave lyacute do kỹ thuật Thực thi hệ thống lagrave một quaacute trigravenh liecircn tụcnhằm đảm bảo cho tổ chức chuẩn bị tiếp nhận một hệ thống mới vagrave đưa hệ thống vagraveo sử dụngthagravenh cocircngThực hiện cocircng nghệ hệ thống hỗ trợ quản lyacute lagrave việc phức tạp vigrave caacutec hệ thống nagravey khocircng đơnthuần lagrave hệ thống thocircng tin chỉ thu thập thao taacutec vagrave phacircn phối thocircng tin Magrave xa hơn chuacuteng

liecircn quan tới caacutec cocircng việc coacute thể lagravem thay đổi đaacuteng kể caacutech thức hoạt động của tổ chức Tuyvậy đa số caacutec yếu tố thực thi đều liecircn quan tới hệ thống thocircng tinThực thi MSS lagrave quaacute trigravenh liecircn tục diễn ra trong suốt thời gian phaacutet triển hệ thống từ đề xuấtban đầu đến nghiecircn cứu khả thi thiết kế vagrave phacircn tiacutech hệ thống lập trigravenh huấn luyện chuyểnđổi vagrave lắp đặt Caacutec chuyecircn gia hệ thống thocircng tin thường gọi thực thi lagrave giai đoạn cuối trongvograveng đời hệ thống Định nghĩa thực thi MSS phức tạp hơn vigrave bản chất lặp của sự phaacutet triểncaacutec hệ thống

THỰC THI KHOcircNG HOAgraveN CHỈNHCaacutec quyết định về tiacutenh khả thi thường coacute giả định về lợi iacutech đạt được khi kế hoạch thực thiđược thực hiện hoagraven toagraven Trong thực tế thường chỉ thực hiện 90 thậm chiacute 70 phần trăm sovới phacircn tiacutech khả thi Lyacute do lagrave sự thay đổi tại một nơi trong hệ thống coacute thể ảnh hưởng vagrave coacutethể taacutec động tiecircu cực đến chỗ khaacutec Do vậy cấp quản lyacute coacute thể bỏ những phần trong dự aacuten coacutethể gacircy ra taacutec động xấu Do đoacute dự aacuten sẽ thực hiện iacutet hơn 100 so với dự aacuten kế hoạch Caacutec lyacutedo khaacutec coacute thể lagrave do khấu trừ ngacircn saacutech hoặc vượt chi phiacuteĐAacuteNH GIAacute SỰ THAgraveNH COcircNG CỦA THỰC THI HỆ THỐNGPhải coacute caacutec chỉ số đo lường thigrave mới coacute thể đaacutenh giaacute sự thagravenh cocircng khi thực thi một hệ thốngDickson va Powers (1973) đề ra 5 tiecircu chuẩn độc lậpbull Tỷ lệ thời gian thực hiện dự aacuten với thời gian ước lượngbull Tỷ lệ chi phiacute thực tế vagrave ngacircn saacutech thực hiệnbull Thaacutei độ của cấp quản lyacute đối với hệ thốngbull Nhu cầu thocircng tin của caacutec nhagrave quản lyacute được đaacutep ứng như thế nagraveo qua hệ thốngbull Taacutec động của dự aacuten đối với những hoạt động maacutey tiacutenh trong cocircng tyCaacutec đo lường khaacutec để đaacutenh giaacute thagravenh cocircng của hệ hỗ trợ quản lyacute (MSS)bull Sự sử dụng hệ thống (dự định dugraveng hoặc thực sự dugraveng)bull Thỏa matilden của người dugravengbull Thaacutei độ taacuten thagravenhbull Mức độ hệ thống hoagraven thagravenh caacutec mục tiecircu ban đầubull Phần thưởng đối với tổ chức (giảm chi phiacute tăng doanh thuhellip)bull Tỷ số lợi iacutech chi phiacute

bull Mức độ thể chế hoacutea của MSS trong tổ chứcDo bởi tiacutenh đa dạng của DSS necircn việc đaacutenh giaacute sự thagravenh cocircng của hệ nagravey cũng khoacute khăn tuynhiecircn cũng coacute thể coacute một số yếu tố giuacutep cho DSS thagravenh cocircng như sự tham gia người dugravenghuấn luyện người dugraveng hỗ trợ quản lyacute cấp cao nguồn thocircng tin đặc điểm của những nhiệmvụ coacute liecircn quan (cấu truacutec bất định độ khoacute phụ thuộc)

Chương5Nhoacutem hỗ trợ quyết định vagrave nhoacutemcocircng nghệ phần mềm

51Nhoacutem tạo quyết định

MDM-Holsapple đatilde gợi yacute chuacuteng ta sử dụng giới hạn người tạo quyết định

Một nhoacutem lagrave kết cấu MDM nơi magrave nhiều người ra quyết định hoagraven toagraven tương taacutec

Một đội lagrave kết cấu MDM nơi caacutec thagravenh viecircn tư vấn cho người đưa ra quyết định nhưng khocircng tương taacutec

Một Ủy ban lagrave kết cấu MDM với một người tạo quyết định duy nhất vagrave sự tương taacutec giữa caacutec thagravenh viecircn

Mạng thocircng tin

Mạng lưới baacutenh xe mỗi người tham gia coacute thể giao tiếp với người đưa ra quyết định ở trung tacircm nhưng khocircng phải với người tham gia khaacutecCấu truacutec nagravey lagrave khocircng thỏa matilden tất cả những người tham gia ngoại trừ người ra quyết định

Mạng dacircy chuyền Tham gia chuyển tiếp thocircng tin chỉ để noacute luocircn liền kề nhau trong chuỗi

Thagravenh viecircn cuối cugraveng ko được đaacutep ứng

Mạng vograveng trograven Tương tự như chuỗi nhưng kết thuacutec được kết nối

Mạng kết nối hoagraven toagraven khocircng coacute hạn chế về giao tiếp vagrave tương taacutec giữa caacutec thagravenh viecircnNoacutei chungnoacute đaacutep ứng hầu hết caacutec kết nối của người tham gia nhưng truyền đạt thocircng tin mất nhiều thời gian vagrave coacute nhiều cơ hội xảy ra lỗi

Nhoacutem hagravenh vi vagrave chuẩn mực

MDMs thiết lập caacutec chỉ tiecircu hướng dẫn quaacute trigravenh ra quyết định

Một chuẩn mực quy định cụ thể những gigrave thagravenh viecircn trong nhoacutem dự kiến sẽ lagravem trong những hoagraven cảnh nhất định

Quy tắc gửi coacute thể được thocircng qua viacute dụ đaacutenh giaacute ngang hagraveng hoặc xử phạt

Lagravem thế nagraveo để đưa ra quyết định

Việc chọn lựa magrave trong đoacute việc sử dụng cấu truacutec MDM phải được dựa trecircn một số yếu tố liecircn quan với bối cảnh quyết định

Viacute dụmột cấu truacutec riecircng lẻ sẽ lagravem việc nơi magrave quyết định được cấu truacutec cao vagrave thocircng tin lagrave coacute sẵn

Một ủy ban cơ cấu sẽ lagrave sự lựa chọn khi người ra quyết định khocircng thể đưa ra quyết định một migravenh

52Caacutec vấn đề thường gặp trong nhoacutem

Kiacutech thước Noacutei chung sự nhất triacute vagrave gắn kết giữa caacutec thagravenh viecircn tỉ lệ nghịch với phạm vi nhoacutem Trong nhoacutem lớn rất dễ higravenh thagravenh caacutec nhoacutem nhỏ vagrave hoạt động rời rạc

Tư duy tập thể Trong nhoacutem lớn mọi người coacute xu hướng suy nghĩ đểđạtđược sự nhất triacute necircn khocircng phaacutet huy được sự saacuteng tạo

Caacutec vấn đề về xatilde hội

Xung đột Trong 1 nhoacutem ai cũng muốn migravenh lagrave giỏi nhất necircn dễ dẫn đến xung đột

Ẩn danh(Giấu tecircn) Đacircy lagrave phương phaacutep được sử dụng để kiểm soaacutet xung đột Cho caacutec thagravenh viecircn tham gia ẩn danh

Vấn đề giới tiacutenh Nam vagrave nữ thường coacute những thế mạnh khaacutec nhau điều nagravey coacute thể lagrave sức mạnh trong 1 thiết lập MDM

Đagravem phaacuten vagrave quyết định

Một quyết định coacute thể liecircn quan đến nhiều quan điểm khaacutec nhau vigrave thế cần phải coacute sự đagravem phaacuten

Caacutec thiết kế của cơ chế hỗ trợ cho MDM phải phugrave hợp với caacutec hoạt độngđagravemphaacuten

Những hoạt động nagravey bao gồm việc thu nhận yacute kiến của caacutec thagravenh viecircn 1 caacutech cocircng bằng

53Cocircng nghệ hỗ trợ MDM

Organizational DSSndash 1 hệ thống cung cấp caacutec quyết định hỗ trợ

Group Support Systemndash Cocircng nghệ sử dụng sự hỗ trợ của nhiều becircn tham gia

Group DSS ndash Lagrave 1 hệ thống được thiết kế đặc biệt để hỗ trợ cho MDM

DSS ndash Lagrave 1 hệ thống dưới sự kiểm soaacutet của 1 người quyết định hệ thống nagravey cung cấp 1 bộ cocircng cụ giuacutep phacircn tiacutech hoagraven cảnh đểđưa ra quyết định vagrave nacircng cao hiệu quả của quyết địnhđoacute

53Cocircng nghệ hỗ trợ MDM

Organizational DSSndash 1 hệ thống cung cấp caacutec quyết định hỗ trợ

Group Support Systemndash Cocircng nghệ sử dụng sự hỗ trợ của nhiều becircn tham gia

Group DSS ndash Lagrave 1 hệ thống được thiết kế đặc biệt để hỗ trợ cho MDM

DSS ndash Lagrave 1 hệ thống dưới sự kiểm soaacutet của 1 người quyết định hệ thống nagravey cung cấp 1 bộ cocircng cụ giuacutep phacircn tiacutech hoagraven cảnh đểđưa ra quyết định vagrave nacircng cao hiệu quả của quyết địnhđoacute

Mục tiecircu của cocircng nghệ hỗ trợ MDM

Quy trigravenh hỗ trợ tập trung vagraveo quaacute trigravenh tạo điều kiện thuận lợi cho sự tương taacutec

Cơ chế cấu truacutec quaacute trigravenh chi phối caacutec hoạt động truyền thocircng

Nhiệm vụ hỗ trợ cocircng việc coacute thể chọn lựa tổ chức hoặc lấy thocircng tin

Nhiệm vụ cấu truacutec cocircng việc cho pheacutep truy cập đến kỹ thuật lọc kết hợp phacircn tiacutech kiến thức liecircn quan đến cocircng việc

Caacutec lớp loại cocircng nghệ hỗ trợ MDM

Phacircn loại theo đặc điểm do DeSanctis vagrave Gallupe đưa ra đề xuất một chương trigravenh ba cấp dựa trecircn caacutec tiacutenh năng được cung cấp

Hệ thống cấp 1 Mục điacutech chiacutenh lagrave tạo điều kiện thocircng tin liecircn lạc giữa caacutec thagravenh viecircn

Hệ thống cấp 2 Thiết kế để giảm thiểu rủi ro

Hệ thống cấp 3 Giuacutep điều chỉnh xử lyacute quyết định

Phacircn loại theo cocircng nghệ -Kraemer vagrave King tập trung vagraveo cocircng nghệ aacutep dụng

Cocircng nghệ bảng mạch điện tử

Hội nghị trực tuyến

Mạng lưới tập đoagraven

Trung tacircm thocircng tin

Mocirci trường cộng taacutec

Phograveng quyết định

Nhoacutem phần mềm

Phần mềm được thiết kế để hỗ trợ sự hợp taacutec bao gồm việc thu huacutet vagrave lưu trữ thocircng tin

Caacutec tổ chức dẫn đầu thị trường hiện tại lagrave Lotus Notes and Domino Microsoft Exchange Novell GroupWise and Oracle Office

Caacutec cocircng cụ trong một bộ phần mềm bao gồm người quản lyacute hội nghị (Lotus Sametime) vagrave trao đổi thocircng điệp (Lotus Notes Mail)

Xếp hạng phần mềm cho nhoacutem

Ellis vv đề xuất một hệ thống xếp hạng dựa vagraveo kiểu sự hỗ trợ noacute Cung cấp

Hệ thocircng điệp

Hệ thống hội thảo truyền higravenh

Hệ thống cộng taacutec soạn thảo

Nhoacutem phacircn phối giải phaacutep phần mền

Hệ thống phối hợp

Hệ thống thocircng minh đại diện

Lực lượng điều khiển phaacutet triển phần mềm cho nhoacutem

Một số nhacircn tố chiacutenh bao gồm

Tăng năng suất

Giảm số lượng caacutec cuộc họp

Tăng cường tự động hoacutea caacutec quy trigravenh lagravem việc thường xuyecircn

Cần phối hợp toagraven cầu tốt hơn

Tiacutenh sẵn sagraveng của những mạng lan rộng

Coleman vagrave Khanna liệt kecirc 10 nhacircn tố khaacutec

54Quản lyacute hoạt động MDM (Mobile Device Management - Quản lyacute thiết bị di động)

Một số phương phaacutep phối hợp phổ biến hơnMDM lagrave

Kỹ thuật nhoacutem định danh

Kỹ thuật Delphi

Sự phacircn xử

Hệ thocircng tin dựa trecircn vấn đề

Nemawashi

Kỹ thuật nhoacutem định danh

1-Mỗi người tham gia viết ra những yacute tưởng về những gigrave necircn quyết định

2-Lần lượt mỗi người tham gia trigravenh bagravey yacute tưởng của migravenh được ghi lại trecircn bảng Khocircng thảo luận ở đacircy

3-Sau khi tất cả caacutec yacute tưởng được trigravenh bagravey caacutec đại biểu coacute thể chất vấn những người khaacutec

4-Mỗi người tham gia bỏ phiếu cho mỗi yacute tưởng

Kỹ thuật Delphi

Về cơ bản tương tự như kỹ thuật nhoacutem định danh ngoại trừ những người khocircng bao giờ tham gia cuộc họp

Một cocircng cụ khảo saacutet được sử dụng để thu thập đầu vagraveo ban đầu từ caacutec thagravenh viecircn

Một cuộc khảo saacutet thứ hai được gửi đi với một bản toacutem tắt caacutec kết quả chung

Những bước lặp lại cho đến khi đạt được một sự đồng thuận hoặc nhigraven nhận của đa số

Sự phacircn xử(Arbitration )

Thiacutech hợp nhất khi caacutec thagravenh viecircn của MDM đại diện cho caacutec yếu tố đối lập

Những người tham gia đồng yacute rằng nếu lựa chọn thay thế hai becircn thỏa thuận khocircng được tigravem thấy thigrave một trọng tagravei viecircn becircn ngoagravei sẽ tham gia

Trọng tagravei sau đoacute lựa chọn thay thế ocircng hoặc xeacutet thấy thiacutech hợp nhất

Hệ thống thocircng tin dựa trecircn vấn đề (IBIS)

Lagrave một phương phaacutep lập luận cấu truacutec

Một đại diện cho IBIS lagrave một đồ thị với caacutec nuacutet vagrave caacutec liecircn kết

IBIS bắt đầu với lựa chọn của một nuacutet vấn đề gốc sau đoacute caacutec nuacutet vị triacute khaacutec nhau được liecircn kết với nuacutet gốc

Caacutec nuacutet vị triacute nagravey sau đoacute được đaacutenh giaacute dựa trecircn những lập luận gắn liền với chuacuteng

Nemawashi (được sử dụng rộng ratildei tại Nhật Bản)

1-Một hoặc nhiều thagravenh viecircn của MDM được chỉ định lagrave điều phối viecircnCaacutec điều phối viecircn sau đoacute chọn người tham gia cograven lại

2-Điều phối viecircn xacircy dựng một tổng hợp caacutec sự lựa chọn vagrave sau đoacute caacutec chuyecircn gia đaacutenh giaacute caacutec lựa chọn

3-Điều phối viecircn lựa chọn một sự lựa chọn dựa trecircn kết quả ở trecircn(ở 2)

4-Sự thay thế được luacircn chuyển điều phối viecircn tigravem kiếm sự đồng thuận thocircng qua sự thuyết phục vagrave đagravem phaacuten

5-Nếu đạt được sự đồng thuận điều phối viecircn cho lưu thocircng một tagravei liệu magrave mỗi thagravenh viecircn MDM để lại dấu hiệu trecircn đoacute

55Nơi lagravem việc ảo

Nhiều tổ chức trecircn toagraven thế giới kinh doanh bất động sản cho cocircng nghệ hợp taacutec

Cocircng việc được trở thagravenh một điều bạn lagravem hơn lagrave một nơi bạn đi

Những thay đổi lớn nhất mang lại bởi nơi lagravem việc ảo coacute thể lagrave về văn hoaacute hay xatilde hội hơn lagrave về cocircng nghệ

Chương 6 Hệ thống thocircng tin điều hagravenh

61 Yacute nghĩa của EIS- Hệ thống thocircng tin điều hagravenh

- EIS lagrave một dạng đặc biệt của DSS được thiết kế để hỗ trợ ra quyết định ở cấp cao nhất của một tổ chức

- Lagrave một hệ thống thocircng tin hỗ trợ nhu cầu lập kế hoạch vagrave đaacutenh giaacute của caacutec nhagrave quản lyacute điều hagravenh

- EIS coacute thể giuacutep một CEO coacute được bức tranh tổng thể chiacutenh xaacutec nhất về caacutec hoạt động vagrave một bản toacutem tắt những gigrave magrave đối thủ cạnh tranh đang lagravem

- Caacutec hệ thống nagravey noacutei chung hoạt động dễ dagraveng vagrave trigravenh bagravey thocircng tin theo những caacutech dễ hiểu để việc tiếp thu được nhanh choacuteng (biểu đồ đồ thịhellip)

(Tagravei liệu thecircm EIS lagrave những loại hệ thống lagrave rất phức tạp trong tự nhiecircn Coacute thể noacutei hệ thống nagravey cũng cung cấp cho caacutec nhagrave quản lyacute với caacutec thiết bị coacute khả năng ra quyết định bằng caacutech sử dụng của noacute Hệ thống nagravey hoạt động trong điều kiện như vậy quan trọng như trong caacutec hệ thống khaacutec khocircng hỗ trợ Khả năng lưu trữ dữ liệu nặng lagravem cho noacute lyacute tưởng để được thocircng qua khocircng chỉ bởi caacutec doanh nghiệp lớn magrave cograven bởi caacutec doanh nghiệp nhỏ hơn Nhigraven chung hệ thống nagravey lagrave dagravenh cho caacutec nhacircn viecircn cấp cao hỗ trợ thagravenh thạo trong việc đưa ra caacutec quyết định quan trọng)

Caacutec phiecircn EIS tiecircu biểu- Phiecircn lagravem việc coacute thể bắt đầu với một baacuteo caacuteo về tigravenh higravenh tagravei chiacutenh vagrave kinh

doanh của một cocircng ty caacutec chỉ số hoạt động quan trọng được hiển thị rotilde ragraveng- EIS sẽ cho pheacutep caacutec giaacutem đốc điều hagravenh coacute thể đi sacircu vagraveo dữ liệu từ những con

số bất kỳ magrave noacute hỗ trợ- Việc điều hagravenh coacute thể lựa chọn một mức độ chi tiết ( VD danh số baacuten hagraveng) nếu

như cần điều tra thecircm- Lagrave một phương phaacutep tiếp cận coacute thể giuacutep việc ra quyết định tốt hơn

Những điều magrave EIS ko coacute- EIS khocircng phải lagrave sự thay thế cho caacutec hệ thống dựa trecircn caacutec maacutey tiacutenh khaacutec EIS

thực sự chỉ cung cấp dữ liệu cho caacutec hệ thống nagravey- Noacute khocircng thể biến caacutec bộ hệ điều hagravenh của maacutey tiacutenh thagravenh những ldquochuyecircn viecircn

giỏirdquo- Coacute thể được viacute một caacutech cao hơn như lagrave một trợ lyacute đaacuteng tin cậy coacute thể được gọi

đến bất khi nagraveo vagrave mỗi khi cần thiết

Tagravei liệu thecircm Sự khaacutec nhau giữa EIS vagrave DSS+ EIS thiết kế để hỗ trợ những người điều hagravenh cấp cao giuacutep họ khaacutem phaacute caacutec vấn đề vagrave caacutec cơ hội DSS hỗ trợ những nười phacircn tiacutech cố gắng trả lời cacircu hỏi caacutei gigrave coacute thể lagravem cugraveng với một cơ hội hoặc một vấn đề

Chiều EIS DSSNhững người sử dụng thocircng thường

Duyệt dữ liệu đi xuống truy xuất trạng thaacutei

Hỗ trợ phacircn tiacutech vagrave quyết định

Sự thuacutec đẩy Tiacutenh thiacutech hợp Tiacutenh hiệu quảỨng dụng Queacutet mocirci trường đaacutenh giaacute

hiệu suất nhận dạng caacutec vấn đề vagrave caacutec cơ hội

Caacutec quyết định quản lyacute trecircn caacutec lĩnh vực đa dạng

Hỗ trợ quyết định Caacutec chiacutenh saacutech caacutec quyết định khocircng coacute cấu truacutec ở mức cao vagrave hỗ trợ giaacuten tiếp

Hỗ trợ caacutec quyết định lặp lại caacutec quyết định khocircng thể đoaacuten trước ra quyết định khocircng coacute cấu truacutec vagrave baacuten cấu truacutec

Loại thocircng tin Caacutec thocircng tin tin tức thocircng tin becircn ngoagravei về khaacutech hagraveng đối thủ cạnh tranh mocirci trường caacutec baacuteo caacuteo theo yecircu cầu vagrave định thời về caacutec hoạt động becircn trong

Caacutec thocircng tin hỗ trợ caacutec tigravenh huống đặc biệt

Sử dụng coacute nguyecircn tắc

Dograve theo vết vagrave điều khiển nhận dạng cơ hội

Hoạch định tổ chức phacircn nhoacutem vagrave điều khiển

Khả năng phugrave hợp với những người sử dụng caacute nhacircn

Thiết kế loại ra quyết định cho mỗi người điều hagravenh caacute nhacircn bằng nhiều lựa chọn đầu ra

Cho pheacutep caacutec đaacutenh giaacute caacute nhacircn caacutec khả năng what-if lựa chọn loại hộp hội thoại

Đồ họa Phải coacute Lagrave một phần quan trọng của nhiều DSS

Thacircn thiện người sử dụng

Phải coacute Phải coacute nếu khocircng coacute người sử dụng trung gian

Xử lyacute thocircng tin Lọc neacuten thocircng tin dograve theo vết dữ liệu vagrave thocircng tin quan trọng

EIS kiacutech thiacutech caacutec cacircu hỏi caacutec cacircu trả lời bằng caacutech sử dụng DSS vagrave phản hồi lại EIS

Hỗ trợ caacutec thocircng tin chi tiết

Truy xuất thường xuyecircn caacutec mức chi tiết của bất kỳ thocircng tin tổng hợp nagraveo (duyệt dữ

Coacute thể coacute trong DSS nhưng khocircng thường

liệu chi tiết)Cơ sở mocirc higravenh Caacutec chức năng coacute sẵn bị hạn

chếLagrave điểm cốt lotildei của DSS

Cấu truacutec Theo người baacuten sản phẩm hoặc theo caacutec chuyecircn gia hệ thống thocircng tin

Theo người sử dụng hoặc caacute nhacircn hoặc caacutec chuyecircn gia từ caacutec trung tacircm thocircng tin hoặc phograveng ban hệ thống thocircng tin

Phần cứng Mainframe caacutec trạm RISC mạng LANs hoặc caacutec hệ thống phacircn bố

Mainframe caacutec trạm RISC caacutec maacutey PC hoặc caacutec hệ thống phacircn bố

Bản chất caacutec goacutei phần mềm

Truy xuất tương taacutec dễ dagraveng đến nhiều cơ sở dữ liệu truy xuất trực tuyến caacutec khả năng DBMS phức tạp caacutec liecircn kết phức tạp

Caacutec khả năng tiacutenh toaacuten lớn caacutec ngocircn ngữ mocirc higravenh mocirc phỏng ứng dụng vagrave caacutec bộ tạo DSS

Bản chất caacutec thocircng tin

Trigravenh bagravey thocircng tin được phaacutet sinh trước về quaacute khứ vagrave hiện tại tạo caacutec thocircng tin mới về quaacute khứ hiện tại tương lai

Tạo thocircng tin mới về quaacute khứ hiện tại tương lai

62 Lịch sử EIS- EIS xuất hiện lần đầu tiecircn tại MIT vagraveo những năm 1970

- Những EIS đầu tiecircn được phaacutet triển bởi caacutec doanh ngiệp lớn sẵn sagraveng chấp nhận rủi ro để đạt được lợi thế cạnh tranh

- Vagraveo những năm 1980 caacutec nhagrave cung cấp đatilde phaacutet triển một số cơ sở khaacutech hagraveng rộng vagrave cocircng nghệ EIS được tiếp tục phaacutet triển cho đến ngagravey nay

(Tagravei liệu thecircm Sử dụng DSSEIS cho phaacutet triển bền vững + Một số nghiecircn cứu đatilde được tiến hagravenh để kiểm tra việc thực hiện của EIS trong khu vực cocircng cộng vagrave chiacutenh phủ caacutec nước tổ chức kể từ khi chuacuteng được phaacutet triển theo định hướng lợi nhuận cho caacutec cocircng ty tư nhacircn (Hasan vagrave Hasan năm 1997) Theo một nghiecircn cứu tiến hagravenh tại Mỹ ở hơn 300 cocircng ty kết quả cho thấy sự khaacutec biệt của EIS giữa tư nhacircn vagrave chiacutenh phủ một số kết quả thuacute vị được phaacutet hiệnViacute dụ khoacute khăn hơn để chuyển tiền từ một tagravei khoản khaacutec trong một EIS của chiacutenh phủ cũng lagrave khoacute khăn hơn để biện giải thiacutech cho những chi phiacute phaacutet triển EIS của chiacutenh phủ Một nghiecircn cứu khaacutec được tiến hagravenh ở Australia

cho thấy rằng EIS cung cấp cho quản lyacute một higravenh ảnh chiacutenh xaacutec hơn về tổ chức thực hiện vagrave cung cấp hỗ trợ cho caacutec lợi iacutech chiến lược cải thiện khocircng chỉ cho caacutec nhagrave quản lyacute nhưng cograven cho phần cograven lại của tổ chức Dựa trecircn caacutec hệ thống được thiết kế cho caacutec cocircng ty tư nhacircn với một caacutech rotilde ragravengxaacutec định mục tiecircu EIS lagrave thiacutech hợp cho caacutec tổ chức cocircng cộng hiện đại nhưng cần phải được linh hoạt hơn vagrave kết thagravenh chugravem một phạm vi rộng hơn khả năng vagrave phương tiện hơn so với khu vực tư nhacircn ban đầu theo định hướng sản phẩm (Hasan vagrave Hasan năm 1997) Điều nagravey coacute thể lagrave do thực tế rằng caacutec hoạt động khu vực cocircng lagrave bắt buộc coacute taacutec động rộng phải đaacutep ứng sự mong đợi duy nhất cocircng cộng thường coacute mục tiecircu mơ hồ vagrave macircu thuẫn iacutet quyền tự chủ vagrave kiểm soaacutet việc ra quyết định vagrave nhacircn viecircn lagrave khoacute khăn hơn (Watson vagrave Carte2000) + Toacutem lại EIS lagrave một khaacutei niệm thagravenh cocircng noacute phaacutet triển qua nhiều năm tuy nhiecircn EIS khắc phục khiếm khuyết của migravenh bằng caacutech tiến hagravenh nghiecircn cứu liecircn tục)

63 Tại sao những người điều hagravenh hagraveng đầu lại khaacutec nhau- Họ lagrave những doanh nghiệp theo định hướng coacute suy nghĩ

- Coacute một khoảng khocircng gian rộng để kiểm soaacutet

- Họ chịu traacutech nhiệm cho việc thiết lập chiacutenh saacutech

- Họ đại diện cho tổ chức mocirci trường becircn ngoagravei

- Hagravenh động của họ tạo ra những kết quả đaacuteng kể về tagravei chiacutenh vagrave con người

Tần số caacutec hoạt động điều hagravenh- Xử lyacute xaacuteo trộn 42

- Hoạt động kinh doanh 32

- Phacircn bổ nguồn lực 17

- Đagravem phaacuten 3

- Những điều khaacutec 6

Handling Disturbances 42

Entrepreneurial Activites 32

Resource Allocation 17

Negotiation 3

Other 6

Những thocircng tin điều hagravenh cần thiết- Quản lyacute xaacuteo trộn coacute thể yecircu cầu sự chuacute yacute xung quanh đồng hồ

- Hoạt động kinh doanh yecircu cầu điều hagravenh để dự đoaacuten những thay đổi trong mocirci trường

- Nhiệm vụ phacircn bổ tagravei nguyecircn yecircu cầu lựa chọn người quản lyacute vagrave caacutec nguồn lực hạn chế được triển khai

- Đagravem phaacuten yecircu cầu cập nhật thocircng tin từng phuacutet để coacute thể xacircy dựng được sự đồng thuận

Caacutec loại thocircng tin điều hagravenh- Hệ thống kế toaacuten coacute liecircn quan đến việc tiacutenh toaacuten thu nhập hoạt động cho caacutec lĩnh

vực cụ thể lagrave quan trọng hơn so với caacutec hệ thống kế toaacuten truyền thocircng- Thocircng tin về thị trường khaacutech hagraveng cung cấp giaacute trị trong việc quyết định chiến

lược- Caacutec thocircng tin cần thiết thường được truyền đi trecircn một số hệ thống maacutey tiacutenh vagrave

nằm trong toagraven tổ chức- Caacutec thocircng tin được sử dụng thường lagrave ngắn hạn vagrave dễ thay đổi

Phương thức để xaacutec định thocircng tin cần thiết

Rockart xaacutec định được năm phương thức cơ bản để xaacutec định thocircng tin cần thiết

- Phương thức dựa trecircn kết quả- Phương thức rỗng- Phương thức chỉ số khoacutea- Phương thức tổng hợp nghiecircn cứu- Phương thức dựa vagraveo nhacircn tố then chốt dẫn đến thagravenh cocircng

64 Thagravenh phần EIS

- Sản phẩm EIS đầu tiecircn được phaacutet triển để sử dụng trecircn maacutey tiacutenh cấu higravenh cao nhưng caacutec sản phẩm hiện nay nhằm mục tiecircu lagrave nền tảng ClientServer

- Những nền tảng linh hoạt hơn coacute thể thiacutech ứng với thay đổi trong tổ chức vagrave cocircng nghệ

- Sử dụng dữ liệu thời gian thực dẫn đến quyết định nhanh hơn nhiều thocircng tin hơn

Thagravenh phần phần cứng- Một EIS khocircng đogravei hỏi coacute phần cứng cụ thể hoặc duy nhất nagraveo- Chigravea khoacutea của vấn đề lagrave để đảm bảo rằng caacutec thagravenh phần của EIS tối ưu hoacutea vagrave

phugrave hợp với tagravei nguyecircn maacutey tiacutenh của tổ chức- Hệ thống nagravey phải được cấu higravenh để caacutec nguồn tagravei nguyecircn phugrave hợp với những

người điều hagravenh chuacuteng

Thagravenh phần phần mềm- Traacutei ngược với phần cứng phần mềm thường được chuyecircn mocircn hoacutea cao cho caacutec

bagravei toaacuten về miền- Sự chuyecircn mocircn hoacutea nagravey thường đạt được bằng caacutech sử dụng thagravenh phần off-the-

shelf cho toagraven bộ EIS vagrave caacutec mocirc-đun tugravey chỉnh để đaacutep ứng nhu cầu cụ thể- Lotus Notes lagrave một viacute dụ điển higravenh Noacute coacute thể được sử dụng một migravenh hoặc coacute

thể phục vụ becircn thứ ba mocirc-đun plug-in

Cocircng nghệ EIS hiện nay

Dobrzeniecki đề xuấtphacircn loạitừng cấptheo bachức năng- Loại 1 sản phẩm bao gồmmột bộ đầy đủcaacutec ứng dụngtừ mộtnhagrave cung cấp- Loại 2 sản phẩm đượcthựchiệnở phần đầu củacaacutecsản phẩmDSS đượcphaacutet triển

bởicugravengmộtnhagrave cung cấp- Loại 3 sản phẩmkết hợp với nhautheo bất kỳ số lượngthuộc sở hữu củacocircng ty

65 Xacircy dựng EIS

- Xacircy dựngmộtEISgiống nhưxacircydựngmột số hệ thống khaacutec củamocirc higravenh hệ thống thocircng tin

- Việcphaacutet triểncấu truacutecnecircn được theo dotildeitừ quaacute trigravenh thiết kế đến quaacute trigravenhthực hiện

- Tuy nhiecircn một dự aacuten phaacutet triển EIScoacute xu hướnglagrave thống nhấtvagraveyecircu cầu hỗ trợ caacutec nhagrave quản lyacute latildenh đạo

- Xacircy dựng một EIScoacute thểphaacutet hiện ra đượccaacutectigravenh huống khoacute khănmagravemột nhagrave phaacutet triển chưabao giờ gặp phải

Mocirc higravenh EIS

Khung phaacutet triển một EIS

- Watson et al đề nghị xacircy dựngkhung với ba thagravenh phần+ Caacutech tiếp cận tập trung vagraveo yếu tốcon người vagrave dữ liệu coacute liecircn quan đến EIS+ Quaacute trigravenh phaacutet triển cần sự linh hoạt vagrave tương taacutec+ Người sử dụng - hệ thống hộp thoại bao gồm một ngocircn ngữ hagravenh động để xử lyacute caacutec lệnh

Lợi iacutech của EIS- Dễ duy trigrave caacutec mục tiecircu coacute tổ chức- Dễ truy xuất thocircng tin- Cho pheacutep người sử dụng nacircng cao hiệu suất hơn

- Tăng chất lượng ra quyết định- Cung cấp sự cải tiến cạnh tranh- Tiết kiệm thời gian của người sử dụng- Tăng khả năng vagrave chất lượng giao tiếp- Cung cấp khả năng điều khiển tốt hơn trong tổ chức- Cho pheacutep tham gia caacutec vấn đề vagrave caacutec cơ hội- Cho pheacutep hoạch định- Cho pheacutep tigravem kiếm nguyecircn nhacircn của một vấn đề- Thảo matilden caacutec yecircu cầu của người điều hagravenh

Hạn chế của EIS vagrave 1 số sai lầm cần traacutenh

- Chi phiacute một cuộc khảo saacutetnăm1991 chothấychi phiacute phaacutet triểntrungbigravenh365000USDvớichi phiacute vận hagravenhhagraveng năm lagrave$200000 (EIS)

- Cocircng nghệ hạn chếEIScần phảiđượctiacutech hợp hoagraven toagravenvagraveokiếntruacuteccủadoanh nghiệphiện tại do đoacute noacutelagrave một thaacutech thứclớn đối vớithiết kế

- Hạn chế tổ chức cơ cấu tổ chứccoacute thể khocircng phugrave hợp

Sự hạn chế về tổ chức- Chương trigravenh nghị sự vagrave thời gian chệch EIS mocirc tả một phần việc thực hiện một

chương trigravenh nghị sự vagrave coacute thể dễ dagraveng đạt được sự tin cậy một caacutech chắc chắn- Đồng bộ hoacutea việc quản lyacute sự tin cậy đuacuteng luacutec đặc biệt baacuteo caacuteo EIS coacute thể phaacute

vỡ sự ổn định thiết lập caacutec chu trigravenh baacuteo caacuteo một caacutech tốt nhất- Sự bất ổn EIS phản ứng nhanh coacute thể gacircy ra việc taacutec động trở lại một caacutech

nhanh choacuteng dẫn đến sự thiếu ổn định trong tổ chức

Sự thất bại lagrave thay thế khocircng thể chấp nhận được- Một số yếu tố lagravem EIS thất bại

+ Thiếu sự hỗ trợ về mặt quản lyacute+ Vấn đề chiacutenh trị+ Thất bại của nhagrave phaacutet triển+ Lỗi về cocircng nghệ+ Giaacute cả+ Thời gian

66 Ra quyết định điều hagravenh trong tương lai vagrave EIS

- Coacute một vagravei điều kiện sẽ được hợp nhất cho việc chuyển đổi cocircng nghệ Trong đoacute một vagravei điều kiện coacute thể dễ dự đoaacuten Hai điều kiện magrave ta coacute thể thấy lagrave+ Phaacutet triển cocircng nghệ maacutey tiacutenh trong việc điều hagravenh sẽ tạo ra sự chuyển đổi được chấp nhận một caacutech dễ dagraveng hơn+ Mở rộng traacutech nhiệm điều hagravenh sẽ mở rộng nhu cầu thocircng tin

Tương lai của EIS- EIS thocircng minh Những tiến bộ trong cocircng nghệ AI sẽ được triển khai trong caacutec

EIS- EIS đa phương tiện Cơ sở dữ liệu đa phương tiện sẽ cho pheacutep tiacutech hợp văn bản

giọng noacutei vagrave higravenh ảnh trong tương lai- EIS thocircng tin Tương lai EIS sẽ mở rộng hơn trong việc sử dụng dữ liệu becircn

ngoagravei doanh nghiệp- EIS kết nối Giao tiếp với băng thocircng rộng cho pheacutep kết nối liecircn thocircng lớn hơn

Chương 7 HỆ CHUYEcircN GIA VAgrave TRIacute TUỆ NHAcircN TẠO

71 Caacutec khaacutei niệm

72 Triacute thocircng minh của triacute tuệ nhacircn tạo

73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia

74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia

75 Lợi iacutech vagrave hạn chế của hệ chuyecircn gia

71 Caacutec khaacutei niệm

Chuyecircn mocircn (Expertise) sự hiểu biết rộng trong 1 lĩnh vực hẹp

Hệ chuyecircn gia (Expert Systems)1 chương trigravenh maacutey tiacutenh sử dụng 1 tập caacutec luật dựa trecircn tri thức của con người để giải quyết caacutec vấn đề đogravei hogravei phải coacute sự chuyecircn mocircn

Một số hệ chuyecircn gia nổi tiếng

DENDRAL (Standford 1960s Edward Feigenbaum)

MYCIN (Standford1970s Edward Shortliffe)

PROSPECTOR (MIT 1979)

Triacute tuệ nhacircn tạo (Artificial Intelligence ndash AI)

Triacute tuệ nhacircn tạo một bộ phacircn của ngagravenh khoa học maacutey tiacutenh quan tacircm đến việc thiết kế caacutec hệ thống maacutey tiacutenh thocircng minh đoacute lagrave caacutec hệ thống đưa ra caacutec đặc điểm magrave từ đoacute chuacuteng ta liecircn hệ với sự thocircng minh trong hagravenh động của con người (Barr vagrave Feigenbaum 1981)

Mục điacutech của AI

Mục điacutech khoa học xaacutec định caacutec gợi yacute để giải thiacutech caacutec loại khaacutec nhau của triacute tuệ thực

Mục điacutech kỹ thuật giải quyết caacutec vấn đề trong thế giới thực

Triacute tuệ nhacircn tạo kế thừa nhiều yacute tưởng quan điểm kỹ thuật từ caacutec ngagravenh khoa học khaacutec

- Triết học

- Logic Toaacuten học

- Tiacutenh toaacuten

- Khoa học tacircm lyacute Khoa học nhận thức

- Sinh học Thần kinh học

- Tiến hoacutea

Caacutec lĩnh vực ứng dụng trong Triacute tuệ nhacircn tạo

Mạng nơ ron thần kinh (Neural Networks)

Tiacutenh toaacuten sự tiến hoacutea

(Evolutionary Computation)

Hệ chuyecircn gia (Expert Systems)

Kỹ thuật xử lyacute tiếng noacutei (Speech Processing)

Kỹ thuật xử lyacute ngocircn ngữ tự nhiecircn

(Natural Language Processing)

Lập kế hoạch (Planning)

Robot (Robotics)

Khoa học higravenh ảnh (Vision)

Caacutec kỹ thuật thocircng dụng dugraveng trong AI

Biểu diễn(Representation)

Học (Learning)

Caacutec luật (Rules)

Tigravem kiếm (Search)

72 Triacute thocircng minh của triacute tuệ nhacircn tạo

Con người suy diễn như thế nagraveo

Phacircn loại (Categorization)

Caacutec quy tắc cụ thể

Heuristics

Kinh nghiệm trước đoacute

Dự tiacutenh trước

Maacutey tiacutenh suy diễn như thế nagraveo

Lập luận dựa trecircn luật IF-THEN mocirc tả tri thức được matilde hoacutea dưới dạng caacutec luật

Caacutec khung (Frames) lagrave caacutec đại diện mocirc tả caacutec tigravenh huống giống nhau lagrave điển higravenh của một vagravei phacircn loại

Lập luận dựa trecircn caacutec trường hợp mocirc phỏng giải phaacutep trước đoacute cho một vấn đề hiện tại

Nhận dạng mẫu phaacutet hiện acircm thanh higravenh dạng hoặc caacutec chuỗi dagravei

Caacutec dạng khaacutec của Triacute tuệ nhacircn tạo

Học maacutey- mạng nơron vagrave giải thuật di truyền

Lập trigravenh tự động ndash lagrave những kỹ thuật tạo ra caacutec chương trigravenh để lagravem 1 nhiệm vụ riecircng biệt (cho pheacutep những người khocircng phải lagrave người lập trigravenh coacute thể lập trigravenh được)

Cuộc sống nhacircn tạo ndash nỗ lực để taacutei tạo caacutec hiện tượng sinh học trong caacutec hệ thống dựa trecircn maacutey tiacutenh

73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia(Expert Systems- ES)

Theo Jackson (1999) Một hệ chuyecircn gia lagrave một chương trigravenh maacutey tiacutenh mocirc tả vagrave suy diễn với tri thức của một vagravei lĩnh vực để giải quyết vấn đề hay đưa ra caacutec lời khuyecircn

Cấu truacutec cơ bản của ES được dựa theo cấu truacutec chung của DSS Sự khaacutec biệt chiacutenh giữa ES vagraveDSS lagrave hệ ES thu thập caacutec kiến thức từ những

chuyecircn gia trong lĩnh vực quan tacircmĐặc trưng của hệ chuyecircn gia Hiệu quả cao Thời gian trả lời thỏa đaacuteng Độ tin cậy cao Dễ hiểu

Giao diện người dugraveng trong ES

Thiết kế giao diện người dugraveng tập trung vagraveo caacutec yếu tố như dễ dagraveng sử dụngcoacute độ tin cậy cao giảm tải những khoacute khăn khi sử dụng

Thiết kế necircn coacute một số tương taacutec (đầu vagraveo kiểm soaacutet vagrave truy vấn)

Cấu tạo giao diện người dugraveng gồm coacute magraven higravenh cảm ứng bagraven phiacutem buacutet saacuteng lệnh thoại caacutec phiacutem chuyecircn dụng

Cơ sở tri thức (Knowledge Base)

Chứa đựng caacutec tri thức cụ thể miền thu được từ caacutec chuyecircn gia miền

Coacute thể chứa caacutec mocirc tả caacutec hagravenh vi giải quyết vấn đề caacutec ragraveng buộc caacutec heuristics

Thagravenh cocircng của một ES dựa trecircn tiacutenh đầy đủ vagrave tiacutenh chiacutenh xaacutec của cơ sở tri thức

Mocirc tơ suy diễn (Inference Engine)

Ở đacircy tri thức được đặt để sử dụng tạo ra caacutec giải phaacutep để giải quyết vấn đề

Mocirc tơ nagravey coacute khả năng thực hiện diễn dịch hoặc suy diễn dựa trecircn caacutec luật hay caacutec caacutec sự kiện

Đồng thời cũng coacute khả năng sử dụng caacutec suy diễn mờ hay khocircng chiacutenh xaacutec dựa trecircn xaacutec suất hay aacutenh xạ mẫu

Vograveng điều khiển suy diễn

1 Aacutenh xạ caacutec luật với caacutec sự kiện đatilde được cho

2 Chọn luật để thực hiện

3 Thực hiện luật bằng caacutech thecircm caacutec sự kiện được suy diễn ra vagraveo bộ nhớ lagravem việc

Chuỗi suy diễn (Chaining)

Suy diễn tiến (forward chaining) maacutey suy diễn bắt đầu từ dữ liệu ban đầu vagrave thực hiện việc suy luận để đưa ra caacutec kết luận cuối cugraveng

Suy diễn lugravei (backward chaining) maacutey suy diễn bắt đầu từ dữ liệu điacutech vagrave tigravem ra tri thức hỗ trợ cho dữ liệu điacutech đoacute

Viacute dụ suy diễn lugravei

R1 Nếu coacute A vagrave B thigrave suy ra coacute D

R2 Nếu coacute B thigrave suy ra coacute C

R3 Nếu coacute C vagrave D thigrave suy ra coacute E

Ta coacute E ta xem trong 3 luật R1 R2 R3 luật nagraveo coacute E ta thấy R3 chứa E đồng thời chứa C vagrave D Xeacutet tiếp trong 2 luật R1 R2 luật nagraveo chứa C vagrave D R2 chứa C R3 chứa D Từ đoacute ta coacute được caacutec tri thức hỗ trợ suy diễn vagrave kết luận lagrave nếu coacute A vagrave B thigrave sẽ coacute E Hay nếu A vagrave B đuacuteng thigrave sẽ coacute E

Viacute dụ suy diễn tiến

Giả sử coacute tập chứa 3 luật sau

R1 Nếu coacute A vagrave B thigrave suy ra coacute D

R2 Nếu coacute B thigrave suy ra coacute C

R3 Nếu coacute C vagrave D thigrave suy ra coacute E

Nếu ta coacute A vagrave B thigrave chuacuteng ta suy ra được D từ R1 vagrave suy ra C từ R2 Với D vagrave C đatilde được suy ra ở trecircn giờ chuacuteng ta suy ra được E từ R3

Viacute dụ thực tế

Giả sử muốn biết magraveu của một con vật nuocirci tecircn lagrave Fred biết rằng noacute kecircu ộp ộp vagrave ăn ruồi

Coacute tập 4 luật ban đầu như sau

R1 Nếu X kecircu ộp ộp vagrave ăn ruồi thigrave X lagrave con ếch

R2 Nếu X kecircu chiecircm chiếp vagrave biết hoacutet thigrave X lagrave con chim

R3 Nếu X lagrave con ếch thigrave X coacute magraveu xanh

R4 Nếu X lagrave con chim thigrave X coacute magraveu vagraveng

74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia

Expert system shells lagrave một tập caacutec goacutei phần mềm vagrave caacutec cocircng cụ dugraveng để phaacutet triển caacutec hệ chuyecircn gia

Những Expert system shells đầu tiecircn thường rất rườm ragrave Mặc dugrave vậy noacute vẫn giuacutep cho người sử dụng sẽ khocircng phải bắt đầu lại từ đầu khi xacircy dựng một hệ chuyecircn gia mới

Những shell hiện đại bao gồm hai mocirc-đun chiacutenh lagrave cocircng cụ xacircy dựng một tập quy tắc vagrave mocirc tơ suy diễn

Xacircy dựng hệ chuyecircn gia

Bước 1 xacircy dựng mocirc higravenh bagravei toaacuten xaacutec định vấn đề nhiệm vụ magrave hệ thống sẽ thực hiện Caacutec dạng bagravei toaacuten cần hệ chuyecircn gia

Bagravei toaacuten diễn giải (InterPretation)

Bagravei toaacuten dự baacuteo (Prediction)

Bagravei toaacuten chuẩn đoaacuten (Diagnose)

Bagravei toaacuten gỡ rối (Debugging)

Bagravei toaacuten thiết kế

Tương tự như một dự aacuten phần mềm để xacircy dựng một hệ chuyecircn gia cần phải coacute caacutec yếu tố về nhacircn lực tagravei nguyecircn vagrave thời gian Những yếu tố nagravey ảnh hưởng đến giaacute thah của một hệ chuyecircn giaTrong phần nagravey cacircu hỏi thường được đặt ra lagrave tại sao cần phải xacircy dựng một hệ chuyecircn giaTrước khi bắt đầu phải xaacute định rotilde bagravei toaacuten đạt ra lagrave jiAi lagrave chuyecircn giaAi lagrave người sử dụng

1 Diễn giải (InterPretation) Nghiecircn cứu 1 vấn đề -gt Dựa trecircn những biểu hiện thuộc tiacutenh đặc trưng becircn ngoagravei -gt Tư vấn

(hoặc đưa ra kết luận hay mocirc tả dễ hiểu từ tập dữ liệu thocirc)

2 Bagravei toaacuten dự baacuteo (Prediction) Coacute thể dự đoaacuten được hagravenh vi kết quả dựa trecircn caacutec hiện tượng -gt dự baacuteo

VD Dự baacuteo thời tiết động đấthellip

3 Bagravei toaacuten chẩn đoaacuten (Diagnoss) Xaacutec định caacutec lỗi caacutec bộ phận hỏng hoacutec của hệ thống dựa trecircn caacutec dữ liệu quan saacutet được

4 Bagravei toaacuten gỡ rối (Debugging) Mocirc tả caacutec phương phaacutep khắc phục hệ thống khi gặp sự cố

5 Bagravei toaacuten thiết kế Lựa chọn cấu higravenh caacutec đối tượng nhằm thoả matilden một số ragraveng buộc nagraveo đoacute

6 Giảng dạy Phần mềm dạy học coacute thể chuẩn đoaacuten vagrave sủa lỗi của học sinh trong quaacute trigravenh học tập

Để xaacutec định đuacuteng bagravei toaacuten magrave chuacuteng ta cần giải quyết thigrave phải trả lời đc một số cacircu hỏi

- cần hệ chuyecircn gia

Bước 2 thu thập tri thức lựa chọn cocircng cụ vagrave aacutep dụng

Trong bước thu thập tri thức vấn đề quan trọng lagrave lựa chọn chuyecircn gia những người magrave sẽ đoacuteng goacutep tri thức cho hệ thống Thocircng thường trong suốt quaacute trigravenh phaacutet triển thigrave chuyecircn gia được xem như một thagravenh viecircn của đội phaacutet triển

Hiện nay coacute rất nhiều cocircng cụ để xacircy dựng một hệ chuyecircn gia Phổ biến nhất lagrave JESS CLIPS vagrave OPS5

Bước 3 Thiết kế cơ sở tri thức thiết kế hệ thốngTri thức được biểu diễn trường minh trong cơ sở tri thức

Caacutec chuyecircn gia vagrave kỹ sư tri thức sẽ đối thoại với nhau bằng caacutec kỹ thuật đối thoại Suy diễn (SD) bảng Mocirc higravenh hoacutea SD quy nạp phacircn loại

Vấn đề bagraveo trigrave vagrave phaacutet triển

Caacutec hệ chuyecircn gia đogravei hỏi phải bảo trigrave vagrave phaacutet triển nhiều hơn so với caacutec hệ thống khaacutec Phải thường xuyecircn bổ sung tri thức mới vagrave thay đổi caacutec tri thức cũ để đổi mới hệ chuyecircn gia

Thu thập vagrave khắc phục lỗi do người sử dụng phaacutet hiện để kịp thời khắc phục những sai soacutet của hệ chuyecircn gia

75 Lợi iacutech vagrave hạn chế của caacutec hệ chuyecircn gia

Một số lợi iacutech chiacutenh

Thời gian trả lời hợp lyacute bằng hoặc nhanh hơn so với chuyecircn gia (người) để đi đến cugraveng một quyết định Hệ chuyecircn gia lagrave một hệ thống thời gian thực (real time system)

Khả năng trả lời với mức độ tinh thocircng bằng hoặc cao hơn so với chuyecircn gia (người) trong cugraveng lĩnh vực

Hệ chuyecircn gia giuacutep cho hiệu quả lagravem việc tăng bằng việc sử dụng tập caacutec luật một caacutech nhanh choacuteng magrave ko bị nhầm lẫn chuyecircn gia lagrave người coacute thể quecircn đi một số tri thức cơ sở lyacute luậ nhưng HCG thigrave ko

Quyết định của một người chuyecircn gia coacute thể bị thay đổi vagrave ko coacute tiacutenh thống nhất như quyết định của một hệ chuyecircn gia tạo ra

Hệ chuyecircn gia giuacutep cho người sử dụng coacute thể trau dồi sự hiểu biết trecircn lĩnh vuej cụ thể magrave noacute giải quyết hỗ trợ người ra quyết định coacute trigravenh độ như 1 chuyecircn gia trong quaacute trigravenh gia quyết định

Kiến thức của rất nhiều chuyecircn gia về một lĩnh vực nagraveo đoacute được đưa vagraveo hệ chuyecircn gia lagravem cho CSTT cuat HCG phong phuacute vagrave rộng lớn hơn rất nhiều

HCG giải thiacutech caacutec bước suy luận một caacutech dễ hiểu nhất quaacuten luacutec nagraveo cũng coacute thể sử dụng ko như chuyecircn gia con người

Hạn chế của caacutec hệ chuyecircn gia

Nhược điểm lớn nhất của hệ chuyecircn gia lagrave những yacute kiến chuyecircn mocircn thường rất khoacute matilde hoacutea vagrave giải neacuten

Hệ chuyecircn gia khocircng coacute khả năng tự học tự cập nhật kiến thức mới như caacutec chuyecircn gia magrave cần phải được matilde hoacutea lại khi noacute được cập nhật

Hệ chuyecircn gia khocircng thể nhận ra được vấn đề khocircng nằm trong miền kiến thức của hệ thống

Chương 8 Tri thức vagrave tiếp nhận

1 Bao gồm caacutec vấn đề

Dữ liệu thực tế đo lường hoặc quan saacutet coacute hoặc khocircng coacute bối cảnh

Thocircng tin dữ liệu được tổng hợp một caacutech hữu iacutech để giải quyết những khoacute khăn trong việc đưa ra quyết định

Tri thức bao gồm caacutec ứng dụng quy tắc thocircng tin hướng dẫn của người ra quyết định

2 Những caacutei nhigraven về tri thức

Đại diện lagravem thế nagraveo để diễn tả tri thức viacute dụ như một quyển saacutech khocircng phải lagrave tri thức nhưng noacute lại lagrave một đại diện của tri thức

Sản xuất tri thức lagrave một tập hơp của hagraveng tồn kho coacute thể được sản xuất cũng như mua lại

Tri thức lagrave 1 trong 6 trạng thaacutei của hệ thống

1Dữ liệu 2Thocircng tin 3Cấu truacutec thocircng tin 4Sự thấu hiểu 5Yacute kiến 6 Quyết định

3 Caacutec loại tri thức Phổ biến mocirc tả dữ liệu thocircng tin thủ tục mọi thứ lagravem như thế nagraveo lập luận chiacutenh saacutech hoặc caacutec quy tắc

4 Thu thập Tri thức hệ chuyecircn gia Hầu hết caacutec phương phaacutep đều bắt đầu với mocirc higravenh của caacutec taacutec vụ trong đoacute

hệ chuyecircn gia được xacircy dựng Trong đoacute mocirc tả về caacutec lĩnh vực được tạo ra Caacutec kỹ sư sử dụng caacutec mocirc higravenh giả thuyết vagrave nhận thức về quaacute trigravenh phacircn

tiacutech để gợi ra caacutech giải quyết vấn đề về tri thức từ caacutec chuyecircn gia

5 Caacutec chiều của thu thập tri thức KE- driven caacutec kỹ sư trao đổi trực tiếp với caacutec chuyecircn gia Expert-driven Caacutec chuyecircn gia trực tiếp đưa chuyecircn mocircn của họ vagraveo hệ

thống maacutey tiacutenh Machine-driven Sử dụng caacutec cocircng cụ suy luận để triacutech xuất tri thức từ một

tập caacutec viacute dụ

6 Kỹ thuật thu thập tri thức Trao đổi gồm 2 loại cơ bản lagrave coacute cấu truacutec(coacute kịch bản) vagrave khocircng coacute cấu

truacutec( đối thoại trực tiếp) Giao thức phacircn tiacutech bằng lời Khi caacutec chuyecircn gia thực hiện một cocircng việc

của họ thigrave một bản ghi về cocircng việc đoacute được thực hiện Caacutec kỹ sư sẽ xacircy dựng mocirc higravenh cho những gigrave được ghi lại trong bản ghi

Phương phaacutep sagraveng lọc caacutec chuyecircn gia so saacutenh caacutec nhoacutem liecircn tiếp trong ba đối tượng vagrave cho biết tại sao nhoacutem thứ hai lại khaacutec nhoacutem thứ ba

7 Thu thập tri thức từ nhiều nguồn Thu thập tri thức từ nhiều nguồn lagrave cần thiết để coacute được đầy đủ caacutec tri thức

cho một vấn đề quan điểm yacute kiến traacutei ngược nhau thường phaacutet sinh Phương phaacutep đồng thuận sẽ giuacutep giải quyết được vấn đề macircu thuẫn Kỹ thuật phacircn tiacutech Meta lagrave kỹ thuật được aacutep dụng trong caacutec trường hợp

khaacutec Caacutech tiếp cận bằng định lượng đogravei hỏi caacutec kỹ sư cần cacircn nhắc yếu tố đầu vagraveo của caacutec chuyecircn gia khaacutec nhau

8 Xaacutec nhận hợp lệ vagrave kiểm tra tri thức Một khi thu thập tri thức noacute phải được đaacutenh giaacute về khả năng sử dụng vagrave độ

chiacutenh xaacutec Hai vấn đề cụ thể lagrave hiệu lực của những kiến thức vagrave kiểm tra việc xacircy dựng cơ sở của tri thức

Cần xaacutec nhận xem liệu hệ thống coacute thể hoạt động ở mức độ tối thiểu khocircng

Xaacutec minh liecircn quan đến việc so saacutenh từng chi tiết kỹ thuật của hệ thống những gigrave đatilde được thực hiện cuối cugraveng

9 Một số caacutec biện phaacutep xaacutec nhận Độ chiacutenh xaacutec Khả năng thiacutech nghi Mức độ đầy đủ Bề rộng Độ sacircu Hiệu lực Tổng quan Chiacutenh xaacutec Hiện thực Độ tin cậy Tiacutenh hữu dụng Mức độ

Chương 9 Học maacutey

1 Logic mờ vagrave ngocircn ngữ mờ(Fuzzy Logic and Linguistic Ambiguity)

Ngocircn ngữ tự nhiecircn gồm những khaacutei niệm mơ hồ vagrave khocircng chiacutenh xaacutectruyền tải ngữ nghĩa thocircng qua tiacutenh xấp xỉkhocircng rotilde ragraveng

Những xấp xỉ nagravey giuacutep con người coacute thể truyền tải hết được yacute nghĩa nhưng maacutey thigrave khocircng hiểu

Lagravem sao biểu diễn caacutec tri thức sử dụng caacutec khaacutei niệm khocircng rotilde ragraveng(mờ) hoặc khocircng chiacutenh xaacutec

2 Khaacutei niệm cơ bản của logic mờ tập mờ lagrave những tập hợp khocircng coacute một giới hạn rotilde Mỗi phần tử của noacute chỉ

chứa một mức độ hagravem liecircn thuộc của từng phần tử Vigrave vậy tập mờ khocircng giống như tập cổ điển Tập mờ coacute thể kết hợp với nhau qua những luật mờ magrave đặc trưng cho những hagravenh động trạng thaacutei vagrave thuộc tiacutenh của logic mờ được tận dụng khi thực hiện một bộ điều khiển mờ

Logic mờ dựa trecircn yacute tưởng mỗi phần tử thuộc vagraveo một tập hợp ở một mức độ nagraveo đấy

Locircgic mờ cho pheacutep độ liecircn thuộc (microA )coacute giaacute trị trong khoảng (01) Locircgic mờ coacute thể được coi lagrave mặt ứng dụng của lyacute thuyết tập mờ để xử lyacute caacutec

giaacute trị trong thế giới thực cho caacutec bagravei toaacuten phức tạp

3 So saacutenh tiacutenh đuacuteng đắn logic mờ vagrave xaacutec suất Xaacutec suất thigrave đề cập đến khả năng xảy ra một biến cố hay một điều gigrave đoacute Logic mờ đề cập đến cấp độ magrave đặc tiacutenh ở hiện tại

o viacute dụ1 người coacute chiều cao 6 feet thigrave coacute cấp độ lagrave 05 về chiều cao

4 Ưu điểm của logic mờ Caacutech tiếp cận rất tự nhiecircnkhocircng phức tạp Coacute thể mocirc higravenh hoacutea caacutec hagravem phi tuyến tugravey yacute phức tạp

Coacute thể tận dụng được kinh nghiệm từ những chuyecircn gia hagraveng đầu trong mọi lĩnh vực

Logic mờ được xacircy dựng dựa trecircn ngocircn ngữ tự nhiecircnNền tảng của logic mờ lagrave dựa trecircn cơ sở giao tiếp của con người

5 Nhược điểm của logic mờ Trong 1 hệ thống phức tạpsử dụng logic mờ coacute thể trở thagravenh trở ngại cho

việc xaacutec thực độ tin cậy của hệ thống Cơ chế lập luận mờ khocircng thể học hỏi từ những lỗi sai

6 Mạng noron nhacircn tạo(ANN) Mạng noron nhacircn tạo lagrave một mocirc phỏng xử lyacute thocircng tinđược nghiecircn cứu ra

từ hệ thống thần kinh của sinh vậtgiống như bộ natildeo để xử lyacute thocircng tin ANNs lagrave chương trigravenh dựa trecircn maacutey tiacutenh đơn giản coacute chức năng lagrave một mocirc

higravenh bagravei toaacuten khocircng gian dựa trecircn thử nghiệm vagrave baacuteo lỗi

7 Học từ kinh nghiệm Tiến trigravenh Một mẫu dữ liệu được biểu diễn như một mạng lưới noronANN ldquodự

đoaacutenrdquo 1 đầu radự đoaacuten được so saacutenh với giaacute trị thực tế hoặc giaacute trị chiacutenh xaacutecNếu đoaacuten được chiacutenh xaacutec thigrave khocircng coacute hagravenh động nagraveo được thực hiện

Nếu dự đoaacuten sai ANN kiểm tra lại vagrave xaacutec định lại thocircng số để điều chỉnh Một mẫu dữ liệu khaacutec được biểu diễn vagrave quaacute trigravenh nagravey được lặp lại

8 Nguyecircn tắc cơ bản của cocircng nghệ nơron Caacutec yếu tố xử lyacute cơ bản trong hệ thống thần kinh của con người lagrave tế bagraveo

thần kinhMạng lưới của tế bagraveo nagravey lagrave liecircn kết với nhau nhận được thocircng tin từ caacutec cảm biến trong mắt taihellip

Thocircng tin nhận được bởi tế bagraveo thần kinh hoặc lagrave sẽ kiacutech thiacutech noacute(sẽ được chuyển qua 1 thocircng điệp dọc theo mạng lưới) hoặc lagrave sẽ ngăn cản noacute(ngăn cản dograveng thocircng tin)

Độ nhạy coacute thể thay đổi qua thời gian hoặc sau khi coacute được kinh nghiệm

9 Cấu truacutec mạng Một ANN gồm 3 lớp cơ bản

Lớp đầu vagraveo nhận dữ liệu Lớp becircn trong hoặc lagrave lớp ẩn xử lyacute dữ liệu Lớp đầu ra chuyển tiếp kết quả cuối cugraveng của mạng

10Mạng nơ ron Thường coacute nhiều đầu vagraveo mỗi đầu vagraveo với mức ảnh hưởng vagrave tầm quan

trọng riecircng của noacute Một đầu vagraveo quan trọng coacute thể được sử dụng để khuếch đại đầu ra caacutec hagravem trạng thaacutei tổng hợp caacutec trọng số của caacutec yếu tố

đầuvagraveo khaacutec nhauvagraveo một giaacute trị duy nhất Caacutec hagravem chuyển giao xử lyacute caacutec giaacute trị trạng thaacutei vagrave tạo đầu ra

11Huấn luyện mạng nơ ron Trong mocirc higravenh coacute giaacutem saacutetANN được đến so saacutenh dự đoaacuten của chiacutenh

noacute với thocircng tin phản hồi coacute chứa caacutec kết quả mong muốn ANN sẽ phải tigravem caacutech thay đổi caacutec tham số becircn trong củamigravenh (caacutec trọng số vagrave caacutec ngưỡng) để tạo necircn một aacutenh xạ coacute khả năng aacutenh xạcaacutec đầu vagraveo thagravenh caacutec đầu ra mong muốn Sự thay đổi nagravey được tiến hagravenh nhờ việc so saacutenh giữa đầu ra thực sự vagrave đầu ra mong muốn

Trong mocirc higravenh khocircng coacute giaacutem saacutetANN nhận được dữ liệu vagraveo nhưng khocircng phải coacute bất kỳ thocircng tin phản hồi về kết quả mong muốn

Phần lớn caacutec ứng dụng nằm trong vugraveng của caacutec bagravei toaacuten ước lượng như mocirc higravenh hoacuteathống kecirc neacuten lọc phacircn cụm

12Lợi iacutech Liecircn kết với mạng noron Traacutenh caacutech lập trigravenh tường minh Giảm nhu cầu của chuyecircn gia ANNs thigrave thiacutech nghi với caacutec yếu tố đầu vagraveo thay đổi Khocircng cần thiết cho cơ sở tri thức tinh chế ANNs coacute tiacutenh động vagrave cải thiện với việc sử dụng Coacute khả năng xử lyacute dữ liệu khocircng chiacutenh xaacutec hoặc khocircng đầy đủ Cho pheacutep tổng quaacutet hoacutea từ thocircng tin cụ thể Cho pheacutep thu thập cảm giaacutec thocircng thường vagraveo miền giải quyết vấn đề

13Hạn chế của việc liecircn kết với mạng noron ANNs khocircng thể giải thiacutech được suy luận Bản chất hộp đen thường khiến cho vấn đề traacutech nhiệm vagrave độ tin cậy phaacutet

sinh lagrave khoacute khăn Lặp đi lặp lại quaacute trigravenh huấn luyện rất tốn thời gian Nguồn lực caacutec nhagrave phacircn tiacutech vagrave thiết kế coacute tay nghề cao vẫn lagrave đaacuteng lo

ngại Cocircng nghệ ANN thuacutec đẩy hạn chế của phần cứng hiện tại ANN yecircu cầu phải coacute sự tin tưởng ở đầu ra

14Giới thiệu về thuật toaacuten di truyền Cũng như mạng lưới thần kinh caacutec thuật toaacuten di truyền được dựa trecircn lyacute

thuyết sinh học Thuật toaacuten di truyền tigravem thấy nguồn gốc của chuacuteng trong caacutec lyacute thuyết

tiến hoacutea của chọn lọc tự nhiecircn vagrave thiacutech ứng với biến đổi khiacute hậu Kết quả thuật toaacuten di truyền lagrave từ giao phối 2 caacute thể trong quần thế để tạo

ra con caacutei đocirci khi tốt hơn so với bậc cha mẹ của chuacuteng 15Caacutec thagravenh phần cơ bản của thuật toaacuten di truyền

Toaacuten tử chọn lọc Caacutec caacute thể tốt được chọn lọc để đưa vagraveo thế hệ sau Sự chọn lọc nagravey căn cứ vagraveo độ thiacutech nghi với mocirci trường của mỗi caacute thể

Toaacuten tử lai gheacutep (crossover) Hai caacute thể cha vagrave mẹ trao đổi caacutec gen với nhau để tạo ra caacute thể con

Toaacuten tử đột biến (mutation) Một caacute thể thay đổi một số gen để biến đổi thagravenh một caacute thể mớiTất cả caacutec toaacuten tử trecircn khi thực hiện đều mang tiacutenh ngẫu nhiecircn

16Quaacute trigravenh cơ bản của một thuật toaacuten di truyền Khởi tạo

Đaacutenh giaacute quần thể

Lựa chọn NST thiacutech hợp nhất vagrave loại bỏ NST yếu nhất

Quy trigravenh giao nhau vagrave cải thiện quần thể

đột biến tiến trigravenh để khaacutem phaacute ra NST mới

17Ưu nhược điểm của việc kết hợp với thuật toaacuten di truyền Kiacutech thước quần thể lagrave 1 yếu tố quan trọng trong tốc độ của việc tigravem

kiếmnhưng noacute tương đối dễ dagraveng để dự đoaacuten tốc độ nagravey Giao nhau hoặc đột biến lagrave khocircng necircn đc sử dụng quaacute thường xuyecircn Luocircn coacute được iacutet nhất 1 giải phaacutep hợp lyacute Necircn coacute thể aacutep dụng chuacuteng cho caacutec vấn đề magrave chuacuteng ta khocircng coacute hướng

về caacutech giải quyết Sức mạnh của thuật toaacuten xuất phaacutet từ khaacutei niệm đơn giảnkhocircng phải từ

một thủ tục thuật toaacuten phức tạp 18Tương lai của học maacutey

Mạng lưới thần kinh nhacircn tạo vượt quaacute năng lực của con người trong caacutec trường hợp bị cocirc lập

Về mặt lyacute thuyếtmột maacutey tiacutenh coacute thể xử lyacute dũ liệu nhanh hơn hagraveng triệu lần so với 1 con người

May mắn thay cho chuacuteng tacon người tốt hơn nhiều khi magrave coacute được dữ liệumaacutey tiacutenh khocircng coacute 1 số thứ như lagrave 5 giaacutec quan

CHƯƠNG 10 KHO DỮ LIỆU

1 Kho dữ liệu Kho dữ liệu lagrave tuyển tập caacutec cơ sở dữ liệu tiacutech hợp hướng chủ đề được

thiết kế để trợ giuacutep cho một hệ hỗ trợ quyết định

Theo John Ladley Cocircng nghệ kho dữ liệu lagrave tập caacutec phương phaacutep kỹ thuật vagrave caacutec cocircng cụ coacute thể kết hợp hỗ trợ nhau để cung cấp thocircng tin cho người sử dụng trecircn cơ sở tiacutech hợp từ nhiều nguồn dữ liệu nhiều mocirci trường khaacutec nhau

Kho dữ liệu thường rất lớn tới hagraveng trăm GB hay thậm chiacute hagraveng Terabyte

2 Kho dữ liệu vận hagravenh (ODS) Một kho dữ liệu vận hagravenh Aacutep dụng kỹ thuật kho dữ liệu vagraveo caacutec hệ xử

lyacute giao taacutec lưu trữ dữ liệu cho một ứng dụng đặc thugrave Noacute đưa vagraveo kho dữ liệu một dograveng caacutec dữ liệu thocirc được thiết kế

3 So saacutenh

Kho dữ liệu vận hagravenh Kho dữ liệu

Dữ liệu theo chủ đề Dữ liệu theo chủ đề

Dữ liệu tiacutech hợp Dữ liệu tiacutech hợp

Dữ liệu thay đổi Dữ liệu khocircng thay đổi

Dữ liệu được cập nhật khi thay đổi

Dữ liệu giữ nguyecircn

Chỉ coacute dữ liệu hiện tạiDữliệu hiện tại vagrave dữ liệu lịch sử

Chu kỳ lagravem tươi dữ liệu ngắn Chu kỳ lagravem tươi dữ liệu dagravei

Chỉ coacute dữ liệu chi tiết Dữ liệu chi tiết vagrave dữ liệu tổng kết

Dugraveng cho caacutec quyết định ngắn hạn

Dugraveng cho hoạch định dagravei hạn

4 Kho dữ liệu cục bộ (Data Mart - DM)

Kho dữ liệu cục bộ lagrave CSDL coacute những đặc điểm giống với kho dữ liệu nhưng với quy mocirc nhỏ hơn vagrave lưu trữ dữ liệu về một lĩnh vực một chuyecircn ngagravenh

Data mart phụ thuộc Chứa những dữ liệu được lấy từ DW vagrave những dữ liệu nagravey sẽ được triacutech lọc vagrave tinh chế tiacutech hợp lại ở mức cao hơn để phục vụ một chủ đề nhất định của Datamart

Data mart độc lập Khocircng giống như Datamart phụ thuộc Data mart độc lập được xacircy dựng trước DW vagrave dữ liệu được trực tiếp lấy từ caacutec nguồn khaacutec nhau

5 Siecircu dữ liệu Metadata lagrave dữ liệu để mocirc tả dữ liệu Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột

một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi Metadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu

6 Mocirci trường kho dữ liệu Hệ thống của tổ chức vagrave kho cung cấp dữ liệu để xacircy dựng kho dữ liệu Trong quaacute trigravenh chuyển dữ liệu từ caacutec nguồn khaacutec nhau dữ liệu coacute thể

được lagravem sạch hoặc chuyển đổi vagrave vigrave thế DW được xem như lagrave một chuẩn cho việc lưu trữ

Đồng thời siecircu dữ liệu được ghi lại Cuối cugraveng DW hoặc siecircu thị coacute thể được sử dụng để tạo ra một kho dữ

liệu ldquocaacute nhacircnrdquo 7 Caacutec đặc điểm của kho dữ liệu

Đặc điểm Mocirc tả

Hướng chủ đề - DL tổ chức theo caacutech thức người dugraveng tham chiếu

Tiacutech hợp - Dữ liệu ldquosạchrdquo loại bỏ tiacutenh thiếu nhất quaacuten

Khocircng thay đổi - DL ldquochỉ đọcrdquo người dugraveng khocircng thay đổi được

Chuỗi thời gian - DL lagrave chuỗi thời gian khocircng phải lagrave trạng thaacutei hiện tại

Được tổng kết - DL vận hagravenhthao taacutec khi cần thiết

được kết hợp lại thagravenh dạng coacute thể dugraveng được cho quyết định

Kiacutech cỡ lớn hơn - Lưu giữ theo chuỗi thời gian tức lagrave giữ lại nhiều DL

Khocircng được chuẩn hoacutea - Coacute thể dư thừa DLSiecircu dữ liệu - Dữ liệu của dữ liệu được lưu trữNguồn dữ liệu - DL vận hagravenh (caacutec hệ sẵn coacute) cugraveng

với caacutec nguồn ngoagravei 8 Kho dữ liệu hướng chủ đề

Hướng chủ để coacute nghĩa lagrave kho dữ liệu được tổ chức xung quanh caacutec chủ đề chiacutenh như khaacutech hagraveng sản phẩm sản xuất Tập trung vagraveo việc mocirc higravenh hoacutea vagrave phacircn tiacutech dữ liệu cho caacutec nhagrave ra quyết định magrave khocircng tập trung vagraveo caacutec xử lyacute thocircng thường Cung cấp cho người dugraveng một khung nhigraven toagraven vẹn đơn giản vagrave đầy đủ về caacutec sự kiện quanh caacutec chủ đề

9 Dữ liệu trong DW được tiacutech hợp Dữ liệu trong kho dữ liệu được xacircy dựng bằng caacutech tổng hợp dữ liệu từ

nhiều nguồn khaacutec nhau vagrave caacutec nguồn coacute tổ chức khaacutec nhau Cơ sở dữ liệu caacutec file excel caacutec flat file hoặc caacutec raw file Khi đưa vagraveo kho dữ liệu caacutec dữ liệu được lagravem sạch vagrave tiacutech hợp dữ liệu nhằm đảm bảo tiacutenh nhất quaacuten của dữ liệu

10Kiến truacutec kho dữ liệu Tầng cơ sở dữ liệu hoạt động Tầng truy xuất thocircng tin Tầng truy xuất dữ liệu Tầng siecircu dữ liệu Tầng quản lyacute tiến trigravenh Tầng thocircng điệp của ứng dụng Tầng vật liacute của kho dữ liệu Tầng trigravenh diễn dữ liệu

11Higravenh trạng kho dữ liệu Kho dữ liệu ảo - người dugraveng cuối coacute thể truy cập trực tiếp đến kho dữ liệu

sử dụng caacutec cocircng cụ cho pheacutep ở tầng truy xuất dữ liệu Kho dữ liệu trung tacircm-1 cơ sở dữ liệu vật lyacute chứa tất cả dữ liệu cho một

vugraveng chuyecircn dụng nagraveo đoacute

Kho dữ liệu phacircn taacuten- Thagravenh phần được phacircn taacuten qua nhiều hệ cơ sở dữ liệu vật lyacute

12METADATA- Siecircu dữ liệu Định nghĩa Siecircu dữ liệu lagrave dữ liệu về dữ liệu Lagrave 1 lưu trữ dugraveng để

Miecircu tả kho dữ liệu tổng thể Nhận dạng kiểu kho dữ liệu Quản liacute quaacute trigravenh tiacutech hợp dữ liệu Quản liacute quaacute trigravenh cập nhật kho dữ liệu Quản liacute bảo mật

Lagrave chigravea khoacutea quyết định sự thagravenh cocircng của kho dữ liệu luocircn được thay đổi vagrave cập nhật theo sự phaacutet triển của kho dữ liệu

Dugraveng để quản liacute điều khiển kho dữ liệu Sự ra đời của kho dữ liệu như 1 cấu truacutec hỗ trợ ra quyết định siecircu dữ liệu

được xem như nguồn tagravei nguyecircn dữ liệu Siecircu dữ liệu lagrave trừu tượng Chuacuteng lagrave dữ liệu bậc cao cung cấp mocirc tả ngắn

gọn caacutec dữ liệu bậc thấp hơn 13Hoạt động của Siecircu dữ liệu

Siecircu dữ liệu rất cần thiết trong việc chuyển hoacutea thocircng tin trở thagravenh tri thức Lagrave chigravea khoacutea giuacutep chuacuteng ta xử lyacute được dữ liệu thocirc Viacute dụ một dograveng dữ liệu baacuten hagraveng 1023 K596 11121 agraveNoacute sẽ khocircng coacute nghĩa gigrave cho đến khi chuacuteng ta đưa vagraveo siecircu dữ liệu (thư

mục chứa dữ liệu) agrave cửa hagraveng 1023 sản phẩm K596 vagrave số tiền baacuten được lagrave 11121 đocirc la

14Sự cần thiết phải nhất quaacuten trong kho dữ liệu Kho dữ liệu được xacircy dựng cho lợi iacutech của những nhagrave phacircn tiacutech kinh

doanh caacutec nhagrave quản trị cho tất cả caacutec khu vực chức năng Trong cơ sở dữ liệu riecircng caacutec khu vực khaacutec nhau coacute thể định nghĩa vagrave lưu

trữ dữ liệu thocircng qua phiecircn bản của chiacutenh noacute Khi dữ liệu được lấy từ những vugraveng khaacutec nhau đoacute vagrave được đặt vagraveo kho dữ

liệu Việc chuyển đổi vagrave lagravem sạch caacutec tiến trigravenh sẽ đảm bảo noacute lagrave duy nhất được tiacutech hợp tại một mức của tổ chức

15Ragrave soaacutet lại dữ liệu ndash Thực thi siecircu dữ liệu

Bất kể cấu truacutec tự nhiecircn của 1 cacircu truy vấn thế nagraveo thigrave caacutec thagravenh phần của siecircu dữ liệu rất quan trọng đối với người ra quyết định

Bảng thuộc tiacutenh khoacutea được lưu trữ bởi kho dữ liệu Tập hợp dữ liệu được lấy từ đacircu Những chuyển đổi nagraveo được thực thi với việc lagravem sạch

16Siecircu dữ liệu lagrave gigrave Metadata - lagrave thocircng tin mocirc tả nội dung của cơ sở dữ liệu (CSDL) Metadata baacuteo cho người dugraveng biết thời gian cập nhật sau cugraveng của dữ liệu

định dạng vagrave mục điacutech sử dụng của noacute Những thocircng tin nagravey coacute thể hướng dẫn người dugraveng duyệt qua CSDL vagrave

giuacutep họ hiểu được yacute nghĩa vagrave ngữ cảnh của dữ liệu Trong CSDL metadata lagrave caacutec dạng biểu diễn khaacutec nhau của caacutec đối tượng

trong CSDL Trong CSDL quan hệ metadata lagrave caacutec định nghĩa của bảng cột CSDL

view vagrave nhiều đối tượng khaacutec Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột

một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi -gtMetadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu

Bảng chuyển đổi Ghi lại những chuyển đổi đatilde được thực hiện

Lịch sử thực thi Ghi lại những dữ liệu đatilde được

phacircn tiacutech

Higravenh thaacutei kết nốiGhi lại những dữ liệu được kết nối vagrave tần suất

17Aacutenh xạ thocircng thường của siecircu dữ liệu Bản ghi aacutenh xạ chuyển đổi bao gồm

Định danh của nguồn gốc Chuyển đổi thuộc tiacutenh Chuyển đổi thuộc tiacutenh vật lyacute Matilde hoacutea tham chiếu bảng chuyển đổi Đổi tecircn Đổi khoacutea Gaacuten giaacute trị cho thuộc tiacutenh mặc định Chọn logic cho caacutec nguồn nhiều giaacute trị Đổi thuật toaacuten

18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để

phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai

lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave

tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec

Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm

Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo

19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua

caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau

SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được

Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra

một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức

Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ

Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ

Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech

CHƯƠNG 11 KHAI PHAacute DỮ LIỆU

1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn

ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993

Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng

2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd

1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều

2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP

3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn

4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng

5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server

6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo

7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động

8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời

9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều

10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện

11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech

12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP

3 Xử lyacute phacircn tiacutech trực tuyến OLAP

MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave

dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu

ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave

thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu

HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave

ROLAP4 Khai phaacute dữ liệu

Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh

khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn

Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan

5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp

6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại

Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp

Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec

Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt

Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra

Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh

vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho

Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec

Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm

Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục

Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng

gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp

Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn

Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec

Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper

Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2

Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25

Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước

Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng

Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện

trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp

Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute

độ hỗ trợ ge ngưỡng minsup

độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan

Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn

Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết

Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu

MOLAP ROLAP HOLAP

Lưu trữ dữ liệu cơ sở

Khối Bảng quan hệ Bảng quan hệ

Lưu trữ thocircng tin tổng hợp

Khối Bảng quan hệ Khối

Hiệu suất thực hiện truy vấn

Nhanh nhất Chậm nhất Nhanh

Tiecircu thụ khocircng gian lưu trữ

Nhiều Thấp Trung bigravenh

Chi phiacute bảo trigrave Cao Thấp Trung bigravenh

Page 2: De cuong(1-11)

thống năng lực phacircn tiacutech cũng coacute thể coacute caacutec ngocircn ngữ mocirc higravenh hoacutea ở đacircy Thagravenh phần nagravey coacute thể kết nối với caacutec kho chứa mocirc higravenh của tổ chức hay ở becircn ngoagravei nagraveo khaacutec

3 Một cocircng cụ tri thức coacute thể hỗ trợ caacutec phacircn hệ khaacutec hay hoạt động độc lập nhằm đưa ra tiacutenh thocircng minh của quyết định đưa ra Noacute cũng coacute thể được kết nối với caacutec kho kiến thức khaacutec của tổ chức

4Giao diện người dugraveng giuacutep người sử dụng giao tiếp với vagrave ra lệnh cho hệ thống Caacutec thagravenh phần vừa kể trecircn tạo necircn HHTQĐ coacute thể kết nối với intranetextranet của tổ chức hay kết nối trực tiếp với Internet

5Chiacutenh caacutec người dugraveng

4Dữ liệu vagrave mocirc higravenh quản lyacute Mối quan tacircm ngagravey cagraveng tăng về giaacute trị dữ liệu đối với một tổ chức chỉ ra rằng

chất lượng vagrave cấu truacutec của CSDL lagrave yếu tố cơ bản xaacutec định sự thagravenh cocircng của DSS

CSDL sẽ tổ chức dữ liệu dưới dạng phacircn cấp logic dưa trecircn mức độ mịn hoacutea dữ liệu

Sự phacircn cấp chứa 4 thagravenh phần tử cơ bản 1CSDL 2 Tập tin 3Bản ghi 4Dữ liệu

Hệ thống quản lyacute CSDL Dữ liệu trong mỗi file coacute cấu truacutec giống nhau (bản ghi) caacutec files coacute thể hoagraven

togravean khaacutec nhau DBMS giữ vai trograve quan trọng trong việc tổ chức files vagrave CSDL DBMS coacute 2 traacutech nhiệm chiacutenh

1 Phối hợp caacutec cocircng việc liecircm quan tới lưu trữ vagrave truy cập thocircng tin2 Duy trigrave sự phụ thuộc logic giữa dữ liệu trong CSDL của DSS vagrave ứng dụng

DSS Caacutec hagravem chức năng trong DBMS

Định nghĩa dữ liệu - cung cấp ngocircn ngữ định nghĩa dữ liệu vagrave cho pheacutep tương quan dữ liệuThao taacutec dữ liệu - cung cấp một ngocircn ngữ truy vấn cho pheacutep nắm bắt vagrave khai thaacutec dữ liệuToagraven vẹn dữ liệu - cho pheacutep người sử dụng để mocirc tả caacutec quy tắc duy trigrave tiacutenh toagraven vẹn vagrave kiểm tra caacutec lỗi

Cơ sở mocirc higravenh Mocirc higravenh lagrave sự đơn giản hoacutea của sự kiện nagraveo đoacute được xacircy dựng để nghiecircn cứu

sự kiện

Cơ sở mocirc higravenh lagrave một biến thể của CSDL Noacute lưu trữ vagrave tổ chức caacutec mocirc higravenh khaacutec nhau magrave DSS sử dụng khi phacircn tiacutech chuacuteng

MBMS lagrave biến thể của DBMS Cơ sở mocirc higravenh chiacutenh lagrave caacutei thể hiện sự khaacutec biệt của một DSS với caacutec hệ

thống thocircng tin khaacutec Tổng quan chức năng của MBMS

Modeling language ndash Cho pheacutep tạo lập caacutec mocirc higravenh quyết định vagrave cung cấp cơ chế liecircn kết nhiều mocirc higravenh để tạo mocirc higravenh phức tạp hơn Model library ndash Lưu trữ vagrave quản lyacute tất cả caacutec mocirc higravenh cung cấp một catalog cugraveng với mocirc tả Model manipulation ndash Cho pheacutep quản lyacute vagrave xử lyacute cơ sở mocirc higravenh với caacutec chức năng (run store query etc) tương tự như caacutec chức năng trong một DBMS

5Cơ sở tri thức của DSS Mọi quyết định đuacuteng đắn đều đogravei hỏi quaacute trigravenh lập luận vagrave quaacute trigravenh nagravey lại

đogravei hỏi thocircng tin Cơ sở tri thức lagrave nơi lưu trữ tất cả caacutec thocircng tin dạng nagravey trong DSS Tri thức coacute thể đơn giản chỉ lagrave caacutec thocircng tin thocirc caacutec quy tắc caacutec heuristics

caacutec ragraveng buộc hoặc kết quả của quaacute khứ Tri thức nagravey khaacutec với thocircng tin cả trong CSDL vagrave cơ sở mocirc higravenh ở chỗ noacute

mang đặc trưng của bagravei toaacuten Nội dung kiến thức cơ sở

Tri thức trong cơ sở tri thức coacute thể được phacircn lagravem 2 loại Facts thể hiện điều chuacuteng ta coi lagrave đuacuteng tại thời điểm cho trước Hypotheses thể hiện caacutec quy tắc hoặc caacutec quan hệ magrave chuacuteng ta tin lagrave tồn tại giữa caacutec facts

Kiến thức thu nhận vagrave truy hồi Một hoặc một vagravei người sẽ thu thập thocircng tin cho cơ sở tri thức Đacircy lagrave những

người được đagraveo tạo đặc biệt về caacutec kỹ thuật để thu thập thocircng tin từ caacutec chuyecircn gia lĩnh vực

Mocirc tơ suy diễn (inference engine) lagrave một phần của cơ sở tri thức Noacute aacutep dụng caacutec quy tắc để lấy ra thocircng tin dưới dạng magrave người dugraveng mong muốn

6Giao diện người dugraveng Giao diecircn người dugraveng lagrave một thagravenh phần được thiết kế để cho pheacutep người

dugraveng truy cập tới caacutec thagravenh phần becircn trong của hệ thống

Thocircng thường giao diện cagraveng gần gũi thigrave cagraveng iacutet đogravei hỏi việc huấn luyện người dugraveng Hatildey suy nghĩ xem coacute bao nhiecircu chương trigravenh Windows dugraveng cugraveng cấu truacutec menu như Microsoft Word

Caacutec chức năng chiacutenh của một giao diện của DSS Communication language vagrave Presentation language

Communication language ndash Cho pheacutep tương taacutec với DSS theo nhiều caacutech xaacutec định caacutec dạng input cung cấp caacutec hỗ trợ cho người dugraveng thu giữ caacutec hội thoại đatilde qua để cải thiện caacutec tương taacutec trong tương lai

Presentation language ndash Cung cấp khả năng thể hiện dữ liệu theo nhiều caacutech cho pheacutep sinh caacutec baacuteo caacuteo chi tiết cung cấp nhiều khung nhigraven khaacutec nhau về dữ liệu

7Vai trograve người dugraveng Trong một DSS người dugraveng cũng lagrave một thagravenh phần của hệ thống giống như

hardware vagrave software User roles Người dugraveng được phacircn thagravenh 5 lớp (decision maker

intermediary maintainer operator and feeder) Patterns of DSS use Lagrave sự phacircn loại tiến theo của caacutec user roles khaacutec nhau

thagravenh 1 trong 4 basic patterns of use Slide tiếp theo sẽ mocirc tả caacutec patterns nagravey

8Caacutec mocirc higravenh sử dụng DSS Subscription mode _nhagrave sản xuất quyết định nhận caacutec baacuteo caacuteo thường

xuyecircn theo dự kiến Terminal mode_ nhagrave sản xuất quyết định tương taacutec trực tiếp với DSS Clerk mode - nhagrave sản xuất quyết định sử dụng hệ thống trực tiếpnhưng

khocircng trực tuyến Đầu ra phản hồi coacute thể mất một thời gian Intermediary mode - nhagrave sản xuất quyết định tương taacutec thocircng qua việc sử

dụng mộthoặc nhiều mocirc higravenh trung gian9Danh mục vagrave lớp của DSSCoacute nhiều phương phaacutep để cố gắng phacircn loại caacutec DSSs

Data-centric and model-centric Formal and ad hoc systems Directed versus nondirected DSSs Procedural and nonprocedural systems Hypertext systems Spreadsheet systems Individual and group DSSs

Caacutec đặc trưng thống nhất của mỗi lược đồ cụ thể giữ vai trograve quan trọng trong việc xaacutec định caacutech tiếp cận tốt nhất để thiết kế một hệ thống mới

Chương 2Quyết định vagrave quyết định của nhagrave sản xuất10Quaacute trigravenh ra quyết định

Quaacute trigravenh ra quyết định gồm coacute 3 giai đoạn (Simon 1977)bull Tigravem hiểu bagravei toaacuten dẫn đến quyết định

+Xaacutec định mục tiecircu tổ chức+Tigravem kiếm vagrave tập hợp dữ liệu+Nhận diện xaacutec định chủ thể bagravei toaacuten+phacircn loại vagrave phaacutet biểu vấn đề

bull Thiết kế (design) phacircn tiacutech vagrave xacircy dựng caacutec diễn trigravenh hagravenh động+Thiết lập mocirc higravenh+Lập bảng tiecircu chuẩn chọn lựa+Tigravem kiếm caacutec phương aacuten+Tiecircn đoaacuten vagrave đo lường caacutec kết cục

bull Chọn lựa (choice) chọn một diễn trigravenh trong tập diễn trigravenh+Giải phaacutep cho mocirc higravenh+Phacircn tiacutech độ nhạy+Chọn (caacutec) phương aacuten tốt nhất+Hoạch định việc hiện thực

tiếp theo giai đoạn chọn lựa lagrave giai đoạn hiện thực (implementation)11Người ra quyết định

Người ra quyết định (decision maker) giữ một vai trograve tacircm thần phacircn liệt vigrave vừa được coi lagrave một bước trong quaacute trigravenh vagrave cũng lại lagrave người tham gia

Phacircn lớp người ra quyết định-Quyết định caacute nhacircn coacute thể lagrave 1 người hoặc một hệ thống maacutey tiacutenh đơn lẻ-Nhiều người ra quyecirct định coacute thể lagrave

+Nhoacutem (group)trong đoacute mọi thagravenh viecircn đều coacute tiếng noacutei trong việc ra quyết định

+Đội(team) Caacutec thagravenh viecircn hỗ trợ một người ra quyết định duy nhất+Tổ chứcTrong đoacute cần sự thỏa thuận chung

12Caacutec kiểu ra quyết định Style lagrave caacutech magrave người quản lyacute ra quyết định

Hiệu lực của mỗi style riecircng biệt phụ thuộc vagraveo ngữ cảnh bagravei toaacuten nhận thức của người ra quyết định vagrave tập caacutec giaacute trị caacute nhacircn của bản thacircn họ

Độ phức tạp của caacutec điều đoacute liecircn kết lại với nhau trong việc higravenh thagravenh decision style

Caacutec kiểu ra quyết định Directive ndash kết hợp đogravei hỏi về cấu truacutec bagravei toaacuten cao với mức độ nhập nhằng thấp

Thocircng thường đacircy lagrave caacutec quyết định coacute bản chất kỹ thuật vagrave đogravei hỏi iacutet thocircng tin Analytical ndash Mức độ nhập nhằng lớn hơn vagrave đogravei hỏi nhiều thocircng tin hơn Conceptual ndash Mức độ nhập nhằng cao vagrave thường gần gũi với caacutech ra quyết định

của con người Behavioral ndash đogravei hỏi lượng dữ liệu nhỏ vagrave thể hiện caacutei nhigraven ngắn hạn Thường

xảy ra xung đột necircn phải dựa vagraveo sự đồng thuận Caacutec kiểu ra quyết định trong thiết kế hệ trợ giuacutep quyecirct định

Những cản trở lớn chiacutenh lagrave phản ứng của người ra quyết định trước aacutep lực vagrave phương phaacutep dugraveng để giải bagravei toaacuten

Viacute dụ đối với những người khocircng chịu được aacutep lực trong dạng directive thigrave giao diện cần cho pheacutep người ra quyết định kiểm soất được hệ thống với khocircng coacute quaacute nhiều dữ liệu đầu vagraveo

Đối với kiểu analytic DSS cần cho pheacutep truy cập tới nhiều nguồn dữ liệu magrave người ra quyết định sẽ phacircn tiacutech

13Khoacute khăn khi xacircy dựng DSS

- Thocircng tin mocirc higravenh cấu truacutec -gt iacutet thocircng tin

- Khả năng của con người (khả năng hiểu biết) chỉ xử lyacute được từ 5-gt9 quaacute trigravenh thocircng tin khaacutec nhau

- Khocircng chắc chắn ( mức độ hoagraven thagravenh vagrave tiacutenh chiacutenh xaacutec)

- Coacute nhiều lựa chọn vagrave đa mục tiecircu

Chương 3Quyết định trong tổ chức

14Tổ chức lagrave gigrave Tổ chức Lagrave 1 hệ thống thống nhất caacutec nguồn tagravei nguyecircnĐược cấu thagravenh bởi caacutec

hệ thống nhỏ hơn ragraveng buộc với nhau bởi caacutec mục tiecircu đề ra

Tổng thể 1 tổ chức sẽ mạnh mẽ hơn rất nhiều so với tất cả caacutec thagravenh phần của noacute cộng lại

Mối liecircn hệ của caacutec quyecirct định Mục điacutech chiacutenh của caacutec tổ chức lagrave đưa ra caacutec quyết định trong mocirci trường kinh doanh Caacutec Quyết định phải phugrave hợp với giới hạncaacutec chiacutenh saacutech caacutec thủ tục vagrave lĩnh vực hoạt động Noacute khocircng phụ thuộc vagraveo người đưa ra quyết định lagrave ai Đoacute coacute thể lagrave 1 caacute nhacircn1 nhoacutem hay thậm chiacute DSSs

Độ đo của quyết địnhNăm khiacutea cạnh ảnh hưởng tới Quyết định

Kết cấu nhoacutem (Group Structure) Vai trograve trong nhoacutem(Group Roles) Quaacute trigravenh lagravem việc(Group Processes) Taacutec phong(Group Style) Quy tăc nhoacutem(Group Norm)

Kết cấu nhoacutem Trong 1 nhoacutem chuẩn caacutec thagravenh viecircn coacute traacutech nhiệm vagrave thẩm quyền ra quyết định như nhau Vai trograve trong nhoacutemTrong nhoacutem caacutec thagravenh viecircn đều coacute vai trograve riecircng vagrave

lagrave 1 phần quan trong trong cả tiến trigravenh Quaacute trigravenh lagravem việcQuaacute trigravenh dugraveng người trong nhoacutem ảnh hưởng tới loại

quyết định gacircy hiệu quả vagrave ảnh hưởng tới cả tiến trigravenh Taacutec phong Coacute phải taacutec phong của người ra quyết định coacute ảnh hưởng tới

chất lượng quyết định cuối khocircng Quy tắc nhoacutemQuy tắc nhoacutem lagrave cực kỳ quan trọng trong việc xaacutec định

hagravenh vi caacutec thagravenh viecircn nhoacutem trong caacutec tigravenh huống xatilde hội Phacircn cấp quyết định trong tổ chức3 cấp

Chiến lược Ban latildenh đạo cấp cao hoặc nhagrave quản lyacute Caacutec quyết định mang tiacutenh lacircu dagravei nhất

Chiến thuật Quản lyacute tầm trung Thực thi caacutec quyết định chiến lược đề ra

Thực hiện

Caacute nhacircn chuyecircn ngagravenh Tự đưa ra caacutec quyết định từng ngagravey

15Năng lực của hệ HTQD

1 HHTQĐ cơ bản hỗ trợ caacutec nhagrave ra quyết định trong caacutec tigravenh huống nửa cấu truacutec vagrave phi cấu truacutec bằng caacutech kết hợp phaacuten xử của con người vagrave xử lyacute thocircng tin bằng maacutey tiacutenh Caacutec bagravei toaacuten như vậy khocircng thểkhocircng thuận tiện giải quyết được chỉ bằng caacutec cocircng cụ maacutey tiacutenh hoacutea hay caacutec phương phaacutep định lượng 2 Phugrave hợp cho caacutec cấp quản lyacute khaacutec nhau từ cao đến thấp 3 Phugrave hợp cho caacute nhacircn lẫn nhoacutem Caacutec bagravei toaacuten iacutet coacute tiacutenh cấu truacutec thường liecircn đới đến nhiều caacute nhacircn ở caacutec đơn vị chức năng hay mức tổ chức khaacutec nhau cũng như ở caacutec tổ chức khaacutec 4 Hỗ trợ cho caacutec quyết định tuần tự liecircn thuộc được đưa ra một lần vagravei lần hay lặp lại 5 Hỗ trợ cho caacutec giai đoạn của quaacute trigravenh ra quyết định tigravem hiểu thiết kế lựa chọn vagrave hiện thực 6 Phugrave hợp cho một số caacutec phong caacutech vagrave quaacute trigravenh ra quyết định 7 Coacute thể tiến hoacutea theo thời gian Người dugraveng coacute thể thecircm bỏ kết hợp thay đổi caacutec phần tử cơ bản của hệ thống 8 Dễ dugraveng vagrave thacircn thiện với người dugraveng 9 Nhằm vagraveo nacircng cao tiacutenh hiệu dụng của quyết định (chiacutenh xaacutec thời gian tiacutenh chất lượng) thay vigrave lagrave tiacutenh hiệu quả (giaacute phiacute của việc ra quyết định) 10 Người ra quyết định kiểm soaacutet toagraven bộ caacutec bước của quaacute trigravenh ra quyết định HHTQĐ chỉ trợ giuacutep khocircng thay thế người ra quyết định 11 Người dugraveng cuối cugraveng coacute thể tự kiến tạo vagrave sửa đổi caacutec hệ thống nhỏ vagrave đơn giản 12 Thường dugraveng mocirc higravenh để phacircn tiacutech caacutec tigravenh huống ra quyết định 13 Cung ứng caacutec truy đạt dữ liệu từ nhiều nguồn dạng thức vagrave kiểu khaacutec nhau 14 Coacute thể dugraveng như một cocircng cụ độc lập hay kết hợp với caacutec HHTQĐứng dụng khaacutec dugraveng đơn lẻ hay trecircn một mạng lưới maacutey tiacutenh (intranet extranet) bất kỳ với cocircng nghệ WEB

16Văn hoacutea tổ chứcVăn hoacutea của tổ chức lagrave tập hợp của rất nhiều thứ (lograveng tin biểu tượng đặc trưng regraven luyện) được phaacutet triển qua thời gian dagravei

Noacute gacircy ra ảnh hưởng mạnh mẽ cograven hơn cả những hoạt động của tổ chức đoacute 10 đặc điểm văn hoacutea của tổ chức

Điều khiển Hệ thống khen thưởng Sự đồng nhất Chịu đựng xung đột Mocirc higravenh giao tiếp Hỗ trợ quản lyacute Sự hogravea nhập Định hướng Chịu đựng rủi ro Caacute nhacircn khởi xướng

Mối quan hệ của văn hoacutea với hiệu năng lagravem việc1 tổ chức thagravenh cocircng phải coacute xu hướng hogravea hợp giữa văn hoacutea với mocirci trường trong vagrave ngoagravei tổ chức

Phugrave hợp trong nội bộ cho thấy một sự kết hợp giữa văn hoacutea của tổ chức với những cocircng nghệ của chiacutenh noacute

Phugrave hợp với becircn ngoagravei cho thấy một nền văn hoacutea phugrave hợp với chiến lược thị trường

Văn hoacutea vagrave sự thay đổi 1 tổ chức magrave khocircng biết thay đổi văn hoacutea sẽ khocircng thể giữ được vị triacute của migravenh trecircn thị trường Caacutec cocircng ty xuất sắc luocircn biết caacutech tiacutech cực tiếp cận khaacutech hagraveng động viecircn đầu tư

17Quyền lực vagrave chiacutenh trịQuyền lực vagrave chiacutenh trị luocircn đi liền với nhau

aQuyền lựclagrave khả năng ảnh hưởng đến việc phacircn phối caacutec nguồn lực trong tổ chứcGồm 5 yếu tố cơ bản

Phacircn quyền Uy quyền Quyền lực caacute nhacircn Sức ảnh hưởng Chiacutenh trị

Một vagravei thagravenh phần của quyền lực ra quyết định Quyết định việc nagraveo coacute sẵn

Quyết định sản phẩm nagraveo được sản xuất Quyết định đầu tư vagraveo đacircu Quyền đặt vagrave quản lyacute quản lyacute giaacute Thanh toaacuten vagrave khấu trừ tiền latildei

bChiacutenh trị Yếu tố cốt lotildei trong quaacute trigravenh higravenh thagravenh chiến lược ra quyết định Chiacutenh trị liecircn quan tới việc ra quyết định thocircng qua đagravem phaacutenảnh hưởngvagrave higravenh

thagravenh sự nhất triacute Trong nhiều trường hợp noacute coacute thể cho ta sự linh hoạt hơn

18Hệ trợ giuacutep quyết định trong tổ chức DSS của 1 tổ chức hỗ trợ cocircng nghệ tập trung vagraveo caacutec quyết định ảnh hưởng tới

rất nhiều người 1 hệ thống DSS hiện đại coacute thể chấp nhận nhiều quyết định vượt qua những giới

hạn phacircn cấp truyền thống aCaacutec hoạt động gần DSS

Giải quyết caacutec nhiệm vụ đặc biệt Thu thập thocircng tin Liecircn lạc qua caacutec chi nhaacutenh Động thaacutei chiacutenh trị

Phacircn loại tư duy chiến lược cho DSS Sắp xếp quyết địnhXếp hạng quyết định sao cho thứ tự đứng trước thigrave được

ưu tiecircn trước Chia sẻ thocircng tinCaacutec quyecirct định coacute thể độc lập nhưng người ra quyết định

phải chia sẻ caacutec thocircng tin liecircn quan Lựa chọn đagravem phaacutenVagravei quyết định coacute thể xaacutec lập thocircng qua đagravem phaacuten vagrave kết

quả được lagravem đồng thờiKhocircng phải cocircng nghệ tự noacute coacute thể đưa ra quyết định magrave noacute nằm ở trigravenh độ cocircng nghệ hỗ trợ caacutec chiến lược quyết định quyền lực vagrave chiacutenh trị cugraveng phối hợp với nhau

Chương 4Mocirc higravenh hoacutea quaacute trigravenh ra quyết định

(Cấu truacutec của hệ HTQD)19Vấn đề Mocirc higravenh

bull Lagrave phần tử chủ chốt trong hầu hết hệ hỗ trợ quyết định vagrave lagrave điều kiện cần trong hệ hỗ trợ quyết định dựa vagraveo mocirc higravenh (model-based DSS)

bull Coacute nhiều lớp mocirc higravenh kegravem theo lagrave caacutec kỹ thuật xử lyacute thao taacutec mocirc higravenh đặc thugrave tương ứng

bull Caacutec vấn đề chiacutenh nhận diện bagravei toaacuten vagrave phacircn tiacutech mocirci trường nhận diện biến số dự baacuteo đa mocirc higravenh caacutec phạm trugrave mocirc higravenh quản lyacute mocirc higravenh vagrave mocirc higravenh hoacutea dựa vagraveo kiến thức

bull Mocirc higravenh hoacutea lagrave taacutec vụ khocircng đơn giản Người xacircy dựng mocirc higravenh phải cacircn bằng giữa tiacutenh đơn giản của mocirc higravenh với caacutec yecircu cầu biểu diễn để mocirc higravenh coacute thể nắm bắt đủ thực tại cần thiết cho người ra quyết định

bull Mocirc phỏng lagrave kỹ thuật mocirc higravenh hoacutea thocircng dụng dugraveng để tigravem hiểu vấn đề tuy khocircng nhất thiết phải tigravem ra được caacutec giải phaacutep biến thể mở rộng quaacute trigravenh ra quyết định của tổ chức vagrave cho pheacutep tổ chức xem xeacutet taacutec độngảnh hưởng của caacutec chọn lựa tương lai

bull Mocirc phỏng tiết kiệm rất nhiều chi phiacute vagrave thời gian ndash rất dễ thay đổi mocirc higravenh hoạt động của một hệ thống vật lyacute bằng mocirc higravenh hoacutea maacutey tiacutenh

bull Mocirc higravenh coacute thể được phaacutet triển vagrave cagravei đặt bằng một số caacutec ngocircn ngữ lập trinh (thế hệ 3 4 ) vagrave hệ thống phần mềm khaacutec nhau

Mocirc higravenh tĩnh vagrave động

bull Mocirc higravenh tĩnh thể hiện bức tranh tại thời điểm của tigravenh huống Caacutec khiacutea cạnh của bagravei toaacuten được xeacutet một thời kỳ nhất định trong một khung thời gian nhất định (coacute thể ldquocuốnrdquo về tương lai) Caacutec tigravenh huống được giả sử lagrave sẽ lập lại với tập caacutec điều kiện đồng nhất

1048713 Giả định coacute được tiacutenh ổn định của dữ liệu 1048713 Mocirc phỏng quaacute trigravenh dạng tĩnh - lagravem việc trecircn caacutec trạng thaacutei ổn định để tigravem ra caacutec

thocircng số tối ưu ndash thường được dugraveng như cocircng cụ chủ yếu để thiết kế quaacute trigravenh 1048713 vd quyết định sản xuấtmua 1 sản phẩm baacuteo caacuteo thu nhập hagraveng quyacutenăm bull Mocirc higravenh động biểu diễn caacutec kịch bản thay đổi theo thời gian 1048713 Phụ thuộc thời gian caacutec trạng thaacutei thay đổi theo thời gian 1048713 Thường dugraveng để tạo sinh vagrave biểu diễn caacutec xu hướng vagrave khuocircn mẫu theo thời gian 1048713 Mocirc phỏng động thể hiện caacutec diễn tiến khi caacutec điều kiện theo thời gian khaacutec với caacutec

trạng thaacutei ổn định ndash thường được dugraveng để thiết kế việc kiểm soaacutet caacutec hệ thống 1048713 VD dự baacuteo lời-lỗ trong 5 năm với caacutec nhập lượng như giaacute phiacute số lượng thay đổi

theo từng năm

Mocirc higravenh chắc chắn tương đối dễ phaacutet triển giải quyết vagrave coacute thể sinh ra caacutec giải phaacutep tối ưu 1048713 Caacutec bagravei toaacuten coacute một số lớnvocirc hạn caacutec giải phaacutep khả thi đặc biệt quan trọng 1048713 Caacutec mocirc higravenh tagravei chaacutenh được xacircy dựng trong điều kiện chắc chắn

Mocirc higravenh bất địnhbằng caacutech thu thập thecircm thocircng tin cố gắng đưa bagravei toaacuten trở về dạng chắc chắn hay dạng

rủi ro Mocirc higravenh rủi ro caacutec quyết định kinh doanh được đưa ra dưới caacutec rủi ro giả định

1048713 Đocirci khi biết được xaacutec suất của caacutec sự kiện xảy ra trong tương lai 1048713 Caacutec trường hợp khaacutec (bất định) ước lượng caacutec rủi ro vagrave giả sử caacutec tigravenh huống rủi ro

xảy ra 20Mocirc higravenh hoacutea

MOcirc HIgraveNH HOacuteA BẰNG BẢNG TIacuteNH bull Bảng tiacutenh phần mềm mạnh linh hoạt vagrave dễ dugraveng cho pheacutep tạo sinh caacutec ứng dụng trong kinh doanh kỹ thuật toaacuten vagrave khoa học với tập caacutec hagravem mạnh về tagravei chaacutenh thống kecirc toaacuten bull Kegravem theo lagrave caacutec thagravenh phần cộng thecircm (add-ins) giuacutep xacircy dựng vagrave giải caacutec lớp mocirc higravenh đặc thugrave bull Lagrave cocircng cụ mocirc higravenh hoacutea thocircng dụng nhất của người dugraveng cuối cugraveng bull Coacute caacutec chức năng về phacircn tiacutech ldquowhat-ifrdquo dograve tigravem mục tiecircu quản lyacute dữ liệu vagrave lập trigravenh (dạng macro) bull Coacute khả năng đọc ghi caacutec cấu truacutec tập tin thocircng dụng để giao tiếp được với caacutec CSDL vagrave cocircng cụ khaacutec bull Coacute thể xacircy dựng mocirc higravenh tĩnh vagrave động bull Dugraveng trecircn maacutey tiacutenh caacute nhacircn vagrave maacutey tiacutenh lớn

bull Cơ sở để xacircy dựng caacutec bảng tiacutenh đa chiều vagrave caacutec cocircng cụ xử lyacute phacircn tiacutech trực tuyến (OLAP) MOcirc HIgraveNH HOacuteA BẰNG PHAcircN TIacuteCH QUYẾT ĐỊNH bull Tiếp cận mocirc higravenh hoacutea caacutec tigravenh huống quyết định coacute một số hữu hạnkhocircng quaacute nhiều caacutec phương aacuten ndash mỗi phương aacuten được trigravenh ra dưới dạng bảng hay đồ thị - caacutec kết quả tương ứng (dự baacuteo được kegravem xaacutec suất) theo mục tiecircu bagravei toaacuten ndash từ đoacute chọn phương aacuten tốt nhất bull Đơn mục tiecircu bảng quyết định hay cacircy quyết định bull Đa mục tiecircu AHP (analytic hierarchy process) khaacutec

MOcirc HIgraveNH HOacuteA BẰNG QUY HOẠCH TOAacuteN

bull Quy hoạch toaacuten học (mathematical programming) lagrave họ caacutec cocircng cụ giải quyết caacutec bagravei toaacuten quản lyacute theo đoacute người ra quyết định phải cấp phaacutet caacutec tagravei nguyecircn khan hiếm cho caacutec hoạt động cạnh tranh nhau (caacutec phương aacuten) nhằm tối ưu hoacutea mục tiecircu coacute khả năng đo lường được bull Caacutec mocirc higravenh quy hoạch tuyến tiacutenh (linear programming) thocircng dụng nhất trong quy hoạch toaacuten coacute nhiều ứng dụng trong thực tế được dugraveng nhiều trong caacutec hệ hỗ trợ quyết định bull Bagravei toaacuten quy hoạch tuyến tiacutenh 1048713 Caacutec biến quyết định (cần tigravem giaacute trị) 1048713 Hagravem mục tiecircu (hagravem toaacuten học dạng tuyến tiacutenh xaacutec định quan hệ giữa biến quyết định vagrave mục tiecircu đo lường mức độ đạt đạt mục tiecircu vagrave cần được tối ưu hoacutea) 1048713 Caacutec hệ số của hagravem mục tiecircu (cho biết mức đoacuteng goacutep vagraveo mục tiecircu của 1 đơn vị biến quyết định) 1048713 Ragraveng buộc (biểu thức tuyến tiacutenh cho biết giới hạn tagravei nguyecircn vagravehay caacutec quan hệ giữa caacutec biến số) 1048713 Dung lượng (mocirc tả cận trecircn vagrave dưới của caacutec biến vagrave ragraveng buộc) 1048713 Hệ số (cocircng nghệ) vagraveo-ra (cho biết mức độ sử dụng tagravei nguyecircn của biến quyết định) bull Đặc điểm của bagravei toaacuten quy hoạch tuyến tiacutenh 1048713 Tagravei nguyecircn kinh tế của bagravei toaacuten lagrave coacute hạn vagrave sẵn sagraveng 1048713 Coacute nhiều caacutech (gt2 caacutech) sử dụng tagravei nguyecircn được gọi lagrave giải phaacutep hay chương trigravenh 1048713 Mỗi hoạt động dugraveng tagravei nguyecircn đều sinh ra kết quả dưới dạng mục tiecircu đatilde phaacutet biểu trước 1048713 Việc cấp phaacutet nằm trong caacutec ragraveng buộc cho trước bull Giả định của bagravei toaacuten quy hoạch tuyến tiacutenh 1048713 Caacutec kết quả của caacutec cấp phaacutet coacute thể đem so saacutenh với nhau coacute thể đo lường bằng một đơn vị chung

1048713 Caacutec cấp phaacutet độc lập với nhau về mặt kết quả 1048713 Kết quả cuối cugraveng lagrave tổng của caacutec kết quả từ caacutec hoạt động riecircng rẽ khaacutec nhau 1048713 Dữ liệu coacute tiacutenh chắc chắn 1048713 Tagravei nguyecircn được dugraveng một caacutech kinh tế nhất 1048713 Thường coacute một số lớn caacutec giải phaacutep với kết quả khaacutec nhau 1048713 Trong số caacutec giải phaacutep coacute thể coacute 1 giải phaacutep tốt nhất ndash mức độ đạt được mục tiecircu cao nhất ndash gọi lagrave giải phaacutep tối ưu được tigravem ra bằng một giải thuật đặc biệt MOcirc HIgraveNH HOacuteA BẰNG HEURISTIC bull Việc tigravem giải phaacutep tối ưu của một số bagravei toaacuten quyết định phức tạp coacute thể tốn nhiều thời gian chi phiacute hay khocircng thể tigravem ra được Cograven nếu dugraveng tiếp cận mocirc phỏng cũng coacute thể keacuteo dagravei phức tạp khocircng thiacutech hợp hay thậm chiacute khocircng chiacutenh xaacutec

bull Lagrave một tiếp cận giuacutep tigravem ra caacutec giải phaacutep khả thithỏa matildenđủ tốt cho caacutec bagravei toaacuten phức tạp Coacute thể coacute giải phaacutep đủ tốt (90-999 giaacute trị của lời giải tối ưu) nhanh choacuteng vagrave đỡ tốn keacutem hơn bằng caacutech dugraveng heuristics bull Quaacute trigravenh heuristic lagrave datildey caacutec bước xacircy dựng caacutec quy luật giải quyết vấn đề thocircng qua việc tigravem kiếm caacutec con đường hứa hẹn nhất dẫn đến lời giải tigravem kiếm caacutech thức thu thập vagrave phacircn giải thocircng tin theo quaacute trigravenh giải vagrave phaacutet triền caacutec phương phaacutep dẫn đến một giải thuật tiacutenh toaacuten hay một lời giải tổng quaacutet đatilde coacute bull Aacutep dụng chủ yếu cho bagravei toaacuten cấu truacutec yếu cũng dugraveng để tigravem ra giải phaacutep chấp nhận được cho bagravei toaacuten cấu truacutec chặt bull Khocircng đủ tổng quaacutet như caacutec giải thuật thường chỉ dugraveng cho tigravenh huống đặc thugrave đang xeacutet bull Coacute thể dẫn đến một giải phaacutep dở - caacutec thủ tục từng bước giải quyết vấn đề khocircng đảm bảo tigravem ra giải phaacutep tối ưu bull Heuristic coacute thể lagrave định lượng vigrave vậy coacute thể đoacuteng vai trograve quan trọng trong cơ sở mocirc higravenh của hệ hỗ trợ quyết định bull Heuristic coacute thể lagrave định tiacutenh vigrave vậy coacute thể đoacuteng vai trograve quan trọng trong cung ứng kiến thức cho hệ chuyecircn gia bull Quaacute trigravenh heuristic liecircn quan đến tigravem kiếm học tập ước lượng phacircn xử vagrave lặp lại caacutec hoạt động nagravey dọc theo tiến trigravenh bull Kiến thức thu được dugrave thagravenh cocircng hay thất bại trong quaacute trigravenh đều được phản hồi vagrave sửa đổi chiacutenh quaacute trigravenh nhờ đoacute coacute thể định nghĩa lại mục tiecircu hay bagravei toaacuten 1048713 Giải thuật di truyền bắt đầu bằng tập caacutec giải phaacutep được sinh ngẫu nhiecircn taacutei kết hợp caacutec cặp giải phaacutep một caacutech ngẫu nhiecircn bull Tigravenh huống necircn dugraveng heuristics 1048713 Dữ liệu đầu vagraveo khocircng chiacutenh xaacutec hay coacute giới hạn 1048713 Thực tế quaacute phức tạp đến nỗi khocircng dugraveng được caacutec mocirc higravenh tối ưu 1048713 Chưa coacute được giải thuật chiacutenh xaacutec vagrave đủ tin cậy 1048713 Bagravei toaacuten phức tạp necircn sẽ khocircng kinh tế nếu dugraveng tối ưu hay mocirc phỏng hoặc tốn quaacute nhiều thời gian tiacutenh toaacuten 1048713 Coacute thể cải thiện tiacutenh hiệu quả của quaacute trigravenh tối ưu (tức coacute thể sinh ra caacutec giải phaacutep ban đầu tương đối tốt) 1048713 Liecircn quan đến xử lyacute kyacute hiệu chứ khocircng phải xử lyacute kyacute số (như hệ chuyecircn gia) 1048713 Cần coacute quyết định nhanh vagrave caacutec xử lyacute dựa vagraveo maacutey tiacutenh đều khocircng khả thi (một số heuristic khocircng cần đến maacutey tiacutenh) bull Thuận lợi 1048713 Dễ hiểu dễ giải thiacutech vagrave dễ cagravei đặt 1048713 Nacircng cao tiacutenh saacuteng tạo vagrave năng lực heuristic cho caacutec vấn đề khaacutec 1048713 Tiết kiệm thời gian xaacutec lập vấn đề 1048713 Tiết kiệm yecircu cầu về bộ chứa vagrave xử lyacute maacutey tiacutenh

1048713 Tiết kiệm thời gian tiacutenh toaacuten vagrave do vậy tiết kiệm thời gian thực trong ra quyết định Một số vấn đề phức tạp đến nỗi chỉ coacute thể giải được bằng heuristics 1048713 Thường sinh ra nhiều giải phaacutep chấp nhận được 1048713 Thường coacute thể phaacutet biểu lyacute thuyết hay đo lường thực nghiệm về chất lượng của giải phaacutep (tức giaacute trị mục tiecircu của giải phaacutep gần với giaacute trị tồi ưu đến mức nagraveo dugrave giaacute trị tối ưu chưa biết được) 1048713 Coacute thể kết hợp tiacutenh thocircng minh vagraveo để hướng dẫn pheacutep tigravem kiếm (tigravem kiếm tabu) Năng lực thocircng minh đoacute coacute thể lagrave đặc thugrave theo bagravei toaacuten hoặc dựa trecircn yacute kiến chuyecircn gia được cấy trong hệ chuyecircn gia hoặc cơ chế tigravem kiếm 1048713 Coacute thể dugraveng heuristic hiệu quả vagraveo caacutec mocirc higravenh coacute thể giải bằng quy hoạch toaacuten học Đocirci khi heuristic lagrave phương phaacutep được ưa thiacutech hơn khi khaacutec giải phaacutep heuristics được dugraveng như giải phaacutep ban đầu cho caacutec phương phaacutep quy hoạch toaacuten học bull Hạn chế 1048713 Khocircng đảm bảo coacute được giải phaacutep tối ưu 1048713 Caacutec quy luật coacute rất nhiều ngoại lệ 1048713 Caacutec lựa chọn quyết định tuần tự coacute thể khocircng tiecircn đoaacuten được caacutec kết cục tương lai của mỗi chọn lựa 1048713 Sự liecircn thuộc giữa caacutec phần trong hệ thống đocirci khi coacute thể gacircy ra caacutec ảnh hưởng lớn lao lecircn toagraven hệ thống bull Phacircn loại caacutec giải thuật heuristic 1048713 Heuristic xacircy dựng xacircy dựng giải phaacutep khả thi bằng caacutech cộng thecircm từng thagravenh phần một VD bagravei toaacuten người baacuten hagraveng ndash luocircn gheacute thagravenh phố chưa viếng thăm kế tiếp gần nhất

1048713 Heuristic cải tiến bắt đầu bằng một giải phaacutep khả thi vagrave cố gắng cải tiến liecircn tục trecircn đoacute VD trecircn thử hoaacuten đổi 2 thagravenh phố 1048713 Quy hoạch toaacuten aacutep dụng vagraveo caacutec mocirc higravenh chứa iacutet ragraveng buộc nhằm coacute được thocircng tin về thỏa hiệp tốt nhất với mocirc higravenh nguyecircn gốc Thường được dugraveng trong tối ưu hoacutea nguyecircn (integer optimization) 1048713 Chia giai đoạn giải quyết một vấn đề theo từng giai đoạn VD ở PampG trecircn đacircy bagravei toaacuten phacircn phối được giải quyết trước sau đoacute dugraveng giải quyết bagravei toaacuten chiến lược sản phẩm 1048713 Phacircn ratilde chia bagravei toaacuten thagravenh caacutec phần nhỏ hơn coacute thể giải quyết được sau đoacute kết hợp caacutec giải phaacutep đoacute lại VD chia latildenh thổ baacuten hagraveng thagravenh 4 vugraveng khaacutec nhau giải quyết cho từng vugraveng sau đoacute kết nối caacutec giải phaacutep

21Mocirc phỏngbull Giả định caacutec đặc điểm của thực tạibull Lagrave kỹ thuật tiến triển caacutec thực nghiệm (như phacircn tiacutech ldquowhat-ifrdquo) - bằng maacutey tiacutenh -trecircn một mocirc higravenh của hệ thocircng tin quản lyacute

bull Khocircng thực sự lagrave một mocirc higravenh vigrave khocircng biểu diễn thực tại magrave lagrave cố gắng bắtchước thực tạibull Một trong những phương phaacutep thocircng dụng nhất trong HHTQĐbull HHTQĐ lagravem việc với caacutec bagravei toaacuten phi cấu truacutec vagrave cấu truacutec yếu tigravenh huống thực tếphức tạp ndash khocircng dễ biểu diễn bằng mocirc higravenh tối ưu hay caacutec dạng mocirc higravenh khaacutecnhưng lại thường coacute thể xử lyacute được bằng mocirc phỏngbull Đặc điểm1048713 Iacutet đưa ra caacutec đơn giản hoacutea về thực tại hơn caacutec mocirc higravenh khaacutec1048713 Do triển khai caacutec thực nghiệm necircn noacute coacute thể kiểm thử caacutec giaacute trị cụ thể của caacutecbiến quyết địnhbiến khocircng kiểm soaacutet được của mocirc higravenh vagrave xem xeacutet ảnh hưởnglecircn caacutec biến kết quả1048713 Phương phaacutep coacute tiacutenh mocirc tả (như vậy khaacutec với phương phaacutep danh định)1048713 Khocircng tự động tigravem kiếm giải phaacutep tối ưu ndash noacute mocirc tảtiecircn đoaacuten caacutec đặc tiacutenh của hệthống đatilde cho dưới caacutec điều kiện khaacutec nhau từ đoacute coacute thể chọn ra phương aacuten tốtnhất1048713 Quaacute trigravenh mocirc phỏng thường lặp lại một thực nghiệm nhiều lần để coacute được ướclượng về hiệu ứng tổng quaacutet của một số hagravenh động nhất định1048713 Mocirc phỏng maacutey tiacutenh thiacutech hợp cho hầu hết caacutec tigravenh huống mặc dugrave cũng coacute một sốmocirc phỏng thủ cocircng thagravenh cocircng1048713 Thường chỉ được dugraveng khi bagravei toaacuten quaacute phức tạp khocircng thể xem xeacutet bằng caacutec kỹthuật tối ưu dạng số Tiacutenh phức tạp theo nghĩa bagravei toaacuten khocircng thể cocircng thức hoacuteacho tối ưu (do khocircng thotildea caacutec giả định) hoặc cocircng thức quaacute lớn quaacute nhiều tươngtaacutec giữa caacutec biến hoặc về bản chất bagravei toaacuten lagrave bất định hay rủi roPhương phaacutep mocirc phỏng thiết lập mocirc higravenh của hệ thống thực vagrave tiến hagravenh caacutec thựcnghiệm lặp lại trecircn mocirc higravenh

bull Thuận lợi1048713 Lyacute thuyết tương đối trực tiếp hiệu ứng dagravei hạn của nhiều chiacutenh saacutech -gt neacuten thờigian lớn1048713 Do tiacutenh chất mocirc tả (khaacutec với danh định)1048713 Coacute thể thấy được nhanh choacuteng coacute thể đặt ra caacutec cacircu hỏi ldquowhat-ifrdquo coacute thể dugravengtiếp cận thử-vagrave-sai vagraveo giải quyết vấn đề một caacutech nhanh choacuteng rẻ chiacutenh xaacutec iacutetrủi ro hơn1048713 Thử nghiệm được biến quyết định phần nagraveo của mocirci trường thực sự quan trọngvới caacutec phương aacuten khaacutec nhau1048713 Yecircu cầu kiến thức riecircng biệt về bagravei toaacuten vigrave thế buộc người xacircy dựng mocirc higravenh phảilagravem việc thường xuyecircn với nhagrave quản lyacute ndash đối tượng mong muốn của HHTQĐ để

từ đoacute bản chất bagravei toaacuten vagrave caacutec quyết định được hiểu tốt hơn1048713 Mocirc higravenh được xacircy dựng từ viễn cảnhcaacutech nhigraven của nhagrave quản lyacute1048713 Mocirc higravenh chỉ cho một bagravei toaacuten riecircng biệt thường khocircng thể dugraveng giải caacutec bagravei toaacutenkhaacutec Như vậy mỗi thagravenh phần của mocirc higravenh ứng với một phần của hệ thống thựcdo đoacute sẽ khocircng yecircu cầu nhagrave quản lyacute phải tổng quaacutet hoacutea caacutec hiểu biết của migravenh1048713 Phổ bagravei toaacuten giải được rất rộng tồn kho nhacircn sự hoạch định chiến lược 1048713 Coacute thể chứa caacutec phức tạp thực sự của bagravei toaacuten khocircng cần caacutec đơn giản hoacutea (TDdugraveng caacutec phacircn phối xaacutec suất thực thay vigrave phacircn phối lyacute thuyết xấp xỉ)1048713 Coacute thể tự động sinh ra nhiều đo lường hiệu năng quan trọng1048713 Thường lagrave phương phaacutep duy nhất của HHTQĐ coacute thể xử lyacute caacutec bagravei toaacuten tương đốiphi cấu truacutec1048713 Coacute một số caacutec goacutei phần mềm mocirc phỏng (Monte Carlo) tương đối dễ dugravengbull Điểm yếu1048713 Tuy thường tigravem được caacutec phương aacuten đủ tốt nhưng khocircng đảm bảo lời giải tối ưu1048713 Quaacute trigravenh xacircy dựng mocirc higravenh thường dagravei vagrave tốn keacutem1048713 Giải phaacutep vagrave suy diễn từ nghiecircn cứu mocirc phỏng thường khocircng thể chuyển sang bagraveitoaacuten khaacutec vigrave mocirc higravenh kết hợp caacutec yếu tố đặc thugrave1048713 Đocirci khi do mocirc higravenh quaacute dễ giải thiacutech cho nhagrave quản lyacute necircn caacutec phương phaacutep phacircntiacutech thường xem nhẹ1048713 Phần mềm mocirc phỏng đocirci khi yecircu cầu caacutec kỹ năng đặc biệt do độ phức tạp củaphương phaacutep giải higravenh thứcbull Caacutec loại mocirc phỏng1048713 Mocirc phỏng xaacutec suất một hay nhiều biến độc lập mang tiacutenh xaacutec suất với 2 loạiphacircn phối ndash thường dugraveng kỹ thuật Monte Carlo1048713 Phacircn phối rời rạc tigravenh huống coacute một số giới hạn caacutec biến cố (biến) với hữu hạncaacutec giaacute trị cho mỗi biến cố (biến)1048713 Phacircn phối liecircn tục tigravenh huống coacute số lượng khocircng giới hạn caacutec biến cố tuacircn theocaacutec hagravem mật độ xaacutec suất như phacircn phối chuẩn1048713 Mocirc phỏng độc lậpphụ thuộc theo thời gian1048713 Độc lập khocircng cần thiết phải biết chiacutenh xaacutec thời điểm xảy ra biến cố (nhu cầutiecircu thụ lượng sản phẩm trong ngagravey khocircng biết chiacutenh xaacutec thời điểm tiecircu thụ)1048713 Phụ thuộc cần biết chiacutenh xaacutec thời điểm xảy ra sự kiện (bagravei toaacuten hagraveng đợi)1048713 Mocirc phỏng tương taacutec trực quan1048713 Mocirc phỏng hướng đối tượng dugraveng tiếp cận hướng đối tượng để xacircy dựng mocirc higravenhmocirc phỏng Chuacute yacute ngocircn ngữ mocirc higravenh hoacutea nhất thể UML (unified modelinglanguage) kể cả khi mocirc phỏng caacutec hệ thời gian thựcMOcirc HIgraveNH HOacuteA ĐA CHIỀU ndash XỬ LYacute PHAcircN TIacuteCH TRỰC TUYẾNbull Người ra quyết định thường phải xem xeacutet nhiều chiều của dữ liệu (TD caacutec chiềucủa dữ liệu baacuten hagraveng lagrave sản phẩm vugraveng thời gian người baacuten ) dữ liệu cần đượcphacircn tiacutech trực tiếp bằng caacutec cocircng cụ chuẩn hay phacircn tiacutech tự động bằng caacutec

phương phaacutep khai mỏ dữ liệu (data mining)bull Hầu hết caacutec hệ thống phacircn tiacutech đa chiều được nhuacuteng trong caacutec hệ xử lyacute phacircn tiacutechtrực tuyến (HXLPTTT ndash online analytic processing - OLAP)bull Mục tiecircu của XLPTTT nắm bắt cấu truacutec của dữ liệu thực để hỗ trợ ra quyết địnhbull Trong HHTQĐ coacute sự gắn nối tự nhiecircn giữa mocirc higravenh hoacutea dữ liệu mocirc higravenh hoacutea kyacutehiệu vagrave caacutec khiacutea cạnh của phacircn tiacutech ldquowhat-ifrdquobull Caacutec baacuteo caacuteo của HXLPTTT đều coacute tiacutenh tương taacutec dễ khai thaacutec sử dụng đặc biệtphugrave hợp cho caacutec baacuteo caacuteo về chỉ số hiệu năng chủ yếu (key performance indicators- KPI) baacuteo caacuteo về đo lường hiệu năng kinh doanh bull Thế hệ hiện tại của HXLPTTT vagrave hệ khai mỏ dữ liệu (data mining) tiacutech hợp caacutecđặc tiacutenh của hệ thocircng tin latildenh đạo (executive information system ndashEIS- nhiềucaacutech nhigraven dữ liệu chi tiết hoacutea theo nhu cầu) vagrave caacutec hệ đồ họa khaacutec ndash thường coacutegiao diện người dugraveng dạng kiểu WEBbull Caacutec hệ thống như trecircn cograven được gọi lagrave caacutec cocircng cụ triacute tuệ kinh doanh (businessintelligence - BI) vigrave coacute caacutec đặc trưng về mocirc higravenh hoacutea vagrave tối ưu hoacutea nhưng lạitrong suốt đối với ngươigrave dugravengbull Hiện caacutec cocircng cụ được đưa ra bởi caacutec nhagrave cung cấp về CSDL về hoạch định tagraveinguyecircn tổ chức (ERP) về nhagrave kho dữ liệu (data warehouse) về HXLPTTT MOcirc HIgraveNH HOacuteA VAgrave MOcirc PHỎNG TƯƠNG TAacuteC TRỰC QUANbull Iacutech lợi Người ra quyết định tham gia vagraveo quaacute trigravenh phaacutet triển mocirc higravenh vagrave thựcnghiệm mocirc phỏng vigrave vậy sẽ tin tưởng khi sử dụng mocirc higravenhbull Mocirc higravenh hoacutea tương taacutec trực quan (visual interactive modeling - VIM) dugraveng caacutecbiểu diễn đồ họa maacutey tiacutenh để trigravenh bagravey caacutec ảnh hưởng của caacutec quyết định quản lyacutekhaacutec nhau ở một thời điểm (tĩnh) hay tiến triển theo thời gian (động với kỹ thuậthoạt higravenh)bull Mocirc phỏng tương taacutec trực quan (visual interactive simulation - VIS) cho pheacutepngười dugraveng theo dotildei tiến trigravenh xacircy dựng vagrave sử dụng khai thaacutec mocirc higravenh mocirc phỏngdưới dạng hoạt higravenhbull Mocirc higravenh hoacutea tương taacutec trực quan coacute thể kết hợp với tiếp cận triacute tuệ nhacircn tạo đểđưa ra caacutec khả năng mới thay đổi từ xacircy dựng hệ thống dạng đồ họa đến tigravem hiểuvề động học của hệ thốngbull Cần đến caacutec hệ thống maacutey tiacutenh xử lyacute song song tốc độ cao để xacircy dựng caacutec mocircphỏng - phức tạp quy mocirc lớn dạng hoạt higravenh - mang tiacutenh khả thi ở thời gian thực

22Caacutec dạng hệ thống hỗ trợ ra quyết địnhHệ hỗ trợ quyết định nhoacutemRa quyết định nhoacutem giao tiếp vagrave cộng taacutec- Caacutec đặc điểm của cocircng việc nhoacutem+ Một nhoacutem thực hiện một nhiệm vụ thỉnh thoảng ra quyết định thỉnh thoảngkhocircng ra quyết định+ Caacutec thagravenh viecircn trong nhoacutem coacute thể ở những nơi khaacutec nhau

+ Caacutec thagravenh viecircn trong nhoacutem coacute thể lagravem việc ở những thời gian khaacutec nhau+ Caacutec thagravenh viecircn trong nhoacutem coacute thể lagravem việc cugraveng nhau hoặc ở caacutec tổ chức khaacutecnhau+ Nhoacutem coacute thể vĩnh viễn hoặc tạm thời+ Nhoacutem coacute thể ở bất kỳ mức quản lyacute nagraveo hoặc mức thời gian nagraveo+ Coacute sự điều phối (quaacute trigravenh vagrave nhiệm vụ đạt được) hoặc macircu thuẩn trongnhoacutem+ Coacute sự đạt được hoặcvagrave mất maacutet năng suất trong tổ chức+ Nhiệm vụ phải hoagraven thagravenh rất nhanh+ Khocircng thể hoặc quaacute đắt cho tất cả caacutec thagravenh viecircn trong nhoacutem cugraveng hợp ở mộtnơi+ Một số dữ liệu thocircng tin hoặc kiến thức cần thiết nằm ở nhiều nơi một sốkhaacutec ở ngoagravei tổ chức+ Chuyecircn mocircn của caacutec thagravenh viecircn khocircng coacute trong nhoacutem lagrave cần thiết- Caacutec hoạt động vagrave caacutec quaacute trigravenh miecircu tả caacutec cuộc họp+ Cuộc họp lagrave hoạt động chung liecircn quan bởi một nhoacutem người coacute địa vị bằngnhau hoặc gần bằng nhau+ Kết quả của cuộc họp phụ thuộc một phần vagraveo kiến thức yacute kiến caacutec đaacutenh giaacutecủa caacutec thagravenh viecircn+ Kết quả của cuộc họp cũng phụ thuộc vagraveo sự kết hợp của nhoacutem vagrave phụ thuộcvagraveo quaacute trigravenh ra quyết định được sử dụng bởi nhoacutem đoacute+ Giải quyết caacutec yacute kiến khaacutec nhau bởi người coacute quyền hạn hoặc thương lượnghoặc phacircn xửHỗ trợ giao tiếp- Giao tiếp lagrave thagravenh phần quan trọng cho hỗ trợ quyết định Khocircng coacute giao tiếp thigravekhocircng coacute cộng taacutec Những người ra quyết định caacute nhacircn phải giao tiếp với caacutecđồng nghiệp chuyecircn gia cơ quan chiacutenh phủ khaacutech hagraveng đối taacutec kinh doanh hellipHọ cũng cần dữ liệu vagrave thocircng tin (vagrave kiến thức) từ nhiều nơi trecircn thế giới Caacutecnhoacutem ra quyết định phải giao tiếp cộng taacutec vagrave thương lượng trong cocircng việcHầu hết caacutec tổ chức sẽ nhanh trở thagravenh khocircng coacute chức năng nếu khocircng coacute caacutec hệthống giao tiếp Thương mại điện tử coacute thể hiệu quả chỉ qua caacutec kỹ thuật giao tiếphiện đại- Caacutec kỹ thuật thocircng tin hiện đại cung cấp caacutec phương tiện hỗ trợ giao tiếp rẻnhanh coacute khả năng coacute thể tin cậy Nền tảng hỗ trợ giao tiếp lagrave caacutec hệ thống maacuteytiacutenh mạng+ Bắt đầu bằng điện baacuteo điện thoại radio vagrave ti vi+ Trong 100 năm chuacuteng ta phaacutet triển maacutey fax thư điện tử chương trigravenh chatnhoacutem tin tức hệ thống hội nghị truyền higravenh Hầu hết caacutec kỹ thuật nagravey đềuhoạt động trecircn internet+ Sự phaacutet triển giao tiếp sau cugraveng lagrave hệ thống họp điện tử caacutec dịch vụ vagrave hệ

thống hội nghị điện tử thường sử dụng internet để kết nối caacutec người ra quyếtđịnh- Caacutec thuận lợi aacutep dụng caacutec phương phaacutep giao tiếp cải tiến trong caacutec tổ chức+ Cải tiến năng suất của nhacircn viecircn+ Liecircn quan đến nhiều người ra quyết định chiacutenh+ Khocircng quan tacircm nhiều đến đường biecircn giới địa lyacute+ Tạo nền văn hoacutea hợp taacutec nhất quaacuten+ Cải tiến chất lượng cuộc sống của nhacircn viecircnHỗ trợ cộng taacutec Maacutey tiacutenh hỗ trợ cộng taacutec- Khung thời giannơi chốn+ Sự hiệu quả của kỹ thuật tiacutenh toaacuten cộng taacutec phụ thuộc vagraveo vị triacute của caacutec thagravenhviecircn trong nhoacutem vagrave phụ thuộc vagraveo thời gian chia sẽ thocircng tin gởi vagrave nhận+ Chia sự giao tiếp thagravenh bốn ocirc vagrave tổ chức bốn ocirc dọc theo 2 chiều thời gian vagravenơi chốn1048713 Thời gian Khi gởi vagrave nhận thocircng tin hầu như đồng thời giao tiếp lagrave đồngthời Viacute dụ Điện thoại ti vi vagrave caacutec cuộc họp gặp mặt nhau Giao tiếp bấtđồng bộ xảy ra khi người nhận nhận thocircng tin ở thời điểm khaacutec thời điểmgởi thocircng tin đoacute1048713 Nơi chốn Người gởi vagrave người nhận coacute thể ở cugraveng phograveng hoặc khocircng+ Bốn ocirc lagrave1048713 Cugraveng thời giancugraveng nơi chốn Caacutec thagravenh viecircn gặp mặt nhau cugraveng một luacutecgiống như phograveng quyết định hoặc gặp mặt truyền thống1048713 Cugraveng thời giankhaacutec nơi chốn Caacutec thagravenh viecircn ở caacutec nơi khaacutec nhau nhưnggiao tiếp cugraveng nhau Viacute dụ hội nghị truyền higravenh (videoconferencing)1048713 Khaacutec thời giancugraveng nơi chốn Nhiều người lagravem việc theo ca Ca nagravey để lạithocircng tin cho ca khaacutec1048713 Khaacutec thời giankhaacutec nơi chốn Caacutec thagravenh viecircn ở caacutec nơi khaacutec nhau Caacutecthagravenh viecircn nagravey gởi vagrave nhận thocircng tin ở những lần khaacutec nhau

23Thực thi hệ DSSHệ thống hỗ trợ quản lyacute (MSS) khocircng phải luacutec nagraveo cũng luocircn thagravenh cocircng Nhiều trường hợpthất bại của ES khocircng hoagraven toagraven lagrave lyacute do kỹ thuật Thực thi hệ thống lagrave một quaacute trigravenh liecircn tụcnhằm đảm bảo cho tổ chức chuẩn bị tiếp nhận một hệ thống mới vagrave đưa hệ thống vagraveo sử dụngthagravenh cocircngThực hiện cocircng nghệ hệ thống hỗ trợ quản lyacute lagrave việc phức tạp vigrave caacutec hệ thống nagravey khocircng đơnthuần lagrave hệ thống thocircng tin chỉ thu thập thao taacutec vagrave phacircn phối thocircng tin Magrave xa hơn chuacuteng

liecircn quan tới caacutec cocircng việc coacute thể lagravem thay đổi đaacuteng kể caacutech thức hoạt động của tổ chức Tuyvậy đa số caacutec yếu tố thực thi đều liecircn quan tới hệ thống thocircng tinThực thi MSS lagrave quaacute trigravenh liecircn tục diễn ra trong suốt thời gian phaacutet triển hệ thống từ đề xuấtban đầu đến nghiecircn cứu khả thi thiết kế vagrave phacircn tiacutech hệ thống lập trigravenh huấn luyện chuyểnđổi vagrave lắp đặt Caacutec chuyecircn gia hệ thống thocircng tin thường gọi thực thi lagrave giai đoạn cuối trongvograveng đời hệ thống Định nghĩa thực thi MSS phức tạp hơn vigrave bản chất lặp của sự phaacutet triểncaacutec hệ thống

THỰC THI KHOcircNG HOAgraveN CHỈNHCaacutec quyết định về tiacutenh khả thi thường coacute giả định về lợi iacutech đạt được khi kế hoạch thực thiđược thực hiện hoagraven toagraven Trong thực tế thường chỉ thực hiện 90 thậm chiacute 70 phần trăm sovới phacircn tiacutech khả thi Lyacute do lagrave sự thay đổi tại một nơi trong hệ thống coacute thể ảnh hưởng vagrave coacutethể taacutec động tiecircu cực đến chỗ khaacutec Do vậy cấp quản lyacute coacute thể bỏ những phần trong dự aacuten coacutethể gacircy ra taacutec động xấu Do đoacute dự aacuten sẽ thực hiện iacutet hơn 100 so với dự aacuten kế hoạch Caacutec lyacutedo khaacutec coacute thể lagrave do khấu trừ ngacircn saacutech hoặc vượt chi phiacuteĐAacuteNH GIAacute SỰ THAgraveNH COcircNG CỦA THỰC THI HỆ THỐNGPhải coacute caacutec chỉ số đo lường thigrave mới coacute thể đaacutenh giaacute sự thagravenh cocircng khi thực thi một hệ thốngDickson va Powers (1973) đề ra 5 tiecircu chuẩn độc lậpbull Tỷ lệ thời gian thực hiện dự aacuten với thời gian ước lượngbull Tỷ lệ chi phiacute thực tế vagrave ngacircn saacutech thực hiệnbull Thaacutei độ của cấp quản lyacute đối với hệ thốngbull Nhu cầu thocircng tin của caacutec nhagrave quản lyacute được đaacutep ứng như thế nagraveo qua hệ thốngbull Taacutec động của dự aacuten đối với những hoạt động maacutey tiacutenh trong cocircng tyCaacutec đo lường khaacutec để đaacutenh giaacute thagravenh cocircng của hệ hỗ trợ quản lyacute (MSS)bull Sự sử dụng hệ thống (dự định dugraveng hoặc thực sự dugraveng)bull Thỏa matilden của người dugravengbull Thaacutei độ taacuten thagravenhbull Mức độ hệ thống hoagraven thagravenh caacutec mục tiecircu ban đầubull Phần thưởng đối với tổ chức (giảm chi phiacute tăng doanh thuhellip)bull Tỷ số lợi iacutech chi phiacute

bull Mức độ thể chế hoacutea của MSS trong tổ chứcDo bởi tiacutenh đa dạng của DSS necircn việc đaacutenh giaacute sự thagravenh cocircng của hệ nagravey cũng khoacute khăn tuynhiecircn cũng coacute thể coacute một số yếu tố giuacutep cho DSS thagravenh cocircng như sự tham gia người dugravenghuấn luyện người dugraveng hỗ trợ quản lyacute cấp cao nguồn thocircng tin đặc điểm của những nhiệmvụ coacute liecircn quan (cấu truacutec bất định độ khoacute phụ thuộc)

Chương5Nhoacutem hỗ trợ quyết định vagrave nhoacutemcocircng nghệ phần mềm

51Nhoacutem tạo quyết định

MDM-Holsapple đatilde gợi yacute chuacuteng ta sử dụng giới hạn người tạo quyết định

Một nhoacutem lagrave kết cấu MDM nơi magrave nhiều người ra quyết định hoagraven toagraven tương taacutec

Một đội lagrave kết cấu MDM nơi caacutec thagravenh viecircn tư vấn cho người đưa ra quyết định nhưng khocircng tương taacutec

Một Ủy ban lagrave kết cấu MDM với một người tạo quyết định duy nhất vagrave sự tương taacutec giữa caacutec thagravenh viecircn

Mạng thocircng tin

Mạng lưới baacutenh xe mỗi người tham gia coacute thể giao tiếp với người đưa ra quyết định ở trung tacircm nhưng khocircng phải với người tham gia khaacutecCấu truacutec nagravey lagrave khocircng thỏa matilden tất cả những người tham gia ngoại trừ người ra quyết định

Mạng dacircy chuyền Tham gia chuyển tiếp thocircng tin chỉ để noacute luocircn liền kề nhau trong chuỗi

Thagravenh viecircn cuối cugraveng ko được đaacutep ứng

Mạng vograveng trograven Tương tự như chuỗi nhưng kết thuacutec được kết nối

Mạng kết nối hoagraven toagraven khocircng coacute hạn chế về giao tiếp vagrave tương taacutec giữa caacutec thagravenh viecircnNoacutei chungnoacute đaacutep ứng hầu hết caacutec kết nối của người tham gia nhưng truyền đạt thocircng tin mất nhiều thời gian vagrave coacute nhiều cơ hội xảy ra lỗi

Nhoacutem hagravenh vi vagrave chuẩn mực

MDMs thiết lập caacutec chỉ tiecircu hướng dẫn quaacute trigravenh ra quyết định

Một chuẩn mực quy định cụ thể những gigrave thagravenh viecircn trong nhoacutem dự kiến sẽ lagravem trong những hoagraven cảnh nhất định

Quy tắc gửi coacute thể được thocircng qua viacute dụ đaacutenh giaacute ngang hagraveng hoặc xử phạt

Lagravem thế nagraveo để đưa ra quyết định

Việc chọn lựa magrave trong đoacute việc sử dụng cấu truacutec MDM phải được dựa trecircn một số yếu tố liecircn quan với bối cảnh quyết định

Viacute dụmột cấu truacutec riecircng lẻ sẽ lagravem việc nơi magrave quyết định được cấu truacutec cao vagrave thocircng tin lagrave coacute sẵn

Một ủy ban cơ cấu sẽ lagrave sự lựa chọn khi người ra quyết định khocircng thể đưa ra quyết định một migravenh

52Caacutec vấn đề thường gặp trong nhoacutem

Kiacutech thước Noacutei chung sự nhất triacute vagrave gắn kết giữa caacutec thagravenh viecircn tỉ lệ nghịch với phạm vi nhoacutem Trong nhoacutem lớn rất dễ higravenh thagravenh caacutec nhoacutem nhỏ vagrave hoạt động rời rạc

Tư duy tập thể Trong nhoacutem lớn mọi người coacute xu hướng suy nghĩ đểđạtđược sự nhất triacute necircn khocircng phaacutet huy được sự saacuteng tạo

Caacutec vấn đề về xatilde hội

Xung đột Trong 1 nhoacutem ai cũng muốn migravenh lagrave giỏi nhất necircn dễ dẫn đến xung đột

Ẩn danh(Giấu tecircn) Đacircy lagrave phương phaacutep được sử dụng để kiểm soaacutet xung đột Cho caacutec thagravenh viecircn tham gia ẩn danh

Vấn đề giới tiacutenh Nam vagrave nữ thường coacute những thế mạnh khaacutec nhau điều nagravey coacute thể lagrave sức mạnh trong 1 thiết lập MDM

Đagravem phaacuten vagrave quyết định

Một quyết định coacute thể liecircn quan đến nhiều quan điểm khaacutec nhau vigrave thế cần phải coacute sự đagravem phaacuten

Caacutec thiết kế của cơ chế hỗ trợ cho MDM phải phugrave hợp với caacutec hoạt độngđagravemphaacuten

Những hoạt động nagravey bao gồm việc thu nhận yacute kiến của caacutec thagravenh viecircn 1 caacutech cocircng bằng

53Cocircng nghệ hỗ trợ MDM

Organizational DSSndash 1 hệ thống cung cấp caacutec quyết định hỗ trợ

Group Support Systemndash Cocircng nghệ sử dụng sự hỗ trợ của nhiều becircn tham gia

Group DSS ndash Lagrave 1 hệ thống được thiết kế đặc biệt để hỗ trợ cho MDM

DSS ndash Lagrave 1 hệ thống dưới sự kiểm soaacutet của 1 người quyết định hệ thống nagravey cung cấp 1 bộ cocircng cụ giuacutep phacircn tiacutech hoagraven cảnh đểđưa ra quyết định vagrave nacircng cao hiệu quả của quyết địnhđoacute

53Cocircng nghệ hỗ trợ MDM

Organizational DSSndash 1 hệ thống cung cấp caacutec quyết định hỗ trợ

Group Support Systemndash Cocircng nghệ sử dụng sự hỗ trợ của nhiều becircn tham gia

Group DSS ndash Lagrave 1 hệ thống được thiết kế đặc biệt để hỗ trợ cho MDM

DSS ndash Lagrave 1 hệ thống dưới sự kiểm soaacutet của 1 người quyết định hệ thống nagravey cung cấp 1 bộ cocircng cụ giuacutep phacircn tiacutech hoagraven cảnh đểđưa ra quyết định vagrave nacircng cao hiệu quả của quyết địnhđoacute

Mục tiecircu của cocircng nghệ hỗ trợ MDM

Quy trigravenh hỗ trợ tập trung vagraveo quaacute trigravenh tạo điều kiện thuận lợi cho sự tương taacutec

Cơ chế cấu truacutec quaacute trigravenh chi phối caacutec hoạt động truyền thocircng

Nhiệm vụ hỗ trợ cocircng việc coacute thể chọn lựa tổ chức hoặc lấy thocircng tin

Nhiệm vụ cấu truacutec cocircng việc cho pheacutep truy cập đến kỹ thuật lọc kết hợp phacircn tiacutech kiến thức liecircn quan đến cocircng việc

Caacutec lớp loại cocircng nghệ hỗ trợ MDM

Phacircn loại theo đặc điểm do DeSanctis vagrave Gallupe đưa ra đề xuất một chương trigravenh ba cấp dựa trecircn caacutec tiacutenh năng được cung cấp

Hệ thống cấp 1 Mục điacutech chiacutenh lagrave tạo điều kiện thocircng tin liecircn lạc giữa caacutec thagravenh viecircn

Hệ thống cấp 2 Thiết kế để giảm thiểu rủi ro

Hệ thống cấp 3 Giuacutep điều chỉnh xử lyacute quyết định

Phacircn loại theo cocircng nghệ -Kraemer vagrave King tập trung vagraveo cocircng nghệ aacutep dụng

Cocircng nghệ bảng mạch điện tử

Hội nghị trực tuyến

Mạng lưới tập đoagraven

Trung tacircm thocircng tin

Mocirci trường cộng taacutec

Phograveng quyết định

Nhoacutem phần mềm

Phần mềm được thiết kế để hỗ trợ sự hợp taacutec bao gồm việc thu huacutet vagrave lưu trữ thocircng tin

Caacutec tổ chức dẫn đầu thị trường hiện tại lagrave Lotus Notes and Domino Microsoft Exchange Novell GroupWise and Oracle Office

Caacutec cocircng cụ trong một bộ phần mềm bao gồm người quản lyacute hội nghị (Lotus Sametime) vagrave trao đổi thocircng điệp (Lotus Notes Mail)

Xếp hạng phần mềm cho nhoacutem

Ellis vv đề xuất một hệ thống xếp hạng dựa vagraveo kiểu sự hỗ trợ noacute Cung cấp

Hệ thocircng điệp

Hệ thống hội thảo truyền higravenh

Hệ thống cộng taacutec soạn thảo

Nhoacutem phacircn phối giải phaacutep phần mền

Hệ thống phối hợp

Hệ thống thocircng minh đại diện

Lực lượng điều khiển phaacutet triển phần mềm cho nhoacutem

Một số nhacircn tố chiacutenh bao gồm

Tăng năng suất

Giảm số lượng caacutec cuộc họp

Tăng cường tự động hoacutea caacutec quy trigravenh lagravem việc thường xuyecircn

Cần phối hợp toagraven cầu tốt hơn

Tiacutenh sẵn sagraveng của những mạng lan rộng

Coleman vagrave Khanna liệt kecirc 10 nhacircn tố khaacutec

54Quản lyacute hoạt động MDM (Mobile Device Management - Quản lyacute thiết bị di động)

Một số phương phaacutep phối hợp phổ biến hơnMDM lagrave

Kỹ thuật nhoacutem định danh

Kỹ thuật Delphi

Sự phacircn xử

Hệ thocircng tin dựa trecircn vấn đề

Nemawashi

Kỹ thuật nhoacutem định danh

1-Mỗi người tham gia viết ra những yacute tưởng về những gigrave necircn quyết định

2-Lần lượt mỗi người tham gia trigravenh bagravey yacute tưởng của migravenh được ghi lại trecircn bảng Khocircng thảo luận ở đacircy

3-Sau khi tất cả caacutec yacute tưởng được trigravenh bagravey caacutec đại biểu coacute thể chất vấn những người khaacutec

4-Mỗi người tham gia bỏ phiếu cho mỗi yacute tưởng

Kỹ thuật Delphi

Về cơ bản tương tự như kỹ thuật nhoacutem định danh ngoại trừ những người khocircng bao giờ tham gia cuộc họp

Một cocircng cụ khảo saacutet được sử dụng để thu thập đầu vagraveo ban đầu từ caacutec thagravenh viecircn

Một cuộc khảo saacutet thứ hai được gửi đi với một bản toacutem tắt caacutec kết quả chung

Những bước lặp lại cho đến khi đạt được một sự đồng thuận hoặc nhigraven nhận của đa số

Sự phacircn xử(Arbitration )

Thiacutech hợp nhất khi caacutec thagravenh viecircn của MDM đại diện cho caacutec yếu tố đối lập

Những người tham gia đồng yacute rằng nếu lựa chọn thay thế hai becircn thỏa thuận khocircng được tigravem thấy thigrave một trọng tagravei viecircn becircn ngoagravei sẽ tham gia

Trọng tagravei sau đoacute lựa chọn thay thế ocircng hoặc xeacutet thấy thiacutech hợp nhất

Hệ thống thocircng tin dựa trecircn vấn đề (IBIS)

Lagrave một phương phaacutep lập luận cấu truacutec

Một đại diện cho IBIS lagrave một đồ thị với caacutec nuacutet vagrave caacutec liecircn kết

IBIS bắt đầu với lựa chọn của một nuacutet vấn đề gốc sau đoacute caacutec nuacutet vị triacute khaacutec nhau được liecircn kết với nuacutet gốc

Caacutec nuacutet vị triacute nagravey sau đoacute được đaacutenh giaacute dựa trecircn những lập luận gắn liền với chuacuteng

Nemawashi (được sử dụng rộng ratildei tại Nhật Bản)

1-Một hoặc nhiều thagravenh viecircn của MDM được chỉ định lagrave điều phối viecircnCaacutec điều phối viecircn sau đoacute chọn người tham gia cograven lại

2-Điều phối viecircn xacircy dựng một tổng hợp caacutec sự lựa chọn vagrave sau đoacute caacutec chuyecircn gia đaacutenh giaacute caacutec lựa chọn

3-Điều phối viecircn lựa chọn một sự lựa chọn dựa trecircn kết quả ở trecircn(ở 2)

4-Sự thay thế được luacircn chuyển điều phối viecircn tigravem kiếm sự đồng thuận thocircng qua sự thuyết phục vagrave đagravem phaacuten

5-Nếu đạt được sự đồng thuận điều phối viecircn cho lưu thocircng một tagravei liệu magrave mỗi thagravenh viecircn MDM để lại dấu hiệu trecircn đoacute

55Nơi lagravem việc ảo

Nhiều tổ chức trecircn toagraven thế giới kinh doanh bất động sản cho cocircng nghệ hợp taacutec

Cocircng việc được trở thagravenh một điều bạn lagravem hơn lagrave một nơi bạn đi

Những thay đổi lớn nhất mang lại bởi nơi lagravem việc ảo coacute thể lagrave về văn hoaacute hay xatilde hội hơn lagrave về cocircng nghệ

Chương 6 Hệ thống thocircng tin điều hagravenh

61 Yacute nghĩa của EIS- Hệ thống thocircng tin điều hagravenh

- EIS lagrave một dạng đặc biệt của DSS được thiết kế để hỗ trợ ra quyết định ở cấp cao nhất của một tổ chức

- Lagrave một hệ thống thocircng tin hỗ trợ nhu cầu lập kế hoạch vagrave đaacutenh giaacute của caacutec nhagrave quản lyacute điều hagravenh

- EIS coacute thể giuacutep một CEO coacute được bức tranh tổng thể chiacutenh xaacutec nhất về caacutec hoạt động vagrave một bản toacutem tắt những gigrave magrave đối thủ cạnh tranh đang lagravem

- Caacutec hệ thống nagravey noacutei chung hoạt động dễ dagraveng vagrave trigravenh bagravey thocircng tin theo những caacutech dễ hiểu để việc tiếp thu được nhanh choacuteng (biểu đồ đồ thịhellip)

(Tagravei liệu thecircm EIS lagrave những loại hệ thống lagrave rất phức tạp trong tự nhiecircn Coacute thể noacutei hệ thống nagravey cũng cung cấp cho caacutec nhagrave quản lyacute với caacutec thiết bị coacute khả năng ra quyết định bằng caacutech sử dụng của noacute Hệ thống nagravey hoạt động trong điều kiện như vậy quan trọng như trong caacutec hệ thống khaacutec khocircng hỗ trợ Khả năng lưu trữ dữ liệu nặng lagravem cho noacute lyacute tưởng để được thocircng qua khocircng chỉ bởi caacutec doanh nghiệp lớn magrave cograven bởi caacutec doanh nghiệp nhỏ hơn Nhigraven chung hệ thống nagravey lagrave dagravenh cho caacutec nhacircn viecircn cấp cao hỗ trợ thagravenh thạo trong việc đưa ra caacutec quyết định quan trọng)

Caacutec phiecircn EIS tiecircu biểu- Phiecircn lagravem việc coacute thể bắt đầu với một baacuteo caacuteo về tigravenh higravenh tagravei chiacutenh vagrave kinh

doanh của một cocircng ty caacutec chỉ số hoạt động quan trọng được hiển thị rotilde ragraveng- EIS sẽ cho pheacutep caacutec giaacutem đốc điều hagravenh coacute thể đi sacircu vagraveo dữ liệu từ những con

số bất kỳ magrave noacute hỗ trợ- Việc điều hagravenh coacute thể lựa chọn một mức độ chi tiết ( VD danh số baacuten hagraveng) nếu

như cần điều tra thecircm- Lagrave một phương phaacutep tiếp cận coacute thể giuacutep việc ra quyết định tốt hơn

Những điều magrave EIS ko coacute- EIS khocircng phải lagrave sự thay thế cho caacutec hệ thống dựa trecircn caacutec maacutey tiacutenh khaacutec EIS

thực sự chỉ cung cấp dữ liệu cho caacutec hệ thống nagravey- Noacute khocircng thể biến caacutec bộ hệ điều hagravenh của maacutey tiacutenh thagravenh những ldquochuyecircn viecircn

giỏirdquo- Coacute thể được viacute một caacutech cao hơn như lagrave một trợ lyacute đaacuteng tin cậy coacute thể được gọi

đến bất khi nagraveo vagrave mỗi khi cần thiết

Tagravei liệu thecircm Sự khaacutec nhau giữa EIS vagrave DSS+ EIS thiết kế để hỗ trợ những người điều hagravenh cấp cao giuacutep họ khaacutem phaacute caacutec vấn đề vagrave caacutec cơ hội DSS hỗ trợ những nười phacircn tiacutech cố gắng trả lời cacircu hỏi caacutei gigrave coacute thể lagravem cugraveng với một cơ hội hoặc một vấn đề

Chiều EIS DSSNhững người sử dụng thocircng thường

Duyệt dữ liệu đi xuống truy xuất trạng thaacutei

Hỗ trợ phacircn tiacutech vagrave quyết định

Sự thuacutec đẩy Tiacutenh thiacutech hợp Tiacutenh hiệu quảỨng dụng Queacutet mocirci trường đaacutenh giaacute

hiệu suất nhận dạng caacutec vấn đề vagrave caacutec cơ hội

Caacutec quyết định quản lyacute trecircn caacutec lĩnh vực đa dạng

Hỗ trợ quyết định Caacutec chiacutenh saacutech caacutec quyết định khocircng coacute cấu truacutec ở mức cao vagrave hỗ trợ giaacuten tiếp

Hỗ trợ caacutec quyết định lặp lại caacutec quyết định khocircng thể đoaacuten trước ra quyết định khocircng coacute cấu truacutec vagrave baacuten cấu truacutec

Loại thocircng tin Caacutec thocircng tin tin tức thocircng tin becircn ngoagravei về khaacutech hagraveng đối thủ cạnh tranh mocirci trường caacutec baacuteo caacuteo theo yecircu cầu vagrave định thời về caacutec hoạt động becircn trong

Caacutec thocircng tin hỗ trợ caacutec tigravenh huống đặc biệt

Sử dụng coacute nguyecircn tắc

Dograve theo vết vagrave điều khiển nhận dạng cơ hội

Hoạch định tổ chức phacircn nhoacutem vagrave điều khiển

Khả năng phugrave hợp với những người sử dụng caacute nhacircn

Thiết kế loại ra quyết định cho mỗi người điều hagravenh caacute nhacircn bằng nhiều lựa chọn đầu ra

Cho pheacutep caacutec đaacutenh giaacute caacute nhacircn caacutec khả năng what-if lựa chọn loại hộp hội thoại

Đồ họa Phải coacute Lagrave một phần quan trọng của nhiều DSS

Thacircn thiện người sử dụng

Phải coacute Phải coacute nếu khocircng coacute người sử dụng trung gian

Xử lyacute thocircng tin Lọc neacuten thocircng tin dograve theo vết dữ liệu vagrave thocircng tin quan trọng

EIS kiacutech thiacutech caacutec cacircu hỏi caacutec cacircu trả lời bằng caacutech sử dụng DSS vagrave phản hồi lại EIS

Hỗ trợ caacutec thocircng tin chi tiết

Truy xuất thường xuyecircn caacutec mức chi tiết của bất kỳ thocircng tin tổng hợp nagraveo (duyệt dữ

Coacute thể coacute trong DSS nhưng khocircng thường

liệu chi tiết)Cơ sở mocirc higravenh Caacutec chức năng coacute sẵn bị hạn

chếLagrave điểm cốt lotildei của DSS

Cấu truacutec Theo người baacuten sản phẩm hoặc theo caacutec chuyecircn gia hệ thống thocircng tin

Theo người sử dụng hoặc caacute nhacircn hoặc caacutec chuyecircn gia từ caacutec trung tacircm thocircng tin hoặc phograveng ban hệ thống thocircng tin

Phần cứng Mainframe caacutec trạm RISC mạng LANs hoặc caacutec hệ thống phacircn bố

Mainframe caacutec trạm RISC caacutec maacutey PC hoặc caacutec hệ thống phacircn bố

Bản chất caacutec goacutei phần mềm

Truy xuất tương taacutec dễ dagraveng đến nhiều cơ sở dữ liệu truy xuất trực tuyến caacutec khả năng DBMS phức tạp caacutec liecircn kết phức tạp

Caacutec khả năng tiacutenh toaacuten lớn caacutec ngocircn ngữ mocirc higravenh mocirc phỏng ứng dụng vagrave caacutec bộ tạo DSS

Bản chất caacutec thocircng tin

Trigravenh bagravey thocircng tin được phaacutet sinh trước về quaacute khứ vagrave hiện tại tạo caacutec thocircng tin mới về quaacute khứ hiện tại tương lai

Tạo thocircng tin mới về quaacute khứ hiện tại tương lai

62 Lịch sử EIS- EIS xuất hiện lần đầu tiecircn tại MIT vagraveo những năm 1970

- Những EIS đầu tiecircn được phaacutet triển bởi caacutec doanh ngiệp lớn sẵn sagraveng chấp nhận rủi ro để đạt được lợi thế cạnh tranh

- Vagraveo những năm 1980 caacutec nhagrave cung cấp đatilde phaacutet triển một số cơ sở khaacutech hagraveng rộng vagrave cocircng nghệ EIS được tiếp tục phaacutet triển cho đến ngagravey nay

(Tagravei liệu thecircm Sử dụng DSSEIS cho phaacutet triển bền vững + Một số nghiecircn cứu đatilde được tiến hagravenh để kiểm tra việc thực hiện của EIS trong khu vực cocircng cộng vagrave chiacutenh phủ caacutec nước tổ chức kể từ khi chuacuteng được phaacutet triển theo định hướng lợi nhuận cho caacutec cocircng ty tư nhacircn (Hasan vagrave Hasan năm 1997) Theo một nghiecircn cứu tiến hagravenh tại Mỹ ở hơn 300 cocircng ty kết quả cho thấy sự khaacutec biệt của EIS giữa tư nhacircn vagrave chiacutenh phủ một số kết quả thuacute vị được phaacutet hiệnViacute dụ khoacute khăn hơn để chuyển tiền từ một tagravei khoản khaacutec trong một EIS của chiacutenh phủ cũng lagrave khoacute khăn hơn để biện giải thiacutech cho những chi phiacute phaacutet triển EIS của chiacutenh phủ Một nghiecircn cứu khaacutec được tiến hagravenh ở Australia

cho thấy rằng EIS cung cấp cho quản lyacute một higravenh ảnh chiacutenh xaacutec hơn về tổ chức thực hiện vagrave cung cấp hỗ trợ cho caacutec lợi iacutech chiến lược cải thiện khocircng chỉ cho caacutec nhagrave quản lyacute nhưng cograven cho phần cograven lại của tổ chức Dựa trecircn caacutec hệ thống được thiết kế cho caacutec cocircng ty tư nhacircn với một caacutech rotilde ragravengxaacutec định mục tiecircu EIS lagrave thiacutech hợp cho caacutec tổ chức cocircng cộng hiện đại nhưng cần phải được linh hoạt hơn vagrave kết thagravenh chugravem một phạm vi rộng hơn khả năng vagrave phương tiện hơn so với khu vực tư nhacircn ban đầu theo định hướng sản phẩm (Hasan vagrave Hasan năm 1997) Điều nagravey coacute thể lagrave do thực tế rằng caacutec hoạt động khu vực cocircng lagrave bắt buộc coacute taacutec động rộng phải đaacutep ứng sự mong đợi duy nhất cocircng cộng thường coacute mục tiecircu mơ hồ vagrave macircu thuẫn iacutet quyền tự chủ vagrave kiểm soaacutet việc ra quyết định vagrave nhacircn viecircn lagrave khoacute khăn hơn (Watson vagrave Carte2000) + Toacutem lại EIS lagrave một khaacutei niệm thagravenh cocircng noacute phaacutet triển qua nhiều năm tuy nhiecircn EIS khắc phục khiếm khuyết của migravenh bằng caacutech tiến hagravenh nghiecircn cứu liecircn tục)

63 Tại sao những người điều hagravenh hagraveng đầu lại khaacutec nhau- Họ lagrave những doanh nghiệp theo định hướng coacute suy nghĩ

- Coacute một khoảng khocircng gian rộng để kiểm soaacutet

- Họ chịu traacutech nhiệm cho việc thiết lập chiacutenh saacutech

- Họ đại diện cho tổ chức mocirci trường becircn ngoagravei

- Hagravenh động của họ tạo ra những kết quả đaacuteng kể về tagravei chiacutenh vagrave con người

Tần số caacutec hoạt động điều hagravenh- Xử lyacute xaacuteo trộn 42

- Hoạt động kinh doanh 32

- Phacircn bổ nguồn lực 17

- Đagravem phaacuten 3

- Những điều khaacutec 6

Handling Disturbances 42

Entrepreneurial Activites 32

Resource Allocation 17

Negotiation 3

Other 6

Những thocircng tin điều hagravenh cần thiết- Quản lyacute xaacuteo trộn coacute thể yecircu cầu sự chuacute yacute xung quanh đồng hồ

- Hoạt động kinh doanh yecircu cầu điều hagravenh để dự đoaacuten những thay đổi trong mocirci trường

- Nhiệm vụ phacircn bổ tagravei nguyecircn yecircu cầu lựa chọn người quản lyacute vagrave caacutec nguồn lực hạn chế được triển khai

- Đagravem phaacuten yecircu cầu cập nhật thocircng tin từng phuacutet để coacute thể xacircy dựng được sự đồng thuận

Caacutec loại thocircng tin điều hagravenh- Hệ thống kế toaacuten coacute liecircn quan đến việc tiacutenh toaacuten thu nhập hoạt động cho caacutec lĩnh

vực cụ thể lagrave quan trọng hơn so với caacutec hệ thống kế toaacuten truyền thocircng- Thocircng tin về thị trường khaacutech hagraveng cung cấp giaacute trị trong việc quyết định chiến

lược- Caacutec thocircng tin cần thiết thường được truyền đi trecircn một số hệ thống maacutey tiacutenh vagrave

nằm trong toagraven tổ chức- Caacutec thocircng tin được sử dụng thường lagrave ngắn hạn vagrave dễ thay đổi

Phương thức để xaacutec định thocircng tin cần thiết

Rockart xaacutec định được năm phương thức cơ bản để xaacutec định thocircng tin cần thiết

- Phương thức dựa trecircn kết quả- Phương thức rỗng- Phương thức chỉ số khoacutea- Phương thức tổng hợp nghiecircn cứu- Phương thức dựa vagraveo nhacircn tố then chốt dẫn đến thagravenh cocircng

64 Thagravenh phần EIS

- Sản phẩm EIS đầu tiecircn được phaacutet triển để sử dụng trecircn maacutey tiacutenh cấu higravenh cao nhưng caacutec sản phẩm hiện nay nhằm mục tiecircu lagrave nền tảng ClientServer

- Những nền tảng linh hoạt hơn coacute thể thiacutech ứng với thay đổi trong tổ chức vagrave cocircng nghệ

- Sử dụng dữ liệu thời gian thực dẫn đến quyết định nhanh hơn nhiều thocircng tin hơn

Thagravenh phần phần cứng- Một EIS khocircng đogravei hỏi coacute phần cứng cụ thể hoặc duy nhất nagraveo- Chigravea khoacutea của vấn đề lagrave để đảm bảo rằng caacutec thagravenh phần của EIS tối ưu hoacutea vagrave

phugrave hợp với tagravei nguyecircn maacutey tiacutenh của tổ chức- Hệ thống nagravey phải được cấu higravenh để caacutec nguồn tagravei nguyecircn phugrave hợp với những

người điều hagravenh chuacuteng

Thagravenh phần phần mềm- Traacutei ngược với phần cứng phần mềm thường được chuyecircn mocircn hoacutea cao cho caacutec

bagravei toaacuten về miền- Sự chuyecircn mocircn hoacutea nagravey thường đạt được bằng caacutech sử dụng thagravenh phần off-the-

shelf cho toagraven bộ EIS vagrave caacutec mocirc-đun tugravey chỉnh để đaacutep ứng nhu cầu cụ thể- Lotus Notes lagrave một viacute dụ điển higravenh Noacute coacute thể được sử dụng một migravenh hoặc coacute

thể phục vụ becircn thứ ba mocirc-đun plug-in

Cocircng nghệ EIS hiện nay

Dobrzeniecki đề xuấtphacircn loạitừng cấptheo bachức năng- Loại 1 sản phẩm bao gồmmột bộ đầy đủcaacutec ứng dụngtừ mộtnhagrave cung cấp- Loại 2 sản phẩm đượcthựchiệnở phần đầu củacaacutecsản phẩmDSS đượcphaacutet triển

bởicugravengmộtnhagrave cung cấp- Loại 3 sản phẩmkết hợp với nhautheo bất kỳ số lượngthuộc sở hữu củacocircng ty

65 Xacircy dựng EIS

- Xacircy dựngmộtEISgiống nhưxacircydựngmột số hệ thống khaacutec củamocirc higravenh hệ thống thocircng tin

- Việcphaacutet triểncấu truacutecnecircn được theo dotildeitừ quaacute trigravenh thiết kế đến quaacute trigravenhthực hiện

- Tuy nhiecircn một dự aacuten phaacutet triển EIScoacute xu hướnglagrave thống nhấtvagraveyecircu cầu hỗ trợ caacutec nhagrave quản lyacute latildenh đạo

- Xacircy dựng một EIScoacute thểphaacutet hiện ra đượccaacutectigravenh huống khoacute khănmagravemột nhagrave phaacutet triển chưabao giờ gặp phải

Mocirc higravenh EIS

Khung phaacutet triển một EIS

- Watson et al đề nghị xacircy dựngkhung với ba thagravenh phần+ Caacutech tiếp cận tập trung vagraveo yếu tốcon người vagrave dữ liệu coacute liecircn quan đến EIS+ Quaacute trigravenh phaacutet triển cần sự linh hoạt vagrave tương taacutec+ Người sử dụng - hệ thống hộp thoại bao gồm một ngocircn ngữ hagravenh động để xử lyacute caacutec lệnh

Lợi iacutech của EIS- Dễ duy trigrave caacutec mục tiecircu coacute tổ chức- Dễ truy xuất thocircng tin- Cho pheacutep người sử dụng nacircng cao hiệu suất hơn

- Tăng chất lượng ra quyết định- Cung cấp sự cải tiến cạnh tranh- Tiết kiệm thời gian của người sử dụng- Tăng khả năng vagrave chất lượng giao tiếp- Cung cấp khả năng điều khiển tốt hơn trong tổ chức- Cho pheacutep tham gia caacutec vấn đề vagrave caacutec cơ hội- Cho pheacutep hoạch định- Cho pheacutep tigravem kiếm nguyecircn nhacircn của một vấn đề- Thảo matilden caacutec yecircu cầu của người điều hagravenh

Hạn chế của EIS vagrave 1 số sai lầm cần traacutenh

- Chi phiacute một cuộc khảo saacutetnăm1991 chothấychi phiacute phaacutet triểntrungbigravenh365000USDvớichi phiacute vận hagravenhhagraveng năm lagrave$200000 (EIS)

- Cocircng nghệ hạn chếEIScần phảiđượctiacutech hợp hoagraven toagravenvagraveokiếntruacuteccủadoanh nghiệphiện tại do đoacute noacutelagrave một thaacutech thứclớn đối vớithiết kế

- Hạn chế tổ chức cơ cấu tổ chứccoacute thể khocircng phugrave hợp

Sự hạn chế về tổ chức- Chương trigravenh nghị sự vagrave thời gian chệch EIS mocirc tả một phần việc thực hiện một

chương trigravenh nghị sự vagrave coacute thể dễ dagraveng đạt được sự tin cậy một caacutech chắc chắn- Đồng bộ hoacutea việc quản lyacute sự tin cậy đuacuteng luacutec đặc biệt baacuteo caacuteo EIS coacute thể phaacute

vỡ sự ổn định thiết lập caacutec chu trigravenh baacuteo caacuteo một caacutech tốt nhất- Sự bất ổn EIS phản ứng nhanh coacute thể gacircy ra việc taacutec động trở lại một caacutech

nhanh choacuteng dẫn đến sự thiếu ổn định trong tổ chức

Sự thất bại lagrave thay thế khocircng thể chấp nhận được- Một số yếu tố lagravem EIS thất bại

+ Thiếu sự hỗ trợ về mặt quản lyacute+ Vấn đề chiacutenh trị+ Thất bại của nhagrave phaacutet triển+ Lỗi về cocircng nghệ+ Giaacute cả+ Thời gian

66 Ra quyết định điều hagravenh trong tương lai vagrave EIS

- Coacute một vagravei điều kiện sẽ được hợp nhất cho việc chuyển đổi cocircng nghệ Trong đoacute một vagravei điều kiện coacute thể dễ dự đoaacuten Hai điều kiện magrave ta coacute thể thấy lagrave+ Phaacutet triển cocircng nghệ maacutey tiacutenh trong việc điều hagravenh sẽ tạo ra sự chuyển đổi được chấp nhận một caacutech dễ dagraveng hơn+ Mở rộng traacutech nhiệm điều hagravenh sẽ mở rộng nhu cầu thocircng tin

Tương lai của EIS- EIS thocircng minh Những tiến bộ trong cocircng nghệ AI sẽ được triển khai trong caacutec

EIS- EIS đa phương tiện Cơ sở dữ liệu đa phương tiện sẽ cho pheacutep tiacutech hợp văn bản

giọng noacutei vagrave higravenh ảnh trong tương lai- EIS thocircng tin Tương lai EIS sẽ mở rộng hơn trong việc sử dụng dữ liệu becircn

ngoagravei doanh nghiệp- EIS kết nối Giao tiếp với băng thocircng rộng cho pheacutep kết nối liecircn thocircng lớn hơn

Chương 7 HỆ CHUYEcircN GIA VAgrave TRIacute TUỆ NHAcircN TẠO

71 Caacutec khaacutei niệm

72 Triacute thocircng minh của triacute tuệ nhacircn tạo

73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia

74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia

75 Lợi iacutech vagrave hạn chế của hệ chuyecircn gia

71 Caacutec khaacutei niệm

Chuyecircn mocircn (Expertise) sự hiểu biết rộng trong 1 lĩnh vực hẹp

Hệ chuyecircn gia (Expert Systems)1 chương trigravenh maacutey tiacutenh sử dụng 1 tập caacutec luật dựa trecircn tri thức của con người để giải quyết caacutec vấn đề đogravei hogravei phải coacute sự chuyecircn mocircn

Một số hệ chuyecircn gia nổi tiếng

DENDRAL (Standford 1960s Edward Feigenbaum)

MYCIN (Standford1970s Edward Shortliffe)

PROSPECTOR (MIT 1979)

Triacute tuệ nhacircn tạo (Artificial Intelligence ndash AI)

Triacute tuệ nhacircn tạo một bộ phacircn của ngagravenh khoa học maacutey tiacutenh quan tacircm đến việc thiết kế caacutec hệ thống maacutey tiacutenh thocircng minh đoacute lagrave caacutec hệ thống đưa ra caacutec đặc điểm magrave từ đoacute chuacuteng ta liecircn hệ với sự thocircng minh trong hagravenh động của con người (Barr vagrave Feigenbaum 1981)

Mục điacutech của AI

Mục điacutech khoa học xaacutec định caacutec gợi yacute để giải thiacutech caacutec loại khaacutec nhau của triacute tuệ thực

Mục điacutech kỹ thuật giải quyết caacutec vấn đề trong thế giới thực

Triacute tuệ nhacircn tạo kế thừa nhiều yacute tưởng quan điểm kỹ thuật từ caacutec ngagravenh khoa học khaacutec

- Triết học

- Logic Toaacuten học

- Tiacutenh toaacuten

- Khoa học tacircm lyacute Khoa học nhận thức

- Sinh học Thần kinh học

- Tiến hoacutea

Caacutec lĩnh vực ứng dụng trong Triacute tuệ nhacircn tạo

Mạng nơ ron thần kinh (Neural Networks)

Tiacutenh toaacuten sự tiến hoacutea

(Evolutionary Computation)

Hệ chuyecircn gia (Expert Systems)

Kỹ thuật xử lyacute tiếng noacutei (Speech Processing)

Kỹ thuật xử lyacute ngocircn ngữ tự nhiecircn

(Natural Language Processing)

Lập kế hoạch (Planning)

Robot (Robotics)

Khoa học higravenh ảnh (Vision)

Caacutec kỹ thuật thocircng dụng dugraveng trong AI

Biểu diễn(Representation)

Học (Learning)

Caacutec luật (Rules)

Tigravem kiếm (Search)

72 Triacute thocircng minh của triacute tuệ nhacircn tạo

Con người suy diễn như thế nagraveo

Phacircn loại (Categorization)

Caacutec quy tắc cụ thể

Heuristics

Kinh nghiệm trước đoacute

Dự tiacutenh trước

Maacutey tiacutenh suy diễn như thế nagraveo

Lập luận dựa trecircn luật IF-THEN mocirc tả tri thức được matilde hoacutea dưới dạng caacutec luật

Caacutec khung (Frames) lagrave caacutec đại diện mocirc tả caacutec tigravenh huống giống nhau lagrave điển higravenh của một vagravei phacircn loại

Lập luận dựa trecircn caacutec trường hợp mocirc phỏng giải phaacutep trước đoacute cho một vấn đề hiện tại

Nhận dạng mẫu phaacutet hiện acircm thanh higravenh dạng hoặc caacutec chuỗi dagravei

Caacutec dạng khaacutec của Triacute tuệ nhacircn tạo

Học maacutey- mạng nơron vagrave giải thuật di truyền

Lập trigravenh tự động ndash lagrave những kỹ thuật tạo ra caacutec chương trigravenh để lagravem 1 nhiệm vụ riecircng biệt (cho pheacutep những người khocircng phải lagrave người lập trigravenh coacute thể lập trigravenh được)

Cuộc sống nhacircn tạo ndash nỗ lực để taacutei tạo caacutec hiện tượng sinh học trong caacutec hệ thống dựa trecircn maacutey tiacutenh

73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia(Expert Systems- ES)

Theo Jackson (1999) Một hệ chuyecircn gia lagrave một chương trigravenh maacutey tiacutenh mocirc tả vagrave suy diễn với tri thức của một vagravei lĩnh vực để giải quyết vấn đề hay đưa ra caacutec lời khuyecircn

Cấu truacutec cơ bản của ES được dựa theo cấu truacutec chung của DSS Sự khaacutec biệt chiacutenh giữa ES vagraveDSS lagrave hệ ES thu thập caacutec kiến thức từ những

chuyecircn gia trong lĩnh vực quan tacircmĐặc trưng của hệ chuyecircn gia Hiệu quả cao Thời gian trả lời thỏa đaacuteng Độ tin cậy cao Dễ hiểu

Giao diện người dugraveng trong ES

Thiết kế giao diện người dugraveng tập trung vagraveo caacutec yếu tố như dễ dagraveng sử dụngcoacute độ tin cậy cao giảm tải những khoacute khăn khi sử dụng

Thiết kế necircn coacute một số tương taacutec (đầu vagraveo kiểm soaacutet vagrave truy vấn)

Cấu tạo giao diện người dugraveng gồm coacute magraven higravenh cảm ứng bagraven phiacutem buacutet saacuteng lệnh thoại caacutec phiacutem chuyecircn dụng

Cơ sở tri thức (Knowledge Base)

Chứa đựng caacutec tri thức cụ thể miền thu được từ caacutec chuyecircn gia miền

Coacute thể chứa caacutec mocirc tả caacutec hagravenh vi giải quyết vấn đề caacutec ragraveng buộc caacutec heuristics

Thagravenh cocircng của một ES dựa trecircn tiacutenh đầy đủ vagrave tiacutenh chiacutenh xaacutec của cơ sở tri thức

Mocirc tơ suy diễn (Inference Engine)

Ở đacircy tri thức được đặt để sử dụng tạo ra caacutec giải phaacutep để giải quyết vấn đề

Mocirc tơ nagravey coacute khả năng thực hiện diễn dịch hoặc suy diễn dựa trecircn caacutec luật hay caacutec caacutec sự kiện

Đồng thời cũng coacute khả năng sử dụng caacutec suy diễn mờ hay khocircng chiacutenh xaacutec dựa trecircn xaacutec suất hay aacutenh xạ mẫu

Vograveng điều khiển suy diễn

1 Aacutenh xạ caacutec luật với caacutec sự kiện đatilde được cho

2 Chọn luật để thực hiện

3 Thực hiện luật bằng caacutech thecircm caacutec sự kiện được suy diễn ra vagraveo bộ nhớ lagravem việc

Chuỗi suy diễn (Chaining)

Suy diễn tiến (forward chaining) maacutey suy diễn bắt đầu từ dữ liệu ban đầu vagrave thực hiện việc suy luận để đưa ra caacutec kết luận cuối cugraveng

Suy diễn lugravei (backward chaining) maacutey suy diễn bắt đầu từ dữ liệu điacutech vagrave tigravem ra tri thức hỗ trợ cho dữ liệu điacutech đoacute

Viacute dụ suy diễn lugravei

R1 Nếu coacute A vagrave B thigrave suy ra coacute D

R2 Nếu coacute B thigrave suy ra coacute C

R3 Nếu coacute C vagrave D thigrave suy ra coacute E

Ta coacute E ta xem trong 3 luật R1 R2 R3 luật nagraveo coacute E ta thấy R3 chứa E đồng thời chứa C vagrave D Xeacutet tiếp trong 2 luật R1 R2 luật nagraveo chứa C vagrave D R2 chứa C R3 chứa D Từ đoacute ta coacute được caacutec tri thức hỗ trợ suy diễn vagrave kết luận lagrave nếu coacute A vagrave B thigrave sẽ coacute E Hay nếu A vagrave B đuacuteng thigrave sẽ coacute E

Viacute dụ suy diễn tiến

Giả sử coacute tập chứa 3 luật sau

R1 Nếu coacute A vagrave B thigrave suy ra coacute D

R2 Nếu coacute B thigrave suy ra coacute C

R3 Nếu coacute C vagrave D thigrave suy ra coacute E

Nếu ta coacute A vagrave B thigrave chuacuteng ta suy ra được D từ R1 vagrave suy ra C từ R2 Với D vagrave C đatilde được suy ra ở trecircn giờ chuacuteng ta suy ra được E từ R3

Viacute dụ thực tế

Giả sử muốn biết magraveu của một con vật nuocirci tecircn lagrave Fred biết rằng noacute kecircu ộp ộp vagrave ăn ruồi

Coacute tập 4 luật ban đầu như sau

R1 Nếu X kecircu ộp ộp vagrave ăn ruồi thigrave X lagrave con ếch

R2 Nếu X kecircu chiecircm chiếp vagrave biết hoacutet thigrave X lagrave con chim

R3 Nếu X lagrave con ếch thigrave X coacute magraveu xanh

R4 Nếu X lagrave con chim thigrave X coacute magraveu vagraveng

74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia

Expert system shells lagrave một tập caacutec goacutei phần mềm vagrave caacutec cocircng cụ dugraveng để phaacutet triển caacutec hệ chuyecircn gia

Những Expert system shells đầu tiecircn thường rất rườm ragrave Mặc dugrave vậy noacute vẫn giuacutep cho người sử dụng sẽ khocircng phải bắt đầu lại từ đầu khi xacircy dựng một hệ chuyecircn gia mới

Những shell hiện đại bao gồm hai mocirc-đun chiacutenh lagrave cocircng cụ xacircy dựng một tập quy tắc vagrave mocirc tơ suy diễn

Xacircy dựng hệ chuyecircn gia

Bước 1 xacircy dựng mocirc higravenh bagravei toaacuten xaacutec định vấn đề nhiệm vụ magrave hệ thống sẽ thực hiện Caacutec dạng bagravei toaacuten cần hệ chuyecircn gia

Bagravei toaacuten diễn giải (InterPretation)

Bagravei toaacuten dự baacuteo (Prediction)

Bagravei toaacuten chuẩn đoaacuten (Diagnose)

Bagravei toaacuten gỡ rối (Debugging)

Bagravei toaacuten thiết kế

Tương tự như một dự aacuten phần mềm để xacircy dựng một hệ chuyecircn gia cần phải coacute caacutec yếu tố về nhacircn lực tagravei nguyecircn vagrave thời gian Những yếu tố nagravey ảnh hưởng đến giaacute thah của một hệ chuyecircn giaTrong phần nagravey cacircu hỏi thường được đặt ra lagrave tại sao cần phải xacircy dựng một hệ chuyecircn giaTrước khi bắt đầu phải xaacute định rotilde bagravei toaacuten đạt ra lagrave jiAi lagrave chuyecircn giaAi lagrave người sử dụng

1 Diễn giải (InterPretation) Nghiecircn cứu 1 vấn đề -gt Dựa trecircn những biểu hiện thuộc tiacutenh đặc trưng becircn ngoagravei -gt Tư vấn

(hoặc đưa ra kết luận hay mocirc tả dễ hiểu từ tập dữ liệu thocirc)

2 Bagravei toaacuten dự baacuteo (Prediction) Coacute thể dự đoaacuten được hagravenh vi kết quả dựa trecircn caacutec hiện tượng -gt dự baacuteo

VD Dự baacuteo thời tiết động đấthellip

3 Bagravei toaacuten chẩn đoaacuten (Diagnoss) Xaacutec định caacutec lỗi caacutec bộ phận hỏng hoacutec của hệ thống dựa trecircn caacutec dữ liệu quan saacutet được

4 Bagravei toaacuten gỡ rối (Debugging) Mocirc tả caacutec phương phaacutep khắc phục hệ thống khi gặp sự cố

5 Bagravei toaacuten thiết kế Lựa chọn cấu higravenh caacutec đối tượng nhằm thoả matilden một số ragraveng buộc nagraveo đoacute

6 Giảng dạy Phần mềm dạy học coacute thể chuẩn đoaacuten vagrave sủa lỗi của học sinh trong quaacute trigravenh học tập

Để xaacutec định đuacuteng bagravei toaacuten magrave chuacuteng ta cần giải quyết thigrave phải trả lời đc một số cacircu hỏi

- cần hệ chuyecircn gia

Bước 2 thu thập tri thức lựa chọn cocircng cụ vagrave aacutep dụng

Trong bước thu thập tri thức vấn đề quan trọng lagrave lựa chọn chuyecircn gia những người magrave sẽ đoacuteng goacutep tri thức cho hệ thống Thocircng thường trong suốt quaacute trigravenh phaacutet triển thigrave chuyecircn gia được xem như một thagravenh viecircn của đội phaacutet triển

Hiện nay coacute rất nhiều cocircng cụ để xacircy dựng một hệ chuyecircn gia Phổ biến nhất lagrave JESS CLIPS vagrave OPS5

Bước 3 Thiết kế cơ sở tri thức thiết kế hệ thốngTri thức được biểu diễn trường minh trong cơ sở tri thức

Caacutec chuyecircn gia vagrave kỹ sư tri thức sẽ đối thoại với nhau bằng caacutec kỹ thuật đối thoại Suy diễn (SD) bảng Mocirc higravenh hoacutea SD quy nạp phacircn loại

Vấn đề bagraveo trigrave vagrave phaacutet triển

Caacutec hệ chuyecircn gia đogravei hỏi phải bảo trigrave vagrave phaacutet triển nhiều hơn so với caacutec hệ thống khaacutec Phải thường xuyecircn bổ sung tri thức mới vagrave thay đổi caacutec tri thức cũ để đổi mới hệ chuyecircn gia

Thu thập vagrave khắc phục lỗi do người sử dụng phaacutet hiện để kịp thời khắc phục những sai soacutet của hệ chuyecircn gia

75 Lợi iacutech vagrave hạn chế của caacutec hệ chuyecircn gia

Một số lợi iacutech chiacutenh

Thời gian trả lời hợp lyacute bằng hoặc nhanh hơn so với chuyecircn gia (người) để đi đến cugraveng một quyết định Hệ chuyecircn gia lagrave một hệ thống thời gian thực (real time system)

Khả năng trả lời với mức độ tinh thocircng bằng hoặc cao hơn so với chuyecircn gia (người) trong cugraveng lĩnh vực

Hệ chuyecircn gia giuacutep cho hiệu quả lagravem việc tăng bằng việc sử dụng tập caacutec luật một caacutech nhanh choacuteng magrave ko bị nhầm lẫn chuyecircn gia lagrave người coacute thể quecircn đi một số tri thức cơ sở lyacute luậ nhưng HCG thigrave ko

Quyết định của một người chuyecircn gia coacute thể bị thay đổi vagrave ko coacute tiacutenh thống nhất như quyết định của một hệ chuyecircn gia tạo ra

Hệ chuyecircn gia giuacutep cho người sử dụng coacute thể trau dồi sự hiểu biết trecircn lĩnh vuej cụ thể magrave noacute giải quyết hỗ trợ người ra quyết định coacute trigravenh độ như 1 chuyecircn gia trong quaacute trigravenh gia quyết định

Kiến thức của rất nhiều chuyecircn gia về một lĩnh vực nagraveo đoacute được đưa vagraveo hệ chuyecircn gia lagravem cho CSTT cuat HCG phong phuacute vagrave rộng lớn hơn rất nhiều

HCG giải thiacutech caacutec bước suy luận một caacutech dễ hiểu nhất quaacuten luacutec nagraveo cũng coacute thể sử dụng ko như chuyecircn gia con người

Hạn chế của caacutec hệ chuyecircn gia

Nhược điểm lớn nhất của hệ chuyecircn gia lagrave những yacute kiến chuyecircn mocircn thường rất khoacute matilde hoacutea vagrave giải neacuten

Hệ chuyecircn gia khocircng coacute khả năng tự học tự cập nhật kiến thức mới như caacutec chuyecircn gia magrave cần phải được matilde hoacutea lại khi noacute được cập nhật

Hệ chuyecircn gia khocircng thể nhận ra được vấn đề khocircng nằm trong miền kiến thức của hệ thống

Chương 8 Tri thức vagrave tiếp nhận

1 Bao gồm caacutec vấn đề

Dữ liệu thực tế đo lường hoặc quan saacutet coacute hoặc khocircng coacute bối cảnh

Thocircng tin dữ liệu được tổng hợp một caacutech hữu iacutech để giải quyết những khoacute khăn trong việc đưa ra quyết định

Tri thức bao gồm caacutec ứng dụng quy tắc thocircng tin hướng dẫn của người ra quyết định

2 Những caacutei nhigraven về tri thức

Đại diện lagravem thế nagraveo để diễn tả tri thức viacute dụ như một quyển saacutech khocircng phải lagrave tri thức nhưng noacute lại lagrave một đại diện của tri thức

Sản xuất tri thức lagrave một tập hơp của hagraveng tồn kho coacute thể được sản xuất cũng như mua lại

Tri thức lagrave 1 trong 6 trạng thaacutei của hệ thống

1Dữ liệu 2Thocircng tin 3Cấu truacutec thocircng tin 4Sự thấu hiểu 5Yacute kiến 6 Quyết định

3 Caacutec loại tri thức Phổ biến mocirc tả dữ liệu thocircng tin thủ tục mọi thứ lagravem như thế nagraveo lập luận chiacutenh saacutech hoặc caacutec quy tắc

4 Thu thập Tri thức hệ chuyecircn gia Hầu hết caacutec phương phaacutep đều bắt đầu với mocirc higravenh của caacutec taacutec vụ trong đoacute

hệ chuyecircn gia được xacircy dựng Trong đoacute mocirc tả về caacutec lĩnh vực được tạo ra Caacutec kỹ sư sử dụng caacutec mocirc higravenh giả thuyết vagrave nhận thức về quaacute trigravenh phacircn

tiacutech để gợi ra caacutech giải quyết vấn đề về tri thức từ caacutec chuyecircn gia

5 Caacutec chiều của thu thập tri thức KE- driven caacutec kỹ sư trao đổi trực tiếp với caacutec chuyecircn gia Expert-driven Caacutec chuyecircn gia trực tiếp đưa chuyecircn mocircn của họ vagraveo hệ

thống maacutey tiacutenh Machine-driven Sử dụng caacutec cocircng cụ suy luận để triacutech xuất tri thức từ một

tập caacutec viacute dụ

6 Kỹ thuật thu thập tri thức Trao đổi gồm 2 loại cơ bản lagrave coacute cấu truacutec(coacute kịch bản) vagrave khocircng coacute cấu

truacutec( đối thoại trực tiếp) Giao thức phacircn tiacutech bằng lời Khi caacutec chuyecircn gia thực hiện một cocircng việc

của họ thigrave một bản ghi về cocircng việc đoacute được thực hiện Caacutec kỹ sư sẽ xacircy dựng mocirc higravenh cho những gigrave được ghi lại trong bản ghi

Phương phaacutep sagraveng lọc caacutec chuyecircn gia so saacutenh caacutec nhoacutem liecircn tiếp trong ba đối tượng vagrave cho biết tại sao nhoacutem thứ hai lại khaacutec nhoacutem thứ ba

7 Thu thập tri thức từ nhiều nguồn Thu thập tri thức từ nhiều nguồn lagrave cần thiết để coacute được đầy đủ caacutec tri thức

cho một vấn đề quan điểm yacute kiến traacutei ngược nhau thường phaacutet sinh Phương phaacutep đồng thuận sẽ giuacutep giải quyết được vấn đề macircu thuẫn Kỹ thuật phacircn tiacutech Meta lagrave kỹ thuật được aacutep dụng trong caacutec trường hợp

khaacutec Caacutech tiếp cận bằng định lượng đogravei hỏi caacutec kỹ sư cần cacircn nhắc yếu tố đầu vagraveo của caacutec chuyecircn gia khaacutec nhau

8 Xaacutec nhận hợp lệ vagrave kiểm tra tri thức Một khi thu thập tri thức noacute phải được đaacutenh giaacute về khả năng sử dụng vagrave độ

chiacutenh xaacutec Hai vấn đề cụ thể lagrave hiệu lực của những kiến thức vagrave kiểm tra việc xacircy dựng cơ sở của tri thức

Cần xaacutec nhận xem liệu hệ thống coacute thể hoạt động ở mức độ tối thiểu khocircng

Xaacutec minh liecircn quan đến việc so saacutenh từng chi tiết kỹ thuật của hệ thống những gigrave đatilde được thực hiện cuối cugraveng

9 Một số caacutec biện phaacutep xaacutec nhận Độ chiacutenh xaacutec Khả năng thiacutech nghi Mức độ đầy đủ Bề rộng Độ sacircu Hiệu lực Tổng quan Chiacutenh xaacutec Hiện thực Độ tin cậy Tiacutenh hữu dụng Mức độ

Chương 9 Học maacutey

1 Logic mờ vagrave ngocircn ngữ mờ(Fuzzy Logic and Linguistic Ambiguity)

Ngocircn ngữ tự nhiecircn gồm những khaacutei niệm mơ hồ vagrave khocircng chiacutenh xaacutectruyền tải ngữ nghĩa thocircng qua tiacutenh xấp xỉkhocircng rotilde ragraveng

Những xấp xỉ nagravey giuacutep con người coacute thể truyền tải hết được yacute nghĩa nhưng maacutey thigrave khocircng hiểu

Lagravem sao biểu diễn caacutec tri thức sử dụng caacutec khaacutei niệm khocircng rotilde ragraveng(mờ) hoặc khocircng chiacutenh xaacutec

2 Khaacutei niệm cơ bản của logic mờ tập mờ lagrave những tập hợp khocircng coacute một giới hạn rotilde Mỗi phần tử của noacute chỉ

chứa một mức độ hagravem liecircn thuộc của từng phần tử Vigrave vậy tập mờ khocircng giống như tập cổ điển Tập mờ coacute thể kết hợp với nhau qua những luật mờ magrave đặc trưng cho những hagravenh động trạng thaacutei vagrave thuộc tiacutenh của logic mờ được tận dụng khi thực hiện một bộ điều khiển mờ

Logic mờ dựa trecircn yacute tưởng mỗi phần tử thuộc vagraveo một tập hợp ở một mức độ nagraveo đấy

Locircgic mờ cho pheacutep độ liecircn thuộc (microA )coacute giaacute trị trong khoảng (01) Locircgic mờ coacute thể được coi lagrave mặt ứng dụng của lyacute thuyết tập mờ để xử lyacute caacutec

giaacute trị trong thế giới thực cho caacutec bagravei toaacuten phức tạp

3 So saacutenh tiacutenh đuacuteng đắn logic mờ vagrave xaacutec suất Xaacutec suất thigrave đề cập đến khả năng xảy ra một biến cố hay một điều gigrave đoacute Logic mờ đề cập đến cấp độ magrave đặc tiacutenh ở hiện tại

o viacute dụ1 người coacute chiều cao 6 feet thigrave coacute cấp độ lagrave 05 về chiều cao

4 Ưu điểm của logic mờ Caacutech tiếp cận rất tự nhiecircnkhocircng phức tạp Coacute thể mocirc higravenh hoacutea caacutec hagravem phi tuyến tugravey yacute phức tạp

Coacute thể tận dụng được kinh nghiệm từ những chuyecircn gia hagraveng đầu trong mọi lĩnh vực

Logic mờ được xacircy dựng dựa trecircn ngocircn ngữ tự nhiecircnNền tảng của logic mờ lagrave dựa trecircn cơ sở giao tiếp của con người

5 Nhược điểm của logic mờ Trong 1 hệ thống phức tạpsử dụng logic mờ coacute thể trở thagravenh trở ngại cho

việc xaacutec thực độ tin cậy của hệ thống Cơ chế lập luận mờ khocircng thể học hỏi từ những lỗi sai

6 Mạng noron nhacircn tạo(ANN) Mạng noron nhacircn tạo lagrave một mocirc phỏng xử lyacute thocircng tinđược nghiecircn cứu ra

từ hệ thống thần kinh của sinh vậtgiống như bộ natildeo để xử lyacute thocircng tin ANNs lagrave chương trigravenh dựa trecircn maacutey tiacutenh đơn giản coacute chức năng lagrave một mocirc

higravenh bagravei toaacuten khocircng gian dựa trecircn thử nghiệm vagrave baacuteo lỗi

7 Học từ kinh nghiệm Tiến trigravenh Một mẫu dữ liệu được biểu diễn như một mạng lưới noronANN ldquodự

đoaacutenrdquo 1 đầu radự đoaacuten được so saacutenh với giaacute trị thực tế hoặc giaacute trị chiacutenh xaacutecNếu đoaacuten được chiacutenh xaacutec thigrave khocircng coacute hagravenh động nagraveo được thực hiện

Nếu dự đoaacuten sai ANN kiểm tra lại vagrave xaacutec định lại thocircng số để điều chỉnh Một mẫu dữ liệu khaacutec được biểu diễn vagrave quaacute trigravenh nagravey được lặp lại

8 Nguyecircn tắc cơ bản của cocircng nghệ nơron Caacutec yếu tố xử lyacute cơ bản trong hệ thống thần kinh của con người lagrave tế bagraveo

thần kinhMạng lưới của tế bagraveo nagravey lagrave liecircn kết với nhau nhận được thocircng tin từ caacutec cảm biến trong mắt taihellip

Thocircng tin nhận được bởi tế bagraveo thần kinh hoặc lagrave sẽ kiacutech thiacutech noacute(sẽ được chuyển qua 1 thocircng điệp dọc theo mạng lưới) hoặc lagrave sẽ ngăn cản noacute(ngăn cản dograveng thocircng tin)

Độ nhạy coacute thể thay đổi qua thời gian hoặc sau khi coacute được kinh nghiệm

9 Cấu truacutec mạng Một ANN gồm 3 lớp cơ bản

Lớp đầu vagraveo nhận dữ liệu Lớp becircn trong hoặc lagrave lớp ẩn xử lyacute dữ liệu Lớp đầu ra chuyển tiếp kết quả cuối cugraveng của mạng

10Mạng nơ ron Thường coacute nhiều đầu vagraveo mỗi đầu vagraveo với mức ảnh hưởng vagrave tầm quan

trọng riecircng của noacute Một đầu vagraveo quan trọng coacute thể được sử dụng để khuếch đại đầu ra caacutec hagravem trạng thaacutei tổng hợp caacutec trọng số của caacutec yếu tố

đầuvagraveo khaacutec nhauvagraveo một giaacute trị duy nhất Caacutec hagravem chuyển giao xử lyacute caacutec giaacute trị trạng thaacutei vagrave tạo đầu ra

11Huấn luyện mạng nơ ron Trong mocirc higravenh coacute giaacutem saacutetANN được đến so saacutenh dự đoaacuten của chiacutenh

noacute với thocircng tin phản hồi coacute chứa caacutec kết quả mong muốn ANN sẽ phải tigravem caacutech thay đổi caacutec tham số becircn trong củamigravenh (caacutec trọng số vagrave caacutec ngưỡng) để tạo necircn một aacutenh xạ coacute khả năng aacutenh xạcaacutec đầu vagraveo thagravenh caacutec đầu ra mong muốn Sự thay đổi nagravey được tiến hagravenh nhờ việc so saacutenh giữa đầu ra thực sự vagrave đầu ra mong muốn

Trong mocirc higravenh khocircng coacute giaacutem saacutetANN nhận được dữ liệu vagraveo nhưng khocircng phải coacute bất kỳ thocircng tin phản hồi về kết quả mong muốn

Phần lớn caacutec ứng dụng nằm trong vugraveng của caacutec bagravei toaacuten ước lượng như mocirc higravenh hoacuteathống kecirc neacuten lọc phacircn cụm

12Lợi iacutech Liecircn kết với mạng noron Traacutenh caacutech lập trigravenh tường minh Giảm nhu cầu của chuyecircn gia ANNs thigrave thiacutech nghi với caacutec yếu tố đầu vagraveo thay đổi Khocircng cần thiết cho cơ sở tri thức tinh chế ANNs coacute tiacutenh động vagrave cải thiện với việc sử dụng Coacute khả năng xử lyacute dữ liệu khocircng chiacutenh xaacutec hoặc khocircng đầy đủ Cho pheacutep tổng quaacutet hoacutea từ thocircng tin cụ thể Cho pheacutep thu thập cảm giaacutec thocircng thường vagraveo miền giải quyết vấn đề

13Hạn chế của việc liecircn kết với mạng noron ANNs khocircng thể giải thiacutech được suy luận Bản chất hộp đen thường khiến cho vấn đề traacutech nhiệm vagrave độ tin cậy phaacutet

sinh lagrave khoacute khăn Lặp đi lặp lại quaacute trigravenh huấn luyện rất tốn thời gian Nguồn lực caacutec nhagrave phacircn tiacutech vagrave thiết kế coacute tay nghề cao vẫn lagrave đaacuteng lo

ngại Cocircng nghệ ANN thuacutec đẩy hạn chế của phần cứng hiện tại ANN yecircu cầu phải coacute sự tin tưởng ở đầu ra

14Giới thiệu về thuật toaacuten di truyền Cũng như mạng lưới thần kinh caacutec thuật toaacuten di truyền được dựa trecircn lyacute

thuyết sinh học Thuật toaacuten di truyền tigravem thấy nguồn gốc của chuacuteng trong caacutec lyacute thuyết

tiến hoacutea của chọn lọc tự nhiecircn vagrave thiacutech ứng với biến đổi khiacute hậu Kết quả thuật toaacuten di truyền lagrave từ giao phối 2 caacute thể trong quần thế để tạo

ra con caacutei đocirci khi tốt hơn so với bậc cha mẹ của chuacuteng 15Caacutec thagravenh phần cơ bản của thuật toaacuten di truyền

Toaacuten tử chọn lọc Caacutec caacute thể tốt được chọn lọc để đưa vagraveo thế hệ sau Sự chọn lọc nagravey căn cứ vagraveo độ thiacutech nghi với mocirci trường của mỗi caacute thể

Toaacuten tử lai gheacutep (crossover) Hai caacute thể cha vagrave mẹ trao đổi caacutec gen với nhau để tạo ra caacute thể con

Toaacuten tử đột biến (mutation) Một caacute thể thay đổi một số gen để biến đổi thagravenh một caacute thể mớiTất cả caacutec toaacuten tử trecircn khi thực hiện đều mang tiacutenh ngẫu nhiecircn

16Quaacute trigravenh cơ bản của một thuật toaacuten di truyền Khởi tạo

Đaacutenh giaacute quần thể

Lựa chọn NST thiacutech hợp nhất vagrave loại bỏ NST yếu nhất

Quy trigravenh giao nhau vagrave cải thiện quần thể

đột biến tiến trigravenh để khaacutem phaacute ra NST mới

17Ưu nhược điểm của việc kết hợp với thuật toaacuten di truyền Kiacutech thước quần thể lagrave 1 yếu tố quan trọng trong tốc độ của việc tigravem

kiếmnhưng noacute tương đối dễ dagraveng để dự đoaacuten tốc độ nagravey Giao nhau hoặc đột biến lagrave khocircng necircn đc sử dụng quaacute thường xuyecircn Luocircn coacute được iacutet nhất 1 giải phaacutep hợp lyacute Necircn coacute thể aacutep dụng chuacuteng cho caacutec vấn đề magrave chuacuteng ta khocircng coacute hướng

về caacutech giải quyết Sức mạnh của thuật toaacuten xuất phaacutet từ khaacutei niệm đơn giảnkhocircng phải từ

một thủ tục thuật toaacuten phức tạp 18Tương lai của học maacutey

Mạng lưới thần kinh nhacircn tạo vượt quaacute năng lực của con người trong caacutec trường hợp bị cocirc lập

Về mặt lyacute thuyếtmột maacutey tiacutenh coacute thể xử lyacute dũ liệu nhanh hơn hagraveng triệu lần so với 1 con người

May mắn thay cho chuacuteng tacon người tốt hơn nhiều khi magrave coacute được dữ liệumaacutey tiacutenh khocircng coacute 1 số thứ như lagrave 5 giaacutec quan

CHƯƠNG 10 KHO DỮ LIỆU

1 Kho dữ liệu Kho dữ liệu lagrave tuyển tập caacutec cơ sở dữ liệu tiacutech hợp hướng chủ đề được

thiết kế để trợ giuacutep cho một hệ hỗ trợ quyết định

Theo John Ladley Cocircng nghệ kho dữ liệu lagrave tập caacutec phương phaacutep kỹ thuật vagrave caacutec cocircng cụ coacute thể kết hợp hỗ trợ nhau để cung cấp thocircng tin cho người sử dụng trecircn cơ sở tiacutech hợp từ nhiều nguồn dữ liệu nhiều mocirci trường khaacutec nhau

Kho dữ liệu thường rất lớn tới hagraveng trăm GB hay thậm chiacute hagraveng Terabyte

2 Kho dữ liệu vận hagravenh (ODS) Một kho dữ liệu vận hagravenh Aacutep dụng kỹ thuật kho dữ liệu vagraveo caacutec hệ xử

lyacute giao taacutec lưu trữ dữ liệu cho một ứng dụng đặc thugrave Noacute đưa vagraveo kho dữ liệu một dograveng caacutec dữ liệu thocirc được thiết kế

3 So saacutenh

Kho dữ liệu vận hagravenh Kho dữ liệu

Dữ liệu theo chủ đề Dữ liệu theo chủ đề

Dữ liệu tiacutech hợp Dữ liệu tiacutech hợp

Dữ liệu thay đổi Dữ liệu khocircng thay đổi

Dữ liệu được cập nhật khi thay đổi

Dữ liệu giữ nguyecircn

Chỉ coacute dữ liệu hiện tạiDữliệu hiện tại vagrave dữ liệu lịch sử

Chu kỳ lagravem tươi dữ liệu ngắn Chu kỳ lagravem tươi dữ liệu dagravei

Chỉ coacute dữ liệu chi tiết Dữ liệu chi tiết vagrave dữ liệu tổng kết

Dugraveng cho caacutec quyết định ngắn hạn

Dugraveng cho hoạch định dagravei hạn

4 Kho dữ liệu cục bộ (Data Mart - DM)

Kho dữ liệu cục bộ lagrave CSDL coacute những đặc điểm giống với kho dữ liệu nhưng với quy mocirc nhỏ hơn vagrave lưu trữ dữ liệu về một lĩnh vực một chuyecircn ngagravenh

Data mart phụ thuộc Chứa những dữ liệu được lấy từ DW vagrave những dữ liệu nagravey sẽ được triacutech lọc vagrave tinh chế tiacutech hợp lại ở mức cao hơn để phục vụ một chủ đề nhất định của Datamart

Data mart độc lập Khocircng giống như Datamart phụ thuộc Data mart độc lập được xacircy dựng trước DW vagrave dữ liệu được trực tiếp lấy từ caacutec nguồn khaacutec nhau

5 Siecircu dữ liệu Metadata lagrave dữ liệu để mocirc tả dữ liệu Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột

một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi Metadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu

6 Mocirci trường kho dữ liệu Hệ thống của tổ chức vagrave kho cung cấp dữ liệu để xacircy dựng kho dữ liệu Trong quaacute trigravenh chuyển dữ liệu từ caacutec nguồn khaacutec nhau dữ liệu coacute thể

được lagravem sạch hoặc chuyển đổi vagrave vigrave thế DW được xem như lagrave một chuẩn cho việc lưu trữ

Đồng thời siecircu dữ liệu được ghi lại Cuối cugraveng DW hoặc siecircu thị coacute thể được sử dụng để tạo ra một kho dữ

liệu ldquocaacute nhacircnrdquo 7 Caacutec đặc điểm của kho dữ liệu

Đặc điểm Mocirc tả

Hướng chủ đề - DL tổ chức theo caacutech thức người dugraveng tham chiếu

Tiacutech hợp - Dữ liệu ldquosạchrdquo loại bỏ tiacutenh thiếu nhất quaacuten

Khocircng thay đổi - DL ldquochỉ đọcrdquo người dugraveng khocircng thay đổi được

Chuỗi thời gian - DL lagrave chuỗi thời gian khocircng phải lagrave trạng thaacutei hiện tại

Được tổng kết - DL vận hagravenhthao taacutec khi cần thiết

được kết hợp lại thagravenh dạng coacute thể dugraveng được cho quyết định

Kiacutech cỡ lớn hơn - Lưu giữ theo chuỗi thời gian tức lagrave giữ lại nhiều DL

Khocircng được chuẩn hoacutea - Coacute thể dư thừa DLSiecircu dữ liệu - Dữ liệu của dữ liệu được lưu trữNguồn dữ liệu - DL vận hagravenh (caacutec hệ sẵn coacute) cugraveng

với caacutec nguồn ngoagravei 8 Kho dữ liệu hướng chủ đề

Hướng chủ để coacute nghĩa lagrave kho dữ liệu được tổ chức xung quanh caacutec chủ đề chiacutenh như khaacutech hagraveng sản phẩm sản xuất Tập trung vagraveo việc mocirc higravenh hoacutea vagrave phacircn tiacutech dữ liệu cho caacutec nhagrave ra quyết định magrave khocircng tập trung vagraveo caacutec xử lyacute thocircng thường Cung cấp cho người dugraveng một khung nhigraven toagraven vẹn đơn giản vagrave đầy đủ về caacutec sự kiện quanh caacutec chủ đề

9 Dữ liệu trong DW được tiacutech hợp Dữ liệu trong kho dữ liệu được xacircy dựng bằng caacutech tổng hợp dữ liệu từ

nhiều nguồn khaacutec nhau vagrave caacutec nguồn coacute tổ chức khaacutec nhau Cơ sở dữ liệu caacutec file excel caacutec flat file hoặc caacutec raw file Khi đưa vagraveo kho dữ liệu caacutec dữ liệu được lagravem sạch vagrave tiacutech hợp dữ liệu nhằm đảm bảo tiacutenh nhất quaacuten của dữ liệu

10Kiến truacutec kho dữ liệu Tầng cơ sở dữ liệu hoạt động Tầng truy xuất thocircng tin Tầng truy xuất dữ liệu Tầng siecircu dữ liệu Tầng quản lyacute tiến trigravenh Tầng thocircng điệp của ứng dụng Tầng vật liacute của kho dữ liệu Tầng trigravenh diễn dữ liệu

11Higravenh trạng kho dữ liệu Kho dữ liệu ảo - người dugraveng cuối coacute thể truy cập trực tiếp đến kho dữ liệu

sử dụng caacutec cocircng cụ cho pheacutep ở tầng truy xuất dữ liệu Kho dữ liệu trung tacircm-1 cơ sở dữ liệu vật lyacute chứa tất cả dữ liệu cho một

vugraveng chuyecircn dụng nagraveo đoacute

Kho dữ liệu phacircn taacuten- Thagravenh phần được phacircn taacuten qua nhiều hệ cơ sở dữ liệu vật lyacute

12METADATA- Siecircu dữ liệu Định nghĩa Siecircu dữ liệu lagrave dữ liệu về dữ liệu Lagrave 1 lưu trữ dugraveng để

Miecircu tả kho dữ liệu tổng thể Nhận dạng kiểu kho dữ liệu Quản liacute quaacute trigravenh tiacutech hợp dữ liệu Quản liacute quaacute trigravenh cập nhật kho dữ liệu Quản liacute bảo mật

Lagrave chigravea khoacutea quyết định sự thagravenh cocircng của kho dữ liệu luocircn được thay đổi vagrave cập nhật theo sự phaacutet triển của kho dữ liệu

Dugraveng để quản liacute điều khiển kho dữ liệu Sự ra đời của kho dữ liệu như 1 cấu truacutec hỗ trợ ra quyết định siecircu dữ liệu

được xem như nguồn tagravei nguyecircn dữ liệu Siecircu dữ liệu lagrave trừu tượng Chuacuteng lagrave dữ liệu bậc cao cung cấp mocirc tả ngắn

gọn caacutec dữ liệu bậc thấp hơn 13Hoạt động của Siecircu dữ liệu

Siecircu dữ liệu rất cần thiết trong việc chuyển hoacutea thocircng tin trở thagravenh tri thức Lagrave chigravea khoacutea giuacutep chuacuteng ta xử lyacute được dữ liệu thocirc Viacute dụ một dograveng dữ liệu baacuten hagraveng 1023 K596 11121 agraveNoacute sẽ khocircng coacute nghĩa gigrave cho đến khi chuacuteng ta đưa vagraveo siecircu dữ liệu (thư

mục chứa dữ liệu) agrave cửa hagraveng 1023 sản phẩm K596 vagrave số tiền baacuten được lagrave 11121 đocirc la

14Sự cần thiết phải nhất quaacuten trong kho dữ liệu Kho dữ liệu được xacircy dựng cho lợi iacutech của những nhagrave phacircn tiacutech kinh

doanh caacutec nhagrave quản trị cho tất cả caacutec khu vực chức năng Trong cơ sở dữ liệu riecircng caacutec khu vực khaacutec nhau coacute thể định nghĩa vagrave lưu

trữ dữ liệu thocircng qua phiecircn bản của chiacutenh noacute Khi dữ liệu được lấy từ những vugraveng khaacutec nhau đoacute vagrave được đặt vagraveo kho dữ

liệu Việc chuyển đổi vagrave lagravem sạch caacutec tiến trigravenh sẽ đảm bảo noacute lagrave duy nhất được tiacutech hợp tại một mức của tổ chức

15Ragrave soaacutet lại dữ liệu ndash Thực thi siecircu dữ liệu

Bất kể cấu truacutec tự nhiecircn của 1 cacircu truy vấn thế nagraveo thigrave caacutec thagravenh phần của siecircu dữ liệu rất quan trọng đối với người ra quyết định

Bảng thuộc tiacutenh khoacutea được lưu trữ bởi kho dữ liệu Tập hợp dữ liệu được lấy từ đacircu Những chuyển đổi nagraveo được thực thi với việc lagravem sạch

16Siecircu dữ liệu lagrave gigrave Metadata - lagrave thocircng tin mocirc tả nội dung của cơ sở dữ liệu (CSDL) Metadata baacuteo cho người dugraveng biết thời gian cập nhật sau cugraveng của dữ liệu

định dạng vagrave mục điacutech sử dụng của noacute Những thocircng tin nagravey coacute thể hướng dẫn người dugraveng duyệt qua CSDL vagrave

giuacutep họ hiểu được yacute nghĩa vagrave ngữ cảnh của dữ liệu Trong CSDL metadata lagrave caacutec dạng biểu diễn khaacutec nhau của caacutec đối tượng

trong CSDL Trong CSDL quan hệ metadata lagrave caacutec định nghĩa của bảng cột CSDL

view vagrave nhiều đối tượng khaacutec Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột

một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi -gtMetadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu

Bảng chuyển đổi Ghi lại những chuyển đổi đatilde được thực hiện

Lịch sử thực thi Ghi lại những dữ liệu đatilde được

phacircn tiacutech

Higravenh thaacutei kết nốiGhi lại những dữ liệu được kết nối vagrave tần suất

17Aacutenh xạ thocircng thường của siecircu dữ liệu Bản ghi aacutenh xạ chuyển đổi bao gồm

Định danh của nguồn gốc Chuyển đổi thuộc tiacutenh Chuyển đổi thuộc tiacutenh vật lyacute Matilde hoacutea tham chiếu bảng chuyển đổi Đổi tecircn Đổi khoacutea Gaacuten giaacute trị cho thuộc tiacutenh mặc định Chọn logic cho caacutec nguồn nhiều giaacute trị Đổi thuật toaacuten

18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để

phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai

lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave

tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec

Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm

Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo

19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua

caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau

SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được

Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra

một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức

Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ

Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ

Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech

CHƯƠNG 11 KHAI PHAacute DỮ LIỆU

1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn

ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993

Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng

2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd

1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều

2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP

3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn

4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng

5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server

6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo

7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động

8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời

9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều

10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện

11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech

12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP

3 Xử lyacute phacircn tiacutech trực tuyến OLAP

MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave

dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu

ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave

thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu

HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave

ROLAP4 Khai phaacute dữ liệu

Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh

khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn

Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan

5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp

6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại

Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp

Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec

Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt

Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra

Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh

vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho

Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec

Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm

Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục

Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng

gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp

Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn

Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec

Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper

Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2

Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25

Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước

Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng

Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện

trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp

Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute

độ hỗ trợ ge ngưỡng minsup

độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan

Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn

Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết

Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu

MOLAP ROLAP HOLAP

Lưu trữ dữ liệu cơ sở

Khối Bảng quan hệ Bảng quan hệ

Lưu trữ thocircng tin tổng hợp

Khối Bảng quan hệ Khối

Hiệu suất thực hiện truy vấn

Nhanh nhất Chậm nhất Nhanh

Tiecircu thụ khocircng gian lưu trữ

Nhiều Thấp Trung bigravenh

Chi phiacute bảo trigrave Cao Thấp Trung bigravenh

Page 3: De cuong(1-11)

Cơ sở mocirc higravenh lagrave một biến thể của CSDL Noacute lưu trữ vagrave tổ chức caacutec mocirc higravenh khaacutec nhau magrave DSS sử dụng khi phacircn tiacutech chuacuteng

MBMS lagrave biến thể của DBMS Cơ sở mocirc higravenh chiacutenh lagrave caacutei thể hiện sự khaacutec biệt của một DSS với caacutec hệ

thống thocircng tin khaacutec Tổng quan chức năng của MBMS

Modeling language ndash Cho pheacutep tạo lập caacutec mocirc higravenh quyết định vagrave cung cấp cơ chế liecircn kết nhiều mocirc higravenh để tạo mocirc higravenh phức tạp hơn Model library ndash Lưu trữ vagrave quản lyacute tất cả caacutec mocirc higravenh cung cấp một catalog cugraveng với mocirc tả Model manipulation ndash Cho pheacutep quản lyacute vagrave xử lyacute cơ sở mocirc higravenh với caacutec chức năng (run store query etc) tương tự như caacutec chức năng trong một DBMS

5Cơ sở tri thức của DSS Mọi quyết định đuacuteng đắn đều đogravei hỏi quaacute trigravenh lập luận vagrave quaacute trigravenh nagravey lại

đogravei hỏi thocircng tin Cơ sở tri thức lagrave nơi lưu trữ tất cả caacutec thocircng tin dạng nagravey trong DSS Tri thức coacute thể đơn giản chỉ lagrave caacutec thocircng tin thocirc caacutec quy tắc caacutec heuristics

caacutec ragraveng buộc hoặc kết quả của quaacute khứ Tri thức nagravey khaacutec với thocircng tin cả trong CSDL vagrave cơ sở mocirc higravenh ở chỗ noacute

mang đặc trưng của bagravei toaacuten Nội dung kiến thức cơ sở

Tri thức trong cơ sở tri thức coacute thể được phacircn lagravem 2 loại Facts thể hiện điều chuacuteng ta coi lagrave đuacuteng tại thời điểm cho trước Hypotheses thể hiện caacutec quy tắc hoặc caacutec quan hệ magrave chuacuteng ta tin lagrave tồn tại giữa caacutec facts

Kiến thức thu nhận vagrave truy hồi Một hoặc một vagravei người sẽ thu thập thocircng tin cho cơ sở tri thức Đacircy lagrave những

người được đagraveo tạo đặc biệt về caacutec kỹ thuật để thu thập thocircng tin từ caacutec chuyecircn gia lĩnh vực

Mocirc tơ suy diễn (inference engine) lagrave một phần của cơ sở tri thức Noacute aacutep dụng caacutec quy tắc để lấy ra thocircng tin dưới dạng magrave người dugraveng mong muốn

6Giao diện người dugraveng Giao diecircn người dugraveng lagrave một thagravenh phần được thiết kế để cho pheacutep người

dugraveng truy cập tới caacutec thagravenh phần becircn trong của hệ thống

Thocircng thường giao diện cagraveng gần gũi thigrave cagraveng iacutet đogravei hỏi việc huấn luyện người dugraveng Hatildey suy nghĩ xem coacute bao nhiecircu chương trigravenh Windows dugraveng cugraveng cấu truacutec menu như Microsoft Word

Caacutec chức năng chiacutenh của một giao diện của DSS Communication language vagrave Presentation language

Communication language ndash Cho pheacutep tương taacutec với DSS theo nhiều caacutech xaacutec định caacutec dạng input cung cấp caacutec hỗ trợ cho người dugraveng thu giữ caacutec hội thoại đatilde qua để cải thiện caacutec tương taacutec trong tương lai

Presentation language ndash Cung cấp khả năng thể hiện dữ liệu theo nhiều caacutech cho pheacutep sinh caacutec baacuteo caacuteo chi tiết cung cấp nhiều khung nhigraven khaacutec nhau về dữ liệu

7Vai trograve người dugraveng Trong một DSS người dugraveng cũng lagrave một thagravenh phần của hệ thống giống như

hardware vagrave software User roles Người dugraveng được phacircn thagravenh 5 lớp (decision maker

intermediary maintainer operator and feeder) Patterns of DSS use Lagrave sự phacircn loại tiến theo của caacutec user roles khaacutec nhau

thagravenh 1 trong 4 basic patterns of use Slide tiếp theo sẽ mocirc tả caacutec patterns nagravey

8Caacutec mocirc higravenh sử dụng DSS Subscription mode _nhagrave sản xuất quyết định nhận caacutec baacuteo caacuteo thường

xuyecircn theo dự kiến Terminal mode_ nhagrave sản xuất quyết định tương taacutec trực tiếp với DSS Clerk mode - nhagrave sản xuất quyết định sử dụng hệ thống trực tiếpnhưng

khocircng trực tuyến Đầu ra phản hồi coacute thể mất một thời gian Intermediary mode - nhagrave sản xuất quyết định tương taacutec thocircng qua việc sử

dụng mộthoặc nhiều mocirc higravenh trung gian9Danh mục vagrave lớp của DSSCoacute nhiều phương phaacutep để cố gắng phacircn loại caacutec DSSs

Data-centric and model-centric Formal and ad hoc systems Directed versus nondirected DSSs Procedural and nonprocedural systems Hypertext systems Spreadsheet systems Individual and group DSSs

Caacutec đặc trưng thống nhất của mỗi lược đồ cụ thể giữ vai trograve quan trọng trong việc xaacutec định caacutech tiếp cận tốt nhất để thiết kế một hệ thống mới

Chương 2Quyết định vagrave quyết định của nhagrave sản xuất10Quaacute trigravenh ra quyết định

Quaacute trigravenh ra quyết định gồm coacute 3 giai đoạn (Simon 1977)bull Tigravem hiểu bagravei toaacuten dẫn đến quyết định

+Xaacutec định mục tiecircu tổ chức+Tigravem kiếm vagrave tập hợp dữ liệu+Nhận diện xaacutec định chủ thể bagravei toaacuten+phacircn loại vagrave phaacutet biểu vấn đề

bull Thiết kế (design) phacircn tiacutech vagrave xacircy dựng caacutec diễn trigravenh hagravenh động+Thiết lập mocirc higravenh+Lập bảng tiecircu chuẩn chọn lựa+Tigravem kiếm caacutec phương aacuten+Tiecircn đoaacuten vagrave đo lường caacutec kết cục

bull Chọn lựa (choice) chọn một diễn trigravenh trong tập diễn trigravenh+Giải phaacutep cho mocirc higravenh+Phacircn tiacutech độ nhạy+Chọn (caacutec) phương aacuten tốt nhất+Hoạch định việc hiện thực

tiếp theo giai đoạn chọn lựa lagrave giai đoạn hiện thực (implementation)11Người ra quyết định

Người ra quyết định (decision maker) giữ một vai trograve tacircm thần phacircn liệt vigrave vừa được coi lagrave một bước trong quaacute trigravenh vagrave cũng lại lagrave người tham gia

Phacircn lớp người ra quyết định-Quyết định caacute nhacircn coacute thể lagrave 1 người hoặc một hệ thống maacutey tiacutenh đơn lẻ-Nhiều người ra quyecirct định coacute thể lagrave

+Nhoacutem (group)trong đoacute mọi thagravenh viecircn đều coacute tiếng noacutei trong việc ra quyết định

+Đội(team) Caacutec thagravenh viecircn hỗ trợ một người ra quyết định duy nhất+Tổ chứcTrong đoacute cần sự thỏa thuận chung

12Caacutec kiểu ra quyết định Style lagrave caacutech magrave người quản lyacute ra quyết định

Hiệu lực của mỗi style riecircng biệt phụ thuộc vagraveo ngữ cảnh bagravei toaacuten nhận thức của người ra quyết định vagrave tập caacutec giaacute trị caacute nhacircn của bản thacircn họ

Độ phức tạp của caacutec điều đoacute liecircn kết lại với nhau trong việc higravenh thagravenh decision style

Caacutec kiểu ra quyết định Directive ndash kết hợp đogravei hỏi về cấu truacutec bagravei toaacuten cao với mức độ nhập nhằng thấp

Thocircng thường đacircy lagrave caacutec quyết định coacute bản chất kỹ thuật vagrave đogravei hỏi iacutet thocircng tin Analytical ndash Mức độ nhập nhằng lớn hơn vagrave đogravei hỏi nhiều thocircng tin hơn Conceptual ndash Mức độ nhập nhằng cao vagrave thường gần gũi với caacutech ra quyết định

của con người Behavioral ndash đogravei hỏi lượng dữ liệu nhỏ vagrave thể hiện caacutei nhigraven ngắn hạn Thường

xảy ra xung đột necircn phải dựa vagraveo sự đồng thuận Caacutec kiểu ra quyết định trong thiết kế hệ trợ giuacutep quyecirct định

Những cản trở lớn chiacutenh lagrave phản ứng của người ra quyết định trước aacutep lực vagrave phương phaacutep dugraveng để giải bagravei toaacuten

Viacute dụ đối với những người khocircng chịu được aacutep lực trong dạng directive thigrave giao diện cần cho pheacutep người ra quyết định kiểm soất được hệ thống với khocircng coacute quaacute nhiều dữ liệu đầu vagraveo

Đối với kiểu analytic DSS cần cho pheacutep truy cập tới nhiều nguồn dữ liệu magrave người ra quyết định sẽ phacircn tiacutech

13Khoacute khăn khi xacircy dựng DSS

- Thocircng tin mocirc higravenh cấu truacutec -gt iacutet thocircng tin

- Khả năng của con người (khả năng hiểu biết) chỉ xử lyacute được từ 5-gt9 quaacute trigravenh thocircng tin khaacutec nhau

- Khocircng chắc chắn ( mức độ hoagraven thagravenh vagrave tiacutenh chiacutenh xaacutec)

- Coacute nhiều lựa chọn vagrave đa mục tiecircu

Chương 3Quyết định trong tổ chức

14Tổ chức lagrave gigrave Tổ chức Lagrave 1 hệ thống thống nhất caacutec nguồn tagravei nguyecircnĐược cấu thagravenh bởi caacutec

hệ thống nhỏ hơn ragraveng buộc với nhau bởi caacutec mục tiecircu đề ra

Tổng thể 1 tổ chức sẽ mạnh mẽ hơn rất nhiều so với tất cả caacutec thagravenh phần của noacute cộng lại

Mối liecircn hệ của caacutec quyecirct định Mục điacutech chiacutenh của caacutec tổ chức lagrave đưa ra caacutec quyết định trong mocirci trường kinh doanh Caacutec Quyết định phải phugrave hợp với giới hạncaacutec chiacutenh saacutech caacutec thủ tục vagrave lĩnh vực hoạt động Noacute khocircng phụ thuộc vagraveo người đưa ra quyết định lagrave ai Đoacute coacute thể lagrave 1 caacute nhacircn1 nhoacutem hay thậm chiacute DSSs

Độ đo của quyết địnhNăm khiacutea cạnh ảnh hưởng tới Quyết định

Kết cấu nhoacutem (Group Structure) Vai trograve trong nhoacutem(Group Roles) Quaacute trigravenh lagravem việc(Group Processes) Taacutec phong(Group Style) Quy tăc nhoacutem(Group Norm)

Kết cấu nhoacutem Trong 1 nhoacutem chuẩn caacutec thagravenh viecircn coacute traacutech nhiệm vagrave thẩm quyền ra quyết định như nhau Vai trograve trong nhoacutemTrong nhoacutem caacutec thagravenh viecircn đều coacute vai trograve riecircng vagrave

lagrave 1 phần quan trong trong cả tiến trigravenh Quaacute trigravenh lagravem việcQuaacute trigravenh dugraveng người trong nhoacutem ảnh hưởng tới loại

quyết định gacircy hiệu quả vagrave ảnh hưởng tới cả tiến trigravenh Taacutec phong Coacute phải taacutec phong của người ra quyết định coacute ảnh hưởng tới

chất lượng quyết định cuối khocircng Quy tắc nhoacutemQuy tắc nhoacutem lagrave cực kỳ quan trọng trong việc xaacutec định

hagravenh vi caacutec thagravenh viecircn nhoacutem trong caacutec tigravenh huống xatilde hội Phacircn cấp quyết định trong tổ chức3 cấp

Chiến lược Ban latildenh đạo cấp cao hoặc nhagrave quản lyacute Caacutec quyết định mang tiacutenh lacircu dagravei nhất

Chiến thuật Quản lyacute tầm trung Thực thi caacutec quyết định chiến lược đề ra

Thực hiện

Caacute nhacircn chuyecircn ngagravenh Tự đưa ra caacutec quyết định từng ngagravey

15Năng lực của hệ HTQD

1 HHTQĐ cơ bản hỗ trợ caacutec nhagrave ra quyết định trong caacutec tigravenh huống nửa cấu truacutec vagrave phi cấu truacutec bằng caacutech kết hợp phaacuten xử của con người vagrave xử lyacute thocircng tin bằng maacutey tiacutenh Caacutec bagravei toaacuten như vậy khocircng thểkhocircng thuận tiện giải quyết được chỉ bằng caacutec cocircng cụ maacutey tiacutenh hoacutea hay caacutec phương phaacutep định lượng 2 Phugrave hợp cho caacutec cấp quản lyacute khaacutec nhau từ cao đến thấp 3 Phugrave hợp cho caacute nhacircn lẫn nhoacutem Caacutec bagravei toaacuten iacutet coacute tiacutenh cấu truacutec thường liecircn đới đến nhiều caacute nhacircn ở caacutec đơn vị chức năng hay mức tổ chức khaacutec nhau cũng như ở caacutec tổ chức khaacutec 4 Hỗ trợ cho caacutec quyết định tuần tự liecircn thuộc được đưa ra một lần vagravei lần hay lặp lại 5 Hỗ trợ cho caacutec giai đoạn của quaacute trigravenh ra quyết định tigravem hiểu thiết kế lựa chọn vagrave hiện thực 6 Phugrave hợp cho một số caacutec phong caacutech vagrave quaacute trigravenh ra quyết định 7 Coacute thể tiến hoacutea theo thời gian Người dugraveng coacute thể thecircm bỏ kết hợp thay đổi caacutec phần tử cơ bản của hệ thống 8 Dễ dugraveng vagrave thacircn thiện với người dugraveng 9 Nhằm vagraveo nacircng cao tiacutenh hiệu dụng của quyết định (chiacutenh xaacutec thời gian tiacutenh chất lượng) thay vigrave lagrave tiacutenh hiệu quả (giaacute phiacute của việc ra quyết định) 10 Người ra quyết định kiểm soaacutet toagraven bộ caacutec bước của quaacute trigravenh ra quyết định HHTQĐ chỉ trợ giuacutep khocircng thay thế người ra quyết định 11 Người dugraveng cuối cugraveng coacute thể tự kiến tạo vagrave sửa đổi caacutec hệ thống nhỏ vagrave đơn giản 12 Thường dugraveng mocirc higravenh để phacircn tiacutech caacutec tigravenh huống ra quyết định 13 Cung ứng caacutec truy đạt dữ liệu từ nhiều nguồn dạng thức vagrave kiểu khaacutec nhau 14 Coacute thể dugraveng như một cocircng cụ độc lập hay kết hợp với caacutec HHTQĐứng dụng khaacutec dugraveng đơn lẻ hay trecircn một mạng lưới maacutey tiacutenh (intranet extranet) bất kỳ với cocircng nghệ WEB

16Văn hoacutea tổ chứcVăn hoacutea của tổ chức lagrave tập hợp của rất nhiều thứ (lograveng tin biểu tượng đặc trưng regraven luyện) được phaacutet triển qua thời gian dagravei

Noacute gacircy ra ảnh hưởng mạnh mẽ cograven hơn cả những hoạt động của tổ chức đoacute 10 đặc điểm văn hoacutea của tổ chức

Điều khiển Hệ thống khen thưởng Sự đồng nhất Chịu đựng xung đột Mocirc higravenh giao tiếp Hỗ trợ quản lyacute Sự hogravea nhập Định hướng Chịu đựng rủi ro Caacute nhacircn khởi xướng

Mối quan hệ của văn hoacutea với hiệu năng lagravem việc1 tổ chức thagravenh cocircng phải coacute xu hướng hogravea hợp giữa văn hoacutea với mocirci trường trong vagrave ngoagravei tổ chức

Phugrave hợp trong nội bộ cho thấy một sự kết hợp giữa văn hoacutea của tổ chức với những cocircng nghệ của chiacutenh noacute

Phugrave hợp với becircn ngoagravei cho thấy một nền văn hoacutea phugrave hợp với chiến lược thị trường

Văn hoacutea vagrave sự thay đổi 1 tổ chức magrave khocircng biết thay đổi văn hoacutea sẽ khocircng thể giữ được vị triacute của migravenh trecircn thị trường Caacutec cocircng ty xuất sắc luocircn biết caacutech tiacutech cực tiếp cận khaacutech hagraveng động viecircn đầu tư

17Quyền lực vagrave chiacutenh trịQuyền lực vagrave chiacutenh trị luocircn đi liền với nhau

aQuyền lựclagrave khả năng ảnh hưởng đến việc phacircn phối caacutec nguồn lực trong tổ chứcGồm 5 yếu tố cơ bản

Phacircn quyền Uy quyền Quyền lực caacute nhacircn Sức ảnh hưởng Chiacutenh trị

Một vagravei thagravenh phần của quyền lực ra quyết định Quyết định việc nagraveo coacute sẵn

Quyết định sản phẩm nagraveo được sản xuất Quyết định đầu tư vagraveo đacircu Quyền đặt vagrave quản lyacute quản lyacute giaacute Thanh toaacuten vagrave khấu trừ tiền latildei

bChiacutenh trị Yếu tố cốt lotildei trong quaacute trigravenh higravenh thagravenh chiến lược ra quyết định Chiacutenh trị liecircn quan tới việc ra quyết định thocircng qua đagravem phaacutenảnh hưởngvagrave higravenh

thagravenh sự nhất triacute Trong nhiều trường hợp noacute coacute thể cho ta sự linh hoạt hơn

18Hệ trợ giuacutep quyết định trong tổ chức DSS của 1 tổ chức hỗ trợ cocircng nghệ tập trung vagraveo caacutec quyết định ảnh hưởng tới

rất nhiều người 1 hệ thống DSS hiện đại coacute thể chấp nhận nhiều quyết định vượt qua những giới

hạn phacircn cấp truyền thống aCaacutec hoạt động gần DSS

Giải quyết caacutec nhiệm vụ đặc biệt Thu thập thocircng tin Liecircn lạc qua caacutec chi nhaacutenh Động thaacutei chiacutenh trị

Phacircn loại tư duy chiến lược cho DSS Sắp xếp quyết địnhXếp hạng quyết định sao cho thứ tự đứng trước thigrave được

ưu tiecircn trước Chia sẻ thocircng tinCaacutec quyecirct định coacute thể độc lập nhưng người ra quyết định

phải chia sẻ caacutec thocircng tin liecircn quan Lựa chọn đagravem phaacutenVagravei quyết định coacute thể xaacutec lập thocircng qua đagravem phaacuten vagrave kết

quả được lagravem đồng thờiKhocircng phải cocircng nghệ tự noacute coacute thể đưa ra quyết định magrave noacute nằm ở trigravenh độ cocircng nghệ hỗ trợ caacutec chiến lược quyết định quyền lực vagrave chiacutenh trị cugraveng phối hợp với nhau

Chương 4Mocirc higravenh hoacutea quaacute trigravenh ra quyết định

(Cấu truacutec của hệ HTQD)19Vấn đề Mocirc higravenh

bull Lagrave phần tử chủ chốt trong hầu hết hệ hỗ trợ quyết định vagrave lagrave điều kiện cần trong hệ hỗ trợ quyết định dựa vagraveo mocirc higravenh (model-based DSS)

bull Coacute nhiều lớp mocirc higravenh kegravem theo lagrave caacutec kỹ thuật xử lyacute thao taacutec mocirc higravenh đặc thugrave tương ứng

bull Caacutec vấn đề chiacutenh nhận diện bagravei toaacuten vagrave phacircn tiacutech mocirci trường nhận diện biến số dự baacuteo đa mocirc higravenh caacutec phạm trugrave mocirc higravenh quản lyacute mocirc higravenh vagrave mocirc higravenh hoacutea dựa vagraveo kiến thức

bull Mocirc higravenh hoacutea lagrave taacutec vụ khocircng đơn giản Người xacircy dựng mocirc higravenh phải cacircn bằng giữa tiacutenh đơn giản của mocirc higravenh với caacutec yecircu cầu biểu diễn để mocirc higravenh coacute thể nắm bắt đủ thực tại cần thiết cho người ra quyết định

bull Mocirc phỏng lagrave kỹ thuật mocirc higravenh hoacutea thocircng dụng dugraveng để tigravem hiểu vấn đề tuy khocircng nhất thiết phải tigravem ra được caacutec giải phaacutep biến thể mở rộng quaacute trigravenh ra quyết định của tổ chức vagrave cho pheacutep tổ chức xem xeacutet taacutec độngảnh hưởng của caacutec chọn lựa tương lai

bull Mocirc phỏng tiết kiệm rất nhiều chi phiacute vagrave thời gian ndash rất dễ thay đổi mocirc higravenh hoạt động của một hệ thống vật lyacute bằng mocirc higravenh hoacutea maacutey tiacutenh

bull Mocirc higravenh coacute thể được phaacutet triển vagrave cagravei đặt bằng một số caacutec ngocircn ngữ lập trinh (thế hệ 3 4 ) vagrave hệ thống phần mềm khaacutec nhau

Mocirc higravenh tĩnh vagrave động

bull Mocirc higravenh tĩnh thể hiện bức tranh tại thời điểm của tigravenh huống Caacutec khiacutea cạnh của bagravei toaacuten được xeacutet một thời kỳ nhất định trong một khung thời gian nhất định (coacute thể ldquocuốnrdquo về tương lai) Caacutec tigravenh huống được giả sử lagrave sẽ lập lại với tập caacutec điều kiện đồng nhất

1048713 Giả định coacute được tiacutenh ổn định của dữ liệu 1048713 Mocirc phỏng quaacute trigravenh dạng tĩnh - lagravem việc trecircn caacutec trạng thaacutei ổn định để tigravem ra caacutec

thocircng số tối ưu ndash thường được dugraveng như cocircng cụ chủ yếu để thiết kế quaacute trigravenh 1048713 vd quyết định sản xuấtmua 1 sản phẩm baacuteo caacuteo thu nhập hagraveng quyacutenăm bull Mocirc higravenh động biểu diễn caacutec kịch bản thay đổi theo thời gian 1048713 Phụ thuộc thời gian caacutec trạng thaacutei thay đổi theo thời gian 1048713 Thường dugraveng để tạo sinh vagrave biểu diễn caacutec xu hướng vagrave khuocircn mẫu theo thời gian 1048713 Mocirc phỏng động thể hiện caacutec diễn tiến khi caacutec điều kiện theo thời gian khaacutec với caacutec

trạng thaacutei ổn định ndash thường được dugraveng để thiết kế việc kiểm soaacutet caacutec hệ thống 1048713 VD dự baacuteo lời-lỗ trong 5 năm với caacutec nhập lượng như giaacute phiacute số lượng thay đổi

theo từng năm

Mocirc higravenh chắc chắn tương đối dễ phaacutet triển giải quyết vagrave coacute thể sinh ra caacutec giải phaacutep tối ưu 1048713 Caacutec bagravei toaacuten coacute một số lớnvocirc hạn caacutec giải phaacutep khả thi đặc biệt quan trọng 1048713 Caacutec mocirc higravenh tagravei chaacutenh được xacircy dựng trong điều kiện chắc chắn

Mocirc higravenh bất địnhbằng caacutech thu thập thecircm thocircng tin cố gắng đưa bagravei toaacuten trở về dạng chắc chắn hay dạng

rủi ro Mocirc higravenh rủi ro caacutec quyết định kinh doanh được đưa ra dưới caacutec rủi ro giả định

1048713 Đocirci khi biết được xaacutec suất của caacutec sự kiện xảy ra trong tương lai 1048713 Caacutec trường hợp khaacutec (bất định) ước lượng caacutec rủi ro vagrave giả sử caacutec tigravenh huống rủi ro

xảy ra 20Mocirc higravenh hoacutea

MOcirc HIgraveNH HOacuteA BẰNG BẢNG TIacuteNH bull Bảng tiacutenh phần mềm mạnh linh hoạt vagrave dễ dugraveng cho pheacutep tạo sinh caacutec ứng dụng trong kinh doanh kỹ thuật toaacuten vagrave khoa học với tập caacutec hagravem mạnh về tagravei chaacutenh thống kecirc toaacuten bull Kegravem theo lagrave caacutec thagravenh phần cộng thecircm (add-ins) giuacutep xacircy dựng vagrave giải caacutec lớp mocirc higravenh đặc thugrave bull Lagrave cocircng cụ mocirc higravenh hoacutea thocircng dụng nhất của người dugraveng cuối cugraveng bull Coacute caacutec chức năng về phacircn tiacutech ldquowhat-ifrdquo dograve tigravem mục tiecircu quản lyacute dữ liệu vagrave lập trigravenh (dạng macro) bull Coacute khả năng đọc ghi caacutec cấu truacutec tập tin thocircng dụng để giao tiếp được với caacutec CSDL vagrave cocircng cụ khaacutec bull Coacute thể xacircy dựng mocirc higravenh tĩnh vagrave động bull Dugraveng trecircn maacutey tiacutenh caacute nhacircn vagrave maacutey tiacutenh lớn

bull Cơ sở để xacircy dựng caacutec bảng tiacutenh đa chiều vagrave caacutec cocircng cụ xử lyacute phacircn tiacutech trực tuyến (OLAP) MOcirc HIgraveNH HOacuteA BẰNG PHAcircN TIacuteCH QUYẾT ĐỊNH bull Tiếp cận mocirc higravenh hoacutea caacutec tigravenh huống quyết định coacute một số hữu hạnkhocircng quaacute nhiều caacutec phương aacuten ndash mỗi phương aacuten được trigravenh ra dưới dạng bảng hay đồ thị - caacutec kết quả tương ứng (dự baacuteo được kegravem xaacutec suất) theo mục tiecircu bagravei toaacuten ndash từ đoacute chọn phương aacuten tốt nhất bull Đơn mục tiecircu bảng quyết định hay cacircy quyết định bull Đa mục tiecircu AHP (analytic hierarchy process) khaacutec

MOcirc HIgraveNH HOacuteA BẰNG QUY HOẠCH TOAacuteN

bull Quy hoạch toaacuten học (mathematical programming) lagrave họ caacutec cocircng cụ giải quyết caacutec bagravei toaacuten quản lyacute theo đoacute người ra quyết định phải cấp phaacutet caacutec tagravei nguyecircn khan hiếm cho caacutec hoạt động cạnh tranh nhau (caacutec phương aacuten) nhằm tối ưu hoacutea mục tiecircu coacute khả năng đo lường được bull Caacutec mocirc higravenh quy hoạch tuyến tiacutenh (linear programming) thocircng dụng nhất trong quy hoạch toaacuten coacute nhiều ứng dụng trong thực tế được dugraveng nhiều trong caacutec hệ hỗ trợ quyết định bull Bagravei toaacuten quy hoạch tuyến tiacutenh 1048713 Caacutec biến quyết định (cần tigravem giaacute trị) 1048713 Hagravem mục tiecircu (hagravem toaacuten học dạng tuyến tiacutenh xaacutec định quan hệ giữa biến quyết định vagrave mục tiecircu đo lường mức độ đạt đạt mục tiecircu vagrave cần được tối ưu hoacutea) 1048713 Caacutec hệ số của hagravem mục tiecircu (cho biết mức đoacuteng goacutep vagraveo mục tiecircu của 1 đơn vị biến quyết định) 1048713 Ragraveng buộc (biểu thức tuyến tiacutenh cho biết giới hạn tagravei nguyecircn vagravehay caacutec quan hệ giữa caacutec biến số) 1048713 Dung lượng (mocirc tả cận trecircn vagrave dưới của caacutec biến vagrave ragraveng buộc) 1048713 Hệ số (cocircng nghệ) vagraveo-ra (cho biết mức độ sử dụng tagravei nguyecircn của biến quyết định) bull Đặc điểm của bagravei toaacuten quy hoạch tuyến tiacutenh 1048713 Tagravei nguyecircn kinh tế của bagravei toaacuten lagrave coacute hạn vagrave sẵn sagraveng 1048713 Coacute nhiều caacutech (gt2 caacutech) sử dụng tagravei nguyecircn được gọi lagrave giải phaacutep hay chương trigravenh 1048713 Mỗi hoạt động dugraveng tagravei nguyecircn đều sinh ra kết quả dưới dạng mục tiecircu đatilde phaacutet biểu trước 1048713 Việc cấp phaacutet nằm trong caacutec ragraveng buộc cho trước bull Giả định của bagravei toaacuten quy hoạch tuyến tiacutenh 1048713 Caacutec kết quả của caacutec cấp phaacutet coacute thể đem so saacutenh với nhau coacute thể đo lường bằng một đơn vị chung

1048713 Caacutec cấp phaacutet độc lập với nhau về mặt kết quả 1048713 Kết quả cuối cugraveng lagrave tổng của caacutec kết quả từ caacutec hoạt động riecircng rẽ khaacutec nhau 1048713 Dữ liệu coacute tiacutenh chắc chắn 1048713 Tagravei nguyecircn được dugraveng một caacutech kinh tế nhất 1048713 Thường coacute một số lớn caacutec giải phaacutep với kết quả khaacutec nhau 1048713 Trong số caacutec giải phaacutep coacute thể coacute 1 giải phaacutep tốt nhất ndash mức độ đạt được mục tiecircu cao nhất ndash gọi lagrave giải phaacutep tối ưu được tigravem ra bằng một giải thuật đặc biệt MOcirc HIgraveNH HOacuteA BẰNG HEURISTIC bull Việc tigravem giải phaacutep tối ưu của một số bagravei toaacuten quyết định phức tạp coacute thể tốn nhiều thời gian chi phiacute hay khocircng thể tigravem ra được Cograven nếu dugraveng tiếp cận mocirc phỏng cũng coacute thể keacuteo dagravei phức tạp khocircng thiacutech hợp hay thậm chiacute khocircng chiacutenh xaacutec

bull Lagrave một tiếp cận giuacutep tigravem ra caacutec giải phaacutep khả thithỏa matildenđủ tốt cho caacutec bagravei toaacuten phức tạp Coacute thể coacute giải phaacutep đủ tốt (90-999 giaacute trị của lời giải tối ưu) nhanh choacuteng vagrave đỡ tốn keacutem hơn bằng caacutech dugraveng heuristics bull Quaacute trigravenh heuristic lagrave datildey caacutec bước xacircy dựng caacutec quy luật giải quyết vấn đề thocircng qua việc tigravem kiếm caacutec con đường hứa hẹn nhất dẫn đến lời giải tigravem kiếm caacutech thức thu thập vagrave phacircn giải thocircng tin theo quaacute trigravenh giải vagrave phaacutet triền caacutec phương phaacutep dẫn đến một giải thuật tiacutenh toaacuten hay một lời giải tổng quaacutet đatilde coacute bull Aacutep dụng chủ yếu cho bagravei toaacuten cấu truacutec yếu cũng dugraveng để tigravem ra giải phaacutep chấp nhận được cho bagravei toaacuten cấu truacutec chặt bull Khocircng đủ tổng quaacutet như caacutec giải thuật thường chỉ dugraveng cho tigravenh huống đặc thugrave đang xeacutet bull Coacute thể dẫn đến một giải phaacutep dở - caacutec thủ tục từng bước giải quyết vấn đề khocircng đảm bảo tigravem ra giải phaacutep tối ưu bull Heuristic coacute thể lagrave định lượng vigrave vậy coacute thể đoacuteng vai trograve quan trọng trong cơ sở mocirc higravenh của hệ hỗ trợ quyết định bull Heuristic coacute thể lagrave định tiacutenh vigrave vậy coacute thể đoacuteng vai trograve quan trọng trong cung ứng kiến thức cho hệ chuyecircn gia bull Quaacute trigravenh heuristic liecircn quan đến tigravem kiếm học tập ước lượng phacircn xử vagrave lặp lại caacutec hoạt động nagravey dọc theo tiến trigravenh bull Kiến thức thu được dugrave thagravenh cocircng hay thất bại trong quaacute trigravenh đều được phản hồi vagrave sửa đổi chiacutenh quaacute trigravenh nhờ đoacute coacute thể định nghĩa lại mục tiecircu hay bagravei toaacuten 1048713 Giải thuật di truyền bắt đầu bằng tập caacutec giải phaacutep được sinh ngẫu nhiecircn taacutei kết hợp caacutec cặp giải phaacutep một caacutech ngẫu nhiecircn bull Tigravenh huống necircn dugraveng heuristics 1048713 Dữ liệu đầu vagraveo khocircng chiacutenh xaacutec hay coacute giới hạn 1048713 Thực tế quaacute phức tạp đến nỗi khocircng dugraveng được caacutec mocirc higravenh tối ưu 1048713 Chưa coacute được giải thuật chiacutenh xaacutec vagrave đủ tin cậy 1048713 Bagravei toaacuten phức tạp necircn sẽ khocircng kinh tế nếu dugraveng tối ưu hay mocirc phỏng hoặc tốn quaacute nhiều thời gian tiacutenh toaacuten 1048713 Coacute thể cải thiện tiacutenh hiệu quả của quaacute trigravenh tối ưu (tức coacute thể sinh ra caacutec giải phaacutep ban đầu tương đối tốt) 1048713 Liecircn quan đến xử lyacute kyacute hiệu chứ khocircng phải xử lyacute kyacute số (như hệ chuyecircn gia) 1048713 Cần coacute quyết định nhanh vagrave caacutec xử lyacute dựa vagraveo maacutey tiacutenh đều khocircng khả thi (một số heuristic khocircng cần đến maacutey tiacutenh) bull Thuận lợi 1048713 Dễ hiểu dễ giải thiacutech vagrave dễ cagravei đặt 1048713 Nacircng cao tiacutenh saacuteng tạo vagrave năng lực heuristic cho caacutec vấn đề khaacutec 1048713 Tiết kiệm thời gian xaacutec lập vấn đề 1048713 Tiết kiệm yecircu cầu về bộ chứa vagrave xử lyacute maacutey tiacutenh

1048713 Tiết kiệm thời gian tiacutenh toaacuten vagrave do vậy tiết kiệm thời gian thực trong ra quyết định Một số vấn đề phức tạp đến nỗi chỉ coacute thể giải được bằng heuristics 1048713 Thường sinh ra nhiều giải phaacutep chấp nhận được 1048713 Thường coacute thể phaacutet biểu lyacute thuyết hay đo lường thực nghiệm về chất lượng của giải phaacutep (tức giaacute trị mục tiecircu của giải phaacutep gần với giaacute trị tồi ưu đến mức nagraveo dugrave giaacute trị tối ưu chưa biết được) 1048713 Coacute thể kết hợp tiacutenh thocircng minh vagraveo để hướng dẫn pheacutep tigravem kiếm (tigravem kiếm tabu) Năng lực thocircng minh đoacute coacute thể lagrave đặc thugrave theo bagravei toaacuten hoặc dựa trecircn yacute kiến chuyecircn gia được cấy trong hệ chuyecircn gia hoặc cơ chế tigravem kiếm 1048713 Coacute thể dugraveng heuristic hiệu quả vagraveo caacutec mocirc higravenh coacute thể giải bằng quy hoạch toaacuten học Đocirci khi heuristic lagrave phương phaacutep được ưa thiacutech hơn khi khaacutec giải phaacutep heuristics được dugraveng như giải phaacutep ban đầu cho caacutec phương phaacutep quy hoạch toaacuten học bull Hạn chế 1048713 Khocircng đảm bảo coacute được giải phaacutep tối ưu 1048713 Caacutec quy luật coacute rất nhiều ngoại lệ 1048713 Caacutec lựa chọn quyết định tuần tự coacute thể khocircng tiecircn đoaacuten được caacutec kết cục tương lai của mỗi chọn lựa 1048713 Sự liecircn thuộc giữa caacutec phần trong hệ thống đocirci khi coacute thể gacircy ra caacutec ảnh hưởng lớn lao lecircn toagraven hệ thống bull Phacircn loại caacutec giải thuật heuristic 1048713 Heuristic xacircy dựng xacircy dựng giải phaacutep khả thi bằng caacutech cộng thecircm từng thagravenh phần một VD bagravei toaacuten người baacuten hagraveng ndash luocircn gheacute thagravenh phố chưa viếng thăm kế tiếp gần nhất

1048713 Heuristic cải tiến bắt đầu bằng một giải phaacutep khả thi vagrave cố gắng cải tiến liecircn tục trecircn đoacute VD trecircn thử hoaacuten đổi 2 thagravenh phố 1048713 Quy hoạch toaacuten aacutep dụng vagraveo caacutec mocirc higravenh chứa iacutet ragraveng buộc nhằm coacute được thocircng tin về thỏa hiệp tốt nhất với mocirc higravenh nguyecircn gốc Thường được dugraveng trong tối ưu hoacutea nguyecircn (integer optimization) 1048713 Chia giai đoạn giải quyết một vấn đề theo từng giai đoạn VD ở PampG trecircn đacircy bagravei toaacuten phacircn phối được giải quyết trước sau đoacute dugraveng giải quyết bagravei toaacuten chiến lược sản phẩm 1048713 Phacircn ratilde chia bagravei toaacuten thagravenh caacutec phần nhỏ hơn coacute thể giải quyết được sau đoacute kết hợp caacutec giải phaacutep đoacute lại VD chia latildenh thổ baacuten hagraveng thagravenh 4 vugraveng khaacutec nhau giải quyết cho từng vugraveng sau đoacute kết nối caacutec giải phaacutep

21Mocirc phỏngbull Giả định caacutec đặc điểm của thực tạibull Lagrave kỹ thuật tiến triển caacutec thực nghiệm (như phacircn tiacutech ldquowhat-ifrdquo) - bằng maacutey tiacutenh -trecircn một mocirc higravenh của hệ thocircng tin quản lyacute

bull Khocircng thực sự lagrave một mocirc higravenh vigrave khocircng biểu diễn thực tại magrave lagrave cố gắng bắtchước thực tạibull Một trong những phương phaacutep thocircng dụng nhất trong HHTQĐbull HHTQĐ lagravem việc với caacutec bagravei toaacuten phi cấu truacutec vagrave cấu truacutec yếu tigravenh huống thực tếphức tạp ndash khocircng dễ biểu diễn bằng mocirc higravenh tối ưu hay caacutec dạng mocirc higravenh khaacutecnhưng lại thường coacute thể xử lyacute được bằng mocirc phỏngbull Đặc điểm1048713 Iacutet đưa ra caacutec đơn giản hoacutea về thực tại hơn caacutec mocirc higravenh khaacutec1048713 Do triển khai caacutec thực nghiệm necircn noacute coacute thể kiểm thử caacutec giaacute trị cụ thể của caacutecbiến quyết địnhbiến khocircng kiểm soaacutet được của mocirc higravenh vagrave xem xeacutet ảnh hưởnglecircn caacutec biến kết quả1048713 Phương phaacutep coacute tiacutenh mocirc tả (như vậy khaacutec với phương phaacutep danh định)1048713 Khocircng tự động tigravem kiếm giải phaacutep tối ưu ndash noacute mocirc tảtiecircn đoaacuten caacutec đặc tiacutenh của hệthống đatilde cho dưới caacutec điều kiện khaacutec nhau từ đoacute coacute thể chọn ra phương aacuten tốtnhất1048713 Quaacute trigravenh mocirc phỏng thường lặp lại một thực nghiệm nhiều lần để coacute được ướclượng về hiệu ứng tổng quaacutet của một số hagravenh động nhất định1048713 Mocirc phỏng maacutey tiacutenh thiacutech hợp cho hầu hết caacutec tigravenh huống mặc dugrave cũng coacute một sốmocirc phỏng thủ cocircng thagravenh cocircng1048713 Thường chỉ được dugraveng khi bagravei toaacuten quaacute phức tạp khocircng thể xem xeacutet bằng caacutec kỹthuật tối ưu dạng số Tiacutenh phức tạp theo nghĩa bagravei toaacuten khocircng thể cocircng thức hoacuteacho tối ưu (do khocircng thotildea caacutec giả định) hoặc cocircng thức quaacute lớn quaacute nhiều tươngtaacutec giữa caacutec biến hoặc về bản chất bagravei toaacuten lagrave bất định hay rủi roPhương phaacutep mocirc phỏng thiết lập mocirc higravenh của hệ thống thực vagrave tiến hagravenh caacutec thựcnghiệm lặp lại trecircn mocirc higravenh

bull Thuận lợi1048713 Lyacute thuyết tương đối trực tiếp hiệu ứng dagravei hạn của nhiều chiacutenh saacutech -gt neacuten thờigian lớn1048713 Do tiacutenh chất mocirc tả (khaacutec với danh định)1048713 Coacute thể thấy được nhanh choacuteng coacute thể đặt ra caacutec cacircu hỏi ldquowhat-ifrdquo coacute thể dugravengtiếp cận thử-vagrave-sai vagraveo giải quyết vấn đề một caacutech nhanh choacuteng rẻ chiacutenh xaacutec iacutetrủi ro hơn1048713 Thử nghiệm được biến quyết định phần nagraveo của mocirci trường thực sự quan trọngvới caacutec phương aacuten khaacutec nhau1048713 Yecircu cầu kiến thức riecircng biệt về bagravei toaacuten vigrave thế buộc người xacircy dựng mocirc higravenh phảilagravem việc thường xuyecircn với nhagrave quản lyacute ndash đối tượng mong muốn của HHTQĐ để

từ đoacute bản chất bagravei toaacuten vagrave caacutec quyết định được hiểu tốt hơn1048713 Mocirc higravenh được xacircy dựng từ viễn cảnhcaacutech nhigraven của nhagrave quản lyacute1048713 Mocirc higravenh chỉ cho một bagravei toaacuten riecircng biệt thường khocircng thể dugraveng giải caacutec bagravei toaacutenkhaacutec Như vậy mỗi thagravenh phần của mocirc higravenh ứng với một phần của hệ thống thựcdo đoacute sẽ khocircng yecircu cầu nhagrave quản lyacute phải tổng quaacutet hoacutea caacutec hiểu biết của migravenh1048713 Phổ bagravei toaacuten giải được rất rộng tồn kho nhacircn sự hoạch định chiến lược 1048713 Coacute thể chứa caacutec phức tạp thực sự của bagravei toaacuten khocircng cần caacutec đơn giản hoacutea (TDdugraveng caacutec phacircn phối xaacutec suất thực thay vigrave phacircn phối lyacute thuyết xấp xỉ)1048713 Coacute thể tự động sinh ra nhiều đo lường hiệu năng quan trọng1048713 Thường lagrave phương phaacutep duy nhất của HHTQĐ coacute thể xử lyacute caacutec bagravei toaacuten tương đốiphi cấu truacutec1048713 Coacute một số caacutec goacutei phần mềm mocirc phỏng (Monte Carlo) tương đối dễ dugravengbull Điểm yếu1048713 Tuy thường tigravem được caacutec phương aacuten đủ tốt nhưng khocircng đảm bảo lời giải tối ưu1048713 Quaacute trigravenh xacircy dựng mocirc higravenh thường dagravei vagrave tốn keacutem1048713 Giải phaacutep vagrave suy diễn từ nghiecircn cứu mocirc phỏng thường khocircng thể chuyển sang bagraveitoaacuten khaacutec vigrave mocirc higravenh kết hợp caacutec yếu tố đặc thugrave1048713 Đocirci khi do mocirc higravenh quaacute dễ giải thiacutech cho nhagrave quản lyacute necircn caacutec phương phaacutep phacircntiacutech thường xem nhẹ1048713 Phần mềm mocirc phỏng đocirci khi yecircu cầu caacutec kỹ năng đặc biệt do độ phức tạp củaphương phaacutep giải higravenh thứcbull Caacutec loại mocirc phỏng1048713 Mocirc phỏng xaacutec suất một hay nhiều biến độc lập mang tiacutenh xaacutec suất với 2 loạiphacircn phối ndash thường dugraveng kỹ thuật Monte Carlo1048713 Phacircn phối rời rạc tigravenh huống coacute một số giới hạn caacutec biến cố (biến) với hữu hạncaacutec giaacute trị cho mỗi biến cố (biến)1048713 Phacircn phối liecircn tục tigravenh huống coacute số lượng khocircng giới hạn caacutec biến cố tuacircn theocaacutec hagravem mật độ xaacutec suất như phacircn phối chuẩn1048713 Mocirc phỏng độc lậpphụ thuộc theo thời gian1048713 Độc lập khocircng cần thiết phải biết chiacutenh xaacutec thời điểm xảy ra biến cố (nhu cầutiecircu thụ lượng sản phẩm trong ngagravey khocircng biết chiacutenh xaacutec thời điểm tiecircu thụ)1048713 Phụ thuộc cần biết chiacutenh xaacutec thời điểm xảy ra sự kiện (bagravei toaacuten hagraveng đợi)1048713 Mocirc phỏng tương taacutec trực quan1048713 Mocirc phỏng hướng đối tượng dugraveng tiếp cận hướng đối tượng để xacircy dựng mocirc higravenhmocirc phỏng Chuacute yacute ngocircn ngữ mocirc higravenh hoacutea nhất thể UML (unified modelinglanguage) kể cả khi mocirc phỏng caacutec hệ thời gian thựcMOcirc HIgraveNH HOacuteA ĐA CHIỀU ndash XỬ LYacute PHAcircN TIacuteCH TRỰC TUYẾNbull Người ra quyết định thường phải xem xeacutet nhiều chiều của dữ liệu (TD caacutec chiềucủa dữ liệu baacuten hagraveng lagrave sản phẩm vugraveng thời gian người baacuten ) dữ liệu cần đượcphacircn tiacutech trực tiếp bằng caacutec cocircng cụ chuẩn hay phacircn tiacutech tự động bằng caacutec

phương phaacutep khai mỏ dữ liệu (data mining)bull Hầu hết caacutec hệ thống phacircn tiacutech đa chiều được nhuacuteng trong caacutec hệ xử lyacute phacircn tiacutechtrực tuyến (HXLPTTT ndash online analytic processing - OLAP)bull Mục tiecircu của XLPTTT nắm bắt cấu truacutec của dữ liệu thực để hỗ trợ ra quyết địnhbull Trong HHTQĐ coacute sự gắn nối tự nhiecircn giữa mocirc higravenh hoacutea dữ liệu mocirc higravenh hoacutea kyacutehiệu vagrave caacutec khiacutea cạnh của phacircn tiacutech ldquowhat-ifrdquobull Caacutec baacuteo caacuteo của HXLPTTT đều coacute tiacutenh tương taacutec dễ khai thaacutec sử dụng đặc biệtphugrave hợp cho caacutec baacuteo caacuteo về chỉ số hiệu năng chủ yếu (key performance indicators- KPI) baacuteo caacuteo về đo lường hiệu năng kinh doanh bull Thế hệ hiện tại của HXLPTTT vagrave hệ khai mỏ dữ liệu (data mining) tiacutech hợp caacutecđặc tiacutenh của hệ thocircng tin latildenh đạo (executive information system ndashEIS- nhiềucaacutech nhigraven dữ liệu chi tiết hoacutea theo nhu cầu) vagrave caacutec hệ đồ họa khaacutec ndash thường coacutegiao diện người dugraveng dạng kiểu WEBbull Caacutec hệ thống như trecircn cograven được gọi lagrave caacutec cocircng cụ triacute tuệ kinh doanh (businessintelligence - BI) vigrave coacute caacutec đặc trưng về mocirc higravenh hoacutea vagrave tối ưu hoacutea nhưng lạitrong suốt đối với ngươigrave dugravengbull Hiện caacutec cocircng cụ được đưa ra bởi caacutec nhagrave cung cấp về CSDL về hoạch định tagraveinguyecircn tổ chức (ERP) về nhagrave kho dữ liệu (data warehouse) về HXLPTTT MOcirc HIgraveNH HOacuteA VAgrave MOcirc PHỎNG TƯƠNG TAacuteC TRỰC QUANbull Iacutech lợi Người ra quyết định tham gia vagraveo quaacute trigravenh phaacutet triển mocirc higravenh vagrave thựcnghiệm mocirc phỏng vigrave vậy sẽ tin tưởng khi sử dụng mocirc higravenhbull Mocirc higravenh hoacutea tương taacutec trực quan (visual interactive modeling - VIM) dugraveng caacutecbiểu diễn đồ họa maacutey tiacutenh để trigravenh bagravey caacutec ảnh hưởng của caacutec quyết định quản lyacutekhaacutec nhau ở một thời điểm (tĩnh) hay tiến triển theo thời gian (động với kỹ thuậthoạt higravenh)bull Mocirc phỏng tương taacutec trực quan (visual interactive simulation - VIS) cho pheacutepngười dugraveng theo dotildei tiến trigravenh xacircy dựng vagrave sử dụng khai thaacutec mocirc higravenh mocirc phỏngdưới dạng hoạt higravenhbull Mocirc higravenh hoacutea tương taacutec trực quan coacute thể kết hợp với tiếp cận triacute tuệ nhacircn tạo đểđưa ra caacutec khả năng mới thay đổi từ xacircy dựng hệ thống dạng đồ họa đến tigravem hiểuvề động học của hệ thốngbull Cần đến caacutec hệ thống maacutey tiacutenh xử lyacute song song tốc độ cao để xacircy dựng caacutec mocircphỏng - phức tạp quy mocirc lớn dạng hoạt higravenh - mang tiacutenh khả thi ở thời gian thực

22Caacutec dạng hệ thống hỗ trợ ra quyết địnhHệ hỗ trợ quyết định nhoacutemRa quyết định nhoacutem giao tiếp vagrave cộng taacutec- Caacutec đặc điểm của cocircng việc nhoacutem+ Một nhoacutem thực hiện một nhiệm vụ thỉnh thoảng ra quyết định thỉnh thoảngkhocircng ra quyết định+ Caacutec thagravenh viecircn trong nhoacutem coacute thể ở những nơi khaacutec nhau

+ Caacutec thagravenh viecircn trong nhoacutem coacute thể lagravem việc ở những thời gian khaacutec nhau+ Caacutec thagravenh viecircn trong nhoacutem coacute thể lagravem việc cugraveng nhau hoặc ở caacutec tổ chức khaacutecnhau+ Nhoacutem coacute thể vĩnh viễn hoặc tạm thời+ Nhoacutem coacute thể ở bất kỳ mức quản lyacute nagraveo hoặc mức thời gian nagraveo+ Coacute sự điều phối (quaacute trigravenh vagrave nhiệm vụ đạt được) hoặc macircu thuẩn trongnhoacutem+ Coacute sự đạt được hoặcvagrave mất maacutet năng suất trong tổ chức+ Nhiệm vụ phải hoagraven thagravenh rất nhanh+ Khocircng thể hoặc quaacute đắt cho tất cả caacutec thagravenh viecircn trong nhoacutem cugraveng hợp ở mộtnơi+ Một số dữ liệu thocircng tin hoặc kiến thức cần thiết nằm ở nhiều nơi một sốkhaacutec ở ngoagravei tổ chức+ Chuyecircn mocircn của caacutec thagravenh viecircn khocircng coacute trong nhoacutem lagrave cần thiết- Caacutec hoạt động vagrave caacutec quaacute trigravenh miecircu tả caacutec cuộc họp+ Cuộc họp lagrave hoạt động chung liecircn quan bởi một nhoacutem người coacute địa vị bằngnhau hoặc gần bằng nhau+ Kết quả của cuộc họp phụ thuộc một phần vagraveo kiến thức yacute kiến caacutec đaacutenh giaacutecủa caacutec thagravenh viecircn+ Kết quả của cuộc họp cũng phụ thuộc vagraveo sự kết hợp của nhoacutem vagrave phụ thuộcvagraveo quaacute trigravenh ra quyết định được sử dụng bởi nhoacutem đoacute+ Giải quyết caacutec yacute kiến khaacutec nhau bởi người coacute quyền hạn hoặc thương lượnghoặc phacircn xửHỗ trợ giao tiếp- Giao tiếp lagrave thagravenh phần quan trọng cho hỗ trợ quyết định Khocircng coacute giao tiếp thigravekhocircng coacute cộng taacutec Những người ra quyết định caacute nhacircn phải giao tiếp với caacutecđồng nghiệp chuyecircn gia cơ quan chiacutenh phủ khaacutech hagraveng đối taacutec kinh doanh hellipHọ cũng cần dữ liệu vagrave thocircng tin (vagrave kiến thức) từ nhiều nơi trecircn thế giới Caacutecnhoacutem ra quyết định phải giao tiếp cộng taacutec vagrave thương lượng trong cocircng việcHầu hết caacutec tổ chức sẽ nhanh trở thagravenh khocircng coacute chức năng nếu khocircng coacute caacutec hệthống giao tiếp Thương mại điện tử coacute thể hiệu quả chỉ qua caacutec kỹ thuật giao tiếphiện đại- Caacutec kỹ thuật thocircng tin hiện đại cung cấp caacutec phương tiện hỗ trợ giao tiếp rẻnhanh coacute khả năng coacute thể tin cậy Nền tảng hỗ trợ giao tiếp lagrave caacutec hệ thống maacuteytiacutenh mạng+ Bắt đầu bằng điện baacuteo điện thoại radio vagrave ti vi+ Trong 100 năm chuacuteng ta phaacutet triển maacutey fax thư điện tử chương trigravenh chatnhoacutem tin tức hệ thống hội nghị truyền higravenh Hầu hết caacutec kỹ thuật nagravey đềuhoạt động trecircn internet+ Sự phaacutet triển giao tiếp sau cugraveng lagrave hệ thống họp điện tử caacutec dịch vụ vagrave hệ

thống hội nghị điện tử thường sử dụng internet để kết nối caacutec người ra quyếtđịnh- Caacutec thuận lợi aacutep dụng caacutec phương phaacutep giao tiếp cải tiến trong caacutec tổ chức+ Cải tiến năng suất của nhacircn viecircn+ Liecircn quan đến nhiều người ra quyết định chiacutenh+ Khocircng quan tacircm nhiều đến đường biecircn giới địa lyacute+ Tạo nền văn hoacutea hợp taacutec nhất quaacuten+ Cải tiến chất lượng cuộc sống của nhacircn viecircnHỗ trợ cộng taacutec Maacutey tiacutenh hỗ trợ cộng taacutec- Khung thời giannơi chốn+ Sự hiệu quả của kỹ thuật tiacutenh toaacuten cộng taacutec phụ thuộc vagraveo vị triacute của caacutec thagravenhviecircn trong nhoacutem vagrave phụ thuộc vagraveo thời gian chia sẽ thocircng tin gởi vagrave nhận+ Chia sự giao tiếp thagravenh bốn ocirc vagrave tổ chức bốn ocirc dọc theo 2 chiều thời gian vagravenơi chốn1048713 Thời gian Khi gởi vagrave nhận thocircng tin hầu như đồng thời giao tiếp lagrave đồngthời Viacute dụ Điện thoại ti vi vagrave caacutec cuộc họp gặp mặt nhau Giao tiếp bấtđồng bộ xảy ra khi người nhận nhận thocircng tin ở thời điểm khaacutec thời điểmgởi thocircng tin đoacute1048713 Nơi chốn Người gởi vagrave người nhận coacute thể ở cugraveng phograveng hoặc khocircng+ Bốn ocirc lagrave1048713 Cugraveng thời giancugraveng nơi chốn Caacutec thagravenh viecircn gặp mặt nhau cugraveng một luacutecgiống như phograveng quyết định hoặc gặp mặt truyền thống1048713 Cugraveng thời giankhaacutec nơi chốn Caacutec thagravenh viecircn ở caacutec nơi khaacutec nhau nhưnggiao tiếp cugraveng nhau Viacute dụ hội nghị truyền higravenh (videoconferencing)1048713 Khaacutec thời giancugraveng nơi chốn Nhiều người lagravem việc theo ca Ca nagravey để lạithocircng tin cho ca khaacutec1048713 Khaacutec thời giankhaacutec nơi chốn Caacutec thagravenh viecircn ở caacutec nơi khaacutec nhau Caacutecthagravenh viecircn nagravey gởi vagrave nhận thocircng tin ở những lần khaacutec nhau

23Thực thi hệ DSSHệ thống hỗ trợ quản lyacute (MSS) khocircng phải luacutec nagraveo cũng luocircn thagravenh cocircng Nhiều trường hợpthất bại của ES khocircng hoagraven toagraven lagrave lyacute do kỹ thuật Thực thi hệ thống lagrave một quaacute trigravenh liecircn tụcnhằm đảm bảo cho tổ chức chuẩn bị tiếp nhận một hệ thống mới vagrave đưa hệ thống vagraveo sử dụngthagravenh cocircngThực hiện cocircng nghệ hệ thống hỗ trợ quản lyacute lagrave việc phức tạp vigrave caacutec hệ thống nagravey khocircng đơnthuần lagrave hệ thống thocircng tin chỉ thu thập thao taacutec vagrave phacircn phối thocircng tin Magrave xa hơn chuacuteng

liecircn quan tới caacutec cocircng việc coacute thể lagravem thay đổi đaacuteng kể caacutech thức hoạt động của tổ chức Tuyvậy đa số caacutec yếu tố thực thi đều liecircn quan tới hệ thống thocircng tinThực thi MSS lagrave quaacute trigravenh liecircn tục diễn ra trong suốt thời gian phaacutet triển hệ thống từ đề xuấtban đầu đến nghiecircn cứu khả thi thiết kế vagrave phacircn tiacutech hệ thống lập trigravenh huấn luyện chuyểnđổi vagrave lắp đặt Caacutec chuyecircn gia hệ thống thocircng tin thường gọi thực thi lagrave giai đoạn cuối trongvograveng đời hệ thống Định nghĩa thực thi MSS phức tạp hơn vigrave bản chất lặp của sự phaacutet triểncaacutec hệ thống

THỰC THI KHOcircNG HOAgraveN CHỈNHCaacutec quyết định về tiacutenh khả thi thường coacute giả định về lợi iacutech đạt được khi kế hoạch thực thiđược thực hiện hoagraven toagraven Trong thực tế thường chỉ thực hiện 90 thậm chiacute 70 phần trăm sovới phacircn tiacutech khả thi Lyacute do lagrave sự thay đổi tại một nơi trong hệ thống coacute thể ảnh hưởng vagrave coacutethể taacutec động tiecircu cực đến chỗ khaacutec Do vậy cấp quản lyacute coacute thể bỏ những phần trong dự aacuten coacutethể gacircy ra taacutec động xấu Do đoacute dự aacuten sẽ thực hiện iacutet hơn 100 so với dự aacuten kế hoạch Caacutec lyacutedo khaacutec coacute thể lagrave do khấu trừ ngacircn saacutech hoặc vượt chi phiacuteĐAacuteNH GIAacute SỰ THAgraveNH COcircNG CỦA THỰC THI HỆ THỐNGPhải coacute caacutec chỉ số đo lường thigrave mới coacute thể đaacutenh giaacute sự thagravenh cocircng khi thực thi một hệ thốngDickson va Powers (1973) đề ra 5 tiecircu chuẩn độc lậpbull Tỷ lệ thời gian thực hiện dự aacuten với thời gian ước lượngbull Tỷ lệ chi phiacute thực tế vagrave ngacircn saacutech thực hiệnbull Thaacutei độ của cấp quản lyacute đối với hệ thốngbull Nhu cầu thocircng tin của caacutec nhagrave quản lyacute được đaacutep ứng như thế nagraveo qua hệ thốngbull Taacutec động của dự aacuten đối với những hoạt động maacutey tiacutenh trong cocircng tyCaacutec đo lường khaacutec để đaacutenh giaacute thagravenh cocircng của hệ hỗ trợ quản lyacute (MSS)bull Sự sử dụng hệ thống (dự định dugraveng hoặc thực sự dugraveng)bull Thỏa matilden của người dugravengbull Thaacutei độ taacuten thagravenhbull Mức độ hệ thống hoagraven thagravenh caacutec mục tiecircu ban đầubull Phần thưởng đối với tổ chức (giảm chi phiacute tăng doanh thuhellip)bull Tỷ số lợi iacutech chi phiacute

bull Mức độ thể chế hoacutea của MSS trong tổ chứcDo bởi tiacutenh đa dạng của DSS necircn việc đaacutenh giaacute sự thagravenh cocircng của hệ nagravey cũng khoacute khăn tuynhiecircn cũng coacute thể coacute một số yếu tố giuacutep cho DSS thagravenh cocircng như sự tham gia người dugravenghuấn luyện người dugraveng hỗ trợ quản lyacute cấp cao nguồn thocircng tin đặc điểm của những nhiệmvụ coacute liecircn quan (cấu truacutec bất định độ khoacute phụ thuộc)

Chương5Nhoacutem hỗ trợ quyết định vagrave nhoacutemcocircng nghệ phần mềm

51Nhoacutem tạo quyết định

MDM-Holsapple đatilde gợi yacute chuacuteng ta sử dụng giới hạn người tạo quyết định

Một nhoacutem lagrave kết cấu MDM nơi magrave nhiều người ra quyết định hoagraven toagraven tương taacutec

Một đội lagrave kết cấu MDM nơi caacutec thagravenh viecircn tư vấn cho người đưa ra quyết định nhưng khocircng tương taacutec

Một Ủy ban lagrave kết cấu MDM với một người tạo quyết định duy nhất vagrave sự tương taacutec giữa caacutec thagravenh viecircn

Mạng thocircng tin

Mạng lưới baacutenh xe mỗi người tham gia coacute thể giao tiếp với người đưa ra quyết định ở trung tacircm nhưng khocircng phải với người tham gia khaacutecCấu truacutec nagravey lagrave khocircng thỏa matilden tất cả những người tham gia ngoại trừ người ra quyết định

Mạng dacircy chuyền Tham gia chuyển tiếp thocircng tin chỉ để noacute luocircn liền kề nhau trong chuỗi

Thagravenh viecircn cuối cugraveng ko được đaacutep ứng

Mạng vograveng trograven Tương tự như chuỗi nhưng kết thuacutec được kết nối

Mạng kết nối hoagraven toagraven khocircng coacute hạn chế về giao tiếp vagrave tương taacutec giữa caacutec thagravenh viecircnNoacutei chungnoacute đaacutep ứng hầu hết caacutec kết nối của người tham gia nhưng truyền đạt thocircng tin mất nhiều thời gian vagrave coacute nhiều cơ hội xảy ra lỗi

Nhoacutem hagravenh vi vagrave chuẩn mực

MDMs thiết lập caacutec chỉ tiecircu hướng dẫn quaacute trigravenh ra quyết định

Một chuẩn mực quy định cụ thể những gigrave thagravenh viecircn trong nhoacutem dự kiến sẽ lagravem trong những hoagraven cảnh nhất định

Quy tắc gửi coacute thể được thocircng qua viacute dụ đaacutenh giaacute ngang hagraveng hoặc xử phạt

Lagravem thế nagraveo để đưa ra quyết định

Việc chọn lựa magrave trong đoacute việc sử dụng cấu truacutec MDM phải được dựa trecircn một số yếu tố liecircn quan với bối cảnh quyết định

Viacute dụmột cấu truacutec riecircng lẻ sẽ lagravem việc nơi magrave quyết định được cấu truacutec cao vagrave thocircng tin lagrave coacute sẵn

Một ủy ban cơ cấu sẽ lagrave sự lựa chọn khi người ra quyết định khocircng thể đưa ra quyết định một migravenh

52Caacutec vấn đề thường gặp trong nhoacutem

Kiacutech thước Noacutei chung sự nhất triacute vagrave gắn kết giữa caacutec thagravenh viecircn tỉ lệ nghịch với phạm vi nhoacutem Trong nhoacutem lớn rất dễ higravenh thagravenh caacutec nhoacutem nhỏ vagrave hoạt động rời rạc

Tư duy tập thể Trong nhoacutem lớn mọi người coacute xu hướng suy nghĩ đểđạtđược sự nhất triacute necircn khocircng phaacutet huy được sự saacuteng tạo

Caacutec vấn đề về xatilde hội

Xung đột Trong 1 nhoacutem ai cũng muốn migravenh lagrave giỏi nhất necircn dễ dẫn đến xung đột

Ẩn danh(Giấu tecircn) Đacircy lagrave phương phaacutep được sử dụng để kiểm soaacutet xung đột Cho caacutec thagravenh viecircn tham gia ẩn danh

Vấn đề giới tiacutenh Nam vagrave nữ thường coacute những thế mạnh khaacutec nhau điều nagravey coacute thể lagrave sức mạnh trong 1 thiết lập MDM

Đagravem phaacuten vagrave quyết định

Một quyết định coacute thể liecircn quan đến nhiều quan điểm khaacutec nhau vigrave thế cần phải coacute sự đagravem phaacuten

Caacutec thiết kế của cơ chế hỗ trợ cho MDM phải phugrave hợp với caacutec hoạt độngđagravemphaacuten

Những hoạt động nagravey bao gồm việc thu nhận yacute kiến của caacutec thagravenh viecircn 1 caacutech cocircng bằng

53Cocircng nghệ hỗ trợ MDM

Organizational DSSndash 1 hệ thống cung cấp caacutec quyết định hỗ trợ

Group Support Systemndash Cocircng nghệ sử dụng sự hỗ trợ của nhiều becircn tham gia

Group DSS ndash Lagrave 1 hệ thống được thiết kế đặc biệt để hỗ trợ cho MDM

DSS ndash Lagrave 1 hệ thống dưới sự kiểm soaacutet của 1 người quyết định hệ thống nagravey cung cấp 1 bộ cocircng cụ giuacutep phacircn tiacutech hoagraven cảnh đểđưa ra quyết định vagrave nacircng cao hiệu quả của quyết địnhđoacute

53Cocircng nghệ hỗ trợ MDM

Organizational DSSndash 1 hệ thống cung cấp caacutec quyết định hỗ trợ

Group Support Systemndash Cocircng nghệ sử dụng sự hỗ trợ của nhiều becircn tham gia

Group DSS ndash Lagrave 1 hệ thống được thiết kế đặc biệt để hỗ trợ cho MDM

DSS ndash Lagrave 1 hệ thống dưới sự kiểm soaacutet của 1 người quyết định hệ thống nagravey cung cấp 1 bộ cocircng cụ giuacutep phacircn tiacutech hoagraven cảnh đểđưa ra quyết định vagrave nacircng cao hiệu quả của quyết địnhđoacute

Mục tiecircu của cocircng nghệ hỗ trợ MDM

Quy trigravenh hỗ trợ tập trung vagraveo quaacute trigravenh tạo điều kiện thuận lợi cho sự tương taacutec

Cơ chế cấu truacutec quaacute trigravenh chi phối caacutec hoạt động truyền thocircng

Nhiệm vụ hỗ trợ cocircng việc coacute thể chọn lựa tổ chức hoặc lấy thocircng tin

Nhiệm vụ cấu truacutec cocircng việc cho pheacutep truy cập đến kỹ thuật lọc kết hợp phacircn tiacutech kiến thức liecircn quan đến cocircng việc

Caacutec lớp loại cocircng nghệ hỗ trợ MDM

Phacircn loại theo đặc điểm do DeSanctis vagrave Gallupe đưa ra đề xuất một chương trigravenh ba cấp dựa trecircn caacutec tiacutenh năng được cung cấp

Hệ thống cấp 1 Mục điacutech chiacutenh lagrave tạo điều kiện thocircng tin liecircn lạc giữa caacutec thagravenh viecircn

Hệ thống cấp 2 Thiết kế để giảm thiểu rủi ro

Hệ thống cấp 3 Giuacutep điều chỉnh xử lyacute quyết định

Phacircn loại theo cocircng nghệ -Kraemer vagrave King tập trung vagraveo cocircng nghệ aacutep dụng

Cocircng nghệ bảng mạch điện tử

Hội nghị trực tuyến

Mạng lưới tập đoagraven

Trung tacircm thocircng tin

Mocirci trường cộng taacutec

Phograveng quyết định

Nhoacutem phần mềm

Phần mềm được thiết kế để hỗ trợ sự hợp taacutec bao gồm việc thu huacutet vagrave lưu trữ thocircng tin

Caacutec tổ chức dẫn đầu thị trường hiện tại lagrave Lotus Notes and Domino Microsoft Exchange Novell GroupWise and Oracle Office

Caacutec cocircng cụ trong một bộ phần mềm bao gồm người quản lyacute hội nghị (Lotus Sametime) vagrave trao đổi thocircng điệp (Lotus Notes Mail)

Xếp hạng phần mềm cho nhoacutem

Ellis vv đề xuất một hệ thống xếp hạng dựa vagraveo kiểu sự hỗ trợ noacute Cung cấp

Hệ thocircng điệp

Hệ thống hội thảo truyền higravenh

Hệ thống cộng taacutec soạn thảo

Nhoacutem phacircn phối giải phaacutep phần mền

Hệ thống phối hợp

Hệ thống thocircng minh đại diện

Lực lượng điều khiển phaacutet triển phần mềm cho nhoacutem

Một số nhacircn tố chiacutenh bao gồm

Tăng năng suất

Giảm số lượng caacutec cuộc họp

Tăng cường tự động hoacutea caacutec quy trigravenh lagravem việc thường xuyecircn

Cần phối hợp toagraven cầu tốt hơn

Tiacutenh sẵn sagraveng của những mạng lan rộng

Coleman vagrave Khanna liệt kecirc 10 nhacircn tố khaacutec

54Quản lyacute hoạt động MDM (Mobile Device Management - Quản lyacute thiết bị di động)

Một số phương phaacutep phối hợp phổ biến hơnMDM lagrave

Kỹ thuật nhoacutem định danh

Kỹ thuật Delphi

Sự phacircn xử

Hệ thocircng tin dựa trecircn vấn đề

Nemawashi

Kỹ thuật nhoacutem định danh

1-Mỗi người tham gia viết ra những yacute tưởng về những gigrave necircn quyết định

2-Lần lượt mỗi người tham gia trigravenh bagravey yacute tưởng của migravenh được ghi lại trecircn bảng Khocircng thảo luận ở đacircy

3-Sau khi tất cả caacutec yacute tưởng được trigravenh bagravey caacutec đại biểu coacute thể chất vấn những người khaacutec

4-Mỗi người tham gia bỏ phiếu cho mỗi yacute tưởng

Kỹ thuật Delphi

Về cơ bản tương tự như kỹ thuật nhoacutem định danh ngoại trừ những người khocircng bao giờ tham gia cuộc họp

Một cocircng cụ khảo saacutet được sử dụng để thu thập đầu vagraveo ban đầu từ caacutec thagravenh viecircn

Một cuộc khảo saacutet thứ hai được gửi đi với một bản toacutem tắt caacutec kết quả chung

Những bước lặp lại cho đến khi đạt được một sự đồng thuận hoặc nhigraven nhận của đa số

Sự phacircn xử(Arbitration )

Thiacutech hợp nhất khi caacutec thagravenh viecircn của MDM đại diện cho caacutec yếu tố đối lập

Những người tham gia đồng yacute rằng nếu lựa chọn thay thế hai becircn thỏa thuận khocircng được tigravem thấy thigrave một trọng tagravei viecircn becircn ngoagravei sẽ tham gia

Trọng tagravei sau đoacute lựa chọn thay thế ocircng hoặc xeacutet thấy thiacutech hợp nhất

Hệ thống thocircng tin dựa trecircn vấn đề (IBIS)

Lagrave một phương phaacutep lập luận cấu truacutec

Một đại diện cho IBIS lagrave một đồ thị với caacutec nuacutet vagrave caacutec liecircn kết

IBIS bắt đầu với lựa chọn của một nuacutet vấn đề gốc sau đoacute caacutec nuacutet vị triacute khaacutec nhau được liecircn kết với nuacutet gốc

Caacutec nuacutet vị triacute nagravey sau đoacute được đaacutenh giaacute dựa trecircn những lập luận gắn liền với chuacuteng

Nemawashi (được sử dụng rộng ratildei tại Nhật Bản)

1-Một hoặc nhiều thagravenh viecircn của MDM được chỉ định lagrave điều phối viecircnCaacutec điều phối viecircn sau đoacute chọn người tham gia cograven lại

2-Điều phối viecircn xacircy dựng một tổng hợp caacutec sự lựa chọn vagrave sau đoacute caacutec chuyecircn gia đaacutenh giaacute caacutec lựa chọn

3-Điều phối viecircn lựa chọn một sự lựa chọn dựa trecircn kết quả ở trecircn(ở 2)

4-Sự thay thế được luacircn chuyển điều phối viecircn tigravem kiếm sự đồng thuận thocircng qua sự thuyết phục vagrave đagravem phaacuten

5-Nếu đạt được sự đồng thuận điều phối viecircn cho lưu thocircng một tagravei liệu magrave mỗi thagravenh viecircn MDM để lại dấu hiệu trecircn đoacute

55Nơi lagravem việc ảo

Nhiều tổ chức trecircn toagraven thế giới kinh doanh bất động sản cho cocircng nghệ hợp taacutec

Cocircng việc được trở thagravenh một điều bạn lagravem hơn lagrave một nơi bạn đi

Những thay đổi lớn nhất mang lại bởi nơi lagravem việc ảo coacute thể lagrave về văn hoaacute hay xatilde hội hơn lagrave về cocircng nghệ

Chương 6 Hệ thống thocircng tin điều hagravenh

61 Yacute nghĩa của EIS- Hệ thống thocircng tin điều hagravenh

- EIS lagrave một dạng đặc biệt của DSS được thiết kế để hỗ trợ ra quyết định ở cấp cao nhất của một tổ chức

- Lagrave một hệ thống thocircng tin hỗ trợ nhu cầu lập kế hoạch vagrave đaacutenh giaacute của caacutec nhagrave quản lyacute điều hagravenh

- EIS coacute thể giuacutep một CEO coacute được bức tranh tổng thể chiacutenh xaacutec nhất về caacutec hoạt động vagrave một bản toacutem tắt những gigrave magrave đối thủ cạnh tranh đang lagravem

- Caacutec hệ thống nagravey noacutei chung hoạt động dễ dagraveng vagrave trigravenh bagravey thocircng tin theo những caacutech dễ hiểu để việc tiếp thu được nhanh choacuteng (biểu đồ đồ thịhellip)

(Tagravei liệu thecircm EIS lagrave những loại hệ thống lagrave rất phức tạp trong tự nhiecircn Coacute thể noacutei hệ thống nagravey cũng cung cấp cho caacutec nhagrave quản lyacute với caacutec thiết bị coacute khả năng ra quyết định bằng caacutech sử dụng của noacute Hệ thống nagravey hoạt động trong điều kiện như vậy quan trọng như trong caacutec hệ thống khaacutec khocircng hỗ trợ Khả năng lưu trữ dữ liệu nặng lagravem cho noacute lyacute tưởng để được thocircng qua khocircng chỉ bởi caacutec doanh nghiệp lớn magrave cograven bởi caacutec doanh nghiệp nhỏ hơn Nhigraven chung hệ thống nagravey lagrave dagravenh cho caacutec nhacircn viecircn cấp cao hỗ trợ thagravenh thạo trong việc đưa ra caacutec quyết định quan trọng)

Caacutec phiecircn EIS tiecircu biểu- Phiecircn lagravem việc coacute thể bắt đầu với một baacuteo caacuteo về tigravenh higravenh tagravei chiacutenh vagrave kinh

doanh của một cocircng ty caacutec chỉ số hoạt động quan trọng được hiển thị rotilde ragraveng- EIS sẽ cho pheacutep caacutec giaacutem đốc điều hagravenh coacute thể đi sacircu vagraveo dữ liệu từ những con

số bất kỳ magrave noacute hỗ trợ- Việc điều hagravenh coacute thể lựa chọn một mức độ chi tiết ( VD danh số baacuten hagraveng) nếu

như cần điều tra thecircm- Lagrave một phương phaacutep tiếp cận coacute thể giuacutep việc ra quyết định tốt hơn

Những điều magrave EIS ko coacute- EIS khocircng phải lagrave sự thay thế cho caacutec hệ thống dựa trecircn caacutec maacutey tiacutenh khaacutec EIS

thực sự chỉ cung cấp dữ liệu cho caacutec hệ thống nagravey- Noacute khocircng thể biến caacutec bộ hệ điều hagravenh của maacutey tiacutenh thagravenh những ldquochuyecircn viecircn

giỏirdquo- Coacute thể được viacute một caacutech cao hơn như lagrave một trợ lyacute đaacuteng tin cậy coacute thể được gọi

đến bất khi nagraveo vagrave mỗi khi cần thiết

Tagravei liệu thecircm Sự khaacutec nhau giữa EIS vagrave DSS+ EIS thiết kế để hỗ trợ những người điều hagravenh cấp cao giuacutep họ khaacutem phaacute caacutec vấn đề vagrave caacutec cơ hội DSS hỗ trợ những nười phacircn tiacutech cố gắng trả lời cacircu hỏi caacutei gigrave coacute thể lagravem cugraveng với một cơ hội hoặc một vấn đề

Chiều EIS DSSNhững người sử dụng thocircng thường

Duyệt dữ liệu đi xuống truy xuất trạng thaacutei

Hỗ trợ phacircn tiacutech vagrave quyết định

Sự thuacutec đẩy Tiacutenh thiacutech hợp Tiacutenh hiệu quảỨng dụng Queacutet mocirci trường đaacutenh giaacute

hiệu suất nhận dạng caacutec vấn đề vagrave caacutec cơ hội

Caacutec quyết định quản lyacute trecircn caacutec lĩnh vực đa dạng

Hỗ trợ quyết định Caacutec chiacutenh saacutech caacutec quyết định khocircng coacute cấu truacutec ở mức cao vagrave hỗ trợ giaacuten tiếp

Hỗ trợ caacutec quyết định lặp lại caacutec quyết định khocircng thể đoaacuten trước ra quyết định khocircng coacute cấu truacutec vagrave baacuten cấu truacutec

Loại thocircng tin Caacutec thocircng tin tin tức thocircng tin becircn ngoagravei về khaacutech hagraveng đối thủ cạnh tranh mocirci trường caacutec baacuteo caacuteo theo yecircu cầu vagrave định thời về caacutec hoạt động becircn trong

Caacutec thocircng tin hỗ trợ caacutec tigravenh huống đặc biệt

Sử dụng coacute nguyecircn tắc

Dograve theo vết vagrave điều khiển nhận dạng cơ hội

Hoạch định tổ chức phacircn nhoacutem vagrave điều khiển

Khả năng phugrave hợp với những người sử dụng caacute nhacircn

Thiết kế loại ra quyết định cho mỗi người điều hagravenh caacute nhacircn bằng nhiều lựa chọn đầu ra

Cho pheacutep caacutec đaacutenh giaacute caacute nhacircn caacutec khả năng what-if lựa chọn loại hộp hội thoại

Đồ họa Phải coacute Lagrave một phần quan trọng của nhiều DSS

Thacircn thiện người sử dụng

Phải coacute Phải coacute nếu khocircng coacute người sử dụng trung gian

Xử lyacute thocircng tin Lọc neacuten thocircng tin dograve theo vết dữ liệu vagrave thocircng tin quan trọng

EIS kiacutech thiacutech caacutec cacircu hỏi caacutec cacircu trả lời bằng caacutech sử dụng DSS vagrave phản hồi lại EIS

Hỗ trợ caacutec thocircng tin chi tiết

Truy xuất thường xuyecircn caacutec mức chi tiết của bất kỳ thocircng tin tổng hợp nagraveo (duyệt dữ

Coacute thể coacute trong DSS nhưng khocircng thường

liệu chi tiết)Cơ sở mocirc higravenh Caacutec chức năng coacute sẵn bị hạn

chếLagrave điểm cốt lotildei của DSS

Cấu truacutec Theo người baacuten sản phẩm hoặc theo caacutec chuyecircn gia hệ thống thocircng tin

Theo người sử dụng hoặc caacute nhacircn hoặc caacutec chuyecircn gia từ caacutec trung tacircm thocircng tin hoặc phograveng ban hệ thống thocircng tin

Phần cứng Mainframe caacutec trạm RISC mạng LANs hoặc caacutec hệ thống phacircn bố

Mainframe caacutec trạm RISC caacutec maacutey PC hoặc caacutec hệ thống phacircn bố

Bản chất caacutec goacutei phần mềm

Truy xuất tương taacutec dễ dagraveng đến nhiều cơ sở dữ liệu truy xuất trực tuyến caacutec khả năng DBMS phức tạp caacutec liecircn kết phức tạp

Caacutec khả năng tiacutenh toaacuten lớn caacutec ngocircn ngữ mocirc higravenh mocirc phỏng ứng dụng vagrave caacutec bộ tạo DSS

Bản chất caacutec thocircng tin

Trigravenh bagravey thocircng tin được phaacutet sinh trước về quaacute khứ vagrave hiện tại tạo caacutec thocircng tin mới về quaacute khứ hiện tại tương lai

Tạo thocircng tin mới về quaacute khứ hiện tại tương lai

62 Lịch sử EIS- EIS xuất hiện lần đầu tiecircn tại MIT vagraveo những năm 1970

- Những EIS đầu tiecircn được phaacutet triển bởi caacutec doanh ngiệp lớn sẵn sagraveng chấp nhận rủi ro để đạt được lợi thế cạnh tranh

- Vagraveo những năm 1980 caacutec nhagrave cung cấp đatilde phaacutet triển một số cơ sở khaacutech hagraveng rộng vagrave cocircng nghệ EIS được tiếp tục phaacutet triển cho đến ngagravey nay

(Tagravei liệu thecircm Sử dụng DSSEIS cho phaacutet triển bền vững + Một số nghiecircn cứu đatilde được tiến hagravenh để kiểm tra việc thực hiện của EIS trong khu vực cocircng cộng vagrave chiacutenh phủ caacutec nước tổ chức kể từ khi chuacuteng được phaacutet triển theo định hướng lợi nhuận cho caacutec cocircng ty tư nhacircn (Hasan vagrave Hasan năm 1997) Theo một nghiecircn cứu tiến hagravenh tại Mỹ ở hơn 300 cocircng ty kết quả cho thấy sự khaacutec biệt của EIS giữa tư nhacircn vagrave chiacutenh phủ một số kết quả thuacute vị được phaacutet hiệnViacute dụ khoacute khăn hơn để chuyển tiền từ một tagravei khoản khaacutec trong một EIS của chiacutenh phủ cũng lagrave khoacute khăn hơn để biện giải thiacutech cho những chi phiacute phaacutet triển EIS của chiacutenh phủ Một nghiecircn cứu khaacutec được tiến hagravenh ở Australia

cho thấy rằng EIS cung cấp cho quản lyacute một higravenh ảnh chiacutenh xaacutec hơn về tổ chức thực hiện vagrave cung cấp hỗ trợ cho caacutec lợi iacutech chiến lược cải thiện khocircng chỉ cho caacutec nhagrave quản lyacute nhưng cograven cho phần cograven lại của tổ chức Dựa trecircn caacutec hệ thống được thiết kế cho caacutec cocircng ty tư nhacircn với một caacutech rotilde ragravengxaacutec định mục tiecircu EIS lagrave thiacutech hợp cho caacutec tổ chức cocircng cộng hiện đại nhưng cần phải được linh hoạt hơn vagrave kết thagravenh chugravem một phạm vi rộng hơn khả năng vagrave phương tiện hơn so với khu vực tư nhacircn ban đầu theo định hướng sản phẩm (Hasan vagrave Hasan năm 1997) Điều nagravey coacute thể lagrave do thực tế rằng caacutec hoạt động khu vực cocircng lagrave bắt buộc coacute taacutec động rộng phải đaacutep ứng sự mong đợi duy nhất cocircng cộng thường coacute mục tiecircu mơ hồ vagrave macircu thuẫn iacutet quyền tự chủ vagrave kiểm soaacutet việc ra quyết định vagrave nhacircn viecircn lagrave khoacute khăn hơn (Watson vagrave Carte2000) + Toacutem lại EIS lagrave một khaacutei niệm thagravenh cocircng noacute phaacutet triển qua nhiều năm tuy nhiecircn EIS khắc phục khiếm khuyết của migravenh bằng caacutech tiến hagravenh nghiecircn cứu liecircn tục)

63 Tại sao những người điều hagravenh hagraveng đầu lại khaacutec nhau- Họ lagrave những doanh nghiệp theo định hướng coacute suy nghĩ

- Coacute một khoảng khocircng gian rộng để kiểm soaacutet

- Họ chịu traacutech nhiệm cho việc thiết lập chiacutenh saacutech

- Họ đại diện cho tổ chức mocirci trường becircn ngoagravei

- Hagravenh động của họ tạo ra những kết quả đaacuteng kể về tagravei chiacutenh vagrave con người

Tần số caacutec hoạt động điều hagravenh- Xử lyacute xaacuteo trộn 42

- Hoạt động kinh doanh 32

- Phacircn bổ nguồn lực 17

- Đagravem phaacuten 3

- Những điều khaacutec 6

Handling Disturbances 42

Entrepreneurial Activites 32

Resource Allocation 17

Negotiation 3

Other 6

Những thocircng tin điều hagravenh cần thiết- Quản lyacute xaacuteo trộn coacute thể yecircu cầu sự chuacute yacute xung quanh đồng hồ

- Hoạt động kinh doanh yecircu cầu điều hagravenh để dự đoaacuten những thay đổi trong mocirci trường

- Nhiệm vụ phacircn bổ tagravei nguyecircn yecircu cầu lựa chọn người quản lyacute vagrave caacutec nguồn lực hạn chế được triển khai

- Đagravem phaacuten yecircu cầu cập nhật thocircng tin từng phuacutet để coacute thể xacircy dựng được sự đồng thuận

Caacutec loại thocircng tin điều hagravenh- Hệ thống kế toaacuten coacute liecircn quan đến việc tiacutenh toaacuten thu nhập hoạt động cho caacutec lĩnh

vực cụ thể lagrave quan trọng hơn so với caacutec hệ thống kế toaacuten truyền thocircng- Thocircng tin về thị trường khaacutech hagraveng cung cấp giaacute trị trong việc quyết định chiến

lược- Caacutec thocircng tin cần thiết thường được truyền đi trecircn một số hệ thống maacutey tiacutenh vagrave

nằm trong toagraven tổ chức- Caacutec thocircng tin được sử dụng thường lagrave ngắn hạn vagrave dễ thay đổi

Phương thức để xaacutec định thocircng tin cần thiết

Rockart xaacutec định được năm phương thức cơ bản để xaacutec định thocircng tin cần thiết

- Phương thức dựa trecircn kết quả- Phương thức rỗng- Phương thức chỉ số khoacutea- Phương thức tổng hợp nghiecircn cứu- Phương thức dựa vagraveo nhacircn tố then chốt dẫn đến thagravenh cocircng

64 Thagravenh phần EIS

- Sản phẩm EIS đầu tiecircn được phaacutet triển để sử dụng trecircn maacutey tiacutenh cấu higravenh cao nhưng caacutec sản phẩm hiện nay nhằm mục tiecircu lagrave nền tảng ClientServer

- Những nền tảng linh hoạt hơn coacute thể thiacutech ứng với thay đổi trong tổ chức vagrave cocircng nghệ

- Sử dụng dữ liệu thời gian thực dẫn đến quyết định nhanh hơn nhiều thocircng tin hơn

Thagravenh phần phần cứng- Một EIS khocircng đogravei hỏi coacute phần cứng cụ thể hoặc duy nhất nagraveo- Chigravea khoacutea của vấn đề lagrave để đảm bảo rằng caacutec thagravenh phần của EIS tối ưu hoacutea vagrave

phugrave hợp với tagravei nguyecircn maacutey tiacutenh của tổ chức- Hệ thống nagravey phải được cấu higravenh để caacutec nguồn tagravei nguyecircn phugrave hợp với những

người điều hagravenh chuacuteng

Thagravenh phần phần mềm- Traacutei ngược với phần cứng phần mềm thường được chuyecircn mocircn hoacutea cao cho caacutec

bagravei toaacuten về miền- Sự chuyecircn mocircn hoacutea nagravey thường đạt được bằng caacutech sử dụng thagravenh phần off-the-

shelf cho toagraven bộ EIS vagrave caacutec mocirc-đun tugravey chỉnh để đaacutep ứng nhu cầu cụ thể- Lotus Notes lagrave một viacute dụ điển higravenh Noacute coacute thể được sử dụng một migravenh hoặc coacute

thể phục vụ becircn thứ ba mocirc-đun plug-in

Cocircng nghệ EIS hiện nay

Dobrzeniecki đề xuấtphacircn loạitừng cấptheo bachức năng- Loại 1 sản phẩm bao gồmmột bộ đầy đủcaacutec ứng dụngtừ mộtnhagrave cung cấp- Loại 2 sản phẩm đượcthựchiệnở phần đầu củacaacutecsản phẩmDSS đượcphaacutet triển

bởicugravengmộtnhagrave cung cấp- Loại 3 sản phẩmkết hợp với nhautheo bất kỳ số lượngthuộc sở hữu củacocircng ty

65 Xacircy dựng EIS

- Xacircy dựngmộtEISgiống nhưxacircydựngmột số hệ thống khaacutec củamocirc higravenh hệ thống thocircng tin

- Việcphaacutet triểncấu truacutecnecircn được theo dotildeitừ quaacute trigravenh thiết kế đến quaacute trigravenhthực hiện

- Tuy nhiecircn một dự aacuten phaacutet triển EIScoacute xu hướnglagrave thống nhấtvagraveyecircu cầu hỗ trợ caacutec nhagrave quản lyacute latildenh đạo

- Xacircy dựng một EIScoacute thểphaacutet hiện ra đượccaacutectigravenh huống khoacute khănmagravemột nhagrave phaacutet triển chưabao giờ gặp phải

Mocirc higravenh EIS

Khung phaacutet triển một EIS

- Watson et al đề nghị xacircy dựngkhung với ba thagravenh phần+ Caacutech tiếp cận tập trung vagraveo yếu tốcon người vagrave dữ liệu coacute liecircn quan đến EIS+ Quaacute trigravenh phaacutet triển cần sự linh hoạt vagrave tương taacutec+ Người sử dụng - hệ thống hộp thoại bao gồm một ngocircn ngữ hagravenh động để xử lyacute caacutec lệnh

Lợi iacutech của EIS- Dễ duy trigrave caacutec mục tiecircu coacute tổ chức- Dễ truy xuất thocircng tin- Cho pheacutep người sử dụng nacircng cao hiệu suất hơn

- Tăng chất lượng ra quyết định- Cung cấp sự cải tiến cạnh tranh- Tiết kiệm thời gian của người sử dụng- Tăng khả năng vagrave chất lượng giao tiếp- Cung cấp khả năng điều khiển tốt hơn trong tổ chức- Cho pheacutep tham gia caacutec vấn đề vagrave caacutec cơ hội- Cho pheacutep hoạch định- Cho pheacutep tigravem kiếm nguyecircn nhacircn của một vấn đề- Thảo matilden caacutec yecircu cầu của người điều hagravenh

Hạn chế của EIS vagrave 1 số sai lầm cần traacutenh

- Chi phiacute một cuộc khảo saacutetnăm1991 chothấychi phiacute phaacutet triểntrungbigravenh365000USDvớichi phiacute vận hagravenhhagraveng năm lagrave$200000 (EIS)

- Cocircng nghệ hạn chếEIScần phảiđượctiacutech hợp hoagraven toagravenvagraveokiếntruacuteccủadoanh nghiệphiện tại do đoacute noacutelagrave một thaacutech thứclớn đối vớithiết kế

- Hạn chế tổ chức cơ cấu tổ chứccoacute thể khocircng phugrave hợp

Sự hạn chế về tổ chức- Chương trigravenh nghị sự vagrave thời gian chệch EIS mocirc tả một phần việc thực hiện một

chương trigravenh nghị sự vagrave coacute thể dễ dagraveng đạt được sự tin cậy một caacutech chắc chắn- Đồng bộ hoacutea việc quản lyacute sự tin cậy đuacuteng luacutec đặc biệt baacuteo caacuteo EIS coacute thể phaacute

vỡ sự ổn định thiết lập caacutec chu trigravenh baacuteo caacuteo một caacutech tốt nhất- Sự bất ổn EIS phản ứng nhanh coacute thể gacircy ra việc taacutec động trở lại một caacutech

nhanh choacuteng dẫn đến sự thiếu ổn định trong tổ chức

Sự thất bại lagrave thay thế khocircng thể chấp nhận được- Một số yếu tố lagravem EIS thất bại

+ Thiếu sự hỗ trợ về mặt quản lyacute+ Vấn đề chiacutenh trị+ Thất bại của nhagrave phaacutet triển+ Lỗi về cocircng nghệ+ Giaacute cả+ Thời gian

66 Ra quyết định điều hagravenh trong tương lai vagrave EIS

- Coacute một vagravei điều kiện sẽ được hợp nhất cho việc chuyển đổi cocircng nghệ Trong đoacute một vagravei điều kiện coacute thể dễ dự đoaacuten Hai điều kiện magrave ta coacute thể thấy lagrave+ Phaacutet triển cocircng nghệ maacutey tiacutenh trong việc điều hagravenh sẽ tạo ra sự chuyển đổi được chấp nhận một caacutech dễ dagraveng hơn+ Mở rộng traacutech nhiệm điều hagravenh sẽ mở rộng nhu cầu thocircng tin

Tương lai của EIS- EIS thocircng minh Những tiến bộ trong cocircng nghệ AI sẽ được triển khai trong caacutec

EIS- EIS đa phương tiện Cơ sở dữ liệu đa phương tiện sẽ cho pheacutep tiacutech hợp văn bản

giọng noacutei vagrave higravenh ảnh trong tương lai- EIS thocircng tin Tương lai EIS sẽ mở rộng hơn trong việc sử dụng dữ liệu becircn

ngoagravei doanh nghiệp- EIS kết nối Giao tiếp với băng thocircng rộng cho pheacutep kết nối liecircn thocircng lớn hơn

Chương 7 HỆ CHUYEcircN GIA VAgrave TRIacute TUỆ NHAcircN TẠO

71 Caacutec khaacutei niệm

72 Triacute thocircng minh của triacute tuệ nhacircn tạo

73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia

74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia

75 Lợi iacutech vagrave hạn chế của hệ chuyecircn gia

71 Caacutec khaacutei niệm

Chuyecircn mocircn (Expertise) sự hiểu biết rộng trong 1 lĩnh vực hẹp

Hệ chuyecircn gia (Expert Systems)1 chương trigravenh maacutey tiacutenh sử dụng 1 tập caacutec luật dựa trecircn tri thức của con người để giải quyết caacutec vấn đề đogravei hogravei phải coacute sự chuyecircn mocircn

Một số hệ chuyecircn gia nổi tiếng

DENDRAL (Standford 1960s Edward Feigenbaum)

MYCIN (Standford1970s Edward Shortliffe)

PROSPECTOR (MIT 1979)

Triacute tuệ nhacircn tạo (Artificial Intelligence ndash AI)

Triacute tuệ nhacircn tạo một bộ phacircn của ngagravenh khoa học maacutey tiacutenh quan tacircm đến việc thiết kế caacutec hệ thống maacutey tiacutenh thocircng minh đoacute lagrave caacutec hệ thống đưa ra caacutec đặc điểm magrave từ đoacute chuacuteng ta liecircn hệ với sự thocircng minh trong hagravenh động của con người (Barr vagrave Feigenbaum 1981)

Mục điacutech của AI

Mục điacutech khoa học xaacutec định caacutec gợi yacute để giải thiacutech caacutec loại khaacutec nhau của triacute tuệ thực

Mục điacutech kỹ thuật giải quyết caacutec vấn đề trong thế giới thực

Triacute tuệ nhacircn tạo kế thừa nhiều yacute tưởng quan điểm kỹ thuật từ caacutec ngagravenh khoa học khaacutec

- Triết học

- Logic Toaacuten học

- Tiacutenh toaacuten

- Khoa học tacircm lyacute Khoa học nhận thức

- Sinh học Thần kinh học

- Tiến hoacutea

Caacutec lĩnh vực ứng dụng trong Triacute tuệ nhacircn tạo

Mạng nơ ron thần kinh (Neural Networks)

Tiacutenh toaacuten sự tiến hoacutea

(Evolutionary Computation)

Hệ chuyecircn gia (Expert Systems)

Kỹ thuật xử lyacute tiếng noacutei (Speech Processing)

Kỹ thuật xử lyacute ngocircn ngữ tự nhiecircn

(Natural Language Processing)

Lập kế hoạch (Planning)

Robot (Robotics)

Khoa học higravenh ảnh (Vision)

Caacutec kỹ thuật thocircng dụng dugraveng trong AI

Biểu diễn(Representation)

Học (Learning)

Caacutec luật (Rules)

Tigravem kiếm (Search)

72 Triacute thocircng minh của triacute tuệ nhacircn tạo

Con người suy diễn như thế nagraveo

Phacircn loại (Categorization)

Caacutec quy tắc cụ thể

Heuristics

Kinh nghiệm trước đoacute

Dự tiacutenh trước

Maacutey tiacutenh suy diễn như thế nagraveo

Lập luận dựa trecircn luật IF-THEN mocirc tả tri thức được matilde hoacutea dưới dạng caacutec luật

Caacutec khung (Frames) lagrave caacutec đại diện mocirc tả caacutec tigravenh huống giống nhau lagrave điển higravenh của một vagravei phacircn loại

Lập luận dựa trecircn caacutec trường hợp mocirc phỏng giải phaacutep trước đoacute cho một vấn đề hiện tại

Nhận dạng mẫu phaacutet hiện acircm thanh higravenh dạng hoặc caacutec chuỗi dagravei

Caacutec dạng khaacutec của Triacute tuệ nhacircn tạo

Học maacutey- mạng nơron vagrave giải thuật di truyền

Lập trigravenh tự động ndash lagrave những kỹ thuật tạo ra caacutec chương trigravenh để lagravem 1 nhiệm vụ riecircng biệt (cho pheacutep những người khocircng phải lagrave người lập trigravenh coacute thể lập trigravenh được)

Cuộc sống nhacircn tạo ndash nỗ lực để taacutei tạo caacutec hiện tượng sinh học trong caacutec hệ thống dựa trecircn maacutey tiacutenh

73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia(Expert Systems- ES)

Theo Jackson (1999) Một hệ chuyecircn gia lagrave một chương trigravenh maacutey tiacutenh mocirc tả vagrave suy diễn với tri thức của một vagravei lĩnh vực để giải quyết vấn đề hay đưa ra caacutec lời khuyecircn

Cấu truacutec cơ bản của ES được dựa theo cấu truacutec chung của DSS Sự khaacutec biệt chiacutenh giữa ES vagraveDSS lagrave hệ ES thu thập caacutec kiến thức từ những

chuyecircn gia trong lĩnh vực quan tacircmĐặc trưng của hệ chuyecircn gia Hiệu quả cao Thời gian trả lời thỏa đaacuteng Độ tin cậy cao Dễ hiểu

Giao diện người dugraveng trong ES

Thiết kế giao diện người dugraveng tập trung vagraveo caacutec yếu tố như dễ dagraveng sử dụngcoacute độ tin cậy cao giảm tải những khoacute khăn khi sử dụng

Thiết kế necircn coacute một số tương taacutec (đầu vagraveo kiểm soaacutet vagrave truy vấn)

Cấu tạo giao diện người dugraveng gồm coacute magraven higravenh cảm ứng bagraven phiacutem buacutet saacuteng lệnh thoại caacutec phiacutem chuyecircn dụng

Cơ sở tri thức (Knowledge Base)

Chứa đựng caacutec tri thức cụ thể miền thu được từ caacutec chuyecircn gia miền

Coacute thể chứa caacutec mocirc tả caacutec hagravenh vi giải quyết vấn đề caacutec ragraveng buộc caacutec heuristics

Thagravenh cocircng của một ES dựa trecircn tiacutenh đầy đủ vagrave tiacutenh chiacutenh xaacutec của cơ sở tri thức

Mocirc tơ suy diễn (Inference Engine)

Ở đacircy tri thức được đặt để sử dụng tạo ra caacutec giải phaacutep để giải quyết vấn đề

Mocirc tơ nagravey coacute khả năng thực hiện diễn dịch hoặc suy diễn dựa trecircn caacutec luật hay caacutec caacutec sự kiện

Đồng thời cũng coacute khả năng sử dụng caacutec suy diễn mờ hay khocircng chiacutenh xaacutec dựa trecircn xaacutec suất hay aacutenh xạ mẫu

Vograveng điều khiển suy diễn

1 Aacutenh xạ caacutec luật với caacutec sự kiện đatilde được cho

2 Chọn luật để thực hiện

3 Thực hiện luật bằng caacutech thecircm caacutec sự kiện được suy diễn ra vagraveo bộ nhớ lagravem việc

Chuỗi suy diễn (Chaining)

Suy diễn tiến (forward chaining) maacutey suy diễn bắt đầu từ dữ liệu ban đầu vagrave thực hiện việc suy luận để đưa ra caacutec kết luận cuối cugraveng

Suy diễn lugravei (backward chaining) maacutey suy diễn bắt đầu từ dữ liệu điacutech vagrave tigravem ra tri thức hỗ trợ cho dữ liệu điacutech đoacute

Viacute dụ suy diễn lugravei

R1 Nếu coacute A vagrave B thigrave suy ra coacute D

R2 Nếu coacute B thigrave suy ra coacute C

R3 Nếu coacute C vagrave D thigrave suy ra coacute E

Ta coacute E ta xem trong 3 luật R1 R2 R3 luật nagraveo coacute E ta thấy R3 chứa E đồng thời chứa C vagrave D Xeacutet tiếp trong 2 luật R1 R2 luật nagraveo chứa C vagrave D R2 chứa C R3 chứa D Từ đoacute ta coacute được caacutec tri thức hỗ trợ suy diễn vagrave kết luận lagrave nếu coacute A vagrave B thigrave sẽ coacute E Hay nếu A vagrave B đuacuteng thigrave sẽ coacute E

Viacute dụ suy diễn tiến

Giả sử coacute tập chứa 3 luật sau

R1 Nếu coacute A vagrave B thigrave suy ra coacute D

R2 Nếu coacute B thigrave suy ra coacute C

R3 Nếu coacute C vagrave D thigrave suy ra coacute E

Nếu ta coacute A vagrave B thigrave chuacuteng ta suy ra được D từ R1 vagrave suy ra C từ R2 Với D vagrave C đatilde được suy ra ở trecircn giờ chuacuteng ta suy ra được E từ R3

Viacute dụ thực tế

Giả sử muốn biết magraveu của một con vật nuocirci tecircn lagrave Fred biết rằng noacute kecircu ộp ộp vagrave ăn ruồi

Coacute tập 4 luật ban đầu như sau

R1 Nếu X kecircu ộp ộp vagrave ăn ruồi thigrave X lagrave con ếch

R2 Nếu X kecircu chiecircm chiếp vagrave biết hoacutet thigrave X lagrave con chim

R3 Nếu X lagrave con ếch thigrave X coacute magraveu xanh

R4 Nếu X lagrave con chim thigrave X coacute magraveu vagraveng

74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia

Expert system shells lagrave một tập caacutec goacutei phần mềm vagrave caacutec cocircng cụ dugraveng để phaacutet triển caacutec hệ chuyecircn gia

Những Expert system shells đầu tiecircn thường rất rườm ragrave Mặc dugrave vậy noacute vẫn giuacutep cho người sử dụng sẽ khocircng phải bắt đầu lại từ đầu khi xacircy dựng một hệ chuyecircn gia mới

Những shell hiện đại bao gồm hai mocirc-đun chiacutenh lagrave cocircng cụ xacircy dựng một tập quy tắc vagrave mocirc tơ suy diễn

Xacircy dựng hệ chuyecircn gia

Bước 1 xacircy dựng mocirc higravenh bagravei toaacuten xaacutec định vấn đề nhiệm vụ magrave hệ thống sẽ thực hiện Caacutec dạng bagravei toaacuten cần hệ chuyecircn gia

Bagravei toaacuten diễn giải (InterPretation)

Bagravei toaacuten dự baacuteo (Prediction)

Bagravei toaacuten chuẩn đoaacuten (Diagnose)

Bagravei toaacuten gỡ rối (Debugging)

Bagravei toaacuten thiết kế

Tương tự như một dự aacuten phần mềm để xacircy dựng một hệ chuyecircn gia cần phải coacute caacutec yếu tố về nhacircn lực tagravei nguyecircn vagrave thời gian Những yếu tố nagravey ảnh hưởng đến giaacute thah của một hệ chuyecircn giaTrong phần nagravey cacircu hỏi thường được đặt ra lagrave tại sao cần phải xacircy dựng một hệ chuyecircn giaTrước khi bắt đầu phải xaacute định rotilde bagravei toaacuten đạt ra lagrave jiAi lagrave chuyecircn giaAi lagrave người sử dụng

1 Diễn giải (InterPretation) Nghiecircn cứu 1 vấn đề -gt Dựa trecircn những biểu hiện thuộc tiacutenh đặc trưng becircn ngoagravei -gt Tư vấn

(hoặc đưa ra kết luận hay mocirc tả dễ hiểu từ tập dữ liệu thocirc)

2 Bagravei toaacuten dự baacuteo (Prediction) Coacute thể dự đoaacuten được hagravenh vi kết quả dựa trecircn caacutec hiện tượng -gt dự baacuteo

VD Dự baacuteo thời tiết động đấthellip

3 Bagravei toaacuten chẩn đoaacuten (Diagnoss) Xaacutec định caacutec lỗi caacutec bộ phận hỏng hoacutec của hệ thống dựa trecircn caacutec dữ liệu quan saacutet được

4 Bagravei toaacuten gỡ rối (Debugging) Mocirc tả caacutec phương phaacutep khắc phục hệ thống khi gặp sự cố

5 Bagravei toaacuten thiết kế Lựa chọn cấu higravenh caacutec đối tượng nhằm thoả matilden một số ragraveng buộc nagraveo đoacute

6 Giảng dạy Phần mềm dạy học coacute thể chuẩn đoaacuten vagrave sủa lỗi của học sinh trong quaacute trigravenh học tập

Để xaacutec định đuacuteng bagravei toaacuten magrave chuacuteng ta cần giải quyết thigrave phải trả lời đc một số cacircu hỏi

- cần hệ chuyecircn gia

Bước 2 thu thập tri thức lựa chọn cocircng cụ vagrave aacutep dụng

Trong bước thu thập tri thức vấn đề quan trọng lagrave lựa chọn chuyecircn gia những người magrave sẽ đoacuteng goacutep tri thức cho hệ thống Thocircng thường trong suốt quaacute trigravenh phaacutet triển thigrave chuyecircn gia được xem như một thagravenh viecircn của đội phaacutet triển

Hiện nay coacute rất nhiều cocircng cụ để xacircy dựng một hệ chuyecircn gia Phổ biến nhất lagrave JESS CLIPS vagrave OPS5

Bước 3 Thiết kế cơ sở tri thức thiết kế hệ thốngTri thức được biểu diễn trường minh trong cơ sở tri thức

Caacutec chuyecircn gia vagrave kỹ sư tri thức sẽ đối thoại với nhau bằng caacutec kỹ thuật đối thoại Suy diễn (SD) bảng Mocirc higravenh hoacutea SD quy nạp phacircn loại

Vấn đề bagraveo trigrave vagrave phaacutet triển

Caacutec hệ chuyecircn gia đogravei hỏi phải bảo trigrave vagrave phaacutet triển nhiều hơn so với caacutec hệ thống khaacutec Phải thường xuyecircn bổ sung tri thức mới vagrave thay đổi caacutec tri thức cũ để đổi mới hệ chuyecircn gia

Thu thập vagrave khắc phục lỗi do người sử dụng phaacutet hiện để kịp thời khắc phục những sai soacutet của hệ chuyecircn gia

75 Lợi iacutech vagrave hạn chế của caacutec hệ chuyecircn gia

Một số lợi iacutech chiacutenh

Thời gian trả lời hợp lyacute bằng hoặc nhanh hơn so với chuyecircn gia (người) để đi đến cugraveng một quyết định Hệ chuyecircn gia lagrave một hệ thống thời gian thực (real time system)

Khả năng trả lời với mức độ tinh thocircng bằng hoặc cao hơn so với chuyecircn gia (người) trong cugraveng lĩnh vực

Hệ chuyecircn gia giuacutep cho hiệu quả lagravem việc tăng bằng việc sử dụng tập caacutec luật một caacutech nhanh choacuteng magrave ko bị nhầm lẫn chuyecircn gia lagrave người coacute thể quecircn đi một số tri thức cơ sở lyacute luậ nhưng HCG thigrave ko

Quyết định của một người chuyecircn gia coacute thể bị thay đổi vagrave ko coacute tiacutenh thống nhất như quyết định của một hệ chuyecircn gia tạo ra

Hệ chuyecircn gia giuacutep cho người sử dụng coacute thể trau dồi sự hiểu biết trecircn lĩnh vuej cụ thể magrave noacute giải quyết hỗ trợ người ra quyết định coacute trigravenh độ như 1 chuyecircn gia trong quaacute trigravenh gia quyết định

Kiến thức của rất nhiều chuyecircn gia về một lĩnh vực nagraveo đoacute được đưa vagraveo hệ chuyecircn gia lagravem cho CSTT cuat HCG phong phuacute vagrave rộng lớn hơn rất nhiều

HCG giải thiacutech caacutec bước suy luận một caacutech dễ hiểu nhất quaacuten luacutec nagraveo cũng coacute thể sử dụng ko như chuyecircn gia con người

Hạn chế của caacutec hệ chuyecircn gia

Nhược điểm lớn nhất của hệ chuyecircn gia lagrave những yacute kiến chuyecircn mocircn thường rất khoacute matilde hoacutea vagrave giải neacuten

Hệ chuyecircn gia khocircng coacute khả năng tự học tự cập nhật kiến thức mới như caacutec chuyecircn gia magrave cần phải được matilde hoacutea lại khi noacute được cập nhật

Hệ chuyecircn gia khocircng thể nhận ra được vấn đề khocircng nằm trong miền kiến thức của hệ thống

Chương 8 Tri thức vagrave tiếp nhận

1 Bao gồm caacutec vấn đề

Dữ liệu thực tế đo lường hoặc quan saacutet coacute hoặc khocircng coacute bối cảnh

Thocircng tin dữ liệu được tổng hợp một caacutech hữu iacutech để giải quyết những khoacute khăn trong việc đưa ra quyết định

Tri thức bao gồm caacutec ứng dụng quy tắc thocircng tin hướng dẫn của người ra quyết định

2 Những caacutei nhigraven về tri thức

Đại diện lagravem thế nagraveo để diễn tả tri thức viacute dụ như một quyển saacutech khocircng phải lagrave tri thức nhưng noacute lại lagrave một đại diện của tri thức

Sản xuất tri thức lagrave một tập hơp của hagraveng tồn kho coacute thể được sản xuất cũng như mua lại

Tri thức lagrave 1 trong 6 trạng thaacutei của hệ thống

1Dữ liệu 2Thocircng tin 3Cấu truacutec thocircng tin 4Sự thấu hiểu 5Yacute kiến 6 Quyết định

3 Caacutec loại tri thức Phổ biến mocirc tả dữ liệu thocircng tin thủ tục mọi thứ lagravem như thế nagraveo lập luận chiacutenh saacutech hoặc caacutec quy tắc

4 Thu thập Tri thức hệ chuyecircn gia Hầu hết caacutec phương phaacutep đều bắt đầu với mocirc higravenh của caacutec taacutec vụ trong đoacute

hệ chuyecircn gia được xacircy dựng Trong đoacute mocirc tả về caacutec lĩnh vực được tạo ra Caacutec kỹ sư sử dụng caacutec mocirc higravenh giả thuyết vagrave nhận thức về quaacute trigravenh phacircn

tiacutech để gợi ra caacutech giải quyết vấn đề về tri thức từ caacutec chuyecircn gia

5 Caacutec chiều của thu thập tri thức KE- driven caacutec kỹ sư trao đổi trực tiếp với caacutec chuyecircn gia Expert-driven Caacutec chuyecircn gia trực tiếp đưa chuyecircn mocircn của họ vagraveo hệ

thống maacutey tiacutenh Machine-driven Sử dụng caacutec cocircng cụ suy luận để triacutech xuất tri thức từ một

tập caacutec viacute dụ

6 Kỹ thuật thu thập tri thức Trao đổi gồm 2 loại cơ bản lagrave coacute cấu truacutec(coacute kịch bản) vagrave khocircng coacute cấu

truacutec( đối thoại trực tiếp) Giao thức phacircn tiacutech bằng lời Khi caacutec chuyecircn gia thực hiện một cocircng việc

của họ thigrave một bản ghi về cocircng việc đoacute được thực hiện Caacutec kỹ sư sẽ xacircy dựng mocirc higravenh cho những gigrave được ghi lại trong bản ghi

Phương phaacutep sagraveng lọc caacutec chuyecircn gia so saacutenh caacutec nhoacutem liecircn tiếp trong ba đối tượng vagrave cho biết tại sao nhoacutem thứ hai lại khaacutec nhoacutem thứ ba

7 Thu thập tri thức từ nhiều nguồn Thu thập tri thức từ nhiều nguồn lagrave cần thiết để coacute được đầy đủ caacutec tri thức

cho một vấn đề quan điểm yacute kiến traacutei ngược nhau thường phaacutet sinh Phương phaacutep đồng thuận sẽ giuacutep giải quyết được vấn đề macircu thuẫn Kỹ thuật phacircn tiacutech Meta lagrave kỹ thuật được aacutep dụng trong caacutec trường hợp

khaacutec Caacutech tiếp cận bằng định lượng đogravei hỏi caacutec kỹ sư cần cacircn nhắc yếu tố đầu vagraveo của caacutec chuyecircn gia khaacutec nhau

8 Xaacutec nhận hợp lệ vagrave kiểm tra tri thức Một khi thu thập tri thức noacute phải được đaacutenh giaacute về khả năng sử dụng vagrave độ

chiacutenh xaacutec Hai vấn đề cụ thể lagrave hiệu lực của những kiến thức vagrave kiểm tra việc xacircy dựng cơ sở của tri thức

Cần xaacutec nhận xem liệu hệ thống coacute thể hoạt động ở mức độ tối thiểu khocircng

Xaacutec minh liecircn quan đến việc so saacutenh từng chi tiết kỹ thuật của hệ thống những gigrave đatilde được thực hiện cuối cugraveng

9 Một số caacutec biện phaacutep xaacutec nhận Độ chiacutenh xaacutec Khả năng thiacutech nghi Mức độ đầy đủ Bề rộng Độ sacircu Hiệu lực Tổng quan Chiacutenh xaacutec Hiện thực Độ tin cậy Tiacutenh hữu dụng Mức độ

Chương 9 Học maacutey

1 Logic mờ vagrave ngocircn ngữ mờ(Fuzzy Logic and Linguistic Ambiguity)

Ngocircn ngữ tự nhiecircn gồm những khaacutei niệm mơ hồ vagrave khocircng chiacutenh xaacutectruyền tải ngữ nghĩa thocircng qua tiacutenh xấp xỉkhocircng rotilde ragraveng

Những xấp xỉ nagravey giuacutep con người coacute thể truyền tải hết được yacute nghĩa nhưng maacutey thigrave khocircng hiểu

Lagravem sao biểu diễn caacutec tri thức sử dụng caacutec khaacutei niệm khocircng rotilde ragraveng(mờ) hoặc khocircng chiacutenh xaacutec

2 Khaacutei niệm cơ bản của logic mờ tập mờ lagrave những tập hợp khocircng coacute một giới hạn rotilde Mỗi phần tử của noacute chỉ

chứa một mức độ hagravem liecircn thuộc của từng phần tử Vigrave vậy tập mờ khocircng giống như tập cổ điển Tập mờ coacute thể kết hợp với nhau qua những luật mờ magrave đặc trưng cho những hagravenh động trạng thaacutei vagrave thuộc tiacutenh của logic mờ được tận dụng khi thực hiện một bộ điều khiển mờ

Logic mờ dựa trecircn yacute tưởng mỗi phần tử thuộc vagraveo một tập hợp ở một mức độ nagraveo đấy

Locircgic mờ cho pheacutep độ liecircn thuộc (microA )coacute giaacute trị trong khoảng (01) Locircgic mờ coacute thể được coi lagrave mặt ứng dụng của lyacute thuyết tập mờ để xử lyacute caacutec

giaacute trị trong thế giới thực cho caacutec bagravei toaacuten phức tạp

3 So saacutenh tiacutenh đuacuteng đắn logic mờ vagrave xaacutec suất Xaacutec suất thigrave đề cập đến khả năng xảy ra một biến cố hay một điều gigrave đoacute Logic mờ đề cập đến cấp độ magrave đặc tiacutenh ở hiện tại

o viacute dụ1 người coacute chiều cao 6 feet thigrave coacute cấp độ lagrave 05 về chiều cao

4 Ưu điểm của logic mờ Caacutech tiếp cận rất tự nhiecircnkhocircng phức tạp Coacute thể mocirc higravenh hoacutea caacutec hagravem phi tuyến tugravey yacute phức tạp

Coacute thể tận dụng được kinh nghiệm từ những chuyecircn gia hagraveng đầu trong mọi lĩnh vực

Logic mờ được xacircy dựng dựa trecircn ngocircn ngữ tự nhiecircnNền tảng của logic mờ lagrave dựa trecircn cơ sở giao tiếp của con người

5 Nhược điểm của logic mờ Trong 1 hệ thống phức tạpsử dụng logic mờ coacute thể trở thagravenh trở ngại cho

việc xaacutec thực độ tin cậy của hệ thống Cơ chế lập luận mờ khocircng thể học hỏi từ những lỗi sai

6 Mạng noron nhacircn tạo(ANN) Mạng noron nhacircn tạo lagrave một mocirc phỏng xử lyacute thocircng tinđược nghiecircn cứu ra

từ hệ thống thần kinh của sinh vậtgiống như bộ natildeo để xử lyacute thocircng tin ANNs lagrave chương trigravenh dựa trecircn maacutey tiacutenh đơn giản coacute chức năng lagrave một mocirc

higravenh bagravei toaacuten khocircng gian dựa trecircn thử nghiệm vagrave baacuteo lỗi

7 Học từ kinh nghiệm Tiến trigravenh Một mẫu dữ liệu được biểu diễn như một mạng lưới noronANN ldquodự

đoaacutenrdquo 1 đầu radự đoaacuten được so saacutenh với giaacute trị thực tế hoặc giaacute trị chiacutenh xaacutecNếu đoaacuten được chiacutenh xaacutec thigrave khocircng coacute hagravenh động nagraveo được thực hiện

Nếu dự đoaacuten sai ANN kiểm tra lại vagrave xaacutec định lại thocircng số để điều chỉnh Một mẫu dữ liệu khaacutec được biểu diễn vagrave quaacute trigravenh nagravey được lặp lại

8 Nguyecircn tắc cơ bản của cocircng nghệ nơron Caacutec yếu tố xử lyacute cơ bản trong hệ thống thần kinh của con người lagrave tế bagraveo

thần kinhMạng lưới của tế bagraveo nagravey lagrave liecircn kết với nhau nhận được thocircng tin từ caacutec cảm biến trong mắt taihellip

Thocircng tin nhận được bởi tế bagraveo thần kinh hoặc lagrave sẽ kiacutech thiacutech noacute(sẽ được chuyển qua 1 thocircng điệp dọc theo mạng lưới) hoặc lagrave sẽ ngăn cản noacute(ngăn cản dograveng thocircng tin)

Độ nhạy coacute thể thay đổi qua thời gian hoặc sau khi coacute được kinh nghiệm

9 Cấu truacutec mạng Một ANN gồm 3 lớp cơ bản

Lớp đầu vagraveo nhận dữ liệu Lớp becircn trong hoặc lagrave lớp ẩn xử lyacute dữ liệu Lớp đầu ra chuyển tiếp kết quả cuối cugraveng của mạng

10Mạng nơ ron Thường coacute nhiều đầu vagraveo mỗi đầu vagraveo với mức ảnh hưởng vagrave tầm quan

trọng riecircng của noacute Một đầu vagraveo quan trọng coacute thể được sử dụng để khuếch đại đầu ra caacutec hagravem trạng thaacutei tổng hợp caacutec trọng số của caacutec yếu tố

đầuvagraveo khaacutec nhauvagraveo một giaacute trị duy nhất Caacutec hagravem chuyển giao xử lyacute caacutec giaacute trị trạng thaacutei vagrave tạo đầu ra

11Huấn luyện mạng nơ ron Trong mocirc higravenh coacute giaacutem saacutetANN được đến so saacutenh dự đoaacuten của chiacutenh

noacute với thocircng tin phản hồi coacute chứa caacutec kết quả mong muốn ANN sẽ phải tigravem caacutech thay đổi caacutec tham số becircn trong củamigravenh (caacutec trọng số vagrave caacutec ngưỡng) để tạo necircn một aacutenh xạ coacute khả năng aacutenh xạcaacutec đầu vagraveo thagravenh caacutec đầu ra mong muốn Sự thay đổi nagravey được tiến hagravenh nhờ việc so saacutenh giữa đầu ra thực sự vagrave đầu ra mong muốn

Trong mocirc higravenh khocircng coacute giaacutem saacutetANN nhận được dữ liệu vagraveo nhưng khocircng phải coacute bất kỳ thocircng tin phản hồi về kết quả mong muốn

Phần lớn caacutec ứng dụng nằm trong vugraveng của caacutec bagravei toaacuten ước lượng như mocirc higravenh hoacuteathống kecirc neacuten lọc phacircn cụm

12Lợi iacutech Liecircn kết với mạng noron Traacutenh caacutech lập trigravenh tường minh Giảm nhu cầu của chuyecircn gia ANNs thigrave thiacutech nghi với caacutec yếu tố đầu vagraveo thay đổi Khocircng cần thiết cho cơ sở tri thức tinh chế ANNs coacute tiacutenh động vagrave cải thiện với việc sử dụng Coacute khả năng xử lyacute dữ liệu khocircng chiacutenh xaacutec hoặc khocircng đầy đủ Cho pheacutep tổng quaacutet hoacutea từ thocircng tin cụ thể Cho pheacutep thu thập cảm giaacutec thocircng thường vagraveo miền giải quyết vấn đề

13Hạn chế của việc liecircn kết với mạng noron ANNs khocircng thể giải thiacutech được suy luận Bản chất hộp đen thường khiến cho vấn đề traacutech nhiệm vagrave độ tin cậy phaacutet

sinh lagrave khoacute khăn Lặp đi lặp lại quaacute trigravenh huấn luyện rất tốn thời gian Nguồn lực caacutec nhagrave phacircn tiacutech vagrave thiết kế coacute tay nghề cao vẫn lagrave đaacuteng lo

ngại Cocircng nghệ ANN thuacutec đẩy hạn chế của phần cứng hiện tại ANN yecircu cầu phải coacute sự tin tưởng ở đầu ra

14Giới thiệu về thuật toaacuten di truyền Cũng như mạng lưới thần kinh caacutec thuật toaacuten di truyền được dựa trecircn lyacute

thuyết sinh học Thuật toaacuten di truyền tigravem thấy nguồn gốc của chuacuteng trong caacutec lyacute thuyết

tiến hoacutea của chọn lọc tự nhiecircn vagrave thiacutech ứng với biến đổi khiacute hậu Kết quả thuật toaacuten di truyền lagrave từ giao phối 2 caacute thể trong quần thế để tạo

ra con caacutei đocirci khi tốt hơn so với bậc cha mẹ của chuacuteng 15Caacutec thagravenh phần cơ bản của thuật toaacuten di truyền

Toaacuten tử chọn lọc Caacutec caacute thể tốt được chọn lọc để đưa vagraveo thế hệ sau Sự chọn lọc nagravey căn cứ vagraveo độ thiacutech nghi với mocirci trường của mỗi caacute thể

Toaacuten tử lai gheacutep (crossover) Hai caacute thể cha vagrave mẹ trao đổi caacutec gen với nhau để tạo ra caacute thể con

Toaacuten tử đột biến (mutation) Một caacute thể thay đổi một số gen để biến đổi thagravenh một caacute thể mớiTất cả caacutec toaacuten tử trecircn khi thực hiện đều mang tiacutenh ngẫu nhiecircn

16Quaacute trigravenh cơ bản của một thuật toaacuten di truyền Khởi tạo

Đaacutenh giaacute quần thể

Lựa chọn NST thiacutech hợp nhất vagrave loại bỏ NST yếu nhất

Quy trigravenh giao nhau vagrave cải thiện quần thể

đột biến tiến trigravenh để khaacutem phaacute ra NST mới

17Ưu nhược điểm của việc kết hợp với thuật toaacuten di truyền Kiacutech thước quần thể lagrave 1 yếu tố quan trọng trong tốc độ của việc tigravem

kiếmnhưng noacute tương đối dễ dagraveng để dự đoaacuten tốc độ nagravey Giao nhau hoặc đột biến lagrave khocircng necircn đc sử dụng quaacute thường xuyecircn Luocircn coacute được iacutet nhất 1 giải phaacutep hợp lyacute Necircn coacute thể aacutep dụng chuacuteng cho caacutec vấn đề magrave chuacuteng ta khocircng coacute hướng

về caacutech giải quyết Sức mạnh của thuật toaacuten xuất phaacutet từ khaacutei niệm đơn giảnkhocircng phải từ

một thủ tục thuật toaacuten phức tạp 18Tương lai của học maacutey

Mạng lưới thần kinh nhacircn tạo vượt quaacute năng lực của con người trong caacutec trường hợp bị cocirc lập

Về mặt lyacute thuyếtmột maacutey tiacutenh coacute thể xử lyacute dũ liệu nhanh hơn hagraveng triệu lần so với 1 con người

May mắn thay cho chuacuteng tacon người tốt hơn nhiều khi magrave coacute được dữ liệumaacutey tiacutenh khocircng coacute 1 số thứ như lagrave 5 giaacutec quan

CHƯƠNG 10 KHO DỮ LIỆU

1 Kho dữ liệu Kho dữ liệu lagrave tuyển tập caacutec cơ sở dữ liệu tiacutech hợp hướng chủ đề được

thiết kế để trợ giuacutep cho một hệ hỗ trợ quyết định

Theo John Ladley Cocircng nghệ kho dữ liệu lagrave tập caacutec phương phaacutep kỹ thuật vagrave caacutec cocircng cụ coacute thể kết hợp hỗ trợ nhau để cung cấp thocircng tin cho người sử dụng trecircn cơ sở tiacutech hợp từ nhiều nguồn dữ liệu nhiều mocirci trường khaacutec nhau

Kho dữ liệu thường rất lớn tới hagraveng trăm GB hay thậm chiacute hagraveng Terabyte

2 Kho dữ liệu vận hagravenh (ODS) Một kho dữ liệu vận hagravenh Aacutep dụng kỹ thuật kho dữ liệu vagraveo caacutec hệ xử

lyacute giao taacutec lưu trữ dữ liệu cho một ứng dụng đặc thugrave Noacute đưa vagraveo kho dữ liệu một dograveng caacutec dữ liệu thocirc được thiết kế

3 So saacutenh

Kho dữ liệu vận hagravenh Kho dữ liệu

Dữ liệu theo chủ đề Dữ liệu theo chủ đề

Dữ liệu tiacutech hợp Dữ liệu tiacutech hợp

Dữ liệu thay đổi Dữ liệu khocircng thay đổi

Dữ liệu được cập nhật khi thay đổi

Dữ liệu giữ nguyecircn

Chỉ coacute dữ liệu hiện tạiDữliệu hiện tại vagrave dữ liệu lịch sử

Chu kỳ lagravem tươi dữ liệu ngắn Chu kỳ lagravem tươi dữ liệu dagravei

Chỉ coacute dữ liệu chi tiết Dữ liệu chi tiết vagrave dữ liệu tổng kết

Dugraveng cho caacutec quyết định ngắn hạn

Dugraveng cho hoạch định dagravei hạn

4 Kho dữ liệu cục bộ (Data Mart - DM)

Kho dữ liệu cục bộ lagrave CSDL coacute những đặc điểm giống với kho dữ liệu nhưng với quy mocirc nhỏ hơn vagrave lưu trữ dữ liệu về một lĩnh vực một chuyecircn ngagravenh

Data mart phụ thuộc Chứa những dữ liệu được lấy từ DW vagrave những dữ liệu nagravey sẽ được triacutech lọc vagrave tinh chế tiacutech hợp lại ở mức cao hơn để phục vụ một chủ đề nhất định của Datamart

Data mart độc lập Khocircng giống như Datamart phụ thuộc Data mart độc lập được xacircy dựng trước DW vagrave dữ liệu được trực tiếp lấy từ caacutec nguồn khaacutec nhau

5 Siecircu dữ liệu Metadata lagrave dữ liệu để mocirc tả dữ liệu Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột

một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi Metadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu

6 Mocirci trường kho dữ liệu Hệ thống của tổ chức vagrave kho cung cấp dữ liệu để xacircy dựng kho dữ liệu Trong quaacute trigravenh chuyển dữ liệu từ caacutec nguồn khaacutec nhau dữ liệu coacute thể

được lagravem sạch hoặc chuyển đổi vagrave vigrave thế DW được xem như lagrave một chuẩn cho việc lưu trữ

Đồng thời siecircu dữ liệu được ghi lại Cuối cugraveng DW hoặc siecircu thị coacute thể được sử dụng để tạo ra một kho dữ

liệu ldquocaacute nhacircnrdquo 7 Caacutec đặc điểm của kho dữ liệu

Đặc điểm Mocirc tả

Hướng chủ đề - DL tổ chức theo caacutech thức người dugraveng tham chiếu

Tiacutech hợp - Dữ liệu ldquosạchrdquo loại bỏ tiacutenh thiếu nhất quaacuten

Khocircng thay đổi - DL ldquochỉ đọcrdquo người dugraveng khocircng thay đổi được

Chuỗi thời gian - DL lagrave chuỗi thời gian khocircng phải lagrave trạng thaacutei hiện tại

Được tổng kết - DL vận hagravenhthao taacutec khi cần thiết

được kết hợp lại thagravenh dạng coacute thể dugraveng được cho quyết định

Kiacutech cỡ lớn hơn - Lưu giữ theo chuỗi thời gian tức lagrave giữ lại nhiều DL

Khocircng được chuẩn hoacutea - Coacute thể dư thừa DLSiecircu dữ liệu - Dữ liệu của dữ liệu được lưu trữNguồn dữ liệu - DL vận hagravenh (caacutec hệ sẵn coacute) cugraveng

với caacutec nguồn ngoagravei 8 Kho dữ liệu hướng chủ đề

Hướng chủ để coacute nghĩa lagrave kho dữ liệu được tổ chức xung quanh caacutec chủ đề chiacutenh như khaacutech hagraveng sản phẩm sản xuất Tập trung vagraveo việc mocirc higravenh hoacutea vagrave phacircn tiacutech dữ liệu cho caacutec nhagrave ra quyết định magrave khocircng tập trung vagraveo caacutec xử lyacute thocircng thường Cung cấp cho người dugraveng một khung nhigraven toagraven vẹn đơn giản vagrave đầy đủ về caacutec sự kiện quanh caacutec chủ đề

9 Dữ liệu trong DW được tiacutech hợp Dữ liệu trong kho dữ liệu được xacircy dựng bằng caacutech tổng hợp dữ liệu từ

nhiều nguồn khaacutec nhau vagrave caacutec nguồn coacute tổ chức khaacutec nhau Cơ sở dữ liệu caacutec file excel caacutec flat file hoặc caacutec raw file Khi đưa vagraveo kho dữ liệu caacutec dữ liệu được lagravem sạch vagrave tiacutech hợp dữ liệu nhằm đảm bảo tiacutenh nhất quaacuten của dữ liệu

10Kiến truacutec kho dữ liệu Tầng cơ sở dữ liệu hoạt động Tầng truy xuất thocircng tin Tầng truy xuất dữ liệu Tầng siecircu dữ liệu Tầng quản lyacute tiến trigravenh Tầng thocircng điệp của ứng dụng Tầng vật liacute của kho dữ liệu Tầng trigravenh diễn dữ liệu

11Higravenh trạng kho dữ liệu Kho dữ liệu ảo - người dugraveng cuối coacute thể truy cập trực tiếp đến kho dữ liệu

sử dụng caacutec cocircng cụ cho pheacutep ở tầng truy xuất dữ liệu Kho dữ liệu trung tacircm-1 cơ sở dữ liệu vật lyacute chứa tất cả dữ liệu cho một

vugraveng chuyecircn dụng nagraveo đoacute

Kho dữ liệu phacircn taacuten- Thagravenh phần được phacircn taacuten qua nhiều hệ cơ sở dữ liệu vật lyacute

12METADATA- Siecircu dữ liệu Định nghĩa Siecircu dữ liệu lagrave dữ liệu về dữ liệu Lagrave 1 lưu trữ dugraveng để

Miecircu tả kho dữ liệu tổng thể Nhận dạng kiểu kho dữ liệu Quản liacute quaacute trigravenh tiacutech hợp dữ liệu Quản liacute quaacute trigravenh cập nhật kho dữ liệu Quản liacute bảo mật

Lagrave chigravea khoacutea quyết định sự thagravenh cocircng của kho dữ liệu luocircn được thay đổi vagrave cập nhật theo sự phaacutet triển của kho dữ liệu

Dugraveng để quản liacute điều khiển kho dữ liệu Sự ra đời của kho dữ liệu như 1 cấu truacutec hỗ trợ ra quyết định siecircu dữ liệu

được xem như nguồn tagravei nguyecircn dữ liệu Siecircu dữ liệu lagrave trừu tượng Chuacuteng lagrave dữ liệu bậc cao cung cấp mocirc tả ngắn

gọn caacutec dữ liệu bậc thấp hơn 13Hoạt động của Siecircu dữ liệu

Siecircu dữ liệu rất cần thiết trong việc chuyển hoacutea thocircng tin trở thagravenh tri thức Lagrave chigravea khoacutea giuacutep chuacuteng ta xử lyacute được dữ liệu thocirc Viacute dụ một dograveng dữ liệu baacuten hagraveng 1023 K596 11121 agraveNoacute sẽ khocircng coacute nghĩa gigrave cho đến khi chuacuteng ta đưa vagraveo siecircu dữ liệu (thư

mục chứa dữ liệu) agrave cửa hagraveng 1023 sản phẩm K596 vagrave số tiền baacuten được lagrave 11121 đocirc la

14Sự cần thiết phải nhất quaacuten trong kho dữ liệu Kho dữ liệu được xacircy dựng cho lợi iacutech của những nhagrave phacircn tiacutech kinh

doanh caacutec nhagrave quản trị cho tất cả caacutec khu vực chức năng Trong cơ sở dữ liệu riecircng caacutec khu vực khaacutec nhau coacute thể định nghĩa vagrave lưu

trữ dữ liệu thocircng qua phiecircn bản của chiacutenh noacute Khi dữ liệu được lấy từ những vugraveng khaacutec nhau đoacute vagrave được đặt vagraveo kho dữ

liệu Việc chuyển đổi vagrave lagravem sạch caacutec tiến trigravenh sẽ đảm bảo noacute lagrave duy nhất được tiacutech hợp tại một mức của tổ chức

15Ragrave soaacutet lại dữ liệu ndash Thực thi siecircu dữ liệu

Bất kể cấu truacutec tự nhiecircn của 1 cacircu truy vấn thế nagraveo thigrave caacutec thagravenh phần của siecircu dữ liệu rất quan trọng đối với người ra quyết định

Bảng thuộc tiacutenh khoacutea được lưu trữ bởi kho dữ liệu Tập hợp dữ liệu được lấy từ đacircu Những chuyển đổi nagraveo được thực thi với việc lagravem sạch

16Siecircu dữ liệu lagrave gigrave Metadata - lagrave thocircng tin mocirc tả nội dung của cơ sở dữ liệu (CSDL) Metadata baacuteo cho người dugraveng biết thời gian cập nhật sau cugraveng của dữ liệu

định dạng vagrave mục điacutech sử dụng của noacute Những thocircng tin nagravey coacute thể hướng dẫn người dugraveng duyệt qua CSDL vagrave

giuacutep họ hiểu được yacute nghĩa vagrave ngữ cảnh của dữ liệu Trong CSDL metadata lagrave caacutec dạng biểu diễn khaacutec nhau của caacutec đối tượng

trong CSDL Trong CSDL quan hệ metadata lagrave caacutec định nghĩa của bảng cột CSDL

view vagrave nhiều đối tượng khaacutec Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột

một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi -gtMetadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu

Bảng chuyển đổi Ghi lại những chuyển đổi đatilde được thực hiện

Lịch sử thực thi Ghi lại những dữ liệu đatilde được

phacircn tiacutech

Higravenh thaacutei kết nốiGhi lại những dữ liệu được kết nối vagrave tần suất

17Aacutenh xạ thocircng thường của siecircu dữ liệu Bản ghi aacutenh xạ chuyển đổi bao gồm

Định danh của nguồn gốc Chuyển đổi thuộc tiacutenh Chuyển đổi thuộc tiacutenh vật lyacute Matilde hoacutea tham chiếu bảng chuyển đổi Đổi tecircn Đổi khoacutea Gaacuten giaacute trị cho thuộc tiacutenh mặc định Chọn logic cho caacutec nguồn nhiều giaacute trị Đổi thuật toaacuten

18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để

phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai

lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave

tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec

Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm

Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo

19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua

caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau

SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được

Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra

một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức

Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ

Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ

Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech

CHƯƠNG 11 KHAI PHAacute DỮ LIỆU

1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn

ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993

Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng

2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd

1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều

2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP

3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn

4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng

5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server

6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo

7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động

8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời

9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều

10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện

11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech

12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP

3 Xử lyacute phacircn tiacutech trực tuyến OLAP

MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave

dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu

ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave

thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu

HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave

ROLAP4 Khai phaacute dữ liệu

Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh

khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn

Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan

5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp

6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại

Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp

Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec

Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt

Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra

Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh

vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho

Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec

Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm

Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục

Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng

gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp

Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn

Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec

Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper

Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2

Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25

Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước

Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng

Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện

trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp

Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute

độ hỗ trợ ge ngưỡng minsup

độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan

Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn

Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết

Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu

MOLAP ROLAP HOLAP

Lưu trữ dữ liệu cơ sở

Khối Bảng quan hệ Bảng quan hệ

Lưu trữ thocircng tin tổng hợp

Khối Bảng quan hệ Khối

Hiệu suất thực hiện truy vấn

Nhanh nhất Chậm nhất Nhanh

Tiecircu thụ khocircng gian lưu trữ

Nhiều Thấp Trung bigravenh

Chi phiacute bảo trigrave Cao Thấp Trung bigravenh

Page 4: De cuong(1-11)

Thocircng thường giao diện cagraveng gần gũi thigrave cagraveng iacutet đogravei hỏi việc huấn luyện người dugraveng Hatildey suy nghĩ xem coacute bao nhiecircu chương trigravenh Windows dugraveng cugraveng cấu truacutec menu như Microsoft Word

Caacutec chức năng chiacutenh của một giao diện của DSS Communication language vagrave Presentation language

Communication language ndash Cho pheacutep tương taacutec với DSS theo nhiều caacutech xaacutec định caacutec dạng input cung cấp caacutec hỗ trợ cho người dugraveng thu giữ caacutec hội thoại đatilde qua để cải thiện caacutec tương taacutec trong tương lai

Presentation language ndash Cung cấp khả năng thể hiện dữ liệu theo nhiều caacutech cho pheacutep sinh caacutec baacuteo caacuteo chi tiết cung cấp nhiều khung nhigraven khaacutec nhau về dữ liệu

7Vai trograve người dugraveng Trong một DSS người dugraveng cũng lagrave một thagravenh phần của hệ thống giống như

hardware vagrave software User roles Người dugraveng được phacircn thagravenh 5 lớp (decision maker

intermediary maintainer operator and feeder) Patterns of DSS use Lagrave sự phacircn loại tiến theo của caacutec user roles khaacutec nhau

thagravenh 1 trong 4 basic patterns of use Slide tiếp theo sẽ mocirc tả caacutec patterns nagravey

8Caacutec mocirc higravenh sử dụng DSS Subscription mode _nhagrave sản xuất quyết định nhận caacutec baacuteo caacuteo thường

xuyecircn theo dự kiến Terminal mode_ nhagrave sản xuất quyết định tương taacutec trực tiếp với DSS Clerk mode - nhagrave sản xuất quyết định sử dụng hệ thống trực tiếpnhưng

khocircng trực tuyến Đầu ra phản hồi coacute thể mất một thời gian Intermediary mode - nhagrave sản xuất quyết định tương taacutec thocircng qua việc sử

dụng mộthoặc nhiều mocirc higravenh trung gian9Danh mục vagrave lớp của DSSCoacute nhiều phương phaacutep để cố gắng phacircn loại caacutec DSSs

Data-centric and model-centric Formal and ad hoc systems Directed versus nondirected DSSs Procedural and nonprocedural systems Hypertext systems Spreadsheet systems Individual and group DSSs

Caacutec đặc trưng thống nhất của mỗi lược đồ cụ thể giữ vai trograve quan trọng trong việc xaacutec định caacutech tiếp cận tốt nhất để thiết kế một hệ thống mới

Chương 2Quyết định vagrave quyết định của nhagrave sản xuất10Quaacute trigravenh ra quyết định

Quaacute trigravenh ra quyết định gồm coacute 3 giai đoạn (Simon 1977)bull Tigravem hiểu bagravei toaacuten dẫn đến quyết định

+Xaacutec định mục tiecircu tổ chức+Tigravem kiếm vagrave tập hợp dữ liệu+Nhận diện xaacutec định chủ thể bagravei toaacuten+phacircn loại vagrave phaacutet biểu vấn đề

bull Thiết kế (design) phacircn tiacutech vagrave xacircy dựng caacutec diễn trigravenh hagravenh động+Thiết lập mocirc higravenh+Lập bảng tiecircu chuẩn chọn lựa+Tigravem kiếm caacutec phương aacuten+Tiecircn đoaacuten vagrave đo lường caacutec kết cục

bull Chọn lựa (choice) chọn một diễn trigravenh trong tập diễn trigravenh+Giải phaacutep cho mocirc higravenh+Phacircn tiacutech độ nhạy+Chọn (caacutec) phương aacuten tốt nhất+Hoạch định việc hiện thực

tiếp theo giai đoạn chọn lựa lagrave giai đoạn hiện thực (implementation)11Người ra quyết định

Người ra quyết định (decision maker) giữ một vai trograve tacircm thần phacircn liệt vigrave vừa được coi lagrave một bước trong quaacute trigravenh vagrave cũng lại lagrave người tham gia

Phacircn lớp người ra quyết định-Quyết định caacute nhacircn coacute thể lagrave 1 người hoặc một hệ thống maacutey tiacutenh đơn lẻ-Nhiều người ra quyecirct định coacute thể lagrave

+Nhoacutem (group)trong đoacute mọi thagravenh viecircn đều coacute tiếng noacutei trong việc ra quyết định

+Đội(team) Caacutec thagravenh viecircn hỗ trợ một người ra quyết định duy nhất+Tổ chứcTrong đoacute cần sự thỏa thuận chung

12Caacutec kiểu ra quyết định Style lagrave caacutech magrave người quản lyacute ra quyết định

Hiệu lực của mỗi style riecircng biệt phụ thuộc vagraveo ngữ cảnh bagravei toaacuten nhận thức của người ra quyết định vagrave tập caacutec giaacute trị caacute nhacircn của bản thacircn họ

Độ phức tạp của caacutec điều đoacute liecircn kết lại với nhau trong việc higravenh thagravenh decision style

Caacutec kiểu ra quyết định Directive ndash kết hợp đogravei hỏi về cấu truacutec bagravei toaacuten cao với mức độ nhập nhằng thấp

Thocircng thường đacircy lagrave caacutec quyết định coacute bản chất kỹ thuật vagrave đogravei hỏi iacutet thocircng tin Analytical ndash Mức độ nhập nhằng lớn hơn vagrave đogravei hỏi nhiều thocircng tin hơn Conceptual ndash Mức độ nhập nhằng cao vagrave thường gần gũi với caacutech ra quyết định

của con người Behavioral ndash đogravei hỏi lượng dữ liệu nhỏ vagrave thể hiện caacutei nhigraven ngắn hạn Thường

xảy ra xung đột necircn phải dựa vagraveo sự đồng thuận Caacutec kiểu ra quyết định trong thiết kế hệ trợ giuacutep quyecirct định

Những cản trở lớn chiacutenh lagrave phản ứng của người ra quyết định trước aacutep lực vagrave phương phaacutep dugraveng để giải bagravei toaacuten

Viacute dụ đối với những người khocircng chịu được aacutep lực trong dạng directive thigrave giao diện cần cho pheacutep người ra quyết định kiểm soất được hệ thống với khocircng coacute quaacute nhiều dữ liệu đầu vagraveo

Đối với kiểu analytic DSS cần cho pheacutep truy cập tới nhiều nguồn dữ liệu magrave người ra quyết định sẽ phacircn tiacutech

13Khoacute khăn khi xacircy dựng DSS

- Thocircng tin mocirc higravenh cấu truacutec -gt iacutet thocircng tin

- Khả năng của con người (khả năng hiểu biết) chỉ xử lyacute được từ 5-gt9 quaacute trigravenh thocircng tin khaacutec nhau

- Khocircng chắc chắn ( mức độ hoagraven thagravenh vagrave tiacutenh chiacutenh xaacutec)

- Coacute nhiều lựa chọn vagrave đa mục tiecircu

Chương 3Quyết định trong tổ chức

14Tổ chức lagrave gigrave Tổ chức Lagrave 1 hệ thống thống nhất caacutec nguồn tagravei nguyecircnĐược cấu thagravenh bởi caacutec

hệ thống nhỏ hơn ragraveng buộc với nhau bởi caacutec mục tiecircu đề ra

Tổng thể 1 tổ chức sẽ mạnh mẽ hơn rất nhiều so với tất cả caacutec thagravenh phần của noacute cộng lại

Mối liecircn hệ của caacutec quyecirct định Mục điacutech chiacutenh của caacutec tổ chức lagrave đưa ra caacutec quyết định trong mocirci trường kinh doanh Caacutec Quyết định phải phugrave hợp với giới hạncaacutec chiacutenh saacutech caacutec thủ tục vagrave lĩnh vực hoạt động Noacute khocircng phụ thuộc vagraveo người đưa ra quyết định lagrave ai Đoacute coacute thể lagrave 1 caacute nhacircn1 nhoacutem hay thậm chiacute DSSs

Độ đo của quyết địnhNăm khiacutea cạnh ảnh hưởng tới Quyết định

Kết cấu nhoacutem (Group Structure) Vai trograve trong nhoacutem(Group Roles) Quaacute trigravenh lagravem việc(Group Processes) Taacutec phong(Group Style) Quy tăc nhoacutem(Group Norm)

Kết cấu nhoacutem Trong 1 nhoacutem chuẩn caacutec thagravenh viecircn coacute traacutech nhiệm vagrave thẩm quyền ra quyết định như nhau Vai trograve trong nhoacutemTrong nhoacutem caacutec thagravenh viecircn đều coacute vai trograve riecircng vagrave

lagrave 1 phần quan trong trong cả tiến trigravenh Quaacute trigravenh lagravem việcQuaacute trigravenh dugraveng người trong nhoacutem ảnh hưởng tới loại

quyết định gacircy hiệu quả vagrave ảnh hưởng tới cả tiến trigravenh Taacutec phong Coacute phải taacutec phong của người ra quyết định coacute ảnh hưởng tới

chất lượng quyết định cuối khocircng Quy tắc nhoacutemQuy tắc nhoacutem lagrave cực kỳ quan trọng trong việc xaacutec định

hagravenh vi caacutec thagravenh viecircn nhoacutem trong caacutec tigravenh huống xatilde hội Phacircn cấp quyết định trong tổ chức3 cấp

Chiến lược Ban latildenh đạo cấp cao hoặc nhagrave quản lyacute Caacutec quyết định mang tiacutenh lacircu dagravei nhất

Chiến thuật Quản lyacute tầm trung Thực thi caacutec quyết định chiến lược đề ra

Thực hiện

Caacute nhacircn chuyecircn ngagravenh Tự đưa ra caacutec quyết định từng ngagravey

15Năng lực của hệ HTQD

1 HHTQĐ cơ bản hỗ trợ caacutec nhagrave ra quyết định trong caacutec tigravenh huống nửa cấu truacutec vagrave phi cấu truacutec bằng caacutech kết hợp phaacuten xử của con người vagrave xử lyacute thocircng tin bằng maacutey tiacutenh Caacutec bagravei toaacuten như vậy khocircng thểkhocircng thuận tiện giải quyết được chỉ bằng caacutec cocircng cụ maacutey tiacutenh hoacutea hay caacutec phương phaacutep định lượng 2 Phugrave hợp cho caacutec cấp quản lyacute khaacutec nhau từ cao đến thấp 3 Phugrave hợp cho caacute nhacircn lẫn nhoacutem Caacutec bagravei toaacuten iacutet coacute tiacutenh cấu truacutec thường liecircn đới đến nhiều caacute nhacircn ở caacutec đơn vị chức năng hay mức tổ chức khaacutec nhau cũng như ở caacutec tổ chức khaacutec 4 Hỗ trợ cho caacutec quyết định tuần tự liecircn thuộc được đưa ra một lần vagravei lần hay lặp lại 5 Hỗ trợ cho caacutec giai đoạn của quaacute trigravenh ra quyết định tigravem hiểu thiết kế lựa chọn vagrave hiện thực 6 Phugrave hợp cho một số caacutec phong caacutech vagrave quaacute trigravenh ra quyết định 7 Coacute thể tiến hoacutea theo thời gian Người dugraveng coacute thể thecircm bỏ kết hợp thay đổi caacutec phần tử cơ bản của hệ thống 8 Dễ dugraveng vagrave thacircn thiện với người dugraveng 9 Nhằm vagraveo nacircng cao tiacutenh hiệu dụng của quyết định (chiacutenh xaacutec thời gian tiacutenh chất lượng) thay vigrave lagrave tiacutenh hiệu quả (giaacute phiacute của việc ra quyết định) 10 Người ra quyết định kiểm soaacutet toagraven bộ caacutec bước của quaacute trigravenh ra quyết định HHTQĐ chỉ trợ giuacutep khocircng thay thế người ra quyết định 11 Người dugraveng cuối cugraveng coacute thể tự kiến tạo vagrave sửa đổi caacutec hệ thống nhỏ vagrave đơn giản 12 Thường dugraveng mocirc higravenh để phacircn tiacutech caacutec tigravenh huống ra quyết định 13 Cung ứng caacutec truy đạt dữ liệu từ nhiều nguồn dạng thức vagrave kiểu khaacutec nhau 14 Coacute thể dugraveng như một cocircng cụ độc lập hay kết hợp với caacutec HHTQĐứng dụng khaacutec dugraveng đơn lẻ hay trecircn một mạng lưới maacutey tiacutenh (intranet extranet) bất kỳ với cocircng nghệ WEB

16Văn hoacutea tổ chứcVăn hoacutea của tổ chức lagrave tập hợp của rất nhiều thứ (lograveng tin biểu tượng đặc trưng regraven luyện) được phaacutet triển qua thời gian dagravei

Noacute gacircy ra ảnh hưởng mạnh mẽ cograven hơn cả những hoạt động của tổ chức đoacute 10 đặc điểm văn hoacutea của tổ chức

Điều khiển Hệ thống khen thưởng Sự đồng nhất Chịu đựng xung đột Mocirc higravenh giao tiếp Hỗ trợ quản lyacute Sự hogravea nhập Định hướng Chịu đựng rủi ro Caacute nhacircn khởi xướng

Mối quan hệ của văn hoacutea với hiệu năng lagravem việc1 tổ chức thagravenh cocircng phải coacute xu hướng hogravea hợp giữa văn hoacutea với mocirci trường trong vagrave ngoagravei tổ chức

Phugrave hợp trong nội bộ cho thấy một sự kết hợp giữa văn hoacutea của tổ chức với những cocircng nghệ của chiacutenh noacute

Phugrave hợp với becircn ngoagravei cho thấy một nền văn hoacutea phugrave hợp với chiến lược thị trường

Văn hoacutea vagrave sự thay đổi 1 tổ chức magrave khocircng biết thay đổi văn hoacutea sẽ khocircng thể giữ được vị triacute của migravenh trecircn thị trường Caacutec cocircng ty xuất sắc luocircn biết caacutech tiacutech cực tiếp cận khaacutech hagraveng động viecircn đầu tư

17Quyền lực vagrave chiacutenh trịQuyền lực vagrave chiacutenh trị luocircn đi liền với nhau

aQuyền lựclagrave khả năng ảnh hưởng đến việc phacircn phối caacutec nguồn lực trong tổ chứcGồm 5 yếu tố cơ bản

Phacircn quyền Uy quyền Quyền lực caacute nhacircn Sức ảnh hưởng Chiacutenh trị

Một vagravei thagravenh phần của quyền lực ra quyết định Quyết định việc nagraveo coacute sẵn

Quyết định sản phẩm nagraveo được sản xuất Quyết định đầu tư vagraveo đacircu Quyền đặt vagrave quản lyacute quản lyacute giaacute Thanh toaacuten vagrave khấu trừ tiền latildei

bChiacutenh trị Yếu tố cốt lotildei trong quaacute trigravenh higravenh thagravenh chiến lược ra quyết định Chiacutenh trị liecircn quan tới việc ra quyết định thocircng qua đagravem phaacutenảnh hưởngvagrave higravenh

thagravenh sự nhất triacute Trong nhiều trường hợp noacute coacute thể cho ta sự linh hoạt hơn

18Hệ trợ giuacutep quyết định trong tổ chức DSS của 1 tổ chức hỗ trợ cocircng nghệ tập trung vagraveo caacutec quyết định ảnh hưởng tới

rất nhiều người 1 hệ thống DSS hiện đại coacute thể chấp nhận nhiều quyết định vượt qua những giới

hạn phacircn cấp truyền thống aCaacutec hoạt động gần DSS

Giải quyết caacutec nhiệm vụ đặc biệt Thu thập thocircng tin Liecircn lạc qua caacutec chi nhaacutenh Động thaacutei chiacutenh trị

Phacircn loại tư duy chiến lược cho DSS Sắp xếp quyết địnhXếp hạng quyết định sao cho thứ tự đứng trước thigrave được

ưu tiecircn trước Chia sẻ thocircng tinCaacutec quyecirct định coacute thể độc lập nhưng người ra quyết định

phải chia sẻ caacutec thocircng tin liecircn quan Lựa chọn đagravem phaacutenVagravei quyết định coacute thể xaacutec lập thocircng qua đagravem phaacuten vagrave kết

quả được lagravem đồng thờiKhocircng phải cocircng nghệ tự noacute coacute thể đưa ra quyết định magrave noacute nằm ở trigravenh độ cocircng nghệ hỗ trợ caacutec chiến lược quyết định quyền lực vagrave chiacutenh trị cugraveng phối hợp với nhau

Chương 4Mocirc higravenh hoacutea quaacute trigravenh ra quyết định

(Cấu truacutec của hệ HTQD)19Vấn đề Mocirc higravenh

bull Lagrave phần tử chủ chốt trong hầu hết hệ hỗ trợ quyết định vagrave lagrave điều kiện cần trong hệ hỗ trợ quyết định dựa vagraveo mocirc higravenh (model-based DSS)

bull Coacute nhiều lớp mocirc higravenh kegravem theo lagrave caacutec kỹ thuật xử lyacute thao taacutec mocirc higravenh đặc thugrave tương ứng

bull Caacutec vấn đề chiacutenh nhận diện bagravei toaacuten vagrave phacircn tiacutech mocirci trường nhận diện biến số dự baacuteo đa mocirc higravenh caacutec phạm trugrave mocirc higravenh quản lyacute mocirc higravenh vagrave mocirc higravenh hoacutea dựa vagraveo kiến thức

bull Mocirc higravenh hoacutea lagrave taacutec vụ khocircng đơn giản Người xacircy dựng mocirc higravenh phải cacircn bằng giữa tiacutenh đơn giản của mocirc higravenh với caacutec yecircu cầu biểu diễn để mocirc higravenh coacute thể nắm bắt đủ thực tại cần thiết cho người ra quyết định

bull Mocirc phỏng lagrave kỹ thuật mocirc higravenh hoacutea thocircng dụng dugraveng để tigravem hiểu vấn đề tuy khocircng nhất thiết phải tigravem ra được caacutec giải phaacutep biến thể mở rộng quaacute trigravenh ra quyết định của tổ chức vagrave cho pheacutep tổ chức xem xeacutet taacutec độngảnh hưởng của caacutec chọn lựa tương lai

bull Mocirc phỏng tiết kiệm rất nhiều chi phiacute vagrave thời gian ndash rất dễ thay đổi mocirc higravenh hoạt động của một hệ thống vật lyacute bằng mocirc higravenh hoacutea maacutey tiacutenh

bull Mocirc higravenh coacute thể được phaacutet triển vagrave cagravei đặt bằng một số caacutec ngocircn ngữ lập trinh (thế hệ 3 4 ) vagrave hệ thống phần mềm khaacutec nhau

Mocirc higravenh tĩnh vagrave động

bull Mocirc higravenh tĩnh thể hiện bức tranh tại thời điểm của tigravenh huống Caacutec khiacutea cạnh của bagravei toaacuten được xeacutet một thời kỳ nhất định trong một khung thời gian nhất định (coacute thể ldquocuốnrdquo về tương lai) Caacutec tigravenh huống được giả sử lagrave sẽ lập lại với tập caacutec điều kiện đồng nhất

1048713 Giả định coacute được tiacutenh ổn định của dữ liệu 1048713 Mocirc phỏng quaacute trigravenh dạng tĩnh - lagravem việc trecircn caacutec trạng thaacutei ổn định để tigravem ra caacutec

thocircng số tối ưu ndash thường được dugraveng như cocircng cụ chủ yếu để thiết kế quaacute trigravenh 1048713 vd quyết định sản xuấtmua 1 sản phẩm baacuteo caacuteo thu nhập hagraveng quyacutenăm bull Mocirc higravenh động biểu diễn caacutec kịch bản thay đổi theo thời gian 1048713 Phụ thuộc thời gian caacutec trạng thaacutei thay đổi theo thời gian 1048713 Thường dugraveng để tạo sinh vagrave biểu diễn caacutec xu hướng vagrave khuocircn mẫu theo thời gian 1048713 Mocirc phỏng động thể hiện caacutec diễn tiến khi caacutec điều kiện theo thời gian khaacutec với caacutec

trạng thaacutei ổn định ndash thường được dugraveng để thiết kế việc kiểm soaacutet caacutec hệ thống 1048713 VD dự baacuteo lời-lỗ trong 5 năm với caacutec nhập lượng như giaacute phiacute số lượng thay đổi

theo từng năm

Mocirc higravenh chắc chắn tương đối dễ phaacutet triển giải quyết vagrave coacute thể sinh ra caacutec giải phaacutep tối ưu 1048713 Caacutec bagravei toaacuten coacute một số lớnvocirc hạn caacutec giải phaacutep khả thi đặc biệt quan trọng 1048713 Caacutec mocirc higravenh tagravei chaacutenh được xacircy dựng trong điều kiện chắc chắn

Mocirc higravenh bất địnhbằng caacutech thu thập thecircm thocircng tin cố gắng đưa bagravei toaacuten trở về dạng chắc chắn hay dạng

rủi ro Mocirc higravenh rủi ro caacutec quyết định kinh doanh được đưa ra dưới caacutec rủi ro giả định

1048713 Đocirci khi biết được xaacutec suất của caacutec sự kiện xảy ra trong tương lai 1048713 Caacutec trường hợp khaacutec (bất định) ước lượng caacutec rủi ro vagrave giả sử caacutec tigravenh huống rủi ro

xảy ra 20Mocirc higravenh hoacutea

MOcirc HIgraveNH HOacuteA BẰNG BẢNG TIacuteNH bull Bảng tiacutenh phần mềm mạnh linh hoạt vagrave dễ dugraveng cho pheacutep tạo sinh caacutec ứng dụng trong kinh doanh kỹ thuật toaacuten vagrave khoa học với tập caacutec hagravem mạnh về tagravei chaacutenh thống kecirc toaacuten bull Kegravem theo lagrave caacutec thagravenh phần cộng thecircm (add-ins) giuacutep xacircy dựng vagrave giải caacutec lớp mocirc higravenh đặc thugrave bull Lagrave cocircng cụ mocirc higravenh hoacutea thocircng dụng nhất của người dugraveng cuối cugraveng bull Coacute caacutec chức năng về phacircn tiacutech ldquowhat-ifrdquo dograve tigravem mục tiecircu quản lyacute dữ liệu vagrave lập trigravenh (dạng macro) bull Coacute khả năng đọc ghi caacutec cấu truacutec tập tin thocircng dụng để giao tiếp được với caacutec CSDL vagrave cocircng cụ khaacutec bull Coacute thể xacircy dựng mocirc higravenh tĩnh vagrave động bull Dugraveng trecircn maacutey tiacutenh caacute nhacircn vagrave maacutey tiacutenh lớn

bull Cơ sở để xacircy dựng caacutec bảng tiacutenh đa chiều vagrave caacutec cocircng cụ xử lyacute phacircn tiacutech trực tuyến (OLAP) MOcirc HIgraveNH HOacuteA BẰNG PHAcircN TIacuteCH QUYẾT ĐỊNH bull Tiếp cận mocirc higravenh hoacutea caacutec tigravenh huống quyết định coacute một số hữu hạnkhocircng quaacute nhiều caacutec phương aacuten ndash mỗi phương aacuten được trigravenh ra dưới dạng bảng hay đồ thị - caacutec kết quả tương ứng (dự baacuteo được kegravem xaacutec suất) theo mục tiecircu bagravei toaacuten ndash từ đoacute chọn phương aacuten tốt nhất bull Đơn mục tiecircu bảng quyết định hay cacircy quyết định bull Đa mục tiecircu AHP (analytic hierarchy process) khaacutec

MOcirc HIgraveNH HOacuteA BẰNG QUY HOẠCH TOAacuteN

bull Quy hoạch toaacuten học (mathematical programming) lagrave họ caacutec cocircng cụ giải quyết caacutec bagravei toaacuten quản lyacute theo đoacute người ra quyết định phải cấp phaacutet caacutec tagravei nguyecircn khan hiếm cho caacutec hoạt động cạnh tranh nhau (caacutec phương aacuten) nhằm tối ưu hoacutea mục tiecircu coacute khả năng đo lường được bull Caacutec mocirc higravenh quy hoạch tuyến tiacutenh (linear programming) thocircng dụng nhất trong quy hoạch toaacuten coacute nhiều ứng dụng trong thực tế được dugraveng nhiều trong caacutec hệ hỗ trợ quyết định bull Bagravei toaacuten quy hoạch tuyến tiacutenh 1048713 Caacutec biến quyết định (cần tigravem giaacute trị) 1048713 Hagravem mục tiecircu (hagravem toaacuten học dạng tuyến tiacutenh xaacutec định quan hệ giữa biến quyết định vagrave mục tiecircu đo lường mức độ đạt đạt mục tiecircu vagrave cần được tối ưu hoacutea) 1048713 Caacutec hệ số của hagravem mục tiecircu (cho biết mức đoacuteng goacutep vagraveo mục tiecircu của 1 đơn vị biến quyết định) 1048713 Ragraveng buộc (biểu thức tuyến tiacutenh cho biết giới hạn tagravei nguyecircn vagravehay caacutec quan hệ giữa caacutec biến số) 1048713 Dung lượng (mocirc tả cận trecircn vagrave dưới của caacutec biến vagrave ragraveng buộc) 1048713 Hệ số (cocircng nghệ) vagraveo-ra (cho biết mức độ sử dụng tagravei nguyecircn của biến quyết định) bull Đặc điểm của bagravei toaacuten quy hoạch tuyến tiacutenh 1048713 Tagravei nguyecircn kinh tế của bagravei toaacuten lagrave coacute hạn vagrave sẵn sagraveng 1048713 Coacute nhiều caacutech (gt2 caacutech) sử dụng tagravei nguyecircn được gọi lagrave giải phaacutep hay chương trigravenh 1048713 Mỗi hoạt động dugraveng tagravei nguyecircn đều sinh ra kết quả dưới dạng mục tiecircu đatilde phaacutet biểu trước 1048713 Việc cấp phaacutet nằm trong caacutec ragraveng buộc cho trước bull Giả định của bagravei toaacuten quy hoạch tuyến tiacutenh 1048713 Caacutec kết quả của caacutec cấp phaacutet coacute thể đem so saacutenh với nhau coacute thể đo lường bằng một đơn vị chung

1048713 Caacutec cấp phaacutet độc lập với nhau về mặt kết quả 1048713 Kết quả cuối cugraveng lagrave tổng của caacutec kết quả từ caacutec hoạt động riecircng rẽ khaacutec nhau 1048713 Dữ liệu coacute tiacutenh chắc chắn 1048713 Tagravei nguyecircn được dugraveng một caacutech kinh tế nhất 1048713 Thường coacute một số lớn caacutec giải phaacutep với kết quả khaacutec nhau 1048713 Trong số caacutec giải phaacutep coacute thể coacute 1 giải phaacutep tốt nhất ndash mức độ đạt được mục tiecircu cao nhất ndash gọi lagrave giải phaacutep tối ưu được tigravem ra bằng một giải thuật đặc biệt MOcirc HIgraveNH HOacuteA BẰNG HEURISTIC bull Việc tigravem giải phaacutep tối ưu của một số bagravei toaacuten quyết định phức tạp coacute thể tốn nhiều thời gian chi phiacute hay khocircng thể tigravem ra được Cograven nếu dugraveng tiếp cận mocirc phỏng cũng coacute thể keacuteo dagravei phức tạp khocircng thiacutech hợp hay thậm chiacute khocircng chiacutenh xaacutec

bull Lagrave một tiếp cận giuacutep tigravem ra caacutec giải phaacutep khả thithỏa matildenđủ tốt cho caacutec bagravei toaacuten phức tạp Coacute thể coacute giải phaacutep đủ tốt (90-999 giaacute trị của lời giải tối ưu) nhanh choacuteng vagrave đỡ tốn keacutem hơn bằng caacutech dugraveng heuristics bull Quaacute trigravenh heuristic lagrave datildey caacutec bước xacircy dựng caacutec quy luật giải quyết vấn đề thocircng qua việc tigravem kiếm caacutec con đường hứa hẹn nhất dẫn đến lời giải tigravem kiếm caacutech thức thu thập vagrave phacircn giải thocircng tin theo quaacute trigravenh giải vagrave phaacutet triền caacutec phương phaacutep dẫn đến một giải thuật tiacutenh toaacuten hay một lời giải tổng quaacutet đatilde coacute bull Aacutep dụng chủ yếu cho bagravei toaacuten cấu truacutec yếu cũng dugraveng để tigravem ra giải phaacutep chấp nhận được cho bagravei toaacuten cấu truacutec chặt bull Khocircng đủ tổng quaacutet như caacutec giải thuật thường chỉ dugraveng cho tigravenh huống đặc thugrave đang xeacutet bull Coacute thể dẫn đến một giải phaacutep dở - caacutec thủ tục từng bước giải quyết vấn đề khocircng đảm bảo tigravem ra giải phaacutep tối ưu bull Heuristic coacute thể lagrave định lượng vigrave vậy coacute thể đoacuteng vai trograve quan trọng trong cơ sở mocirc higravenh của hệ hỗ trợ quyết định bull Heuristic coacute thể lagrave định tiacutenh vigrave vậy coacute thể đoacuteng vai trograve quan trọng trong cung ứng kiến thức cho hệ chuyecircn gia bull Quaacute trigravenh heuristic liecircn quan đến tigravem kiếm học tập ước lượng phacircn xử vagrave lặp lại caacutec hoạt động nagravey dọc theo tiến trigravenh bull Kiến thức thu được dugrave thagravenh cocircng hay thất bại trong quaacute trigravenh đều được phản hồi vagrave sửa đổi chiacutenh quaacute trigravenh nhờ đoacute coacute thể định nghĩa lại mục tiecircu hay bagravei toaacuten 1048713 Giải thuật di truyền bắt đầu bằng tập caacutec giải phaacutep được sinh ngẫu nhiecircn taacutei kết hợp caacutec cặp giải phaacutep một caacutech ngẫu nhiecircn bull Tigravenh huống necircn dugraveng heuristics 1048713 Dữ liệu đầu vagraveo khocircng chiacutenh xaacutec hay coacute giới hạn 1048713 Thực tế quaacute phức tạp đến nỗi khocircng dugraveng được caacutec mocirc higravenh tối ưu 1048713 Chưa coacute được giải thuật chiacutenh xaacutec vagrave đủ tin cậy 1048713 Bagravei toaacuten phức tạp necircn sẽ khocircng kinh tế nếu dugraveng tối ưu hay mocirc phỏng hoặc tốn quaacute nhiều thời gian tiacutenh toaacuten 1048713 Coacute thể cải thiện tiacutenh hiệu quả của quaacute trigravenh tối ưu (tức coacute thể sinh ra caacutec giải phaacutep ban đầu tương đối tốt) 1048713 Liecircn quan đến xử lyacute kyacute hiệu chứ khocircng phải xử lyacute kyacute số (như hệ chuyecircn gia) 1048713 Cần coacute quyết định nhanh vagrave caacutec xử lyacute dựa vagraveo maacutey tiacutenh đều khocircng khả thi (một số heuristic khocircng cần đến maacutey tiacutenh) bull Thuận lợi 1048713 Dễ hiểu dễ giải thiacutech vagrave dễ cagravei đặt 1048713 Nacircng cao tiacutenh saacuteng tạo vagrave năng lực heuristic cho caacutec vấn đề khaacutec 1048713 Tiết kiệm thời gian xaacutec lập vấn đề 1048713 Tiết kiệm yecircu cầu về bộ chứa vagrave xử lyacute maacutey tiacutenh

1048713 Tiết kiệm thời gian tiacutenh toaacuten vagrave do vậy tiết kiệm thời gian thực trong ra quyết định Một số vấn đề phức tạp đến nỗi chỉ coacute thể giải được bằng heuristics 1048713 Thường sinh ra nhiều giải phaacutep chấp nhận được 1048713 Thường coacute thể phaacutet biểu lyacute thuyết hay đo lường thực nghiệm về chất lượng của giải phaacutep (tức giaacute trị mục tiecircu của giải phaacutep gần với giaacute trị tồi ưu đến mức nagraveo dugrave giaacute trị tối ưu chưa biết được) 1048713 Coacute thể kết hợp tiacutenh thocircng minh vagraveo để hướng dẫn pheacutep tigravem kiếm (tigravem kiếm tabu) Năng lực thocircng minh đoacute coacute thể lagrave đặc thugrave theo bagravei toaacuten hoặc dựa trecircn yacute kiến chuyecircn gia được cấy trong hệ chuyecircn gia hoặc cơ chế tigravem kiếm 1048713 Coacute thể dugraveng heuristic hiệu quả vagraveo caacutec mocirc higravenh coacute thể giải bằng quy hoạch toaacuten học Đocirci khi heuristic lagrave phương phaacutep được ưa thiacutech hơn khi khaacutec giải phaacutep heuristics được dugraveng như giải phaacutep ban đầu cho caacutec phương phaacutep quy hoạch toaacuten học bull Hạn chế 1048713 Khocircng đảm bảo coacute được giải phaacutep tối ưu 1048713 Caacutec quy luật coacute rất nhiều ngoại lệ 1048713 Caacutec lựa chọn quyết định tuần tự coacute thể khocircng tiecircn đoaacuten được caacutec kết cục tương lai của mỗi chọn lựa 1048713 Sự liecircn thuộc giữa caacutec phần trong hệ thống đocirci khi coacute thể gacircy ra caacutec ảnh hưởng lớn lao lecircn toagraven hệ thống bull Phacircn loại caacutec giải thuật heuristic 1048713 Heuristic xacircy dựng xacircy dựng giải phaacutep khả thi bằng caacutech cộng thecircm từng thagravenh phần một VD bagravei toaacuten người baacuten hagraveng ndash luocircn gheacute thagravenh phố chưa viếng thăm kế tiếp gần nhất

1048713 Heuristic cải tiến bắt đầu bằng một giải phaacutep khả thi vagrave cố gắng cải tiến liecircn tục trecircn đoacute VD trecircn thử hoaacuten đổi 2 thagravenh phố 1048713 Quy hoạch toaacuten aacutep dụng vagraveo caacutec mocirc higravenh chứa iacutet ragraveng buộc nhằm coacute được thocircng tin về thỏa hiệp tốt nhất với mocirc higravenh nguyecircn gốc Thường được dugraveng trong tối ưu hoacutea nguyecircn (integer optimization) 1048713 Chia giai đoạn giải quyết một vấn đề theo từng giai đoạn VD ở PampG trecircn đacircy bagravei toaacuten phacircn phối được giải quyết trước sau đoacute dugraveng giải quyết bagravei toaacuten chiến lược sản phẩm 1048713 Phacircn ratilde chia bagravei toaacuten thagravenh caacutec phần nhỏ hơn coacute thể giải quyết được sau đoacute kết hợp caacutec giải phaacutep đoacute lại VD chia latildenh thổ baacuten hagraveng thagravenh 4 vugraveng khaacutec nhau giải quyết cho từng vugraveng sau đoacute kết nối caacutec giải phaacutep

21Mocirc phỏngbull Giả định caacutec đặc điểm của thực tạibull Lagrave kỹ thuật tiến triển caacutec thực nghiệm (như phacircn tiacutech ldquowhat-ifrdquo) - bằng maacutey tiacutenh -trecircn một mocirc higravenh của hệ thocircng tin quản lyacute

bull Khocircng thực sự lagrave một mocirc higravenh vigrave khocircng biểu diễn thực tại magrave lagrave cố gắng bắtchước thực tạibull Một trong những phương phaacutep thocircng dụng nhất trong HHTQĐbull HHTQĐ lagravem việc với caacutec bagravei toaacuten phi cấu truacutec vagrave cấu truacutec yếu tigravenh huống thực tếphức tạp ndash khocircng dễ biểu diễn bằng mocirc higravenh tối ưu hay caacutec dạng mocirc higravenh khaacutecnhưng lại thường coacute thể xử lyacute được bằng mocirc phỏngbull Đặc điểm1048713 Iacutet đưa ra caacutec đơn giản hoacutea về thực tại hơn caacutec mocirc higravenh khaacutec1048713 Do triển khai caacutec thực nghiệm necircn noacute coacute thể kiểm thử caacutec giaacute trị cụ thể của caacutecbiến quyết địnhbiến khocircng kiểm soaacutet được của mocirc higravenh vagrave xem xeacutet ảnh hưởnglecircn caacutec biến kết quả1048713 Phương phaacutep coacute tiacutenh mocirc tả (như vậy khaacutec với phương phaacutep danh định)1048713 Khocircng tự động tigravem kiếm giải phaacutep tối ưu ndash noacute mocirc tảtiecircn đoaacuten caacutec đặc tiacutenh của hệthống đatilde cho dưới caacutec điều kiện khaacutec nhau từ đoacute coacute thể chọn ra phương aacuten tốtnhất1048713 Quaacute trigravenh mocirc phỏng thường lặp lại một thực nghiệm nhiều lần để coacute được ướclượng về hiệu ứng tổng quaacutet của một số hagravenh động nhất định1048713 Mocirc phỏng maacutey tiacutenh thiacutech hợp cho hầu hết caacutec tigravenh huống mặc dugrave cũng coacute một sốmocirc phỏng thủ cocircng thagravenh cocircng1048713 Thường chỉ được dugraveng khi bagravei toaacuten quaacute phức tạp khocircng thể xem xeacutet bằng caacutec kỹthuật tối ưu dạng số Tiacutenh phức tạp theo nghĩa bagravei toaacuten khocircng thể cocircng thức hoacuteacho tối ưu (do khocircng thotildea caacutec giả định) hoặc cocircng thức quaacute lớn quaacute nhiều tươngtaacutec giữa caacutec biến hoặc về bản chất bagravei toaacuten lagrave bất định hay rủi roPhương phaacutep mocirc phỏng thiết lập mocirc higravenh của hệ thống thực vagrave tiến hagravenh caacutec thựcnghiệm lặp lại trecircn mocirc higravenh

bull Thuận lợi1048713 Lyacute thuyết tương đối trực tiếp hiệu ứng dagravei hạn của nhiều chiacutenh saacutech -gt neacuten thờigian lớn1048713 Do tiacutenh chất mocirc tả (khaacutec với danh định)1048713 Coacute thể thấy được nhanh choacuteng coacute thể đặt ra caacutec cacircu hỏi ldquowhat-ifrdquo coacute thể dugravengtiếp cận thử-vagrave-sai vagraveo giải quyết vấn đề một caacutech nhanh choacuteng rẻ chiacutenh xaacutec iacutetrủi ro hơn1048713 Thử nghiệm được biến quyết định phần nagraveo của mocirci trường thực sự quan trọngvới caacutec phương aacuten khaacutec nhau1048713 Yecircu cầu kiến thức riecircng biệt về bagravei toaacuten vigrave thế buộc người xacircy dựng mocirc higravenh phảilagravem việc thường xuyecircn với nhagrave quản lyacute ndash đối tượng mong muốn của HHTQĐ để

từ đoacute bản chất bagravei toaacuten vagrave caacutec quyết định được hiểu tốt hơn1048713 Mocirc higravenh được xacircy dựng từ viễn cảnhcaacutech nhigraven của nhagrave quản lyacute1048713 Mocirc higravenh chỉ cho một bagravei toaacuten riecircng biệt thường khocircng thể dugraveng giải caacutec bagravei toaacutenkhaacutec Như vậy mỗi thagravenh phần của mocirc higravenh ứng với một phần của hệ thống thựcdo đoacute sẽ khocircng yecircu cầu nhagrave quản lyacute phải tổng quaacutet hoacutea caacutec hiểu biết của migravenh1048713 Phổ bagravei toaacuten giải được rất rộng tồn kho nhacircn sự hoạch định chiến lược 1048713 Coacute thể chứa caacutec phức tạp thực sự của bagravei toaacuten khocircng cần caacutec đơn giản hoacutea (TDdugraveng caacutec phacircn phối xaacutec suất thực thay vigrave phacircn phối lyacute thuyết xấp xỉ)1048713 Coacute thể tự động sinh ra nhiều đo lường hiệu năng quan trọng1048713 Thường lagrave phương phaacutep duy nhất của HHTQĐ coacute thể xử lyacute caacutec bagravei toaacuten tương đốiphi cấu truacutec1048713 Coacute một số caacutec goacutei phần mềm mocirc phỏng (Monte Carlo) tương đối dễ dugravengbull Điểm yếu1048713 Tuy thường tigravem được caacutec phương aacuten đủ tốt nhưng khocircng đảm bảo lời giải tối ưu1048713 Quaacute trigravenh xacircy dựng mocirc higravenh thường dagravei vagrave tốn keacutem1048713 Giải phaacutep vagrave suy diễn từ nghiecircn cứu mocirc phỏng thường khocircng thể chuyển sang bagraveitoaacuten khaacutec vigrave mocirc higravenh kết hợp caacutec yếu tố đặc thugrave1048713 Đocirci khi do mocirc higravenh quaacute dễ giải thiacutech cho nhagrave quản lyacute necircn caacutec phương phaacutep phacircntiacutech thường xem nhẹ1048713 Phần mềm mocirc phỏng đocirci khi yecircu cầu caacutec kỹ năng đặc biệt do độ phức tạp củaphương phaacutep giải higravenh thứcbull Caacutec loại mocirc phỏng1048713 Mocirc phỏng xaacutec suất một hay nhiều biến độc lập mang tiacutenh xaacutec suất với 2 loạiphacircn phối ndash thường dugraveng kỹ thuật Monte Carlo1048713 Phacircn phối rời rạc tigravenh huống coacute một số giới hạn caacutec biến cố (biến) với hữu hạncaacutec giaacute trị cho mỗi biến cố (biến)1048713 Phacircn phối liecircn tục tigravenh huống coacute số lượng khocircng giới hạn caacutec biến cố tuacircn theocaacutec hagravem mật độ xaacutec suất như phacircn phối chuẩn1048713 Mocirc phỏng độc lậpphụ thuộc theo thời gian1048713 Độc lập khocircng cần thiết phải biết chiacutenh xaacutec thời điểm xảy ra biến cố (nhu cầutiecircu thụ lượng sản phẩm trong ngagravey khocircng biết chiacutenh xaacutec thời điểm tiecircu thụ)1048713 Phụ thuộc cần biết chiacutenh xaacutec thời điểm xảy ra sự kiện (bagravei toaacuten hagraveng đợi)1048713 Mocirc phỏng tương taacutec trực quan1048713 Mocirc phỏng hướng đối tượng dugraveng tiếp cận hướng đối tượng để xacircy dựng mocirc higravenhmocirc phỏng Chuacute yacute ngocircn ngữ mocirc higravenh hoacutea nhất thể UML (unified modelinglanguage) kể cả khi mocirc phỏng caacutec hệ thời gian thựcMOcirc HIgraveNH HOacuteA ĐA CHIỀU ndash XỬ LYacute PHAcircN TIacuteCH TRỰC TUYẾNbull Người ra quyết định thường phải xem xeacutet nhiều chiều của dữ liệu (TD caacutec chiềucủa dữ liệu baacuten hagraveng lagrave sản phẩm vugraveng thời gian người baacuten ) dữ liệu cần đượcphacircn tiacutech trực tiếp bằng caacutec cocircng cụ chuẩn hay phacircn tiacutech tự động bằng caacutec

phương phaacutep khai mỏ dữ liệu (data mining)bull Hầu hết caacutec hệ thống phacircn tiacutech đa chiều được nhuacuteng trong caacutec hệ xử lyacute phacircn tiacutechtrực tuyến (HXLPTTT ndash online analytic processing - OLAP)bull Mục tiecircu của XLPTTT nắm bắt cấu truacutec của dữ liệu thực để hỗ trợ ra quyết địnhbull Trong HHTQĐ coacute sự gắn nối tự nhiecircn giữa mocirc higravenh hoacutea dữ liệu mocirc higravenh hoacutea kyacutehiệu vagrave caacutec khiacutea cạnh của phacircn tiacutech ldquowhat-ifrdquobull Caacutec baacuteo caacuteo của HXLPTTT đều coacute tiacutenh tương taacutec dễ khai thaacutec sử dụng đặc biệtphugrave hợp cho caacutec baacuteo caacuteo về chỉ số hiệu năng chủ yếu (key performance indicators- KPI) baacuteo caacuteo về đo lường hiệu năng kinh doanh bull Thế hệ hiện tại của HXLPTTT vagrave hệ khai mỏ dữ liệu (data mining) tiacutech hợp caacutecđặc tiacutenh của hệ thocircng tin latildenh đạo (executive information system ndashEIS- nhiềucaacutech nhigraven dữ liệu chi tiết hoacutea theo nhu cầu) vagrave caacutec hệ đồ họa khaacutec ndash thường coacutegiao diện người dugraveng dạng kiểu WEBbull Caacutec hệ thống như trecircn cograven được gọi lagrave caacutec cocircng cụ triacute tuệ kinh doanh (businessintelligence - BI) vigrave coacute caacutec đặc trưng về mocirc higravenh hoacutea vagrave tối ưu hoacutea nhưng lạitrong suốt đối với ngươigrave dugravengbull Hiện caacutec cocircng cụ được đưa ra bởi caacutec nhagrave cung cấp về CSDL về hoạch định tagraveinguyecircn tổ chức (ERP) về nhagrave kho dữ liệu (data warehouse) về HXLPTTT MOcirc HIgraveNH HOacuteA VAgrave MOcirc PHỎNG TƯƠNG TAacuteC TRỰC QUANbull Iacutech lợi Người ra quyết định tham gia vagraveo quaacute trigravenh phaacutet triển mocirc higravenh vagrave thựcnghiệm mocirc phỏng vigrave vậy sẽ tin tưởng khi sử dụng mocirc higravenhbull Mocirc higravenh hoacutea tương taacutec trực quan (visual interactive modeling - VIM) dugraveng caacutecbiểu diễn đồ họa maacutey tiacutenh để trigravenh bagravey caacutec ảnh hưởng của caacutec quyết định quản lyacutekhaacutec nhau ở một thời điểm (tĩnh) hay tiến triển theo thời gian (động với kỹ thuậthoạt higravenh)bull Mocirc phỏng tương taacutec trực quan (visual interactive simulation - VIS) cho pheacutepngười dugraveng theo dotildei tiến trigravenh xacircy dựng vagrave sử dụng khai thaacutec mocirc higravenh mocirc phỏngdưới dạng hoạt higravenhbull Mocirc higravenh hoacutea tương taacutec trực quan coacute thể kết hợp với tiếp cận triacute tuệ nhacircn tạo đểđưa ra caacutec khả năng mới thay đổi từ xacircy dựng hệ thống dạng đồ họa đến tigravem hiểuvề động học của hệ thốngbull Cần đến caacutec hệ thống maacutey tiacutenh xử lyacute song song tốc độ cao để xacircy dựng caacutec mocircphỏng - phức tạp quy mocirc lớn dạng hoạt higravenh - mang tiacutenh khả thi ở thời gian thực

22Caacutec dạng hệ thống hỗ trợ ra quyết địnhHệ hỗ trợ quyết định nhoacutemRa quyết định nhoacutem giao tiếp vagrave cộng taacutec- Caacutec đặc điểm của cocircng việc nhoacutem+ Một nhoacutem thực hiện một nhiệm vụ thỉnh thoảng ra quyết định thỉnh thoảngkhocircng ra quyết định+ Caacutec thagravenh viecircn trong nhoacutem coacute thể ở những nơi khaacutec nhau

+ Caacutec thagravenh viecircn trong nhoacutem coacute thể lagravem việc ở những thời gian khaacutec nhau+ Caacutec thagravenh viecircn trong nhoacutem coacute thể lagravem việc cugraveng nhau hoặc ở caacutec tổ chức khaacutecnhau+ Nhoacutem coacute thể vĩnh viễn hoặc tạm thời+ Nhoacutem coacute thể ở bất kỳ mức quản lyacute nagraveo hoặc mức thời gian nagraveo+ Coacute sự điều phối (quaacute trigravenh vagrave nhiệm vụ đạt được) hoặc macircu thuẩn trongnhoacutem+ Coacute sự đạt được hoặcvagrave mất maacutet năng suất trong tổ chức+ Nhiệm vụ phải hoagraven thagravenh rất nhanh+ Khocircng thể hoặc quaacute đắt cho tất cả caacutec thagravenh viecircn trong nhoacutem cugraveng hợp ở mộtnơi+ Một số dữ liệu thocircng tin hoặc kiến thức cần thiết nằm ở nhiều nơi một sốkhaacutec ở ngoagravei tổ chức+ Chuyecircn mocircn của caacutec thagravenh viecircn khocircng coacute trong nhoacutem lagrave cần thiết- Caacutec hoạt động vagrave caacutec quaacute trigravenh miecircu tả caacutec cuộc họp+ Cuộc họp lagrave hoạt động chung liecircn quan bởi một nhoacutem người coacute địa vị bằngnhau hoặc gần bằng nhau+ Kết quả của cuộc họp phụ thuộc một phần vagraveo kiến thức yacute kiến caacutec đaacutenh giaacutecủa caacutec thagravenh viecircn+ Kết quả của cuộc họp cũng phụ thuộc vagraveo sự kết hợp của nhoacutem vagrave phụ thuộcvagraveo quaacute trigravenh ra quyết định được sử dụng bởi nhoacutem đoacute+ Giải quyết caacutec yacute kiến khaacutec nhau bởi người coacute quyền hạn hoặc thương lượnghoặc phacircn xửHỗ trợ giao tiếp- Giao tiếp lagrave thagravenh phần quan trọng cho hỗ trợ quyết định Khocircng coacute giao tiếp thigravekhocircng coacute cộng taacutec Những người ra quyết định caacute nhacircn phải giao tiếp với caacutecđồng nghiệp chuyecircn gia cơ quan chiacutenh phủ khaacutech hagraveng đối taacutec kinh doanh hellipHọ cũng cần dữ liệu vagrave thocircng tin (vagrave kiến thức) từ nhiều nơi trecircn thế giới Caacutecnhoacutem ra quyết định phải giao tiếp cộng taacutec vagrave thương lượng trong cocircng việcHầu hết caacutec tổ chức sẽ nhanh trở thagravenh khocircng coacute chức năng nếu khocircng coacute caacutec hệthống giao tiếp Thương mại điện tử coacute thể hiệu quả chỉ qua caacutec kỹ thuật giao tiếphiện đại- Caacutec kỹ thuật thocircng tin hiện đại cung cấp caacutec phương tiện hỗ trợ giao tiếp rẻnhanh coacute khả năng coacute thể tin cậy Nền tảng hỗ trợ giao tiếp lagrave caacutec hệ thống maacuteytiacutenh mạng+ Bắt đầu bằng điện baacuteo điện thoại radio vagrave ti vi+ Trong 100 năm chuacuteng ta phaacutet triển maacutey fax thư điện tử chương trigravenh chatnhoacutem tin tức hệ thống hội nghị truyền higravenh Hầu hết caacutec kỹ thuật nagravey đềuhoạt động trecircn internet+ Sự phaacutet triển giao tiếp sau cugraveng lagrave hệ thống họp điện tử caacutec dịch vụ vagrave hệ

thống hội nghị điện tử thường sử dụng internet để kết nối caacutec người ra quyếtđịnh- Caacutec thuận lợi aacutep dụng caacutec phương phaacutep giao tiếp cải tiến trong caacutec tổ chức+ Cải tiến năng suất của nhacircn viecircn+ Liecircn quan đến nhiều người ra quyết định chiacutenh+ Khocircng quan tacircm nhiều đến đường biecircn giới địa lyacute+ Tạo nền văn hoacutea hợp taacutec nhất quaacuten+ Cải tiến chất lượng cuộc sống của nhacircn viecircnHỗ trợ cộng taacutec Maacutey tiacutenh hỗ trợ cộng taacutec- Khung thời giannơi chốn+ Sự hiệu quả của kỹ thuật tiacutenh toaacuten cộng taacutec phụ thuộc vagraveo vị triacute của caacutec thagravenhviecircn trong nhoacutem vagrave phụ thuộc vagraveo thời gian chia sẽ thocircng tin gởi vagrave nhận+ Chia sự giao tiếp thagravenh bốn ocirc vagrave tổ chức bốn ocirc dọc theo 2 chiều thời gian vagravenơi chốn1048713 Thời gian Khi gởi vagrave nhận thocircng tin hầu như đồng thời giao tiếp lagrave đồngthời Viacute dụ Điện thoại ti vi vagrave caacutec cuộc họp gặp mặt nhau Giao tiếp bấtđồng bộ xảy ra khi người nhận nhận thocircng tin ở thời điểm khaacutec thời điểmgởi thocircng tin đoacute1048713 Nơi chốn Người gởi vagrave người nhận coacute thể ở cugraveng phograveng hoặc khocircng+ Bốn ocirc lagrave1048713 Cugraveng thời giancugraveng nơi chốn Caacutec thagravenh viecircn gặp mặt nhau cugraveng một luacutecgiống như phograveng quyết định hoặc gặp mặt truyền thống1048713 Cugraveng thời giankhaacutec nơi chốn Caacutec thagravenh viecircn ở caacutec nơi khaacutec nhau nhưnggiao tiếp cugraveng nhau Viacute dụ hội nghị truyền higravenh (videoconferencing)1048713 Khaacutec thời giancugraveng nơi chốn Nhiều người lagravem việc theo ca Ca nagravey để lạithocircng tin cho ca khaacutec1048713 Khaacutec thời giankhaacutec nơi chốn Caacutec thagravenh viecircn ở caacutec nơi khaacutec nhau Caacutecthagravenh viecircn nagravey gởi vagrave nhận thocircng tin ở những lần khaacutec nhau

23Thực thi hệ DSSHệ thống hỗ trợ quản lyacute (MSS) khocircng phải luacutec nagraveo cũng luocircn thagravenh cocircng Nhiều trường hợpthất bại của ES khocircng hoagraven toagraven lagrave lyacute do kỹ thuật Thực thi hệ thống lagrave một quaacute trigravenh liecircn tụcnhằm đảm bảo cho tổ chức chuẩn bị tiếp nhận một hệ thống mới vagrave đưa hệ thống vagraveo sử dụngthagravenh cocircngThực hiện cocircng nghệ hệ thống hỗ trợ quản lyacute lagrave việc phức tạp vigrave caacutec hệ thống nagravey khocircng đơnthuần lagrave hệ thống thocircng tin chỉ thu thập thao taacutec vagrave phacircn phối thocircng tin Magrave xa hơn chuacuteng

liecircn quan tới caacutec cocircng việc coacute thể lagravem thay đổi đaacuteng kể caacutech thức hoạt động của tổ chức Tuyvậy đa số caacutec yếu tố thực thi đều liecircn quan tới hệ thống thocircng tinThực thi MSS lagrave quaacute trigravenh liecircn tục diễn ra trong suốt thời gian phaacutet triển hệ thống từ đề xuấtban đầu đến nghiecircn cứu khả thi thiết kế vagrave phacircn tiacutech hệ thống lập trigravenh huấn luyện chuyểnđổi vagrave lắp đặt Caacutec chuyecircn gia hệ thống thocircng tin thường gọi thực thi lagrave giai đoạn cuối trongvograveng đời hệ thống Định nghĩa thực thi MSS phức tạp hơn vigrave bản chất lặp của sự phaacutet triểncaacutec hệ thống

THỰC THI KHOcircNG HOAgraveN CHỈNHCaacutec quyết định về tiacutenh khả thi thường coacute giả định về lợi iacutech đạt được khi kế hoạch thực thiđược thực hiện hoagraven toagraven Trong thực tế thường chỉ thực hiện 90 thậm chiacute 70 phần trăm sovới phacircn tiacutech khả thi Lyacute do lagrave sự thay đổi tại một nơi trong hệ thống coacute thể ảnh hưởng vagrave coacutethể taacutec động tiecircu cực đến chỗ khaacutec Do vậy cấp quản lyacute coacute thể bỏ những phần trong dự aacuten coacutethể gacircy ra taacutec động xấu Do đoacute dự aacuten sẽ thực hiện iacutet hơn 100 so với dự aacuten kế hoạch Caacutec lyacutedo khaacutec coacute thể lagrave do khấu trừ ngacircn saacutech hoặc vượt chi phiacuteĐAacuteNH GIAacute SỰ THAgraveNH COcircNG CỦA THỰC THI HỆ THỐNGPhải coacute caacutec chỉ số đo lường thigrave mới coacute thể đaacutenh giaacute sự thagravenh cocircng khi thực thi một hệ thốngDickson va Powers (1973) đề ra 5 tiecircu chuẩn độc lậpbull Tỷ lệ thời gian thực hiện dự aacuten với thời gian ước lượngbull Tỷ lệ chi phiacute thực tế vagrave ngacircn saacutech thực hiệnbull Thaacutei độ của cấp quản lyacute đối với hệ thốngbull Nhu cầu thocircng tin của caacutec nhagrave quản lyacute được đaacutep ứng như thế nagraveo qua hệ thốngbull Taacutec động của dự aacuten đối với những hoạt động maacutey tiacutenh trong cocircng tyCaacutec đo lường khaacutec để đaacutenh giaacute thagravenh cocircng của hệ hỗ trợ quản lyacute (MSS)bull Sự sử dụng hệ thống (dự định dugraveng hoặc thực sự dugraveng)bull Thỏa matilden của người dugravengbull Thaacutei độ taacuten thagravenhbull Mức độ hệ thống hoagraven thagravenh caacutec mục tiecircu ban đầubull Phần thưởng đối với tổ chức (giảm chi phiacute tăng doanh thuhellip)bull Tỷ số lợi iacutech chi phiacute

bull Mức độ thể chế hoacutea của MSS trong tổ chứcDo bởi tiacutenh đa dạng của DSS necircn việc đaacutenh giaacute sự thagravenh cocircng của hệ nagravey cũng khoacute khăn tuynhiecircn cũng coacute thể coacute một số yếu tố giuacutep cho DSS thagravenh cocircng như sự tham gia người dugravenghuấn luyện người dugraveng hỗ trợ quản lyacute cấp cao nguồn thocircng tin đặc điểm của những nhiệmvụ coacute liecircn quan (cấu truacutec bất định độ khoacute phụ thuộc)

Chương5Nhoacutem hỗ trợ quyết định vagrave nhoacutemcocircng nghệ phần mềm

51Nhoacutem tạo quyết định

MDM-Holsapple đatilde gợi yacute chuacuteng ta sử dụng giới hạn người tạo quyết định

Một nhoacutem lagrave kết cấu MDM nơi magrave nhiều người ra quyết định hoagraven toagraven tương taacutec

Một đội lagrave kết cấu MDM nơi caacutec thagravenh viecircn tư vấn cho người đưa ra quyết định nhưng khocircng tương taacutec

Một Ủy ban lagrave kết cấu MDM với một người tạo quyết định duy nhất vagrave sự tương taacutec giữa caacutec thagravenh viecircn

Mạng thocircng tin

Mạng lưới baacutenh xe mỗi người tham gia coacute thể giao tiếp với người đưa ra quyết định ở trung tacircm nhưng khocircng phải với người tham gia khaacutecCấu truacutec nagravey lagrave khocircng thỏa matilden tất cả những người tham gia ngoại trừ người ra quyết định

Mạng dacircy chuyền Tham gia chuyển tiếp thocircng tin chỉ để noacute luocircn liền kề nhau trong chuỗi

Thagravenh viecircn cuối cugraveng ko được đaacutep ứng

Mạng vograveng trograven Tương tự như chuỗi nhưng kết thuacutec được kết nối

Mạng kết nối hoagraven toagraven khocircng coacute hạn chế về giao tiếp vagrave tương taacutec giữa caacutec thagravenh viecircnNoacutei chungnoacute đaacutep ứng hầu hết caacutec kết nối của người tham gia nhưng truyền đạt thocircng tin mất nhiều thời gian vagrave coacute nhiều cơ hội xảy ra lỗi

Nhoacutem hagravenh vi vagrave chuẩn mực

MDMs thiết lập caacutec chỉ tiecircu hướng dẫn quaacute trigravenh ra quyết định

Một chuẩn mực quy định cụ thể những gigrave thagravenh viecircn trong nhoacutem dự kiến sẽ lagravem trong những hoagraven cảnh nhất định

Quy tắc gửi coacute thể được thocircng qua viacute dụ đaacutenh giaacute ngang hagraveng hoặc xử phạt

Lagravem thế nagraveo để đưa ra quyết định

Việc chọn lựa magrave trong đoacute việc sử dụng cấu truacutec MDM phải được dựa trecircn một số yếu tố liecircn quan với bối cảnh quyết định

Viacute dụmột cấu truacutec riecircng lẻ sẽ lagravem việc nơi magrave quyết định được cấu truacutec cao vagrave thocircng tin lagrave coacute sẵn

Một ủy ban cơ cấu sẽ lagrave sự lựa chọn khi người ra quyết định khocircng thể đưa ra quyết định một migravenh

52Caacutec vấn đề thường gặp trong nhoacutem

Kiacutech thước Noacutei chung sự nhất triacute vagrave gắn kết giữa caacutec thagravenh viecircn tỉ lệ nghịch với phạm vi nhoacutem Trong nhoacutem lớn rất dễ higravenh thagravenh caacutec nhoacutem nhỏ vagrave hoạt động rời rạc

Tư duy tập thể Trong nhoacutem lớn mọi người coacute xu hướng suy nghĩ đểđạtđược sự nhất triacute necircn khocircng phaacutet huy được sự saacuteng tạo

Caacutec vấn đề về xatilde hội

Xung đột Trong 1 nhoacutem ai cũng muốn migravenh lagrave giỏi nhất necircn dễ dẫn đến xung đột

Ẩn danh(Giấu tecircn) Đacircy lagrave phương phaacutep được sử dụng để kiểm soaacutet xung đột Cho caacutec thagravenh viecircn tham gia ẩn danh

Vấn đề giới tiacutenh Nam vagrave nữ thường coacute những thế mạnh khaacutec nhau điều nagravey coacute thể lagrave sức mạnh trong 1 thiết lập MDM

Đagravem phaacuten vagrave quyết định

Một quyết định coacute thể liecircn quan đến nhiều quan điểm khaacutec nhau vigrave thế cần phải coacute sự đagravem phaacuten

Caacutec thiết kế của cơ chế hỗ trợ cho MDM phải phugrave hợp với caacutec hoạt độngđagravemphaacuten

Những hoạt động nagravey bao gồm việc thu nhận yacute kiến của caacutec thagravenh viecircn 1 caacutech cocircng bằng

53Cocircng nghệ hỗ trợ MDM

Organizational DSSndash 1 hệ thống cung cấp caacutec quyết định hỗ trợ

Group Support Systemndash Cocircng nghệ sử dụng sự hỗ trợ của nhiều becircn tham gia

Group DSS ndash Lagrave 1 hệ thống được thiết kế đặc biệt để hỗ trợ cho MDM

DSS ndash Lagrave 1 hệ thống dưới sự kiểm soaacutet của 1 người quyết định hệ thống nagravey cung cấp 1 bộ cocircng cụ giuacutep phacircn tiacutech hoagraven cảnh đểđưa ra quyết định vagrave nacircng cao hiệu quả của quyết địnhđoacute

53Cocircng nghệ hỗ trợ MDM

Organizational DSSndash 1 hệ thống cung cấp caacutec quyết định hỗ trợ

Group Support Systemndash Cocircng nghệ sử dụng sự hỗ trợ của nhiều becircn tham gia

Group DSS ndash Lagrave 1 hệ thống được thiết kế đặc biệt để hỗ trợ cho MDM

DSS ndash Lagrave 1 hệ thống dưới sự kiểm soaacutet của 1 người quyết định hệ thống nagravey cung cấp 1 bộ cocircng cụ giuacutep phacircn tiacutech hoagraven cảnh đểđưa ra quyết định vagrave nacircng cao hiệu quả của quyết địnhđoacute

Mục tiecircu của cocircng nghệ hỗ trợ MDM

Quy trigravenh hỗ trợ tập trung vagraveo quaacute trigravenh tạo điều kiện thuận lợi cho sự tương taacutec

Cơ chế cấu truacutec quaacute trigravenh chi phối caacutec hoạt động truyền thocircng

Nhiệm vụ hỗ trợ cocircng việc coacute thể chọn lựa tổ chức hoặc lấy thocircng tin

Nhiệm vụ cấu truacutec cocircng việc cho pheacutep truy cập đến kỹ thuật lọc kết hợp phacircn tiacutech kiến thức liecircn quan đến cocircng việc

Caacutec lớp loại cocircng nghệ hỗ trợ MDM

Phacircn loại theo đặc điểm do DeSanctis vagrave Gallupe đưa ra đề xuất một chương trigravenh ba cấp dựa trecircn caacutec tiacutenh năng được cung cấp

Hệ thống cấp 1 Mục điacutech chiacutenh lagrave tạo điều kiện thocircng tin liecircn lạc giữa caacutec thagravenh viecircn

Hệ thống cấp 2 Thiết kế để giảm thiểu rủi ro

Hệ thống cấp 3 Giuacutep điều chỉnh xử lyacute quyết định

Phacircn loại theo cocircng nghệ -Kraemer vagrave King tập trung vagraveo cocircng nghệ aacutep dụng

Cocircng nghệ bảng mạch điện tử

Hội nghị trực tuyến

Mạng lưới tập đoagraven

Trung tacircm thocircng tin

Mocirci trường cộng taacutec

Phograveng quyết định

Nhoacutem phần mềm

Phần mềm được thiết kế để hỗ trợ sự hợp taacutec bao gồm việc thu huacutet vagrave lưu trữ thocircng tin

Caacutec tổ chức dẫn đầu thị trường hiện tại lagrave Lotus Notes and Domino Microsoft Exchange Novell GroupWise and Oracle Office

Caacutec cocircng cụ trong một bộ phần mềm bao gồm người quản lyacute hội nghị (Lotus Sametime) vagrave trao đổi thocircng điệp (Lotus Notes Mail)

Xếp hạng phần mềm cho nhoacutem

Ellis vv đề xuất một hệ thống xếp hạng dựa vagraveo kiểu sự hỗ trợ noacute Cung cấp

Hệ thocircng điệp

Hệ thống hội thảo truyền higravenh

Hệ thống cộng taacutec soạn thảo

Nhoacutem phacircn phối giải phaacutep phần mền

Hệ thống phối hợp

Hệ thống thocircng minh đại diện

Lực lượng điều khiển phaacutet triển phần mềm cho nhoacutem

Một số nhacircn tố chiacutenh bao gồm

Tăng năng suất

Giảm số lượng caacutec cuộc họp

Tăng cường tự động hoacutea caacutec quy trigravenh lagravem việc thường xuyecircn

Cần phối hợp toagraven cầu tốt hơn

Tiacutenh sẵn sagraveng của những mạng lan rộng

Coleman vagrave Khanna liệt kecirc 10 nhacircn tố khaacutec

54Quản lyacute hoạt động MDM (Mobile Device Management - Quản lyacute thiết bị di động)

Một số phương phaacutep phối hợp phổ biến hơnMDM lagrave

Kỹ thuật nhoacutem định danh

Kỹ thuật Delphi

Sự phacircn xử

Hệ thocircng tin dựa trecircn vấn đề

Nemawashi

Kỹ thuật nhoacutem định danh

1-Mỗi người tham gia viết ra những yacute tưởng về những gigrave necircn quyết định

2-Lần lượt mỗi người tham gia trigravenh bagravey yacute tưởng của migravenh được ghi lại trecircn bảng Khocircng thảo luận ở đacircy

3-Sau khi tất cả caacutec yacute tưởng được trigravenh bagravey caacutec đại biểu coacute thể chất vấn những người khaacutec

4-Mỗi người tham gia bỏ phiếu cho mỗi yacute tưởng

Kỹ thuật Delphi

Về cơ bản tương tự như kỹ thuật nhoacutem định danh ngoại trừ những người khocircng bao giờ tham gia cuộc họp

Một cocircng cụ khảo saacutet được sử dụng để thu thập đầu vagraveo ban đầu từ caacutec thagravenh viecircn

Một cuộc khảo saacutet thứ hai được gửi đi với một bản toacutem tắt caacutec kết quả chung

Những bước lặp lại cho đến khi đạt được một sự đồng thuận hoặc nhigraven nhận của đa số

Sự phacircn xử(Arbitration )

Thiacutech hợp nhất khi caacutec thagravenh viecircn của MDM đại diện cho caacutec yếu tố đối lập

Những người tham gia đồng yacute rằng nếu lựa chọn thay thế hai becircn thỏa thuận khocircng được tigravem thấy thigrave một trọng tagravei viecircn becircn ngoagravei sẽ tham gia

Trọng tagravei sau đoacute lựa chọn thay thế ocircng hoặc xeacutet thấy thiacutech hợp nhất

Hệ thống thocircng tin dựa trecircn vấn đề (IBIS)

Lagrave một phương phaacutep lập luận cấu truacutec

Một đại diện cho IBIS lagrave một đồ thị với caacutec nuacutet vagrave caacutec liecircn kết

IBIS bắt đầu với lựa chọn của một nuacutet vấn đề gốc sau đoacute caacutec nuacutet vị triacute khaacutec nhau được liecircn kết với nuacutet gốc

Caacutec nuacutet vị triacute nagravey sau đoacute được đaacutenh giaacute dựa trecircn những lập luận gắn liền với chuacuteng

Nemawashi (được sử dụng rộng ratildei tại Nhật Bản)

1-Một hoặc nhiều thagravenh viecircn của MDM được chỉ định lagrave điều phối viecircnCaacutec điều phối viecircn sau đoacute chọn người tham gia cograven lại

2-Điều phối viecircn xacircy dựng một tổng hợp caacutec sự lựa chọn vagrave sau đoacute caacutec chuyecircn gia đaacutenh giaacute caacutec lựa chọn

3-Điều phối viecircn lựa chọn một sự lựa chọn dựa trecircn kết quả ở trecircn(ở 2)

4-Sự thay thế được luacircn chuyển điều phối viecircn tigravem kiếm sự đồng thuận thocircng qua sự thuyết phục vagrave đagravem phaacuten

5-Nếu đạt được sự đồng thuận điều phối viecircn cho lưu thocircng một tagravei liệu magrave mỗi thagravenh viecircn MDM để lại dấu hiệu trecircn đoacute

55Nơi lagravem việc ảo

Nhiều tổ chức trecircn toagraven thế giới kinh doanh bất động sản cho cocircng nghệ hợp taacutec

Cocircng việc được trở thagravenh một điều bạn lagravem hơn lagrave một nơi bạn đi

Những thay đổi lớn nhất mang lại bởi nơi lagravem việc ảo coacute thể lagrave về văn hoaacute hay xatilde hội hơn lagrave về cocircng nghệ

Chương 6 Hệ thống thocircng tin điều hagravenh

61 Yacute nghĩa của EIS- Hệ thống thocircng tin điều hagravenh

- EIS lagrave một dạng đặc biệt của DSS được thiết kế để hỗ trợ ra quyết định ở cấp cao nhất của một tổ chức

- Lagrave một hệ thống thocircng tin hỗ trợ nhu cầu lập kế hoạch vagrave đaacutenh giaacute của caacutec nhagrave quản lyacute điều hagravenh

- EIS coacute thể giuacutep một CEO coacute được bức tranh tổng thể chiacutenh xaacutec nhất về caacutec hoạt động vagrave một bản toacutem tắt những gigrave magrave đối thủ cạnh tranh đang lagravem

- Caacutec hệ thống nagravey noacutei chung hoạt động dễ dagraveng vagrave trigravenh bagravey thocircng tin theo những caacutech dễ hiểu để việc tiếp thu được nhanh choacuteng (biểu đồ đồ thịhellip)

(Tagravei liệu thecircm EIS lagrave những loại hệ thống lagrave rất phức tạp trong tự nhiecircn Coacute thể noacutei hệ thống nagravey cũng cung cấp cho caacutec nhagrave quản lyacute với caacutec thiết bị coacute khả năng ra quyết định bằng caacutech sử dụng của noacute Hệ thống nagravey hoạt động trong điều kiện như vậy quan trọng như trong caacutec hệ thống khaacutec khocircng hỗ trợ Khả năng lưu trữ dữ liệu nặng lagravem cho noacute lyacute tưởng để được thocircng qua khocircng chỉ bởi caacutec doanh nghiệp lớn magrave cograven bởi caacutec doanh nghiệp nhỏ hơn Nhigraven chung hệ thống nagravey lagrave dagravenh cho caacutec nhacircn viecircn cấp cao hỗ trợ thagravenh thạo trong việc đưa ra caacutec quyết định quan trọng)

Caacutec phiecircn EIS tiecircu biểu- Phiecircn lagravem việc coacute thể bắt đầu với một baacuteo caacuteo về tigravenh higravenh tagravei chiacutenh vagrave kinh

doanh của một cocircng ty caacutec chỉ số hoạt động quan trọng được hiển thị rotilde ragraveng- EIS sẽ cho pheacutep caacutec giaacutem đốc điều hagravenh coacute thể đi sacircu vagraveo dữ liệu từ những con

số bất kỳ magrave noacute hỗ trợ- Việc điều hagravenh coacute thể lựa chọn một mức độ chi tiết ( VD danh số baacuten hagraveng) nếu

như cần điều tra thecircm- Lagrave một phương phaacutep tiếp cận coacute thể giuacutep việc ra quyết định tốt hơn

Những điều magrave EIS ko coacute- EIS khocircng phải lagrave sự thay thế cho caacutec hệ thống dựa trecircn caacutec maacutey tiacutenh khaacutec EIS

thực sự chỉ cung cấp dữ liệu cho caacutec hệ thống nagravey- Noacute khocircng thể biến caacutec bộ hệ điều hagravenh của maacutey tiacutenh thagravenh những ldquochuyecircn viecircn

giỏirdquo- Coacute thể được viacute một caacutech cao hơn như lagrave một trợ lyacute đaacuteng tin cậy coacute thể được gọi

đến bất khi nagraveo vagrave mỗi khi cần thiết

Tagravei liệu thecircm Sự khaacutec nhau giữa EIS vagrave DSS+ EIS thiết kế để hỗ trợ những người điều hagravenh cấp cao giuacutep họ khaacutem phaacute caacutec vấn đề vagrave caacutec cơ hội DSS hỗ trợ những nười phacircn tiacutech cố gắng trả lời cacircu hỏi caacutei gigrave coacute thể lagravem cugraveng với một cơ hội hoặc một vấn đề

Chiều EIS DSSNhững người sử dụng thocircng thường

Duyệt dữ liệu đi xuống truy xuất trạng thaacutei

Hỗ trợ phacircn tiacutech vagrave quyết định

Sự thuacutec đẩy Tiacutenh thiacutech hợp Tiacutenh hiệu quảỨng dụng Queacutet mocirci trường đaacutenh giaacute

hiệu suất nhận dạng caacutec vấn đề vagrave caacutec cơ hội

Caacutec quyết định quản lyacute trecircn caacutec lĩnh vực đa dạng

Hỗ trợ quyết định Caacutec chiacutenh saacutech caacutec quyết định khocircng coacute cấu truacutec ở mức cao vagrave hỗ trợ giaacuten tiếp

Hỗ trợ caacutec quyết định lặp lại caacutec quyết định khocircng thể đoaacuten trước ra quyết định khocircng coacute cấu truacutec vagrave baacuten cấu truacutec

Loại thocircng tin Caacutec thocircng tin tin tức thocircng tin becircn ngoagravei về khaacutech hagraveng đối thủ cạnh tranh mocirci trường caacutec baacuteo caacuteo theo yecircu cầu vagrave định thời về caacutec hoạt động becircn trong

Caacutec thocircng tin hỗ trợ caacutec tigravenh huống đặc biệt

Sử dụng coacute nguyecircn tắc

Dograve theo vết vagrave điều khiển nhận dạng cơ hội

Hoạch định tổ chức phacircn nhoacutem vagrave điều khiển

Khả năng phugrave hợp với những người sử dụng caacute nhacircn

Thiết kế loại ra quyết định cho mỗi người điều hagravenh caacute nhacircn bằng nhiều lựa chọn đầu ra

Cho pheacutep caacutec đaacutenh giaacute caacute nhacircn caacutec khả năng what-if lựa chọn loại hộp hội thoại

Đồ họa Phải coacute Lagrave một phần quan trọng của nhiều DSS

Thacircn thiện người sử dụng

Phải coacute Phải coacute nếu khocircng coacute người sử dụng trung gian

Xử lyacute thocircng tin Lọc neacuten thocircng tin dograve theo vết dữ liệu vagrave thocircng tin quan trọng

EIS kiacutech thiacutech caacutec cacircu hỏi caacutec cacircu trả lời bằng caacutech sử dụng DSS vagrave phản hồi lại EIS

Hỗ trợ caacutec thocircng tin chi tiết

Truy xuất thường xuyecircn caacutec mức chi tiết của bất kỳ thocircng tin tổng hợp nagraveo (duyệt dữ

Coacute thể coacute trong DSS nhưng khocircng thường

liệu chi tiết)Cơ sở mocirc higravenh Caacutec chức năng coacute sẵn bị hạn

chếLagrave điểm cốt lotildei của DSS

Cấu truacutec Theo người baacuten sản phẩm hoặc theo caacutec chuyecircn gia hệ thống thocircng tin

Theo người sử dụng hoặc caacute nhacircn hoặc caacutec chuyecircn gia từ caacutec trung tacircm thocircng tin hoặc phograveng ban hệ thống thocircng tin

Phần cứng Mainframe caacutec trạm RISC mạng LANs hoặc caacutec hệ thống phacircn bố

Mainframe caacutec trạm RISC caacutec maacutey PC hoặc caacutec hệ thống phacircn bố

Bản chất caacutec goacutei phần mềm

Truy xuất tương taacutec dễ dagraveng đến nhiều cơ sở dữ liệu truy xuất trực tuyến caacutec khả năng DBMS phức tạp caacutec liecircn kết phức tạp

Caacutec khả năng tiacutenh toaacuten lớn caacutec ngocircn ngữ mocirc higravenh mocirc phỏng ứng dụng vagrave caacutec bộ tạo DSS

Bản chất caacutec thocircng tin

Trigravenh bagravey thocircng tin được phaacutet sinh trước về quaacute khứ vagrave hiện tại tạo caacutec thocircng tin mới về quaacute khứ hiện tại tương lai

Tạo thocircng tin mới về quaacute khứ hiện tại tương lai

62 Lịch sử EIS- EIS xuất hiện lần đầu tiecircn tại MIT vagraveo những năm 1970

- Những EIS đầu tiecircn được phaacutet triển bởi caacutec doanh ngiệp lớn sẵn sagraveng chấp nhận rủi ro để đạt được lợi thế cạnh tranh

- Vagraveo những năm 1980 caacutec nhagrave cung cấp đatilde phaacutet triển một số cơ sở khaacutech hagraveng rộng vagrave cocircng nghệ EIS được tiếp tục phaacutet triển cho đến ngagravey nay

(Tagravei liệu thecircm Sử dụng DSSEIS cho phaacutet triển bền vững + Một số nghiecircn cứu đatilde được tiến hagravenh để kiểm tra việc thực hiện của EIS trong khu vực cocircng cộng vagrave chiacutenh phủ caacutec nước tổ chức kể từ khi chuacuteng được phaacutet triển theo định hướng lợi nhuận cho caacutec cocircng ty tư nhacircn (Hasan vagrave Hasan năm 1997) Theo một nghiecircn cứu tiến hagravenh tại Mỹ ở hơn 300 cocircng ty kết quả cho thấy sự khaacutec biệt của EIS giữa tư nhacircn vagrave chiacutenh phủ một số kết quả thuacute vị được phaacutet hiệnViacute dụ khoacute khăn hơn để chuyển tiền từ một tagravei khoản khaacutec trong một EIS của chiacutenh phủ cũng lagrave khoacute khăn hơn để biện giải thiacutech cho những chi phiacute phaacutet triển EIS của chiacutenh phủ Một nghiecircn cứu khaacutec được tiến hagravenh ở Australia

cho thấy rằng EIS cung cấp cho quản lyacute một higravenh ảnh chiacutenh xaacutec hơn về tổ chức thực hiện vagrave cung cấp hỗ trợ cho caacutec lợi iacutech chiến lược cải thiện khocircng chỉ cho caacutec nhagrave quản lyacute nhưng cograven cho phần cograven lại của tổ chức Dựa trecircn caacutec hệ thống được thiết kế cho caacutec cocircng ty tư nhacircn với một caacutech rotilde ragravengxaacutec định mục tiecircu EIS lagrave thiacutech hợp cho caacutec tổ chức cocircng cộng hiện đại nhưng cần phải được linh hoạt hơn vagrave kết thagravenh chugravem một phạm vi rộng hơn khả năng vagrave phương tiện hơn so với khu vực tư nhacircn ban đầu theo định hướng sản phẩm (Hasan vagrave Hasan năm 1997) Điều nagravey coacute thể lagrave do thực tế rằng caacutec hoạt động khu vực cocircng lagrave bắt buộc coacute taacutec động rộng phải đaacutep ứng sự mong đợi duy nhất cocircng cộng thường coacute mục tiecircu mơ hồ vagrave macircu thuẫn iacutet quyền tự chủ vagrave kiểm soaacutet việc ra quyết định vagrave nhacircn viecircn lagrave khoacute khăn hơn (Watson vagrave Carte2000) + Toacutem lại EIS lagrave một khaacutei niệm thagravenh cocircng noacute phaacutet triển qua nhiều năm tuy nhiecircn EIS khắc phục khiếm khuyết của migravenh bằng caacutech tiến hagravenh nghiecircn cứu liecircn tục)

63 Tại sao những người điều hagravenh hagraveng đầu lại khaacutec nhau- Họ lagrave những doanh nghiệp theo định hướng coacute suy nghĩ

- Coacute một khoảng khocircng gian rộng để kiểm soaacutet

- Họ chịu traacutech nhiệm cho việc thiết lập chiacutenh saacutech

- Họ đại diện cho tổ chức mocirci trường becircn ngoagravei

- Hagravenh động của họ tạo ra những kết quả đaacuteng kể về tagravei chiacutenh vagrave con người

Tần số caacutec hoạt động điều hagravenh- Xử lyacute xaacuteo trộn 42

- Hoạt động kinh doanh 32

- Phacircn bổ nguồn lực 17

- Đagravem phaacuten 3

- Những điều khaacutec 6

Handling Disturbances 42

Entrepreneurial Activites 32

Resource Allocation 17

Negotiation 3

Other 6

Những thocircng tin điều hagravenh cần thiết- Quản lyacute xaacuteo trộn coacute thể yecircu cầu sự chuacute yacute xung quanh đồng hồ

- Hoạt động kinh doanh yecircu cầu điều hagravenh để dự đoaacuten những thay đổi trong mocirci trường

- Nhiệm vụ phacircn bổ tagravei nguyecircn yecircu cầu lựa chọn người quản lyacute vagrave caacutec nguồn lực hạn chế được triển khai

- Đagravem phaacuten yecircu cầu cập nhật thocircng tin từng phuacutet để coacute thể xacircy dựng được sự đồng thuận

Caacutec loại thocircng tin điều hagravenh- Hệ thống kế toaacuten coacute liecircn quan đến việc tiacutenh toaacuten thu nhập hoạt động cho caacutec lĩnh

vực cụ thể lagrave quan trọng hơn so với caacutec hệ thống kế toaacuten truyền thocircng- Thocircng tin về thị trường khaacutech hagraveng cung cấp giaacute trị trong việc quyết định chiến

lược- Caacutec thocircng tin cần thiết thường được truyền đi trecircn một số hệ thống maacutey tiacutenh vagrave

nằm trong toagraven tổ chức- Caacutec thocircng tin được sử dụng thường lagrave ngắn hạn vagrave dễ thay đổi

Phương thức để xaacutec định thocircng tin cần thiết

Rockart xaacutec định được năm phương thức cơ bản để xaacutec định thocircng tin cần thiết

- Phương thức dựa trecircn kết quả- Phương thức rỗng- Phương thức chỉ số khoacutea- Phương thức tổng hợp nghiecircn cứu- Phương thức dựa vagraveo nhacircn tố then chốt dẫn đến thagravenh cocircng

64 Thagravenh phần EIS

- Sản phẩm EIS đầu tiecircn được phaacutet triển để sử dụng trecircn maacutey tiacutenh cấu higravenh cao nhưng caacutec sản phẩm hiện nay nhằm mục tiecircu lagrave nền tảng ClientServer

- Những nền tảng linh hoạt hơn coacute thể thiacutech ứng với thay đổi trong tổ chức vagrave cocircng nghệ

- Sử dụng dữ liệu thời gian thực dẫn đến quyết định nhanh hơn nhiều thocircng tin hơn

Thagravenh phần phần cứng- Một EIS khocircng đogravei hỏi coacute phần cứng cụ thể hoặc duy nhất nagraveo- Chigravea khoacutea của vấn đề lagrave để đảm bảo rằng caacutec thagravenh phần của EIS tối ưu hoacutea vagrave

phugrave hợp với tagravei nguyecircn maacutey tiacutenh của tổ chức- Hệ thống nagravey phải được cấu higravenh để caacutec nguồn tagravei nguyecircn phugrave hợp với những

người điều hagravenh chuacuteng

Thagravenh phần phần mềm- Traacutei ngược với phần cứng phần mềm thường được chuyecircn mocircn hoacutea cao cho caacutec

bagravei toaacuten về miền- Sự chuyecircn mocircn hoacutea nagravey thường đạt được bằng caacutech sử dụng thagravenh phần off-the-

shelf cho toagraven bộ EIS vagrave caacutec mocirc-đun tugravey chỉnh để đaacutep ứng nhu cầu cụ thể- Lotus Notes lagrave một viacute dụ điển higravenh Noacute coacute thể được sử dụng một migravenh hoặc coacute

thể phục vụ becircn thứ ba mocirc-đun plug-in

Cocircng nghệ EIS hiện nay

Dobrzeniecki đề xuấtphacircn loạitừng cấptheo bachức năng- Loại 1 sản phẩm bao gồmmột bộ đầy đủcaacutec ứng dụngtừ mộtnhagrave cung cấp- Loại 2 sản phẩm đượcthựchiệnở phần đầu củacaacutecsản phẩmDSS đượcphaacutet triển

bởicugravengmộtnhagrave cung cấp- Loại 3 sản phẩmkết hợp với nhautheo bất kỳ số lượngthuộc sở hữu củacocircng ty

65 Xacircy dựng EIS

- Xacircy dựngmộtEISgiống nhưxacircydựngmột số hệ thống khaacutec củamocirc higravenh hệ thống thocircng tin

- Việcphaacutet triểncấu truacutecnecircn được theo dotildeitừ quaacute trigravenh thiết kế đến quaacute trigravenhthực hiện

- Tuy nhiecircn một dự aacuten phaacutet triển EIScoacute xu hướnglagrave thống nhấtvagraveyecircu cầu hỗ trợ caacutec nhagrave quản lyacute latildenh đạo

- Xacircy dựng một EIScoacute thểphaacutet hiện ra đượccaacutectigravenh huống khoacute khănmagravemột nhagrave phaacutet triển chưabao giờ gặp phải

Mocirc higravenh EIS

Khung phaacutet triển một EIS

- Watson et al đề nghị xacircy dựngkhung với ba thagravenh phần+ Caacutech tiếp cận tập trung vagraveo yếu tốcon người vagrave dữ liệu coacute liecircn quan đến EIS+ Quaacute trigravenh phaacutet triển cần sự linh hoạt vagrave tương taacutec+ Người sử dụng - hệ thống hộp thoại bao gồm một ngocircn ngữ hagravenh động để xử lyacute caacutec lệnh

Lợi iacutech của EIS- Dễ duy trigrave caacutec mục tiecircu coacute tổ chức- Dễ truy xuất thocircng tin- Cho pheacutep người sử dụng nacircng cao hiệu suất hơn

- Tăng chất lượng ra quyết định- Cung cấp sự cải tiến cạnh tranh- Tiết kiệm thời gian của người sử dụng- Tăng khả năng vagrave chất lượng giao tiếp- Cung cấp khả năng điều khiển tốt hơn trong tổ chức- Cho pheacutep tham gia caacutec vấn đề vagrave caacutec cơ hội- Cho pheacutep hoạch định- Cho pheacutep tigravem kiếm nguyecircn nhacircn của một vấn đề- Thảo matilden caacutec yecircu cầu của người điều hagravenh

Hạn chế của EIS vagrave 1 số sai lầm cần traacutenh

- Chi phiacute một cuộc khảo saacutetnăm1991 chothấychi phiacute phaacutet triểntrungbigravenh365000USDvớichi phiacute vận hagravenhhagraveng năm lagrave$200000 (EIS)

- Cocircng nghệ hạn chếEIScần phảiđượctiacutech hợp hoagraven toagravenvagraveokiếntruacuteccủadoanh nghiệphiện tại do đoacute noacutelagrave một thaacutech thứclớn đối vớithiết kế

- Hạn chế tổ chức cơ cấu tổ chứccoacute thể khocircng phugrave hợp

Sự hạn chế về tổ chức- Chương trigravenh nghị sự vagrave thời gian chệch EIS mocirc tả một phần việc thực hiện một

chương trigravenh nghị sự vagrave coacute thể dễ dagraveng đạt được sự tin cậy một caacutech chắc chắn- Đồng bộ hoacutea việc quản lyacute sự tin cậy đuacuteng luacutec đặc biệt baacuteo caacuteo EIS coacute thể phaacute

vỡ sự ổn định thiết lập caacutec chu trigravenh baacuteo caacuteo một caacutech tốt nhất- Sự bất ổn EIS phản ứng nhanh coacute thể gacircy ra việc taacutec động trở lại một caacutech

nhanh choacuteng dẫn đến sự thiếu ổn định trong tổ chức

Sự thất bại lagrave thay thế khocircng thể chấp nhận được- Một số yếu tố lagravem EIS thất bại

+ Thiếu sự hỗ trợ về mặt quản lyacute+ Vấn đề chiacutenh trị+ Thất bại của nhagrave phaacutet triển+ Lỗi về cocircng nghệ+ Giaacute cả+ Thời gian

66 Ra quyết định điều hagravenh trong tương lai vagrave EIS

- Coacute một vagravei điều kiện sẽ được hợp nhất cho việc chuyển đổi cocircng nghệ Trong đoacute một vagravei điều kiện coacute thể dễ dự đoaacuten Hai điều kiện magrave ta coacute thể thấy lagrave+ Phaacutet triển cocircng nghệ maacutey tiacutenh trong việc điều hagravenh sẽ tạo ra sự chuyển đổi được chấp nhận một caacutech dễ dagraveng hơn+ Mở rộng traacutech nhiệm điều hagravenh sẽ mở rộng nhu cầu thocircng tin

Tương lai của EIS- EIS thocircng minh Những tiến bộ trong cocircng nghệ AI sẽ được triển khai trong caacutec

EIS- EIS đa phương tiện Cơ sở dữ liệu đa phương tiện sẽ cho pheacutep tiacutech hợp văn bản

giọng noacutei vagrave higravenh ảnh trong tương lai- EIS thocircng tin Tương lai EIS sẽ mở rộng hơn trong việc sử dụng dữ liệu becircn

ngoagravei doanh nghiệp- EIS kết nối Giao tiếp với băng thocircng rộng cho pheacutep kết nối liecircn thocircng lớn hơn

Chương 7 HỆ CHUYEcircN GIA VAgrave TRIacute TUỆ NHAcircN TẠO

71 Caacutec khaacutei niệm

72 Triacute thocircng minh của triacute tuệ nhacircn tạo

73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia

74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia

75 Lợi iacutech vagrave hạn chế của hệ chuyecircn gia

71 Caacutec khaacutei niệm

Chuyecircn mocircn (Expertise) sự hiểu biết rộng trong 1 lĩnh vực hẹp

Hệ chuyecircn gia (Expert Systems)1 chương trigravenh maacutey tiacutenh sử dụng 1 tập caacutec luật dựa trecircn tri thức của con người để giải quyết caacutec vấn đề đogravei hogravei phải coacute sự chuyecircn mocircn

Một số hệ chuyecircn gia nổi tiếng

DENDRAL (Standford 1960s Edward Feigenbaum)

MYCIN (Standford1970s Edward Shortliffe)

PROSPECTOR (MIT 1979)

Triacute tuệ nhacircn tạo (Artificial Intelligence ndash AI)

Triacute tuệ nhacircn tạo một bộ phacircn của ngagravenh khoa học maacutey tiacutenh quan tacircm đến việc thiết kế caacutec hệ thống maacutey tiacutenh thocircng minh đoacute lagrave caacutec hệ thống đưa ra caacutec đặc điểm magrave từ đoacute chuacuteng ta liecircn hệ với sự thocircng minh trong hagravenh động của con người (Barr vagrave Feigenbaum 1981)

Mục điacutech của AI

Mục điacutech khoa học xaacutec định caacutec gợi yacute để giải thiacutech caacutec loại khaacutec nhau của triacute tuệ thực

Mục điacutech kỹ thuật giải quyết caacutec vấn đề trong thế giới thực

Triacute tuệ nhacircn tạo kế thừa nhiều yacute tưởng quan điểm kỹ thuật từ caacutec ngagravenh khoa học khaacutec

- Triết học

- Logic Toaacuten học

- Tiacutenh toaacuten

- Khoa học tacircm lyacute Khoa học nhận thức

- Sinh học Thần kinh học

- Tiến hoacutea

Caacutec lĩnh vực ứng dụng trong Triacute tuệ nhacircn tạo

Mạng nơ ron thần kinh (Neural Networks)

Tiacutenh toaacuten sự tiến hoacutea

(Evolutionary Computation)

Hệ chuyecircn gia (Expert Systems)

Kỹ thuật xử lyacute tiếng noacutei (Speech Processing)

Kỹ thuật xử lyacute ngocircn ngữ tự nhiecircn

(Natural Language Processing)

Lập kế hoạch (Planning)

Robot (Robotics)

Khoa học higravenh ảnh (Vision)

Caacutec kỹ thuật thocircng dụng dugraveng trong AI

Biểu diễn(Representation)

Học (Learning)

Caacutec luật (Rules)

Tigravem kiếm (Search)

72 Triacute thocircng minh của triacute tuệ nhacircn tạo

Con người suy diễn như thế nagraveo

Phacircn loại (Categorization)

Caacutec quy tắc cụ thể

Heuristics

Kinh nghiệm trước đoacute

Dự tiacutenh trước

Maacutey tiacutenh suy diễn như thế nagraveo

Lập luận dựa trecircn luật IF-THEN mocirc tả tri thức được matilde hoacutea dưới dạng caacutec luật

Caacutec khung (Frames) lagrave caacutec đại diện mocirc tả caacutec tigravenh huống giống nhau lagrave điển higravenh của một vagravei phacircn loại

Lập luận dựa trecircn caacutec trường hợp mocirc phỏng giải phaacutep trước đoacute cho một vấn đề hiện tại

Nhận dạng mẫu phaacutet hiện acircm thanh higravenh dạng hoặc caacutec chuỗi dagravei

Caacutec dạng khaacutec của Triacute tuệ nhacircn tạo

Học maacutey- mạng nơron vagrave giải thuật di truyền

Lập trigravenh tự động ndash lagrave những kỹ thuật tạo ra caacutec chương trigravenh để lagravem 1 nhiệm vụ riecircng biệt (cho pheacutep những người khocircng phải lagrave người lập trigravenh coacute thể lập trigravenh được)

Cuộc sống nhacircn tạo ndash nỗ lực để taacutei tạo caacutec hiện tượng sinh học trong caacutec hệ thống dựa trecircn maacutey tiacutenh

73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia(Expert Systems- ES)

Theo Jackson (1999) Một hệ chuyecircn gia lagrave một chương trigravenh maacutey tiacutenh mocirc tả vagrave suy diễn với tri thức của một vagravei lĩnh vực để giải quyết vấn đề hay đưa ra caacutec lời khuyecircn

Cấu truacutec cơ bản của ES được dựa theo cấu truacutec chung của DSS Sự khaacutec biệt chiacutenh giữa ES vagraveDSS lagrave hệ ES thu thập caacutec kiến thức từ những

chuyecircn gia trong lĩnh vực quan tacircmĐặc trưng của hệ chuyecircn gia Hiệu quả cao Thời gian trả lời thỏa đaacuteng Độ tin cậy cao Dễ hiểu

Giao diện người dugraveng trong ES

Thiết kế giao diện người dugraveng tập trung vagraveo caacutec yếu tố như dễ dagraveng sử dụngcoacute độ tin cậy cao giảm tải những khoacute khăn khi sử dụng

Thiết kế necircn coacute một số tương taacutec (đầu vagraveo kiểm soaacutet vagrave truy vấn)

Cấu tạo giao diện người dugraveng gồm coacute magraven higravenh cảm ứng bagraven phiacutem buacutet saacuteng lệnh thoại caacutec phiacutem chuyecircn dụng

Cơ sở tri thức (Knowledge Base)

Chứa đựng caacutec tri thức cụ thể miền thu được từ caacutec chuyecircn gia miền

Coacute thể chứa caacutec mocirc tả caacutec hagravenh vi giải quyết vấn đề caacutec ragraveng buộc caacutec heuristics

Thagravenh cocircng của một ES dựa trecircn tiacutenh đầy đủ vagrave tiacutenh chiacutenh xaacutec của cơ sở tri thức

Mocirc tơ suy diễn (Inference Engine)

Ở đacircy tri thức được đặt để sử dụng tạo ra caacutec giải phaacutep để giải quyết vấn đề

Mocirc tơ nagravey coacute khả năng thực hiện diễn dịch hoặc suy diễn dựa trecircn caacutec luật hay caacutec caacutec sự kiện

Đồng thời cũng coacute khả năng sử dụng caacutec suy diễn mờ hay khocircng chiacutenh xaacutec dựa trecircn xaacutec suất hay aacutenh xạ mẫu

Vograveng điều khiển suy diễn

1 Aacutenh xạ caacutec luật với caacutec sự kiện đatilde được cho

2 Chọn luật để thực hiện

3 Thực hiện luật bằng caacutech thecircm caacutec sự kiện được suy diễn ra vagraveo bộ nhớ lagravem việc

Chuỗi suy diễn (Chaining)

Suy diễn tiến (forward chaining) maacutey suy diễn bắt đầu từ dữ liệu ban đầu vagrave thực hiện việc suy luận để đưa ra caacutec kết luận cuối cugraveng

Suy diễn lugravei (backward chaining) maacutey suy diễn bắt đầu từ dữ liệu điacutech vagrave tigravem ra tri thức hỗ trợ cho dữ liệu điacutech đoacute

Viacute dụ suy diễn lugravei

R1 Nếu coacute A vagrave B thigrave suy ra coacute D

R2 Nếu coacute B thigrave suy ra coacute C

R3 Nếu coacute C vagrave D thigrave suy ra coacute E

Ta coacute E ta xem trong 3 luật R1 R2 R3 luật nagraveo coacute E ta thấy R3 chứa E đồng thời chứa C vagrave D Xeacutet tiếp trong 2 luật R1 R2 luật nagraveo chứa C vagrave D R2 chứa C R3 chứa D Từ đoacute ta coacute được caacutec tri thức hỗ trợ suy diễn vagrave kết luận lagrave nếu coacute A vagrave B thigrave sẽ coacute E Hay nếu A vagrave B đuacuteng thigrave sẽ coacute E

Viacute dụ suy diễn tiến

Giả sử coacute tập chứa 3 luật sau

R1 Nếu coacute A vagrave B thigrave suy ra coacute D

R2 Nếu coacute B thigrave suy ra coacute C

R3 Nếu coacute C vagrave D thigrave suy ra coacute E

Nếu ta coacute A vagrave B thigrave chuacuteng ta suy ra được D từ R1 vagrave suy ra C từ R2 Với D vagrave C đatilde được suy ra ở trecircn giờ chuacuteng ta suy ra được E từ R3

Viacute dụ thực tế

Giả sử muốn biết magraveu của một con vật nuocirci tecircn lagrave Fred biết rằng noacute kecircu ộp ộp vagrave ăn ruồi

Coacute tập 4 luật ban đầu như sau

R1 Nếu X kecircu ộp ộp vagrave ăn ruồi thigrave X lagrave con ếch

R2 Nếu X kecircu chiecircm chiếp vagrave biết hoacutet thigrave X lagrave con chim

R3 Nếu X lagrave con ếch thigrave X coacute magraveu xanh

R4 Nếu X lagrave con chim thigrave X coacute magraveu vagraveng

74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia

Expert system shells lagrave một tập caacutec goacutei phần mềm vagrave caacutec cocircng cụ dugraveng để phaacutet triển caacutec hệ chuyecircn gia

Những Expert system shells đầu tiecircn thường rất rườm ragrave Mặc dugrave vậy noacute vẫn giuacutep cho người sử dụng sẽ khocircng phải bắt đầu lại từ đầu khi xacircy dựng một hệ chuyecircn gia mới

Những shell hiện đại bao gồm hai mocirc-đun chiacutenh lagrave cocircng cụ xacircy dựng một tập quy tắc vagrave mocirc tơ suy diễn

Xacircy dựng hệ chuyecircn gia

Bước 1 xacircy dựng mocirc higravenh bagravei toaacuten xaacutec định vấn đề nhiệm vụ magrave hệ thống sẽ thực hiện Caacutec dạng bagravei toaacuten cần hệ chuyecircn gia

Bagravei toaacuten diễn giải (InterPretation)

Bagravei toaacuten dự baacuteo (Prediction)

Bagravei toaacuten chuẩn đoaacuten (Diagnose)

Bagravei toaacuten gỡ rối (Debugging)

Bagravei toaacuten thiết kế

Tương tự như một dự aacuten phần mềm để xacircy dựng một hệ chuyecircn gia cần phải coacute caacutec yếu tố về nhacircn lực tagravei nguyecircn vagrave thời gian Những yếu tố nagravey ảnh hưởng đến giaacute thah của một hệ chuyecircn giaTrong phần nagravey cacircu hỏi thường được đặt ra lagrave tại sao cần phải xacircy dựng một hệ chuyecircn giaTrước khi bắt đầu phải xaacute định rotilde bagravei toaacuten đạt ra lagrave jiAi lagrave chuyecircn giaAi lagrave người sử dụng

1 Diễn giải (InterPretation) Nghiecircn cứu 1 vấn đề -gt Dựa trecircn những biểu hiện thuộc tiacutenh đặc trưng becircn ngoagravei -gt Tư vấn

(hoặc đưa ra kết luận hay mocirc tả dễ hiểu từ tập dữ liệu thocirc)

2 Bagravei toaacuten dự baacuteo (Prediction) Coacute thể dự đoaacuten được hagravenh vi kết quả dựa trecircn caacutec hiện tượng -gt dự baacuteo

VD Dự baacuteo thời tiết động đấthellip

3 Bagravei toaacuten chẩn đoaacuten (Diagnoss) Xaacutec định caacutec lỗi caacutec bộ phận hỏng hoacutec của hệ thống dựa trecircn caacutec dữ liệu quan saacutet được

4 Bagravei toaacuten gỡ rối (Debugging) Mocirc tả caacutec phương phaacutep khắc phục hệ thống khi gặp sự cố

5 Bagravei toaacuten thiết kế Lựa chọn cấu higravenh caacutec đối tượng nhằm thoả matilden một số ragraveng buộc nagraveo đoacute

6 Giảng dạy Phần mềm dạy học coacute thể chuẩn đoaacuten vagrave sủa lỗi của học sinh trong quaacute trigravenh học tập

Để xaacutec định đuacuteng bagravei toaacuten magrave chuacuteng ta cần giải quyết thigrave phải trả lời đc một số cacircu hỏi

- cần hệ chuyecircn gia

Bước 2 thu thập tri thức lựa chọn cocircng cụ vagrave aacutep dụng

Trong bước thu thập tri thức vấn đề quan trọng lagrave lựa chọn chuyecircn gia những người magrave sẽ đoacuteng goacutep tri thức cho hệ thống Thocircng thường trong suốt quaacute trigravenh phaacutet triển thigrave chuyecircn gia được xem như một thagravenh viecircn của đội phaacutet triển

Hiện nay coacute rất nhiều cocircng cụ để xacircy dựng một hệ chuyecircn gia Phổ biến nhất lagrave JESS CLIPS vagrave OPS5

Bước 3 Thiết kế cơ sở tri thức thiết kế hệ thốngTri thức được biểu diễn trường minh trong cơ sở tri thức

Caacutec chuyecircn gia vagrave kỹ sư tri thức sẽ đối thoại với nhau bằng caacutec kỹ thuật đối thoại Suy diễn (SD) bảng Mocirc higravenh hoacutea SD quy nạp phacircn loại

Vấn đề bagraveo trigrave vagrave phaacutet triển

Caacutec hệ chuyecircn gia đogravei hỏi phải bảo trigrave vagrave phaacutet triển nhiều hơn so với caacutec hệ thống khaacutec Phải thường xuyecircn bổ sung tri thức mới vagrave thay đổi caacutec tri thức cũ để đổi mới hệ chuyecircn gia

Thu thập vagrave khắc phục lỗi do người sử dụng phaacutet hiện để kịp thời khắc phục những sai soacutet của hệ chuyecircn gia

75 Lợi iacutech vagrave hạn chế của caacutec hệ chuyecircn gia

Một số lợi iacutech chiacutenh

Thời gian trả lời hợp lyacute bằng hoặc nhanh hơn so với chuyecircn gia (người) để đi đến cugraveng một quyết định Hệ chuyecircn gia lagrave một hệ thống thời gian thực (real time system)

Khả năng trả lời với mức độ tinh thocircng bằng hoặc cao hơn so với chuyecircn gia (người) trong cugraveng lĩnh vực

Hệ chuyecircn gia giuacutep cho hiệu quả lagravem việc tăng bằng việc sử dụng tập caacutec luật một caacutech nhanh choacuteng magrave ko bị nhầm lẫn chuyecircn gia lagrave người coacute thể quecircn đi một số tri thức cơ sở lyacute luậ nhưng HCG thigrave ko

Quyết định của một người chuyecircn gia coacute thể bị thay đổi vagrave ko coacute tiacutenh thống nhất như quyết định của một hệ chuyecircn gia tạo ra

Hệ chuyecircn gia giuacutep cho người sử dụng coacute thể trau dồi sự hiểu biết trecircn lĩnh vuej cụ thể magrave noacute giải quyết hỗ trợ người ra quyết định coacute trigravenh độ như 1 chuyecircn gia trong quaacute trigravenh gia quyết định

Kiến thức của rất nhiều chuyecircn gia về một lĩnh vực nagraveo đoacute được đưa vagraveo hệ chuyecircn gia lagravem cho CSTT cuat HCG phong phuacute vagrave rộng lớn hơn rất nhiều

HCG giải thiacutech caacutec bước suy luận một caacutech dễ hiểu nhất quaacuten luacutec nagraveo cũng coacute thể sử dụng ko như chuyecircn gia con người

Hạn chế của caacutec hệ chuyecircn gia

Nhược điểm lớn nhất của hệ chuyecircn gia lagrave những yacute kiến chuyecircn mocircn thường rất khoacute matilde hoacutea vagrave giải neacuten

Hệ chuyecircn gia khocircng coacute khả năng tự học tự cập nhật kiến thức mới như caacutec chuyecircn gia magrave cần phải được matilde hoacutea lại khi noacute được cập nhật

Hệ chuyecircn gia khocircng thể nhận ra được vấn đề khocircng nằm trong miền kiến thức của hệ thống

Chương 8 Tri thức vagrave tiếp nhận

1 Bao gồm caacutec vấn đề

Dữ liệu thực tế đo lường hoặc quan saacutet coacute hoặc khocircng coacute bối cảnh

Thocircng tin dữ liệu được tổng hợp một caacutech hữu iacutech để giải quyết những khoacute khăn trong việc đưa ra quyết định

Tri thức bao gồm caacutec ứng dụng quy tắc thocircng tin hướng dẫn của người ra quyết định

2 Những caacutei nhigraven về tri thức

Đại diện lagravem thế nagraveo để diễn tả tri thức viacute dụ như một quyển saacutech khocircng phải lagrave tri thức nhưng noacute lại lagrave một đại diện của tri thức

Sản xuất tri thức lagrave một tập hơp của hagraveng tồn kho coacute thể được sản xuất cũng như mua lại

Tri thức lagrave 1 trong 6 trạng thaacutei của hệ thống

1Dữ liệu 2Thocircng tin 3Cấu truacutec thocircng tin 4Sự thấu hiểu 5Yacute kiến 6 Quyết định

3 Caacutec loại tri thức Phổ biến mocirc tả dữ liệu thocircng tin thủ tục mọi thứ lagravem như thế nagraveo lập luận chiacutenh saacutech hoặc caacutec quy tắc

4 Thu thập Tri thức hệ chuyecircn gia Hầu hết caacutec phương phaacutep đều bắt đầu với mocirc higravenh của caacutec taacutec vụ trong đoacute

hệ chuyecircn gia được xacircy dựng Trong đoacute mocirc tả về caacutec lĩnh vực được tạo ra Caacutec kỹ sư sử dụng caacutec mocirc higravenh giả thuyết vagrave nhận thức về quaacute trigravenh phacircn

tiacutech để gợi ra caacutech giải quyết vấn đề về tri thức từ caacutec chuyecircn gia

5 Caacutec chiều của thu thập tri thức KE- driven caacutec kỹ sư trao đổi trực tiếp với caacutec chuyecircn gia Expert-driven Caacutec chuyecircn gia trực tiếp đưa chuyecircn mocircn của họ vagraveo hệ

thống maacutey tiacutenh Machine-driven Sử dụng caacutec cocircng cụ suy luận để triacutech xuất tri thức từ một

tập caacutec viacute dụ

6 Kỹ thuật thu thập tri thức Trao đổi gồm 2 loại cơ bản lagrave coacute cấu truacutec(coacute kịch bản) vagrave khocircng coacute cấu

truacutec( đối thoại trực tiếp) Giao thức phacircn tiacutech bằng lời Khi caacutec chuyecircn gia thực hiện một cocircng việc

của họ thigrave một bản ghi về cocircng việc đoacute được thực hiện Caacutec kỹ sư sẽ xacircy dựng mocirc higravenh cho những gigrave được ghi lại trong bản ghi

Phương phaacutep sagraveng lọc caacutec chuyecircn gia so saacutenh caacutec nhoacutem liecircn tiếp trong ba đối tượng vagrave cho biết tại sao nhoacutem thứ hai lại khaacutec nhoacutem thứ ba

7 Thu thập tri thức từ nhiều nguồn Thu thập tri thức từ nhiều nguồn lagrave cần thiết để coacute được đầy đủ caacutec tri thức

cho một vấn đề quan điểm yacute kiến traacutei ngược nhau thường phaacutet sinh Phương phaacutep đồng thuận sẽ giuacutep giải quyết được vấn đề macircu thuẫn Kỹ thuật phacircn tiacutech Meta lagrave kỹ thuật được aacutep dụng trong caacutec trường hợp

khaacutec Caacutech tiếp cận bằng định lượng đogravei hỏi caacutec kỹ sư cần cacircn nhắc yếu tố đầu vagraveo của caacutec chuyecircn gia khaacutec nhau

8 Xaacutec nhận hợp lệ vagrave kiểm tra tri thức Một khi thu thập tri thức noacute phải được đaacutenh giaacute về khả năng sử dụng vagrave độ

chiacutenh xaacutec Hai vấn đề cụ thể lagrave hiệu lực của những kiến thức vagrave kiểm tra việc xacircy dựng cơ sở của tri thức

Cần xaacutec nhận xem liệu hệ thống coacute thể hoạt động ở mức độ tối thiểu khocircng

Xaacutec minh liecircn quan đến việc so saacutenh từng chi tiết kỹ thuật của hệ thống những gigrave đatilde được thực hiện cuối cugraveng

9 Một số caacutec biện phaacutep xaacutec nhận Độ chiacutenh xaacutec Khả năng thiacutech nghi Mức độ đầy đủ Bề rộng Độ sacircu Hiệu lực Tổng quan Chiacutenh xaacutec Hiện thực Độ tin cậy Tiacutenh hữu dụng Mức độ

Chương 9 Học maacutey

1 Logic mờ vagrave ngocircn ngữ mờ(Fuzzy Logic and Linguistic Ambiguity)

Ngocircn ngữ tự nhiecircn gồm những khaacutei niệm mơ hồ vagrave khocircng chiacutenh xaacutectruyền tải ngữ nghĩa thocircng qua tiacutenh xấp xỉkhocircng rotilde ragraveng

Những xấp xỉ nagravey giuacutep con người coacute thể truyền tải hết được yacute nghĩa nhưng maacutey thigrave khocircng hiểu

Lagravem sao biểu diễn caacutec tri thức sử dụng caacutec khaacutei niệm khocircng rotilde ragraveng(mờ) hoặc khocircng chiacutenh xaacutec

2 Khaacutei niệm cơ bản của logic mờ tập mờ lagrave những tập hợp khocircng coacute một giới hạn rotilde Mỗi phần tử của noacute chỉ

chứa một mức độ hagravem liecircn thuộc của từng phần tử Vigrave vậy tập mờ khocircng giống như tập cổ điển Tập mờ coacute thể kết hợp với nhau qua những luật mờ magrave đặc trưng cho những hagravenh động trạng thaacutei vagrave thuộc tiacutenh của logic mờ được tận dụng khi thực hiện một bộ điều khiển mờ

Logic mờ dựa trecircn yacute tưởng mỗi phần tử thuộc vagraveo một tập hợp ở một mức độ nagraveo đấy

Locircgic mờ cho pheacutep độ liecircn thuộc (microA )coacute giaacute trị trong khoảng (01) Locircgic mờ coacute thể được coi lagrave mặt ứng dụng của lyacute thuyết tập mờ để xử lyacute caacutec

giaacute trị trong thế giới thực cho caacutec bagravei toaacuten phức tạp

3 So saacutenh tiacutenh đuacuteng đắn logic mờ vagrave xaacutec suất Xaacutec suất thigrave đề cập đến khả năng xảy ra một biến cố hay một điều gigrave đoacute Logic mờ đề cập đến cấp độ magrave đặc tiacutenh ở hiện tại

o viacute dụ1 người coacute chiều cao 6 feet thigrave coacute cấp độ lagrave 05 về chiều cao

4 Ưu điểm của logic mờ Caacutech tiếp cận rất tự nhiecircnkhocircng phức tạp Coacute thể mocirc higravenh hoacutea caacutec hagravem phi tuyến tugravey yacute phức tạp

Coacute thể tận dụng được kinh nghiệm từ những chuyecircn gia hagraveng đầu trong mọi lĩnh vực

Logic mờ được xacircy dựng dựa trecircn ngocircn ngữ tự nhiecircnNền tảng của logic mờ lagrave dựa trecircn cơ sở giao tiếp của con người

5 Nhược điểm của logic mờ Trong 1 hệ thống phức tạpsử dụng logic mờ coacute thể trở thagravenh trở ngại cho

việc xaacutec thực độ tin cậy của hệ thống Cơ chế lập luận mờ khocircng thể học hỏi từ những lỗi sai

6 Mạng noron nhacircn tạo(ANN) Mạng noron nhacircn tạo lagrave một mocirc phỏng xử lyacute thocircng tinđược nghiecircn cứu ra

từ hệ thống thần kinh của sinh vậtgiống như bộ natildeo để xử lyacute thocircng tin ANNs lagrave chương trigravenh dựa trecircn maacutey tiacutenh đơn giản coacute chức năng lagrave một mocirc

higravenh bagravei toaacuten khocircng gian dựa trecircn thử nghiệm vagrave baacuteo lỗi

7 Học từ kinh nghiệm Tiến trigravenh Một mẫu dữ liệu được biểu diễn như một mạng lưới noronANN ldquodự

đoaacutenrdquo 1 đầu radự đoaacuten được so saacutenh với giaacute trị thực tế hoặc giaacute trị chiacutenh xaacutecNếu đoaacuten được chiacutenh xaacutec thigrave khocircng coacute hagravenh động nagraveo được thực hiện

Nếu dự đoaacuten sai ANN kiểm tra lại vagrave xaacutec định lại thocircng số để điều chỉnh Một mẫu dữ liệu khaacutec được biểu diễn vagrave quaacute trigravenh nagravey được lặp lại

8 Nguyecircn tắc cơ bản của cocircng nghệ nơron Caacutec yếu tố xử lyacute cơ bản trong hệ thống thần kinh của con người lagrave tế bagraveo

thần kinhMạng lưới của tế bagraveo nagravey lagrave liecircn kết với nhau nhận được thocircng tin từ caacutec cảm biến trong mắt taihellip

Thocircng tin nhận được bởi tế bagraveo thần kinh hoặc lagrave sẽ kiacutech thiacutech noacute(sẽ được chuyển qua 1 thocircng điệp dọc theo mạng lưới) hoặc lagrave sẽ ngăn cản noacute(ngăn cản dograveng thocircng tin)

Độ nhạy coacute thể thay đổi qua thời gian hoặc sau khi coacute được kinh nghiệm

9 Cấu truacutec mạng Một ANN gồm 3 lớp cơ bản

Lớp đầu vagraveo nhận dữ liệu Lớp becircn trong hoặc lagrave lớp ẩn xử lyacute dữ liệu Lớp đầu ra chuyển tiếp kết quả cuối cugraveng của mạng

10Mạng nơ ron Thường coacute nhiều đầu vagraveo mỗi đầu vagraveo với mức ảnh hưởng vagrave tầm quan

trọng riecircng của noacute Một đầu vagraveo quan trọng coacute thể được sử dụng để khuếch đại đầu ra caacutec hagravem trạng thaacutei tổng hợp caacutec trọng số của caacutec yếu tố

đầuvagraveo khaacutec nhauvagraveo một giaacute trị duy nhất Caacutec hagravem chuyển giao xử lyacute caacutec giaacute trị trạng thaacutei vagrave tạo đầu ra

11Huấn luyện mạng nơ ron Trong mocirc higravenh coacute giaacutem saacutetANN được đến so saacutenh dự đoaacuten của chiacutenh

noacute với thocircng tin phản hồi coacute chứa caacutec kết quả mong muốn ANN sẽ phải tigravem caacutech thay đổi caacutec tham số becircn trong củamigravenh (caacutec trọng số vagrave caacutec ngưỡng) để tạo necircn một aacutenh xạ coacute khả năng aacutenh xạcaacutec đầu vagraveo thagravenh caacutec đầu ra mong muốn Sự thay đổi nagravey được tiến hagravenh nhờ việc so saacutenh giữa đầu ra thực sự vagrave đầu ra mong muốn

Trong mocirc higravenh khocircng coacute giaacutem saacutetANN nhận được dữ liệu vagraveo nhưng khocircng phải coacute bất kỳ thocircng tin phản hồi về kết quả mong muốn

Phần lớn caacutec ứng dụng nằm trong vugraveng của caacutec bagravei toaacuten ước lượng như mocirc higravenh hoacuteathống kecirc neacuten lọc phacircn cụm

12Lợi iacutech Liecircn kết với mạng noron Traacutenh caacutech lập trigravenh tường minh Giảm nhu cầu của chuyecircn gia ANNs thigrave thiacutech nghi với caacutec yếu tố đầu vagraveo thay đổi Khocircng cần thiết cho cơ sở tri thức tinh chế ANNs coacute tiacutenh động vagrave cải thiện với việc sử dụng Coacute khả năng xử lyacute dữ liệu khocircng chiacutenh xaacutec hoặc khocircng đầy đủ Cho pheacutep tổng quaacutet hoacutea từ thocircng tin cụ thể Cho pheacutep thu thập cảm giaacutec thocircng thường vagraveo miền giải quyết vấn đề

13Hạn chế của việc liecircn kết với mạng noron ANNs khocircng thể giải thiacutech được suy luận Bản chất hộp đen thường khiến cho vấn đề traacutech nhiệm vagrave độ tin cậy phaacutet

sinh lagrave khoacute khăn Lặp đi lặp lại quaacute trigravenh huấn luyện rất tốn thời gian Nguồn lực caacutec nhagrave phacircn tiacutech vagrave thiết kế coacute tay nghề cao vẫn lagrave đaacuteng lo

ngại Cocircng nghệ ANN thuacutec đẩy hạn chế của phần cứng hiện tại ANN yecircu cầu phải coacute sự tin tưởng ở đầu ra

14Giới thiệu về thuật toaacuten di truyền Cũng như mạng lưới thần kinh caacutec thuật toaacuten di truyền được dựa trecircn lyacute

thuyết sinh học Thuật toaacuten di truyền tigravem thấy nguồn gốc của chuacuteng trong caacutec lyacute thuyết

tiến hoacutea của chọn lọc tự nhiecircn vagrave thiacutech ứng với biến đổi khiacute hậu Kết quả thuật toaacuten di truyền lagrave từ giao phối 2 caacute thể trong quần thế để tạo

ra con caacutei đocirci khi tốt hơn so với bậc cha mẹ của chuacuteng 15Caacutec thagravenh phần cơ bản của thuật toaacuten di truyền

Toaacuten tử chọn lọc Caacutec caacute thể tốt được chọn lọc để đưa vagraveo thế hệ sau Sự chọn lọc nagravey căn cứ vagraveo độ thiacutech nghi với mocirci trường của mỗi caacute thể

Toaacuten tử lai gheacutep (crossover) Hai caacute thể cha vagrave mẹ trao đổi caacutec gen với nhau để tạo ra caacute thể con

Toaacuten tử đột biến (mutation) Một caacute thể thay đổi một số gen để biến đổi thagravenh một caacute thể mớiTất cả caacutec toaacuten tử trecircn khi thực hiện đều mang tiacutenh ngẫu nhiecircn

16Quaacute trigravenh cơ bản của một thuật toaacuten di truyền Khởi tạo

Đaacutenh giaacute quần thể

Lựa chọn NST thiacutech hợp nhất vagrave loại bỏ NST yếu nhất

Quy trigravenh giao nhau vagrave cải thiện quần thể

đột biến tiến trigravenh để khaacutem phaacute ra NST mới

17Ưu nhược điểm của việc kết hợp với thuật toaacuten di truyền Kiacutech thước quần thể lagrave 1 yếu tố quan trọng trong tốc độ của việc tigravem

kiếmnhưng noacute tương đối dễ dagraveng để dự đoaacuten tốc độ nagravey Giao nhau hoặc đột biến lagrave khocircng necircn đc sử dụng quaacute thường xuyecircn Luocircn coacute được iacutet nhất 1 giải phaacutep hợp lyacute Necircn coacute thể aacutep dụng chuacuteng cho caacutec vấn đề magrave chuacuteng ta khocircng coacute hướng

về caacutech giải quyết Sức mạnh của thuật toaacuten xuất phaacutet từ khaacutei niệm đơn giảnkhocircng phải từ

một thủ tục thuật toaacuten phức tạp 18Tương lai của học maacutey

Mạng lưới thần kinh nhacircn tạo vượt quaacute năng lực của con người trong caacutec trường hợp bị cocirc lập

Về mặt lyacute thuyếtmột maacutey tiacutenh coacute thể xử lyacute dũ liệu nhanh hơn hagraveng triệu lần so với 1 con người

May mắn thay cho chuacuteng tacon người tốt hơn nhiều khi magrave coacute được dữ liệumaacutey tiacutenh khocircng coacute 1 số thứ như lagrave 5 giaacutec quan

CHƯƠNG 10 KHO DỮ LIỆU

1 Kho dữ liệu Kho dữ liệu lagrave tuyển tập caacutec cơ sở dữ liệu tiacutech hợp hướng chủ đề được

thiết kế để trợ giuacutep cho một hệ hỗ trợ quyết định

Theo John Ladley Cocircng nghệ kho dữ liệu lagrave tập caacutec phương phaacutep kỹ thuật vagrave caacutec cocircng cụ coacute thể kết hợp hỗ trợ nhau để cung cấp thocircng tin cho người sử dụng trecircn cơ sở tiacutech hợp từ nhiều nguồn dữ liệu nhiều mocirci trường khaacutec nhau

Kho dữ liệu thường rất lớn tới hagraveng trăm GB hay thậm chiacute hagraveng Terabyte

2 Kho dữ liệu vận hagravenh (ODS) Một kho dữ liệu vận hagravenh Aacutep dụng kỹ thuật kho dữ liệu vagraveo caacutec hệ xử

lyacute giao taacutec lưu trữ dữ liệu cho một ứng dụng đặc thugrave Noacute đưa vagraveo kho dữ liệu một dograveng caacutec dữ liệu thocirc được thiết kế

3 So saacutenh

Kho dữ liệu vận hagravenh Kho dữ liệu

Dữ liệu theo chủ đề Dữ liệu theo chủ đề

Dữ liệu tiacutech hợp Dữ liệu tiacutech hợp

Dữ liệu thay đổi Dữ liệu khocircng thay đổi

Dữ liệu được cập nhật khi thay đổi

Dữ liệu giữ nguyecircn

Chỉ coacute dữ liệu hiện tạiDữliệu hiện tại vagrave dữ liệu lịch sử

Chu kỳ lagravem tươi dữ liệu ngắn Chu kỳ lagravem tươi dữ liệu dagravei

Chỉ coacute dữ liệu chi tiết Dữ liệu chi tiết vagrave dữ liệu tổng kết

Dugraveng cho caacutec quyết định ngắn hạn

Dugraveng cho hoạch định dagravei hạn

4 Kho dữ liệu cục bộ (Data Mart - DM)

Kho dữ liệu cục bộ lagrave CSDL coacute những đặc điểm giống với kho dữ liệu nhưng với quy mocirc nhỏ hơn vagrave lưu trữ dữ liệu về một lĩnh vực một chuyecircn ngagravenh

Data mart phụ thuộc Chứa những dữ liệu được lấy từ DW vagrave những dữ liệu nagravey sẽ được triacutech lọc vagrave tinh chế tiacutech hợp lại ở mức cao hơn để phục vụ một chủ đề nhất định của Datamart

Data mart độc lập Khocircng giống như Datamart phụ thuộc Data mart độc lập được xacircy dựng trước DW vagrave dữ liệu được trực tiếp lấy từ caacutec nguồn khaacutec nhau

5 Siecircu dữ liệu Metadata lagrave dữ liệu để mocirc tả dữ liệu Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột

một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi Metadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu

6 Mocirci trường kho dữ liệu Hệ thống của tổ chức vagrave kho cung cấp dữ liệu để xacircy dựng kho dữ liệu Trong quaacute trigravenh chuyển dữ liệu từ caacutec nguồn khaacutec nhau dữ liệu coacute thể

được lagravem sạch hoặc chuyển đổi vagrave vigrave thế DW được xem như lagrave một chuẩn cho việc lưu trữ

Đồng thời siecircu dữ liệu được ghi lại Cuối cugraveng DW hoặc siecircu thị coacute thể được sử dụng để tạo ra một kho dữ

liệu ldquocaacute nhacircnrdquo 7 Caacutec đặc điểm của kho dữ liệu

Đặc điểm Mocirc tả

Hướng chủ đề - DL tổ chức theo caacutech thức người dugraveng tham chiếu

Tiacutech hợp - Dữ liệu ldquosạchrdquo loại bỏ tiacutenh thiếu nhất quaacuten

Khocircng thay đổi - DL ldquochỉ đọcrdquo người dugraveng khocircng thay đổi được

Chuỗi thời gian - DL lagrave chuỗi thời gian khocircng phải lagrave trạng thaacutei hiện tại

Được tổng kết - DL vận hagravenhthao taacutec khi cần thiết

được kết hợp lại thagravenh dạng coacute thể dugraveng được cho quyết định

Kiacutech cỡ lớn hơn - Lưu giữ theo chuỗi thời gian tức lagrave giữ lại nhiều DL

Khocircng được chuẩn hoacutea - Coacute thể dư thừa DLSiecircu dữ liệu - Dữ liệu của dữ liệu được lưu trữNguồn dữ liệu - DL vận hagravenh (caacutec hệ sẵn coacute) cugraveng

với caacutec nguồn ngoagravei 8 Kho dữ liệu hướng chủ đề

Hướng chủ để coacute nghĩa lagrave kho dữ liệu được tổ chức xung quanh caacutec chủ đề chiacutenh như khaacutech hagraveng sản phẩm sản xuất Tập trung vagraveo việc mocirc higravenh hoacutea vagrave phacircn tiacutech dữ liệu cho caacutec nhagrave ra quyết định magrave khocircng tập trung vagraveo caacutec xử lyacute thocircng thường Cung cấp cho người dugraveng một khung nhigraven toagraven vẹn đơn giản vagrave đầy đủ về caacutec sự kiện quanh caacutec chủ đề

9 Dữ liệu trong DW được tiacutech hợp Dữ liệu trong kho dữ liệu được xacircy dựng bằng caacutech tổng hợp dữ liệu từ

nhiều nguồn khaacutec nhau vagrave caacutec nguồn coacute tổ chức khaacutec nhau Cơ sở dữ liệu caacutec file excel caacutec flat file hoặc caacutec raw file Khi đưa vagraveo kho dữ liệu caacutec dữ liệu được lagravem sạch vagrave tiacutech hợp dữ liệu nhằm đảm bảo tiacutenh nhất quaacuten của dữ liệu

10Kiến truacutec kho dữ liệu Tầng cơ sở dữ liệu hoạt động Tầng truy xuất thocircng tin Tầng truy xuất dữ liệu Tầng siecircu dữ liệu Tầng quản lyacute tiến trigravenh Tầng thocircng điệp của ứng dụng Tầng vật liacute của kho dữ liệu Tầng trigravenh diễn dữ liệu

11Higravenh trạng kho dữ liệu Kho dữ liệu ảo - người dugraveng cuối coacute thể truy cập trực tiếp đến kho dữ liệu

sử dụng caacutec cocircng cụ cho pheacutep ở tầng truy xuất dữ liệu Kho dữ liệu trung tacircm-1 cơ sở dữ liệu vật lyacute chứa tất cả dữ liệu cho một

vugraveng chuyecircn dụng nagraveo đoacute

Kho dữ liệu phacircn taacuten- Thagravenh phần được phacircn taacuten qua nhiều hệ cơ sở dữ liệu vật lyacute

12METADATA- Siecircu dữ liệu Định nghĩa Siecircu dữ liệu lagrave dữ liệu về dữ liệu Lagrave 1 lưu trữ dugraveng để

Miecircu tả kho dữ liệu tổng thể Nhận dạng kiểu kho dữ liệu Quản liacute quaacute trigravenh tiacutech hợp dữ liệu Quản liacute quaacute trigravenh cập nhật kho dữ liệu Quản liacute bảo mật

Lagrave chigravea khoacutea quyết định sự thagravenh cocircng của kho dữ liệu luocircn được thay đổi vagrave cập nhật theo sự phaacutet triển của kho dữ liệu

Dugraveng để quản liacute điều khiển kho dữ liệu Sự ra đời của kho dữ liệu như 1 cấu truacutec hỗ trợ ra quyết định siecircu dữ liệu

được xem như nguồn tagravei nguyecircn dữ liệu Siecircu dữ liệu lagrave trừu tượng Chuacuteng lagrave dữ liệu bậc cao cung cấp mocirc tả ngắn

gọn caacutec dữ liệu bậc thấp hơn 13Hoạt động của Siecircu dữ liệu

Siecircu dữ liệu rất cần thiết trong việc chuyển hoacutea thocircng tin trở thagravenh tri thức Lagrave chigravea khoacutea giuacutep chuacuteng ta xử lyacute được dữ liệu thocirc Viacute dụ một dograveng dữ liệu baacuten hagraveng 1023 K596 11121 agraveNoacute sẽ khocircng coacute nghĩa gigrave cho đến khi chuacuteng ta đưa vagraveo siecircu dữ liệu (thư

mục chứa dữ liệu) agrave cửa hagraveng 1023 sản phẩm K596 vagrave số tiền baacuten được lagrave 11121 đocirc la

14Sự cần thiết phải nhất quaacuten trong kho dữ liệu Kho dữ liệu được xacircy dựng cho lợi iacutech của những nhagrave phacircn tiacutech kinh

doanh caacutec nhagrave quản trị cho tất cả caacutec khu vực chức năng Trong cơ sở dữ liệu riecircng caacutec khu vực khaacutec nhau coacute thể định nghĩa vagrave lưu

trữ dữ liệu thocircng qua phiecircn bản của chiacutenh noacute Khi dữ liệu được lấy từ những vugraveng khaacutec nhau đoacute vagrave được đặt vagraveo kho dữ

liệu Việc chuyển đổi vagrave lagravem sạch caacutec tiến trigravenh sẽ đảm bảo noacute lagrave duy nhất được tiacutech hợp tại một mức của tổ chức

15Ragrave soaacutet lại dữ liệu ndash Thực thi siecircu dữ liệu

Bất kể cấu truacutec tự nhiecircn của 1 cacircu truy vấn thế nagraveo thigrave caacutec thagravenh phần của siecircu dữ liệu rất quan trọng đối với người ra quyết định

Bảng thuộc tiacutenh khoacutea được lưu trữ bởi kho dữ liệu Tập hợp dữ liệu được lấy từ đacircu Những chuyển đổi nagraveo được thực thi với việc lagravem sạch

16Siecircu dữ liệu lagrave gigrave Metadata - lagrave thocircng tin mocirc tả nội dung của cơ sở dữ liệu (CSDL) Metadata baacuteo cho người dugraveng biết thời gian cập nhật sau cugraveng của dữ liệu

định dạng vagrave mục điacutech sử dụng của noacute Những thocircng tin nagravey coacute thể hướng dẫn người dugraveng duyệt qua CSDL vagrave

giuacutep họ hiểu được yacute nghĩa vagrave ngữ cảnh của dữ liệu Trong CSDL metadata lagrave caacutec dạng biểu diễn khaacutec nhau của caacutec đối tượng

trong CSDL Trong CSDL quan hệ metadata lagrave caacutec định nghĩa của bảng cột CSDL

view vagrave nhiều đối tượng khaacutec Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột

một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi -gtMetadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu

Bảng chuyển đổi Ghi lại những chuyển đổi đatilde được thực hiện

Lịch sử thực thi Ghi lại những dữ liệu đatilde được

phacircn tiacutech

Higravenh thaacutei kết nốiGhi lại những dữ liệu được kết nối vagrave tần suất

17Aacutenh xạ thocircng thường của siecircu dữ liệu Bản ghi aacutenh xạ chuyển đổi bao gồm

Định danh của nguồn gốc Chuyển đổi thuộc tiacutenh Chuyển đổi thuộc tiacutenh vật lyacute Matilde hoacutea tham chiếu bảng chuyển đổi Đổi tecircn Đổi khoacutea Gaacuten giaacute trị cho thuộc tiacutenh mặc định Chọn logic cho caacutec nguồn nhiều giaacute trị Đổi thuật toaacuten

18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để

phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai

lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave

tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec

Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm

Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo

19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua

caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau

SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được

Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra

một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức

Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ

Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ

Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech

CHƯƠNG 11 KHAI PHAacute DỮ LIỆU

1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn

ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993

Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng

2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd

1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều

2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP

3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn

4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng

5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server

6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo

7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động

8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời

9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều

10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện

11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech

12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP

3 Xử lyacute phacircn tiacutech trực tuyến OLAP

MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave

dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu

ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave

thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu

HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave

ROLAP4 Khai phaacute dữ liệu

Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh

khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn

Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan

5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp

6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại

Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp

Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec

Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt

Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra

Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh

vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho

Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec

Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm

Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục

Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng

gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp

Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn

Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec

Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper

Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2

Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25

Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước

Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng

Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện

trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp

Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute

độ hỗ trợ ge ngưỡng minsup

độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan

Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn

Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết

Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu

MOLAP ROLAP HOLAP

Lưu trữ dữ liệu cơ sở

Khối Bảng quan hệ Bảng quan hệ

Lưu trữ thocircng tin tổng hợp

Khối Bảng quan hệ Khối

Hiệu suất thực hiện truy vấn

Nhanh nhất Chậm nhất Nhanh

Tiecircu thụ khocircng gian lưu trữ

Nhiều Thấp Trung bigravenh

Chi phiacute bảo trigrave Cao Thấp Trung bigravenh

Page 5: De cuong(1-11)

Caacutec đặc trưng thống nhất của mỗi lược đồ cụ thể giữ vai trograve quan trọng trong việc xaacutec định caacutech tiếp cận tốt nhất để thiết kế một hệ thống mới

Chương 2Quyết định vagrave quyết định của nhagrave sản xuất10Quaacute trigravenh ra quyết định

Quaacute trigravenh ra quyết định gồm coacute 3 giai đoạn (Simon 1977)bull Tigravem hiểu bagravei toaacuten dẫn đến quyết định

+Xaacutec định mục tiecircu tổ chức+Tigravem kiếm vagrave tập hợp dữ liệu+Nhận diện xaacutec định chủ thể bagravei toaacuten+phacircn loại vagrave phaacutet biểu vấn đề

bull Thiết kế (design) phacircn tiacutech vagrave xacircy dựng caacutec diễn trigravenh hagravenh động+Thiết lập mocirc higravenh+Lập bảng tiecircu chuẩn chọn lựa+Tigravem kiếm caacutec phương aacuten+Tiecircn đoaacuten vagrave đo lường caacutec kết cục

bull Chọn lựa (choice) chọn một diễn trigravenh trong tập diễn trigravenh+Giải phaacutep cho mocirc higravenh+Phacircn tiacutech độ nhạy+Chọn (caacutec) phương aacuten tốt nhất+Hoạch định việc hiện thực

tiếp theo giai đoạn chọn lựa lagrave giai đoạn hiện thực (implementation)11Người ra quyết định

Người ra quyết định (decision maker) giữ một vai trograve tacircm thần phacircn liệt vigrave vừa được coi lagrave một bước trong quaacute trigravenh vagrave cũng lại lagrave người tham gia

Phacircn lớp người ra quyết định-Quyết định caacute nhacircn coacute thể lagrave 1 người hoặc một hệ thống maacutey tiacutenh đơn lẻ-Nhiều người ra quyecirct định coacute thể lagrave

+Nhoacutem (group)trong đoacute mọi thagravenh viecircn đều coacute tiếng noacutei trong việc ra quyết định

+Đội(team) Caacutec thagravenh viecircn hỗ trợ một người ra quyết định duy nhất+Tổ chứcTrong đoacute cần sự thỏa thuận chung

12Caacutec kiểu ra quyết định Style lagrave caacutech magrave người quản lyacute ra quyết định

Hiệu lực của mỗi style riecircng biệt phụ thuộc vagraveo ngữ cảnh bagravei toaacuten nhận thức của người ra quyết định vagrave tập caacutec giaacute trị caacute nhacircn của bản thacircn họ

Độ phức tạp của caacutec điều đoacute liecircn kết lại với nhau trong việc higravenh thagravenh decision style

Caacutec kiểu ra quyết định Directive ndash kết hợp đogravei hỏi về cấu truacutec bagravei toaacuten cao với mức độ nhập nhằng thấp

Thocircng thường đacircy lagrave caacutec quyết định coacute bản chất kỹ thuật vagrave đogravei hỏi iacutet thocircng tin Analytical ndash Mức độ nhập nhằng lớn hơn vagrave đogravei hỏi nhiều thocircng tin hơn Conceptual ndash Mức độ nhập nhằng cao vagrave thường gần gũi với caacutech ra quyết định

của con người Behavioral ndash đogravei hỏi lượng dữ liệu nhỏ vagrave thể hiện caacutei nhigraven ngắn hạn Thường

xảy ra xung đột necircn phải dựa vagraveo sự đồng thuận Caacutec kiểu ra quyết định trong thiết kế hệ trợ giuacutep quyecirct định

Những cản trở lớn chiacutenh lagrave phản ứng của người ra quyết định trước aacutep lực vagrave phương phaacutep dugraveng để giải bagravei toaacuten

Viacute dụ đối với những người khocircng chịu được aacutep lực trong dạng directive thigrave giao diện cần cho pheacutep người ra quyết định kiểm soất được hệ thống với khocircng coacute quaacute nhiều dữ liệu đầu vagraveo

Đối với kiểu analytic DSS cần cho pheacutep truy cập tới nhiều nguồn dữ liệu magrave người ra quyết định sẽ phacircn tiacutech

13Khoacute khăn khi xacircy dựng DSS

- Thocircng tin mocirc higravenh cấu truacutec -gt iacutet thocircng tin

- Khả năng của con người (khả năng hiểu biết) chỉ xử lyacute được từ 5-gt9 quaacute trigravenh thocircng tin khaacutec nhau

- Khocircng chắc chắn ( mức độ hoagraven thagravenh vagrave tiacutenh chiacutenh xaacutec)

- Coacute nhiều lựa chọn vagrave đa mục tiecircu

Chương 3Quyết định trong tổ chức

14Tổ chức lagrave gigrave Tổ chức Lagrave 1 hệ thống thống nhất caacutec nguồn tagravei nguyecircnĐược cấu thagravenh bởi caacutec

hệ thống nhỏ hơn ragraveng buộc với nhau bởi caacutec mục tiecircu đề ra

Tổng thể 1 tổ chức sẽ mạnh mẽ hơn rất nhiều so với tất cả caacutec thagravenh phần của noacute cộng lại

Mối liecircn hệ của caacutec quyecirct định Mục điacutech chiacutenh của caacutec tổ chức lagrave đưa ra caacutec quyết định trong mocirci trường kinh doanh Caacutec Quyết định phải phugrave hợp với giới hạncaacutec chiacutenh saacutech caacutec thủ tục vagrave lĩnh vực hoạt động Noacute khocircng phụ thuộc vagraveo người đưa ra quyết định lagrave ai Đoacute coacute thể lagrave 1 caacute nhacircn1 nhoacutem hay thậm chiacute DSSs

Độ đo của quyết địnhNăm khiacutea cạnh ảnh hưởng tới Quyết định

Kết cấu nhoacutem (Group Structure) Vai trograve trong nhoacutem(Group Roles) Quaacute trigravenh lagravem việc(Group Processes) Taacutec phong(Group Style) Quy tăc nhoacutem(Group Norm)

Kết cấu nhoacutem Trong 1 nhoacutem chuẩn caacutec thagravenh viecircn coacute traacutech nhiệm vagrave thẩm quyền ra quyết định như nhau Vai trograve trong nhoacutemTrong nhoacutem caacutec thagravenh viecircn đều coacute vai trograve riecircng vagrave

lagrave 1 phần quan trong trong cả tiến trigravenh Quaacute trigravenh lagravem việcQuaacute trigravenh dugraveng người trong nhoacutem ảnh hưởng tới loại

quyết định gacircy hiệu quả vagrave ảnh hưởng tới cả tiến trigravenh Taacutec phong Coacute phải taacutec phong của người ra quyết định coacute ảnh hưởng tới

chất lượng quyết định cuối khocircng Quy tắc nhoacutemQuy tắc nhoacutem lagrave cực kỳ quan trọng trong việc xaacutec định

hagravenh vi caacutec thagravenh viecircn nhoacutem trong caacutec tigravenh huống xatilde hội Phacircn cấp quyết định trong tổ chức3 cấp

Chiến lược Ban latildenh đạo cấp cao hoặc nhagrave quản lyacute Caacutec quyết định mang tiacutenh lacircu dagravei nhất

Chiến thuật Quản lyacute tầm trung Thực thi caacutec quyết định chiến lược đề ra

Thực hiện

Caacute nhacircn chuyecircn ngagravenh Tự đưa ra caacutec quyết định từng ngagravey

15Năng lực của hệ HTQD

1 HHTQĐ cơ bản hỗ trợ caacutec nhagrave ra quyết định trong caacutec tigravenh huống nửa cấu truacutec vagrave phi cấu truacutec bằng caacutech kết hợp phaacuten xử của con người vagrave xử lyacute thocircng tin bằng maacutey tiacutenh Caacutec bagravei toaacuten như vậy khocircng thểkhocircng thuận tiện giải quyết được chỉ bằng caacutec cocircng cụ maacutey tiacutenh hoacutea hay caacutec phương phaacutep định lượng 2 Phugrave hợp cho caacutec cấp quản lyacute khaacutec nhau từ cao đến thấp 3 Phugrave hợp cho caacute nhacircn lẫn nhoacutem Caacutec bagravei toaacuten iacutet coacute tiacutenh cấu truacutec thường liecircn đới đến nhiều caacute nhacircn ở caacutec đơn vị chức năng hay mức tổ chức khaacutec nhau cũng như ở caacutec tổ chức khaacutec 4 Hỗ trợ cho caacutec quyết định tuần tự liecircn thuộc được đưa ra một lần vagravei lần hay lặp lại 5 Hỗ trợ cho caacutec giai đoạn của quaacute trigravenh ra quyết định tigravem hiểu thiết kế lựa chọn vagrave hiện thực 6 Phugrave hợp cho một số caacutec phong caacutech vagrave quaacute trigravenh ra quyết định 7 Coacute thể tiến hoacutea theo thời gian Người dugraveng coacute thể thecircm bỏ kết hợp thay đổi caacutec phần tử cơ bản của hệ thống 8 Dễ dugraveng vagrave thacircn thiện với người dugraveng 9 Nhằm vagraveo nacircng cao tiacutenh hiệu dụng của quyết định (chiacutenh xaacutec thời gian tiacutenh chất lượng) thay vigrave lagrave tiacutenh hiệu quả (giaacute phiacute của việc ra quyết định) 10 Người ra quyết định kiểm soaacutet toagraven bộ caacutec bước của quaacute trigravenh ra quyết định HHTQĐ chỉ trợ giuacutep khocircng thay thế người ra quyết định 11 Người dugraveng cuối cugraveng coacute thể tự kiến tạo vagrave sửa đổi caacutec hệ thống nhỏ vagrave đơn giản 12 Thường dugraveng mocirc higravenh để phacircn tiacutech caacutec tigravenh huống ra quyết định 13 Cung ứng caacutec truy đạt dữ liệu từ nhiều nguồn dạng thức vagrave kiểu khaacutec nhau 14 Coacute thể dugraveng như một cocircng cụ độc lập hay kết hợp với caacutec HHTQĐứng dụng khaacutec dugraveng đơn lẻ hay trecircn một mạng lưới maacutey tiacutenh (intranet extranet) bất kỳ với cocircng nghệ WEB

16Văn hoacutea tổ chứcVăn hoacutea của tổ chức lagrave tập hợp của rất nhiều thứ (lograveng tin biểu tượng đặc trưng regraven luyện) được phaacutet triển qua thời gian dagravei

Noacute gacircy ra ảnh hưởng mạnh mẽ cograven hơn cả những hoạt động của tổ chức đoacute 10 đặc điểm văn hoacutea của tổ chức

Điều khiển Hệ thống khen thưởng Sự đồng nhất Chịu đựng xung đột Mocirc higravenh giao tiếp Hỗ trợ quản lyacute Sự hogravea nhập Định hướng Chịu đựng rủi ro Caacute nhacircn khởi xướng

Mối quan hệ của văn hoacutea với hiệu năng lagravem việc1 tổ chức thagravenh cocircng phải coacute xu hướng hogravea hợp giữa văn hoacutea với mocirci trường trong vagrave ngoagravei tổ chức

Phugrave hợp trong nội bộ cho thấy một sự kết hợp giữa văn hoacutea của tổ chức với những cocircng nghệ của chiacutenh noacute

Phugrave hợp với becircn ngoagravei cho thấy một nền văn hoacutea phugrave hợp với chiến lược thị trường

Văn hoacutea vagrave sự thay đổi 1 tổ chức magrave khocircng biết thay đổi văn hoacutea sẽ khocircng thể giữ được vị triacute của migravenh trecircn thị trường Caacutec cocircng ty xuất sắc luocircn biết caacutech tiacutech cực tiếp cận khaacutech hagraveng động viecircn đầu tư

17Quyền lực vagrave chiacutenh trịQuyền lực vagrave chiacutenh trị luocircn đi liền với nhau

aQuyền lựclagrave khả năng ảnh hưởng đến việc phacircn phối caacutec nguồn lực trong tổ chứcGồm 5 yếu tố cơ bản

Phacircn quyền Uy quyền Quyền lực caacute nhacircn Sức ảnh hưởng Chiacutenh trị

Một vagravei thagravenh phần của quyền lực ra quyết định Quyết định việc nagraveo coacute sẵn

Quyết định sản phẩm nagraveo được sản xuất Quyết định đầu tư vagraveo đacircu Quyền đặt vagrave quản lyacute quản lyacute giaacute Thanh toaacuten vagrave khấu trừ tiền latildei

bChiacutenh trị Yếu tố cốt lotildei trong quaacute trigravenh higravenh thagravenh chiến lược ra quyết định Chiacutenh trị liecircn quan tới việc ra quyết định thocircng qua đagravem phaacutenảnh hưởngvagrave higravenh

thagravenh sự nhất triacute Trong nhiều trường hợp noacute coacute thể cho ta sự linh hoạt hơn

18Hệ trợ giuacutep quyết định trong tổ chức DSS của 1 tổ chức hỗ trợ cocircng nghệ tập trung vagraveo caacutec quyết định ảnh hưởng tới

rất nhiều người 1 hệ thống DSS hiện đại coacute thể chấp nhận nhiều quyết định vượt qua những giới

hạn phacircn cấp truyền thống aCaacutec hoạt động gần DSS

Giải quyết caacutec nhiệm vụ đặc biệt Thu thập thocircng tin Liecircn lạc qua caacutec chi nhaacutenh Động thaacutei chiacutenh trị

Phacircn loại tư duy chiến lược cho DSS Sắp xếp quyết địnhXếp hạng quyết định sao cho thứ tự đứng trước thigrave được

ưu tiecircn trước Chia sẻ thocircng tinCaacutec quyecirct định coacute thể độc lập nhưng người ra quyết định

phải chia sẻ caacutec thocircng tin liecircn quan Lựa chọn đagravem phaacutenVagravei quyết định coacute thể xaacutec lập thocircng qua đagravem phaacuten vagrave kết

quả được lagravem đồng thờiKhocircng phải cocircng nghệ tự noacute coacute thể đưa ra quyết định magrave noacute nằm ở trigravenh độ cocircng nghệ hỗ trợ caacutec chiến lược quyết định quyền lực vagrave chiacutenh trị cugraveng phối hợp với nhau

Chương 4Mocirc higravenh hoacutea quaacute trigravenh ra quyết định

(Cấu truacutec của hệ HTQD)19Vấn đề Mocirc higravenh

bull Lagrave phần tử chủ chốt trong hầu hết hệ hỗ trợ quyết định vagrave lagrave điều kiện cần trong hệ hỗ trợ quyết định dựa vagraveo mocirc higravenh (model-based DSS)

bull Coacute nhiều lớp mocirc higravenh kegravem theo lagrave caacutec kỹ thuật xử lyacute thao taacutec mocirc higravenh đặc thugrave tương ứng

bull Caacutec vấn đề chiacutenh nhận diện bagravei toaacuten vagrave phacircn tiacutech mocirci trường nhận diện biến số dự baacuteo đa mocirc higravenh caacutec phạm trugrave mocirc higravenh quản lyacute mocirc higravenh vagrave mocirc higravenh hoacutea dựa vagraveo kiến thức

bull Mocirc higravenh hoacutea lagrave taacutec vụ khocircng đơn giản Người xacircy dựng mocirc higravenh phải cacircn bằng giữa tiacutenh đơn giản của mocirc higravenh với caacutec yecircu cầu biểu diễn để mocirc higravenh coacute thể nắm bắt đủ thực tại cần thiết cho người ra quyết định

bull Mocirc phỏng lagrave kỹ thuật mocirc higravenh hoacutea thocircng dụng dugraveng để tigravem hiểu vấn đề tuy khocircng nhất thiết phải tigravem ra được caacutec giải phaacutep biến thể mở rộng quaacute trigravenh ra quyết định của tổ chức vagrave cho pheacutep tổ chức xem xeacutet taacutec độngảnh hưởng của caacutec chọn lựa tương lai

bull Mocirc phỏng tiết kiệm rất nhiều chi phiacute vagrave thời gian ndash rất dễ thay đổi mocirc higravenh hoạt động của một hệ thống vật lyacute bằng mocirc higravenh hoacutea maacutey tiacutenh

bull Mocirc higravenh coacute thể được phaacutet triển vagrave cagravei đặt bằng một số caacutec ngocircn ngữ lập trinh (thế hệ 3 4 ) vagrave hệ thống phần mềm khaacutec nhau

Mocirc higravenh tĩnh vagrave động

bull Mocirc higravenh tĩnh thể hiện bức tranh tại thời điểm của tigravenh huống Caacutec khiacutea cạnh của bagravei toaacuten được xeacutet một thời kỳ nhất định trong một khung thời gian nhất định (coacute thể ldquocuốnrdquo về tương lai) Caacutec tigravenh huống được giả sử lagrave sẽ lập lại với tập caacutec điều kiện đồng nhất

1048713 Giả định coacute được tiacutenh ổn định của dữ liệu 1048713 Mocirc phỏng quaacute trigravenh dạng tĩnh - lagravem việc trecircn caacutec trạng thaacutei ổn định để tigravem ra caacutec

thocircng số tối ưu ndash thường được dugraveng như cocircng cụ chủ yếu để thiết kế quaacute trigravenh 1048713 vd quyết định sản xuấtmua 1 sản phẩm baacuteo caacuteo thu nhập hagraveng quyacutenăm bull Mocirc higravenh động biểu diễn caacutec kịch bản thay đổi theo thời gian 1048713 Phụ thuộc thời gian caacutec trạng thaacutei thay đổi theo thời gian 1048713 Thường dugraveng để tạo sinh vagrave biểu diễn caacutec xu hướng vagrave khuocircn mẫu theo thời gian 1048713 Mocirc phỏng động thể hiện caacutec diễn tiến khi caacutec điều kiện theo thời gian khaacutec với caacutec

trạng thaacutei ổn định ndash thường được dugraveng để thiết kế việc kiểm soaacutet caacutec hệ thống 1048713 VD dự baacuteo lời-lỗ trong 5 năm với caacutec nhập lượng như giaacute phiacute số lượng thay đổi

theo từng năm

Mocirc higravenh chắc chắn tương đối dễ phaacutet triển giải quyết vagrave coacute thể sinh ra caacutec giải phaacutep tối ưu 1048713 Caacutec bagravei toaacuten coacute một số lớnvocirc hạn caacutec giải phaacutep khả thi đặc biệt quan trọng 1048713 Caacutec mocirc higravenh tagravei chaacutenh được xacircy dựng trong điều kiện chắc chắn

Mocirc higravenh bất địnhbằng caacutech thu thập thecircm thocircng tin cố gắng đưa bagravei toaacuten trở về dạng chắc chắn hay dạng

rủi ro Mocirc higravenh rủi ro caacutec quyết định kinh doanh được đưa ra dưới caacutec rủi ro giả định

1048713 Đocirci khi biết được xaacutec suất của caacutec sự kiện xảy ra trong tương lai 1048713 Caacutec trường hợp khaacutec (bất định) ước lượng caacutec rủi ro vagrave giả sử caacutec tigravenh huống rủi ro

xảy ra 20Mocirc higravenh hoacutea

MOcirc HIgraveNH HOacuteA BẰNG BẢNG TIacuteNH bull Bảng tiacutenh phần mềm mạnh linh hoạt vagrave dễ dugraveng cho pheacutep tạo sinh caacutec ứng dụng trong kinh doanh kỹ thuật toaacuten vagrave khoa học với tập caacutec hagravem mạnh về tagravei chaacutenh thống kecirc toaacuten bull Kegravem theo lagrave caacutec thagravenh phần cộng thecircm (add-ins) giuacutep xacircy dựng vagrave giải caacutec lớp mocirc higravenh đặc thugrave bull Lagrave cocircng cụ mocirc higravenh hoacutea thocircng dụng nhất của người dugraveng cuối cugraveng bull Coacute caacutec chức năng về phacircn tiacutech ldquowhat-ifrdquo dograve tigravem mục tiecircu quản lyacute dữ liệu vagrave lập trigravenh (dạng macro) bull Coacute khả năng đọc ghi caacutec cấu truacutec tập tin thocircng dụng để giao tiếp được với caacutec CSDL vagrave cocircng cụ khaacutec bull Coacute thể xacircy dựng mocirc higravenh tĩnh vagrave động bull Dugraveng trecircn maacutey tiacutenh caacute nhacircn vagrave maacutey tiacutenh lớn

bull Cơ sở để xacircy dựng caacutec bảng tiacutenh đa chiều vagrave caacutec cocircng cụ xử lyacute phacircn tiacutech trực tuyến (OLAP) MOcirc HIgraveNH HOacuteA BẰNG PHAcircN TIacuteCH QUYẾT ĐỊNH bull Tiếp cận mocirc higravenh hoacutea caacutec tigravenh huống quyết định coacute một số hữu hạnkhocircng quaacute nhiều caacutec phương aacuten ndash mỗi phương aacuten được trigravenh ra dưới dạng bảng hay đồ thị - caacutec kết quả tương ứng (dự baacuteo được kegravem xaacutec suất) theo mục tiecircu bagravei toaacuten ndash từ đoacute chọn phương aacuten tốt nhất bull Đơn mục tiecircu bảng quyết định hay cacircy quyết định bull Đa mục tiecircu AHP (analytic hierarchy process) khaacutec

MOcirc HIgraveNH HOacuteA BẰNG QUY HOẠCH TOAacuteN

bull Quy hoạch toaacuten học (mathematical programming) lagrave họ caacutec cocircng cụ giải quyết caacutec bagravei toaacuten quản lyacute theo đoacute người ra quyết định phải cấp phaacutet caacutec tagravei nguyecircn khan hiếm cho caacutec hoạt động cạnh tranh nhau (caacutec phương aacuten) nhằm tối ưu hoacutea mục tiecircu coacute khả năng đo lường được bull Caacutec mocirc higravenh quy hoạch tuyến tiacutenh (linear programming) thocircng dụng nhất trong quy hoạch toaacuten coacute nhiều ứng dụng trong thực tế được dugraveng nhiều trong caacutec hệ hỗ trợ quyết định bull Bagravei toaacuten quy hoạch tuyến tiacutenh 1048713 Caacutec biến quyết định (cần tigravem giaacute trị) 1048713 Hagravem mục tiecircu (hagravem toaacuten học dạng tuyến tiacutenh xaacutec định quan hệ giữa biến quyết định vagrave mục tiecircu đo lường mức độ đạt đạt mục tiecircu vagrave cần được tối ưu hoacutea) 1048713 Caacutec hệ số của hagravem mục tiecircu (cho biết mức đoacuteng goacutep vagraveo mục tiecircu của 1 đơn vị biến quyết định) 1048713 Ragraveng buộc (biểu thức tuyến tiacutenh cho biết giới hạn tagravei nguyecircn vagravehay caacutec quan hệ giữa caacutec biến số) 1048713 Dung lượng (mocirc tả cận trecircn vagrave dưới của caacutec biến vagrave ragraveng buộc) 1048713 Hệ số (cocircng nghệ) vagraveo-ra (cho biết mức độ sử dụng tagravei nguyecircn của biến quyết định) bull Đặc điểm của bagravei toaacuten quy hoạch tuyến tiacutenh 1048713 Tagravei nguyecircn kinh tế của bagravei toaacuten lagrave coacute hạn vagrave sẵn sagraveng 1048713 Coacute nhiều caacutech (gt2 caacutech) sử dụng tagravei nguyecircn được gọi lagrave giải phaacutep hay chương trigravenh 1048713 Mỗi hoạt động dugraveng tagravei nguyecircn đều sinh ra kết quả dưới dạng mục tiecircu đatilde phaacutet biểu trước 1048713 Việc cấp phaacutet nằm trong caacutec ragraveng buộc cho trước bull Giả định của bagravei toaacuten quy hoạch tuyến tiacutenh 1048713 Caacutec kết quả của caacutec cấp phaacutet coacute thể đem so saacutenh với nhau coacute thể đo lường bằng một đơn vị chung

1048713 Caacutec cấp phaacutet độc lập với nhau về mặt kết quả 1048713 Kết quả cuối cugraveng lagrave tổng của caacutec kết quả từ caacutec hoạt động riecircng rẽ khaacutec nhau 1048713 Dữ liệu coacute tiacutenh chắc chắn 1048713 Tagravei nguyecircn được dugraveng một caacutech kinh tế nhất 1048713 Thường coacute một số lớn caacutec giải phaacutep với kết quả khaacutec nhau 1048713 Trong số caacutec giải phaacutep coacute thể coacute 1 giải phaacutep tốt nhất ndash mức độ đạt được mục tiecircu cao nhất ndash gọi lagrave giải phaacutep tối ưu được tigravem ra bằng một giải thuật đặc biệt MOcirc HIgraveNH HOacuteA BẰNG HEURISTIC bull Việc tigravem giải phaacutep tối ưu của một số bagravei toaacuten quyết định phức tạp coacute thể tốn nhiều thời gian chi phiacute hay khocircng thể tigravem ra được Cograven nếu dugraveng tiếp cận mocirc phỏng cũng coacute thể keacuteo dagravei phức tạp khocircng thiacutech hợp hay thậm chiacute khocircng chiacutenh xaacutec

bull Lagrave một tiếp cận giuacutep tigravem ra caacutec giải phaacutep khả thithỏa matildenđủ tốt cho caacutec bagravei toaacuten phức tạp Coacute thể coacute giải phaacutep đủ tốt (90-999 giaacute trị của lời giải tối ưu) nhanh choacuteng vagrave đỡ tốn keacutem hơn bằng caacutech dugraveng heuristics bull Quaacute trigravenh heuristic lagrave datildey caacutec bước xacircy dựng caacutec quy luật giải quyết vấn đề thocircng qua việc tigravem kiếm caacutec con đường hứa hẹn nhất dẫn đến lời giải tigravem kiếm caacutech thức thu thập vagrave phacircn giải thocircng tin theo quaacute trigravenh giải vagrave phaacutet triền caacutec phương phaacutep dẫn đến một giải thuật tiacutenh toaacuten hay một lời giải tổng quaacutet đatilde coacute bull Aacutep dụng chủ yếu cho bagravei toaacuten cấu truacutec yếu cũng dugraveng để tigravem ra giải phaacutep chấp nhận được cho bagravei toaacuten cấu truacutec chặt bull Khocircng đủ tổng quaacutet như caacutec giải thuật thường chỉ dugraveng cho tigravenh huống đặc thugrave đang xeacutet bull Coacute thể dẫn đến một giải phaacutep dở - caacutec thủ tục từng bước giải quyết vấn đề khocircng đảm bảo tigravem ra giải phaacutep tối ưu bull Heuristic coacute thể lagrave định lượng vigrave vậy coacute thể đoacuteng vai trograve quan trọng trong cơ sở mocirc higravenh của hệ hỗ trợ quyết định bull Heuristic coacute thể lagrave định tiacutenh vigrave vậy coacute thể đoacuteng vai trograve quan trọng trong cung ứng kiến thức cho hệ chuyecircn gia bull Quaacute trigravenh heuristic liecircn quan đến tigravem kiếm học tập ước lượng phacircn xử vagrave lặp lại caacutec hoạt động nagravey dọc theo tiến trigravenh bull Kiến thức thu được dugrave thagravenh cocircng hay thất bại trong quaacute trigravenh đều được phản hồi vagrave sửa đổi chiacutenh quaacute trigravenh nhờ đoacute coacute thể định nghĩa lại mục tiecircu hay bagravei toaacuten 1048713 Giải thuật di truyền bắt đầu bằng tập caacutec giải phaacutep được sinh ngẫu nhiecircn taacutei kết hợp caacutec cặp giải phaacutep một caacutech ngẫu nhiecircn bull Tigravenh huống necircn dugraveng heuristics 1048713 Dữ liệu đầu vagraveo khocircng chiacutenh xaacutec hay coacute giới hạn 1048713 Thực tế quaacute phức tạp đến nỗi khocircng dugraveng được caacutec mocirc higravenh tối ưu 1048713 Chưa coacute được giải thuật chiacutenh xaacutec vagrave đủ tin cậy 1048713 Bagravei toaacuten phức tạp necircn sẽ khocircng kinh tế nếu dugraveng tối ưu hay mocirc phỏng hoặc tốn quaacute nhiều thời gian tiacutenh toaacuten 1048713 Coacute thể cải thiện tiacutenh hiệu quả của quaacute trigravenh tối ưu (tức coacute thể sinh ra caacutec giải phaacutep ban đầu tương đối tốt) 1048713 Liecircn quan đến xử lyacute kyacute hiệu chứ khocircng phải xử lyacute kyacute số (như hệ chuyecircn gia) 1048713 Cần coacute quyết định nhanh vagrave caacutec xử lyacute dựa vagraveo maacutey tiacutenh đều khocircng khả thi (một số heuristic khocircng cần đến maacutey tiacutenh) bull Thuận lợi 1048713 Dễ hiểu dễ giải thiacutech vagrave dễ cagravei đặt 1048713 Nacircng cao tiacutenh saacuteng tạo vagrave năng lực heuristic cho caacutec vấn đề khaacutec 1048713 Tiết kiệm thời gian xaacutec lập vấn đề 1048713 Tiết kiệm yecircu cầu về bộ chứa vagrave xử lyacute maacutey tiacutenh

1048713 Tiết kiệm thời gian tiacutenh toaacuten vagrave do vậy tiết kiệm thời gian thực trong ra quyết định Một số vấn đề phức tạp đến nỗi chỉ coacute thể giải được bằng heuristics 1048713 Thường sinh ra nhiều giải phaacutep chấp nhận được 1048713 Thường coacute thể phaacutet biểu lyacute thuyết hay đo lường thực nghiệm về chất lượng của giải phaacutep (tức giaacute trị mục tiecircu của giải phaacutep gần với giaacute trị tồi ưu đến mức nagraveo dugrave giaacute trị tối ưu chưa biết được) 1048713 Coacute thể kết hợp tiacutenh thocircng minh vagraveo để hướng dẫn pheacutep tigravem kiếm (tigravem kiếm tabu) Năng lực thocircng minh đoacute coacute thể lagrave đặc thugrave theo bagravei toaacuten hoặc dựa trecircn yacute kiến chuyecircn gia được cấy trong hệ chuyecircn gia hoặc cơ chế tigravem kiếm 1048713 Coacute thể dugraveng heuristic hiệu quả vagraveo caacutec mocirc higravenh coacute thể giải bằng quy hoạch toaacuten học Đocirci khi heuristic lagrave phương phaacutep được ưa thiacutech hơn khi khaacutec giải phaacutep heuristics được dugraveng như giải phaacutep ban đầu cho caacutec phương phaacutep quy hoạch toaacuten học bull Hạn chế 1048713 Khocircng đảm bảo coacute được giải phaacutep tối ưu 1048713 Caacutec quy luật coacute rất nhiều ngoại lệ 1048713 Caacutec lựa chọn quyết định tuần tự coacute thể khocircng tiecircn đoaacuten được caacutec kết cục tương lai của mỗi chọn lựa 1048713 Sự liecircn thuộc giữa caacutec phần trong hệ thống đocirci khi coacute thể gacircy ra caacutec ảnh hưởng lớn lao lecircn toagraven hệ thống bull Phacircn loại caacutec giải thuật heuristic 1048713 Heuristic xacircy dựng xacircy dựng giải phaacutep khả thi bằng caacutech cộng thecircm từng thagravenh phần một VD bagravei toaacuten người baacuten hagraveng ndash luocircn gheacute thagravenh phố chưa viếng thăm kế tiếp gần nhất

1048713 Heuristic cải tiến bắt đầu bằng một giải phaacutep khả thi vagrave cố gắng cải tiến liecircn tục trecircn đoacute VD trecircn thử hoaacuten đổi 2 thagravenh phố 1048713 Quy hoạch toaacuten aacutep dụng vagraveo caacutec mocirc higravenh chứa iacutet ragraveng buộc nhằm coacute được thocircng tin về thỏa hiệp tốt nhất với mocirc higravenh nguyecircn gốc Thường được dugraveng trong tối ưu hoacutea nguyecircn (integer optimization) 1048713 Chia giai đoạn giải quyết một vấn đề theo từng giai đoạn VD ở PampG trecircn đacircy bagravei toaacuten phacircn phối được giải quyết trước sau đoacute dugraveng giải quyết bagravei toaacuten chiến lược sản phẩm 1048713 Phacircn ratilde chia bagravei toaacuten thagravenh caacutec phần nhỏ hơn coacute thể giải quyết được sau đoacute kết hợp caacutec giải phaacutep đoacute lại VD chia latildenh thổ baacuten hagraveng thagravenh 4 vugraveng khaacutec nhau giải quyết cho từng vugraveng sau đoacute kết nối caacutec giải phaacutep

21Mocirc phỏngbull Giả định caacutec đặc điểm của thực tạibull Lagrave kỹ thuật tiến triển caacutec thực nghiệm (như phacircn tiacutech ldquowhat-ifrdquo) - bằng maacutey tiacutenh -trecircn một mocirc higravenh của hệ thocircng tin quản lyacute

bull Khocircng thực sự lagrave một mocirc higravenh vigrave khocircng biểu diễn thực tại magrave lagrave cố gắng bắtchước thực tạibull Một trong những phương phaacutep thocircng dụng nhất trong HHTQĐbull HHTQĐ lagravem việc với caacutec bagravei toaacuten phi cấu truacutec vagrave cấu truacutec yếu tigravenh huống thực tếphức tạp ndash khocircng dễ biểu diễn bằng mocirc higravenh tối ưu hay caacutec dạng mocirc higravenh khaacutecnhưng lại thường coacute thể xử lyacute được bằng mocirc phỏngbull Đặc điểm1048713 Iacutet đưa ra caacutec đơn giản hoacutea về thực tại hơn caacutec mocirc higravenh khaacutec1048713 Do triển khai caacutec thực nghiệm necircn noacute coacute thể kiểm thử caacutec giaacute trị cụ thể của caacutecbiến quyết địnhbiến khocircng kiểm soaacutet được của mocirc higravenh vagrave xem xeacutet ảnh hưởnglecircn caacutec biến kết quả1048713 Phương phaacutep coacute tiacutenh mocirc tả (như vậy khaacutec với phương phaacutep danh định)1048713 Khocircng tự động tigravem kiếm giải phaacutep tối ưu ndash noacute mocirc tảtiecircn đoaacuten caacutec đặc tiacutenh của hệthống đatilde cho dưới caacutec điều kiện khaacutec nhau từ đoacute coacute thể chọn ra phương aacuten tốtnhất1048713 Quaacute trigravenh mocirc phỏng thường lặp lại một thực nghiệm nhiều lần để coacute được ướclượng về hiệu ứng tổng quaacutet của một số hagravenh động nhất định1048713 Mocirc phỏng maacutey tiacutenh thiacutech hợp cho hầu hết caacutec tigravenh huống mặc dugrave cũng coacute một sốmocirc phỏng thủ cocircng thagravenh cocircng1048713 Thường chỉ được dugraveng khi bagravei toaacuten quaacute phức tạp khocircng thể xem xeacutet bằng caacutec kỹthuật tối ưu dạng số Tiacutenh phức tạp theo nghĩa bagravei toaacuten khocircng thể cocircng thức hoacuteacho tối ưu (do khocircng thotildea caacutec giả định) hoặc cocircng thức quaacute lớn quaacute nhiều tươngtaacutec giữa caacutec biến hoặc về bản chất bagravei toaacuten lagrave bất định hay rủi roPhương phaacutep mocirc phỏng thiết lập mocirc higravenh của hệ thống thực vagrave tiến hagravenh caacutec thựcnghiệm lặp lại trecircn mocirc higravenh

bull Thuận lợi1048713 Lyacute thuyết tương đối trực tiếp hiệu ứng dagravei hạn của nhiều chiacutenh saacutech -gt neacuten thờigian lớn1048713 Do tiacutenh chất mocirc tả (khaacutec với danh định)1048713 Coacute thể thấy được nhanh choacuteng coacute thể đặt ra caacutec cacircu hỏi ldquowhat-ifrdquo coacute thể dugravengtiếp cận thử-vagrave-sai vagraveo giải quyết vấn đề một caacutech nhanh choacuteng rẻ chiacutenh xaacutec iacutetrủi ro hơn1048713 Thử nghiệm được biến quyết định phần nagraveo của mocirci trường thực sự quan trọngvới caacutec phương aacuten khaacutec nhau1048713 Yecircu cầu kiến thức riecircng biệt về bagravei toaacuten vigrave thế buộc người xacircy dựng mocirc higravenh phảilagravem việc thường xuyecircn với nhagrave quản lyacute ndash đối tượng mong muốn của HHTQĐ để

từ đoacute bản chất bagravei toaacuten vagrave caacutec quyết định được hiểu tốt hơn1048713 Mocirc higravenh được xacircy dựng từ viễn cảnhcaacutech nhigraven của nhagrave quản lyacute1048713 Mocirc higravenh chỉ cho một bagravei toaacuten riecircng biệt thường khocircng thể dugraveng giải caacutec bagravei toaacutenkhaacutec Như vậy mỗi thagravenh phần của mocirc higravenh ứng với một phần của hệ thống thựcdo đoacute sẽ khocircng yecircu cầu nhagrave quản lyacute phải tổng quaacutet hoacutea caacutec hiểu biết của migravenh1048713 Phổ bagravei toaacuten giải được rất rộng tồn kho nhacircn sự hoạch định chiến lược 1048713 Coacute thể chứa caacutec phức tạp thực sự của bagravei toaacuten khocircng cần caacutec đơn giản hoacutea (TDdugraveng caacutec phacircn phối xaacutec suất thực thay vigrave phacircn phối lyacute thuyết xấp xỉ)1048713 Coacute thể tự động sinh ra nhiều đo lường hiệu năng quan trọng1048713 Thường lagrave phương phaacutep duy nhất của HHTQĐ coacute thể xử lyacute caacutec bagravei toaacuten tương đốiphi cấu truacutec1048713 Coacute một số caacutec goacutei phần mềm mocirc phỏng (Monte Carlo) tương đối dễ dugravengbull Điểm yếu1048713 Tuy thường tigravem được caacutec phương aacuten đủ tốt nhưng khocircng đảm bảo lời giải tối ưu1048713 Quaacute trigravenh xacircy dựng mocirc higravenh thường dagravei vagrave tốn keacutem1048713 Giải phaacutep vagrave suy diễn từ nghiecircn cứu mocirc phỏng thường khocircng thể chuyển sang bagraveitoaacuten khaacutec vigrave mocirc higravenh kết hợp caacutec yếu tố đặc thugrave1048713 Đocirci khi do mocirc higravenh quaacute dễ giải thiacutech cho nhagrave quản lyacute necircn caacutec phương phaacutep phacircntiacutech thường xem nhẹ1048713 Phần mềm mocirc phỏng đocirci khi yecircu cầu caacutec kỹ năng đặc biệt do độ phức tạp củaphương phaacutep giải higravenh thứcbull Caacutec loại mocirc phỏng1048713 Mocirc phỏng xaacutec suất một hay nhiều biến độc lập mang tiacutenh xaacutec suất với 2 loạiphacircn phối ndash thường dugraveng kỹ thuật Monte Carlo1048713 Phacircn phối rời rạc tigravenh huống coacute một số giới hạn caacutec biến cố (biến) với hữu hạncaacutec giaacute trị cho mỗi biến cố (biến)1048713 Phacircn phối liecircn tục tigravenh huống coacute số lượng khocircng giới hạn caacutec biến cố tuacircn theocaacutec hagravem mật độ xaacutec suất như phacircn phối chuẩn1048713 Mocirc phỏng độc lậpphụ thuộc theo thời gian1048713 Độc lập khocircng cần thiết phải biết chiacutenh xaacutec thời điểm xảy ra biến cố (nhu cầutiecircu thụ lượng sản phẩm trong ngagravey khocircng biết chiacutenh xaacutec thời điểm tiecircu thụ)1048713 Phụ thuộc cần biết chiacutenh xaacutec thời điểm xảy ra sự kiện (bagravei toaacuten hagraveng đợi)1048713 Mocirc phỏng tương taacutec trực quan1048713 Mocirc phỏng hướng đối tượng dugraveng tiếp cận hướng đối tượng để xacircy dựng mocirc higravenhmocirc phỏng Chuacute yacute ngocircn ngữ mocirc higravenh hoacutea nhất thể UML (unified modelinglanguage) kể cả khi mocirc phỏng caacutec hệ thời gian thựcMOcirc HIgraveNH HOacuteA ĐA CHIỀU ndash XỬ LYacute PHAcircN TIacuteCH TRỰC TUYẾNbull Người ra quyết định thường phải xem xeacutet nhiều chiều của dữ liệu (TD caacutec chiềucủa dữ liệu baacuten hagraveng lagrave sản phẩm vugraveng thời gian người baacuten ) dữ liệu cần đượcphacircn tiacutech trực tiếp bằng caacutec cocircng cụ chuẩn hay phacircn tiacutech tự động bằng caacutec

phương phaacutep khai mỏ dữ liệu (data mining)bull Hầu hết caacutec hệ thống phacircn tiacutech đa chiều được nhuacuteng trong caacutec hệ xử lyacute phacircn tiacutechtrực tuyến (HXLPTTT ndash online analytic processing - OLAP)bull Mục tiecircu của XLPTTT nắm bắt cấu truacutec của dữ liệu thực để hỗ trợ ra quyết địnhbull Trong HHTQĐ coacute sự gắn nối tự nhiecircn giữa mocirc higravenh hoacutea dữ liệu mocirc higravenh hoacutea kyacutehiệu vagrave caacutec khiacutea cạnh của phacircn tiacutech ldquowhat-ifrdquobull Caacutec baacuteo caacuteo của HXLPTTT đều coacute tiacutenh tương taacutec dễ khai thaacutec sử dụng đặc biệtphugrave hợp cho caacutec baacuteo caacuteo về chỉ số hiệu năng chủ yếu (key performance indicators- KPI) baacuteo caacuteo về đo lường hiệu năng kinh doanh bull Thế hệ hiện tại của HXLPTTT vagrave hệ khai mỏ dữ liệu (data mining) tiacutech hợp caacutecđặc tiacutenh của hệ thocircng tin latildenh đạo (executive information system ndashEIS- nhiềucaacutech nhigraven dữ liệu chi tiết hoacutea theo nhu cầu) vagrave caacutec hệ đồ họa khaacutec ndash thường coacutegiao diện người dugraveng dạng kiểu WEBbull Caacutec hệ thống như trecircn cograven được gọi lagrave caacutec cocircng cụ triacute tuệ kinh doanh (businessintelligence - BI) vigrave coacute caacutec đặc trưng về mocirc higravenh hoacutea vagrave tối ưu hoacutea nhưng lạitrong suốt đối với ngươigrave dugravengbull Hiện caacutec cocircng cụ được đưa ra bởi caacutec nhagrave cung cấp về CSDL về hoạch định tagraveinguyecircn tổ chức (ERP) về nhagrave kho dữ liệu (data warehouse) về HXLPTTT MOcirc HIgraveNH HOacuteA VAgrave MOcirc PHỎNG TƯƠNG TAacuteC TRỰC QUANbull Iacutech lợi Người ra quyết định tham gia vagraveo quaacute trigravenh phaacutet triển mocirc higravenh vagrave thựcnghiệm mocirc phỏng vigrave vậy sẽ tin tưởng khi sử dụng mocirc higravenhbull Mocirc higravenh hoacutea tương taacutec trực quan (visual interactive modeling - VIM) dugraveng caacutecbiểu diễn đồ họa maacutey tiacutenh để trigravenh bagravey caacutec ảnh hưởng của caacutec quyết định quản lyacutekhaacutec nhau ở một thời điểm (tĩnh) hay tiến triển theo thời gian (động với kỹ thuậthoạt higravenh)bull Mocirc phỏng tương taacutec trực quan (visual interactive simulation - VIS) cho pheacutepngười dugraveng theo dotildei tiến trigravenh xacircy dựng vagrave sử dụng khai thaacutec mocirc higravenh mocirc phỏngdưới dạng hoạt higravenhbull Mocirc higravenh hoacutea tương taacutec trực quan coacute thể kết hợp với tiếp cận triacute tuệ nhacircn tạo đểđưa ra caacutec khả năng mới thay đổi từ xacircy dựng hệ thống dạng đồ họa đến tigravem hiểuvề động học của hệ thốngbull Cần đến caacutec hệ thống maacutey tiacutenh xử lyacute song song tốc độ cao để xacircy dựng caacutec mocircphỏng - phức tạp quy mocirc lớn dạng hoạt higravenh - mang tiacutenh khả thi ở thời gian thực

22Caacutec dạng hệ thống hỗ trợ ra quyết địnhHệ hỗ trợ quyết định nhoacutemRa quyết định nhoacutem giao tiếp vagrave cộng taacutec- Caacutec đặc điểm của cocircng việc nhoacutem+ Một nhoacutem thực hiện một nhiệm vụ thỉnh thoảng ra quyết định thỉnh thoảngkhocircng ra quyết định+ Caacutec thagravenh viecircn trong nhoacutem coacute thể ở những nơi khaacutec nhau

+ Caacutec thagravenh viecircn trong nhoacutem coacute thể lagravem việc ở những thời gian khaacutec nhau+ Caacutec thagravenh viecircn trong nhoacutem coacute thể lagravem việc cugraveng nhau hoặc ở caacutec tổ chức khaacutecnhau+ Nhoacutem coacute thể vĩnh viễn hoặc tạm thời+ Nhoacutem coacute thể ở bất kỳ mức quản lyacute nagraveo hoặc mức thời gian nagraveo+ Coacute sự điều phối (quaacute trigravenh vagrave nhiệm vụ đạt được) hoặc macircu thuẩn trongnhoacutem+ Coacute sự đạt được hoặcvagrave mất maacutet năng suất trong tổ chức+ Nhiệm vụ phải hoagraven thagravenh rất nhanh+ Khocircng thể hoặc quaacute đắt cho tất cả caacutec thagravenh viecircn trong nhoacutem cugraveng hợp ở mộtnơi+ Một số dữ liệu thocircng tin hoặc kiến thức cần thiết nằm ở nhiều nơi một sốkhaacutec ở ngoagravei tổ chức+ Chuyecircn mocircn của caacutec thagravenh viecircn khocircng coacute trong nhoacutem lagrave cần thiết- Caacutec hoạt động vagrave caacutec quaacute trigravenh miecircu tả caacutec cuộc họp+ Cuộc họp lagrave hoạt động chung liecircn quan bởi một nhoacutem người coacute địa vị bằngnhau hoặc gần bằng nhau+ Kết quả của cuộc họp phụ thuộc một phần vagraveo kiến thức yacute kiến caacutec đaacutenh giaacutecủa caacutec thagravenh viecircn+ Kết quả của cuộc họp cũng phụ thuộc vagraveo sự kết hợp của nhoacutem vagrave phụ thuộcvagraveo quaacute trigravenh ra quyết định được sử dụng bởi nhoacutem đoacute+ Giải quyết caacutec yacute kiến khaacutec nhau bởi người coacute quyền hạn hoặc thương lượnghoặc phacircn xửHỗ trợ giao tiếp- Giao tiếp lagrave thagravenh phần quan trọng cho hỗ trợ quyết định Khocircng coacute giao tiếp thigravekhocircng coacute cộng taacutec Những người ra quyết định caacute nhacircn phải giao tiếp với caacutecđồng nghiệp chuyecircn gia cơ quan chiacutenh phủ khaacutech hagraveng đối taacutec kinh doanh hellipHọ cũng cần dữ liệu vagrave thocircng tin (vagrave kiến thức) từ nhiều nơi trecircn thế giới Caacutecnhoacutem ra quyết định phải giao tiếp cộng taacutec vagrave thương lượng trong cocircng việcHầu hết caacutec tổ chức sẽ nhanh trở thagravenh khocircng coacute chức năng nếu khocircng coacute caacutec hệthống giao tiếp Thương mại điện tử coacute thể hiệu quả chỉ qua caacutec kỹ thuật giao tiếphiện đại- Caacutec kỹ thuật thocircng tin hiện đại cung cấp caacutec phương tiện hỗ trợ giao tiếp rẻnhanh coacute khả năng coacute thể tin cậy Nền tảng hỗ trợ giao tiếp lagrave caacutec hệ thống maacuteytiacutenh mạng+ Bắt đầu bằng điện baacuteo điện thoại radio vagrave ti vi+ Trong 100 năm chuacuteng ta phaacutet triển maacutey fax thư điện tử chương trigravenh chatnhoacutem tin tức hệ thống hội nghị truyền higravenh Hầu hết caacutec kỹ thuật nagravey đềuhoạt động trecircn internet+ Sự phaacutet triển giao tiếp sau cugraveng lagrave hệ thống họp điện tử caacutec dịch vụ vagrave hệ

thống hội nghị điện tử thường sử dụng internet để kết nối caacutec người ra quyếtđịnh- Caacutec thuận lợi aacutep dụng caacutec phương phaacutep giao tiếp cải tiến trong caacutec tổ chức+ Cải tiến năng suất của nhacircn viecircn+ Liecircn quan đến nhiều người ra quyết định chiacutenh+ Khocircng quan tacircm nhiều đến đường biecircn giới địa lyacute+ Tạo nền văn hoacutea hợp taacutec nhất quaacuten+ Cải tiến chất lượng cuộc sống của nhacircn viecircnHỗ trợ cộng taacutec Maacutey tiacutenh hỗ trợ cộng taacutec- Khung thời giannơi chốn+ Sự hiệu quả của kỹ thuật tiacutenh toaacuten cộng taacutec phụ thuộc vagraveo vị triacute của caacutec thagravenhviecircn trong nhoacutem vagrave phụ thuộc vagraveo thời gian chia sẽ thocircng tin gởi vagrave nhận+ Chia sự giao tiếp thagravenh bốn ocirc vagrave tổ chức bốn ocirc dọc theo 2 chiều thời gian vagravenơi chốn1048713 Thời gian Khi gởi vagrave nhận thocircng tin hầu như đồng thời giao tiếp lagrave đồngthời Viacute dụ Điện thoại ti vi vagrave caacutec cuộc họp gặp mặt nhau Giao tiếp bấtđồng bộ xảy ra khi người nhận nhận thocircng tin ở thời điểm khaacutec thời điểmgởi thocircng tin đoacute1048713 Nơi chốn Người gởi vagrave người nhận coacute thể ở cugraveng phograveng hoặc khocircng+ Bốn ocirc lagrave1048713 Cugraveng thời giancugraveng nơi chốn Caacutec thagravenh viecircn gặp mặt nhau cugraveng một luacutecgiống như phograveng quyết định hoặc gặp mặt truyền thống1048713 Cugraveng thời giankhaacutec nơi chốn Caacutec thagravenh viecircn ở caacutec nơi khaacutec nhau nhưnggiao tiếp cugraveng nhau Viacute dụ hội nghị truyền higravenh (videoconferencing)1048713 Khaacutec thời giancugraveng nơi chốn Nhiều người lagravem việc theo ca Ca nagravey để lạithocircng tin cho ca khaacutec1048713 Khaacutec thời giankhaacutec nơi chốn Caacutec thagravenh viecircn ở caacutec nơi khaacutec nhau Caacutecthagravenh viecircn nagravey gởi vagrave nhận thocircng tin ở những lần khaacutec nhau

23Thực thi hệ DSSHệ thống hỗ trợ quản lyacute (MSS) khocircng phải luacutec nagraveo cũng luocircn thagravenh cocircng Nhiều trường hợpthất bại của ES khocircng hoagraven toagraven lagrave lyacute do kỹ thuật Thực thi hệ thống lagrave một quaacute trigravenh liecircn tụcnhằm đảm bảo cho tổ chức chuẩn bị tiếp nhận một hệ thống mới vagrave đưa hệ thống vagraveo sử dụngthagravenh cocircngThực hiện cocircng nghệ hệ thống hỗ trợ quản lyacute lagrave việc phức tạp vigrave caacutec hệ thống nagravey khocircng đơnthuần lagrave hệ thống thocircng tin chỉ thu thập thao taacutec vagrave phacircn phối thocircng tin Magrave xa hơn chuacuteng

liecircn quan tới caacutec cocircng việc coacute thể lagravem thay đổi đaacuteng kể caacutech thức hoạt động của tổ chức Tuyvậy đa số caacutec yếu tố thực thi đều liecircn quan tới hệ thống thocircng tinThực thi MSS lagrave quaacute trigravenh liecircn tục diễn ra trong suốt thời gian phaacutet triển hệ thống từ đề xuấtban đầu đến nghiecircn cứu khả thi thiết kế vagrave phacircn tiacutech hệ thống lập trigravenh huấn luyện chuyểnđổi vagrave lắp đặt Caacutec chuyecircn gia hệ thống thocircng tin thường gọi thực thi lagrave giai đoạn cuối trongvograveng đời hệ thống Định nghĩa thực thi MSS phức tạp hơn vigrave bản chất lặp của sự phaacutet triểncaacutec hệ thống

THỰC THI KHOcircNG HOAgraveN CHỈNHCaacutec quyết định về tiacutenh khả thi thường coacute giả định về lợi iacutech đạt được khi kế hoạch thực thiđược thực hiện hoagraven toagraven Trong thực tế thường chỉ thực hiện 90 thậm chiacute 70 phần trăm sovới phacircn tiacutech khả thi Lyacute do lagrave sự thay đổi tại một nơi trong hệ thống coacute thể ảnh hưởng vagrave coacutethể taacutec động tiecircu cực đến chỗ khaacutec Do vậy cấp quản lyacute coacute thể bỏ những phần trong dự aacuten coacutethể gacircy ra taacutec động xấu Do đoacute dự aacuten sẽ thực hiện iacutet hơn 100 so với dự aacuten kế hoạch Caacutec lyacutedo khaacutec coacute thể lagrave do khấu trừ ngacircn saacutech hoặc vượt chi phiacuteĐAacuteNH GIAacute SỰ THAgraveNH COcircNG CỦA THỰC THI HỆ THỐNGPhải coacute caacutec chỉ số đo lường thigrave mới coacute thể đaacutenh giaacute sự thagravenh cocircng khi thực thi một hệ thốngDickson va Powers (1973) đề ra 5 tiecircu chuẩn độc lậpbull Tỷ lệ thời gian thực hiện dự aacuten với thời gian ước lượngbull Tỷ lệ chi phiacute thực tế vagrave ngacircn saacutech thực hiệnbull Thaacutei độ của cấp quản lyacute đối với hệ thốngbull Nhu cầu thocircng tin của caacutec nhagrave quản lyacute được đaacutep ứng như thế nagraveo qua hệ thốngbull Taacutec động của dự aacuten đối với những hoạt động maacutey tiacutenh trong cocircng tyCaacutec đo lường khaacutec để đaacutenh giaacute thagravenh cocircng của hệ hỗ trợ quản lyacute (MSS)bull Sự sử dụng hệ thống (dự định dugraveng hoặc thực sự dugraveng)bull Thỏa matilden của người dugravengbull Thaacutei độ taacuten thagravenhbull Mức độ hệ thống hoagraven thagravenh caacutec mục tiecircu ban đầubull Phần thưởng đối với tổ chức (giảm chi phiacute tăng doanh thuhellip)bull Tỷ số lợi iacutech chi phiacute

bull Mức độ thể chế hoacutea của MSS trong tổ chứcDo bởi tiacutenh đa dạng của DSS necircn việc đaacutenh giaacute sự thagravenh cocircng của hệ nagravey cũng khoacute khăn tuynhiecircn cũng coacute thể coacute một số yếu tố giuacutep cho DSS thagravenh cocircng như sự tham gia người dugravenghuấn luyện người dugraveng hỗ trợ quản lyacute cấp cao nguồn thocircng tin đặc điểm của những nhiệmvụ coacute liecircn quan (cấu truacutec bất định độ khoacute phụ thuộc)

Chương5Nhoacutem hỗ trợ quyết định vagrave nhoacutemcocircng nghệ phần mềm

51Nhoacutem tạo quyết định

MDM-Holsapple đatilde gợi yacute chuacuteng ta sử dụng giới hạn người tạo quyết định

Một nhoacutem lagrave kết cấu MDM nơi magrave nhiều người ra quyết định hoagraven toagraven tương taacutec

Một đội lagrave kết cấu MDM nơi caacutec thagravenh viecircn tư vấn cho người đưa ra quyết định nhưng khocircng tương taacutec

Một Ủy ban lagrave kết cấu MDM với một người tạo quyết định duy nhất vagrave sự tương taacutec giữa caacutec thagravenh viecircn

Mạng thocircng tin

Mạng lưới baacutenh xe mỗi người tham gia coacute thể giao tiếp với người đưa ra quyết định ở trung tacircm nhưng khocircng phải với người tham gia khaacutecCấu truacutec nagravey lagrave khocircng thỏa matilden tất cả những người tham gia ngoại trừ người ra quyết định

Mạng dacircy chuyền Tham gia chuyển tiếp thocircng tin chỉ để noacute luocircn liền kề nhau trong chuỗi

Thagravenh viecircn cuối cugraveng ko được đaacutep ứng

Mạng vograveng trograven Tương tự như chuỗi nhưng kết thuacutec được kết nối

Mạng kết nối hoagraven toagraven khocircng coacute hạn chế về giao tiếp vagrave tương taacutec giữa caacutec thagravenh viecircnNoacutei chungnoacute đaacutep ứng hầu hết caacutec kết nối của người tham gia nhưng truyền đạt thocircng tin mất nhiều thời gian vagrave coacute nhiều cơ hội xảy ra lỗi

Nhoacutem hagravenh vi vagrave chuẩn mực

MDMs thiết lập caacutec chỉ tiecircu hướng dẫn quaacute trigravenh ra quyết định

Một chuẩn mực quy định cụ thể những gigrave thagravenh viecircn trong nhoacutem dự kiến sẽ lagravem trong những hoagraven cảnh nhất định

Quy tắc gửi coacute thể được thocircng qua viacute dụ đaacutenh giaacute ngang hagraveng hoặc xử phạt

Lagravem thế nagraveo để đưa ra quyết định

Việc chọn lựa magrave trong đoacute việc sử dụng cấu truacutec MDM phải được dựa trecircn một số yếu tố liecircn quan với bối cảnh quyết định

Viacute dụmột cấu truacutec riecircng lẻ sẽ lagravem việc nơi magrave quyết định được cấu truacutec cao vagrave thocircng tin lagrave coacute sẵn

Một ủy ban cơ cấu sẽ lagrave sự lựa chọn khi người ra quyết định khocircng thể đưa ra quyết định một migravenh

52Caacutec vấn đề thường gặp trong nhoacutem

Kiacutech thước Noacutei chung sự nhất triacute vagrave gắn kết giữa caacutec thagravenh viecircn tỉ lệ nghịch với phạm vi nhoacutem Trong nhoacutem lớn rất dễ higravenh thagravenh caacutec nhoacutem nhỏ vagrave hoạt động rời rạc

Tư duy tập thể Trong nhoacutem lớn mọi người coacute xu hướng suy nghĩ đểđạtđược sự nhất triacute necircn khocircng phaacutet huy được sự saacuteng tạo

Caacutec vấn đề về xatilde hội

Xung đột Trong 1 nhoacutem ai cũng muốn migravenh lagrave giỏi nhất necircn dễ dẫn đến xung đột

Ẩn danh(Giấu tecircn) Đacircy lagrave phương phaacutep được sử dụng để kiểm soaacutet xung đột Cho caacutec thagravenh viecircn tham gia ẩn danh

Vấn đề giới tiacutenh Nam vagrave nữ thường coacute những thế mạnh khaacutec nhau điều nagravey coacute thể lagrave sức mạnh trong 1 thiết lập MDM

Đagravem phaacuten vagrave quyết định

Một quyết định coacute thể liecircn quan đến nhiều quan điểm khaacutec nhau vigrave thế cần phải coacute sự đagravem phaacuten

Caacutec thiết kế của cơ chế hỗ trợ cho MDM phải phugrave hợp với caacutec hoạt độngđagravemphaacuten

Những hoạt động nagravey bao gồm việc thu nhận yacute kiến của caacutec thagravenh viecircn 1 caacutech cocircng bằng

53Cocircng nghệ hỗ trợ MDM

Organizational DSSndash 1 hệ thống cung cấp caacutec quyết định hỗ trợ

Group Support Systemndash Cocircng nghệ sử dụng sự hỗ trợ của nhiều becircn tham gia

Group DSS ndash Lagrave 1 hệ thống được thiết kế đặc biệt để hỗ trợ cho MDM

DSS ndash Lagrave 1 hệ thống dưới sự kiểm soaacutet của 1 người quyết định hệ thống nagravey cung cấp 1 bộ cocircng cụ giuacutep phacircn tiacutech hoagraven cảnh đểđưa ra quyết định vagrave nacircng cao hiệu quả của quyết địnhđoacute

53Cocircng nghệ hỗ trợ MDM

Organizational DSSndash 1 hệ thống cung cấp caacutec quyết định hỗ trợ

Group Support Systemndash Cocircng nghệ sử dụng sự hỗ trợ của nhiều becircn tham gia

Group DSS ndash Lagrave 1 hệ thống được thiết kế đặc biệt để hỗ trợ cho MDM

DSS ndash Lagrave 1 hệ thống dưới sự kiểm soaacutet của 1 người quyết định hệ thống nagravey cung cấp 1 bộ cocircng cụ giuacutep phacircn tiacutech hoagraven cảnh đểđưa ra quyết định vagrave nacircng cao hiệu quả của quyết địnhđoacute

Mục tiecircu của cocircng nghệ hỗ trợ MDM

Quy trigravenh hỗ trợ tập trung vagraveo quaacute trigravenh tạo điều kiện thuận lợi cho sự tương taacutec

Cơ chế cấu truacutec quaacute trigravenh chi phối caacutec hoạt động truyền thocircng

Nhiệm vụ hỗ trợ cocircng việc coacute thể chọn lựa tổ chức hoặc lấy thocircng tin

Nhiệm vụ cấu truacutec cocircng việc cho pheacutep truy cập đến kỹ thuật lọc kết hợp phacircn tiacutech kiến thức liecircn quan đến cocircng việc

Caacutec lớp loại cocircng nghệ hỗ trợ MDM

Phacircn loại theo đặc điểm do DeSanctis vagrave Gallupe đưa ra đề xuất một chương trigravenh ba cấp dựa trecircn caacutec tiacutenh năng được cung cấp

Hệ thống cấp 1 Mục điacutech chiacutenh lagrave tạo điều kiện thocircng tin liecircn lạc giữa caacutec thagravenh viecircn

Hệ thống cấp 2 Thiết kế để giảm thiểu rủi ro

Hệ thống cấp 3 Giuacutep điều chỉnh xử lyacute quyết định

Phacircn loại theo cocircng nghệ -Kraemer vagrave King tập trung vagraveo cocircng nghệ aacutep dụng

Cocircng nghệ bảng mạch điện tử

Hội nghị trực tuyến

Mạng lưới tập đoagraven

Trung tacircm thocircng tin

Mocirci trường cộng taacutec

Phograveng quyết định

Nhoacutem phần mềm

Phần mềm được thiết kế để hỗ trợ sự hợp taacutec bao gồm việc thu huacutet vagrave lưu trữ thocircng tin

Caacutec tổ chức dẫn đầu thị trường hiện tại lagrave Lotus Notes and Domino Microsoft Exchange Novell GroupWise and Oracle Office

Caacutec cocircng cụ trong một bộ phần mềm bao gồm người quản lyacute hội nghị (Lotus Sametime) vagrave trao đổi thocircng điệp (Lotus Notes Mail)

Xếp hạng phần mềm cho nhoacutem

Ellis vv đề xuất một hệ thống xếp hạng dựa vagraveo kiểu sự hỗ trợ noacute Cung cấp

Hệ thocircng điệp

Hệ thống hội thảo truyền higravenh

Hệ thống cộng taacutec soạn thảo

Nhoacutem phacircn phối giải phaacutep phần mền

Hệ thống phối hợp

Hệ thống thocircng minh đại diện

Lực lượng điều khiển phaacutet triển phần mềm cho nhoacutem

Một số nhacircn tố chiacutenh bao gồm

Tăng năng suất

Giảm số lượng caacutec cuộc họp

Tăng cường tự động hoacutea caacutec quy trigravenh lagravem việc thường xuyecircn

Cần phối hợp toagraven cầu tốt hơn

Tiacutenh sẵn sagraveng của những mạng lan rộng

Coleman vagrave Khanna liệt kecirc 10 nhacircn tố khaacutec

54Quản lyacute hoạt động MDM (Mobile Device Management - Quản lyacute thiết bị di động)

Một số phương phaacutep phối hợp phổ biến hơnMDM lagrave

Kỹ thuật nhoacutem định danh

Kỹ thuật Delphi

Sự phacircn xử

Hệ thocircng tin dựa trecircn vấn đề

Nemawashi

Kỹ thuật nhoacutem định danh

1-Mỗi người tham gia viết ra những yacute tưởng về những gigrave necircn quyết định

2-Lần lượt mỗi người tham gia trigravenh bagravey yacute tưởng của migravenh được ghi lại trecircn bảng Khocircng thảo luận ở đacircy

3-Sau khi tất cả caacutec yacute tưởng được trigravenh bagravey caacutec đại biểu coacute thể chất vấn những người khaacutec

4-Mỗi người tham gia bỏ phiếu cho mỗi yacute tưởng

Kỹ thuật Delphi

Về cơ bản tương tự như kỹ thuật nhoacutem định danh ngoại trừ những người khocircng bao giờ tham gia cuộc họp

Một cocircng cụ khảo saacutet được sử dụng để thu thập đầu vagraveo ban đầu từ caacutec thagravenh viecircn

Một cuộc khảo saacutet thứ hai được gửi đi với một bản toacutem tắt caacutec kết quả chung

Những bước lặp lại cho đến khi đạt được một sự đồng thuận hoặc nhigraven nhận của đa số

Sự phacircn xử(Arbitration )

Thiacutech hợp nhất khi caacutec thagravenh viecircn của MDM đại diện cho caacutec yếu tố đối lập

Những người tham gia đồng yacute rằng nếu lựa chọn thay thế hai becircn thỏa thuận khocircng được tigravem thấy thigrave một trọng tagravei viecircn becircn ngoagravei sẽ tham gia

Trọng tagravei sau đoacute lựa chọn thay thế ocircng hoặc xeacutet thấy thiacutech hợp nhất

Hệ thống thocircng tin dựa trecircn vấn đề (IBIS)

Lagrave một phương phaacutep lập luận cấu truacutec

Một đại diện cho IBIS lagrave một đồ thị với caacutec nuacutet vagrave caacutec liecircn kết

IBIS bắt đầu với lựa chọn của một nuacutet vấn đề gốc sau đoacute caacutec nuacutet vị triacute khaacutec nhau được liecircn kết với nuacutet gốc

Caacutec nuacutet vị triacute nagravey sau đoacute được đaacutenh giaacute dựa trecircn những lập luận gắn liền với chuacuteng

Nemawashi (được sử dụng rộng ratildei tại Nhật Bản)

1-Một hoặc nhiều thagravenh viecircn của MDM được chỉ định lagrave điều phối viecircnCaacutec điều phối viecircn sau đoacute chọn người tham gia cograven lại

2-Điều phối viecircn xacircy dựng một tổng hợp caacutec sự lựa chọn vagrave sau đoacute caacutec chuyecircn gia đaacutenh giaacute caacutec lựa chọn

3-Điều phối viecircn lựa chọn một sự lựa chọn dựa trecircn kết quả ở trecircn(ở 2)

4-Sự thay thế được luacircn chuyển điều phối viecircn tigravem kiếm sự đồng thuận thocircng qua sự thuyết phục vagrave đagravem phaacuten

5-Nếu đạt được sự đồng thuận điều phối viecircn cho lưu thocircng một tagravei liệu magrave mỗi thagravenh viecircn MDM để lại dấu hiệu trecircn đoacute

55Nơi lagravem việc ảo

Nhiều tổ chức trecircn toagraven thế giới kinh doanh bất động sản cho cocircng nghệ hợp taacutec

Cocircng việc được trở thagravenh một điều bạn lagravem hơn lagrave một nơi bạn đi

Những thay đổi lớn nhất mang lại bởi nơi lagravem việc ảo coacute thể lagrave về văn hoaacute hay xatilde hội hơn lagrave về cocircng nghệ

Chương 6 Hệ thống thocircng tin điều hagravenh

61 Yacute nghĩa của EIS- Hệ thống thocircng tin điều hagravenh

- EIS lagrave một dạng đặc biệt của DSS được thiết kế để hỗ trợ ra quyết định ở cấp cao nhất của một tổ chức

- Lagrave một hệ thống thocircng tin hỗ trợ nhu cầu lập kế hoạch vagrave đaacutenh giaacute của caacutec nhagrave quản lyacute điều hagravenh

- EIS coacute thể giuacutep một CEO coacute được bức tranh tổng thể chiacutenh xaacutec nhất về caacutec hoạt động vagrave một bản toacutem tắt những gigrave magrave đối thủ cạnh tranh đang lagravem

- Caacutec hệ thống nagravey noacutei chung hoạt động dễ dagraveng vagrave trigravenh bagravey thocircng tin theo những caacutech dễ hiểu để việc tiếp thu được nhanh choacuteng (biểu đồ đồ thịhellip)

(Tagravei liệu thecircm EIS lagrave những loại hệ thống lagrave rất phức tạp trong tự nhiecircn Coacute thể noacutei hệ thống nagravey cũng cung cấp cho caacutec nhagrave quản lyacute với caacutec thiết bị coacute khả năng ra quyết định bằng caacutech sử dụng của noacute Hệ thống nagravey hoạt động trong điều kiện như vậy quan trọng như trong caacutec hệ thống khaacutec khocircng hỗ trợ Khả năng lưu trữ dữ liệu nặng lagravem cho noacute lyacute tưởng để được thocircng qua khocircng chỉ bởi caacutec doanh nghiệp lớn magrave cograven bởi caacutec doanh nghiệp nhỏ hơn Nhigraven chung hệ thống nagravey lagrave dagravenh cho caacutec nhacircn viecircn cấp cao hỗ trợ thagravenh thạo trong việc đưa ra caacutec quyết định quan trọng)

Caacutec phiecircn EIS tiecircu biểu- Phiecircn lagravem việc coacute thể bắt đầu với một baacuteo caacuteo về tigravenh higravenh tagravei chiacutenh vagrave kinh

doanh của một cocircng ty caacutec chỉ số hoạt động quan trọng được hiển thị rotilde ragraveng- EIS sẽ cho pheacutep caacutec giaacutem đốc điều hagravenh coacute thể đi sacircu vagraveo dữ liệu từ những con

số bất kỳ magrave noacute hỗ trợ- Việc điều hagravenh coacute thể lựa chọn một mức độ chi tiết ( VD danh số baacuten hagraveng) nếu

như cần điều tra thecircm- Lagrave một phương phaacutep tiếp cận coacute thể giuacutep việc ra quyết định tốt hơn

Những điều magrave EIS ko coacute- EIS khocircng phải lagrave sự thay thế cho caacutec hệ thống dựa trecircn caacutec maacutey tiacutenh khaacutec EIS

thực sự chỉ cung cấp dữ liệu cho caacutec hệ thống nagravey- Noacute khocircng thể biến caacutec bộ hệ điều hagravenh của maacutey tiacutenh thagravenh những ldquochuyecircn viecircn

giỏirdquo- Coacute thể được viacute một caacutech cao hơn như lagrave một trợ lyacute đaacuteng tin cậy coacute thể được gọi

đến bất khi nagraveo vagrave mỗi khi cần thiết

Tagravei liệu thecircm Sự khaacutec nhau giữa EIS vagrave DSS+ EIS thiết kế để hỗ trợ những người điều hagravenh cấp cao giuacutep họ khaacutem phaacute caacutec vấn đề vagrave caacutec cơ hội DSS hỗ trợ những nười phacircn tiacutech cố gắng trả lời cacircu hỏi caacutei gigrave coacute thể lagravem cugraveng với một cơ hội hoặc một vấn đề

Chiều EIS DSSNhững người sử dụng thocircng thường

Duyệt dữ liệu đi xuống truy xuất trạng thaacutei

Hỗ trợ phacircn tiacutech vagrave quyết định

Sự thuacutec đẩy Tiacutenh thiacutech hợp Tiacutenh hiệu quảỨng dụng Queacutet mocirci trường đaacutenh giaacute

hiệu suất nhận dạng caacutec vấn đề vagrave caacutec cơ hội

Caacutec quyết định quản lyacute trecircn caacutec lĩnh vực đa dạng

Hỗ trợ quyết định Caacutec chiacutenh saacutech caacutec quyết định khocircng coacute cấu truacutec ở mức cao vagrave hỗ trợ giaacuten tiếp

Hỗ trợ caacutec quyết định lặp lại caacutec quyết định khocircng thể đoaacuten trước ra quyết định khocircng coacute cấu truacutec vagrave baacuten cấu truacutec

Loại thocircng tin Caacutec thocircng tin tin tức thocircng tin becircn ngoagravei về khaacutech hagraveng đối thủ cạnh tranh mocirci trường caacutec baacuteo caacuteo theo yecircu cầu vagrave định thời về caacutec hoạt động becircn trong

Caacutec thocircng tin hỗ trợ caacutec tigravenh huống đặc biệt

Sử dụng coacute nguyecircn tắc

Dograve theo vết vagrave điều khiển nhận dạng cơ hội

Hoạch định tổ chức phacircn nhoacutem vagrave điều khiển

Khả năng phugrave hợp với những người sử dụng caacute nhacircn

Thiết kế loại ra quyết định cho mỗi người điều hagravenh caacute nhacircn bằng nhiều lựa chọn đầu ra

Cho pheacutep caacutec đaacutenh giaacute caacute nhacircn caacutec khả năng what-if lựa chọn loại hộp hội thoại

Đồ họa Phải coacute Lagrave một phần quan trọng của nhiều DSS

Thacircn thiện người sử dụng

Phải coacute Phải coacute nếu khocircng coacute người sử dụng trung gian

Xử lyacute thocircng tin Lọc neacuten thocircng tin dograve theo vết dữ liệu vagrave thocircng tin quan trọng

EIS kiacutech thiacutech caacutec cacircu hỏi caacutec cacircu trả lời bằng caacutech sử dụng DSS vagrave phản hồi lại EIS

Hỗ trợ caacutec thocircng tin chi tiết

Truy xuất thường xuyecircn caacutec mức chi tiết của bất kỳ thocircng tin tổng hợp nagraveo (duyệt dữ

Coacute thể coacute trong DSS nhưng khocircng thường

liệu chi tiết)Cơ sở mocirc higravenh Caacutec chức năng coacute sẵn bị hạn

chếLagrave điểm cốt lotildei của DSS

Cấu truacutec Theo người baacuten sản phẩm hoặc theo caacutec chuyecircn gia hệ thống thocircng tin

Theo người sử dụng hoặc caacute nhacircn hoặc caacutec chuyecircn gia từ caacutec trung tacircm thocircng tin hoặc phograveng ban hệ thống thocircng tin

Phần cứng Mainframe caacutec trạm RISC mạng LANs hoặc caacutec hệ thống phacircn bố

Mainframe caacutec trạm RISC caacutec maacutey PC hoặc caacutec hệ thống phacircn bố

Bản chất caacutec goacutei phần mềm

Truy xuất tương taacutec dễ dagraveng đến nhiều cơ sở dữ liệu truy xuất trực tuyến caacutec khả năng DBMS phức tạp caacutec liecircn kết phức tạp

Caacutec khả năng tiacutenh toaacuten lớn caacutec ngocircn ngữ mocirc higravenh mocirc phỏng ứng dụng vagrave caacutec bộ tạo DSS

Bản chất caacutec thocircng tin

Trigravenh bagravey thocircng tin được phaacutet sinh trước về quaacute khứ vagrave hiện tại tạo caacutec thocircng tin mới về quaacute khứ hiện tại tương lai

Tạo thocircng tin mới về quaacute khứ hiện tại tương lai

62 Lịch sử EIS- EIS xuất hiện lần đầu tiecircn tại MIT vagraveo những năm 1970

- Những EIS đầu tiecircn được phaacutet triển bởi caacutec doanh ngiệp lớn sẵn sagraveng chấp nhận rủi ro để đạt được lợi thế cạnh tranh

- Vagraveo những năm 1980 caacutec nhagrave cung cấp đatilde phaacutet triển một số cơ sở khaacutech hagraveng rộng vagrave cocircng nghệ EIS được tiếp tục phaacutet triển cho đến ngagravey nay

(Tagravei liệu thecircm Sử dụng DSSEIS cho phaacutet triển bền vững + Một số nghiecircn cứu đatilde được tiến hagravenh để kiểm tra việc thực hiện của EIS trong khu vực cocircng cộng vagrave chiacutenh phủ caacutec nước tổ chức kể từ khi chuacuteng được phaacutet triển theo định hướng lợi nhuận cho caacutec cocircng ty tư nhacircn (Hasan vagrave Hasan năm 1997) Theo một nghiecircn cứu tiến hagravenh tại Mỹ ở hơn 300 cocircng ty kết quả cho thấy sự khaacutec biệt của EIS giữa tư nhacircn vagrave chiacutenh phủ một số kết quả thuacute vị được phaacutet hiệnViacute dụ khoacute khăn hơn để chuyển tiền từ một tagravei khoản khaacutec trong một EIS của chiacutenh phủ cũng lagrave khoacute khăn hơn để biện giải thiacutech cho những chi phiacute phaacutet triển EIS của chiacutenh phủ Một nghiecircn cứu khaacutec được tiến hagravenh ở Australia

cho thấy rằng EIS cung cấp cho quản lyacute một higravenh ảnh chiacutenh xaacutec hơn về tổ chức thực hiện vagrave cung cấp hỗ trợ cho caacutec lợi iacutech chiến lược cải thiện khocircng chỉ cho caacutec nhagrave quản lyacute nhưng cograven cho phần cograven lại của tổ chức Dựa trecircn caacutec hệ thống được thiết kế cho caacutec cocircng ty tư nhacircn với một caacutech rotilde ragravengxaacutec định mục tiecircu EIS lagrave thiacutech hợp cho caacutec tổ chức cocircng cộng hiện đại nhưng cần phải được linh hoạt hơn vagrave kết thagravenh chugravem một phạm vi rộng hơn khả năng vagrave phương tiện hơn so với khu vực tư nhacircn ban đầu theo định hướng sản phẩm (Hasan vagrave Hasan năm 1997) Điều nagravey coacute thể lagrave do thực tế rằng caacutec hoạt động khu vực cocircng lagrave bắt buộc coacute taacutec động rộng phải đaacutep ứng sự mong đợi duy nhất cocircng cộng thường coacute mục tiecircu mơ hồ vagrave macircu thuẫn iacutet quyền tự chủ vagrave kiểm soaacutet việc ra quyết định vagrave nhacircn viecircn lagrave khoacute khăn hơn (Watson vagrave Carte2000) + Toacutem lại EIS lagrave một khaacutei niệm thagravenh cocircng noacute phaacutet triển qua nhiều năm tuy nhiecircn EIS khắc phục khiếm khuyết của migravenh bằng caacutech tiến hagravenh nghiecircn cứu liecircn tục)

63 Tại sao những người điều hagravenh hagraveng đầu lại khaacutec nhau- Họ lagrave những doanh nghiệp theo định hướng coacute suy nghĩ

- Coacute một khoảng khocircng gian rộng để kiểm soaacutet

- Họ chịu traacutech nhiệm cho việc thiết lập chiacutenh saacutech

- Họ đại diện cho tổ chức mocirci trường becircn ngoagravei

- Hagravenh động của họ tạo ra những kết quả đaacuteng kể về tagravei chiacutenh vagrave con người

Tần số caacutec hoạt động điều hagravenh- Xử lyacute xaacuteo trộn 42

- Hoạt động kinh doanh 32

- Phacircn bổ nguồn lực 17

- Đagravem phaacuten 3

- Những điều khaacutec 6

Handling Disturbances 42

Entrepreneurial Activites 32

Resource Allocation 17

Negotiation 3

Other 6

Những thocircng tin điều hagravenh cần thiết- Quản lyacute xaacuteo trộn coacute thể yecircu cầu sự chuacute yacute xung quanh đồng hồ

- Hoạt động kinh doanh yecircu cầu điều hagravenh để dự đoaacuten những thay đổi trong mocirci trường

- Nhiệm vụ phacircn bổ tagravei nguyecircn yecircu cầu lựa chọn người quản lyacute vagrave caacutec nguồn lực hạn chế được triển khai

- Đagravem phaacuten yecircu cầu cập nhật thocircng tin từng phuacutet để coacute thể xacircy dựng được sự đồng thuận

Caacutec loại thocircng tin điều hagravenh- Hệ thống kế toaacuten coacute liecircn quan đến việc tiacutenh toaacuten thu nhập hoạt động cho caacutec lĩnh

vực cụ thể lagrave quan trọng hơn so với caacutec hệ thống kế toaacuten truyền thocircng- Thocircng tin về thị trường khaacutech hagraveng cung cấp giaacute trị trong việc quyết định chiến

lược- Caacutec thocircng tin cần thiết thường được truyền đi trecircn một số hệ thống maacutey tiacutenh vagrave

nằm trong toagraven tổ chức- Caacutec thocircng tin được sử dụng thường lagrave ngắn hạn vagrave dễ thay đổi

Phương thức để xaacutec định thocircng tin cần thiết

Rockart xaacutec định được năm phương thức cơ bản để xaacutec định thocircng tin cần thiết

- Phương thức dựa trecircn kết quả- Phương thức rỗng- Phương thức chỉ số khoacutea- Phương thức tổng hợp nghiecircn cứu- Phương thức dựa vagraveo nhacircn tố then chốt dẫn đến thagravenh cocircng

64 Thagravenh phần EIS

- Sản phẩm EIS đầu tiecircn được phaacutet triển để sử dụng trecircn maacutey tiacutenh cấu higravenh cao nhưng caacutec sản phẩm hiện nay nhằm mục tiecircu lagrave nền tảng ClientServer

- Những nền tảng linh hoạt hơn coacute thể thiacutech ứng với thay đổi trong tổ chức vagrave cocircng nghệ

- Sử dụng dữ liệu thời gian thực dẫn đến quyết định nhanh hơn nhiều thocircng tin hơn

Thagravenh phần phần cứng- Một EIS khocircng đogravei hỏi coacute phần cứng cụ thể hoặc duy nhất nagraveo- Chigravea khoacutea của vấn đề lagrave để đảm bảo rằng caacutec thagravenh phần của EIS tối ưu hoacutea vagrave

phugrave hợp với tagravei nguyecircn maacutey tiacutenh của tổ chức- Hệ thống nagravey phải được cấu higravenh để caacutec nguồn tagravei nguyecircn phugrave hợp với những

người điều hagravenh chuacuteng

Thagravenh phần phần mềm- Traacutei ngược với phần cứng phần mềm thường được chuyecircn mocircn hoacutea cao cho caacutec

bagravei toaacuten về miền- Sự chuyecircn mocircn hoacutea nagravey thường đạt được bằng caacutech sử dụng thagravenh phần off-the-

shelf cho toagraven bộ EIS vagrave caacutec mocirc-đun tugravey chỉnh để đaacutep ứng nhu cầu cụ thể- Lotus Notes lagrave một viacute dụ điển higravenh Noacute coacute thể được sử dụng một migravenh hoặc coacute

thể phục vụ becircn thứ ba mocirc-đun plug-in

Cocircng nghệ EIS hiện nay

Dobrzeniecki đề xuấtphacircn loạitừng cấptheo bachức năng- Loại 1 sản phẩm bao gồmmột bộ đầy đủcaacutec ứng dụngtừ mộtnhagrave cung cấp- Loại 2 sản phẩm đượcthựchiệnở phần đầu củacaacutecsản phẩmDSS đượcphaacutet triển

bởicugravengmộtnhagrave cung cấp- Loại 3 sản phẩmkết hợp với nhautheo bất kỳ số lượngthuộc sở hữu củacocircng ty

65 Xacircy dựng EIS

- Xacircy dựngmộtEISgiống nhưxacircydựngmột số hệ thống khaacutec củamocirc higravenh hệ thống thocircng tin

- Việcphaacutet triểncấu truacutecnecircn được theo dotildeitừ quaacute trigravenh thiết kế đến quaacute trigravenhthực hiện

- Tuy nhiecircn một dự aacuten phaacutet triển EIScoacute xu hướnglagrave thống nhấtvagraveyecircu cầu hỗ trợ caacutec nhagrave quản lyacute latildenh đạo

- Xacircy dựng một EIScoacute thểphaacutet hiện ra đượccaacutectigravenh huống khoacute khănmagravemột nhagrave phaacutet triển chưabao giờ gặp phải

Mocirc higravenh EIS

Khung phaacutet triển một EIS

- Watson et al đề nghị xacircy dựngkhung với ba thagravenh phần+ Caacutech tiếp cận tập trung vagraveo yếu tốcon người vagrave dữ liệu coacute liecircn quan đến EIS+ Quaacute trigravenh phaacutet triển cần sự linh hoạt vagrave tương taacutec+ Người sử dụng - hệ thống hộp thoại bao gồm một ngocircn ngữ hagravenh động để xử lyacute caacutec lệnh

Lợi iacutech của EIS- Dễ duy trigrave caacutec mục tiecircu coacute tổ chức- Dễ truy xuất thocircng tin- Cho pheacutep người sử dụng nacircng cao hiệu suất hơn

- Tăng chất lượng ra quyết định- Cung cấp sự cải tiến cạnh tranh- Tiết kiệm thời gian của người sử dụng- Tăng khả năng vagrave chất lượng giao tiếp- Cung cấp khả năng điều khiển tốt hơn trong tổ chức- Cho pheacutep tham gia caacutec vấn đề vagrave caacutec cơ hội- Cho pheacutep hoạch định- Cho pheacutep tigravem kiếm nguyecircn nhacircn của một vấn đề- Thảo matilden caacutec yecircu cầu của người điều hagravenh

Hạn chế của EIS vagrave 1 số sai lầm cần traacutenh

- Chi phiacute một cuộc khảo saacutetnăm1991 chothấychi phiacute phaacutet triểntrungbigravenh365000USDvớichi phiacute vận hagravenhhagraveng năm lagrave$200000 (EIS)

- Cocircng nghệ hạn chếEIScần phảiđượctiacutech hợp hoagraven toagravenvagraveokiếntruacuteccủadoanh nghiệphiện tại do đoacute noacutelagrave một thaacutech thứclớn đối vớithiết kế

- Hạn chế tổ chức cơ cấu tổ chứccoacute thể khocircng phugrave hợp

Sự hạn chế về tổ chức- Chương trigravenh nghị sự vagrave thời gian chệch EIS mocirc tả một phần việc thực hiện một

chương trigravenh nghị sự vagrave coacute thể dễ dagraveng đạt được sự tin cậy một caacutech chắc chắn- Đồng bộ hoacutea việc quản lyacute sự tin cậy đuacuteng luacutec đặc biệt baacuteo caacuteo EIS coacute thể phaacute

vỡ sự ổn định thiết lập caacutec chu trigravenh baacuteo caacuteo một caacutech tốt nhất- Sự bất ổn EIS phản ứng nhanh coacute thể gacircy ra việc taacutec động trở lại một caacutech

nhanh choacuteng dẫn đến sự thiếu ổn định trong tổ chức

Sự thất bại lagrave thay thế khocircng thể chấp nhận được- Một số yếu tố lagravem EIS thất bại

+ Thiếu sự hỗ trợ về mặt quản lyacute+ Vấn đề chiacutenh trị+ Thất bại của nhagrave phaacutet triển+ Lỗi về cocircng nghệ+ Giaacute cả+ Thời gian

66 Ra quyết định điều hagravenh trong tương lai vagrave EIS

- Coacute một vagravei điều kiện sẽ được hợp nhất cho việc chuyển đổi cocircng nghệ Trong đoacute một vagravei điều kiện coacute thể dễ dự đoaacuten Hai điều kiện magrave ta coacute thể thấy lagrave+ Phaacutet triển cocircng nghệ maacutey tiacutenh trong việc điều hagravenh sẽ tạo ra sự chuyển đổi được chấp nhận một caacutech dễ dagraveng hơn+ Mở rộng traacutech nhiệm điều hagravenh sẽ mở rộng nhu cầu thocircng tin

Tương lai của EIS- EIS thocircng minh Những tiến bộ trong cocircng nghệ AI sẽ được triển khai trong caacutec

EIS- EIS đa phương tiện Cơ sở dữ liệu đa phương tiện sẽ cho pheacutep tiacutech hợp văn bản

giọng noacutei vagrave higravenh ảnh trong tương lai- EIS thocircng tin Tương lai EIS sẽ mở rộng hơn trong việc sử dụng dữ liệu becircn

ngoagravei doanh nghiệp- EIS kết nối Giao tiếp với băng thocircng rộng cho pheacutep kết nối liecircn thocircng lớn hơn

Chương 7 HỆ CHUYEcircN GIA VAgrave TRIacute TUỆ NHAcircN TẠO

71 Caacutec khaacutei niệm

72 Triacute thocircng minh của triacute tuệ nhacircn tạo

73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia

74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia

75 Lợi iacutech vagrave hạn chế của hệ chuyecircn gia

71 Caacutec khaacutei niệm

Chuyecircn mocircn (Expertise) sự hiểu biết rộng trong 1 lĩnh vực hẹp

Hệ chuyecircn gia (Expert Systems)1 chương trigravenh maacutey tiacutenh sử dụng 1 tập caacutec luật dựa trecircn tri thức của con người để giải quyết caacutec vấn đề đogravei hogravei phải coacute sự chuyecircn mocircn

Một số hệ chuyecircn gia nổi tiếng

DENDRAL (Standford 1960s Edward Feigenbaum)

MYCIN (Standford1970s Edward Shortliffe)

PROSPECTOR (MIT 1979)

Triacute tuệ nhacircn tạo (Artificial Intelligence ndash AI)

Triacute tuệ nhacircn tạo một bộ phacircn của ngagravenh khoa học maacutey tiacutenh quan tacircm đến việc thiết kế caacutec hệ thống maacutey tiacutenh thocircng minh đoacute lagrave caacutec hệ thống đưa ra caacutec đặc điểm magrave từ đoacute chuacuteng ta liecircn hệ với sự thocircng minh trong hagravenh động của con người (Barr vagrave Feigenbaum 1981)

Mục điacutech của AI

Mục điacutech khoa học xaacutec định caacutec gợi yacute để giải thiacutech caacutec loại khaacutec nhau của triacute tuệ thực

Mục điacutech kỹ thuật giải quyết caacutec vấn đề trong thế giới thực

Triacute tuệ nhacircn tạo kế thừa nhiều yacute tưởng quan điểm kỹ thuật từ caacutec ngagravenh khoa học khaacutec

- Triết học

- Logic Toaacuten học

- Tiacutenh toaacuten

- Khoa học tacircm lyacute Khoa học nhận thức

- Sinh học Thần kinh học

- Tiến hoacutea

Caacutec lĩnh vực ứng dụng trong Triacute tuệ nhacircn tạo

Mạng nơ ron thần kinh (Neural Networks)

Tiacutenh toaacuten sự tiến hoacutea

(Evolutionary Computation)

Hệ chuyecircn gia (Expert Systems)

Kỹ thuật xử lyacute tiếng noacutei (Speech Processing)

Kỹ thuật xử lyacute ngocircn ngữ tự nhiecircn

(Natural Language Processing)

Lập kế hoạch (Planning)

Robot (Robotics)

Khoa học higravenh ảnh (Vision)

Caacutec kỹ thuật thocircng dụng dugraveng trong AI

Biểu diễn(Representation)

Học (Learning)

Caacutec luật (Rules)

Tigravem kiếm (Search)

72 Triacute thocircng minh của triacute tuệ nhacircn tạo

Con người suy diễn như thế nagraveo

Phacircn loại (Categorization)

Caacutec quy tắc cụ thể

Heuristics

Kinh nghiệm trước đoacute

Dự tiacutenh trước

Maacutey tiacutenh suy diễn như thế nagraveo

Lập luận dựa trecircn luật IF-THEN mocirc tả tri thức được matilde hoacutea dưới dạng caacutec luật

Caacutec khung (Frames) lagrave caacutec đại diện mocirc tả caacutec tigravenh huống giống nhau lagrave điển higravenh của một vagravei phacircn loại

Lập luận dựa trecircn caacutec trường hợp mocirc phỏng giải phaacutep trước đoacute cho một vấn đề hiện tại

Nhận dạng mẫu phaacutet hiện acircm thanh higravenh dạng hoặc caacutec chuỗi dagravei

Caacutec dạng khaacutec của Triacute tuệ nhacircn tạo

Học maacutey- mạng nơron vagrave giải thuật di truyền

Lập trigravenh tự động ndash lagrave những kỹ thuật tạo ra caacutec chương trigravenh để lagravem 1 nhiệm vụ riecircng biệt (cho pheacutep những người khocircng phải lagrave người lập trigravenh coacute thể lập trigravenh được)

Cuộc sống nhacircn tạo ndash nỗ lực để taacutei tạo caacutec hiện tượng sinh học trong caacutec hệ thống dựa trecircn maacutey tiacutenh

73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia(Expert Systems- ES)

Theo Jackson (1999) Một hệ chuyecircn gia lagrave một chương trigravenh maacutey tiacutenh mocirc tả vagrave suy diễn với tri thức của một vagravei lĩnh vực để giải quyết vấn đề hay đưa ra caacutec lời khuyecircn

Cấu truacutec cơ bản của ES được dựa theo cấu truacutec chung của DSS Sự khaacutec biệt chiacutenh giữa ES vagraveDSS lagrave hệ ES thu thập caacutec kiến thức từ những

chuyecircn gia trong lĩnh vực quan tacircmĐặc trưng của hệ chuyecircn gia Hiệu quả cao Thời gian trả lời thỏa đaacuteng Độ tin cậy cao Dễ hiểu

Giao diện người dugraveng trong ES

Thiết kế giao diện người dugraveng tập trung vagraveo caacutec yếu tố như dễ dagraveng sử dụngcoacute độ tin cậy cao giảm tải những khoacute khăn khi sử dụng

Thiết kế necircn coacute một số tương taacutec (đầu vagraveo kiểm soaacutet vagrave truy vấn)

Cấu tạo giao diện người dugraveng gồm coacute magraven higravenh cảm ứng bagraven phiacutem buacutet saacuteng lệnh thoại caacutec phiacutem chuyecircn dụng

Cơ sở tri thức (Knowledge Base)

Chứa đựng caacutec tri thức cụ thể miền thu được từ caacutec chuyecircn gia miền

Coacute thể chứa caacutec mocirc tả caacutec hagravenh vi giải quyết vấn đề caacutec ragraveng buộc caacutec heuristics

Thagravenh cocircng của một ES dựa trecircn tiacutenh đầy đủ vagrave tiacutenh chiacutenh xaacutec của cơ sở tri thức

Mocirc tơ suy diễn (Inference Engine)

Ở đacircy tri thức được đặt để sử dụng tạo ra caacutec giải phaacutep để giải quyết vấn đề

Mocirc tơ nagravey coacute khả năng thực hiện diễn dịch hoặc suy diễn dựa trecircn caacutec luật hay caacutec caacutec sự kiện

Đồng thời cũng coacute khả năng sử dụng caacutec suy diễn mờ hay khocircng chiacutenh xaacutec dựa trecircn xaacutec suất hay aacutenh xạ mẫu

Vograveng điều khiển suy diễn

1 Aacutenh xạ caacutec luật với caacutec sự kiện đatilde được cho

2 Chọn luật để thực hiện

3 Thực hiện luật bằng caacutech thecircm caacutec sự kiện được suy diễn ra vagraveo bộ nhớ lagravem việc

Chuỗi suy diễn (Chaining)

Suy diễn tiến (forward chaining) maacutey suy diễn bắt đầu từ dữ liệu ban đầu vagrave thực hiện việc suy luận để đưa ra caacutec kết luận cuối cugraveng

Suy diễn lugravei (backward chaining) maacutey suy diễn bắt đầu từ dữ liệu điacutech vagrave tigravem ra tri thức hỗ trợ cho dữ liệu điacutech đoacute

Viacute dụ suy diễn lugravei

R1 Nếu coacute A vagrave B thigrave suy ra coacute D

R2 Nếu coacute B thigrave suy ra coacute C

R3 Nếu coacute C vagrave D thigrave suy ra coacute E

Ta coacute E ta xem trong 3 luật R1 R2 R3 luật nagraveo coacute E ta thấy R3 chứa E đồng thời chứa C vagrave D Xeacutet tiếp trong 2 luật R1 R2 luật nagraveo chứa C vagrave D R2 chứa C R3 chứa D Từ đoacute ta coacute được caacutec tri thức hỗ trợ suy diễn vagrave kết luận lagrave nếu coacute A vagrave B thigrave sẽ coacute E Hay nếu A vagrave B đuacuteng thigrave sẽ coacute E

Viacute dụ suy diễn tiến

Giả sử coacute tập chứa 3 luật sau

R1 Nếu coacute A vagrave B thigrave suy ra coacute D

R2 Nếu coacute B thigrave suy ra coacute C

R3 Nếu coacute C vagrave D thigrave suy ra coacute E

Nếu ta coacute A vagrave B thigrave chuacuteng ta suy ra được D từ R1 vagrave suy ra C từ R2 Với D vagrave C đatilde được suy ra ở trecircn giờ chuacuteng ta suy ra được E từ R3

Viacute dụ thực tế

Giả sử muốn biết magraveu của một con vật nuocirci tecircn lagrave Fred biết rằng noacute kecircu ộp ộp vagrave ăn ruồi

Coacute tập 4 luật ban đầu như sau

R1 Nếu X kecircu ộp ộp vagrave ăn ruồi thigrave X lagrave con ếch

R2 Nếu X kecircu chiecircm chiếp vagrave biết hoacutet thigrave X lagrave con chim

R3 Nếu X lagrave con ếch thigrave X coacute magraveu xanh

R4 Nếu X lagrave con chim thigrave X coacute magraveu vagraveng

74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia

Expert system shells lagrave một tập caacutec goacutei phần mềm vagrave caacutec cocircng cụ dugraveng để phaacutet triển caacutec hệ chuyecircn gia

Những Expert system shells đầu tiecircn thường rất rườm ragrave Mặc dugrave vậy noacute vẫn giuacutep cho người sử dụng sẽ khocircng phải bắt đầu lại từ đầu khi xacircy dựng một hệ chuyecircn gia mới

Những shell hiện đại bao gồm hai mocirc-đun chiacutenh lagrave cocircng cụ xacircy dựng một tập quy tắc vagrave mocirc tơ suy diễn

Xacircy dựng hệ chuyecircn gia

Bước 1 xacircy dựng mocirc higravenh bagravei toaacuten xaacutec định vấn đề nhiệm vụ magrave hệ thống sẽ thực hiện Caacutec dạng bagravei toaacuten cần hệ chuyecircn gia

Bagravei toaacuten diễn giải (InterPretation)

Bagravei toaacuten dự baacuteo (Prediction)

Bagravei toaacuten chuẩn đoaacuten (Diagnose)

Bagravei toaacuten gỡ rối (Debugging)

Bagravei toaacuten thiết kế

Tương tự như một dự aacuten phần mềm để xacircy dựng một hệ chuyecircn gia cần phải coacute caacutec yếu tố về nhacircn lực tagravei nguyecircn vagrave thời gian Những yếu tố nagravey ảnh hưởng đến giaacute thah của một hệ chuyecircn giaTrong phần nagravey cacircu hỏi thường được đặt ra lagrave tại sao cần phải xacircy dựng một hệ chuyecircn giaTrước khi bắt đầu phải xaacute định rotilde bagravei toaacuten đạt ra lagrave jiAi lagrave chuyecircn giaAi lagrave người sử dụng

1 Diễn giải (InterPretation) Nghiecircn cứu 1 vấn đề -gt Dựa trecircn những biểu hiện thuộc tiacutenh đặc trưng becircn ngoagravei -gt Tư vấn

(hoặc đưa ra kết luận hay mocirc tả dễ hiểu từ tập dữ liệu thocirc)

2 Bagravei toaacuten dự baacuteo (Prediction) Coacute thể dự đoaacuten được hagravenh vi kết quả dựa trecircn caacutec hiện tượng -gt dự baacuteo

VD Dự baacuteo thời tiết động đấthellip

3 Bagravei toaacuten chẩn đoaacuten (Diagnoss) Xaacutec định caacutec lỗi caacutec bộ phận hỏng hoacutec của hệ thống dựa trecircn caacutec dữ liệu quan saacutet được

4 Bagravei toaacuten gỡ rối (Debugging) Mocirc tả caacutec phương phaacutep khắc phục hệ thống khi gặp sự cố

5 Bagravei toaacuten thiết kế Lựa chọn cấu higravenh caacutec đối tượng nhằm thoả matilden một số ragraveng buộc nagraveo đoacute

6 Giảng dạy Phần mềm dạy học coacute thể chuẩn đoaacuten vagrave sủa lỗi của học sinh trong quaacute trigravenh học tập

Để xaacutec định đuacuteng bagravei toaacuten magrave chuacuteng ta cần giải quyết thigrave phải trả lời đc một số cacircu hỏi

- cần hệ chuyecircn gia

Bước 2 thu thập tri thức lựa chọn cocircng cụ vagrave aacutep dụng

Trong bước thu thập tri thức vấn đề quan trọng lagrave lựa chọn chuyecircn gia những người magrave sẽ đoacuteng goacutep tri thức cho hệ thống Thocircng thường trong suốt quaacute trigravenh phaacutet triển thigrave chuyecircn gia được xem như một thagravenh viecircn của đội phaacutet triển

Hiện nay coacute rất nhiều cocircng cụ để xacircy dựng một hệ chuyecircn gia Phổ biến nhất lagrave JESS CLIPS vagrave OPS5

Bước 3 Thiết kế cơ sở tri thức thiết kế hệ thốngTri thức được biểu diễn trường minh trong cơ sở tri thức

Caacutec chuyecircn gia vagrave kỹ sư tri thức sẽ đối thoại với nhau bằng caacutec kỹ thuật đối thoại Suy diễn (SD) bảng Mocirc higravenh hoacutea SD quy nạp phacircn loại

Vấn đề bagraveo trigrave vagrave phaacutet triển

Caacutec hệ chuyecircn gia đogravei hỏi phải bảo trigrave vagrave phaacutet triển nhiều hơn so với caacutec hệ thống khaacutec Phải thường xuyecircn bổ sung tri thức mới vagrave thay đổi caacutec tri thức cũ để đổi mới hệ chuyecircn gia

Thu thập vagrave khắc phục lỗi do người sử dụng phaacutet hiện để kịp thời khắc phục những sai soacutet của hệ chuyecircn gia

75 Lợi iacutech vagrave hạn chế của caacutec hệ chuyecircn gia

Một số lợi iacutech chiacutenh

Thời gian trả lời hợp lyacute bằng hoặc nhanh hơn so với chuyecircn gia (người) để đi đến cugraveng một quyết định Hệ chuyecircn gia lagrave một hệ thống thời gian thực (real time system)

Khả năng trả lời với mức độ tinh thocircng bằng hoặc cao hơn so với chuyecircn gia (người) trong cugraveng lĩnh vực

Hệ chuyecircn gia giuacutep cho hiệu quả lagravem việc tăng bằng việc sử dụng tập caacutec luật một caacutech nhanh choacuteng magrave ko bị nhầm lẫn chuyecircn gia lagrave người coacute thể quecircn đi một số tri thức cơ sở lyacute luậ nhưng HCG thigrave ko

Quyết định của một người chuyecircn gia coacute thể bị thay đổi vagrave ko coacute tiacutenh thống nhất như quyết định của một hệ chuyecircn gia tạo ra

Hệ chuyecircn gia giuacutep cho người sử dụng coacute thể trau dồi sự hiểu biết trecircn lĩnh vuej cụ thể magrave noacute giải quyết hỗ trợ người ra quyết định coacute trigravenh độ như 1 chuyecircn gia trong quaacute trigravenh gia quyết định

Kiến thức của rất nhiều chuyecircn gia về một lĩnh vực nagraveo đoacute được đưa vagraveo hệ chuyecircn gia lagravem cho CSTT cuat HCG phong phuacute vagrave rộng lớn hơn rất nhiều

HCG giải thiacutech caacutec bước suy luận một caacutech dễ hiểu nhất quaacuten luacutec nagraveo cũng coacute thể sử dụng ko như chuyecircn gia con người

Hạn chế của caacutec hệ chuyecircn gia

Nhược điểm lớn nhất của hệ chuyecircn gia lagrave những yacute kiến chuyecircn mocircn thường rất khoacute matilde hoacutea vagrave giải neacuten

Hệ chuyecircn gia khocircng coacute khả năng tự học tự cập nhật kiến thức mới như caacutec chuyecircn gia magrave cần phải được matilde hoacutea lại khi noacute được cập nhật

Hệ chuyecircn gia khocircng thể nhận ra được vấn đề khocircng nằm trong miền kiến thức của hệ thống

Chương 8 Tri thức vagrave tiếp nhận

1 Bao gồm caacutec vấn đề

Dữ liệu thực tế đo lường hoặc quan saacutet coacute hoặc khocircng coacute bối cảnh

Thocircng tin dữ liệu được tổng hợp một caacutech hữu iacutech để giải quyết những khoacute khăn trong việc đưa ra quyết định

Tri thức bao gồm caacutec ứng dụng quy tắc thocircng tin hướng dẫn của người ra quyết định

2 Những caacutei nhigraven về tri thức

Đại diện lagravem thế nagraveo để diễn tả tri thức viacute dụ như một quyển saacutech khocircng phải lagrave tri thức nhưng noacute lại lagrave một đại diện của tri thức

Sản xuất tri thức lagrave một tập hơp của hagraveng tồn kho coacute thể được sản xuất cũng như mua lại

Tri thức lagrave 1 trong 6 trạng thaacutei của hệ thống

1Dữ liệu 2Thocircng tin 3Cấu truacutec thocircng tin 4Sự thấu hiểu 5Yacute kiến 6 Quyết định

3 Caacutec loại tri thức Phổ biến mocirc tả dữ liệu thocircng tin thủ tục mọi thứ lagravem như thế nagraveo lập luận chiacutenh saacutech hoặc caacutec quy tắc

4 Thu thập Tri thức hệ chuyecircn gia Hầu hết caacutec phương phaacutep đều bắt đầu với mocirc higravenh của caacutec taacutec vụ trong đoacute

hệ chuyecircn gia được xacircy dựng Trong đoacute mocirc tả về caacutec lĩnh vực được tạo ra Caacutec kỹ sư sử dụng caacutec mocirc higravenh giả thuyết vagrave nhận thức về quaacute trigravenh phacircn

tiacutech để gợi ra caacutech giải quyết vấn đề về tri thức từ caacutec chuyecircn gia

5 Caacutec chiều của thu thập tri thức KE- driven caacutec kỹ sư trao đổi trực tiếp với caacutec chuyecircn gia Expert-driven Caacutec chuyecircn gia trực tiếp đưa chuyecircn mocircn của họ vagraveo hệ

thống maacutey tiacutenh Machine-driven Sử dụng caacutec cocircng cụ suy luận để triacutech xuất tri thức từ một

tập caacutec viacute dụ

6 Kỹ thuật thu thập tri thức Trao đổi gồm 2 loại cơ bản lagrave coacute cấu truacutec(coacute kịch bản) vagrave khocircng coacute cấu

truacutec( đối thoại trực tiếp) Giao thức phacircn tiacutech bằng lời Khi caacutec chuyecircn gia thực hiện một cocircng việc

của họ thigrave một bản ghi về cocircng việc đoacute được thực hiện Caacutec kỹ sư sẽ xacircy dựng mocirc higravenh cho những gigrave được ghi lại trong bản ghi

Phương phaacutep sagraveng lọc caacutec chuyecircn gia so saacutenh caacutec nhoacutem liecircn tiếp trong ba đối tượng vagrave cho biết tại sao nhoacutem thứ hai lại khaacutec nhoacutem thứ ba

7 Thu thập tri thức từ nhiều nguồn Thu thập tri thức từ nhiều nguồn lagrave cần thiết để coacute được đầy đủ caacutec tri thức

cho một vấn đề quan điểm yacute kiến traacutei ngược nhau thường phaacutet sinh Phương phaacutep đồng thuận sẽ giuacutep giải quyết được vấn đề macircu thuẫn Kỹ thuật phacircn tiacutech Meta lagrave kỹ thuật được aacutep dụng trong caacutec trường hợp

khaacutec Caacutech tiếp cận bằng định lượng đogravei hỏi caacutec kỹ sư cần cacircn nhắc yếu tố đầu vagraveo của caacutec chuyecircn gia khaacutec nhau

8 Xaacutec nhận hợp lệ vagrave kiểm tra tri thức Một khi thu thập tri thức noacute phải được đaacutenh giaacute về khả năng sử dụng vagrave độ

chiacutenh xaacutec Hai vấn đề cụ thể lagrave hiệu lực của những kiến thức vagrave kiểm tra việc xacircy dựng cơ sở của tri thức

Cần xaacutec nhận xem liệu hệ thống coacute thể hoạt động ở mức độ tối thiểu khocircng

Xaacutec minh liecircn quan đến việc so saacutenh từng chi tiết kỹ thuật của hệ thống những gigrave đatilde được thực hiện cuối cugraveng

9 Một số caacutec biện phaacutep xaacutec nhận Độ chiacutenh xaacutec Khả năng thiacutech nghi Mức độ đầy đủ Bề rộng Độ sacircu Hiệu lực Tổng quan Chiacutenh xaacutec Hiện thực Độ tin cậy Tiacutenh hữu dụng Mức độ

Chương 9 Học maacutey

1 Logic mờ vagrave ngocircn ngữ mờ(Fuzzy Logic and Linguistic Ambiguity)

Ngocircn ngữ tự nhiecircn gồm những khaacutei niệm mơ hồ vagrave khocircng chiacutenh xaacutectruyền tải ngữ nghĩa thocircng qua tiacutenh xấp xỉkhocircng rotilde ragraveng

Những xấp xỉ nagravey giuacutep con người coacute thể truyền tải hết được yacute nghĩa nhưng maacutey thigrave khocircng hiểu

Lagravem sao biểu diễn caacutec tri thức sử dụng caacutec khaacutei niệm khocircng rotilde ragraveng(mờ) hoặc khocircng chiacutenh xaacutec

2 Khaacutei niệm cơ bản của logic mờ tập mờ lagrave những tập hợp khocircng coacute một giới hạn rotilde Mỗi phần tử của noacute chỉ

chứa một mức độ hagravem liecircn thuộc của từng phần tử Vigrave vậy tập mờ khocircng giống như tập cổ điển Tập mờ coacute thể kết hợp với nhau qua những luật mờ magrave đặc trưng cho những hagravenh động trạng thaacutei vagrave thuộc tiacutenh của logic mờ được tận dụng khi thực hiện một bộ điều khiển mờ

Logic mờ dựa trecircn yacute tưởng mỗi phần tử thuộc vagraveo một tập hợp ở một mức độ nagraveo đấy

Locircgic mờ cho pheacutep độ liecircn thuộc (microA )coacute giaacute trị trong khoảng (01) Locircgic mờ coacute thể được coi lagrave mặt ứng dụng của lyacute thuyết tập mờ để xử lyacute caacutec

giaacute trị trong thế giới thực cho caacutec bagravei toaacuten phức tạp

3 So saacutenh tiacutenh đuacuteng đắn logic mờ vagrave xaacutec suất Xaacutec suất thigrave đề cập đến khả năng xảy ra một biến cố hay một điều gigrave đoacute Logic mờ đề cập đến cấp độ magrave đặc tiacutenh ở hiện tại

o viacute dụ1 người coacute chiều cao 6 feet thigrave coacute cấp độ lagrave 05 về chiều cao

4 Ưu điểm của logic mờ Caacutech tiếp cận rất tự nhiecircnkhocircng phức tạp Coacute thể mocirc higravenh hoacutea caacutec hagravem phi tuyến tugravey yacute phức tạp

Coacute thể tận dụng được kinh nghiệm từ những chuyecircn gia hagraveng đầu trong mọi lĩnh vực

Logic mờ được xacircy dựng dựa trecircn ngocircn ngữ tự nhiecircnNền tảng của logic mờ lagrave dựa trecircn cơ sở giao tiếp của con người

5 Nhược điểm của logic mờ Trong 1 hệ thống phức tạpsử dụng logic mờ coacute thể trở thagravenh trở ngại cho

việc xaacutec thực độ tin cậy của hệ thống Cơ chế lập luận mờ khocircng thể học hỏi từ những lỗi sai

6 Mạng noron nhacircn tạo(ANN) Mạng noron nhacircn tạo lagrave một mocirc phỏng xử lyacute thocircng tinđược nghiecircn cứu ra

từ hệ thống thần kinh của sinh vậtgiống như bộ natildeo để xử lyacute thocircng tin ANNs lagrave chương trigravenh dựa trecircn maacutey tiacutenh đơn giản coacute chức năng lagrave một mocirc

higravenh bagravei toaacuten khocircng gian dựa trecircn thử nghiệm vagrave baacuteo lỗi

7 Học từ kinh nghiệm Tiến trigravenh Một mẫu dữ liệu được biểu diễn như một mạng lưới noronANN ldquodự

đoaacutenrdquo 1 đầu radự đoaacuten được so saacutenh với giaacute trị thực tế hoặc giaacute trị chiacutenh xaacutecNếu đoaacuten được chiacutenh xaacutec thigrave khocircng coacute hagravenh động nagraveo được thực hiện

Nếu dự đoaacuten sai ANN kiểm tra lại vagrave xaacutec định lại thocircng số để điều chỉnh Một mẫu dữ liệu khaacutec được biểu diễn vagrave quaacute trigravenh nagravey được lặp lại

8 Nguyecircn tắc cơ bản của cocircng nghệ nơron Caacutec yếu tố xử lyacute cơ bản trong hệ thống thần kinh của con người lagrave tế bagraveo

thần kinhMạng lưới của tế bagraveo nagravey lagrave liecircn kết với nhau nhận được thocircng tin từ caacutec cảm biến trong mắt taihellip

Thocircng tin nhận được bởi tế bagraveo thần kinh hoặc lagrave sẽ kiacutech thiacutech noacute(sẽ được chuyển qua 1 thocircng điệp dọc theo mạng lưới) hoặc lagrave sẽ ngăn cản noacute(ngăn cản dograveng thocircng tin)

Độ nhạy coacute thể thay đổi qua thời gian hoặc sau khi coacute được kinh nghiệm

9 Cấu truacutec mạng Một ANN gồm 3 lớp cơ bản

Lớp đầu vagraveo nhận dữ liệu Lớp becircn trong hoặc lagrave lớp ẩn xử lyacute dữ liệu Lớp đầu ra chuyển tiếp kết quả cuối cugraveng của mạng

10Mạng nơ ron Thường coacute nhiều đầu vagraveo mỗi đầu vagraveo với mức ảnh hưởng vagrave tầm quan

trọng riecircng của noacute Một đầu vagraveo quan trọng coacute thể được sử dụng để khuếch đại đầu ra caacutec hagravem trạng thaacutei tổng hợp caacutec trọng số của caacutec yếu tố

đầuvagraveo khaacutec nhauvagraveo một giaacute trị duy nhất Caacutec hagravem chuyển giao xử lyacute caacutec giaacute trị trạng thaacutei vagrave tạo đầu ra

11Huấn luyện mạng nơ ron Trong mocirc higravenh coacute giaacutem saacutetANN được đến so saacutenh dự đoaacuten của chiacutenh

noacute với thocircng tin phản hồi coacute chứa caacutec kết quả mong muốn ANN sẽ phải tigravem caacutech thay đổi caacutec tham số becircn trong củamigravenh (caacutec trọng số vagrave caacutec ngưỡng) để tạo necircn một aacutenh xạ coacute khả năng aacutenh xạcaacutec đầu vagraveo thagravenh caacutec đầu ra mong muốn Sự thay đổi nagravey được tiến hagravenh nhờ việc so saacutenh giữa đầu ra thực sự vagrave đầu ra mong muốn

Trong mocirc higravenh khocircng coacute giaacutem saacutetANN nhận được dữ liệu vagraveo nhưng khocircng phải coacute bất kỳ thocircng tin phản hồi về kết quả mong muốn

Phần lớn caacutec ứng dụng nằm trong vugraveng của caacutec bagravei toaacuten ước lượng như mocirc higravenh hoacuteathống kecirc neacuten lọc phacircn cụm

12Lợi iacutech Liecircn kết với mạng noron Traacutenh caacutech lập trigravenh tường minh Giảm nhu cầu của chuyecircn gia ANNs thigrave thiacutech nghi với caacutec yếu tố đầu vagraveo thay đổi Khocircng cần thiết cho cơ sở tri thức tinh chế ANNs coacute tiacutenh động vagrave cải thiện với việc sử dụng Coacute khả năng xử lyacute dữ liệu khocircng chiacutenh xaacutec hoặc khocircng đầy đủ Cho pheacutep tổng quaacutet hoacutea từ thocircng tin cụ thể Cho pheacutep thu thập cảm giaacutec thocircng thường vagraveo miền giải quyết vấn đề

13Hạn chế của việc liecircn kết với mạng noron ANNs khocircng thể giải thiacutech được suy luận Bản chất hộp đen thường khiến cho vấn đề traacutech nhiệm vagrave độ tin cậy phaacutet

sinh lagrave khoacute khăn Lặp đi lặp lại quaacute trigravenh huấn luyện rất tốn thời gian Nguồn lực caacutec nhagrave phacircn tiacutech vagrave thiết kế coacute tay nghề cao vẫn lagrave đaacuteng lo

ngại Cocircng nghệ ANN thuacutec đẩy hạn chế của phần cứng hiện tại ANN yecircu cầu phải coacute sự tin tưởng ở đầu ra

14Giới thiệu về thuật toaacuten di truyền Cũng như mạng lưới thần kinh caacutec thuật toaacuten di truyền được dựa trecircn lyacute

thuyết sinh học Thuật toaacuten di truyền tigravem thấy nguồn gốc của chuacuteng trong caacutec lyacute thuyết

tiến hoacutea của chọn lọc tự nhiecircn vagrave thiacutech ứng với biến đổi khiacute hậu Kết quả thuật toaacuten di truyền lagrave từ giao phối 2 caacute thể trong quần thế để tạo

ra con caacutei đocirci khi tốt hơn so với bậc cha mẹ của chuacuteng 15Caacutec thagravenh phần cơ bản của thuật toaacuten di truyền

Toaacuten tử chọn lọc Caacutec caacute thể tốt được chọn lọc để đưa vagraveo thế hệ sau Sự chọn lọc nagravey căn cứ vagraveo độ thiacutech nghi với mocirci trường của mỗi caacute thể

Toaacuten tử lai gheacutep (crossover) Hai caacute thể cha vagrave mẹ trao đổi caacutec gen với nhau để tạo ra caacute thể con

Toaacuten tử đột biến (mutation) Một caacute thể thay đổi một số gen để biến đổi thagravenh một caacute thể mớiTất cả caacutec toaacuten tử trecircn khi thực hiện đều mang tiacutenh ngẫu nhiecircn

16Quaacute trigravenh cơ bản của một thuật toaacuten di truyền Khởi tạo

Đaacutenh giaacute quần thể

Lựa chọn NST thiacutech hợp nhất vagrave loại bỏ NST yếu nhất

Quy trigravenh giao nhau vagrave cải thiện quần thể

đột biến tiến trigravenh để khaacutem phaacute ra NST mới

17Ưu nhược điểm của việc kết hợp với thuật toaacuten di truyền Kiacutech thước quần thể lagrave 1 yếu tố quan trọng trong tốc độ của việc tigravem

kiếmnhưng noacute tương đối dễ dagraveng để dự đoaacuten tốc độ nagravey Giao nhau hoặc đột biến lagrave khocircng necircn đc sử dụng quaacute thường xuyecircn Luocircn coacute được iacutet nhất 1 giải phaacutep hợp lyacute Necircn coacute thể aacutep dụng chuacuteng cho caacutec vấn đề magrave chuacuteng ta khocircng coacute hướng

về caacutech giải quyết Sức mạnh của thuật toaacuten xuất phaacutet từ khaacutei niệm đơn giảnkhocircng phải từ

một thủ tục thuật toaacuten phức tạp 18Tương lai của học maacutey

Mạng lưới thần kinh nhacircn tạo vượt quaacute năng lực của con người trong caacutec trường hợp bị cocirc lập

Về mặt lyacute thuyếtmột maacutey tiacutenh coacute thể xử lyacute dũ liệu nhanh hơn hagraveng triệu lần so với 1 con người

May mắn thay cho chuacuteng tacon người tốt hơn nhiều khi magrave coacute được dữ liệumaacutey tiacutenh khocircng coacute 1 số thứ như lagrave 5 giaacutec quan

CHƯƠNG 10 KHO DỮ LIỆU

1 Kho dữ liệu Kho dữ liệu lagrave tuyển tập caacutec cơ sở dữ liệu tiacutech hợp hướng chủ đề được

thiết kế để trợ giuacutep cho một hệ hỗ trợ quyết định

Theo John Ladley Cocircng nghệ kho dữ liệu lagrave tập caacutec phương phaacutep kỹ thuật vagrave caacutec cocircng cụ coacute thể kết hợp hỗ trợ nhau để cung cấp thocircng tin cho người sử dụng trecircn cơ sở tiacutech hợp từ nhiều nguồn dữ liệu nhiều mocirci trường khaacutec nhau

Kho dữ liệu thường rất lớn tới hagraveng trăm GB hay thậm chiacute hagraveng Terabyte

2 Kho dữ liệu vận hagravenh (ODS) Một kho dữ liệu vận hagravenh Aacutep dụng kỹ thuật kho dữ liệu vagraveo caacutec hệ xử

lyacute giao taacutec lưu trữ dữ liệu cho một ứng dụng đặc thugrave Noacute đưa vagraveo kho dữ liệu một dograveng caacutec dữ liệu thocirc được thiết kế

3 So saacutenh

Kho dữ liệu vận hagravenh Kho dữ liệu

Dữ liệu theo chủ đề Dữ liệu theo chủ đề

Dữ liệu tiacutech hợp Dữ liệu tiacutech hợp

Dữ liệu thay đổi Dữ liệu khocircng thay đổi

Dữ liệu được cập nhật khi thay đổi

Dữ liệu giữ nguyecircn

Chỉ coacute dữ liệu hiện tạiDữliệu hiện tại vagrave dữ liệu lịch sử

Chu kỳ lagravem tươi dữ liệu ngắn Chu kỳ lagravem tươi dữ liệu dagravei

Chỉ coacute dữ liệu chi tiết Dữ liệu chi tiết vagrave dữ liệu tổng kết

Dugraveng cho caacutec quyết định ngắn hạn

Dugraveng cho hoạch định dagravei hạn

4 Kho dữ liệu cục bộ (Data Mart - DM)

Kho dữ liệu cục bộ lagrave CSDL coacute những đặc điểm giống với kho dữ liệu nhưng với quy mocirc nhỏ hơn vagrave lưu trữ dữ liệu về một lĩnh vực một chuyecircn ngagravenh

Data mart phụ thuộc Chứa những dữ liệu được lấy từ DW vagrave những dữ liệu nagravey sẽ được triacutech lọc vagrave tinh chế tiacutech hợp lại ở mức cao hơn để phục vụ một chủ đề nhất định của Datamart

Data mart độc lập Khocircng giống như Datamart phụ thuộc Data mart độc lập được xacircy dựng trước DW vagrave dữ liệu được trực tiếp lấy từ caacutec nguồn khaacutec nhau

5 Siecircu dữ liệu Metadata lagrave dữ liệu để mocirc tả dữ liệu Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột

một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi Metadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu

6 Mocirci trường kho dữ liệu Hệ thống của tổ chức vagrave kho cung cấp dữ liệu để xacircy dựng kho dữ liệu Trong quaacute trigravenh chuyển dữ liệu từ caacutec nguồn khaacutec nhau dữ liệu coacute thể

được lagravem sạch hoặc chuyển đổi vagrave vigrave thế DW được xem như lagrave một chuẩn cho việc lưu trữ

Đồng thời siecircu dữ liệu được ghi lại Cuối cugraveng DW hoặc siecircu thị coacute thể được sử dụng để tạo ra một kho dữ

liệu ldquocaacute nhacircnrdquo 7 Caacutec đặc điểm của kho dữ liệu

Đặc điểm Mocirc tả

Hướng chủ đề - DL tổ chức theo caacutech thức người dugraveng tham chiếu

Tiacutech hợp - Dữ liệu ldquosạchrdquo loại bỏ tiacutenh thiếu nhất quaacuten

Khocircng thay đổi - DL ldquochỉ đọcrdquo người dugraveng khocircng thay đổi được

Chuỗi thời gian - DL lagrave chuỗi thời gian khocircng phải lagrave trạng thaacutei hiện tại

Được tổng kết - DL vận hagravenhthao taacutec khi cần thiết

được kết hợp lại thagravenh dạng coacute thể dugraveng được cho quyết định

Kiacutech cỡ lớn hơn - Lưu giữ theo chuỗi thời gian tức lagrave giữ lại nhiều DL

Khocircng được chuẩn hoacutea - Coacute thể dư thừa DLSiecircu dữ liệu - Dữ liệu của dữ liệu được lưu trữNguồn dữ liệu - DL vận hagravenh (caacutec hệ sẵn coacute) cugraveng

với caacutec nguồn ngoagravei 8 Kho dữ liệu hướng chủ đề

Hướng chủ để coacute nghĩa lagrave kho dữ liệu được tổ chức xung quanh caacutec chủ đề chiacutenh như khaacutech hagraveng sản phẩm sản xuất Tập trung vagraveo việc mocirc higravenh hoacutea vagrave phacircn tiacutech dữ liệu cho caacutec nhagrave ra quyết định magrave khocircng tập trung vagraveo caacutec xử lyacute thocircng thường Cung cấp cho người dugraveng một khung nhigraven toagraven vẹn đơn giản vagrave đầy đủ về caacutec sự kiện quanh caacutec chủ đề

9 Dữ liệu trong DW được tiacutech hợp Dữ liệu trong kho dữ liệu được xacircy dựng bằng caacutech tổng hợp dữ liệu từ

nhiều nguồn khaacutec nhau vagrave caacutec nguồn coacute tổ chức khaacutec nhau Cơ sở dữ liệu caacutec file excel caacutec flat file hoặc caacutec raw file Khi đưa vagraveo kho dữ liệu caacutec dữ liệu được lagravem sạch vagrave tiacutech hợp dữ liệu nhằm đảm bảo tiacutenh nhất quaacuten của dữ liệu

10Kiến truacutec kho dữ liệu Tầng cơ sở dữ liệu hoạt động Tầng truy xuất thocircng tin Tầng truy xuất dữ liệu Tầng siecircu dữ liệu Tầng quản lyacute tiến trigravenh Tầng thocircng điệp của ứng dụng Tầng vật liacute của kho dữ liệu Tầng trigravenh diễn dữ liệu

11Higravenh trạng kho dữ liệu Kho dữ liệu ảo - người dugraveng cuối coacute thể truy cập trực tiếp đến kho dữ liệu

sử dụng caacutec cocircng cụ cho pheacutep ở tầng truy xuất dữ liệu Kho dữ liệu trung tacircm-1 cơ sở dữ liệu vật lyacute chứa tất cả dữ liệu cho một

vugraveng chuyecircn dụng nagraveo đoacute

Kho dữ liệu phacircn taacuten- Thagravenh phần được phacircn taacuten qua nhiều hệ cơ sở dữ liệu vật lyacute

12METADATA- Siecircu dữ liệu Định nghĩa Siecircu dữ liệu lagrave dữ liệu về dữ liệu Lagrave 1 lưu trữ dugraveng để

Miecircu tả kho dữ liệu tổng thể Nhận dạng kiểu kho dữ liệu Quản liacute quaacute trigravenh tiacutech hợp dữ liệu Quản liacute quaacute trigravenh cập nhật kho dữ liệu Quản liacute bảo mật

Lagrave chigravea khoacutea quyết định sự thagravenh cocircng của kho dữ liệu luocircn được thay đổi vagrave cập nhật theo sự phaacutet triển của kho dữ liệu

Dugraveng để quản liacute điều khiển kho dữ liệu Sự ra đời của kho dữ liệu như 1 cấu truacutec hỗ trợ ra quyết định siecircu dữ liệu

được xem như nguồn tagravei nguyecircn dữ liệu Siecircu dữ liệu lagrave trừu tượng Chuacuteng lagrave dữ liệu bậc cao cung cấp mocirc tả ngắn

gọn caacutec dữ liệu bậc thấp hơn 13Hoạt động của Siecircu dữ liệu

Siecircu dữ liệu rất cần thiết trong việc chuyển hoacutea thocircng tin trở thagravenh tri thức Lagrave chigravea khoacutea giuacutep chuacuteng ta xử lyacute được dữ liệu thocirc Viacute dụ một dograveng dữ liệu baacuten hagraveng 1023 K596 11121 agraveNoacute sẽ khocircng coacute nghĩa gigrave cho đến khi chuacuteng ta đưa vagraveo siecircu dữ liệu (thư

mục chứa dữ liệu) agrave cửa hagraveng 1023 sản phẩm K596 vagrave số tiền baacuten được lagrave 11121 đocirc la

14Sự cần thiết phải nhất quaacuten trong kho dữ liệu Kho dữ liệu được xacircy dựng cho lợi iacutech của những nhagrave phacircn tiacutech kinh

doanh caacutec nhagrave quản trị cho tất cả caacutec khu vực chức năng Trong cơ sở dữ liệu riecircng caacutec khu vực khaacutec nhau coacute thể định nghĩa vagrave lưu

trữ dữ liệu thocircng qua phiecircn bản của chiacutenh noacute Khi dữ liệu được lấy từ những vugraveng khaacutec nhau đoacute vagrave được đặt vagraveo kho dữ

liệu Việc chuyển đổi vagrave lagravem sạch caacutec tiến trigravenh sẽ đảm bảo noacute lagrave duy nhất được tiacutech hợp tại một mức của tổ chức

15Ragrave soaacutet lại dữ liệu ndash Thực thi siecircu dữ liệu

Bất kể cấu truacutec tự nhiecircn của 1 cacircu truy vấn thế nagraveo thigrave caacutec thagravenh phần của siecircu dữ liệu rất quan trọng đối với người ra quyết định

Bảng thuộc tiacutenh khoacutea được lưu trữ bởi kho dữ liệu Tập hợp dữ liệu được lấy từ đacircu Những chuyển đổi nagraveo được thực thi với việc lagravem sạch

16Siecircu dữ liệu lagrave gigrave Metadata - lagrave thocircng tin mocirc tả nội dung của cơ sở dữ liệu (CSDL) Metadata baacuteo cho người dugraveng biết thời gian cập nhật sau cugraveng của dữ liệu

định dạng vagrave mục điacutech sử dụng của noacute Những thocircng tin nagravey coacute thể hướng dẫn người dugraveng duyệt qua CSDL vagrave

giuacutep họ hiểu được yacute nghĩa vagrave ngữ cảnh của dữ liệu Trong CSDL metadata lagrave caacutec dạng biểu diễn khaacutec nhau của caacutec đối tượng

trong CSDL Trong CSDL quan hệ metadata lagrave caacutec định nghĩa của bảng cột CSDL

view vagrave nhiều đối tượng khaacutec Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột

một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi -gtMetadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu

Bảng chuyển đổi Ghi lại những chuyển đổi đatilde được thực hiện

Lịch sử thực thi Ghi lại những dữ liệu đatilde được

phacircn tiacutech

Higravenh thaacutei kết nốiGhi lại những dữ liệu được kết nối vagrave tần suất

17Aacutenh xạ thocircng thường của siecircu dữ liệu Bản ghi aacutenh xạ chuyển đổi bao gồm

Định danh của nguồn gốc Chuyển đổi thuộc tiacutenh Chuyển đổi thuộc tiacutenh vật lyacute Matilde hoacutea tham chiếu bảng chuyển đổi Đổi tecircn Đổi khoacutea Gaacuten giaacute trị cho thuộc tiacutenh mặc định Chọn logic cho caacutec nguồn nhiều giaacute trị Đổi thuật toaacuten

18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để

phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai

lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave

tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec

Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm

Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo

19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua

caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau

SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được

Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra

một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức

Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ

Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ

Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech

CHƯƠNG 11 KHAI PHAacute DỮ LIỆU

1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn

ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993

Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng

2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd

1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều

2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP

3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn

4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng

5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server

6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo

7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động

8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời

9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều

10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện

11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech

12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP

3 Xử lyacute phacircn tiacutech trực tuyến OLAP

MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave

dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu

ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave

thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu

HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave

ROLAP4 Khai phaacute dữ liệu

Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh

khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn

Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan

5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp

6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại

Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp

Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec

Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt

Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra

Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh

vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho

Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec

Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm

Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục

Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng

gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp

Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn

Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec

Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper

Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2

Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25

Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước

Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng

Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện

trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp

Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute

độ hỗ trợ ge ngưỡng minsup

độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan

Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn

Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết

Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu

MOLAP ROLAP HOLAP

Lưu trữ dữ liệu cơ sở

Khối Bảng quan hệ Bảng quan hệ

Lưu trữ thocircng tin tổng hợp

Khối Bảng quan hệ Khối

Hiệu suất thực hiện truy vấn

Nhanh nhất Chậm nhất Nhanh

Tiecircu thụ khocircng gian lưu trữ

Nhiều Thấp Trung bigravenh

Chi phiacute bảo trigrave Cao Thấp Trung bigravenh

Page 6: De cuong(1-11)

Hiệu lực của mỗi style riecircng biệt phụ thuộc vagraveo ngữ cảnh bagravei toaacuten nhận thức của người ra quyết định vagrave tập caacutec giaacute trị caacute nhacircn của bản thacircn họ

Độ phức tạp của caacutec điều đoacute liecircn kết lại với nhau trong việc higravenh thagravenh decision style

Caacutec kiểu ra quyết định Directive ndash kết hợp đogravei hỏi về cấu truacutec bagravei toaacuten cao với mức độ nhập nhằng thấp

Thocircng thường đacircy lagrave caacutec quyết định coacute bản chất kỹ thuật vagrave đogravei hỏi iacutet thocircng tin Analytical ndash Mức độ nhập nhằng lớn hơn vagrave đogravei hỏi nhiều thocircng tin hơn Conceptual ndash Mức độ nhập nhằng cao vagrave thường gần gũi với caacutech ra quyết định

của con người Behavioral ndash đogravei hỏi lượng dữ liệu nhỏ vagrave thể hiện caacutei nhigraven ngắn hạn Thường

xảy ra xung đột necircn phải dựa vagraveo sự đồng thuận Caacutec kiểu ra quyết định trong thiết kế hệ trợ giuacutep quyecirct định

Những cản trở lớn chiacutenh lagrave phản ứng của người ra quyết định trước aacutep lực vagrave phương phaacutep dugraveng để giải bagravei toaacuten

Viacute dụ đối với những người khocircng chịu được aacutep lực trong dạng directive thigrave giao diện cần cho pheacutep người ra quyết định kiểm soất được hệ thống với khocircng coacute quaacute nhiều dữ liệu đầu vagraveo

Đối với kiểu analytic DSS cần cho pheacutep truy cập tới nhiều nguồn dữ liệu magrave người ra quyết định sẽ phacircn tiacutech

13Khoacute khăn khi xacircy dựng DSS

- Thocircng tin mocirc higravenh cấu truacutec -gt iacutet thocircng tin

- Khả năng của con người (khả năng hiểu biết) chỉ xử lyacute được từ 5-gt9 quaacute trigravenh thocircng tin khaacutec nhau

- Khocircng chắc chắn ( mức độ hoagraven thagravenh vagrave tiacutenh chiacutenh xaacutec)

- Coacute nhiều lựa chọn vagrave đa mục tiecircu

Chương 3Quyết định trong tổ chức

14Tổ chức lagrave gigrave Tổ chức Lagrave 1 hệ thống thống nhất caacutec nguồn tagravei nguyecircnĐược cấu thagravenh bởi caacutec

hệ thống nhỏ hơn ragraveng buộc với nhau bởi caacutec mục tiecircu đề ra

Tổng thể 1 tổ chức sẽ mạnh mẽ hơn rất nhiều so với tất cả caacutec thagravenh phần của noacute cộng lại

Mối liecircn hệ của caacutec quyecirct định Mục điacutech chiacutenh của caacutec tổ chức lagrave đưa ra caacutec quyết định trong mocirci trường kinh doanh Caacutec Quyết định phải phugrave hợp với giới hạncaacutec chiacutenh saacutech caacutec thủ tục vagrave lĩnh vực hoạt động Noacute khocircng phụ thuộc vagraveo người đưa ra quyết định lagrave ai Đoacute coacute thể lagrave 1 caacute nhacircn1 nhoacutem hay thậm chiacute DSSs

Độ đo của quyết địnhNăm khiacutea cạnh ảnh hưởng tới Quyết định

Kết cấu nhoacutem (Group Structure) Vai trograve trong nhoacutem(Group Roles) Quaacute trigravenh lagravem việc(Group Processes) Taacutec phong(Group Style) Quy tăc nhoacutem(Group Norm)

Kết cấu nhoacutem Trong 1 nhoacutem chuẩn caacutec thagravenh viecircn coacute traacutech nhiệm vagrave thẩm quyền ra quyết định như nhau Vai trograve trong nhoacutemTrong nhoacutem caacutec thagravenh viecircn đều coacute vai trograve riecircng vagrave

lagrave 1 phần quan trong trong cả tiến trigravenh Quaacute trigravenh lagravem việcQuaacute trigravenh dugraveng người trong nhoacutem ảnh hưởng tới loại

quyết định gacircy hiệu quả vagrave ảnh hưởng tới cả tiến trigravenh Taacutec phong Coacute phải taacutec phong của người ra quyết định coacute ảnh hưởng tới

chất lượng quyết định cuối khocircng Quy tắc nhoacutemQuy tắc nhoacutem lagrave cực kỳ quan trọng trong việc xaacutec định

hagravenh vi caacutec thagravenh viecircn nhoacutem trong caacutec tigravenh huống xatilde hội Phacircn cấp quyết định trong tổ chức3 cấp

Chiến lược Ban latildenh đạo cấp cao hoặc nhagrave quản lyacute Caacutec quyết định mang tiacutenh lacircu dagravei nhất

Chiến thuật Quản lyacute tầm trung Thực thi caacutec quyết định chiến lược đề ra

Thực hiện

Caacute nhacircn chuyecircn ngagravenh Tự đưa ra caacutec quyết định từng ngagravey

15Năng lực của hệ HTQD

1 HHTQĐ cơ bản hỗ trợ caacutec nhagrave ra quyết định trong caacutec tigravenh huống nửa cấu truacutec vagrave phi cấu truacutec bằng caacutech kết hợp phaacuten xử của con người vagrave xử lyacute thocircng tin bằng maacutey tiacutenh Caacutec bagravei toaacuten như vậy khocircng thểkhocircng thuận tiện giải quyết được chỉ bằng caacutec cocircng cụ maacutey tiacutenh hoacutea hay caacutec phương phaacutep định lượng 2 Phugrave hợp cho caacutec cấp quản lyacute khaacutec nhau từ cao đến thấp 3 Phugrave hợp cho caacute nhacircn lẫn nhoacutem Caacutec bagravei toaacuten iacutet coacute tiacutenh cấu truacutec thường liecircn đới đến nhiều caacute nhacircn ở caacutec đơn vị chức năng hay mức tổ chức khaacutec nhau cũng như ở caacutec tổ chức khaacutec 4 Hỗ trợ cho caacutec quyết định tuần tự liecircn thuộc được đưa ra một lần vagravei lần hay lặp lại 5 Hỗ trợ cho caacutec giai đoạn của quaacute trigravenh ra quyết định tigravem hiểu thiết kế lựa chọn vagrave hiện thực 6 Phugrave hợp cho một số caacutec phong caacutech vagrave quaacute trigravenh ra quyết định 7 Coacute thể tiến hoacutea theo thời gian Người dugraveng coacute thể thecircm bỏ kết hợp thay đổi caacutec phần tử cơ bản của hệ thống 8 Dễ dugraveng vagrave thacircn thiện với người dugraveng 9 Nhằm vagraveo nacircng cao tiacutenh hiệu dụng của quyết định (chiacutenh xaacutec thời gian tiacutenh chất lượng) thay vigrave lagrave tiacutenh hiệu quả (giaacute phiacute của việc ra quyết định) 10 Người ra quyết định kiểm soaacutet toagraven bộ caacutec bước của quaacute trigravenh ra quyết định HHTQĐ chỉ trợ giuacutep khocircng thay thế người ra quyết định 11 Người dugraveng cuối cugraveng coacute thể tự kiến tạo vagrave sửa đổi caacutec hệ thống nhỏ vagrave đơn giản 12 Thường dugraveng mocirc higravenh để phacircn tiacutech caacutec tigravenh huống ra quyết định 13 Cung ứng caacutec truy đạt dữ liệu từ nhiều nguồn dạng thức vagrave kiểu khaacutec nhau 14 Coacute thể dugraveng như một cocircng cụ độc lập hay kết hợp với caacutec HHTQĐứng dụng khaacutec dugraveng đơn lẻ hay trecircn một mạng lưới maacutey tiacutenh (intranet extranet) bất kỳ với cocircng nghệ WEB

16Văn hoacutea tổ chứcVăn hoacutea của tổ chức lagrave tập hợp của rất nhiều thứ (lograveng tin biểu tượng đặc trưng regraven luyện) được phaacutet triển qua thời gian dagravei

Noacute gacircy ra ảnh hưởng mạnh mẽ cograven hơn cả những hoạt động của tổ chức đoacute 10 đặc điểm văn hoacutea của tổ chức

Điều khiển Hệ thống khen thưởng Sự đồng nhất Chịu đựng xung đột Mocirc higravenh giao tiếp Hỗ trợ quản lyacute Sự hogravea nhập Định hướng Chịu đựng rủi ro Caacute nhacircn khởi xướng

Mối quan hệ của văn hoacutea với hiệu năng lagravem việc1 tổ chức thagravenh cocircng phải coacute xu hướng hogravea hợp giữa văn hoacutea với mocirci trường trong vagrave ngoagravei tổ chức

Phugrave hợp trong nội bộ cho thấy một sự kết hợp giữa văn hoacutea của tổ chức với những cocircng nghệ của chiacutenh noacute

Phugrave hợp với becircn ngoagravei cho thấy một nền văn hoacutea phugrave hợp với chiến lược thị trường

Văn hoacutea vagrave sự thay đổi 1 tổ chức magrave khocircng biết thay đổi văn hoacutea sẽ khocircng thể giữ được vị triacute của migravenh trecircn thị trường Caacutec cocircng ty xuất sắc luocircn biết caacutech tiacutech cực tiếp cận khaacutech hagraveng động viecircn đầu tư

17Quyền lực vagrave chiacutenh trịQuyền lực vagrave chiacutenh trị luocircn đi liền với nhau

aQuyền lựclagrave khả năng ảnh hưởng đến việc phacircn phối caacutec nguồn lực trong tổ chứcGồm 5 yếu tố cơ bản

Phacircn quyền Uy quyền Quyền lực caacute nhacircn Sức ảnh hưởng Chiacutenh trị

Một vagravei thagravenh phần của quyền lực ra quyết định Quyết định việc nagraveo coacute sẵn

Quyết định sản phẩm nagraveo được sản xuất Quyết định đầu tư vagraveo đacircu Quyền đặt vagrave quản lyacute quản lyacute giaacute Thanh toaacuten vagrave khấu trừ tiền latildei

bChiacutenh trị Yếu tố cốt lotildei trong quaacute trigravenh higravenh thagravenh chiến lược ra quyết định Chiacutenh trị liecircn quan tới việc ra quyết định thocircng qua đagravem phaacutenảnh hưởngvagrave higravenh

thagravenh sự nhất triacute Trong nhiều trường hợp noacute coacute thể cho ta sự linh hoạt hơn

18Hệ trợ giuacutep quyết định trong tổ chức DSS của 1 tổ chức hỗ trợ cocircng nghệ tập trung vagraveo caacutec quyết định ảnh hưởng tới

rất nhiều người 1 hệ thống DSS hiện đại coacute thể chấp nhận nhiều quyết định vượt qua những giới

hạn phacircn cấp truyền thống aCaacutec hoạt động gần DSS

Giải quyết caacutec nhiệm vụ đặc biệt Thu thập thocircng tin Liecircn lạc qua caacutec chi nhaacutenh Động thaacutei chiacutenh trị

Phacircn loại tư duy chiến lược cho DSS Sắp xếp quyết địnhXếp hạng quyết định sao cho thứ tự đứng trước thigrave được

ưu tiecircn trước Chia sẻ thocircng tinCaacutec quyecirct định coacute thể độc lập nhưng người ra quyết định

phải chia sẻ caacutec thocircng tin liecircn quan Lựa chọn đagravem phaacutenVagravei quyết định coacute thể xaacutec lập thocircng qua đagravem phaacuten vagrave kết

quả được lagravem đồng thờiKhocircng phải cocircng nghệ tự noacute coacute thể đưa ra quyết định magrave noacute nằm ở trigravenh độ cocircng nghệ hỗ trợ caacutec chiến lược quyết định quyền lực vagrave chiacutenh trị cugraveng phối hợp với nhau

Chương 4Mocirc higravenh hoacutea quaacute trigravenh ra quyết định

(Cấu truacutec của hệ HTQD)19Vấn đề Mocirc higravenh

bull Lagrave phần tử chủ chốt trong hầu hết hệ hỗ trợ quyết định vagrave lagrave điều kiện cần trong hệ hỗ trợ quyết định dựa vagraveo mocirc higravenh (model-based DSS)

bull Coacute nhiều lớp mocirc higravenh kegravem theo lagrave caacutec kỹ thuật xử lyacute thao taacutec mocirc higravenh đặc thugrave tương ứng

bull Caacutec vấn đề chiacutenh nhận diện bagravei toaacuten vagrave phacircn tiacutech mocirci trường nhận diện biến số dự baacuteo đa mocirc higravenh caacutec phạm trugrave mocirc higravenh quản lyacute mocirc higravenh vagrave mocirc higravenh hoacutea dựa vagraveo kiến thức

bull Mocirc higravenh hoacutea lagrave taacutec vụ khocircng đơn giản Người xacircy dựng mocirc higravenh phải cacircn bằng giữa tiacutenh đơn giản của mocirc higravenh với caacutec yecircu cầu biểu diễn để mocirc higravenh coacute thể nắm bắt đủ thực tại cần thiết cho người ra quyết định

bull Mocirc phỏng lagrave kỹ thuật mocirc higravenh hoacutea thocircng dụng dugraveng để tigravem hiểu vấn đề tuy khocircng nhất thiết phải tigravem ra được caacutec giải phaacutep biến thể mở rộng quaacute trigravenh ra quyết định của tổ chức vagrave cho pheacutep tổ chức xem xeacutet taacutec độngảnh hưởng của caacutec chọn lựa tương lai

bull Mocirc phỏng tiết kiệm rất nhiều chi phiacute vagrave thời gian ndash rất dễ thay đổi mocirc higravenh hoạt động của một hệ thống vật lyacute bằng mocirc higravenh hoacutea maacutey tiacutenh

bull Mocirc higravenh coacute thể được phaacutet triển vagrave cagravei đặt bằng một số caacutec ngocircn ngữ lập trinh (thế hệ 3 4 ) vagrave hệ thống phần mềm khaacutec nhau

Mocirc higravenh tĩnh vagrave động

bull Mocirc higravenh tĩnh thể hiện bức tranh tại thời điểm của tigravenh huống Caacutec khiacutea cạnh của bagravei toaacuten được xeacutet một thời kỳ nhất định trong một khung thời gian nhất định (coacute thể ldquocuốnrdquo về tương lai) Caacutec tigravenh huống được giả sử lagrave sẽ lập lại với tập caacutec điều kiện đồng nhất

1048713 Giả định coacute được tiacutenh ổn định của dữ liệu 1048713 Mocirc phỏng quaacute trigravenh dạng tĩnh - lagravem việc trecircn caacutec trạng thaacutei ổn định để tigravem ra caacutec

thocircng số tối ưu ndash thường được dugraveng như cocircng cụ chủ yếu để thiết kế quaacute trigravenh 1048713 vd quyết định sản xuấtmua 1 sản phẩm baacuteo caacuteo thu nhập hagraveng quyacutenăm bull Mocirc higravenh động biểu diễn caacutec kịch bản thay đổi theo thời gian 1048713 Phụ thuộc thời gian caacutec trạng thaacutei thay đổi theo thời gian 1048713 Thường dugraveng để tạo sinh vagrave biểu diễn caacutec xu hướng vagrave khuocircn mẫu theo thời gian 1048713 Mocirc phỏng động thể hiện caacutec diễn tiến khi caacutec điều kiện theo thời gian khaacutec với caacutec

trạng thaacutei ổn định ndash thường được dugraveng để thiết kế việc kiểm soaacutet caacutec hệ thống 1048713 VD dự baacuteo lời-lỗ trong 5 năm với caacutec nhập lượng như giaacute phiacute số lượng thay đổi

theo từng năm

Mocirc higravenh chắc chắn tương đối dễ phaacutet triển giải quyết vagrave coacute thể sinh ra caacutec giải phaacutep tối ưu 1048713 Caacutec bagravei toaacuten coacute một số lớnvocirc hạn caacutec giải phaacutep khả thi đặc biệt quan trọng 1048713 Caacutec mocirc higravenh tagravei chaacutenh được xacircy dựng trong điều kiện chắc chắn

Mocirc higravenh bất địnhbằng caacutech thu thập thecircm thocircng tin cố gắng đưa bagravei toaacuten trở về dạng chắc chắn hay dạng

rủi ro Mocirc higravenh rủi ro caacutec quyết định kinh doanh được đưa ra dưới caacutec rủi ro giả định

1048713 Đocirci khi biết được xaacutec suất của caacutec sự kiện xảy ra trong tương lai 1048713 Caacutec trường hợp khaacutec (bất định) ước lượng caacutec rủi ro vagrave giả sử caacutec tigravenh huống rủi ro

xảy ra 20Mocirc higravenh hoacutea

MOcirc HIgraveNH HOacuteA BẰNG BẢNG TIacuteNH bull Bảng tiacutenh phần mềm mạnh linh hoạt vagrave dễ dugraveng cho pheacutep tạo sinh caacutec ứng dụng trong kinh doanh kỹ thuật toaacuten vagrave khoa học với tập caacutec hagravem mạnh về tagravei chaacutenh thống kecirc toaacuten bull Kegravem theo lagrave caacutec thagravenh phần cộng thecircm (add-ins) giuacutep xacircy dựng vagrave giải caacutec lớp mocirc higravenh đặc thugrave bull Lagrave cocircng cụ mocirc higravenh hoacutea thocircng dụng nhất của người dugraveng cuối cugraveng bull Coacute caacutec chức năng về phacircn tiacutech ldquowhat-ifrdquo dograve tigravem mục tiecircu quản lyacute dữ liệu vagrave lập trigravenh (dạng macro) bull Coacute khả năng đọc ghi caacutec cấu truacutec tập tin thocircng dụng để giao tiếp được với caacutec CSDL vagrave cocircng cụ khaacutec bull Coacute thể xacircy dựng mocirc higravenh tĩnh vagrave động bull Dugraveng trecircn maacutey tiacutenh caacute nhacircn vagrave maacutey tiacutenh lớn

bull Cơ sở để xacircy dựng caacutec bảng tiacutenh đa chiều vagrave caacutec cocircng cụ xử lyacute phacircn tiacutech trực tuyến (OLAP) MOcirc HIgraveNH HOacuteA BẰNG PHAcircN TIacuteCH QUYẾT ĐỊNH bull Tiếp cận mocirc higravenh hoacutea caacutec tigravenh huống quyết định coacute một số hữu hạnkhocircng quaacute nhiều caacutec phương aacuten ndash mỗi phương aacuten được trigravenh ra dưới dạng bảng hay đồ thị - caacutec kết quả tương ứng (dự baacuteo được kegravem xaacutec suất) theo mục tiecircu bagravei toaacuten ndash từ đoacute chọn phương aacuten tốt nhất bull Đơn mục tiecircu bảng quyết định hay cacircy quyết định bull Đa mục tiecircu AHP (analytic hierarchy process) khaacutec

MOcirc HIgraveNH HOacuteA BẰNG QUY HOẠCH TOAacuteN

bull Quy hoạch toaacuten học (mathematical programming) lagrave họ caacutec cocircng cụ giải quyết caacutec bagravei toaacuten quản lyacute theo đoacute người ra quyết định phải cấp phaacutet caacutec tagravei nguyecircn khan hiếm cho caacutec hoạt động cạnh tranh nhau (caacutec phương aacuten) nhằm tối ưu hoacutea mục tiecircu coacute khả năng đo lường được bull Caacutec mocirc higravenh quy hoạch tuyến tiacutenh (linear programming) thocircng dụng nhất trong quy hoạch toaacuten coacute nhiều ứng dụng trong thực tế được dugraveng nhiều trong caacutec hệ hỗ trợ quyết định bull Bagravei toaacuten quy hoạch tuyến tiacutenh 1048713 Caacutec biến quyết định (cần tigravem giaacute trị) 1048713 Hagravem mục tiecircu (hagravem toaacuten học dạng tuyến tiacutenh xaacutec định quan hệ giữa biến quyết định vagrave mục tiecircu đo lường mức độ đạt đạt mục tiecircu vagrave cần được tối ưu hoacutea) 1048713 Caacutec hệ số của hagravem mục tiecircu (cho biết mức đoacuteng goacutep vagraveo mục tiecircu của 1 đơn vị biến quyết định) 1048713 Ragraveng buộc (biểu thức tuyến tiacutenh cho biết giới hạn tagravei nguyecircn vagravehay caacutec quan hệ giữa caacutec biến số) 1048713 Dung lượng (mocirc tả cận trecircn vagrave dưới của caacutec biến vagrave ragraveng buộc) 1048713 Hệ số (cocircng nghệ) vagraveo-ra (cho biết mức độ sử dụng tagravei nguyecircn của biến quyết định) bull Đặc điểm của bagravei toaacuten quy hoạch tuyến tiacutenh 1048713 Tagravei nguyecircn kinh tế của bagravei toaacuten lagrave coacute hạn vagrave sẵn sagraveng 1048713 Coacute nhiều caacutech (gt2 caacutech) sử dụng tagravei nguyecircn được gọi lagrave giải phaacutep hay chương trigravenh 1048713 Mỗi hoạt động dugraveng tagravei nguyecircn đều sinh ra kết quả dưới dạng mục tiecircu đatilde phaacutet biểu trước 1048713 Việc cấp phaacutet nằm trong caacutec ragraveng buộc cho trước bull Giả định của bagravei toaacuten quy hoạch tuyến tiacutenh 1048713 Caacutec kết quả của caacutec cấp phaacutet coacute thể đem so saacutenh với nhau coacute thể đo lường bằng một đơn vị chung

1048713 Caacutec cấp phaacutet độc lập với nhau về mặt kết quả 1048713 Kết quả cuối cugraveng lagrave tổng của caacutec kết quả từ caacutec hoạt động riecircng rẽ khaacutec nhau 1048713 Dữ liệu coacute tiacutenh chắc chắn 1048713 Tagravei nguyecircn được dugraveng một caacutech kinh tế nhất 1048713 Thường coacute một số lớn caacutec giải phaacutep với kết quả khaacutec nhau 1048713 Trong số caacutec giải phaacutep coacute thể coacute 1 giải phaacutep tốt nhất ndash mức độ đạt được mục tiecircu cao nhất ndash gọi lagrave giải phaacutep tối ưu được tigravem ra bằng một giải thuật đặc biệt MOcirc HIgraveNH HOacuteA BẰNG HEURISTIC bull Việc tigravem giải phaacutep tối ưu của một số bagravei toaacuten quyết định phức tạp coacute thể tốn nhiều thời gian chi phiacute hay khocircng thể tigravem ra được Cograven nếu dugraveng tiếp cận mocirc phỏng cũng coacute thể keacuteo dagravei phức tạp khocircng thiacutech hợp hay thậm chiacute khocircng chiacutenh xaacutec

bull Lagrave một tiếp cận giuacutep tigravem ra caacutec giải phaacutep khả thithỏa matildenđủ tốt cho caacutec bagravei toaacuten phức tạp Coacute thể coacute giải phaacutep đủ tốt (90-999 giaacute trị của lời giải tối ưu) nhanh choacuteng vagrave đỡ tốn keacutem hơn bằng caacutech dugraveng heuristics bull Quaacute trigravenh heuristic lagrave datildey caacutec bước xacircy dựng caacutec quy luật giải quyết vấn đề thocircng qua việc tigravem kiếm caacutec con đường hứa hẹn nhất dẫn đến lời giải tigravem kiếm caacutech thức thu thập vagrave phacircn giải thocircng tin theo quaacute trigravenh giải vagrave phaacutet triền caacutec phương phaacutep dẫn đến một giải thuật tiacutenh toaacuten hay một lời giải tổng quaacutet đatilde coacute bull Aacutep dụng chủ yếu cho bagravei toaacuten cấu truacutec yếu cũng dugraveng để tigravem ra giải phaacutep chấp nhận được cho bagravei toaacuten cấu truacutec chặt bull Khocircng đủ tổng quaacutet như caacutec giải thuật thường chỉ dugraveng cho tigravenh huống đặc thugrave đang xeacutet bull Coacute thể dẫn đến một giải phaacutep dở - caacutec thủ tục từng bước giải quyết vấn đề khocircng đảm bảo tigravem ra giải phaacutep tối ưu bull Heuristic coacute thể lagrave định lượng vigrave vậy coacute thể đoacuteng vai trograve quan trọng trong cơ sở mocirc higravenh của hệ hỗ trợ quyết định bull Heuristic coacute thể lagrave định tiacutenh vigrave vậy coacute thể đoacuteng vai trograve quan trọng trong cung ứng kiến thức cho hệ chuyecircn gia bull Quaacute trigravenh heuristic liecircn quan đến tigravem kiếm học tập ước lượng phacircn xử vagrave lặp lại caacutec hoạt động nagravey dọc theo tiến trigravenh bull Kiến thức thu được dugrave thagravenh cocircng hay thất bại trong quaacute trigravenh đều được phản hồi vagrave sửa đổi chiacutenh quaacute trigravenh nhờ đoacute coacute thể định nghĩa lại mục tiecircu hay bagravei toaacuten 1048713 Giải thuật di truyền bắt đầu bằng tập caacutec giải phaacutep được sinh ngẫu nhiecircn taacutei kết hợp caacutec cặp giải phaacutep một caacutech ngẫu nhiecircn bull Tigravenh huống necircn dugraveng heuristics 1048713 Dữ liệu đầu vagraveo khocircng chiacutenh xaacutec hay coacute giới hạn 1048713 Thực tế quaacute phức tạp đến nỗi khocircng dugraveng được caacutec mocirc higravenh tối ưu 1048713 Chưa coacute được giải thuật chiacutenh xaacutec vagrave đủ tin cậy 1048713 Bagravei toaacuten phức tạp necircn sẽ khocircng kinh tế nếu dugraveng tối ưu hay mocirc phỏng hoặc tốn quaacute nhiều thời gian tiacutenh toaacuten 1048713 Coacute thể cải thiện tiacutenh hiệu quả của quaacute trigravenh tối ưu (tức coacute thể sinh ra caacutec giải phaacutep ban đầu tương đối tốt) 1048713 Liecircn quan đến xử lyacute kyacute hiệu chứ khocircng phải xử lyacute kyacute số (như hệ chuyecircn gia) 1048713 Cần coacute quyết định nhanh vagrave caacutec xử lyacute dựa vagraveo maacutey tiacutenh đều khocircng khả thi (một số heuristic khocircng cần đến maacutey tiacutenh) bull Thuận lợi 1048713 Dễ hiểu dễ giải thiacutech vagrave dễ cagravei đặt 1048713 Nacircng cao tiacutenh saacuteng tạo vagrave năng lực heuristic cho caacutec vấn đề khaacutec 1048713 Tiết kiệm thời gian xaacutec lập vấn đề 1048713 Tiết kiệm yecircu cầu về bộ chứa vagrave xử lyacute maacutey tiacutenh

1048713 Tiết kiệm thời gian tiacutenh toaacuten vagrave do vậy tiết kiệm thời gian thực trong ra quyết định Một số vấn đề phức tạp đến nỗi chỉ coacute thể giải được bằng heuristics 1048713 Thường sinh ra nhiều giải phaacutep chấp nhận được 1048713 Thường coacute thể phaacutet biểu lyacute thuyết hay đo lường thực nghiệm về chất lượng của giải phaacutep (tức giaacute trị mục tiecircu của giải phaacutep gần với giaacute trị tồi ưu đến mức nagraveo dugrave giaacute trị tối ưu chưa biết được) 1048713 Coacute thể kết hợp tiacutenh thocircng minh vagraveo để hướng dẫn pheacutep tigravem kiếm (tigravem kiếm tabu) Năng lực thocircng minh đoacute coacute thể lagrave đặc thugrave theo bagravei toaacuten hoặc dựa trecircn yacute kiến chuyecircn gia được cấy trong hệ chuyecircn gia hoặc cơ chế tigravem kiếm 1048713 Coacute thể dugraveng heuristic hiệu quả vagraveo caacutec mocirc higravenh coacute thể giải bằng quy hoạch toaacuten học Đocirci khi heuristic lagrave phương phaacutep được ưa thiacutech hơn khi khaacutec giải phaacutep heuristics được dugraveng như giải phaacutep ban đầu cho caacutec phương phaacutep quy hoạch toaacuten học bull Hạn chế 1048713 Khocircng đảm bảo coacute được giải phaacutep tối ưu 1048713 Caacutec quy luật coacute rất nhiều ngoại lệ 1048713 Caacutec lựa chọn quyết định tuần tự coacute thể khocircng tiecircn đoaacuten được caacutec kết cục tương lai của mỗi chọn lựa 1048713 Sự liecircn thuộc giữa caacutec phần trong hệ thống đocirci khi coacute thể gacircy ra caacutec ảnh hưởng lớn lao lecircn toagraven hệ thống bull Phacircn loại caacutec giải thuật heuristic 1048713 Heuristic xacircy dựng xacircy dựng giải phaacutep khả thi bằng caacutech cộng thecircm từng thagravenh phần một VD bagravei toaacuten người baacuten hagraveng ndash luocircn gheacute thagravenh phố chưa viếng thăm kế tiếp gần nhất

1048713 Heuristic cải tiến bắt đầu bằng một giải phaacutep khả thi vagrave cố gắng cải tiến liecircn tục trecircn đoacute VD trecircn thử hoaacuten đổi 2 thagravenh phố 1048713 Quy hoạch toaacuten aacutep dụng vagraveo caacutec mocirc higravenh chứa iacutet ragraveng buộc nhằm coacute được thocircng tin về thỏa hiệp tốt nhất với mocirc higravenh nguyecircn gốc Thường được dugraveng trong tối ưu hoacutea nguyecircn (integer optimization) 1048713 Chia giai đoạn giải quyết một vấn đề theo từng giai đoạn VD ở PampG trecircn đacircy bagravei toaacuten phacircn phối được giải quyết trước sau đoacute dugraveng giải quyết bagravei toaacuten chiến lược sản phẩm 1048713 Phacircn ratilde chia bagravei toaacuten thagravenh caacutec phần nhỏ hơn coacute thể giải quyết được sau đoacute kết hợp caacutec giải phaacutep đoacute lại VD chia latildenh thổ baacuten hagraveng thagravenh 4 vugraveng khaacutec nhau giải quyết cho từng vugraveng sau đoacute kết nối caacutec giải phaacutep

21Mocirc phỏngbull Giả định caacutec đặc điểm của thực tạibull Lagrave kỹ thuật tiến triển caacutec thực nghiệm (như phacircn tiacutech ldquowhat-ifrdquo) - bằng maacutey tiacutenh -trecircn một mocirc higravenh của hệ thocircng tin quản lyacute

bull Khocircng thực sự lagrave một mocirc higravenh vigrave khocircng biểu diễn thực tại magrave lagrave cố gắng bắtchước thực tạibull Một trong những phương phaacutep thocircng dụng nhất trong HHTQĐbull HHTQĐ lagravem việc với caacutec bagravei toaacuten phi cấu truacutec vagrave cấu truacutec yếu tigravenh huống thực tếphức tạp ndash khocircng dễ biểu diễn bằng mocirc higravenh tối ưu hay caacutec dạng mocirc higravenh khaacutecnhưng lại thường coacute thể xử lyacute được bằng mocirc phỏngbull Đặc điểm1048713 Iacutet đưa ra caacutec đơn giản hoacutea về thực tại hơn caacutec mocirc higravenh khaacutec1048713 Do triển khai caacutec thực nghiệm necircn noacute coacute thể kiểm thử caacutec giaacute trị cụ thể của caacutecbiến quyết địnhbiến khocircng kiểm soaacutet được của mocirc higravenh vagrave xem xeacutet ảnh hưởnglecircn caacutec biến kết quả1048713 Phương phaacutep coacute tiacutenh mocirc tả (như vậy khaacutec với phương phaacutep danh định)1048713 Khocircng tự động tigravem kiếm giải phaacutep tối ưu ndash noacute mocirc tảtiecircn đoaacuten caacutec đặc tiacutenh của hệthống đatilde cho dưới caacutec điều kiện khaacutec nhau từ đoacute coacute thể chọn ra phương aacuten tốtnhất1048713 Quaacute trigravenh mocirc phỏng thường lặp lại một thực nghiệm nhiều lần để coacute được ướclượng về hiệu ứng tổng quaacutet của một số hagravenh động nhất định1048713 Mocirc phỏng maacutey tiacutenh thiacutech hợp cho hầu hết caacutec tigravenh huống mặc dugrave cũng coacute một sốmocirc phỏng thủ cocircng thagravenh cocircng1048713 Thường chỉ được dugraveng khi bagravei toaacuten quaacute phức tạp khocircng thể xem xeacutet bằng caacutec kỹthuật tối ưu dạng số Tiacutenh phức tạp theo nghĩa bagravei toaacuten khocircng thể cocircng thức hoacuteacho tối ưu (do khocircng thotildea caacutec giả định) hoặc cocircng thức quaacute lớn quaacute nhiều tươngtaacutec giữa caacutec biến hoặc về bản chất bagravei toaacuten lagrave bất định hay rủi roPhương phaacutep mocirc phỏng thiết lập mocirc higravenh của hệ thống thực vagrave tiến hagravenh caacutec thựcnghiệm lặp lại trecircn mocirc higravenh

bull Thuận lợi1048713 Lyacute thuyết tương đối trực tiếp hiệu ứng dagravei hạn của nhiều chiacutenh saacutech -gt neacuten thờigian lớn1048713 Do tiacutenh chất mocirc tả (khaacutec với danh định)1048713 Coacute thể thấy được nhanh choacuteng coacute thể đặt ra caacutec cacircu hỏi ldquowhat-ifrdquo coacute thể dugravengtiếp cận thử-vagrave-sai vagraveo giải quyết vấn đề một caacutech nhanh choacuteng rẻ chiacutenh xaacutec iacutetrủi ro hơn1048713 Thử nghiệm được biến quyết định phần nagraveo của mocirci trường thực sự quan trọngvới caacutec phương aacuten khaacutec nhau1048713 Yecircu cầu kiến thức riecircng biệt về bagravei toaacuten vigrave thế buộc người xacircy dựng mocirc higravenh phảilagravem việc thường xuyecircn với nhagrave quản lyacute ndash đối tượng mong muốn của HHTQĐ để

từ đoacute bản chất bagravei toaacuten vagrave caacutec quyết định được hiểu tốt hơn1048713 Mocirc higravenh được xacircy dựng từ viễn cảnhcaacutech nhigraven của nhagrave quản lyacute1048713 Mocirc higravenh chỉ cho một bagravei toaacuten riecircng biệt thường khocircng thể dugraveng giải caacutec bagravei toaacutenkhaacutec Như vậy mỗi thagravenh phần của mocirc higravenh ứng với một phần của hệ thống thựcdo đoacute sẽ khocircng yecircu cầu nhagrave quản lyacute phải tổng quaacutet hoacutea caacutec hiểu biết của migravenh1048713 Phổ bagravei toaacuten giải được rất rộng tồn kho nhacircn sự hoạch định chiến lược 1048713 Coacute thể chứa caacutec phức tạp thực sự của bagravei toaacuten khocircng cần caacutec đơn giản hoacutea (TDdugraveng caacutec phacircn phối xaacutec suất thực thay vigrave phacircn phối lyacute thuyết xấp xỉ)1048713 Coacute thể tự động sinh ra nhiều đo lường hiệu năng quan trọng1048713 Thường lagrave phương phaacutep duy nhất của HHTQĐ coacute thể xử lyacute caacutec bagravei toaacuten tương đốiphi cấu truacutec1048713 Coacute một số caacutec goacutei phần mềm mocirc phỏng (Monte Carlo) tương đối dễ dugravengbull Điểm yếu1048713 Tuy thường tigravem được caacutec phương aacuten đủ tốt nhưng khocircng đảm bảo lời giải tối ưu1048713 Quaacute trigravenh xacircy dựng mocirc higravenh thường dagravei vagrave tốn keacutem1048713 Giải phaacutep vagrave suy diễn từ nghiecircn cứu mocirc phỏng thường khocircng thể chuyển sang bagraveitoaacuten khaacutec vigrave mocirc higravenh kết hợp caacutec yếu tố đặc thugrave1048713 Đocirci khi do mocirc higravenh quaacute dễ giải thiacutech cho nhagrave quản lyacute necircn caacutec phương phaacutep phacircntiacutech thường xem nhẹ1048713 Phần mềm mocirc phỏng đocirci khi yecircu cầu caacutec kỹ năng đặc biệt do độ phức tạp củaphương phaacutep giải higravenh thứcbull Caacutec loại mocirc phỏng1048713 Mocirc phỏng xaacutec suất một hay nhiều biến độc lập mang tiacutenh xaacutec suất với 2 loạiphacircn phối ndash thường dugraveng kỹ thuật Monte Carlo1048713 Phacircn phối rời rạc tigravenh huống coacute một số giới hạn caacutec biến cố (biến) với hữu hạncaacutec giaacute trị cho mỗi biến cố (biến)1048713 Phacircn phối liecircn tục tigravenh huống coacute số lượng khocircng giới hạn caacutec biến cố tuacircn theocaacutec hagravem mật độ xaacutec suất như phacircn phối chuẩn1048713 Mocirc phỏng độc lậpphụ thuộc theo thời gian1048713 Độc lập khocircng cần thiết phải biết chiacutenh xaacutec thời điểm xảy ra biến cố (nhu cầutiecircu thụ lượng sản phẩm trong ngagravey khocircng biết chiacutenh xaacutec thời điểm tiecircu thụ)1048713 Phụ thuộc cần biết chiacutenh xaacutec thời điểm xảy ra sự kiện (bagravei toaacuten hagraveng đợi)1048713 Mocirc phỏng tương taacutec trực quan1048713 Mocirc phỏng hướng đối tượng dugraveng tiếp cận hướng đối tượng để xacircy dựng mocirc higravenhmocirc phỏng Chuacute yacute ngocircn ngữ mocirc higravenh hoacutea nhất thể UML (unified modelinglanguage) kể cả khi mocirc phỏng caacutec hệ thời gian thựcMOcirc HIgraveNH HOacuteA ĐA CHIỀU ndash XỬ LYacute PHAcircN TIacuteCH TRỰC TUYẾNbull Người ra quyết định thường phải xem xeacutet nhiều chiều của dữ liệu (TD caacutec chiềucủa dữ liệu baacuten hagraveng lagrave sản phẩm vugraveng thời gian người baacuten ) dữ liệu cần đượcphacircn tiacutech trực tiếp bằng caacutec cocircng cụ chuẩn hay phacircn tiacutech tự động bằng caacutec

phương phaacutep khai mỏ dữ liệu (data mining)bull Hầu hết caacutec hệ thống phacircn tiacutech đa chiều được nhuacuteng trong caacutec hệ xử lyacute phacircn tiacutechtrực tuyến (HXLPTTT ndash online analytic processing - OLAP)bull Mục tiecircu của XLPTTT nắm bắt cấu truacutec của dữ liệu thực để hỗ trợ ra quyết địnhbull Trong HHTQĐ coacute sự gắn nối tự nhiecircn giữa mocirc higravenh hoacutea dữ liệu mocirc higravenh hoacutea kyacutehiệu vagrave caacutec khiacutea cạnh của phacircn tiacutech ldquowhat-ifrdquobull Caacutec baacuteo caacuteo của HXLPTTT đều coacute tiacutenh tương taacutec dễ khai thaacutec sử dụng đặc biệtphugrave hợp cho caacutec baacuteo caacuteo về chỉ số hiệu năng chủ yếu (key performance indicators- KPI) baacuteo caacuteo về đo lường hiệu năng kinh doanh bull Thế hệ hiện tại của HXLPTTT vagrave hệ khai mỏ dữ liệu (data mining) tiacutech hợp caacutecđặc tiacutenh của hệ thocircng tin latildenh đạo (executive information system ndashEIS- nhiềucaacutech nhigraven dữ liệu chi tiết hoacutea theo nhu cầu) vagrave caacutec hệ đồ họa khaacutec ndash thường coacutegiao diện người dugraveng dạng kiểu WEBbull Caacutec hệ thống như trecircn cograven được gọi lagrave caacutec cocircng cụ triacute tuệ kinh doanh (businessintelligence - BI) vigrave coacute caacutec đặc trưng về mocirc higravenh hoacutea vagrave tối ưu hoacutea nhưng lạitrong suốt đối với ngươigrave dugravengbull Hiện caacutec cocircng cụ được đưa ra bởi caacutec nhagrave cung cấp về CSDL về hoạch định tagraveinguyecircn tổ chức (ERP) về nhagrave kho dữ liệu (data warehouse) về HXLPTTT MOcirc HIgraveNH HOacuteA VAgrave MOcirc PHỎNG TƯƠNG TAacuteC TRỰC QUANbull Iacutech lợi Người ra quyết định tham gia vagraveo quaacute trigravenh phaacutet triển mocirc higravenh vagrave thựcnghiệm mocirc phỏng vigrave vậy sẽ tin tưởng khi sử dụng mocirc higravenhbull Mocirc higravenh hoacutea tương taacutec trực quan (visual interactive modeling - VIM) dugraveng caacutecbiểu diễn đồ họa maacutey tiacutenh để trigravenh bagravey caacutec ảnh hưởng của caacutec quyết định quản lyacutekhaacutec nhau ở một thời điểm (tĩnh) hay tiến triển theo thời gian (động với kỹ thuậthoạt higravenh)bull Mocirc phỏng tương taacutec trực quan (visual interactive simulation - VIS) cho pheacutepngười dugraveng theo dotildei tiến trigravenh xacircy dựng vagrave sử dụng khai thaacutec mocirc higravenh mocirc phỏngdưới dạng hoạt higravenhbull Mocirc higravenh hoacutea tương taacutec trực quan coacute thể kết hợp với tiếp cận triacute tuệ nhacircn tạo đểđưa ra caacutec khả năng mới thay đổi từ xacircy dựng hệ thống dạng đồ họa đến tigravem hiểuvề động học của hệ thốngbull Cần đến caacutec hệ thống maacutey tiacutenh xử lyacute song song tốc độ cao để xacircy dựng caacutec mocircphỏng - phức tạp quy mocirc lớn dạng hoạt higravenh - mang tiacutenh khả thi ở thời gian thực

22Caacutec dạng hệ thống hỗ trợ ra quyết địnhHệ hỗ trợ quyết định nhoacutemRa quyết định nhoacutem giao tiếp vagrave cộng taacutec- Caacutec đặc điểm của cocircng việc nhoacutem+ Một nhoacutem thực hiện một nhiệm vụ thỉnh thoảng ra quyết định thỉnh thoảngkhocircng ra quyết định+ Caacutec thagravenh viecircn trong nhoacutem coacute thể ở những nơi khaacutec nhau

+ Caacutec thagravenh viecircn trong nhoacutem coacute thể lagravem việc ở những thời gian khaacutec nhau+ Caacutec thagravenh viecircn trong nhoacutem coacute thể lagravem việc cugraveng nhau hoặc ở caacutec tổ chức khaacutecnhau+ Nhoacutem coacute thể vĩnh viễn hoặc tạm thời+ Nhoacutem coacute thể ở bất kỳ mức quản lyacute nagraveo hoặc mức thời gian nagraveo+ Coacute sự điều phối (quaacute trigravenh vagrave nhiệm vụ đạt được) hoặc macircu thuẩn trongnhoacutem+ Coacute sự đạt được hoặcvagrave mất maacutet năng suất trong tổ chức+ Nhiệm vụ phải hoagraven thagravenh rất nhanh+ Khocircng thể hoặc quaacute đắt cho tất cả caacutec thagravenh viecircn trong nhoacutem cugraveng hợp ở mộtnơi+ Một số dữ liệu thocircng tin hoặc kiến thức cần thiết nằm ở nhiều nơi một sốkhaacutec ở ngoagravei tổ chức+ Chuyecircn mocircn của caacutec thagravenh viecircn khocircng coacute trong nhoacutem lagrave cần thiết- Caacutec hoạt động vagrave caacutec quaacute trigravenh miecircu tả caacutec cuộc họp+ Cuộc họp lagrave hoạt động chung liecircn quan bởi một nhoacutem người coacute địa vị bằngnhau hoặc gần bằng nhau+ Kết quả của cuộc họp phụ thuộc một phần vagraveo kiến thức yacute kiến caacutec đaacutenh giaacutecủa caacutec thagravenh viecircn+ Kết quả của cuộc họp cũng phụ thuộc vagraveo sự kết hợp của nhoacutem vagrave phụ thuộcvagraveo quaacute trigravenh ra quyết định được sử dụng bởi nhoacutem đoacute+ Giải quyết caacutec yacute kiến khaacutec nhau bởi người coacute quyền hạn hoặc thương lượnghoặc phacircn xửHỗ trợ giao tiếp- Giao tiếp lagrave thagravenh phần quan trọng cho hỗ trợ quyết định Khocircng coacute giao tiếp thigravekhocircng coacute cộng taacutec Những người ra quyết định caacute nhacircn phải giao tiếp với caacutecđồng nghiệp chuyecircn gia cơ quan chiacutenh phủ khaacutech hagraveng đối taacutec kinh doanh hellipHọ cũng cần dữ liệu vagrave thocircng tin (vagrave kiến thức) từ nhiều nơi trecircn thế giới Caacutecnhoacutem ra quyết định phải giao tiếp cộng taacutec vagrave thương lượng trong cocircng việcHầu hết caacutec tổ chức sẽ nhanh trở thagravenh khocircng coacute chức năng nếu khocircng coacute caacutec hệthống giao tiếp Thương mại điện tử coacute thể hiệu quả chỉ qua caacutec kỹ thuật giao tiếphiện đại- Caacutec kỹ thuật thocircng tin hiện đại cung cấp caacutec phương tiện hỗ trợ giao tiếp rẻnhanh coacute khả năng coacute thể tin cậy Nền tảng hỗ trợ giao tiếp lagrave caacutec hệ thống maacuteytiacutenh mạng+ Bắt đầu bằng điện baacuteo điện thoại radio vagrave ti vi+ Trong 100 năm chuacuteng ta phaacutet triển maacutey fax thư điện tử chương trigravenh chatnhoacutem tin tức hệ thống hội nghị truyền higravenh Hầu hết caacutec kỹ thuật nagravey đềuhoạt động trecircn internet+ Sự phaacutet triển giao tiếp sau cugraveng lagrave hệ thống họp điện tử caacutec dịch vụ vagrave hệ

thống hội nghị điện tử thường sử dụng internet để kết nối caacutec người ra quyếtđịnh- Caacutec thuận lợi aacutep dụng caacutec phương phaacutep giao tiếp cải tiến trong caacutec tổ chức+ Cải tiến năng suất của nhacircn viecircn+ Liecircn quan đến nhiều người ra quyết định chiacutenh+ Khocircng quan tacircm nhiều đến đường biecircn giới địa lyacute+ Tạo nền văn hoacutea hợp taacutec nhất quaacuten+ Cải tiến chất lượng cuộc sống của nhacircn viecircnHỗ trợ cộng taacutec Maacutey tiacutenh hỗ trợ cộng taacutec- Khung thời giannơi chốn+ Sự hiệu quả của kỹ thuật tiacutenh toaacuten cộng taacutec phụ thuộc vagraveo vị triacute của caacutec thagravenhviecircn trong nhoacutem vagrave phụ thuộc vagraveo thời gian chia sẽ thocircng tin gởi vagrave nhận+ Chia sự giao tiếp thagravenh bốn ocirc vagrave tổ chức bốn ocirc dọc theo 2 chiều thời gian vagravenơi chốn1048713 Thời gian Khi gởi vagrave nhận thocircng tin hầu như đồng thời giao tiếp lagrave đồngthời Viacute dụ Điện thoại ti vi vagrave caacutec cuộc họp gặp mặt nhau Giao tiếp bấtđồng bộ xảy ra khi người nhận nhận thocircng tin ở thời điểm khaacutec thời điểmgởi thocircng tin đoacute1048713 Nơi chốn Người gởi vagrave người nhận coacute thể ở cugraveng phograveng hoặc khocircng+ Bốn ocirc lagrave1048713 Cugraveng thời giancugraveng nơi chốn Caacutec thagravenh viecircn gặp mặt nhau cugraveng một luacutecgiống như phograveng quyết định hoặc gặp mặt truyền thống1048713 Cugraveng thời giankhaacutec nơi chốn Caacutec thagravenh viecircn ở caacutec nơi khaacutec nhau nhưnggiao tiếp cugraveng nhau Viacute dụ hội nghị truyền higravenh (videoconferencing)1048713 Khaacutec thời giancugraveng nơi chốn Nhiều người lagravem việc theo ca Ca nagravey để lạithocircng tin cho ca khaacutec1048713 Khaacutec thời giankhaacutec nơi chốn Caacutec thagravenh viecircn ở caacutec nơi khaacutec nhau Caacutecthagravenh viecircn nagravey gởi vagrave nhận thocircng tin ở những lần khaacutec nhau

23Thực thi hệ DSSHệ thống hỗ trợ quản lyacute (MSS) khocircng phải luacutec nagraveo cũng luocircn thagravenh cocircng Nhiều trường hợpthất bại của ES khocircng hoagraven toagraven lagrave lyacute do kỹ thuật Thực thi hệ thống lagrave một quaacute trigravenh liecircn tụcnhằm đảm bảo cho tổ chức chuẩn bị tiếp nhận một hệ thống mới vagrave đưa hệ thống vagraveo sử dụngthagravenh cocircngThực hiện cocircng nghệ hệ thống hỗ trợ quản lyacute lagrave việc phức tạp vigrave caacutec hệ thống nagravey khocircng đơnthuần lagrave hệ thống thocircng tin chỉ thu thập thao taacutec vagrave phacircn phối thocircng tin Magrave xa hơn chuacuteng

liecircn quan tới caacutec cocircng việc coacute thể lagravem thay đổi đaacuteng kể caacutech thức hoạt động của tổ chức Tuyvậy đa số caacutec yếu tố thực thi đều liecircn quan tới hệ thống thocircng tinThực thi MSS lagrave quaacute trigravenh liecircn tục diễn ra trong suốt thời gian phaacutet triển hệ thống từ đề xuấtban đầu đến nghiecircn cứu khả thi thiết kế vagrave phacircn tiacutech hệ thống lập trigravenh huấn luyện chuyểnđổi vagrave lắp đặt Caacutec chuyecircn gia hệ thống thocircng tin thường gọi thực thi lagrave giai đoạn cuối trongvograveng đời hệ thống Định nghĩa thực thi MSS phức tạp hơn vigrave bản chất lặp của sự phaacutet triểncaacutec hệ thống

THỰC THI KHOcircNG HOAgraveN CHỈNHCaacutec quyết định về tiacutenh khả thi thường coacute giả định về lợi iacutech đạt được khi kế hoạch thực thiđược thực hiện hoagraven toagraven Trong thực tế thường chỉ thực hiện 90 thậm chiacute 70 phần trăm sovới phacircn tiacutech khả thi Lyacute do lagrave sự thay đổi tại một nơi trong hệ thống coacute thể ảnh hưởng vagrave coacutethể taacutec động tiecircu cực đến chỗ khaacutec Do vậy cấp quản lyacute coacute thể bỏ những phần trong dự aacuten coacutethể gacircy ra taacutec động xấu Do đoacute dự aacuten sẽ thực hiện iacutet hơn 100 so với dự aacuten kế hoạch Caacutec lyacutedo khaacutec coacute thể lagrave do khấu trừ ngacircn saacutech hoặc vượt chi phiacuteĐAacuteNH GIAacute SỰ THAgraveNH COcircNG CỦA THỰC THI HỆ THỐNGPhải coacute caacutec chỉ số đo lường thigrave mới coacute thể đaacutenh giaacute sự thagravenh cocircng khi thực thi một hệ thốngDickson va Powers (1973) đề ra 5 tiecircu chuẩn độc lậpbull Tỷ lệ thời gian thực hiện dự aacuten với thời gian ước lượngbull Tỷ lệ chi phiacute thực tế vagrave ngacircn saacutech thực hiệnbull Thaacutei độ của cấp quản lyacute đối với hệ thốngbull Nhu cầu thocircng tin của caacutec nhagrave quản lyacute được đaacutep ứng như thế nagraveo qua hệ thốngbull Taacutec động của dự aacuten đối với những hoạt động maacutey tiacutenh trong cocircng tyCaacutec đo lường khaacutec để đaacutenh giaacute thagravenh cocircng của hệ hỗ trợ quản lyacute (MSS)bull Sự sử dụng hệ thống (dự định dugraveng hoặc thực sự dugraveng)bull Thỏa matilden của người dugravengbull Thaacutei độ taacuten thagravenhbull Mức độ hệ thống hoagraven thagravenh caacutec mục tiecircu ban đầubull Phần thưởng đối với tổ chức (giảm chi phiacute tăng doanh thuhellip)bull Tỷ số lợi iacutech chi phiacute

bull Mức độ thể chế hoacutea của MSS trong tổ chứcDo bởi tiacutenh đa dạng của DSS necircn việc đaacutenh giaacute sự thagravenh cocircng của hệ nagravey cũng khoacute khăn tuynhiecircn cũng coacute thể coacute một số yếu tố giuacutep cho DSS thagravenh cocircng như sự tham gia người dugravenghuấn luyện người dugraveng hỗ trợ quản lyacute cấp cao nguồn thocircng tin đặc điểm của những nhiệmvụ coacute liecircn quan (cấu truacutec bất định độ khoacute phụ thuộc)

Chương5Nhoacutem hỗ trợ quyết định vagrave nhoacutemcocircng nghệ phần mềm

51Nhoacutem tạo quyết định

MDM-Holsapple đatilde gợi yacute chuacuteng ta sử dụng giới hạn người tạo quyết định

Một nhoacutem lagrave kết cấu MDM nơi magrave nhiều người ra quyết định hoagraven toagraven tương taacutec

Một đội lagrave kết cấu MDM nơi caacutec thagravenh viecircn tư vấn cho người đưa ra quyết định nhưng khocircng tương taacutec

Một Ủy ban lagrave kết cấu MDM với một người tạo quyết định duy nhất vagrave sự tương taacutec giữa caacutec thagravenh viecircn

Mạng thocircng tin

Mạng lưới baacutenh xe mỗi người tham gia coacute thể giao tiếp với người đưa ra quyết định ở trung tacircm nhưng khocircng phải với người tham gia khaacutecCấu truacutec nagravey lagrave khocircng thỏa matilden tất cả những người tham gia ngoại trừ người ra quyết định

Mạng dacircy chuyền Tham gia chuyển tiếp thocircng tin chỉ để noacute luocircn liền kề nhau trong chuỗi

Thagravenh viecircn cuối cugraveng ko được đaacutep ứng

Mạng vograveng trograven Tương tự như chuỗi nhưng kết thuacutec được kết nối

Mạng kết nối hoagraven toagraven khocircng coacute hạn chế về giao tiếp vagrave tương taacutec giữa caacutec thagravenh viecircnNoacutei chungnoacute đaacutep ứng hầu hết caacutec kết nối của người tham gia nhưng truyền đạt thocircng tin mất nhiều thời gian vagrave coacute nhiều cơ hội xảy ra lỗi

Nhoacutem hagravenh vi vagrave chuẩn mực

MDMs thiết lập caacutec chỉ tiecircu hướng dẫn quaacute trigravenh ra quyết định

Một chuẩn mực quy định cụ thể những gigrave thagravenh viecircn trong nhoacutem dự kiến sẽ lagravem trong những hoagraven cảnh nhất định

Quy tắc gửi coacute thể được thocircng qua viacute dụ đaacutenh giaacute ngang hagraveng hoặc xử phạt

Lagravem thế nagraveo để đưa ra quyết định

Việc chọn lựa magrave trong đoacute việc sử dụng cấu truacutec MDM phải được dựa trecircn một số yếu tố liecircn quan với bối cảnh quyết định

Viacute dụmột cấu truacutec riecircng lẻ sẽ lagravem việc nơi magrave quyết định được cấu truacutec cao vagrave thocircng tin lagrave coacute sẵn

Một ủy ban cơ cấu sẽ lagrave sự lựa chọn khi người ra quyết định khocircng thể đưa ra quyết định một migravenh

52Caacutec vấn đề thường gặp trong nhoacutem

Kiacutech thước Noacutei chung sự nhất triacute vagrave gắn kết giữa caacutec thagravenh viecircn tỉ lệ nghịch với phạm vi nhoacutem Trong nhoacutem lớn rất dễ higravenh thagravenh caacutec nhoacutem nhỏ vagrave hoạt động rời rạc

Tư duy tập thể Trong nhoacutem lớn mọi người coacute xu hướng suy nghĩ đểđạtđược sự nhất triacute necircn khocircng phaacutet huy được sự saacuteng tạo

Caacutec vấn đề về xatilde hội

Xung đột Trong 1 nhoacutem ai cũng muốn migravenh lagrave giỏi nhất necircn dễ dẫn đến xung đột

Ẩn danh(Giấu tecircn) Đacircy lagrave phương phaacutep được sử dụng để kiểm soaacutet xung đột Cho caacutec thagravenh viecircn tham gia ẩn danh

Vấn đề giới tiacutenh Nam vagrave nữ thường coacute những thế mạnh khaacutec nhau điều nagravey coacute thể lagrave sức mạnh trong 1 thiết lập MDM

Đagravem phaacuten vagrave quyết định

Một quyết định coacute thể liecircn quan đến nhiều quan điểm khaacutec nhau vigrave thế cần phải coacute sự đagravem phaacuten

Caacutec thiết kế của cơ chế hỗ trợ cho MDM phải phugrave hợp với caacutec hoạt độngđagravemphaacuten

Những hoạt động nagravey bao gồm việc thu nhận yacute kiến của caacutec thagravenh viecircn 1 caacutech cocircng bằng

53Cocircng nghệ hỗ trợ MDM

Organizational DSSndash 1 hệ thống cung cấp caacutec quyết định hỗ trợ

Group Support Systemndash Cocircng nghệ sử dụng sự hỗ trợ của nhiều becircn tham gia

Group DSS ndash Lagrave 1 hệ thống được thiết kế đặc biệt để hỗ trợ cho MDM

DSS ndash Lagrave 1 hệ thống dưới sự kiểm soaacutet của 1 người quyết định hệ thống nagravey cung cấp 1 bộ cocircng cụ giuacutep phacircn tiacutech hoagraven cảnh đểđưa ra quyết định vagrave nacircng cao hiệu quả của quyết địnhđoacute

53Cocircng nghệ hỗ trợ MDM

Organizational DSSndash 1 hệ thống cung cấp caacutec quyết định hỗ trợ

Group Support Systemndash Cocircng nghệ sử dụng sự hỗ trợ của nhiều becircn tham gia

Group DSS ndash Lagrave 1 hệ thống được thiết kế đặc biệt để hỗ trợ cho MDM

DSS ndash Lagrave 1 hệ thống dưới sự kiểm soaacutet của 1 người quyết định hệ thống nagravey cung cấp 1 bộ cocircng cụ giuacutep phacircn tiacutech hoagraven cảnh đểđưa ra quyết định vagrave nacircng cao hiệu quả của quyết địnhđoacute

Mục tiecircu của cocircng nghệ hỗ trợ MDM

Quy trigravenh hỗ trợ tập trung vagraveo quaacute trigravenh tạo điều kiện thuận lợi cho sự tương taacutec

Cơ chế cấu truacutec quaacute trigravenh chi phối caacutec hoạt động truyền thocircng

Nhiệm vụ hỗ trợ cocircng việc coacute thể chọn lựa tổ chức hoặc lấy thocircng tin

Nhiệm vụ cấu truacutec cocircng việc cho pheacutep truy cập đến kỹ thuật lọc kết hợp phacircn tiacutech kiến thức liecircn quan đến cocircng việc

Caacutec lớp loại cocircng nghệ hỗ trợ MDM

Phacircn loại theo đặc điểm do DeSanctis vagrave Gallupe đưa ra đề xuất một chương trigravenh ba cấp dựa trecircn caacutec tiacutenh năng được cung cấp

Hệ thống cấp 1 Mục điacutech chiacutenh lagrave tạo điều kiện thocircng tin liecircn lạc giữa caacutec thagravenh viecircn

Hệ thống cấp 2 Thiết kế để giảm thiểu rủi ro

Hệ thống cấp 3 Giuacutep điều chỉnh xử lyacute quyết định

Phacircn loại theo cocircng nghệ -Kraemer vagrave King tập trung vagraveo cocircng nghệ aacutep dụng

Cocircng nghệ bảng mạch điện tử

Hội nghị trực tuyến

Mạng lưới tập đoagraven

Trung tacircm thocircng tin

Mocirci trường cộng taacutec

Phograveng quyết định

Nhoacutem phần mềm

Phần mềm được thiết kế để hỗ trợ sự hợp taacutec bao gồm việc thu huacutet vagrave lưu trữ thocircng tin

Caacutec tổ chức dẫn đầu thị trường hiện tại lagrave Lotus Notes and Domino Microsoft Exchange Novell GroupWise and Oracle Office

Caacutec cocircng cụ trong một bộ phần mềm bao gồm người quản lyacute hội nghị (Lotus Sametime) vagrave trao đổi thocircng điệp (Lotus Notes Mail)

Xếp hạng phần mềm cho nhoacutem

Ellis vv đề xuất một hệ thống xếp hạng dựa vagraveo kiểu sự hỗ trợ noacute Cung cấp

Hệ thocircng điệp

Hệ thống hội thảo truyền higravenh

Hệ thống cộng taacutec soạn thảo

Nhoacutem phacircn phối giải phaacutep phần mền

Hệ thống phối hợp

Hệ thống thocircng minh đại diện

Lực lượng điều khiển phaacutet triển phần mềm cho nhoacutem

Một số nhacircn tố chiacutenh bao gồm

Tăng năng suất

Giảm số lượng caacutec cuộc họp

Tăng cường tự động hoacutea caacutec quy trigravenh lagravem việc thường xuyecircn

Cần phối hợp toagraven cầu tốt hơn

Tiacutenh sẵn sagraveng của những mạng lan rộng

Coleman vagrave Khanna liệt kecirc 10 nhacircn tố khaacutec

54Quản lyacute hoạt động MDM (Mobile Device Management - Quản lyacute thiết bị di động)

Một số phương phaacutep phối hợp phổ biến hơnMDM lagrave

Kỹ thuật nhoacutem định danh

Kỹ thuật Delphi

Sự phacircn xử

Hệ thocircng tin dựa trecircn vấn đề

Nemawashi

Kỹ thuật nhoacutem định danh

1-Mỗi người tham gia viết ra những yacute tưởng về những gigrave necircn quyết định

2-Lần lượt mỗi người tham gia trigravenh bagravey yacute tưởng của migravenh được ghi lại trecircn bảng Khocircng thảo luận ở đacircy

3-Sau khi tất cả caacutec yacute tưởng được trigravenh bagravey caacutec đại biểu coacute thể chất vấn những người khaacutec

4-Mỗi người tham gia bỏ phiếu cho mỗi yacute tưởng

Kỹ thuật Delphi

Về cơ bản tương tự như kỹ thuật nhoacutem định danh ngoại trừ những người khocircng bao giờ tham gia cuộc họp

Một cocircng cụ khảo saacutet được sử dụng để thu thập đầu vagraveo ban đầu từ caacutec thagravenh viecircn

Một cuộc khảo saacutet thứ hai được gửi đi với một bản toacutem tắt caacutec kết quả chung

Những bước lặp lại cho đến khi đạt được một sự đồng thuận hoặc nhigraven nhận của đa số

Sự phacircn xử(Arbitration )

Thiacutech hợp nhất khi caacutec thagravenh viecircn của MDM đại diện cho caacutec yếu tố đối lập

Những người tham gia đồng yacute rằng nếu lựa chọn thay thế hai becircn thỏa thuận khocircng được tigravem thấy thigrave một trọng tagravei viecircn becircn ngoagravei sẽ tham gia

Trọng tagravei sau đoacute lựa chọn thay thế ocircng hoặc xeacutet thấy thiacutech hợp nhất

Hệ thống thocircng tin dựa trecircn vấn đề (IBIS)

Lagrave một phương phaacutep lập luận cấu truacutec

Một đại diện cho IBIS lagrave một đồ thị với caacutec nuacutet vagrave caacutec liecircn kết

IBIS bắt đầu với lựa chọn của một nuacutet vấn đề gốc sau đoacute caacutec nuacutet vị triacute khaacutec nhau được liecircn kết với nuacutet gốc

Caacutec nuacutet vị triacute nagravey sau đoacute được đaacutenh giaacute dựa trecircn những lập luận gắn liền với chuacuteng

Nemawashi (được sử dụng rộng ratildei tại Nhật Bản)

1-Một hoặc nhiều thagravenh viecircn của MDM được chỉ định lagrave điều phối viecircnCaacutec điều phối viecircn sau đoacute chọn người tham gia cograven lại

2-Điều phối viecircn xacircy dựng một tổng hợp caacutec sự lựa chọn vagrave sau đoacute caacutec chuyecircn gia đaacutenh giaacute caacutec lựa chọn

3-Điều phối viecircn lựa chọn một sự lựa chọn dựa trecircn kết quả ở trecircn(ở 2)

4-Sự thay thế được luacircn chuyển điều phối viecircn tigravem kiếm sự đồng thuận thocircng qua sự thuyết phục vagrave đagravem phaacuten

5-Nếu đạt được sự đồng thuận điều phối viecircn cho lưu thocircng một tagravei liệu magrave mỗi thagravenh viecircn MDM để lại dấu hiệu trecircn đoacute

55Nơi lagravem việc ảo

Nhiều tổ chức trecircn toagraven thế giới kinh doanh bất động sản cho cocircng nghệ hợp taacutec

Cocircng việc được trở thagravenh một điều bạn lagravem hơn lagrave một nơi bạn đi

Những thay đổi lớn nhất mang lại bởi nơi lagravem việc ảo coacute thể lagrave về văn hoaacute hay xatilde hội hơn lagrave về cocircng nghệ

Chương 6 Hệ thống thocircng tin điều hagravenh

61 Yacute nghĩa của EIS- Hệ thống thocircng tin điều hagravenh

- EIS lagrave một dạng đặc biệt của DSS được thiết kế để hỗ trợ ra quyết định ở cấp cao nhất của một tổ chức

- Lagrave một hệ thống thocircng tin hỗ trợ nhu cầu lập kế hoạch vagrave đaacutenh giaacute của caacutec nhagrave quản lyacute điều hagravenh

- EIS coacute thể giuacutep một CEO coacute được bức tranh tổng thể chiacutenh xaacutec nhất về caacutec hoạt động vagrave một bản toacutem tắt những gigrave magrave đối thủ cạnh tranh đang lagravem

- Caacutec hệ thống nagravey noacutei chung hoạt động dễ dagraveng vagrave trigravenh bagravey thocircng tin theo những caacutech dễ hiểu để việc tiếp thu được nhanh choacuteng (biểu đồ đồ thịhellip)

(Tagravei liệu thecircm EIS lagrave những loại hệ thống lagrave rất phức tạp trong tự nhiecircn Coacute thể noacutei hệ thống nagravey cũng cung cấp cho caacutec nhagrave quản lyacute với caacutec thiết bị coacute khả năng ra quyết định bằng caacutech sử dụng của noacute Hệ thống nagravey hoạt động trong điều kiện như vậy quan trọng như trong caacutec hệ thống khaacutec khocircng hỗ trợ Khả năng lưu trữ dữ liệu nặng lagravem cho noacute lyacute tưởng để được thocircng qua khocircng chỉ bởi caacutec doanh nghiệp lớn magrave cograven bởi caacutec doanh nghiệp nhỏ hơn Nhigraven chung hệ thống nagravey lagrave dagravenh cho caacutec nhacircn viecircn cấp cao hỗ trợ thagravenh thạo trong việc đưa ra caacutec quyết định quan trọng)

Caacutec phiecircn EIS tiecircu biểu- Phiecircn lagravem việc coacute thể bắt đầu với một baacuteo caacuteo về tigravenh higravenh tagravei chiacutenh vagrave kinh

doanh của một cocircng ty caacutec chỉ số hoạt động quan trọng được hiển thị rotilde ragraveng- EIS sẽ cho pheacutep caacutec giaacutem đốc điều hagravenh coacute thể đi sacircu vagraveo dữ liệu từ những con

số bất kỳ magrave noacute hỗ trợ- Việc điều hagravenh coacute thể lựa chọn một mức độ chi tiết ( VD danh số baacuten hagraveng) nếu

như cần điều tra thecircm- Lagrave một phương phaacutep tiếp cận coacute thể giuacutep việc ra quyết định tốt hơn

Những điều magrave EIS ko coacute- EIS khocircng phải lagrave sự thay thế cho caacutec hệ thống dựa trecircn caacutec maacutey tiacutenh khaacutec EIS

thực sự chỉ cung cấp dữ liệu cho caacutec hệ thống nagravey- Noacute khocircng thể biến caacutec bộ hệ điều hagravenh của maacutey tiacutenh thagravenh những ldquochuyecircn viecircn

giỏirdquo- Coacute thể được viacute một caacutech cao hơn như lagrave một trợ lyacute đaacuteng tin cậy coacute thể được gọi

đến bất khi nagraveo vagrave mỗi khi cần thiết

Tagravei liệu thecircm Sự khaacutec nhau giữa EIS vagrave DSS+ EIS thiết kế để hỗ trợ những người điều hagravenh cấp cao giuacutep họ khaacutem phaacute caacutec vấn đề vagrave caacutec cơ hội DSS hỗ trợ những nười phacircn tiacutech cố gắng trả lời cacircu hỏi caacutei gigrave coacute thể lagravem cugraveng với một cơ hội hoặc một vấn đề

Chiều EIS DSSNhững người sử dụng thocircng thường

Duyệt dữ liệu đi xuống truy xuất trạng thaacutei

Hỗ trợ phacircn tiacutech vagrave quyết định

Sự thuacutec đẩy Tiacutenh thiacutech hợp Tiacutenh hiệu quảỨng dụng Queacutet mocirci trường đaacutenh giaacute

hiệu suất nhận dạng caacutec vấn đề vagrave caacutec cơ hội

Caacutec quyết định quản lyacute trecircn caacutec lĩnh vực đa dạng

Hỗ trợ quyết định Caacutec chiacutenh saacutech caacutec quyết định khocircng coacute cấu truacutec ở mức cao vagrave hỗ trợ giaacuten tiếp

Hỗ trợ caacutec quyết định lặp lại caacutec quyết định khocircng thể đoaacuten trước ra quyết định khocircng coacute cấu truacutec vagrave baacuten cấu truacutec

Loại thocircng tin Caacutec thocircng tin tin tức thocircng tin becircn ngoagravei về khaacutech hagraveng đối thủ cạnh tranh mocirci trường caacutec baacuteo caacuteo theo yecircu cầu vagrave định thời về caacutec hoạt động becircn trong

Caacutec thocircng tin hỗ trợ caacutec tigravenh huống đặc biệt

Sử dụng coacute nguyecircn tắc

Dograve theo vết vagrave điều khiển nhận dạng cơ hội

Hoạch định tổ chức phacircn nhoacutem vagrave điều khiển

Khả năng phugrave hợp với những người sử dụng caacute nhacircn

Thiết kế loại ra quyết định cho mỗi người điều hagravenh caacute nhacircn bằng nhiều lựa chọn đầu ra

Cho pheacutep caacutec đaacutenh giaacute caacute nhacircn caacutec khả năng what-if lựa chọn loại hộp hội thoại

Đồ họa Phải coacute Lagrave một phần quan trọng của nhiều DSS

Thacircn thiện người sử dụng

Phải coacute Phải coacute nếu khocircng coacute người sử dụng trung gian

Xử lyacute thocircng tin Lọc neacuten thocircng tin dograve theo vết dữ liệu vagrave thocircng tin quan trọng

EIS kiacutech thiacutech caacutec cacircu hỏi caacutec cacircu trả lời bằng caacutech sử dụng DSS vagrave phản hồi lại EIS

Hỗ trợ caacutec thocircng tin chi tiết

Truy xuất thường xuyecircn caacutec mức chi tiết của bất kỳ thocircng tin tổng hợp nagraveo (duyệt dữ

Coacute thể coacute trong DSS nhưng khocircng thường

liệu chi tiết)Cơ sở mocirc higravenh Caacutec chức năng coacute sẵn bị hạn

chếLagrave điểm cốt lotildei của DSS

Cấu truacutec Theo người baacuten sản phẩm hoặc theo caacutec chuyecircn gia hệ thống thocircng tin

Theo người sử dụng hoặc caacute nhacircn hoặc caacutec chuyecircn gia từ caacutec trung tacircm thocircng tin hoặc phograveng ban hệ thống thocircng tin

Phần cứng Mainframe caacutec trạm RISC mạng LANs hoặc caacutec hệ thống phacircn bố

Mainframe caacutec trạm RISC caacutec maacutey PC hoặc caacutec hệ thống phacircn bố

Bản chất caacutec goacutei phần mềm

Truy xuất tương taacutec dễ dagraveng đến nhiều cơ sở dữ liệu truy xuất trực tuyến caacutec khả năng DBMS phức tạp caacutec liecircn kết phức tạp

Caacutec khả năng tiacutenh toaacuten lớn caacutec ngocircn ngữ mocirc higravenh mocirc phỏng ứng dụng vagrave caacutec bộ tạo DSS

Bản chất caacutec thocircng tin

Trigravenh bagravey thocircng tin được phaacutet sinh trước về quaacute khứ vagrave hiện tại tạo caacutec thocircng tin mới về quaacute khứ hiện tại tương lai

Tạo thocircng tin mới về quaacute khứ hiện tại tương lai

62 Lịch sử EIS- EIS xuất hiện lần đầu tiecircn tại MIT vagraveo những năm 1970

- Những EIS đầu tiecircn được phaacutet triển bởi caacutec doanh ngiệp lớn sẵn sagraveng chấp nhận rủi ro để đạt được lợi thế cạnh tranh

- Vagraveo những năm 1980 caacutec nhagrave cung cấp đatilde phaacutet triển một số cơ sở khaacutech hagraveng rộng vagrave cocircng nghệ EIS được tiếp tục phaacutet triển cho đến ngagravey nay

(Tagravei liệu thecircm Sử dụng DSSEIS cho phaacutet triển bền vững + Một số nghiecircn cứu đatilde được tiến hagravenh để kiểm tra việc thực hiện của EIS trong khu vực cocircng cộng vagrave chiacutenh phủ caacutec nước tổ chức kể từ khi chuacuteng được phaacutet triển theo định hướng lợi nhuận cho caacutec cocircng ty tư nhacircn (Hasan vagrave Hasan năm 1997) Theo một nghiecircn cứu tiến hagravenh tại Mỹ ở hơn 300 cocircng ty kết quả cho thấy sự khaacutec biệt của EIS giữa tư nhacircn vagrave chiacutenh phủ một số kết quả thuacute vị được phaacutet hiệnViacute dụ khoacute khăn hơn để chuyển tiền từ một tagravei khoản khaacutec trong một EIS của chiacutenh phủ cũng lagrave khoacute khăn hơn để biện giải thiacutech cho những chi phiacute phaacutet triển EIS của chiacutenh phủ Một nghiecircn cứu khaacutec được tiến hagravenh ở Australia

cho thấy rằng EIS cung cấp cho quản lyacute một higravenh ảnh chiacutenh xaacutec hơn về tổ chức thực hiện vagrave cung cấp hỗ trợ cho caacutec lợi iacutech chiến lược cải thiện khocircng chỉ cho caacutec nhagrave quản lyacute nhưng cograven cho phần cograven lại của tổ chức Dựa trecircn caacutec hệ thống được thiết kế cho caacutec cocircng ty tư nhacircn với một caacutech rotilde ragravengxaacutec định mục tiecircu EIS lagrave thiacutech hợp cho caacutec tổ chức cocircng cộng hiện đại nhưng cần phải được linh hoạt hơn vagrave kết thagravenh chugravem một phạm vi rộng hơn khả năng vagrave phương tiện hơn so với khu vực tư nhacircn ban đầu theo định hướng sản phẩm (Hasan vagrave Hasan năm 1997) Điều nagravey coacute thể lagrave do thực tế rằng caacutec hoạt động khu vực cocircng lagrave bắt buộc coacute taacutec động rộng phải đaacutep ứng sự mong đợi duy nhất cocircng cộng thường coacute mục tiecircu mơ hồ vagrave macircu thuẫn iacutet quyền tự chủ vagrave kiểm soaacutet việc ra quyết định vagrave nhacircn viecircn lagrave khoacute khăn hơn (Watson vagrave Carte2000) + Toacutem lại EIS lagrave một khaacutei niệm thagravenh cocircng noacute phaacutet triển qua nhiều năm tuy nhiecircn EIS khắc phục khiếm khuyết của migravenh bằng caacutech tiến hagravenh nghiecircn cứu liecircn tục)

63 Tại sao những người điều hagravenh hagraveng đầu lại khaacutec nhau- Họ lagrave những doanh nghiệp theo định hướng coacute suy nghĩ

- Coacute một khoảng khocircng gian rộng để kiểm soaacutet

- Họ chịu traacutech nhiệm cho việc thiết lập chiacutenh saacutech

- Họ đại diện cho tổ chức mocirci trường becircn ngoagravei

- Hagravenh động của họ tạo ra những kết quả đaacuteng kể về tagravei chiacutenh vagrave con người

Tần số caacutec hoạt động điều hagravenh- Xử lyacute xaacuteo trộn 42

- Hoạt động kinh doanh 32

- Phacircn bổ nguồn lực 17

- Đagravem phaacuten 3

- Những điều khaacutec 6

Handling Disturbances 42

Entrepreneurial Activites 32

Resource Allocation 17

Negotiation 3

Other 6

Những thocircng tin điều hagravenh cần thiết- Quản lyacute xaacuteo trộn coacute thể yecircu cầu sự chuacute yacute xung quanh đồng hồ

- Hoạt động kinh doanh yecircu cầu điều hagravenh để dự đoaacuten những thay đổi trong mocirci trường

- Nhiệm vụ phacircn bổ tagravei nguyecircn yecircu cầu lựa chọn người quản lyacute vagrave caacutec nguồn lực hạn chế được triển khai

- Đagravem phaacuten yecircu cầu cập nhật thocircng tin từng phuacutet để coacute thể xacircy dựng được sự đồng thuận

Caacutec loại thocircng tin điều hagravenh- Hệ thống kế toaacuten coacute liecircn quan đến việc tiacutenh toaacuten thu nhập hoạt động cho caacutec lĩnh

vực cụ thể lagrave quan trọng hơn so với caacutec hệ thống kế toaacuten truyền thocircng- Thocircng tin về thị trường khaacutech hagraveng cung cấp giaacute trị trong việc quyết định chiến

lược- Caacutec thocircng tin cần thiết thường được truyền đi trecircn một số hệ thống maacutey tiacutenh vagrave

nằm trong toagraven tổ chức- Caacutec thocircng tin được sử dụng thường lagrave ngắn hạn vagrave dễ thay đổi

Phương thức để xaacutec định thocircng tin cần thiết

Rockart xaacutec định được năm phương thức cơ bản để xaacutec định thocircng tin cần thiết

- Phương thức dựa trecircn kết quả- Phương thức rỗng- Phương thức chỉ số khoacutea- Phương thức tổng hợp nghiecircn cứu- Phương thức dựa vagraveo nhacircn tố then chốt dẫn đến thagravenh cocircng

64 Thagravenh phần EIS

- Sản phẩm EIS đầu tiecircn được phaacutet triển để sử dụng trecircn maacutey tiacutenh cấu higravenh cao nhưng caacutec sản phẩm hiện nay nhằm mục tiecircu lagrave nền tảng ClientServer

- Những nền tảng linh hoạt hơn coacute thể thiacutech ứng với thay đổi trong tổ chức vagrave cocircng nghệ

- Sử dụng dữ liệu thời gian thực dẫn đến quyết định nhanh hơn nhiều thocircng tin hơn

Thagravenh phần phần cứng- Một EIS khocircng đogravei hỏi coacute phần cứng cụ thể hoặc duy nhất nagraveo- Chigravea khoacutea của vấn đề lagrave để đảm bảo rằng caacutec thagravenh phần của EIS tối ưu hoacutea vagrave

phugrave hợp với tagravei nguyecircn maacutey tiacutenh của tổ chức- Hệ thống nagravey phải được cấu higravenh để caacutec nguồn tagravei nguyecircn phugrave hợp với những

người điều hagravenh chuacuteng

Thagravenh phần phần mềm- Traacutei ngược với phần cứng phần mềm thường được chuyecircn mocircn hoacutea cao cho caacutec

bagravei toaacuten về miền- Sự chuyecircn mocircn hoacutea nagravey thường đạt được bằng caacutech sử dụng thagravenh phần off-the-

shelf cho toagraven bộ EIS vagrave caacutec mocirc-đun tugravey chỉnh để đaacutep ứng nhu cầu cụ thể- Lotus Notes lagrave một viacute dụ điển higravenh Noacute coacute thể được sử dụng một migravenh hoặc coacute

thể phục vụ becircn thứ ba mocirc-đun plug-in

Cocircng nghệ EIS hiện nay

Dobrzeniecki đề xuấtphacircn loạitừng cấptheo bachức năng- Loại 1 sản phẩm bao gồmmột bộ đầy đủcaacutec ứng dụngtừ mộtnhagrave cung cấp- Loại 2 sản phẩm đượcthựchiệnở phần đầu củacaacutecsản phẩmDSS đượcphaacutet triển

bởicugravengmộtnhagrave cung cấp- Loại 3 sản phẩmkết hợp với nhautheo bất kỳ số lượngthuộc sở hữu củacocircng ty

65 Xacircy dựng EIS

- Xacircy dựngmộtEISgiống nhưxacircydựngmột số hệ thống khaacutec củamocirc higravenh hệ thống thocircng tin

- Việcphaacutet triểncấu truacutecnecircn được theo dotildeitừ quaacute trigravenh thiết kế đến quaacute trigravenhthực hiện

- Tuy nhiecircn một dự aacuten phaacutet triển EIScoacute xu hướnglagrave thống nhấtvagraveyecircu cầu hỗ trợ caacutec nhagrave quản lyacute latildenh đạo

- Xacircy dựng một EIScoacute thểphaacutet hiện ra đượccaacutectigravenh huống khoacute khănmagravemột nhagrave phaacutet triển chưabao giờ gặp phải

Mocirc higravenh EIS

Khung phaacutet triển một EIS

- Watson et al đề nghị xacircy dựngkhung với ba thagravenh phần+ Caacutech tiếp cận tập trung vagraveo yếu tốcon người vagrave dữ liệu coacute liecircn quan đến EIS+ Quaacute trigravenh phaacutet triển cần sự linh hoạt vagrave tương taacutec+ Người sử dụng - hệ thống hộp thoại bao gồm một ngocircn ngữ hagravenh động để xử lyacute caacutec lệnh

Lợi iacutech của EIS- Dễ duy trigrave caacutec mục tiecircu coacute tổ chức- Dễ truy xuất thocircng tin- Cho pheacutep người sử dụng nacircng cao hiệu suất hơn

- Tăng chất lượng ra quyết định- Cung cấp sự cải tiến cạnh tranh- Tiết kiệm thời gian của người sử dụng- Tăng khả năng vagrave chất lượng giao tiếp- Cung cấp khả năng điều khiển tốt hơn trong tổ chức- Cho pheacutep tham gia caacutec vấn đề vagrave caacutec cơ hội- Cho pheacutep hoạch định- Cho pheacutep tigravem kiếm nguyecircn nhacircn của một vấn đề- Thảo matilden caacutec yecircu cầu của người điều hagravenh

Hạn chế của EIS vagrave 1 số sai lầm cần traacutenh

- Chi phiacute một cuộc khảo saacutetnăm1991 chothấychi phiacute phaacutet triểntrungbigravenh365000USDvớichi phiacute vận hagravenhhagraveng năm lagrave$200000 (EIS)

- Cocircng nghệ hạn chếEIScần phảiđượctiacutech hợp hoagraven toagravenvagraveokiếntruacuteccủadoanh nghiệphiện tại do đoacute noacutelagrave một thaacutech thứclớn đối vớithiết kế

- Hạn chế tổ chức cơ cấu tổ chứccoacute thể khocircng phugrave hợp

Sự hạn chế về tổ chức- Chương trigravenh nghị sự vagrave thời gian chệch EIS mocirc tả một phần việc thực hiện một

chương trigravenh nghị sự vagrave coacute thể dễ dagraveng đạt được sự tin cậy một caacutech chắc chắn- Đồng bộ hoacutea việc quản lyacute sự tin cậy đuacuteng luacutec đặc biệt baacuteo caacuteo EIS coacute thể phaacute

vỡ sự ổn định thiết lập caacutec chu trigravenh baacuteo caacuteo một caacutech tốt nhất- Sự bất ổn EIS phản ứng nhanh coacute thể gacircy ra việc taacutec động trở lại một caacutech

nhanh choacuteng dẫn đến sự thiếu ổn định trong tổ chức

Sự thất bại lagrave thay thế khocircng thể chấp nhận được- Một số yếu tố lagravem EIS thất bại

+ Thiếu sự hỗ trợ về mặt quản lyacute+ Vấn đề chiacutenh trị+ Thất bại của nhagrave phaacutet triển+ Lỗi về cocircng nghệ+ Giaacute cả+ Thời gian

66 Ra quyết định điều hagravenh trong tương lai vagrave EIS

- Coacute một vagravei điều kiện sẽ được hợp nhất cho việc chuyển đổi cocircng nghệ Trong đoacute một vagravei điều kiện coacute thể dễ dự đoaacuten Hai điều kiện magrave ta coacute thể thấy lagrave+ Phaacutet triển cocircng nghệ maacutey tiacutenh trong việc điều hagravenh sẽ tạo ra sự chuyển đổi được chấp nhận một caacutech dễ dagraveng hơn+ Mở rộng traacutech nhiệm điều hagravenh sẽ mở rộng nhu cầu thocircng tin

Tương lai của EIS- EIS thocircng minh Những tiến bộ trong cocircng nghệ AI sẽ được triển khai trong caacutec

EIS- EIS đa phương tiện Cơ sở dữ liệu đa phương tiện sẽ cho pheacutep tiacutech hợp văn bản

giọng noacutei vagrave higravenh ảnh trong tương lai- EIS thocircng tin Tương lai EIS sẽ mở rộng hơn trong việc sử dụng dữ liệu becircn

ngoagravei doanh nghiệp- EIS kết nối Giao tiếp với băng thocircng rộng cho pheacutep kết nối liecircn thocircng lớn hơn

Chương 7 HỆ CHUYEcircN GIA VAgrave TRIacute TUỆ NHAcircN TẠO

71 Caacutec khaacutei niệm

72 Triacute thocircng minh của triacute tuệ nhacircn tạo

73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia

74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia

75 Lợi iacutech vagrave hạn chế của hệ chuyecircn gia

71 Caacutec khaacutei niệm

Chuyecircn mocircn (Expertise) sự hiểu biết rộng trong 1 lĩnh vực hẹp

Hệ chuyecircn gia (Expert Systems)1 chương trigravenh maacutey tiacutenh sử dụng 1 tập caacutec luật dựa trecircn tri thức của con người để giải quyết caacutec vấn đề đogravei hogravei phải coacute sự chuyecircn mocircn

Một số hệ chuyecircn gia nổi tiếng

DENDRAL (Standford 1960s Edward Feigenbaum)

MYCIN (Standford1970s Edward Shortliffe)

PROSPECTOR (MIT 1979)

Triacute tuệ nhacircn tạo (Artificial Intelligence ndash AI)

Triacute tuệ nhacircn tạo một bộ phacircn của ngagravenh khoa học maacutey tiacutenh quan tacircm đến việc thiết kế caacutec hệ thống maacutey tiacutenh thocircng minh đoacute lagrave caacutec hệ thống đưa ra caacutec đặc điểm magrave từ đoacute chuacuteng ta liecircn hệ với sự thocircng minh trong hagravenh động của con người (Barr vagrave Feigenbaum 1981)

Mục điacutech của AI

Mục điacutech khoa học xaacutec định caacutec gợi yacute để giải thiacutech caacutec loại khaacutec nhau của triacute tuệ thực

Mục điacutech kỹ thuật giải quyết caacutec vấn đề trong thế giới thực

Triacute tuệ nhacircn tạo kế thừa nhiều yacute tưởng quan điểm kỹ thuật từ caacutec ngagravenh khoa học khaacutec

- Triết học

- Logic Toaacuten học

- Tiacutenh toaacuten

- Khoa học tacircm lyacute Khoa học nhận thức

- Sinh học Thần kinh học

- Tiến hoacutea

Caacutec lĩnh vực ứng dụng trong Triacute tuệ nhacircn tạo

Mạng nơ ron thần kinh (Neural Networks)

Tiacutenh toaacuten sự tiến hoacutea

(Evolutionary Computation)

Hệ chuyecircn gia (Expert Systems)

Kỹ thuật xử lyacute tiếng noacutei (Speech Processing)

Kỹ thuật xử lyacute ngocircn ngữ tự nhiecircn

(Natural Language Processing)

Lập kế hoạch (Planning)

Robot (Robotics)

Khoa học higravenh ảnh (Vision)

Caacutec kỹ thuật thocircng dụng dugraveng trong AI

Biểu diễn(Representation)

Học (Learning)

Caacutec luật (Rules)

Tigravem kiếm (Search)

72 Triacute thocircng minh của triacute tuệ nhacircn tạo

Con người suy diễn như thế nagraveo

Phacircn loại (Categorization)

Caacutec quy tắc cụ thể

Heuristics

Kinh nghiệm trước đoacute

Dự tiacutenh trước

Maacutey tiacutenh suy diễn như thế nagraveo

Lập luận dựa trecircn luật IF-THEN mocirc tả tri thức được matilde hoacutea dưới dạng caacutec luật

Caacutec khung (Frames) lagrave caacutec đại diện mocirc tả caacutec tigravenh huống giống nhau lagrave điển higravenh của một vagravei phacircn loại

Lập luận dựa trecircn caacutec trường hợp mocirc phỏng giải phaacutep trước đoacute cho một vấn đề hiện tại

Nhận dạng mẫu phaacutet hiện acircm thanh higravenh dạng hoặc caacutec chuỗi dagravei

Caacutec dạng khaacutec của Triacute tuệ nhacircn tạo

Học maacutey- mạng nơron vagrave giải thuật di truyền

Lập trigravenh tự động ndash lagrave những kỹ thuật tạo ra caacutec chương trigravenh để lagravem 1 nhiệm vụ riecircng biệt (cho pheacutep những người khocircng phải lagrave người lập trigravenh coacute thể lập trigravenh được)

Cuộc sống nhacircn tạo ndash nỗ lực để taacutei tạo caacutec hiện tượng sinh học trong caacutec hệ thống dựa trecircn maacutey tiacutenh

73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia(Expert Systems- ES)

Theo Jackson (1999) Một hệ chuyecircn gia lagrave một chương trigravenh maacutey tiacutenh mocirc tả vagrave suy diễn với tri thức của một vagravei lĩnh vực để giải quyết vấn đề hay đưa ra caacutec lời khuyecircn

Cấu truacutec cơ bản của ES được dựa theo cấu truacutec chung của DSS Sự khaacutec biệt chiacutenh giữa ES vagraveDSS lagrave hệ ES thu thập caacutec kiến thức từ những

chuyecircn gia trong lĩnh vực quan tacircmĐặc trưng của hệ chuyecircn gia Hiệu quả cao Thời gian trả lời thỏa đaacuteng Độ tin cậy cao Dễ hiểu

Giao diện người dugraveng trong ES

Thiết kế giao diện người dugraveng tập trung vagraveo caacutec yếu tố như dễ dagraveng sử dụngcoacute độ tin cậy cao giảm tải những khoacute khăn khi sử dụng

Thiết kế necircn coacute một số tương taacutec (đầu vagraveo kiểm soaacutet vagrave truy vấn)

Cấu tạo giao diện người dugraveng gồm coacute magraven higravenh cảm ứng bagraven phiacutem buacutet saacuteng lệnh thoại caacutec phiacutem chuyecircn dụng

Cơ sở tri thức (Knowledge Base)

Chứa đựng caacutec tri thức cụ thể miền thu được từ caacutec chuyecircn gia miền

Coacute thể chứa caacutec mocirc tả caacutec hagravenh vi giải quyết vấn đề caacutec ragraveng buộc caacutec heuristics

Thagravenh cocircng của một ES dựa trecircn tiacutenh đầy đủ vagrave tiacutenh chiacutenh xaacutec của cơ sở tri thức

Mocirc tơ suy diễn (Inference Engine)

Ở đacircy tri thức được đặt để sử dụng tạo ra caacutec giải phaacutep để giải quyết vấn đề

Mocirc tơ nagravey coacute khả năng thực hiện diễn dịch hoặc suy diễn dựa trecircn caacutec luật hay caacutec caacutec sự kiện

Đồng thời cũng coacute khả năng sử dụng caacutec suy diễn mờ hay khocircng chiacutenh xaacutec dựa trecircn xaacutec suất hay aacutenh xạ mẫu

Vograveng điều khiển suy diễn

1 Aacutenh xạ caacutec luật với caacutec sự kiện đatilde được cho

2 Chọn luật để thực hiện

3 Thực hiện luật bằng caacutech thecircm caacutec sự kiện được suy diễn ra vagraveo bộ nhớ lagravem việc

Chuỗi suy diễn (Chaining)

Suy diễn tiến (forward chaining) maacutey suy diễn bắt đầu từ dữ liệu ban đầu vagrave thực hiện việc suy luận để đưa ra caacutec kết luận cuối cugraveng

Suy diễn lugravei (backward chaining) maacutey suy diễn bắt đầu từ dữ liệu điacutech vagrave tigravem ra tri thức hỗ trợ cho dữ liệu điacutech đoacute

Viacute dụ suy diễn lugravei

R1 Nếu coacute A vagrave B thigrave suy ra coacute D

R2 Nếu coacute B thigrave suy ra coacute C

R3 Nếu coacute C vagrave D thigrave suy ra coacute E

Ta coacute E ta xem trong 3 luật R1 R2 R3 luật nagraveo coacute E ta thấy R3 chứa E đồng thời chứa C vagrave D Xeacutet tiếp trong 2 luật R1 R2 luật nagraveo chứa C vagrave D R2 chứa C R3 chứa D Từ đoacute ta coacute được caacutec tri thức hỗ trợ suy diễn vagrave kết luận lagrave nếu coacute A vagrave B thigrave sẽ coacute E Hay nếu A vagrave B đuacuteng thigrave sẽ coacute E

Viacute dụ suy diễn tiến

Giả sử coacute tập chứa 3 luật sau

R1 Nếu coacute A vagrave B thigrave suy ra coacute D

R2 Nếu coacute B thigrave suy ra coacute C

R3 Nếu coacute C vagrave D thigrave suy ra coacute E

Nếu ta coacute A vagrave B thigrave chuacuteng ta suy ra được D từ R1 vagrave suy ra C từ R2 Với D vagrave C đatilde được suy ra ở trecircn giờ chuacuteng ta suy ra được E từ R3

Viacute dụ thực tế

Giả sử muốn biết magraveu của một con vật nuocirci tecircn lagrave Fred biết rằng noacute kecircu ộp ộp vagrave ăn ruồi

Coacute tập 4 luật ban đầu như sau

R1 Nếu X kecircu ộp ộp vagrave ăn ruồi thigrave X lagrave con ếch

R2 Nếu X kecircu chiecircm chiếp vagrave biết hoacutet thigrave X lagrave con chim

R3 Nếu X lagrave con ếch thigrave X coacute magraveu xanh

R4 Nếu X lagrave con chim thigrave X coacute magraveu vagraveng

74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia

Expert system shells lagrave một tập caacutec goacutei phần mềm vagrave caacutec cocircng cụ dugraveng để phaacutet triển caacutec hệ chuyecircn gia

Những Expert system shells đầu tiecircn thường rất rườm ragrave Mặc dugrave vậy noacute vẫn giuacutep cho người sử dụng sẽ khocircng phải bắt đầu lại từ đầu khi xacircy dựng một hệ chuyecircn gia mới

Những shell hiện đại bao gồm hai mocirc-đun chiacutenh lagrave cocircng cụ xacircy dựng một tập quy tắc vagrave mocirc tơ suy diễn

Xacircy dựng hệ chuyecircn gia

Bước 1 xacircy dựng mocirc higravenh bagravei toaacuten xaacutec định vấn đề nhiệm vụ magrave hệ thống sẽ thực hiện Caacutec dạng bagravei toaacuten cần hệ chuyecircn gia

Bagravei toaacuten diễn giải (InterPretation)

Bagravei toaacuten dự baacuteo (Prediction)

Bagravei toaacuten chuẩn đoaacuten (Diagnose)

Bagravei toaacuten gỡ rối (Debugging)

Bagravei toaacuten thiết kế

Tương tự như một dự aacuten phần mềm để xacircy dựng một hệ chuyecircn gia cần phải coacute caacutec yếu tố về nhacircn lực tagravei nguyecircn vagrave thời gian Những yếu tố nagravey ảnh hưởng đến giaacute thah của một hệ chuyecircn giaTrong phần nagravey cacircu hỏi thường được đặt ra lagrave tại sao cần phải xacircy dựng một hệ chuyecircn giaTrước khi bắt đầu phải xaacute định rotilde bagravei toaacuten đạt ra lagrave jiAi lagrave chuyecircn giaAi lagrave người sử dụng

1 Diễn giải (InterPretation) Nghiecircn cứu 1 vấn đề -gt Dựa trecircn những biểu hiện thuộc tiacutenh đặc trưng becircn ngoagravei -gt Tư vấn

(hoặc đưa ra kết luận hay mocirc tả dễ hiểu từ tập dữ liệu thocirc)

2 Bagravei toaacuten dự baacuteo (Prediction) Coacute thể dự đoaacuten được hagravenh vi kết quả dựa trecircn caacutec hiện tượng -gt dự baacuteo

VD Dự baacuteo thời tiết động đấthellip

3 Bagravei toaacuten chẩn đoaacuten (Diagnoss) Xaacutec định caacutec lỗi caacutec bộ phận hỏng hoacutec của hệ thống dựa trecircn caacutec dữ liệu quan saacutet được

4 Bagravei toaacuten gỡ rối (Debugging) Mocirc tả caacutec phương phaacutep khắc phục hệ thống khi gặp sự cố

5 Bagravei toaacuten thiết kế Lựa chọn cấu higravenh caacutec đối tượng nhằm thoả matilden một số ragraveng buộc nagraveo đoacute

6 Giảng dạy Phần mềm dạy học coacute thể chuẩn đoaacuten vagrave sủa lỗi của học sinh trong quaacute trigravenh học tập

Để xaacutec định đuacuteng bagravei toaacuten magrave chuacuteng ta cần giải quyết thigrave phải trả lời đc một số cacircu hỏi

- cần hệ chuyecircn gia

Bước 2 thu thập tri thức lựa chọn cocircng cụ vagrave aacutep dụng

Trong bước thu thập tri thức vấn đề quan trọng lagrave lựa chọn chuyecircn gia những người magrave sẽ đoacuteng goacutep tri thức cho hệ thống Thocircng thường trong suốt quaacute trigravenh phaacutet triển thigrave chuyecircn gia được xem như một thagravenh viecircn của đội phaacutet triển

Hiện nay coacute rất nhiều cocircng cụ để xacircy dựng một hệ chuyecircn gia Phổ biến nhất lagrave JESS CLIPS vagrave OPS5

Bước 3 Thiết kế cơ sở tri thức thiết kế hệ thốngTri thức được biểu diễn trường minh trong cơ sở tri thức

Caacutec chuyecircn gia vagrave kỹ sư tri thức sẽ đối thoại với nhau bằng caacutec kỹ thuật đối thoại Suy diễn (SD) bảng Mocirc higravenh hoacutea SD quy nạp phacircn loại

Vấn đề bagraveo trigrave vagrave phaacutet triển

Caacutec hệ chuyecircn gia đogravei hỏi phải bảo trigrave vagrave phaacutet triển nhiều hơn so với caacutec hệ thống khaacutec Phải thường xuyecircn bổ sung tri thức mới vagrave thay đổi caacutec tri thức cũ để đổi mới hệ chuyecircn gia

Thu thập vagrave khắc phục lỗi do người sử dụng phaacutet hiện để kịp thời khắc phục những sai soacutet của hệ chuyecircn gia

75 Lợi iacutech vagrave hạn chế của caacutec hệ chuyecircn gia

Một số lợi iacutech chiacutenh

Thời gian trả lời hợp lyacute bằng hoặc nhanh hơn so với chuyecircn gia (người) để đi đến cugraveng một quyết định Hệ chuyecircn gia lagrave một hệ thống thời gian thực (real time system)

Khả năng trả lời với mức độ tinh thocircng bằng hoặc cao hơn so với chuyecircn gia (người) trong cugraveng lĩnh vực

Hệ chuyecircn gia giuacutep cho hiệu quả lagravem việc tăng bằng việc sử dụng tập caacutec luật một caacutech nhanh choacuteng magrave ko bị nhầm lẫn chuyecircn gia lagrave người coacute thể quecircn đi một số tri thức cơ sở lyacute luậ nhưng HCG thigrave ko

Quyết định của một người chuyecircn gia coacute thể bị thay đổi vagrave ko coacute tiacutenh thống nhất như quyết định của một hệ chuyecircn gia tạo ra

Hệ chuyecircn gia giuacutep cho người sử dụng coacute thể trau dồi sự hiểu biết trecircn lĩnh vuej cụ thể magrave noacute giải quyết hỗ trợ người ra quyết định coacute trigravenh độ như 1 chuyecircn gia trong quaacute trigravenh gia quyết định

Kiến thức của rất nhiều chuyecircn gia về một lĩnh vực nagraveo đoacute được đưa vagraveo hệ chuyecircn gia lagravem cho CSTT cuat HCG phong phuacute vagrave rộng lớn hơn rất nhiều

HCG giải thiacutech caacutec bước suy luận một caacutech dễ hiểu nhất quaacuten luacutec nagraveo cũng coacute thể sử dụng ko như chuyecircn gia con người

Hạn chế của caacutec hệ chuyecircn gia

Nhược điểm lớn nhất của hệ chuyecircn gia lagrave những yacute kiến chuyecircn mocircn thường rất khoacute matilde hoacutea vagrave giải neacuten

Hệ chuyecircn gia khocircng coacute khả năng tự học tự cập nhật kiến thức mới như caacutec chuyecircn gia magrave cần phải được matilde hoacutea lại khi noacute được cập nhật

Hệ chuyecircn gia khocircng thể nhận ra được vấn đề khocircng nằm trong miền kiến thức của hệ thống

Chương 8 Tri thức vagrave tiếp nhận

1 Bao gồm caacutec vấn đề

Dữ liệu thực tế đo lường hoặc quan saacutet coacute hoặc khocircng coacute bối cảnh

Thocircng tin dữ liệu được tổng hợp một caacutech hữu iacutech để giải quyết những khoacute khăn trong việc đưa ra quyết định

Tri thức bao gồm caacutec ứng dụng quy tắc thocircng tin hướng dẫn của người ra quyết định

2 Những caacutei nhigraven về tri thức

Đại diện lagravem thế nagraveo để diễn tả tri thức viacute dụ như một quyển saacutech khocircng phải lagrave tri thức nhưng noacute lại lagrave một đại diện của tri thức

Sản xuất tri thức lagrave một tập hơp của hagraveng tồn kho coacute thể được sản xuất cũng như mua lại

Tri thức lagrave 1 trong 6 trạng thaacutei của hệ thống

1Dữ liệu 2Thocircng tin 3Cấu truacutec thocircng tin 4Sự thấu hiểu 5Yacute kiến 6 Quyết định

3 Caacutec loại tri thức Phổ biến mocirc tả dữ liệu thocircng tin thủ tục mọi thứ lagravem như thế nagraveo lập luận chiacutenh saacutech hoặc caacutec quy tắc

4 Thu thập Tri thức hệ chuyecircn gia Hầu hết caacutec phương phaacutep đều bắt đầu với mocirc higravenh của caacutec taacutec vụ trong đoacute

hệ chuyecircn gia được xacircy dựng Trong đoacute mocirc tả về caacutec lĩnh vực được tạo ra Caacutec kỹ sư sử dụng caacutec mocirc higravenh giả thuyết vagrave nhận thức về quaacute trigravenh phacircn

tiacutech để gợi ra caacutech giải quyết vấn đề về tri thức từ caacutec chuyecircn gia

5 Caacutec chiều của thu thập tri thức KE- driven caacutec kỹ sư trao đổi trực tiếp với caacutec chuyecircn gia Expert-driven Caacutec chuyecircn gia trực tiếp đưa chuyecircn mocircn của họ vagraveo hệ

thống maacutey tiacutenh Machine-driven Sử dụng caacutec cocircng cụ suy luận để triacutech xuất tri thức từ một

tập caacutec viacute dụ

6 Kỹ thuật thu thập tri thức Trao đổi gồm 2 loại cơ bản lagrave coacute cấu truacutec(coacute kịch bản) vagrave khocircng coacute cấu

truacutec( đối thoại trực tiếp) Giao thức phacircn tiacutech bằng lời Khi caacutec chuyecircn gia thực hiện một cocircng việc

của họ thigrave một bản ghi về cocircng việc đoacute được thực hiện Caacutec kỹ sư sẽ xacircy dựng mocirc higravenh cho những gigrave được ghi lại trong bản ghi

Phương phaacutep sagraveng lọc caacutec chuyecircn gia so saacutenh caacutec nhoacutem liecircn tiếp trong ba đối tượng vagrave cho biết tại sao nhoacutem thứ hai lại khaacutec nhoacutem thứ ba

7 Thu thập tri thức từ nhiều nguồn Thu thập tri thức từ nhiều nguồn lagrave cần thiết để coacute được đầy đủ caacutec tri thức

cho một vấn đề quan điểm yacute kiến traacutei ngược nhau thường phaacutet sinh Phương phaacutep đồng thuận sẽ giuacutep giải quyết được vấn đề macircu thuẫn Kỹ thuật phacircn tiacutech Meta lagrave kỹ thuật được aacutep dụng trong caacutec trường hợp

khaacutec Caacutech tiếp cận bằng định lượng đogravei hỏi caacutec kỹ sư cần cacircn nhắc yếu tố đầu vagraveo của caacutec chuyecircn gia khaacutec nhau

8 Xaacutec nhận hợp lệ vagrave kiểm tra tri thức Một khi thu thập tri thức noacute phải được đaacutenh giaacute về khả năng sử dụng vagrave độ

chiacutenh xaacutec Hai vấn đề cụ thể lagrave hiệu lực của những kiến thức vagrave kiểm tra việc xacircy dựng cơ sở của tri thức

Cần xaacutec nhận xem liệu hệ thống coacute thể hoạt động ở mức độ tối thiểu khocircng

Xaacutec minh liecircn quan đến việc so saacutenh từng chi tiết kỹ thuật của hệ thống những gigrave đatilde được thực hiện cuối cugraveng

9 Một số caacutec biện phaacutep xaacutec nhận Độ chiacutenh xaacutec Khả năng thiacutech nghi Mức độ đầy đủ Bề rộng Độ sacircu Hiệu lực Tổng quan Chiacutenh xaacutec Hiện thực Độ tin cậy Tiacutenh hữu dụng Mức độ

Chương 9 Học maacutey

1 Logic mờ vagrave ngocircn ngữ mờ(Fuzzy Logic and Linguistic Ambiguity)

Ngocircn ngữ tự nhiecircn gồm những khaacutei niệm mơ hồ vagrave khocircng chiacutenh xaacutectruyền tải ngữ nghĩa thocircng qua tiacutenh xấp xỉkhocircng rotilde ragraveng

Những xấp xỉ nagravey giuacutep con người coacute thể truyền tải hết được yacute nghĩa nhưng maacutey thigrave khocircng hiểu

Lagravem sao biểu diễn caacutec tri thức sử dụng caacutec khaacutei niệm khocircng rotilde ragraveng(mờ) hoặc khocircng chiacutenh xaacutec

2 Khaacutei niệm cơ bản của logic mờ tập mờ lagrave những tập hợp khocircng coacute một giới hạn rotilde Mỗi phần tử của noacute chỉ

chứa một mức độ hagravem liecircn thuộc của từng phần tử Vigrave vậy tập mờ khocircng giống như tập cổ điển Tập mờ coacute thể kết hợp với nhau qua những luật mờ magrave đặc trưng cho những hagravenh động trạng thaacutei vagrave thuộc tiacutenh của logic mờ được tận dụng khi thực hiện một bộ điều khiển mờ

Logic mờ dựa trecircn yacute tưởng mỗi phần tử thuộc vagraveo một tập hợp ở một mức độ nagraveo đấy

Locircgic mờ cho pheacutep độ liecircn thuộc (microA )coacute giaacute trị trong khoảng (01) Locircgic mờ coacute thể được coi lagrave mặt ứng dụng của lyacute thuyết tập mờ để xử lyacute caacutec

giaacute trị trong thế giới thực cho caacutec bagravei toaacuten phức tạp

3 So saacutenh tiacutenh đuacuteng đắn logic mờ vagrave xaacutec suất Xaacutec suất thigrave đề cập đến khả năng xảy ra một biến cố hay một điều gigrave đoacute Logic mờ đề cập đến cấp độ magrave đặc tiacutenh ở hiện tại

o viacute dụ1 người coacute chiều cao 6 feet thigrave coacute cấp độ lagrave 05 về chiều cao

4 Ưu điểm của logic mờ Caacutech tiếp cận rất tự nhiecircnkhocircng phức tạp Coacute thể mocirc higravenh hoacutea caacutec hagravem phi tuyến tugravey yacute phức tạp

Coacute thể tận dụng được kinh nghiệm từ những chuyecircn gia hagraveng đầu trong mọi lĩnh vực

Logic mờ được xacircy dựng dựa trecircn ngocircn ngữ tự nhiecircnNền tảng của logic mờ lagrave dựa trecircn cơ sở giao tiếp của con người

5 Nhược điểm của logic mờ Trong 1 hệ thống phức tạpsử dụng logic mờ coacute thể trở thagravenh trở ngại cho

việc xaacutec thực độ tin cậy của hệ thống Cơ chế lập luận mờ khocircng thể học hỏi từ những lỗi sai

6 Mạng noron nhacircn tạo(ANN) Mạng noron nhacircn tạo lagrave một mocirc phỏng xử lyacute thocircng tinđược nghiecircn cứu ra

từ hệ thống thần kinh của sinh vậtgiống như bộ natildeo để xử lyacute thocircng tin ANNs lagrave chương trigravenh dựa trecircn maacutey tiacutenh đơn giản coacute chức năng lagrave một mocirc

higravenh bagravei toaacuten khocircng gian dựa trecircn thử nghiệm vagrave baacuteo lỗi

7 Học từ kinh nghiệm Tiến trigravenh Một mẫu dữ liệu được biểu diễn như một mạng lưới noronANN ldquodự

đoaacutenrdquo 1 đầu radự đoaacuten được so saacutenh với giaacute trị thực tế hoặc giaacute trị chiacutenh xaacutecNếu đoaacuten được chiacutenh xaacutec thigrave khocircng coacute hagravenh động nagraveo được thực hiện

Nếu dự đoaacuten sai ANN kiểm tra lại vagrave xaacutec định lại thocircng số để điều chỉnh Một mẫu dữ liệu khaacutec được biểu diễn vagrave quaacute trigravenh nagravey được lặp lại

8 Nguyecircn tắc cơ bản của cocircng nghệ nơron Caacutec yếu tố xử lyacute cơ bản trong hệ thống thần kinh của con người lagrave tế bagraveo

thần kinhMạng lưới của tế bagraveo nagravey lagrave liecircn kết với nhau nhận được thocircng tin từ caacutec cảm biến trong mắt taihellip

Thocircng tin nhận được bởi tế bagraveo thần kinh hoặc lagrave sẽ kiacutech thiacutech noacute(sẽ được chuyển qua 1 thocircng điệp dọc theo mạng lưới) hoặc lagrave sẽ ngăn cản noacute(ngăn cản dograveng thocircng tin)

Độ nhạy coacute thể thay đổi qua thời gian hoặc sau khi coacute được kinh nghiệm

9 Cấu truacutec mạng Một ANN gồm 3 lớp cơ bản

Lớp đầu vagraveo nhận dữ liệu Lớp becircn trong hoặc lagrave lớp ẩn xử lyacute dữ liệu Lớp đầu ra chuyển tiếp kết quả cuối cugraveng của mạng

10Mạng nơ ron Thường coacute nhiều đầu vagraveo mỗi đầu vagraveo với mức ảnh hưởng vagrave tầm quan

trọng riecircng của noacute Một đầu vagraveo quan trọng coacute thể được sử dụng để khuếch đại đầu ra caacutec hagravem trạng thaacutei tổng hợp caacutec trọng số của caacutec yếu tố

đầuvagraveo khaacutec nhauvagraveo một giaacute trị duy nhất Caacutec hagravem chuyển giao xử lyacute caacutec giaacute trị trạng thaacutei vagrave tạo đầu ra

11Huấn luyện mạng nơ ron Trong mocirc higravenh coacute giaacutem saacutetANN được đến so saacutenh dự đoaacuten của chiacutenh

noacute với thocircng tin phản hồi coacute chứa caacutec kết quả mong muốn ANN sẽ phải tigravem caacutech thay đổi caacutec tham số becircn trong củamigravenh (caacutec trọng số vagrave caacutec ngưỡng) để tạo necircn một aacutenh xạ coacute khả năng aacutenh xạcaacutec đầu vagraveo thagravenh caacutec đầu ra mong muốn Sự thay đổi nagravey được tiến hagravenh nhờ việc so saacutenh giữa đầu ra thực sự vagrave đầu ra mong muốn

Trong mocirc higravenh khocircng coacute giaacutem saacutetANN nhận được dữ liệu vagraveo nhưng khocircng phải coacute bất kỳ thocircng tin phản hồi về kết quả mong muốn

Phần lớn caacutec ứng dụng nằm trong vugraveng của caacutec bagravei toaacuten ước lượng như mocirc higravenh hoacuteathống kecirc neacuten lọc phacircn cụm

12Lợi iacutech Liecircn kết với mạng noron Traacutenh caacutech lập trigravenh tường minh Giảm nhu cầu của chuyecircn gia ANNs thigrave thiacutech nghi với caacutec yếu tố đầu vagraveo thay đổi Khocircng cần thiết cho cơ sở tri thức tinh chế ANNs coacute tiacutenh động vagrave cải thiện với việc sử dụng Coacute khả năng xử lyacute dữ liệu khocircng chiacutenh xaacutec hoặc khocircng đầy đủ Cho pheacutep tổng quaacutet hoacutea từ thocircng tin cụ thể Cho pheacutep thu thập cảm giaacutec thocircng thường vagraveo miền giải quyết vấn đề

13Hạn chế của việc liecircn kết với mạng noron ANNs khocircng thể giải thiacutech được suy luận Bản chất hộp đen thường khiến cho vấn đề traacutech nhiệm vagrave độ tin cậy phaacutet

sinh lagrave khoacute khăn Lặp đi lặp lại quaacute trigravenh huấn luyện rất tốn thời gian Nguồn lực caacutec nhagrave phacircn tiacutech vagrave thiết kế coacute tay nghề cao vẫn lagrave đaacuteng lo

ngại Cocircng nghệ ANN thuacutec đẩy hạn chế của phần cứng hiện tại ANN yecircu cầu phải coacute sự tin tưởng ở đầu ra

14Giới thiệu về thuật toaacuten di truyền Cũng như mạng lưới thần kinh caacutec thuật toaacuten di truyền được dựa trecircn lyacute

thuyết sinh học Thuật toaacuten di truyền tigravem thấy nguồn gốc của chuacuteng trong caacutec lyacute thuyết

tiến hoacutea của chọn lọc tự nhiecircn vagrave thiacutech ứng với biến đổi khiacute hậu Kết quả thuật toaacuten di truyền lagrave từ giao phối 2 caacute thể trong quần thế để tạo

ra con caacutei đocirci khi tốt hơn so với bậc cha mẹ của chuacuteng 15Caacutec thagravenh phần cơ bản của thuật toaacuten di truyền

Toaacuten tử chọn lọc Caacutec caacute thể tốt được chọn lọc để đưa vagraveo thế hệ sau Sự chọn lọc nagravey căn cứ vagraveo độ thiacutech nghi với mocirci trường của mỗi caacute thể

Toaacuten tử lai gheacutep (crossover) Hai caacute thể cha vagrave mẹ trao đổi caacutec gen với nhau để tạo ra caacute thể con

Toaacuten tử đột biến (mutation) Một caacute thể thay đổi một số gen để biến đổi thagravenh một caacute thể mớiTất cả caacutec toaacuten tử trecircn khi thực hiện đều mang tiacutenh ngẫu nhiecircn

16Quaacute trigravenh cơ bản của một thuật toaacuten di truyền Khởi tạo

Đaacutenh giaacute quần thể

Lựa chọn NST thiacutech hợp nhất vagrave loại bỏ NST yếu nhất

Quy trigravenh giao nhau vagrave cải thiện quần thể

đột biến tiến trigravenh để khaacutem phaacute ra NST mới

17Ưu nhược điểm của việc kết hợp với thuật toaacuten di truyền Kiacutech thước quần thể lagrave 1 yếu tố quan trọng trong tốc độ của việc tigravem

kiếmnhưng noacute tương đối dễ dagraveng để dự đoaacuten tốc độ nagravey Giao nhau hoặc đột biến lagrave khocircng necircn đc sử dụng quaacute thường xuyecircn Luocircn coacute được iacutet nhất 1 giải phaacutep hợp lyacute Necircn coacute thể aacutep dụng chuacuteng cho caacutec vấn đề magrave chuacuteng ta khocircng coacute hướng

về caacutech giải quyết Sức mạnh của thuật toaacuten xuất phaacutet từ khaacutei niệm đơn giảnkhocircng phải từ

một thủ tục thuật toaacuten phức tạp 18Tương lai của học maacutey

Mạng lưới thần kinh nhacircn tạo vượt quaacute năng lực của con người trong caacutec trường hợp bị cocirc lập

Về mặt lyacute thuyếtmột maacutey tiacutenh coacute thể xử lyacute dũ liệu nhanh hơn hagraveng triệu lần so với 1 con người

May mắn thay cho chuacuteng tacon người tốt hơn nhiều khi magrave coacute được dữ liệumaacutey tiacutenh khocircng coacute 1 số thứ như lagrave 5 giaacutec quan

CHƯƠNG 10 KHO DỮ LIỆU

1 Kho dữ liệu Kho dữ liệu lagrave tuyển tập caacutec cơ sở dữ liệu tiacutech hợp hướng chủ đề được

thiết kế để trợ giuacutep cho một hệ hỗ trợ quyết định

Theo John Ladley Cocircng nghệ kho dữ liệu lagrave tập caacutec phương phaacutep kỹ thuật vagrave caacutec cocircng cụ coacute thể kết hợp hỗ trợ nhau để cung cấp thocircng tin cho người sử dụng trecircn cơ sở tiacutech hợp từ nhiều nguồn dữ liệu nhiều mocirci trường khaacutec nhau

Kho dữ liệu thường rất lớn tới hagraveng trăm GB hay thậm chiacute hagraveng Terabyte

2 Kho dữ liệu vận hagravenh (ODS) Một kho dữ liệu vận hagravenh Aacutep dụng kỹ thuật kho dữ liệu vagraveo caacutec hệ xử

lyacute giao taacutec lưu trữ dữ liệu cho một ứng dụng đặc thugrave Noacute đưa vagraveo kho dữ liệu một dograveng caacutec dữ liệu thocirc được thiết kế

3 So saacutenh

Kho dữ liệu vận hagravenh Kho dữ liệu

Dữ liệu theo chủ đề Dữ liệu theo chủ đề

Dữ liệu tiacutech hợp Dữ liệu tiacutech hợp

Dữ liệu thay đổi Dữ liệu khocircng thay đổi

Dữ liệu được cập nhật khi thay đổi

Dữ liệu giữ nguyecircn

Chỉ coacute dữ liệu hiện tạiDữliệu hiện tại vagrave dữ liệu lịch sử

Chu kỳ lagravem tươi dữ liệu ngắn Chu kỳ lagravem tươi dữ liệu dagravei

Chỉ coacute dữ liệu chi tiết Dữ liệu chi tiết vagrave dữ liệu tổng kết

Dugraveng cho caacutec quyết định ngắn hạn

Dugraveng cho hoạch định dagravei hạn

4 Kho dữ liệu cục bộ (Data Mart - DM)

Kho dữ liệu cục bộ lagrave CSDL coacute những đặc điểm giống với kho dữ liệu nhưng với quy mocirc nhỏ hơn vagrave lưu trữ dữ liệu về một lĩnh vực một chuyecircn ngagravenh

Data mart phụ thuộc Chứa những dữ liệu được lấy từ DW vagrave những dữ liệu nagravey sẽ được triacutech lọc vagrave tinh chế tiacutech hợp lại ở mức cao hơn để phục vụ một chủ đề nhất định của Datamart

Data mart độc lập Khocircng giống như Datamart phụ thuộc Data mart độc lập được xacircy dựng trước DW vagrave dữ liệu được trực tiếp lấy từ caacutec nguồn khaacutec nhau

5 Siecircu dữ liệu Metadata lagrave dữ liệu để mocirc tả dữ liệu Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột

một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi Metadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu

6 Mocirci trường kho dữ liệu Hệ thống của tổ chức vagrave kho cung cấp dữ liệu để xacircy dựng kho dữ liệu Trong quaacute trigravenh chuyển dữ liệu từ caacutec nguồn khaacutec nhau dữ liệu coacute thể

được lagravem sạch hoặc chuyển đổi vagrave vigrave thế DW được xem như lagrave một chuẩn cho việc lưu trữ

Đồng thời siecircu dữ liệu được ghi lại Cuối cugraveng DW hoặc siecircu thị coacute thể được sử dụng để tạo ra một kho dữ

liệu ldquocaacute nhacircnrdquo 7 Caacutec đặc điểm của kho dữ liệu

Đặc điểm Mocirc tả

Hướng chủ đề - DL tổ chức theo caacutech thức người dugraveng tham chiếu

Tiacutech hợp - Dữ liệu ldquosạchrdquo loại bỏ tiacutenh thiếu nhất quaacuten

Khocircng thay đổi - DL ldquochỉ đọcrdquo người dugraveng khocircng thay đổi được

Chuỗi thời gian - DL lagrave chuỗi thời gian khocircng phải lagrave trạng thaacutei hiện tại

Được tổng kết - DL vận hagravenhthao taacutec khi cần thiết

được kết hợp lại thagravenh dạng coacute thể dugraveng được cho quyết định

Kiacutech cỡ lớn hơn - Lưu giữ theo chuỗi thời gian tức lagrave giữ lại nhiều DL

Khocircng được chuẩn hoacutea - Coacute thể dư thừa DLSiecircu dữ liệu - Dữ liệu của dữ liệu được lưu trữNguồn dữ liệu - DL vận hagravenh (caacutec hệ sẵn coacute) cugraveng

với caacutec nguồn ngoagravei 8 Kho dữ liệu hướng chủ đề

Hướng chủ để coacute nghĩa lagrave kho dữ liệu được tổ chức xung quanh caacutec chủ đề chiacutenh như khaacutech hagraveng sản phẩm sản xuất Tập trung vagraveo việc mocirc higravenh hoacutea vagrave phacircn tiacutech dữ liệu cho caacutec nhagrave ra quyết định magrave khocircng tập trung vagraveo caacutec xử lyacute thocircng thường Cung cấp cho người dugraveng một khung nhigraven toagraven vẹn đơn giản vagrave đầy đủ về caacutec sự kiện quanh caacutec chủ đề

9 Dữ liệu trong DW được tiacutech hợp Dữ liệu trong kho dữ liệu được xacircy dựng bằng caacutech tổng hợp dữ liệu từ

nhiều nguồn khaacutec nhau vagrave caacutec nguồn coacute tổ chức khaacutec nhau Cơ sở dữ liệu caacutec file excel caacutec flat file hoặc caacutec raw file Khi đưa vagraveo kho dữ liệu caacutec dữ liệu được lagravem sạch vagrave tiacutech hợp dữ liệu nhằm đảm bảo tiacutenh nhất quaacuten của dữ liệu

10Kiến truacutec kho dữ liệu Tầng cơ sở dữ liệu hoạt động Tầng truy xuất thocircng tin Tầng truy xuất dữ liệu Tầng siecircu dữ liệu Tầng quản lyacute tiến trigravenh Tầng thocircng điệp của ứng dụng Tầng vật liacute của kho dữ liệu Tầng trigravenh diễn dữ liệu

11Higravenh trạng kho dữ liệu Kho dữ liệu ảo - người dugraveng cuối coacute thể truy cập trực tiếp đến kho dữ liệu

sử dụng caacutec cocircng cụ cho pheacutep ở tầng truy xuất dữ liệu Kho dữ liệu trung tacircm-1 cơ sở dữ liệu vật lyacute chứa tất cả dữ liệu cho một

vugraveng chuyecircn dụng nagraveo đoacute

Kho dữ liệu phacircn taacuten- Thagravenh phần được phacircn taacuten qua nhiều hệ cơ sở dữ liệu vật lyacute

12METADATA- Siecircu dữ liệu Định nghĩa Siecircu dữ liệu lagrave dữ liệu về dữ liệu Lagrave 1 lưu trữ dugraveng để

Miecircu tả kho dữ liệu tổng thể Nhận dạng kiểu kho dữ liệu Quản liacute quaacute trigravenh tiacutech hợp dữ liệu Quản liacute quaacute trigravenh cập nhật kho dữ liệu Quản liacute bảo mật

Lagrave chigravea khoacutea quyết định sự thagravenh cocircng của kho dữ liệu luocircn được thay đổi vagrave cập nhật theo sự phaacutet triển của kho dữ liệu

Dugraveng để quản liacute điều khiển kho dữ liệu Sự ra đời của kho dữ liệu như 1 cấu truacutec hỗ trợ ra quyết định siecircu dữ liệu

được xem như nguồn tagravei nguyecircn dữ liệu Siecircu dữ liệu lagrave trừu tượng Chuacuteng lagrave dữ liệu bậc cao cung cấp mocirc tả ngắn

gọn caacutec dữ liệu bậc thấp hơn 13Hoạt động của Siecircu dữ liệu

Siecircu dữ liệu rất cần thiết trong việc chuyển hoacutea thocircng tin trở thagravenh tri thức Lagrave chigravea khoacutea giuacutep chuacuteng ta xử lyacute được dữ liệu thocirc Viacute dụ một dograveng dữ liệu baacuten hagraveng 1023 K596 11121 agraveNoacute sẽ khocircng coacute nghĩa gigrave cho đến khi chuacuteng ta đưa vagraveo siecircu dữ liệu (thư

mục chứa dữ liệu) agrave cửa hagraveng 1023 sản phẩm K596 vagrave số tiền baacuten được lagrave 11121 đocirc la

14Sự cần thiết phải nhất quaacuten trong kho dữ liệu Kho dữ liệu được xacircy dựng cho lợi iacutech của những nhagrave phacircn tiacutech kinh

doanh caacutec nhagrave quản trị cho tất cả caacutec khu vực chức năng Trong cơ sở dữ liệu riecircng caacutec khu vực khaacutec nhau coacute thể định nghĩa vagrave lưu

trữ dữ liệu thocircng qua phiecircn bản của chiacutenh noacute Khi dữ liệu được lấy từ những vugraveng khaacutec nhau đoacute vagrave được đặt vagraveo kho dữ

liệu Việc chuyển đổi vagrave lagravem sạch caacutec tiến trigravenh sẽ đảm bảo noacute lagrave duy nhất được tiacutech hợp tại một mức của tổ chức

15Ragrave soaacutet lại dữ liệu ndash Thực thi siecircu dữ liệu

Bất kể cấu truacutec tự nhiecircn của 1 cacircu truy vấn thế nagraveo thigrave caacutec thagravenh phần của siecircu dữ liệu rất quan trọng đối với người ra quyết định

Bảng thuộc tiacutenh khoacutea được lưu trữ bởi kho dữ liệu Tập hợp dữ liệu được lấy từ đacircu Những chuyển đổi nagraveo được thực thi với việc lagravem sạch

16Siecircu dữ liệu lagrave gigrave Metadata - lagrave thocircng tin mocirc tả nội dung của cơ sở dữ liệu (CSDL) Metadata baacuteo cho người dugraveng biết thời gian cập nhật sau cugraveng của dữ liệu

định dạng vagrave mục điacutech sử dụng của noacute Những thocircng tin nagravey coacute thể hướng dẫn người dugraveng duyệt qua CSDL vagrave

giuacutep họ hiểu được yacute nghĩa vagrave ngữ cảnh của dữ liệu Trong CSDL metadata lagrave caacutec dạng biểu diễn khaacutec nhau của caacutec đối tượng

trong CSDL Trong CSDL quan hệ metadata lagrave caacutec định nghĩa của bảng cột CSDL

view vagrave nhiều đối tượng khaacutec Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột

một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi -gtMetadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu

Bảng chuyển đổi Ghi lại những chuyển đổi đatilde được thực hiện

Lịch sử thực thi Ghi lại những dữ liệu đatilde được

phacircn tiacutech

Higravenh thaacutei kết nốiGhi lại những dữ liệu được kết nối vagrave tần suất

17Aacutenh xạ thocircng thường của siecircu dữ liệu Bản ghi aacutenh xạ chuyển đổi bao gồm

Định danh của nguồn gốc Chuyển đổi thuộc tiacutenh Chuyển đổi thuộc tiacutenh vật lyacute Matilde hoacutea tham chiếu bảng chuyển đổi Đổi tecircn Đổi khoacutea Gaacuten giaacute trị cho thuộc tiacutenh mặc định Chọn logic cho caacutec nguồn nhiều giaacute trị Đổi thuật toaacuten

18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để

phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai

lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave

tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec

Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm

Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo

19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua

caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau

SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được

Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra

một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức

Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ

Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ

Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech

CHƯƠNG 11 KHAI PHAacute DỮ LIỆU

1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn

ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993

Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng

2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd

1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều

2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP

3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn

4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng

5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server

6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo

7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động

8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời

9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều

10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện

11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech

12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP

3 Xử lyacute phacircn tiacutech trực tuyến OLAP

MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave

dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu

ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave

thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu

HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave

ROLAP4 Khai phaacute dữ liệu

Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh

khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn

Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan

5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp

6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại

Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp

Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec

Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt

Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra

Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh

vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho

Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec

Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm

Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục

Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng

gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp

Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn

Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec

Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper

Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2

Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25

Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước

Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng

Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện

trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp

Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute

độ hỗ trợ ge ngưỡng minsup

độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan

Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn

Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết

Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu

MOLAP ROLAP HOLAP

Lưu trữ dữ liệu cơ sở

Khối Bảng quan hệ Bảng quan hệ

Lưu trữ thocircng tin tổng hợp

Khối Bảng quan hệ Khối

Hiệu suất thực hiện truy vấn

Nhanh nhất Chậm nhất Nhanh

Tiecircu thụ khocircng gian lưu trữ

Nhiều Thấp Trung bigravenh

Chi phiacute bảo trigrave Cao Thấp Trung bigravenh

Page 7: De cuong(1-11)

Tổng thể 1 tổ chức sẽ mạnh mẽ hơn rất nhiều so với tất cả caacutec thagravenh phần của noacute cộng lại

Mối liecircn hệ của caacutec quyecirct định Mục điacutech chiacutenh của caacutec tổ chức lagrave đưa ra caacutec quyết định trong mocirci trường kinh doanh Caacutec Quyết định phải phugrave hợp với giới hạncaacutec chiacutenh saacutech caacutec thủ tục vagrave lĩnh vực hoạt động Noacute khocircng phụ thuộc vagraveo người đưa ra quyết định lagrave ai Đoacute coacute thể lagrave 1 caacute nhacircn1 nhoacutem hay thậm chiacute DSSs

Độ đo của quyết địnhNăm khiacutea cạnh ảnh hưởng tới Quyết định

Kết cấu nhoacutem (Group Structure) Vai trograve trong nhoacutem(Group Roles) Quaacute trigravenh lagravem việc(Group Processes) Taacutec phong(Group Style) Quy tăc nhoacutem(Group Norm)

Kết cấu nhoacutem Trong 1 nhoacutem chuẩn caacutec thagravenh viecircn coacute traacutech nhiệm vagrave thẩm quyền ra quyết định như nhau Vai trograve trong nhoacutemTrong nhoacutem caacutec thagravenh viecircn đều coacute vai trograve riecircng vagrave

lagrave 1 phần quan trong trong cả tiến trigravenh Quaacute trigravenh lagravem việcQuaacute trigravenh dugraveng người trong nhoacutem ảnh hưởng tới loại

quyết định gacircy hiệu quả vagrave ảnh hưởng tới cả tiến trigravenh Taacutec phong Coacute phải taacutec phong của người ra quyết định coacute ảnh hưởng tới

chất lượng quyết định cuối khocircng Quy tắc nhoacutemQuy tắc nhoacutem lagrave cực kỳ quan trọng trong việc xaacutec định

hagravenh vi caacutec thagravenh viecircn nhoacutem trong caacutec tigravenh huống xatilde hội Phacircn cấp quyết định trong tổ chức3 cấp

Chiến lược Ban latildenh đạo cấp cao hoặc nhagrave quản lyacute Caacutec quyết định mang tiacutenh lacircu dagravei nhất

Chiến thuật Quản lyacute tầm trung Thực thi caacutec quyết định chiến lược đề ra

Thực hiện

Caacute nhacircn chuyecircn ngagravenh Tự đưa ra caacutec quyết định từng ngagravey

15Năng lực của hệ HTQD

1 HHTQĐ cơ bản hỗ trợ caacutec nhagrave ra quyết định trong caacutec tigravenh huống nửa cấu truacutec vagrave phi cấu truacutec bằng caacutech kết hợp phaacuten xử của con người vagrave xử lyacute thocircng tin bằng maacutey tiacutenh Caacutec bagravei toaacuten như vậy khocircng thểkhocircng thuận tiện giải quyết được chỉ bằng caacutec cocircng cụ maacutey tiacutenh hoacutea hay caacutec phương phaacutep định lượng 2 Phugrave hợp cho caacutec cấp quản lyacute khaacutec nhau từ cao đến thấp 3 Phugrave hợp cho caacute nhacircn lẫn nhoacutem Caacutec bagravei toaacuten iacutet coacute tiacutenh cấu truacutec thường liecircn đới đến nhiều caacute nhacircn ở caacutec đơn vị chức năng hay mức tổ chức khaacutec nhau cũng như ở caacutec tổ chức khaacutec 4 Hỗ trợ cho caacutec quyết định tuần tự liecircn thuộc được đưa ra một lần vagravei lần hay lặp lại 5 Hỗ trợ cho caacutec giai đoạn của quaacute trigravenh ra quyết định tigravem hiểu thiết kế lựa chọn vagrave hiện thực 6 Phugrave hợp cho một số caacutec phong caacutech vagrave quaacute trigravenh ra quyết định 7 Coacute thể tiến hoacutea theo thời gian Người dugraveng coacute thể thecircm bỏ kết hợp thay đổi caacutec phần tử cơ bản của hệ thống 8 Dễ dugraveng vagrave thacircn thiện với người dugraveng 9 Nhằm vagraveo nacircng cao tiacutenh hiệu dụng của quyết định (chiacutenh xaacutec thời gian tiacutenh chất lượng) thay vigrave lagrave tiacutenh hiệu quả (giaacute phiacute của việc ra quyết định) 10 Người ra quyết định kiểm soaacutet toagraven bộ caacutec bước của quaacute trigravenh ra quyết định HHTQĐ chỉ trợ giuacutep khocircng thay thế người ra quyết định 11 Người dugraveng cuối cugraveng coacute thể tự kiến tạo vagrave sửa đổi caacutec hệ thống nhỏ vagrave đơn giản 12 Thường dugraveng mocirc higravenh để phacircn tiacutech caacutec tigravenh huống ra quyết định 13 Cung ứng caacutec truy đạt dữ liệu từ nhiều nguồn dạng thức vagrave kiểu khaacutec nhau 14 Coacute thể dugraveng như một cocircng cụ độc lập hay kết hợp với caacutec HHTQĐứng dụng khaacutec dugraveng đơn lẻ hay trecircn một mạng lưới maacutey tiacutenh (intranet extranet) bất kỳ với cocircng nghệ WEB

16Văn hoacutea tổ chứcVăn hoacutea của tổ chức lagrave tập hợp của rất nhiều thứ (lograveng tin biểu tượng đặc trưng regraven luyện) được phaacutet triển qua thời gian dagravei

Noacute gacircy ra ảnh hưởng mạnh mẽ cograven hơn cả những hoạt động của tổ chức đoacute 10 đặc điểm văn hoacutea của tổ chức

Điều khiển Hệ thống khen thưởng Sự đồng nhất Chịu đựng xung đột Mocirc higravenh giao tiếp Hỗ trợ quản lyacute Sự hogravea nhập Định hướng Chịu đựng rủi ro Caacute nhacircn khởi xướng

Mối quan hệ của văn hoacutea với hiệu năng lagravem việc1 tổ chức thagravenh cocircng phải coacute xu hướng hogravea hợp giữa văn hoacutea với mocirci trường trong vagrave ngoagravei tổ chức

Phugrave hợp trong nội bộ cho thấy một sự kết hợp giữa văn hoacutea của tổ chức với những cocircng nghệ của chiacutenh noacute

Phugrave hợp với becircn ngoagravei cho thấy một nền văn hoacutea phugrave hợp với chiến lược thị trường

Văn hoacutea vagrave sự thay đổi 1 tổ chức magrave khocircng biết thay đổi văn hoacutea sẽ khocircng thể giữ được vị triacute của migravenh trecircn thị trường Caacutec cocircng ty xuất sắc luocircn biết caacutech tiacutech cực tiếp cận khaacutech hagraveng động viecircn đầu tư

17Quyền lực vagrave chiacutenh trịQuyền lực vagrave chiacutenh trị luocircn đi liền với nhau

aQuyền lựclagrave khả năng ảnh hưởng đến việc phacircn phối caacutec nguồn lực trong tổ chứcGồm 5 yếu tố cơ bản

Phacircn quyền Uy quyền Quyền lực caacute nhacircn Sức ảnh hưởng Chiacutenh trị

Một vagravei thagravenh phần của quyền lực ra quyết định Quyết định việc nagraveo coacute sẵn

Quyết định sản phẩm nagraveo được sản xuất Quyết định đầu tư vagraveo đacircu Quyền đặt vagrave quản lyacute quản lyacute giaacute Thanh toaacuten vagrave khấu trừ tiền latildei

bChiacutenh trị Yếu tố cốt lotildei trong quaacute trigravenh higravenh thagravenh chiến lược ra quyết định Chiacutenh trị liecircn quan tới việc ra quyết định thocircng qua đagravem phaacutenảnh hưởngvagrave higravenh

thagravenh sự nhất triacute Trong nhiều trường hợp noacute coacute thể cho ta sự linh hoạt hơn

18Hệ trợ giuacutep quyết định trong tổ chức DSS của 1 tổ chức hỗ trợ cocircng nghệ tập trung vagraveo caacutec quyết định ảnh hưởng tới

rất nhiều người 1 hệ thống DSS hiện đại coacute thể chấp nhận nhiều quyết định vượt qua những giới

hạn phacircn cấp truyền thống aCaacutec hoạt động gần DSS

Giải quyết caacutec nhiệm vụ đặc biệt Thu thập thocircng tin Liecircn lạc qua caacutec chi nhaacutenh Động thaacutei chiacutenh trị

Phacircn loại tư duy chiến lược cho DSS Sắp xếp quyết địnhXếp hạng quyết định sao cho thứ tự đứng trước thigrave được

ưu tiecircn trước Chia sẻ thocircng tinCaacutec quyecirct định coacute thể độc lập nhưng người ra quyết định

phải chia sẻ caacutec thocircng tin liecircn quan Lựa chọn đagravem phaacutenVagravei quyết định coacute thể xaacutec lập thocircng qua đagravem phaacuten vagrave kết

quả được lagravem đồng thờiKhocircng phải cocircng nghệ tự noacute coacute thể đưa ra quyết định magrave noacute nằm ở trigravenh độ cocircng nghệ hỗ trợ caacutec chiến lược quyết định quyền lực vagrave chiacutenh trị cugraveng phối hợp với nhau

Chương 4Mocirc higravenh hoacutea quaacute trigravenh ra quyết định

(Cấu truacutec của hệ HTQD)19Vấn đề Mocirc higravenh

bull Lagrave phần tử chủ chốt trong hầu hết hệ hỗ trợ quyết định vagrave lagrave điều kiện cần trong hệ hỗ trợ quyết định dựa vagraveo mocirc higravenh (model-based DSS)

bull Coacute nhiều lớp mocirc higravenh kegravem theo lagrave caacutec kỹ thuật xử lyacute thao taacutec mocirc higravenh đặc thugrave tương ứng

bull Caacutec vấn đề chiacutenh nhận diện bagravei toaacuten vagrave phacircn tiacutech mocirci trường nhận diện biến số dự baacuteo đa mocirc higravenh caacutec phạm trugrave mocirc higravenh quản lyacute mocirc higravenh vagrave mocirc higravenh hoacutea dựa vagraveo kiến thức

bull Mocirc higravenh hoacutea lagrave taacutec vụ khocircng đơn giản Người xacircy dựng mocirc higravenh phải cacircn bằng giữa tiacutenh đơn giản của mocirc higravenh với caacutec yecircu cầu biểu diễn để mocirc higravenh coacute thể nắm bắt đủ thực tại cần thiết cho người ra quyết định

bull Mocirc phỏng lagrave kỹ thuật mocirc higravenh hoacutea thocircng dụng dugraveng để tigravem hiểu vấn đề tuy khocircng nhất thiết phải tigravem ra được caacutec giải phaacutep biến thể mở rộng quaacute trigravenh ra quyết định của tổ chức vagrave cho pheacutep tổ chức xem xeacutet taacutec độngảnh hưởng của caacutec chọn lựa tương lai

bull Mocirc phỏng tiết kiệm rất nhiều chi phiacute vagrave thời gian ndash rất dễ thay đổi mocirc higravenh hoạt động của một hệ thống vật lyacute bằng mocirc higravenh hoacutea maacutey tiacutenh

bull Mocirc higravenh coacute thể được phaacutet triển vagrave cagravei đặt bằng một số caacutec ngocircn ngữ lập trinh (thế hệ 3 4 ) vagrave hệ thống phần mềm khaacutec nhau

Mocirc higravenh tĩnh vagrave động

bull Mocirc higravenh tĩnh thể hiện bức tranh tại thời điểm của tigravenh huống Caacutec khiacutea cạnh của bagravei toaacuten được xeacutet một thời kỳ nhất định trong một khung thời gian nhất định (coacute thể ldquocuốnrdquo về tương lai) Caacutec tigravenh huống được giả sử lagrave sẽ lập lại với tập caacutec điều kiện đồng nhất

1048713 Giả định coacute được tiacutenh ổn định của dữ liệu 1048713 Mocirc phỏng quaacute trigravenh dạng tĩnh - lagravem việc trecircn caacutec trạng thaacutei ổn định để tigravem ra caacutec

thocircng số tối ưu ndash thường được dugraveng như cocircng cụ chủ yếu để thiết kế quaacute trigravenh 1048713 vd quyết định sản xuấtmua 1 sản phẩm baacuteo caacuteo thu nhập hagraveng quyacutenăm bull Mocirc higravenh động biểu diễn caacutec kịch bản thay đổi theo thời gian 1048713 Phụ thuộc thời gian caacutec trạng thaacutei thay đổi theo thời gian 1048713 Thường dugraveng để tạo sinh vagrave biểu diễn caacutec xu hướng vagrave khuocircn mẫu theo thời gian 1048713 Mocirc phỏng động thể hiện caacutec diễn tiến khi caacutec điều kiện theo thời gian khaacutec với caacutec

trạng thaacutei ổn định ndash thường được dugraveng để thiết kế việc kiểm soaacutet caacutec hệ thống 1048713 VD dự baacuteo lời-lỗ trong 5 năm với caacutec nhập lượng như giaacute phiacute số lượng thay đổi

theo từng năm

Mocirc higravenh chắc chắn tương đối dễ phaacutet triển giải quyết vagrave coacute thể sinh ra caacutec giải phaacutep tối ưu 1048713 Caacutec bagravei toaacuten coacute một số lớnvocirc hạn caacutec giải phaacutep khả thi đặc biệt quan trọng 1048713 Caacutec mocirc higravenh tagravei chaacutenh được xacircy dựng trong điều kiện chắc chắn

Mocirc higravenh bất địnhbằng caacutech thu thập thecircm thocircng tin cố gắng đưa bagravei toaacuten trở về dạng chắc chắn hay dạng

rủi ro Mocirc higravenh rủi ro caacutec quyết định kinh doanh được đưa ra dưới caacutec rủi ro giả định

1048713 Đocirci khi biết được xaacutec suất của caacutec sự kiện xảy ra trong tương lai 1048713 Caacutec trường hợp khaacutec (bất định) ước lượng caacutec rủi ro vagrave giả sử caacutec tigravenh huống rủi ro

xảy ra 20Mocirc higravenh hoacutea

MOcirc HIgraveNH HOacuteA BẰNG BẢNG TIacuteNH bull Bảng tiacutenh phần mềm mạnh linh hoạt vagrave dễ dugraveng cho pheacutep tạo sinh caacutec ứng dụng trong kinh doanh kỹ thuật toaacuten vagrave khoa học với tập caacutec hagravem mạnh về tagravei chaacutenh thống kecirc toaacuten bull Kegravem theo lagrave caacutec thagravenh phần cộng thecircm (add-ins) giuacutep xacircy dựng vagrave giải caacutec lớp mocirc higravenh đặc thugrave bull Lagrave cocircng cụ mocirc higravenh hoacutea thocircng dụng nhất của người dugraveng cuối cugraveng bull Coacute caacutec chức năng về phacircn tiacutech ldquowhat-ifrdquo dograve tigravem mục tiecircu quản lyacute dữ liệu vagrave lập trigravenh (dạng macro) bull Coacute khả năng đọc ghi caacutec cấu truacutec tập tin thocircng dụng để giao tiếp được với caacutec CSDL vagrave cocircng cụ khaacutec bull Coacute thể xacircy dựng mocirc higravenh tĩnh vagrave động bull Dugraveng trecircn maacutey tiacutenh caacute nhacircn vagrave maacutey tiacutenh lớn

bull Cơ sở để xacircy dựng caacutec bảng tiacutenh đa chiều vagrave caacutec cocircng cụ xử lyacute phacircn tiacutech trực tuyến (OLAP) MOcirc HIgraveNH HOacuteA BẰNG PHAcircN TIacuteCH QUYẾT ĐỊNH bull Tiếp cận mocirc higravenh hoacutea caacutec tigravenh huống quyết định coacute một số hữu hạnkhocircng quaacute nhiều caacutec phương aacuten ndash mỗi phương aacuten được trigravenh ra dưới dạng bảng hay đồ thị - caacutec kết quả tương ứng (dự baacuteo được kegravem xaacutec suất) theo mục tiecircu bagravei toaacuten ndash từ đoacute chọn phương aacuten tốt nhất bull Đơn mục tiecircu bảng quyết định hay cacircy quyết định bull Đa mục tiecircu AHP (analytic hierarchy process) khaacutec

MOcirc HIgraveNH HOacuteA BẰNG QUY HOẠCH TOAacuteN

bull Quy hoạch toaacuten học (mathematical programming) lagrave họ caacutec cocircng cụ giải quyết caacutec bagravei toaacuten quản lyacute theo đoacute người ra quyết định phải cấp phaacutet caacutec tagravei nguyecircn khan hiếm cho caacutec hoạt động cạnh tranh nhau (caacutec phương aacuten) nhằm tối ưu hoacutea mục tiecircu coacute khả năng đo lường được bull Caacutec mocirc higravenh quy hoạch tuyến tiacutenh (linear programming) thocircng dụng nhất trong quy hoạch toaacuten coacute nhiều ứng dụng trong thực tế được dugraveng nhiều trong caacutec hệ hỗ trợ quyết định bull Bagravei toaacuten quy hoạch tuyến tiacutenh 1048713 Caacutec biến quyết định (cần tigravem giaacute trị) 1048713 Hagravem mục tiecircu (hagravem toaacuten học dạng tuyến tiacutenh xaacutec định quan hệ giữa biến quyết định vagrave mục tiecircu đo lường mức độ đạt đạt mục tiecircu vagrave cần được tối ưu hoacutea) 1048713 Caacutec hệ số của hagravem mục tiecircu (cho biết mức đoacuteng goacutep vagraveo mục tiecircu của 1 đơn vị biến quyết định) 1048713 Ragraveng buộc (biểu thức tuyến tiacutenh cho biết giới hạn tagravei nguyecircn vagravehay caacutec quan hệ giữa caacutec biến số) 1048713 Dung lượng (mocirc tả cận trecircn vagrave dưới của caacutec biến vagrave ragraveng buộc) 1048713 Hệ số (cocircng nghệ) vagraveo-ra (cho biết mức độ sử dụng tagravei nguyecircn của biến quyết định) bull Đặc điểm của bagravei toaacuten quy hoạch tuyến tiacutenh 1048713 Tagravei nguyecircn kinh tế của bagravei toaacuten lagrave coacute hạn vagrave sẵn sagraveng 1048713 Coacute nhiều caacutech (gt2 caacutech) sử dụng tagravei nguyecircn được gọi lagrave giải phaacutep hay chương trigravenh 1048713 Mỗi hoạt động dugraveng tagravei nguyecircn đều sinh ra kết quả dưới dạng mục tiecircu đatilde phaacutet biểu trước 1048713 Việc cấp phaacutet nằm trong caacutec ragraveng buộc cho trước bull Giả định của bagravei toaacuten quy hoạch tuyến tiacutenh 1048713 Caacutec kết quả của caacutec cấp phaacutet coacute thể đem so saacutenh với nhau coacute thể đo lường bằng một đơn vị chung

1048713 Caacutec cấp phaacutet độc lập với nhau về mặt kết quả 1048713 Kết quả cuối cugraveng lagrave tổng của caacutec kết quả từ caacutec hoạt động riecircng rẽ khaacutec nhau 1048713 Dữ liệu coacute tiacutenh chắc chắn 1048713 Tagravei nguyecircn được dugraveng một caacutech kinh tế nhất 1048713 Thường coacute một số lớn caacutec giải phaacutep với kết quả khaacutec nhau 1048713 Trong số caacutec giải phaacutep coacute thể coacute 1 giải phaacutep tốt nhất ndash mức độ đạt được mục tiecircu cao nhất ndash gọi lagrave giải phaacutep tối ưu được tigravem ra bằng một giải thuật đặc biệt MOcirc HIgraveNH HOacuteA BẰNG HEURISTIC bull Việc tigravem giải phaacutep tối ưu của một số bagravei toaacuten quyết định phức tạp coacute thể tốn nhiều thời gian chi phiacute hay khocircng thể tigravem ra được Cograven nếu dugraveng tiếp cận mocirc phỏng cũng coacute thể keacuteo dagravei phức tạp khocircng thiacutech hợp hay thậm chiacute khocircng chiacutenh xaacutec

bull Lagrave một tiếp cận giuacutep tigravem ra caacutec giải phaacutep khả thithỏa matildenđủ tốt cho caacutec bagravei toaacuten phức tạp Coacute thể coacute giải phaacutep đủ tốt (90-999 giaacute trị của lời giải tối ưu) nhanh choacuteng vagrave đỡ tốn keacutem hơn bằng caacutech dugraveng heuristics bull Quaacute trigravenh heuristic lagrave datildey caacutec bước xacircy dựng caacutec quy luật giải quyết vấn đề thocircng qua việc tigravem kiếm caacutec con đường hứa hẹn nhất dẫn đến lời giải tigravem kiếm caacutech thức thu thập vagrave phacircn giải thocircng tin theo quaacute trigravenh giải vagrave phaacutet triền caacutec phương phaacutep dẫn đến một giải thuật tiacutenh toaacuten hay một lời giải tổng quaacutet đatilde coacute bull Aacutep dụng chủ yếu cho bagravei toaacuten cấu truacutec yếu cũng dugraveng để tigravem ra giải phaacutep chấp nhận được cho bagravei toaacuten cấu truacutec chặt bull Khocircng đủ tổng quaacutet như caacutec giải thuật thường chỉ dugraveng cho tigravenh huống đặc thugrave đang xeacutet bull Coacute thể dẫn đến một giải phaacutep dở - caacutec thủ tục từng bước giải quyết vấn đề khocircng đảm bảo tigravem ra giải phaacutep tối ưu bull Heuristic coacute thể lagrave định lượng vigrave vậy coacute thể đoacuteng vai trograve quan trọng trong cơ sở mocirc higravenh của hệ hỗ trợ quyết định bull Heuristic coacute thể lagrave định tiacutenh vigrave vậy coacute thể đoacuteng vai trograve quan trọng trong cung ứng kiến thức cho hệ chuyecircn gia bull Quaacute trigravenh heuristic liecircn quan đến tigravem kiếm học tập ước lượng phacircn xử vagrave lặp lại caacutec hoạt động nagravey dọc theo tiến trigravenh bull Kiến thức thu được dugrave thagravenh cocircng hay thất bại trong quaacute trigravenh đều được phản hồi vagrave sửa đổi chiacutenh quaacute trigravenh nhờ đoacute coacute thể định nghĩa lại mục tiecircu hay bagravei toaacuten 1048713 Giải thuật di truyền bắt đầu bằng tập caacutec giải phaacutep được sinh ngẫu nhiecircn taacutei kết hợp caacutec cặp giải phaacutep một caacutech ngẫu nhiecircn bull Tigravenh huống necircn dugraveng heuristics 1048713 Dữ liệu đầu vagraveo khocircng chiacutenh xaacutec hay coacute giới hạn 1048713 Thực tế quaacute phức tạp đến nỗi khocircng dugraveng được caacutec mocirc higravenh tối ưu 1048713 Chưa coacute được giải thuật chiacutenh xaacutec vagrave đủ tin cậy 1048713 Bagravei toaacuten phức tạp necircn sẽ khocircng kinh tế nếu dugraveng tối ưu hay mocirc phỏng hoặc tốn quaacute nhiều thời gian tiacutenh toaacuten 1048713 Coacute thể cải thiện tiacutenh hiệu quả của quaacute trigravenh tối ưu (tức coacute thể sinh ra caacutec giải phaacutep ban đầu tương đối tốt) 1048713 Liecircn quan đến xử lyacute kyacute hiệu chứ khocircng phải xử lyacute kyacute số (như hệ chuyecircn gia) 1048713 Cần coacute quyết định nhanh vagrave caacutec xử lyacute dựa vagraveo maacutey tiacutenh đều khocircng khả thi (một số heuristic khocircng cần đến maacutey tiacutenh) bull Thuận lợi 1048713 Dễ hiểu dễ giải thiacutech vagrave dễ cagravei đặt 1048713 Nacircng cao tiacutenh saacuteng tạo vagrave năng lực heuristic cho caacutec vấn đề khaacutec 1048713 Tiết kiệm thời gian xaacutec lập vấn đề 1048713 Tiết kiệm yecircu cầu về bộ chứa vagrave xử lyacute maacutey tiacutenh

1048713 Tiết kiệm thời gian tiacutenh toaacuten vagrave do vậy tiết kiệm thời gian thực trong ra quyết định Một số vấn đề phức tạp đến nỗi chỉ coacute thể giải được bằng heuristics 1048713 Thường sinh ra nhiều giải phaacutep chấp nhận được 1048713 Thường coacute thể phaacutet biểu lyacute thuyết hay đo lường thực nghiệm về chất lượng của giải phaacutep (tức giaacute trị mục tiecircu của giải phaacutep gần với giaacute trị tồi ưu đến mức nagraveo dugrave giaacute trị tối ưu chưa biết được) 1048713 Coacute thể kết hợp tiacutenh thocircng minh vagraveo để hướng dẫn pheacutep tigravem kiếm (tigravem kiếm tabu) Năng lực thocircng minh đoacute coacute thể lagrave đặc thugrave theo bagravei toaacuten hoặc dựa trecircn yacute kiến chuyecircn gia được cấy trong hệ chuyecircn gia hoặc cơ chế tigravem kiếm 1048713 Coacute thể dugraveng heuristic hiệu quả vagraveo caacutec mocirc higravenh coacute thể giải bằng quy hoạch toaacuten học Đocirci khi heuristic lagrave phương phaacutep được ưa thiacutech hơn khi khaacutec giải phaacutep heuristics được dugraveng như giải phaacutep ban đầu cho caacutec phương phaacutep quy hoạch toaacuten học bull Hạn chế 1048713 Khocircng đảm bảo coacute được giải phaacutep tối ưu 1048713 Caacutec quy luật coacute rất nhiều ngoại lệ 1048713 Caacutec lựa chọn quyết định tuần tự coacute thể khocircng tiecircn đoaacuten được caacutec kết cục tương lai của mỗi chọn lựa 1048713 Sự liecircn thuộc giữa caacutec phần trong hệ thống đocirci khi coacute thể gacircy ra caacutec ảnh hưởng lớn lao lecircn toagraven hệ thống bull Phacircn loại caacutec giải thuật heuristic 1048713 Heuristic xacircy dựng xacircy dựng giải phaacutep khả thi bằng caacutech cộng thecircm từng thagravenh phần một VD bagravei toaacuten người baacuten hagraveng ndash luocircn gheacute thagravenh phố chưa viếng thăm kế tiếp gần nhất

1048713 Heuristic cải tiến bắt đầu bằng một giải phaacutep khả thi vagrave cố gắng cải tiến liecircn tục trecircn đoacute VD trecircn thử hoaacuten đổi 2 thagravenh phố 1048713 Quy hoạch toaacuten aacutep dụng vagraveo caacutec mocirc higravenh chứa iacutet ragraveng buộc nhằm coacute được thocircng tin về thỏa hiệp tốt nhất với mocirc higravenh nguyecircn gốc Thường được dugraveng trong tối ưu hoacutea nguyecircn (integer optimization) 1048713 Chia giai đoạn giải quyết một vấn đề theo từng giai đoạn VD ở PampG trecircn đacircy bagravei toaacuten phacircn phối được giải quyết trước sau đoacute dugraveng giải quyết bagravei toaacuten chiến lược sản phẩm 1048713 Phacircn ratilde chia bagravei toaacuten thagravenh caacutec phần nhỏ hơn coacute thể giải quyết được sau đoacute kết hợp caacutec giải phaacutep đoacute lại VD chia latildenh thổ baacuten hagraveng thagravenh 4 vugraveng khaacutec nhau giải quyết cho từng vugraveng sau đoacute kết nối caacutec giải phaacutep

21Mocirc phỏngbull Giả định caacutec đặc điểm của thực tạibull Lagrave kỹ thuật tiến triển caacutec thực nghiệm (như phacircn tiacutech ldquowhat-ifrdquo) - bằng maacutey tiacutenh -trecircn một mocirc higravenh của hệ thocircng tin quản lyacute

bull Khocircng thực sự lagrave một mocirc higravenh vigrave khocircng biểu diễn thực tại magrave lagrave cố gắng bắtchước thực tạibull Một trong những phương phaacutep thocircng dụng nhất trong HHTQĐbull HHTQĐ lagravem việc với caacutec bagravei toaacuten phi cấu truacutec vagrave cấu truacutec yếu tigravenh huống thực tếphức tạp ndash khocircng dễ biểu diễn bằng mocirc higravenh tối ưu hay caacutec dạng mocirc higravenh khaacutecnhưng lại thường coacute thể xử lyacute được bằng mocirc phỏngbull Đặc điểm1048713 Iacutet đưa ra caacutec đơn giản hoacutea về thực tại hơn caacutec mocirc higravenh khaacutec1048713 Do triển khai caacutec thực nghiệm necircn noacute coacute thể kiểm thử caacutec giaacute trị cụ thể của caacutecbiến quyết địnhbiến khocircng kiểm soaacutet được của mocirc higravenh vagrave xem xeacutet ảnh hưởnglecircn caacutec biến kết quả1048713 Phương phaacutep coacute tiacutenh mocirc tả (như vậy khaacutec với phương phaacutep danh định)1048713 Khocircng tự động tigravem kiếm giải phaacutep tối ưu ndash noacute mocirc tảtiecircn đoaacuten caacutec đặc tiacutenh của hệthống đatilde cho dưới caacutec điều kiện khaacutec nhau từ đoacute coacute thể chọn ra phương aacuten tốtnhất1048713 Quaacute trigravenh mocirc phỏng thường lặp lại một thực nghiệm nhiều lần để coacute được ướclượng về hiệu ứng tổng quaacutet của một số hagravenh động nhất định1048713 Mocirc phỏng maacutey tiacutenh thiacutech hợp cho hầu hết caacutec tigravenh huống mặc dugrave cũng coacute một sốmocirc phỏng thủ cocircng thagravenh cocircng1048713 Thường chỉ được dugraveng khi bagravei toaacuten quaacute phức tạp khocircng thể xem xeacutet bằng caacutec kỹthuật tối ưu dạng số Tiacutenh phức tạp theo nghĩa bagravei toaacuten khocircng thể cocircng thức hoacuteacho tối ưu (do khocircng thotildea caacutec giả định) hoặc cocircng thức quaacute lớn quaacute nhiều tươngtaacutec giữa caacutec biến hoặc về bản chất bagravei toaacuten lagrave bất định hay rủi roPhương phaacutep mocirc phỏng thiết lập mocirc higravenh của hệ thống thực vagrave tiến hagravenh caacutec thựcnghiệm lặp lại trecircn mocirc higravenh

bull Thuận lợi1048713 Lyacute thuyết tương đối trực tiếp hiệu ứng dagravei hạn của nhiều chiacutenh saacutech -gt neacuten thờigian lớn1048713 Do tiacutenh chất mocirc tả (khaacutec với danh định)1048713 Coacute thể thấy được nhanh choacuteng coacute thể đặt ra caacutec cacircu hỏi ldquowhat-ifrdquo coacute thể dugravengtiếp cận thử-vagrave-sai vagraveo giải quyết vấn đề một caacutech nhanh choacuteng rẻ chiacutenh xaacutec iacutetrủi ro hơn1048713 Thử nghiệm được biến quyết định phần nagraveo của mocirci trường thực sự quan trọngvới caacutec phương aacuten khaacutec nhau1048713 Yecircu cầu kiến thức riecircng biệt về bagravei toaacuten vigrave thế buộc người xacircy dựng mocirc higravenh phảilagravem việc thường xuyecircn với nhagrave quản lyacute ndash đối tượng mong muốn của HHTQĐ để

từ đoacute bản chất bagravei toaacuten vagrave caacutec quyết định được hiểu tốt hơn1048713 Mocirc higravenh được xacircy dựng từ viễn cảnhcaacutech nhigraven của nhagrave quản lyacute1048713 Mocirc higravenh chỉ cho một bagravei toaacuten riecircng biệt thường khocircng thể dugraveng giải caacutec bagravei toaacutenkhaacutec Như vậy mỗi thagravenh phần của mocirc higravenh ứng với một phần của hệ thống thựcdo đoacute sẽ khocircng yecircu cầu nhagrave quản lyacute phải tổng quaacutet hoacutea caacutec hiểu biết của migravenh1048713 Phổ bagravei toaacuten giải được rất rộng tồn kho nhacircn sự hoạch định chiến lược 1048713 Coacute thể chứa caacutec phức tạp thực sự của bagravei toaacuten khocircng cần caacutec đơn giản hoacutea (TDdugraveng caacutec phacircn phối xaacutec suất thực thay vigrave phacircn phối lyacute thuyết xấp xỉ)1048713 Coacute thể tự động sinh ra nhiều đo lường hiệu năng quan trọng1048713 Thường lagrave phương phaacutep duy nhất của HHTQĐ coacute thể xử lyacute caacutec bagravei toaacuten tương đốiphi cấu truacutec1048713 Coacute một số caacutec goacutei phần mềm mocirc phỏng (Monte Carlo) tương đối dễ dugravengbull Điểm yếu1048713 Tuy thường tigravem được caacutec phương aacuten đủ tốt nhưng khocircng đảm bảo lời giải tối ưu1048713 Quaacute trigravenh xacircy dựng mocirc higravenh thường dagravei vagrave tốn keacutem1048713 Giải phaacutep vagrave suy diễn từ nghiecircn cứu mocirc phỏng thường khocircng thể chuyển sang bagraveitoaacuten khaacutec vigrave mocirc higravenh kết hợp caacutec yếu tố đặc thugrave1048713 Đocirci khi do mocirc higravenh quaacute dễ giải thiacutech cho nhagrave quản lyacute necircn caacutec phương phaacutep phacircntiacutech thường xem nhẹ1048713 Phần mềm mocirc phỏng đocirci khi yecircu cầu caacutec kỹ năng đặc biệt do độ phức tạp củaphương phaacutep giải higravenh thứcbull Caacutec loại mocirc phỏng1048713 Mocirc phỏng xaacutec suất một hay nhiều biến độc lập mang tiacutenh xaacutec suất với 2 loạiphacircn phối ndash thường dugraveng kỹ thuật Monte Carlo1048713 Phacircn phối rời rạc tigravenh huống coacute một số giới hạn caacutec biến cố (biến) với hữu hạncaacutec giaacute trị cho mỗi biến cố (biến)1048713 Phacircn phối liecircn tục tigravenh huống coacute số lượng khocircng giới hạn caacutec biến cố tuacircn theocaacutec hagravem mật độ xaacutec suất như phacircn phối chuẩn1048713 Mocirc phỏng độc lậpphụ thuộc theo thời gian1048713 Độc lập khocircng cần thiết phải biết chiacutenh xaacutec thời điểm xảy ra biến cố (nhu cầutiecircu thụ lượng sản phẩm trong ngagravey khocircng biết chiacutenh xaacutec thời điểm tiecircu thụ)1048713 Phụ thuộc cần biết chiacutenh xaacutec thời điểm xảy ra sự kiện (bagravei toaacuten hagraveng đợi)1048713 Mocirc phỏng tương taacutec trực quan1048713 Mocirc phỏng hướng đối tượng dugraveng tiếp cận hướng đối tượng để xacircy dựng mocirc higravenhmocirc phỏng Chuacute yacute ngocircn ngữ mocirc higravenh hoacutea nhất thể UML (unified modelinglanguage) kể cả khi mocirc phỏng caacutec hệ thời gian thựcMOcirc HIgraveNH HOacuteA ĐA CHIỀU ndash XỬ LYacute PHAcircN TIacuteCH TRỰC TUYẾNbull Người ra quyết định thường phải xem xeacutet nhiều chiều của dữ liệu (TD caacutec chiềucủa dữ liệu baacuten hagraveng lagrave sản phẩm vugraveng thời gian người baacuten ) dữ liệu cần đượcphacircn tiacutech trực tiếp bằng caacutec cocircng cụ chuẩn hay phacircn tiacutech tự động bằng caacutec

phương phaacutep khai mỏ dữ liệu (data mining)bull Hầu hết caacutec hệ thống phacircn tiacutech đa chiều được nhuacuteng trong caacutec hệ xử lyacute phacircn tiacutechtrực tuyến (HXLPTTT ndash online analytic processing - OLAP)bull Mục tiecircu của XLPTTT nắm bắt cấu truacutec của dữ liệu thực để hỗ trợ ra quyết địnhbull Trong HHTQĐ coacute sự gắn nối tự nhiecircn giữa mocirc higravenh hoacutea dữ liệu mocirc higravenh hoacutea kyacutehiệu vagrave caacutec khiacutea cạnh của phacircn tiacutech ldquowhat-ifrdquobull Caacutec baacuteo caacuteo của HXLPTTT đều coacute tiacutenh tương taacutec dễ khai thaacutec sử dụng đặc biệtphugrave hợp cho caacutec baacuteo caacuteo về chỉ số hiệu năng chủ yếu (key performance indicators- KPI) baacuteo caacuteo về đo lường hiệu năng kinh doanh bull Thế hệ hiện tại của HXLPTTT vagrave hệ khai mỏ dữ liệu (data mining) tiacutech hợp caacutecđặc tiacutenh của hệ thocircng tin latildenh đạo (executive information system ndashEIS- nhiềucaacutech nhigraven dữ liệu chi tiết hoacutea theo nhu cầu) vagrave caacutec hệ đồ họa khaacutec ndash thường coacutegiao diện người dugraveng dạng kiểu WEBbull Caacutec hệ thống như trecircn cograven được gọi lagrave caacutec cocircng cụ triacute tuệ kinh doanh (businessintelligence - BI) vigrave coacute caacutec đặc trưng về mocirc higravenh hoacutea vagrave tối ưu hoacutea nhưng lạitrong suốt đối với ngươigrave dugravengbull Hiện caacutec cocircng cụ được đưa ra bởi caacutec nhagrave cung cấp về CSDL về hoạch định tagraveinguyecircn tổ chức (ERP) về nhagrave kho dữ liệu (data warehouse) về HXLPTTT MOcirc HIgraveNH HOacuteA VAgrave MOcirc PHỎNG TƯƠNG TAacuteC TRỰC QUANbull Iacutech lợi Người ra quyết định tham gia vagraveo quaacute trigravenh phaacutet triển mocirc higravenh vagrave thựcnghiệm mocirc phỏng vigrave vậy sẽ tin tưởng khi sử dụng mocirc higravenhbull Mocirc higravenh hoacutea tương taacutec trực quan (visual interactive modeling - VIM) dugraveng caacutecbiểu diễn đồ họa maacutey tiacutenh để trigravenh bagravey caacutec ảnh hưởng của caacutec quyết định quản lyacutekhaacutec nhau ở một thời điểm (tĩnh) hay tiến triển theo thời gian (động với kỹ thuậthoạt higravenh)bull Mocirc phỏng tương taacutec trực quan (visual interactive simulation - VIS) cho pheacutepngười dugraveng theo dotildei tiến trigravenh xacircy dựng vagrave sử dụng khai thaacutec mocirc higravenh mocirc phỏngdưới dạng hoạt higravenhbull Mocirc higravenh hoacutea tương taacutec trực quan coacute thể kết hợp với tiếp cận triacute tuệ nhacircn tạo đểđưa ra caacutec khả năng mới thay đổi từ xacircy dựng hệ thống dạng đồ họa đến tigravem hiểuvề động học của hệ thốngbull Cần đến caacutec hệ thống maacutey tiacutenh xử lyacute song song tốc độ cao để xacircy dựng caacutec mocircphỏng - phức tạp quy mocirc lớn dạng hoạt higravenh - mang tiacutenh khả thi ở thời gian thực

22Caacutec dạng hệ thống hỗ trợ ra quyết địnhHệ hỗ trợ quyết định nhoacutemRa quyết định nhoacutem giao tiếp vagrave cộng taacutec- Caacutec đặc điểm của cocircng việc nhoacutem+ Một nhoacutem thực hiện một nhiệm vụ thỉnh thoảng ra quyết định thỉnh thoảngkhocircng ra quyết định+ Caacutec thagravenh viecircn trong nhoacutem coacute thể ở những nơi khaacutec nhau

+ Caacutec thagravenh viecircn trong nhoacutem coacute thể lagravem việc ở những thời gian khaacutec nhau+ Caacutec thagravenh viecircn trong nhoacutem coacute thể lagravem việc cugraveng nhau hoặc ở caacutec tổ chức khaacutecnhau+ Nhoacutem coacute thể vĩnh viễn hoặc tạm thời+ Nhoacutem coacute thể ở bất kỳ mức quản lyacute nagraveo hoặc mức thời gian nagraveo+ Coacute sự điều phối (quaacute trigravenh vagrave nhiệm vụ đạt được) hoặc macircu thuẩn trongnhoacutem+ Coacute sự đạt được hoặcvagrave mất maacutet năng suất trong tổ chức+ Nhiệm vụ phải hoagraven thagravenh rất nhanh+ Khocircng thể hoặc quaacute đắt cho tất cả caacutec thagravenh viecircn trong nhoacutem cugraveng hợp ở mộtnơi+ Một số dữ liệu thocircng tin hoặc kiến thức cần thiết nằm ở nhiều nơi một sốkhaacutec ở ngoagravei tổ chức+ Chuyecircn mocircn của caacutec thagravenh viecircn khocircng coacute trong nhoacutem lagrave cần thiết- Caacutec hoạt động vagrave caacutec quaacute trigravenh miecircu tả caacutec cuộc họp+ Cuộc họp lagrave hoạt động chung liecircn quan bởi một nhoacutem người coacute địa vị bằngnhau hoặc gần bằng nhau+ Kết quả của cuộc họp phụ thuộc một phần vagraveo kiến thức yacute kiến caacutec đaacutenh giaacutecủa caacutec thagravenh viecircn+ Kết quả của cuộc họp cũng phụ thuộc vagraveo sự kết hợp của nhoacutem vagrave phụ thuộcvagraveo quaacute trigravenh ra quyết định được sử dụng bởi nhoacutem đoacute+ Giải quyết caacutec yacute kiến khaacutec nhau bởi người coacute quyền hạn hoặc thương lượnghoặc phacircn xửHỗ trợ giao tiếp- Giao tiếp lagrave thagravenh phần quan trọng cho hỗ trợ quyết định Khocircng coacute giao tiếp thigravekhocircng coacute cộng taacutec Những người ra quyết định caacute nhacircn phải giao tiếp với caacutecđồng nghiệp chuyecircn gia cơ quan chiacutenh phủ khaacutech hagraveng đối taacutec kinh doanh hellipHọ cũng cần dữ liệu vagrave thocircng tin (vagrave kiến thức) từ nhiều nơi trecircn thế giới Caacutecnhoacutem ra quyết định phải giao tiếp cộng taacutec vagrave thương lượng trong cocircng việcHầu hết caacutec tổ chức sẽ nhanh trở thagravenh khocircng coacute chức năng nếu khocircng coacute caacutec hệthống giao tiếp Thương mại điện tử coacute thể hiệu quả chỉ qua caacutec kỹ thuật giao tiếphiện đại- Caacutec kỹ thuật thocircng tin hiện đại cung cấp caacutec phương tiện hỗ trợ giao tiếp rẻnhanh coacute khả năng coacute thể tin cậy Nền tảng hỗ trợ giao tiếp lagrave caacutec hệ thống maacuteytiacutenh mạng+ Bắt đầu bằng điện baacuteo điện thoại radio vagrave ti vi+ Trong 100 năm chuacuteng ta phaacutet triển maacutey fax thư điện tử chương trigravenh chatnhoacutem tin tức hệ thống hội nghị truyền higravenh Hầu hết caacutec kỹ thuật nagravey đềuhoạt động trecircn internet+ Sự phaacutet triển giao tiếp sau cugraveng lagrave hệ thống họp điện tử caacutec dịch vụ vagrave hệ

thống hội nghị điện tử thường sử dụng internet để kết nối caacutec người ra quyếtđịnh- Caacutec thuận lợi aacutep dụng caacutec phương phaacutep giao tiếp cải tiến trong caacutec tổ chức+ Cải tiến năng suất của nhacircn viecircn+ Liecircn quan đến nhiều người ra quyết định chiacutenh+ Khocircng quan tacircm nhiều đến đường biecircn giới địa lyacute+ Tạo nền văn hoacutea hợp taacutec nhất quaacuten+ Cải tiến chất lượng cuộc sống của nhacircn viecircnHỗ trợ cộng taacutec Maacutey tiacutenh hỗ trợ cộng taacutec- Khung thời giannơi chốn+ Sự hiệu quả của kỹ thuật tiacutenh toaacuten cộng taacutec phụ thuộc vagraveo vị triacute của caacutec thagravenhviecircn trong nhoacutem vagrave phụ thuộc vagraveo thời gian chia sẽ thocircng tin gởi vagrave nhận+ Chia sự giao tiếp thagravenh bốn ocirc vagrave tổ chức bốn ocirc dọc theo 2 chiều thời gian vagravenơi chốn1048713 Thời gian Khi gởi vagrave nhận thocircng tin hầu như đồng thời giao tiếp lagrave đồngthời Viacute dụ Điện thoại ti vi vagrave caacutec cuộc họp gặp mặt nhau Giao tiếp bấtđồng bộ xảy ra khi người nhận nhận thocircng tin ở thời điểm khaacutec thời điểmgởi thocircng tin đoacute1048713 Nơi chốn Người gởi vagrave người nhận coacute thể ở cugraveng phograveng hoặc khocircng+ Bốn ocirc lagrave1048713 Cugraveng thời giancugraveng nơi chốn Caacutec thagravenh viecircn gặp mặt nhau cugraveng một luacutecgiống như phograveng quyết định hoặc gặp mặt truyền thống1048713 Cugraveng thời giankhaacutec nơi chốn Caacutec thagravenh viecircn ở caacutec nơi khaacutec nhau nhưnggiao tiếp cugraveng nhau Viacute dụ hội nghị truyền higravenh (videoconferencing)1048713 Khaacutec thời giancugraveng nơi chốn Nhiều người lagravem việc theo ca Ca nagravey để lạithocircng tin cho ca khaacutec1048713 Khaacutec thời giankhaacutec nơi chốn Caacutec thagravenh viecircn ở caacutec nơi khaacutec nhau Caacutecthagravenh viecircn nagravey gởi vagrave nhận thocircng tin ở những lần khaacutec nhau

23Thực thi hệ DSSHệ thống hỗ trợ quản lyacute (MSS) khocircng phải luacutec nagraveo cũng luocircn thagravenh cocircng Nhiều trường hợpthất bại của ES khocircng hoagraven toagraven lagrave lyacute do kỹ thuật Thực thi hệ thống lagrave một quaacute trigravenh liecircn tụcnhằm đảm bảo cho tổ chức chuẩn bị tiếp nhận một hệ thống mới vagrave đưa hệ thống vagraveo sử dụngthagravenh cocircngThực hiện cocircng nghệ hệ thống hỗ trợ quản lyacute lagrave việc phức tạp vigrave caacutec hệ thống nagravey khocircng đơnthuần lagrave hệ thống thocircng tin chỉ thu thập thao taacutec vagrave phacircn phối thocircng tin Magrave xa hơn chuacuteng

liecircn quan tới caacutec cocircng việc coacute thể lagravem thay đổi đaacuteng kể caacutech thức hoạt động của tổ chức Tuyvậy đa số caacutec yếu tố thực thi đều liecircn quan tới hệ thống thocircng tinThực thi MSS lagrave quaacute trigravenh liecircn tục diễn ra trong suốt thời gian phaacutet triển hệ thống từ đề xuấtban đầu đến nghiecircn cứu khả thi thiết kế vagrave phacircn tiacutech hệ thống lập trigravenh huấn luyện chuyểnđổi vagrave lắp đặt Caacutec chuyecircn gia hệ thống thocircng tin thường gọi thực thi lagrave giai đoạn cuối trongvograveng đời hệ thống Định nghĩa thực thi MSS phức tạp hơn vigrave bản chất lặp của sự phaacutet triểncaacutec hệ thống

THỰC THI KHOcircNG HOAgraveN CHỈNHCaacutec quyết định về tiacutenh khả thi thường coacute giả định về lợi iacutech đạt được khi kế hoạch thực thiđược thực hiện hoagraven toagraven Trong thực tế thường chỉ thực hiện 90 thậm chiacute 70 phần trăm sovới phacircn tiacutech khả thi Lyacute do lagrave sự thay đổi tại một nơi trong hệ thống coacute thể ảnh hưởng vagrave coacutethể taacutec động tiecircu cực đến chỗ khaacutec Do vậy cấp quản lyacute coacute thể bỏ những phần trong dự aacuten coacutethể gacircy ra taacutec động xấu Do đoacute dự aacuten sẽ thực hiện iacutet hơn 100 so với dự aacuten kế hoạch Caacutec lyacutedo khaacutec coacute thể lagrave do khấu trừ ngacircn saacutech hoặc vượt chi phiacuteĐAacuteNH GIAacute SỰ THAgraveNH COcircNG CỦA THỰC THI HỆ THỐNGPhải coacute caacutec chỉ số đo lường thigrave mới coacute thể đaacutenh giaacute sự thagravenh cocircng khi thực thi một hệ thốngDickson va Powers (1973) đề ra 5 tiecircu chuẩn độc lậpbull Tỷ lệ thời gian thực hiện dự aacuten với thời gian ước lượngbull Tỷ lệ chi phiacute thực tế vagrave ngacircn saacutech thực hiệnbull Thaacutei độ của cấp quản lyacute đối với hệ thốngbull Nhu cầu thocircng tin của caacutec nhagrave quản lyacute được đaacutep ứng như thế nagraveo qua hệ thốngbull Taacutec động của dự aacuten đối với những hoạt động maacutey tiacutenh trong cocircng tyCaacutec đo lường khaacutec để đaacutenh giaacute thagravenh cocircng của hệ hỗ trợ quản lyacute (MSS)bull Sự sử dụng hệ thống (dự định dugraveng hoặc thực sự dugraveng)bull Thỏa matilden của người dugravengbull Thaacutei độ taacuten thagravenhbull Mức độ hệ thống hoagraven thagravenh caacutec mục tiecircu ban đầubull Phần thưởng đối với tổ chức (giảm chi phiacute tăng doanh thuhellip)bull Tỷ số lợi iacutech chi phiacute

bull Mức độ thể chế hoacutea của MSS trong tổ chứcDo bởi tiacutenh đa dạng của DSS necircn việc đaacutenh giaacute sự thagravenh cocircng của hệ nagravey cũng khoacute khăn tuynhiecircn cũng coacute thể coacute một số yếu tố giuacutep cho DSS thagravenh cocircng như sự tham gia người dugravenghuấn luyện người dugraveng hỗ trợ quản lyacute cấp cao nguồn thocircng tin đặc điểm của những nhiệmvụ coacute liecircn quan (cấu truacutec bất định độ khoacute phụ thuộc)

Chương5Nhoacutem hỗ trợ quyết định vagrave nhoacutemcocircng nghệ phần mềm

51Nhoacutem tạo quyết định

MDM-Holsapple đatilde gợi yacute chuacuteng ta sử dụng giới hạn người tạo quyết định

Một nhoacutem lagrave kết cấu MDM nơi magrave nhiều người ra quyết định hoagraven toagraven tương taacutec

Một đội lagrave kết cấu MDM nơi caacutec thagravenh viecircn tư vấn cho người đưa ra quyết định nhưng khocircng tương taacutec

Một Ủy ban lagrave kết cấu MDM với một người tạo quyết định duy nhất vagrave sự tương taacutec giữa caacutec thagravenh viecircn

Mạng thocircng tin

Mạng lưới baacutenh xe mỗi người tham gia coacute thể giao tiếp với người đưa ra quyết định ở trung tacircm nhưng khocircng phải với người tham gia khaacutecCấu truacutec nagravey lagrave khocircng thỏa matilden tất cả những người tham gia ngoại trừ người ra quyết định

Mạng dacircy chuyền Tham gia chuyển tiếp thocircng tin chỉ để noacute luocircn liền kề nhau trong chuỗi

Thagravenh viecircn cuối cugraveng ko được đaacutep ứng

Mạng vograveng trograven Tương tự như chuỗi nhưng kết thuacutec được kết nối

Mạng kết nối hoagraven toagraven khocircng coacute hạn chế về giao tiếp vagrave tương taacutec giữa caacutec thagravenh viecircnNoacutei chungnoacute đaacutep ứng hầu hết caacutec kết nối của người tham gia nhưng truyền đạt thocircng tin mất nhiều thời gian vagrave coacute nhiều cơ hội xảy ra lỗi

Nhoacutem hagravenh vi vagrave chuẩn mực

MDMs thiết lập caacutec chỉ tiecircu hướng dẫn quaacute trigravenh ra quyết định

Một chuẩn mực quy định cụ thể những gigrave thagravenh viecircn trong nhoacutem dự kiến sẽ lagravem trong những hoagraven cảnh nhất định

Quy tắc gửi coacute thể được thocircng qua viacute dụ đaacutenh giaacute ngang hagraveng hoặc xử phạt

Lagravem thế nagraveo để đưa ra quyết định

Việc chọn lựa magrave trong đoacute việc sử dụng cấu truacutec MDM phải được dựa trecircn một số yếu tố liecircn quan với bối cảnh quyết định

Viacute dụmột cấu truacutec riecircng lẻ sẽ lagravem việc nơi magrave quyết định được cấu truacutec cao vagrave thocircng tin lagrave coacute sẵn

Một ủy ban cơ cấu sẽ lagrave sự lựa chọn khi người ra quyết định khocircng thể đưa ra quyết định một migravenh

52Caacutec vấn đề thường gặp trong nhoacutem

Kiacutech thước Noacutei chung sự nhất triacute vagrave gắn kết giữa caacutec thagravenh viecircn tỉ lệ nghịch với phạm vi nhoacutem Trong nhoacutem lớn rất dễ higravenh thagravenh caacutec nhoacutem nhỏ vagrave hoạt động rời rạc

Tư duy tập thể Trong nhoacutem lớn mọi người coacute xu hướng suy nghĩ đểđạtđược sự nhất triacute necircn khocircng phaacutet huy được sự saacuteng tạo

Caacutec vấn đề về xatilde hội

Xung đột Trong 1 nhoacutem ai cũng muốn migravenh lagrave giỏi nhất necircn dễ dẫn đến xung đột

Ẩn danh(Giấu tecircn) Đacircy lagrave phương phaacutep được sử dụng để kiểm soaacutet xung đột Cho caacutec thagravenh viecircn tham gia ẩn danh

Vấn đề giới tiacutenh Nam vagrave nữ thường coacute những thế mạnh khaacutec nhau điều nagravey coacute thể lagrave sức mạnh trong 1 thiết lập MDM

Đagravem phaacuten vagrave quyết định

Một quyết định coacute thể liecircn quan đến nhiều quan điểm khaacutec nhau vigrave thế cần phải coacute sự đagravem phaacuten

Caacutec thiết kế của cơ chế hỗ trợ cho MDM phải phugrave hợp với caacutec hoạt độngđagravemphaacuten

Những hoạt động nagravey bao gồm việc thu nhận yacute kiến của caacutec thagravenh viecircn 1 caacutech cocircng bằng

53Cocircng nghệ hỗ trợ MDM

Organizational DSSndash 1 hệ thống cung cấp caacutec quyết định hỗ trợ

Group Support Systemndash Cocircng nghệ sử dụng sự hỗ trợ của nhiều becircn tham gia

Group DSS ndash Lagrave 1 hệ thống được thiết kế đặc biệt để hỗ trợ cho MDM

DSS ndash Lagrave 1 hệ thống dưới sự kiểm soaacutet của 1 người quyết định hệ thống nagravey cung cấp 1 bộ cocircng cụ giuacutep phacircn tiacutech hoagraven cảnh đểđưa ra quyết định vagrave nacircng cao hiệu quả của quyết địnhđoacute

53Cocircng nghệ hỗ trợ MDM

Organizational DSSndash 1 hệ thống cung cấp caacutec quyết định hỗ trợ

Group Support Systemndash Cocircng nghệ sử dụng sự hỗ trợ của nhiều becircn tham gia

Group DSS ndash Lagrave 1 hệ thống được thiết kế đặc biệt để hỗ trợ cho MDM

DSS ndash Lagrave 1 hệ thống dưới sự kiểm soaacutet của 1 người quyết định hệ thống nagravey cung cấp 1 bộ cocircng cụ giuacutep phacircn tiacutech hoagraven cảnh đểđưa ra quyết định vagrave nacircng cao hiệu quả của quyết địnhđoacute

Mục tiecircu của cocircng nghệ hỗ trợ MDM

Quy trigravenh hỗ trợ tập trung vagraveo quaacute trigravenh tạo điều kiện thuận lợi cho sự tương taacutec

Cơ chế cấu truacutec quaacute trigravenh chi phối caacutec hoạt động truyền thocircng

Nhiệm vụ hỗ trợ cocircng việc coacute thể chọn lựa tổ chức hoặc lấy thocircng tin

Nhiệm vụ cấu truacutec cocircng việc cho pheacutep truy cập đến kỹ thuật lọc kết hợp phacircn tiacutech kiến thức liecircn quan đến cocircng việc

Caacutec lớp loại cocircng nghệ hỗ trợ MDM

Phacircn loại theo đặc điểm do DeSanctis vagrave Gallupe đưa ra đề xuất một chương trigravenh ba cấp dựa trecircn caacutec tiacutenh năng được cung cấp

Hệ thống cấp 1 Mục điacutech chiacutenh lagrave tạo điều kiện thocircng tin liecircn lạc giữa caacutec thagravenh viecircn

Hệ thống cấp 2 Thiết kế để giảm thiểu rủi ro

Hệ thống cấp 3 Giuacutep điều chỉnh xử lyacute quyết định

Phacircn loại theo cocircng nghệ -Kraemer vagrave King tập trung vagraveo cocircng nghệ aacutep dụng

Cocircng nghệ bảng mạch điện tử

Hội nghị trực tuyến

Mạng lưới tập đoagraven

Trung tacircm thocircng tin

Mocirci trường cộng taacutec

Phograveng quyết định

Nhoacutem phần mềm

Phần mềm được thiết kế để hỗ trợ sự hợp taacutec bao gồm việc thu huacutet vagrave lưu trữ thocircng tin

Caacutec tổ chức dẫn đầu thị trường hiện tại lagrave Lotus Notes and Domino Microsoft Exchange Novell GroupWise and Oracle Office

Caacutec cocircng cụ trong một bộ phần mềm bao gồm người quản lyacute hội nghị (Lotus Sametime) vagrave trao đổi thocircng điệp (Lotus Notes Mail)

Xếp hạng phần mềm cho nhoacutem

Ellis vv đề xuất một hệ thống xếp hạng dựa vagraveo kiểu sự hỗ trợ noacute Cung cấp

Hệ thocircng điệp

Hệ thống hội thảo truyền higravenh

Hệ thống cộng taacutec soạn thảo

Nhoacutem phacircn phối giải phaacutep phần mền

Hệ thống phối hợp

Hệ thống thocircng minh đại diện

Lực lượng điều khiển phaacutet triển phần mềm cho nhoacutem

Một số nhacircn tố chiacutenh bao gồm

Tăng năng suất

Giảm số lượng caacutec cuộc họp

Tăng cường tự động hoacutea caacutec quy trigravenh lagravem việc thường xuyecircn

Cần phối hợp toagraven cầu tốt hơn

Tiacutenh sẵn sagraveng của những mạng lan rộng

Coleman vagrave Khanna liệt kecirc 10 nhacircn tố khaacutec

54Quản lyacute hoạt động MDM (Mobile Device Management - Quản lyacute thiết bị di động)

Một số phương phaacutep phối hợp phổ biến hơnMDM lagrave

Kỹ thuật nhoacutem định danh

Kỹ thuật Delphi

Sự phacircn xử

Hệ thocircng tin dựa trecircn vấn đề

Nemawashi

Kỹ thuật nhoacutem định danh

1-Mỗi người tham gia viết ra những yacute tưởng về những gigrave necircn quyết định

2-Lần lượt mỗi người tham gia trigravenh bagravey yacute tưởng của migravenh được ghi lại trecircn bảng Khocircng thảo luận ở đacircy

3-Sau khi tất cả caacutec yacute tưởng được trigravenh bagravey caacutec đại biểu coacute thể chất vấn những người khaacutec

4-Mỗi người tham gia bỏ phiếu cho mỗi yacute tưởng

Kỹ thuật Delphi

Về cơ bản tương tự như kỹ thuật nhoacutem định danh ngoại trừ những người khocircng bao giờ tham gia cuộc họp

Một cocircng cụ khảo saacutet được sử dụng để thu thập đầu vagraveo ban đầu từ caacutec thagravenh viecircn

Một cuộc khảo saacutet thứ hai được gửi đi với một bản toacutem tắt caacutec kết quả chung

Những bước lặp lại cho đến khi đạt được một sự đồng thuận hoặc nhigraven nhận của đa số

Sự phacircn xử(Arbitration )

Thiacutech hợp nhất khi caacutec thagravenh viecircn của MDM đại diện cho caacutec yếu tố đối lập

Những người tham gia đồng yacute rằng nếu lựa chọn thay thế hai becircn thỏa thuận khocircng được tigravem thấy thigrave một trọng tagravei viecircn becircn ngoagravei sẽ tham gia

Trọng tagravei sau đoacute lựa chọn thay thế ocircng hoặc xeacutet thấy thiacutech hợp nhất

Hệ thống thocircng tin dựa trecircn vấn đề (IBIS)

Lagrave một phương phaacutep lập luận cấu truacutec

Một đại diện cho IBIS lagrave một đồ thị với caacutec nuacutet vagrave caacutec liecircn kết

IBIS bắt đầu với lựa chọn của một nuacutet vấn đề gốc sau đoacute caacutec nuacutet vị triacute khaacutec nhau được liecircn kết với nuacutet gốc

Caacutec nuacutet vị triacute nagravey sau đoacute được đaacutenh giaacute dựa trecircn những lập luận gắn liền với chuacuteng

Nemawashi (được sử dụng rộng ratildei tại Nhật Bản)

1-Một hoặc nhiều thagravenh viecircn của MDM được chỉ định lagrave điều phối viecircnCaacutec điều phối viecircn sau đoacute chọn người tham gia cograven lại

2-Điều phối viecircn xacircy dựng một tổng hợp caacutec sự lựa chọn vagrave sau đoacute caacutec chuyecircn gia đaacutenh giaacute caacutec lựa chọn

3-Điều phối viecircn lựa chọn một sự lựa chọn dựa trecircn kết quả ở trecircn(ở 2)

4-Sự thay thế được luacircn chuyển điều phối viecircn tigravem kiếm sự đồng thuận thocircng qua sự thuyết phục vagrave đagravem phaacuten

5-Nếu đạt được sự đồng thuận điều phối viecircn cho lưu thocircng một tagravei liệu magrave mỗi thagravenh viecircn MDM để lại dấu hiệu trecircn đoacute

55Nơi lagravem việc ảo

Nhiều tổ chức trecircn toagraven thế giới kinh doanh bất động sản cho cocircng nghệ hợp taacutec

Cocircng việc được trở thagravenh một điều bạn lagravem hơn lagrave một nơi bạn đi

Những thay đổi lớn nhất mang lại bởi nơi lagravem việc ảo coacute thể lagrave về văn hoaacute hay xatilde hội hơn lagrave về cocircng nghệ

Chương 6 Hệ thống thocircng tin điều hagravenh

61 Yacute nghĩa của EIS- Hệ thống thocircng tin điều hagravenh

- EIS lagrave một dạng đặc biệt của DSS được thiết kế để hỗ trợ ra quyết định ở cấp cao nhất của một tổ chức

- Lagrave một hệ thống thocircng tin hỗ trợ nhu cầu lập kế hoạch vagrave đaacutenh giaacute của caacutec nhagrave quản lyacute điều hagravenh

- EIS coacute thể giuacutep một CEO coacute được bức tranh tổng thể chiacutenh xaacutec nhất về caacutec hoạt động vagrave một bản toacutem tắt những gigrave magrave đối thủ cạnh tranh đang lagravem

- Caacutec hệ thống nagravey noacutei chung hoạt động dễ dagraveng vagrave trigravenh bagravey thocircng tin theo những caacutech dễ hiểu để việc tiếp thu được nhanh choacuteng (biểu đồ đồ thịhellip)

(Tagravei liệu thecircm EIS lagrave những loại hệ thống lagrave rất phức tạp trong tự nhiecircn Coacute thể noacutei hệ thống nagravey cũng cung cấp cho caacutec nhagrave quản lyacute với caacutec thiết bị coacute khả năng ra quyết định bằng caacutech sử dụng của noacute Hệ thống nagravey hoạt động trong điều kiện như vậy quan trọng như trong caacutec hệ thống khaacutec khocircng hỗ trợ Khả năng lưu trữ dữ liệu nặng lagravem cho noacute lyacute tưởng để được thocircng qua khocircng chỉ bởi caacutec doanh nghiệp lớn magrave cograven bởi caacutec doanh nghiệp nhỏ hơn Nhigraven chung hệ thống nagravey lagrave dagravenh cho caacutec nhacircn viecircn cấp cao hỗ trợ thagravenh thạo trong việc đưa ra caacutec quyết định quan trọng)

Caacutec phiecircn EIS tiecircu biểu- Phiecircn lagravem việc coacute thể bắt đầu với một baacuteo caacuteo về tigravenh higravenh tagravei chiacutenh vagrave kinh

doanh của một cocircng ty caacutec chỉ số hoạt động quan trọng được hiển thị rotilde ragraveng- EIS sẽ cho pheacutep caacutec giaacutem đốc điều hagravenh coacute thể đi sacircu vagraveo dữ liệu từ những con

số bất kỳ magrave noacute hỗ trợ- Việc điều hagravenh coacute thể lựa chọn một mức độ chi tiết ( VD danh số baacuten hagraveng) nếu

như cần điều tra thecircm- Lagrave một phương phaacutep tiếp cận coacute thể giuacutep việc ra quyết định tốt hơn

Những điều magrave EIS ko coacute- EIS khocircng phải lagrave sự thay thế cho caacutec hệ thống dựa trecircn caacutec maacutey tiacutenh khaacutec EIS

thực sự chỉ cung cấp dữ liệu cho caacutec hệ thống nagravey- Noacute khocircng thể biến caacutec bộ hệ điều hagravenh của maacutey tiacutenh thagravenh những ldquochuyecircn viecircn

giỏirdquo- Coacute thể được viacute một caacutech cao hơn như lagrave một trợ lyacute đaacuteng tin cậy coacute thể được gọi

đến bất khi nagraveo vagrave mỗi khi cần thiết

Tagravei liệu thecircm Sự khaacutec nhau giữa EIS vagrave DSS+ EIS thiết kế để hỗ trợ những người điều hagravenh cấp cao giuacutep họ khaacutem phaacute caacutec vấn đề vagrave caacutec cơ hội DSS hỗ trợ những nười phacircn tiacutech cố gắng trả lời cacircu hỏi caacutei gigrave coacute thể lagravem cugraveng với một cơ hội hoặc một vấn đề

Chiều EIS DSSNhững người sử dụng thocircng thường

Duyệt dữ liệu đi xuống truy xuất trạng thaacutei

Hỗ trợ phacircn tiacutech vagrave quyết định

Sự thuacutec đẩy Tiacutenh thiacutech hợp Tiacutenh hiệu quảỨng dụng Queacutet mocirci trường đaacutenh giaacute

hiệu suất nhận dạng caacutec vấn đề vagrave caacutec cơ hội

Caacutec quyết định quản lyacute trecircn caacutec lĩnh vực đa dạng

Hỗ trợ quyết định Caacutec chiacutenh saacutech caacutec quyết định khocircng coacute cấu truacutec ở mức cao vagrave hỗ trợ giaacuten tiếp

Hỗ trợ caacutec quyết định lặp lại caacutec quyết định khocircng thể đoaacuten trước ra quyết định khocircng coacute cấu truacutec vagrave baacuten cấu truacutec

Loại thocircng tin Caacutec thocircng tin tin tức thocircng tin becircn ngoagravei về khaacutech hagraveng đối thủ cạnh tranh mocirci trường caacutec baacuteo caacuteo theo yecircu cầu vagrave định thời về caacutec hoạt động becircn trong

Caacutec thocircng tin hỗ trợ caacutec tigravenh huống đặc biệt

Sử dụng coacute nguyecircn tắc

Dograve theo vết vagrave điều khiển nhận dạng cơ hội

Hoạch định tổ chức phacircn nhoacutem vagrave điều khiển

Khả năng phugrave hợp với những người sử dụng caacute nhacircn

Thiết kế loại ra quyết định cho mỗi người điều hagravenh caacute nhacircn bằng nhiều lựa chọn đầu ra

Cho pheacutep caacutec đaacutenh giaacute caacute nhacircn caacutec khả năng what-if lựa chọn loại hộp hội thoại

Đồ họa Phải coacute Lagrave một phần quan trọng của nhiều DSS

Thacircn thiện người sử dụng

Phải coacute Phải coacute nếu khocircng coacute người sử dụng trung gian

Xử lyacute thocircng tin Lọc neacuten thocircng tin dograve theo vết dữ liệu vagrave thocircng tin quan trọng

EIS kiacutech thiacutech caacutec cacircu hỏi caacutec cacircu trả lời bằng caacutech sử dụng DSS vagrave phản hồi lại EIS

Hỗ trợ caacutec thocircng tin chi tiết

Truy xuất thường xuyecircn caacutec mức chi tiết của bất kỳ thocircng tin tổng hợp nagraveo (duyệt dữ

Coacute thể coacute trong DSS nhưng khocircng thường

liệu chi tiết)Cơ sở mocirc higravenh Caacutec chức năng coacute sẵn bị hạn

chếLagrave điểm cốt lotildei của DSS

Cấu truacutec Theo người baacuten sản phẩm hoặc theo caacutec chuyecircn gia hệ thống thocircng tin

Theo người sử dụng hoặc caacute nhacircn hoặc caacutec chuyecircn gia từ caacutec trung tacircm thocircng tin hoặc phograveng ban hệ thống thocircng tin

Phần cứng Mainframe caacutec trạm RISC mạng LANs hoặc caacutec hệ thống phacircn bố

Mainframe caacutec trạm RISC caacutec maacutey PC hoặc caacutec hệ thống phacircn bố

Bản chất caacutec goacutei phần mềm

Truy xuất tương taacutec dễ dagraveng đến nhiều cơ sở dữ liệu truy xuất trực tuyến caacutec khả năng DBMS phức tạp caacutec liecircn kết phức tạp

Caacutec khả năng tiacutenh toaacuten lớn caacutec ngocircn ngữ mocirc higravenh mocirc phỏng ứng dụng vagrave caacutec bộ tạo DSS

Bản chất caacutec thocircng tin

Trigravenh bagravey thocircng tin được phaacutet sinh trước về quaacute khứ vagrave hiện tại tạo caacutec thocircng tin mới về quaacute khứ hiện tại tương lai

Tạo thocircng tin mới về quaacute khứ hiện tại tương lai

62 Lịch sử EIS- EIS xuất hiện lần đầu tiecircn tại MIT vagraveo những năm 1970

- Những EIS đầu tiecircn được phaacutet triển bởi caacutec doanh ngiệp lớn sẵn sagraveng chấp nhận rủi ro để đạt được lợi thế cạnh tranh

- Vagraveo những năm 1980 caacutec nhagrave cung cấp đatilde phaacutet triển một số cơ sở khaacutech hagraveng rộng vagrave cocircng nghệ EIS được tiếp tục phaacutet triển cho đến ngagravey nay

(Tagravei liệu thecircm Sử dụng DSSEIS cho phaacutet triển bền vững + Một số nghiecircn cứu đatilde được tiến hagravenh để kiểm tra việc thực hiện của EIS trong khu vực cocircng cộng vagrave chiacutenh phủ caacutec nước tổ chức kể từ khi chuacuteng được phaacutet triển theo định hướng lợi nhuận cho caacutec cocircng ty tư nhacircn (Hasan vagrave Hasan năm 1997) Theo một nghiecircn cứu tiến hagravenh tại Mỹ ở hơn 300 cocircng ty kết quả cho thấy sự khaacutec biệt của EIS giữa tư nhacircn vagrave chiacutenh phủ một số kết quả thuacute vị được phaacutet hiệnViacute dụ khoacute khăn hơn để chuyển tiền từ một tagravei khoản khaacutec trong một EIS của chiacutenh phủ cũng lagrave khoacute khăn hơn để biện giải thiacutech cho những chi phiacute phaacutet triển EIS của chiacutenh phủ Một nghiecircn cứu khaacutec được tiến hagravenh ở Australia

cho thấy rằng EIS cung cấp cho quản lyacute một higravenh ảnh chiacutenh xaacutec hơn về tổ chức thực hiện vagrave cung cấp hỗ trợ cho caacutec lợi iacutech chiến lược cải thiện khocircng chỉ cho caacutec nhagrave quản lyacute nhưng cograven cho phần cograven lại của tổ chức Dựa trecircn caacutec hệ thống được thiết kế cho caacutec cocircng ty tư nhacircn với một caacutech rotilde ragravengxaacutec định mục tiecircu EIS lagrave thiacutech hợp cho caacutec tổ chức cocircng cộng hiện đại nhưng cần phải được linh hoạt hơn vagrave kết thagravenh chugravem một phạm vi rộng hơn khả năng vagrave phương tiện hơn so với khu vực tư nhacircn ban đầu theo định hướng sản phẩm (Hasan vagrave Hasan năm 1997) Điều nagravey coacute thể lagrave do thực tế rằng caacutec hoạt động khu vực cocircng lagrave bắt buộc coacute taacutec động rộng phải đaacutep ứng sự mong đợi duy nhất cocircng cộng thường coacute mục tiecircu mơ hồ vagrave macircu thuẫn iacutet quyền tự chủ vagrave kiểm soaacutet việc ra quyết định vagrave nhacircn viecircn lagrave khoacute khăn hơn (Watson vagrave Carte2000) + Toacutem lại EIS lagrave một khaacutei niệm thagravenh cocircng noacute phaacutet triển qua nhiều năm tuy nhiecircn EIS khắc phục khiếm khuyết của migravenh bằng caacutech tiến hagravenh nghiecircn cứu liecircn tục)

63 Tại sao những người điều hagravenh hagraveng đầu lại khaacutec nhau- Họ lagrave những doanh nghiệp theo định hướng coacute suy nghĩ

- Coacute một khoảng khocircng gian rộng để kiểm soaacutet

- Họ chịu traacutech nhiệm cho việc thiết lập chiacutenh saacutech

- Họ đại diện cho tổ chức mocirci trường becircn ngoagravei

- Hagravenh động của họ tạo ra những kết quả đaacuteng kể về tagravei chiacutenh vagrave con người

Tần số caacutec hoạt động điều hagravenh- Xử lyacute xaacuteo trộn 42

- Hoạt động kinh doanh 32

- Phacircn bổ nguồn lực 17

- Đagravem phaacuten 3

- Những điều khaacutec 6

Handling Disturbances 42

Entrepreneurial Activites 32

Resource Allocation 17

Negotiation 3

Other 6

Những thocircng tin điều hagravenh cần thiết- Quản lyacute xaacuteo trộn coacute thể yecircu cầu sự chuacute yacute xung quanh đồng hồ

- Hoạt động kinh doanh yecircu cầu điều hagravenh để dự đoaacuten những thay đổi trong mocirci trường

- Nhiệm vụ phacircn bổ tagravei nguyecircn yecircu cầu lựa chọn người quản lyacute vagrave caacutec nguồn lực hạn chế được triển khai

- Đagravem phaacuten yecircu cầu cập nhật thocircng tin từng phuacutet để coacute thể xacircy dựng được sự đồng thuận

Caacutec loại thocircng tin điều hagravenh- Hệ thống kế toaacuten coacute liecircn quan đến việc tiacutenh toaacuten thu nhập hoạt động cho caacutec lĩnh

vực cụ thể lagrave quan trọng hơn so với caacutec hệ thống kế toaacuten truyền thocircng- Thocircng tin về thị trường khaacutech hagraveng cung cấp giaacute trị trong việc quyết định chiến

lược- Caacutec thocircng tin cần thiết thường được truyền đi trecircn một số hệ thống maacutey tiacutenh vagrave

nằm trong toagraven tổ chức- Caacutec thocircng tin được sử dụng thường lagrave ngắn hạn vagrave dễ thay đổi

Phương thức để xaacutec định thocircng tin cần thiết

Rockart xaacutec định được năm phương thức cơ bản để xaacutec định thocircng tin cần thiết

- Phương thức dựa trecircn kết quả- Phương thức rỗng- Phương thức chỉ số khoacutea- Phương thức tổng hợp nghiecircn cứu- Phương thức dựa vagraveo nhacircn tố then chốt dẫn đến thagravenh cocircng

64 Thagravenh phần EIS

- Sản phẩm EIS đầu tiecircn được phaacutet triển để sử dụng trecircn maacutey tiacutenh cấu higravenh cao nhưng caacutec sản phẩm hiện nay nhằm mục tiecircu lagrave nền tảng ClientServer

- Những nền tảng linh hoạt hơn coacute thể thiacutech ứng với thay đổi trong tổ chức vagrave cocircng nghệ

- Sử dụng dữ liệu thời gian thực dẫn đến quyết định nhanh hơn nhiều thocircng tin hơn

Thagravenh phần phần cứng- Một EIS khocircng đogravei hỏi coacute phần cứng cụ thể hoặc duy nhất nagraveo- Chigravea khoacutea của vấn đề lagrave để đảm bảo rằng caacutec thagravenh phần của EIS tối ưu hoacutea vagrave

phugrave hợp với tagravei nguyecircn maacutey tiacutenh của tổ chức- Hệ thống nagravey phải được cấu higravenh để caacutec nguồn tagravei nguyecircn phugrave hợp với những

người điều hagravenh chuacuteng

Thagravenh phần phần mềm- Traacutei ngược với phần cứng phần mềm thường được chuyecircn mocircn hoacutea cao cho caacutec

bagravei toaacuten về miền- Sự chuyecircn mocircn hoacutea nagravey thường đạt được bằng caacutech sử dụng thagravenh phần off-the-

shelf cho toagraven bộ EIS vagrave caacutec mocirc-đun tugravey chỉnh để đaacutep ứng nhu cầu cụ thể- Lotus Notes lagrave một viacute dụ điển higravenh Noacute coacute thể được sử dụng một migravenh hoặc coacute

thể phục vụ becircn thứ ba mocirc-đun plug-in

Cocircng nghệ EIS hiện nay

Dobrzeniecki đề xuấtphacircn loạitừng cấptheo bachức năng- Loại 1 sản phẩm bao gồmmột bộ đầy đủcaacutec ứng dụngtừ mộtnhagrave cung cấp- Loại 2 sản phẩm đượcthựchiệnở phần đầu củacaacutecsản phẩmDSS đượcphaacutet triển

bởicugravengmộtnhagrave cung cấp- Loại 3 sản phẩmkết hợp với nhautheo bất kỳ số lượngthuộc sở hữu củacocircng ty

65 Xacircy dựng EIS

- Xacircy dựngmộtEISgiống nhưxacircydựngmột số hệ thống khaacutec củamocirc higravenh hệ thống thocircng tin

- Việcphaacutet triểncấu truacutecnecircn được theo dotildeitừ quaacute trigravenh thiết kế đến quaacute trigravenhthực hiện

- Tuy nhiecircn một dự aacuten phaacutet triển EIScoacute xu hướnglagrave thống nhấtvagraveyecircu cầu hỗ trợ caacutec nhagrave quản lyacute latildenh đạo

- Xacircy dựng một EIScoacute thểphaacutet hiện ra đượccaacutectigravenh huống khoacute khănmagravemột nhagrave phaacutet triển chưabao giờ gặp phải

Mocirc higravenh EIS

Khung phaacutet triển một EIS

- Watson et al đề nghị xacircy dựngkhung với ba thagravenh phần+ Caacutech tiếp cận tập trung vagraveo yếu tốcon người vagrave dữ liệu coacute liecircn quan đến EIS+ Quaacute trigravenh phaacutet triển cần sự linh hoạt vagrave tương taacutec+ Người sử dụng - hệ thống hộp thoại bao gồm một ngocircn ngữ hagravenh động để xử lyacute caacutec lệnh

Lợi iacutech của EIS- Dễ duy trigrave caacutec mục tiecircu coacute tổ chức- Dễ truy xuất thocircng tin- Cho pheacutep người sử dụng nacircng cao hiệu suất hơn

- Tăng chất lượng ra quyết định- Cung cấp sự cải tiến cạnh tranh- Tiết kiệm thời gian của người sử dụng- Tăng khả năng vagrave chất lượng giao tiếp- Cung cấp khả năng điều khiển tốt hơn trong tổ chức- Cho pheacutep tham gia caacutec vấn đề vagrave caacutec cơ hội- Cho pheacutep hoạch định- Cho pheacutep tigravem kiếm nguyecircn nhacircn của một vấn đề- Thảo matilden caacutec yecircu cầu của người điều hagravenh

Hạn chế của EIS vagrave 1 số sai lầm cần traacutenh

- Chi phiacute một cuộc khảo saacutetnăm1991 chothấychi phiacute phaacutet triểntrungbigravenh365000USDvớichi phiacute vận hagravenhhagraveng năm lagrave$200000 (EIS)

- Cocircng nghệ hạn chếEIScần phảiđượctiacutech hợp hoagraven toagravenvagraveokiếntruacuteccủadoanh nghiệphiện tại do đoacute noacutelagrave một thaacutech thứclớn đối vớithiết kế

- Hạn chế tổ chức cơ cấu tổ chứccoacute thể khocircng phugrave hợp

Sự hạn chế về tổ chức- Chương trigravenh nghị sự vagrave thời gian chệch EIS mocirc tả một phần việc thực hiện một

chương trigravenh nghị sự vagrave coacute thể dễ dagraveng đạt được sự tin cậy một caacutech chắc chắn- Đồng bộ hoacutea việc quản lyacute sự tin cậy đuacuteng luacutec đặc biệt baacuteo caacuteo EIS coacute thể phaacute

vỡ sự ổn định thiết lập caacutec chu trigravenh baacuteo caacuteo một caacutech tốt nhất- Sự bất ổn EIS phản ứng nhanh coacute thể gacircy ra việc taacutec động trở lại một caacutech

nhanh choacuteng dẫn đến sự thiếu ổn định trong tổ chức

Sự thất bại lagrave thay thế khocircng thể chấp nhận được- Một số yếu tố lagravem EIS thất bại

+ Thiếu sự hỗ trợ về mặt quản lyacute+ Vấn đề chiacutenh trị+ Thất bại của nhagrave phaacutet triển+ Lỗi về cocircng nghệ+ Giaacute cả+ Thời gian

66 Ra quyết định điều hagravenh trong tương lai vagrave EIS

- Coacute một vagravei điều kiện sẽ được hợp nhất cho việc chuyển đổi cocircng nghệ Trong đoacute một vagravei điều kiện coacute thể dễ dự đoaacuten Hai điều kiện magrave ta coacute thể thấy lagrave+ Phaacutet triển cocircng nghệ maacutey tiacutenh trong việc điều hagravenh sẽ tạo ra sự chuyển đổi được chấp nhận một caacutech dễ dagraveng hơn+ Mở rộng traacutech nhiệm điều hagravenh sẽ mở rộng nhu cầu thocircng tin

Tương lai của EIS- EIS thocircng minh Những tiến bộ trong cocircng nghệ AI sẽ được triển khai trong caacutec

EIS- EIS đa phương tiện Cơ sở dữ liệu đa phương tiện sẽ cho pheacutep tiacutech hợp văn bản

giọng noacutei vagrave higravenh ảnh trong tương lai- EIS thocircng tin Tương lai EIS sẽ mở rộng hơn trong việc sử dụng dữ liệu becircn

ngoagravei doanh nghiệp- EIS kết nối Giao tiếp với băng thocircng rộng cho pheacutep kết nối liecircn thocircng lớn hơn

Chương 7 HỆ CHUYEcircN GIA VAgrave TRIacute TUỆ NHAcircN TẠO

71 Caacutec khaacutei niệm

72 Triacute thocircng minh của triacute tuệ nhacircn tạo

73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia

74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia

75 Lợi iacutech vagrave hạn chế của hệ chuyecircn gia

71 Caacutec khaacutei niệm

Chuyecircn mocircn (Expertise) sự hiểu biết rộng trong 1 lĩnh vực hẹp

Hệ chuyecircn gia (Expert Systems)1 chương trigravenh maacutey tiacutenh sử dụng 1 tập caacutec luật dựa trecircn tri thức của con người để giải quyết caacutec vấn đề đogravei hogravei phải coacute sự chuyecircn mocircn

Một số hệ chuyecircn gia nổi tiếng

DENDRAL (Standford 1960s Edward Feigenbaum)

MYCIN (Standford1970s Edward Shortliffe)

PROSPECTOR (MIT 1979)

Triacute tuệ nhacircn tạo (Artificial Intelligence ndash AI)

Triacute tuệ nhacircn tạo một bộ phacircn của ngagravenh khoa học maacutey tiacutenh quan tacircm đến việc thiết kế caacutec hệ thống maacutey tiacutenh thocircng minh đoacute lagrave caacutec hệ thống đưa ra caacutec đặc điểm magrave từ đoacute chuacuteng ta liecircn hệ với sự thocircng minh trong hagravenh động của con người (Barr vagrave Feigenbaum 1981)

Mục điacutech của AI

Mục điacutech khoa học xaacutec định caacutec gợi yacute để giải thiacutech caacutec loại khaacutec nhau của triacute tuệ thực

Mục điacutech kỹ thuật giải quyết caacutec vấn đề trong thế giới thực

Triacute tuệ nhacircn tạo kế thừa nhiều yacute tưởng quan điểm kỹ thuật từ caacutec ngagravenh khoa học khaacutec

- Triết học

- Logic Toaacuten học

- Tiacutenh toaacuten

- Khoa học tacircm lyacute Khoa học nhận thức

- Sinh học Thần kinh học

- Tiến hoacutea

Caacutec lĩnh vực ứng dụng trong Triacute tuệ nhacircn tạo

Mạng nơ ron thần kinh (Neural Networks)

Tiacutenh toaacuten sự tiến hoacutea

(Evolutionary Computation)

Hệ chuyecircn gia (Expert Systems)

Kỹ thuật xử lyacute tiếng noacutei (Speech Processing)

Kỹ thuật xử lyacute ngocircn ngữ tự nhiecircn

(Natural Language Processing)

Lập kế hoạch (Planning)

Robot (Robotics)

Khoa học higravenh ảnh (Vision)

Caacutec kỹ thuật thocircng dụng dugraveng trong AI

Biểu diễn(Representation)

Học (Learning)

Caacutec luật (Rules)

Tigravem kiếm (Search)

72 Triacute thocircng minh của triacute tuệ nhacircn tạo

Con người suy diễn như thế nagraveo

Phacircn loại (Categorization)

Caacutec quy tắc cụ thể

Heuristics

Kinh nghiệm trước đoacute

Dự tiacutenh trước

Maacutey tiacutenh suy diễn như thế nagraveo

Lập luận dựa trecircn luật IF-THEN mocirc tả tri thức được matilde hoacutea dưới dạng caacutec luật

Caacutec khung (Frames) lagrave caacutec đại diện mocirc tả caacutec tigravenh huống giống nhau lagrave điển higravenh của một vagravei phacircn loại

Lập luận dựa trecircn caacutec trường hợp mocirc phỏng giải phaacutep trước đoacute cho một vấn đề hiện tại

Nhận dạng mẫu phaacutet hiện acircm thanh higravenh dạng hoặc caacutec chuỗi dagravei

Caacutec dạng khaacutec của Triacute tuệ nhacircn tạo

Học maacutey- mạng nơron vagrave giải thuật di truyền

Lập trigravenh tự động ndash lagrave những kỹ thuật tạo ra caacutec chương trigravenh để lagravem 1 nhiệm vụ riecircng biệt (cho pheacutep những người khocircng phải lagrave người lập trigravenh coacute thể lập trigravenh được)

Cuộc sống nhacircn tạo ndash nỗ lực để taacutei tạo caacutec hiện tượng sinh học trong caacutec hệ thống dựa trecircn maacutey tiacutenh

73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia(Expert Systems- ES)

Theo Jackson (1999) Một hệ chuyecircn gia lagrave một chương trigravenh maacutey tiacutenh mocirc tả vagrave suy diễn với tri thức của một vagravei lĩnh vực để giải quyết vấn đề hay đưa ra caacutec lời khuyecircn

Cấu truacutec cơ bản của ES được dựa theo cấu truacutec chung của DSS Sự khaacutec biệt chiacutenh giữa ES vagraveDSS lagrave hệ ES thu thập caacutec kiến thức từ những

chuyecircn gia trong lĩnh vực quan tacircmĐặc trưng của hệ chuyecircn gia Hiệu quả cao Thời gian trả lời thỏa đaacuteng Độ tin cậy cao Dễ hiểu

Giao diện người dugraveng trong ES

Thiết kế giao diện người dugraveng tập trung vagraveo caacutec yếu tố như dễ dagraveng sử dụngcoacute độ tin cậy cao giảm tải những khoacute khăn khi sử dụng

Thiết kế necircn coacute một số tương taacutec (đầu vagraveo kiểm soaacutet vagrave truy vấn)

Cấu tạo giao diện người dugraveng gồm coacute magraven higravenh cảm ứng bagraven phiacutem buacutet saacuteng lệnh thoại caacutec phiacutem chuyecircn dụng

Cơ sở tri thức (Knowledge Base)

Chứa đựng caacutec tri thức cụ thể miền thu được từ caacutec chuyecircn gia miền

Coacute thể chứa caacutec mocirc tả caacutec hagravenh vi giải quyết vấn đề caacutec ragraveng buộc caacutec heuristics

Thagravenh cocircng của một ES dựa trecircn tiacutenh đầy đủ vagrave tiacutenh chiacutenh xaacutec của cơ sở tri thức

Mocirc tơ suy diễn (Inference Engine)

Ở đacircy tri thức được đặt để sử dụng tạo ra caacutec giải phaacutep để giải quyết vấn đề

Mocirc tơ nagravey coacute khả năng thực hiện diễn dịch hoặc suy diễn dựa trecircn caacutec luật hay caacutec caacutec sự kiện

Đồng thời cũng coacute khả năng sử dụng caacutec suy diễn mờ hay khocircng chiacutenh xaacutec dựa trecircn xaacutec suất hay aacutenh xạ mẫu

Vograveng điều khiển suy diễn

1 Aacutenh xạ caacutec luật với caacutec sự kiện đatilde được cho

2 Chọn luật để thực hiện

3 Thực hiện luật bằng caacutech thecircm caacutec sự kiện được suy diễn ra vagraveo bộ nhớ lagravem việc

Chuỗi suy diễn (Chaining)

Suy diễn tiến (forward chaining) maacutey suy diễn bắt đầu từ dữ liệu ban đầu vagrave thực hiện việc suy luận để đưa ra caacutec kết luận cuối cugraveng

Suy diễn lugravei (backward chaining) maacutey suy diễn bắt đầu từ dữ liệu điacutech vagrave tigravem ra tri thức hỗ trợ cho dữ liệu điacutech đoacute

Viacute dụ suy diễn lugravei

R1 Nếu coacute A vagrave B thigrave suy ra coacute D

R2 Nếu coacute B thigrave suy ra coacute C

R3 Nếu coacute C vagrave D thigrave suy ra coacute E

Ta coacute E ta xem trong 3 luật R1 R2 R3 luật nagraveo coacute E ta thấy R3 chứa E đồng thời chứa C vagrave D Xeacutet tiếp trong 2 luật R1 R2 luật nagraveo chứa C vagrave D R2 chứa C R3 chứa D Từ đoacute ta coacute được caacutec tri thức hỗ trợ suy diễn vagrave kết luận lagrave nếu coacute A vagrave B thigrave sẽ coacute E Hay nếu A vagrave B đuacuteng thigrave sẽ coacute E

Viacute dụ suy diễn tiến

Giả sử coacute tập chứa 3 luật sau

R1 Nếu coacute A vagrave B thigrave suy ra coacute D

R2 Nếu coacute B thigrave suy ra coacute C

R3 Nếu coacute C vagrave D thigrave suy ra coacute E

Nếu ta coacute A vagrave B thigrave chuacuteng ta suy ra được D từ R1 vagrave suy ra C từ R2 Với D vagrave C đatilde được suy ra ở trecircn giờ chuacuteng ta suy ra được E từ R3

Viacute dụ thực tế

Giả sử muốn biết magraveu của một con vật nuocirci tecircn lagrave Fred biết rằng noacute kecircu ộp ộp vagrave ăn ruồi

Coacute tập 4 luật ban đầu như sau

R1 Nếu X kecircu ộp ộp vagrave ăn ruồi thigrave X lagrave con ếch

R2 Nếu X kecircu chiecircm chiếp vagrave biết hoacutet thigrave X lagrave con chim

R3 Nếu X lagrave con ếch thigrave X coacute magraveu xanh

R4 Nếu X lagrave con chim thigrave X coacute magraveu vagraveng

74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia

Expert system shells lagrave một tập caacutec goacutei phần mềm vagrave caacutec cocircng cụ dugraveng để phaacutet triển caacutec hệ chuyecircn gia

Những Expert system shells đầu tiecircn thường rất rườm ragrave Mặc dugrave vậy noacute vẫn giuacutep cho người sử dụng sẽ khocircng phải bắt đầu lại từ đầu khi xacircy dựng một hệ chuyecircn gia mới

Những shell hiện đại bao gồm hai mocirc-đun chiacutenh lagrave cocircng cụ xacircy dựng một tập quy tắc vagrave mocirc tơ suy diễn

Xacircy dựng hệ chuyecircn gia

Bước 1 xacircy dựng mocirc higravenh bagravei toaacuten xaacutec định vấn đề nhiệm vụ magrave hệ thống sẽ thực hiện Caacutec dạng bagravei toaacuten cần hệ chuyecircn gia

Bagravei toaacuten diễn giải (InterPretation)

Bagravei toaacuten dự baacuteo (Prediction)

Bagravei toaacuten chuẩn đoaacuten (Diagnose)

Bagravei toaacuten gỡ rối (Debugging)

Bagravei toaacuten thiết kế

Tương tự như một dự aacuten phần mềm để xacircy dựng một hệ chuyecircn gia cần phải coacute caacutec yếu tố về nhacircn lực tagravei nguyecircn vagrave thời gian Những yếu tố nagravey ảnh hưởng đến giaacute thah của một hệ chuyecircn giaTrong phần nagravey cacircu hỏi thường được đặt ra lagrave tại sao cần phải xacircy dựng một hệ chuyecircn giaTrước khi bắt đầu phải xaacute định rotilde bagravei toaacuten đạt ra lagrave jiAi lagrave chuyecircn giaAi lagrave người sử dụng

1 Diễn giải (InterPretation) Nghiecircn cứu 1 vấn đề -gt Dựa trecircn những biểu hiện thuộc tiacutenh đặc trưng becircn ngoagravei -gt Tư vấn

(hoặc đưa ra kết luận hay mocirc tả dễ hiểu từ tập dữ liệu thocirc)

2 Bagravei toaacuten dự baacuteo (Prediction) Coacute thể dự đoaacuten được hagravenh vi kết quả dựa trecircn caacutec hiện tượng -gt dự baacuteo

VD Dự baacuteo thời tiết động đấthellip

3 Bagravei toaacuten chẩn đoaacuten (Diagnoss) Xaacutec định caacutec lỗi caacutec bộ phận hỏng hoacutec của hệ thống dựa trecircn caacutec dữ liệu quan saacutet được

4 Bagravei toaacuten gỡ rối (Debugging) Mocirc tả caacutec phương phaacutep khắc phục hệ thống khi gặp sự cố

5 Bagravei toaacuten thiết kế Lựa chọn cấu higravenh caacutec đối tượng nhằm thoả matilden một số ragraveng buộc nagraveo đoacute

6 Giảng dạy Phần mềm dạy học coacute thể chuẩn đoaacuten vagrave sủa lỗi của học sinh trong quaacute trigravenh học tập

Để xaacutec định đuacuteng bagravei toaacuten magrave chuacuteng ta cần giải quyết thigrave phải trả lời đc một số cacircu hỏi

- cần hệ chuyecircn gia

Bước 2 thu thập tri thức lựa chọn cocircng cụ vagrave aacutep dụng

Trong bước thu thập tri thức vấn đề quan trọng lagrave lựa chọn chuyecircn gia những người magrave sẽ đoacuteng goacutep tri thức cho hệ thống Thocircng thường trong suốt quaacute trigravenh phaacutet triển thigrave chuyecircn gia được xem như một thagravenh viecircn của đội phaacutet triển

Hiện nay coacute rất nhiều cocircng cụ để xacircy dựng một hệ chuyecircn gia Phổ biến nhất lagrave JESS CLIPS vagrave OPS5

Bước 3 Thiết kế cơ sở tri thức thiết kế hệ thốngTri thức được biểu diễn trường minh trong cơ sở tri thức

Caacutec chuyecircn gia vagrave kỹ sư tri thức sẽ đối thoại với nhau bằng caacutec kỹ thuật đối thoại Suy diễn (SD) bảng Mocirc higravenh hoacutea SD quy nạp phacircn loại

Vấn đề bagraveo trigrave vagrave phaacutet triển

Caacutec hệ chuyecircn gia đogravei hỏi phải bảo trigrave vagrave phaacutet triển nhiều hơn so với caacutec hệ thống khaacutec Phải thường xuyecircn bổ sung tri thức mới vagrave thay đổi caacutec tri thức cũ để đổi mới hệ chuyecircn gia

Thu thập vagrave khắc phục lỗi do người sử dụng phaacutet hiện để kịp thời khắc phục những sai soacutet của hệ chuyecircn gia

75 Lợi iacutech vagrave hạn chế của caacutec hệ chuyecircn gia

Một số lợi iacutech chiacutenh

Thời gian trả lời hợp lyacute bằng hoặc nhanh hơn so với chuyecircn gia (người) để đi đến cugraveng một quyết định Hệ chuyecircn gia lagrave một hệ thống thời gian thực (real time system)

Khả năng trả lời với mức độ tinh thocircng bằng hoặc cao hơn so với chuyecircn gia (người) trong cugraveng lĩnh vực

Hệ chuyecircn gia giuacutep cho hiệu quả lagravem việc tăng bằng việc sử dụng tập caacutec luật một caacutech nhanh choacuteng magrave ko bị nhầm lẫn chuyecircn gia lagrave người coacute thể quecircn đi một số tri thức cơ sở lyacute luậ nhưng HCG thigrave ko

Quyết định của một người chuyecircn gia coacute thể bị thay đổi vagrave ko coacute tiacutenh thống nhất như quyết định của một hệ chuyecircn gia tạo ra

Hệ chuyecircn gia giuacutep cho người sử dụng coacute thể trau dồi sự hiểu biết trecircn lĩnh vuej cụ thể magrave noacute giải quyết hỗ trợ người ra quyết định coacute trigravenh độ như 1 chuyecircn gia trong quaacute trigravenh gia quyết định

Kiến thức của rất nhiều chuyecircn gia về một lĩnh vực nagraveo đoacute được đưa vagraveo hệ chuyecircn gia lagravem cho CSTT cuat HCG phong phuacute vagrave rộng lớn hơn rất nhiều

HCG giải thiacutech caacutec bước suy luận một caacutech dễ hiểu nhất quaacuten luacutec nagraveo cũng coacute thể sử dụng ko như chuyecircn gia con người

Hạn chế của caacutec hệ chuyecircn gia

Nhược điểm lớn nhất của hệ chuyecircn gia lagrave những yacute kiến chuyecircn mocircn thường rất khoacute matilde hoacutea vagrave giải neacuten

Hệ chuyecircn gia khocircng coacute khả năng tự học tự cập nhật kiến thức mới như caacutec chuyecircn gia magrave cần phải được matilde hoacutea lại khi noacute được cập nhật

Hệ chuyecircn gia khocircng thể nhận ra được vấn đề khocircng nằm trong miền kiến thức của hệ thống

Chương 8 Tri thức vagrave tiếp nhận

1 Bao gồm caacutec vấn đề

Dữ liệu thực tế đo lường hoặc quan saacutet coacute hoặc khocircng coacute bối cảnh

Thocircng tin dữ liệu được tổng hợp một caacutech hữu iacutech để giải quyết những khoacute khăn trong việc đưa ra quyết định

Tri thức bao gồm caacutec ứng dụng quy tắc thocircng tin hướng dẫn của người ra quyết định

2 Những caacutei nhigraven về tri thức

Đại diện lagravem thế nagraveo để diễn tả tri thức viacute dụ như một quyển saacutech khocircng phải lagrave tri thức nhưng noacute lại lagrave một đại diện của tri thức

Sản xuất tri thức lagrave một tập hơp của hagraveng tồn kho coacute thể được sản xuất cũng như mua lại

Tri thức lagrave 1 trong 6 trạng thaacutei của hệ thống

1Dữ liệu 2Thocircng tin 3Cấu truacutec thocircng tin 4Sự thấu hiểu 5Yacute kiến 6 Quyết định

3 Caacutec loại tri thức Phổ biến mocirc tả dữ liệu thocircng tin thủ tục mọi thứ lagravem như thế nagraveo lập luận chiacutenh saacutech hoặc caacutec quy tắc

4 Thu thập Tri thức hệ chuyecircn gia Hầu hết caacutec phương phaacutep đều bắt đầu với mocirc higravenh của caacutec taacutec vụ trong đoacute

hệ chuyecircn gia được xacircy dựng Trong đoacute mocirc tả về caacutec lĩnh vực được tạo ra Caacutec kỹ sư sử dụng caacutec mocirc higravenh giả thuyết vagrave nhận thức về quaacute trigravenh phacircn

tiacutech để gợi ra caacutech giải quyết vấn đề về tri thức từ caacutec chuyecircn gia

5 Caacutec chiều của thu thập tri thức KE- driven caacutec kỹ sư trao đổi trực tiếp với caacutec chuyecircn gia Expert-driven Caacutec chuyecircn gia trực tiếp đưa chuyecircn mocircn của họ vagraveo hệ

thống maacutey tiacutenh Machine-driven Sử dụng caacutec cocircng cụ suy luận để triacutech xuất tri thức từ một

tập caacutec viacute dụ

6 Kỹ thuật thu thập tri thức Trao đổi gồm 2 loại cơ bản lagrave coacute cấu truacutec(coacute kịch bản) vagrave khocircng coacute cấu

truacutec( đối thoại trực tiếp) Giao thức phacircn tiacutech bằng lời Khi caacutec chuyecircn gia thực hiện một cocircng việc

của họ thigrave một bản ghi về cocircng việc đoacute được thực hiện Caacutec kỹ sư sẽ xacircy dựng mocirc higravenh cho những gigrave được ghi lại trong bản ghi

Phương phaacutep sagraveng lọc caacutec chuyecircn gia so saacutenh caacutec nhoacutem liecircn tiếp trong ba đối tượng vagrave cho biết tại sao nhoacutem thứ hai lại khaacutec nhoacutem thứ ba

7 Thu thập tri thức từ nhiều nguồn Thu thập tri thức từ nhiều nguồn lagrave cần thiết để coacute được đầy đủ caacutec tri thức

cho một vấn đề quan điểm yacute kiến traacutei ngược nhau thường phaacutet sinh Phương phaacutep đồng thuận sẽ giuacutep giải quyết được vấn đề macircu thuẫn Kỹ thuật phacircn tiacutech Meta lagrave kỹ thuật được aacutep dụng trong caacutec trường hợp

khaacutec Caacutech tiếp cận bằng định lượng đogravei hỏi caacutec kỹ sư cần cacircn nhắc yếu tố đầu vagraveo của caacutec chuyecircn gia khaacutec nhau

8 Xaacutec nhận hợp lệ vagrave kiểm tra tri thức Một khi thu thập tri thức noacute phải được đaacutenh giaacute về khả năng sử dụng vagrave độ

chiacutenh xaacutec Hai vấn đề cụ thể lagrave hiệu lực của những kiến thức vagrave kiểm tra việc xacircy dựng cơ sở của tri thức

Cần xaacutec nhận xem liệu hệ thống coacute thể hoạt động ở mức độ tối thiểu khocircng

Xaacutec minh liecircn quan đến việc so saacutenh từng chi tiết kỹ thuật của hệ thống những gigrave đatilde được thực hiện cuối cugraveng

9 Một số caacutec biện phaacutep xaacutec nhận Độ chiacutenh xaacutec Khả năng thiacutech nghi Mức độ đầy đủ Bề rộng Độ sacircu Hiệu lực Tổng quan Chiacutenh xaacutec Hiện thực Độ tin cậy Tiacutenh hữu dụng Mức độ

Chương 9 Học maacutey

1 Logic mờ vagrave ngocircn ngữ mờ(Fuzzy Logic and Linguistic Ambiguity)

Ngocircn ngữ tự nhiecircn gồm những khaacutei niệm mơ hồ vagrave khocircng chiacutenh xaacutectruyền tải ngữ nghĩa thocircng qua tiacutenh xấp xỉkhocircng rotilde ragraveng

Những xấp xỉ nagravey giuacutep con người coacute thể truyền tải hết được yacute nghĩa nhưng maacutey thigrave khocircng hiểu

Lagravem sao biểu diễn caacutec tri thức sử dụng caacutec khaacutei niệm khocircng rotilde ragraveng(mờ) hoặc khocircng chiacutenh xaacutec

2 Khaacutei niệm cơ bản của logic mờ tập mờ lagrave những tập hợp khocircng coacute một giới hạn rotilde Mỗi phần tử của noacute chỉ

chứa một mức độ hagravem liecircn thuộc của từng phần tử Vigrave vậy tập mờ khocircng giống như tập cổ điển Tập mờ coacute thể kết hợp với nhau qua những luật mờ magrave đặc trưng cho những hagravenh động trạng thaacutei vagrave thuộc tiacutenh của logic mờ được tận dụng khi thực hiện một bộ điều khiển mờ

Logic mờ dựa trecircn yacute tưởng mỗi phần tử thuộc vagraveo một tập hợp ở một mức độ nagraveo đấy

Locircgic mờ cho pheacutep độ liecircn thuộc (microA )coacute giaacute trị trong khoảng (01) Locircgic mờ coacute thể được coi lagrave mặt ứng dụng của lyacute thuyết tập mờ để xử lyacute caacutec

giaacute trị trong thế giới thực cho caacutec bagravei toaacuten phức tạp

3 So saacutenh tiacutenh đuacuteng đắn logic mờ vagrave xaacutec suất Xaacutec suất thigrave đề cập đến khả năng xảy ra một biến cố hay một điều gigrave đoacute Logic mờ đề cập đến cấp độ magrave đặc tiacutenh ở hiện tại

o viacute dụ1 người coacute chiều cao 6 feet thigrave coacute cấp độ lagrave 05 về chiều cao

4 Ưu điểm của logic mờ Caacutech tiếp cận rất tự nhiecircnkhocircng phức tạp Coacute thể mocirc higravenh hoacutea caacutec hagravem phi tuyến tugravey yacute phức tạp

Coacute thể tận dụng được kinh nghiệm từ những chuyecircn gia hagraveng đầu trong mọi lĩnh vực

Logic mờ được xacircy dựng dựa trecircn ngocircn ngữ tự nhiecircnNền tảng của logic mờ lagrave dựa trecircn cơ sở giao tiếp của con người

5 Nhược điểm của logic mờ Trong 1 hệ thống phức tạpsử dụng logic mờ coacute thể trở thagravenh trở ngại cho

việc xaacutec thực độ tin cậy của hệ thống Cơ chế lập luận mờ khocircng thể học hỏi từ những lỗi sai

6 Mạng noron nhacircn tạo(ANN) Mạng noron nhacircn tạo lagrave một mocirc phỏng xử lyacute thocircng tinđược nghiecircn cứu ra

từ hệ thống thần kinh của sinh vậtgiống như bộ natildeo để xử lyacute thocircng tin ANNs lagrave chương trigravenh dựa trecircn maacutey tiacutenh đơn giản coacute chức năng lagrave một mocirc

higravenh bagravei toaacuten khocircng gian dựa trecircn thử nghiệm vagrave baacuteo lỗi

7 Học từ kinh nghiệm Tiến trigravenh Một mẫu dữ liệu được biểu diễn như một mạng lưới noronANN ldquodự

đoaacutenrdquo 1 đầu radự đoaacuten được so saacutenh với giaacute trị thực tế hoặc giaacute trị chiacutenh xaacutecNếu đoaacuten được chiacutenh xaacutec thigrave khocircng coacute hagravenh động nagraveo được thực hiện

Nếu dự đoaacuten sai ANN kiểm tra lại vagrave xaacutec định lại thocircng số để điều chỉnh Một mẫu dữ liệu khaacutec được biểu diễn vagrave quaacute trigravenh nagravey được lặp lại

8 Nguyecircn tắc cơ bản của cocircng nghệ nơron Caacutec yếu tố xử lyacute cơ bản trong hệ thống thần kinh của con người lagrave tế bagraveo

thần kinhMạng lưới của tế bagraveo nagravey lagrave liecircn kết với nhau nhận được thocircng tin từ caacutec cảm biến trong mắt taihellip

Thocircng tin nhận được bởi tế bagraveo thần kinh hoặc lagrave sẽ kiacutech thiacutech noacute(sẽ được chuyển qua 1 thocircng điệp dọc theo mạng lưới) hoặc lagrave sẽ ngăn cản noacute(ngăn cản dograveng thocircng tin)

Độ nhạy coacute thể thay đổi qua thời gian hoặc sau khi coacute được kinh nghiệm

9 Cấu truacutec mạng Một ANN gồm 3 lớp cơ bản

Lớp đầu vagraveo nhận dữ liệu Lớp becircn trong hoặc lagrave lớp ẩn xử lyacute dữ liệu Lớp đầu ra chuyển tiếp kết quả cuối cugraveng của mạng

10Mạng nơ ron Thường coacute nhiều đầu vagraveo mỗi đầu vagraveo với mức ảnh hưởng vagrave tầm quan

trọng riecircng của noacute Một đầu vagraveo quan trọng coacute thể được sử dụng để khuếch đại đầu ra caacutec hagravem trạng thaacutei tổng hợp caacutec trọng số của caacutec yếu tố

đầuvagraveo khaacutec nhauvagraveo một giaacute trị duy nhất Caacutec hagravem chuyển giao xử lyacute caacutec giaacute trị trạng thaacutei vagrave tạo đầu ra

11Huấn luyện mạng nơ ron Trong mocirc higravenh coacute giaacutem saacutetANN được đến so saacutenh dự đoaacuten của chiacutenh

noacute với thocircng tin phản hồi coacute chứa caacutec kết quả mong muốn ANN sẽ phải tigravem caacutech thay đổi caacutec tham số becircn trong củamigravenh (caacutec trọng số vagrave caacutec ngưỡng) để tạo necircn một aacutenh xạ coacute khả năng aacutenh xạcaacutec đầu vagraveo thagravenh caacutec đầu ra mong muốn Sự thay đổi nagravey được tiến hagravenh nhờ việc so saacutenh giữa đầu ra thực sự vagrave đầu ra mong muốn

Trong mocirc higravenh khocircng coacute giaacutem saacutetANN nhận được dữ liệu vagraveo nhưng khocircng phải coacute bất kỳ thocircng tin phản hồi về kết quả mong muốn

Phần lớn caacutec ứng dụng nằm trong vugraveng của caacutec bagravei toaacuten ước lượng như mocirc higravenh hoacuteathống kecirc neacuten lọc phacircn cụm

12Lợi iacutech Liecircn kết với mạng noron Traacutenh caacutech lập trigravenh tường minh Giảm nhu cầu của chuyecircn gia ANNs thigrave thiacutech nghi với caacutec yếu tố đầu vagraveo thay đổi Khocircng cần thiết cho cơ sở tri thức tinh chế ANNs coacute tiacutenh động vagrave cải thiện với việc sử dụng Coacute khả năng xử lyacute dữ liệu khocircng chiacutenh xaacutec hoặc khocircng đầy đủ Cho pheacutep tổng quaacutet hoacutea từ thocircng tin cụ thể Cho pheacutep thu thập cảm giaacutec thocircng thường vagraveo miền giải quyết vấn đề

13Hạn chế của việc liecircn kết với mạng noron ANNs khocircng thể giải thiacutech được suy luận Bản chất hộp đen thường khiến cho vấn đề traacutech nhiệm vagrave độ tin cậy phaacutet

sinh lagrave khoacute khăn Lặp đi lặp lại quaacute trigravenh huấn luyện rất tốn thời gian Nguồn lực caacutec nhagrave phacircn tiacutech vagrave thiết kế coacute tay nghề cao vẫn lagrave đaacuteng lo

ngại Cocircng nghệ ANN thuacutec đẩy hạn chế của phần cứng hiện tại ANN yecircu cầu phải coacute sự tin tưởng ở đầu ra

14Giới thiệu về thuật toaacuten di truyền Cũng như mạng lưới thần kinh caacutec thuật toaacuten di truyền được dựa trecircn lyacute

thuyết sinh học Thuật toaacuten di truyền tigravem thấy nguồn gốc của chuacuteng trong caacutec lyacute thuyết

tiến hoacutea của chọn lọc tự nhiecircn vagrave thiacutech ứng với biến đổi khiacute hậu Kết quả thuật toaacuten di truyền lagrave từ giao phối 2 caacute thể trong quần thế để tạo

ra con caacutei đocirci khi tốt hơn so với bậc cha mẹ của chuacuteng 15Caacutec thagravenh phần cơ bản của thuật toaacuten di truyền

Toaacuten tử chọn lọc Caacutec caacute thể tốt được chọn lọc để đưa vagraveo thế hệ sau Sự chọn lọc nagravey căn cứ vagraveo độ thiacutech nghi với mocirci trường của mỗi caacute thể

Toaacuten tử lai gheacutep (crossover) Hai caacute thể cha vagrave mẹ trao đổi caacutec gen với nhau để tạo ra caacute thể con

Toaacuten tử đột biến (mutation) Một caacute thể thay đổi một số gen để biến đổi thagravenh một caacute thể mớiTất cả caacutec toaacuten tử trecircn khi thực hiện đều mang tiacutenh ngẫu nhiecircn

16Quaacute trigravenh cơ bản của một thuật toaacuten di truyền Khởi tạo

Đaacutenh giaacute quần thể

Lựa chọn NST thiacutech hợp nhất vagrave loại bỏ NST yếu nhất

Quy trigravenh giao nhau vagrave cải thiện quần thể

đột biến tiến trigravenh để khaacutem phaacute ra NST mới

17Ưu nhược điểm của việc kết hợp với thuật toaacuten di truyền Kiacutech thước quần thể lagrave 1 yếu tố quan trọng trong tốc độ của việc tigravem

kiếmnhưng noacute tương đối dễ dagraveng để dự đoaacuten tốc độ nagravey Giao nhau hoặc đột biến lagrave khocircng necircn đc sử dụng quaacute thường xuyecircn Luocircn coacute được iacutet nhất 1 giải phaacutep hợp lyacute Necircn coacute thể aacutep dụng chuacuteng cho caacutec vấn đề magrave chuacuteng ta khocircng coacute hướng

về caacutech giải quyết Sức mạnh của thuật toaacuten xuất phaacutet từ khaacutei niệm đơn giảnkhocircng phải từ

một thủ tục thuật toaacuten phức tạp 18Tương lai của học maacutey

Mạng lưới thần kinh nhacircn tạo vượt quaacute năng lực của con người trong caacutec trường hợp bị cocirc lập

Về mặt lyacute thuyếtmột maacutey tiacutenh coacute thể xử lyacute dũ liệu nhanh hơn hagraveng triệu lần so với 1 con người

May mắn thay cho chuacuteng tacon người tốt hơn nhiều khi magrave coacute được dữ liệumaacutey tiacutenh khocircng coacute 1 số thứ như lagrave 5 giaacutec quan

CHƯƠNG 10 KHO DỮ LIỆU

1 Kho dữ liệu Kho dữ liệu lagrave tuyển tập caacutec cơ sở dữ liệu tiacutech hợp hướng chủ đề được

thiết kế để trợ giuacutep cho một hệ hỗ trợ quyết định

Theo John Ladley Cocircng nghệ kho dữ liệu lagrave tập caacutec phương phaacutep kỹ thuật vagrave caacutec cocircng cụ coacute thể kết hợp hỗ trợ nhau để cung cấp thocircng tin cho người sử dụng trecircn cơ sở tiacutech hợp từ nhiều nguồn dữ liệu nhiều mocirci trường khaacutec nhau

Kho dữ liệu thường rất lớn tới hagraveng trăm GB hay thậm chiacute hagraveng Terabyte

2 Kho dữ liệu vận hagravenh (ODS) Một kho dữ liệu vận hagravenh Aacutep dụng kỹ thuật kho dữ liệu vagraveo caacutec hệ xử

lyacute giao taacutec lưu trữ dữ liệu cho một ứng dụng đặc thugrave Noacute đưa vagraveo kho dữ liệu một dograveng caacutec dữ liệu thocirc được thiết kế

3 So saacutenh

Kho dữ liệu vận hagravenh Kho dữ liệu

Dữ liệu theo chủ đề Dữ liệu theo chủ đề

Dữ liệu tiacutech hợp Dữ liệu tiacutech hợp

Dữ liệu thay đổi Dữ liệu khocircng thay đổi

Dữ liệu được cập nhật khi thay đổi

Dữ liệu giữ nguyecircn

Chỉ coacute dữ liệu hiện tạiDữliệu hiện tại vagrave dữ liệu lịch sử

Chu kỳ lagravem tươi dữ liệu ngắn Chu kỳ lagravem tươi dữ liệu dagravei

Chỉ coacute dữ liệu chi tiết Dữ liệu chi tiết vagrave dữ liệu tổng kết

Dugraveng cho caacutec quyết định ngắn hạn

Dugraveng cho hoạch định dagravei hạn

4 Kho dữ liệu cục bộ (Data Mart - DM)

Kho dữ liệu cục bộ lagrave CSDL coacute những đặc điểm giống với kho dữ liệu nhưng với quy mocirc nhỏ hơn vagrave lưu trữ dữ liệu về một lĩnh vực một chuyecircn ngagravenh

Data mart phụ thuộc Chứa những dữ liệu được lấy từ DW vagrave những dữ liệu nagravey sẽ được triacutech lọc vagrave tinh chế tiacutech hợp lại ở mức cao hơn để phục vụ một chủ đề nhất định của Datamart

Data mart độc lập Khocircng giống như Datamart phụ thuộc Data mart độc lập được xacircy dựng trước DW vagrave dữ liệu được trực tiếp lấy từ caacutec nguồn khaacutec nhau

5 Siecircu dữ liệu Metadata lagrave dữ liệu để mocirc tả dữ liệu Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột

một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi Metadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu

6 Mocirci trường kho dữ liệu Hệ thống của tổ chức vagrave kho cung cấp dữ liệu để xacircy dựng kho dữ liệu Trong quaacute trigravenh chuyển dữ liệu từ caacutec nguồn khaacutec nhau dữ liệu coacute thể

được lagravem sạch hoặc chuyển đổi vagrave vigrave thế DW được xem như lagrave một chuẩn cho việc lưu trữ

Đồng thời siecircu dữ liệu được ghi lại Cuối cugraveng DW hoặc siecircu thị coacute thể được sử dụng để tạo ra một kho dữ

liệu ldquocaacute nhacircnrdquo 7 Caacutec đặc điểm của kho dữ liệu

Đặc điểm Mocirc tả

Hướng chủ đề - DL tổ chức theo caacutech thức người dugraveng tham chiếu

Tiacutech hợp - Dữ liệu ldquosạchrdquo loại bỏ tiacutenh thiếu nhất quaacuten

Khocircng thay đổi - DL ldquochỉ đọcrdquo người dugraveng khocircng thay đổi được

Chuỗi thời gian - DL lagrave chuỗi thời gian khocircng phải lagrave trạng thaacutei hiện tại

Được tổng kết - DL vận hagravenhthao taacutec khi cần thiết

được kết hợp lại thagravenh dạng coacute thể dugraveng được cho quyết định

Kiacutech cỡ lớn hơn - Lưu giữ theo chuỗi thời gian tức lagrave giữ lại nhiều DL

Khocircng được chuẩn hoacutea - Coacute thể dư thừa DLSiecircu dữ liệu - Dữ liệu của dữ liệu được lưu trữNguồn dữ liệu - DL vận hagravenh (caacutec hệ sẵn coacute) cugraveng

với caacutec nguồn ngoagravei 8 Kho dữ liệu hướng chủ đề

Hướng chủ để coacute nghĩa lagrave kho dữ liệu được tổ chức xung quanh caacutec chủ đề chiacutenh như khaacutech hagraveng sản phẩm sản xuất Tập trung vagraveo việc mocirc higravenh hoacutea vagrave phacircn tiacutech dữ liệu cho caacutec nhagrave ra quyết định magrave khocircng tập trung vagraveo caacutec xử lyacute thocircng thường Cung cấp cho người dugraveng một khung nhigraven toagraven vẹn đơn giản vagrave đầy đủ về caacutec sự kiện quanh caacutec chủ đề

9 Dữ liệu trong DW được tiacutech hợp Dữ liệu trong kho dữ liệu được xacircy dựng bằng caacutech tổng hợp dữ liệu từ

nhiều nguồn khaacutec nhau vagrave caacutec nguồn coacute tổ chức khaacutec nhau Cơ sở dữ liệu caacutec file excel caacutec flat file hoặc caacutec raw file Khi đưa vagraveo kho dữ liệu caacutec dữ liệu được lagravem sạch vagrave tiacutech hợp dữ liệu nhằm đảm bảo tiacutenh nhất quaacuten của dữ liệu

10Kiến truacutec kho dữ liệu Tầng cơ sở dữ liệu hoạt động Tầng truy xuất thocircng tin Tầng truy xuất dữ liệu Tầng siecircu dữ liệu Tầng quản lyacute tiến trigravenh Tầng thocircng điệp của ứng dụng Tầng vật liacute của kho dữ liệu Tầng trigravenh diễn dữ liệu

11Higravenh trạng kho dữ liệu Kho dữ liệu ảo - người dugraveng cuối coacute thể truy cập trực tiếp đến kho dữ liệu

sử dụng caacutec cocircng cụ cho pheacutep ở tầng truy xuất dữ liệu Kho dữ liệu trung tacircm-1 cơ sở dữ liệu vật lyacute chứa tất cả dữ liệu cho một

vugraveng chuyecircn dụng nagraveo đoacute

Kho dữ liệu phacircn taacuten- Thagravenh phần được phacircn taacuten qua nhiều hệ cơ sở dữ liệu vật lyacute

12METADATA- Siecircu dữ liệu Định nghĩa Siecircu dữ liệu lagrave dữ liệu về dữ liệu Lagrave 1 lưu trữ dugraveng để

Miecircu tả kho dữ liệu tổng thể Nhận dạng kiểu kho dữ liệu Quản liacute quaacute trigravenh tiacutech hợp dữ liệu Quản liacute quaacute trigravenh cập nhật kho dữ liệu Quản liacute bảo mật

Lagrave chigravea khoacutea quyết định sự thagravenh cocircng của kho dữ liệu luocircn được thay đổi vagrave cập nhật theo sự phaacutet triển của kho dữ liệu

Dugraveng để quản liacute điều khiển kho dữ liệu Sự ra đời của kho dữ liệu như 1 cấu truacutec hỗ trợ ra quyết định siecircu dữ liệu

được xem như nguồn tagravei nguyecircn dữ liệu Siecircu dữ liệu lagrave trừu tượng Chuacuteng lagrave dữ liệu bậc cao cung cấp mocirc tả ngắn

gọn caacutec dữ liệu bậc thấp hơn 13Hoạt động của Siecircu dữ liệu

Siecircu dữ liệu rất cần thiết trong việc chuyển hoacutea thocircng tin trở thagravenh tri thức Lagrave chigravea khoacutea giuacutep chuacuteng ta xử lyacute được dữ liệu thocirc Viacute dụ một dograveng dữ liệu baacuten hagraveng 1023 K596 11121 agraveNoacute sẽ khocircng coacute nghĩa gigrave cho đến khi chuacuteng ta đưa vagraveo siecircu dữ liệu (thư

mục chứa dữ liệu) agrave cửa hagraveng 1023 sản phẩm K596 vagrave số tiền baacuten được lagrave 11121 đocirc la

14Sự cần thiết phải nhất quaacuten trong kho dữ liệu Kho dữ liệu được xacircy dựng cho lợi iacutech của những nhagrave phacircn tiacutech kinh

doanh caacutec nhagrave quản trị cho tất cả caacutec khu vực chức năng Trong cơ sở dữ liệu riecircng caacutec khu vực khaacutec nhau coacute thể định nghĩa vagrave lưu

trữ dữ liệu thocircng qua phiecircn bản của chiacutenh noacute Khi dữ liệu được lấy từ những vugraveng khaacutec nhau đoacute vagrave được đặt vagraveo kho dữ

liệu Việc chuyển đổi vagrave lagravem sạch caacutec tiến trigravenh sẽ đảm bảo noacute lagrave duy nhất được tiacutech hợp tại một mức của tổ chức

15Ragrave soaacutet lại dữ liệu ndash Thực thi siecircu dữ liệu

Bất kể cấu truacutec tự nhiecircn của 1 cacircu truy vấn thế nagraveo thigrave caacutec thagravenh phần của siecircu dữ liệu rất quan trọng đối với người ra quyết định

Bảng thuộc tiacutenh khoacutea được lưu trữ bởi kho dữ liệu Tập hợp dữ liệu được lấy từ đacircu Những chuyển đổi nagraveo được thực thi với việc lagravem sạch

16Siecircu dữ liệu lagrave gigrave Metadata - lagrave thocircng tin mocirc tả nội dung của cơ sở dữ liệu (CSDL) Metadata baacuteo cho người dugraveng biết thời gian cập nhật sau cugraveng của dữ liệu

định dạng vagrave mục điacutech sử dụng của noacute Những thocircng tin nagravey coacute thể hướng dẫn người dugraveng duyệt qua CSDL vagrave

giuacutep họ hiểu được yacute nghĩa vagrave ngữ cảnh của dữ liệu Trong CSDL metadata lagrave caacutec dạng biểu diễn khaacutec nhau của caacutec đối tượng

trong CSDL Trong CSDL quan hệ metadata lagrave caacutec định nghĩa của bảng cột CSDL

view vagrave nhiều đối tượng khaacutec Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột

một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi -gtMetadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu

Bảng chuyển đổi Ghi lại những chuyển đổi đatilde được thực hiện

Lịch sử thực thi Ghi lại những dữ liệu đatilde được

phacircn tiacutech

Higravenh thaacutei kết nốiGhi lại những dữ liệu được kết nối vagrave tần suất

17Aacutenh xạ thocircng thường của siecircu dữ liệu Bản ghi aacutenh xạ chuyển đổi bao gồm

Định danh của nguồn gốc Chuyển đổi thuộc tiacutenh Chuyển đổi thuộc tiacutenh vật lyacute Matilde hoacutea tham chiếu bảng chuyển đổi Đổi tecircn Đổi khoacutea Gaacuten giaacute trị cho thuộc tiacutenh mặc định Chọn logic cho caacutec nguồn nhiều giaacute trị Đổi thuật toaacuten

18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để

phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai

lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave

tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec

Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm

Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo

19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua

caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau

SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được

Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra

một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức

Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ

Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ

Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech

CHƯƠNG 11 KHAI PHAacute DỮ LIỆU

1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn

ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993

Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng

2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd

1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều

2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP

3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn

4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng

5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server

6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo

7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động

8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời

9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều

10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện

11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech

12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP

3 Xử lyacute phacircn tiacutech trực tuyến OLAP

MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave

dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu

ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave

thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu

HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave

ROLAP4 Khai phaacute dữ liệu

Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh

khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn

Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan

5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp

6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại

Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp

Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec

Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt

Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra

Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh

vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho

Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec

Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm

Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục

Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng

gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp

Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn

Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec

Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper

Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2

Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25

Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước

Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng

Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện

trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp

Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute

độ hỗ trợ ge ngưỡng minsup

độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan

Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn

Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết

Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu

MOLAP ROLAP HOLAP

Lưu trữ dữ liệu cơ sở

Khối Bảng quan hệ Bảng quan hệ

Lưu trữ thocircng tin tổng hợp

Khối Bảng quan hệ Khối

Hiệu suất thực hiện truy vấn

Nhanh nhất Chậm nhất Nhanh

Tiecircu thụ khocircng gian lưu trữ

Nhiều Thấp Trung bigravenh

Chi phiacute bảo trigrave Cao Thấp Trung bigravenh

Page 8: De cuong(1-11)

Caacute nhacircn chuyecircn ngagravenh Tự đưa ra caacutec quyết định từng ngagravey

15Năng lực của hệ HTQD

1 HHTQĐ cơ bản hỗ trợ caacutec nhagrave ra quyết định trong caacutec tigravenh huống nửa cấu truacutec vagrave phi cấu truacutec bằng caacutech kết hợp phaacuten xử của con người vagrave xử lyacute thocircng tin bằng maacutey tiacutenh Caacutec bagravei toaacuten như vậy khocircng thểkhocircng thuận tiện giải quyết được chỉ bằng caacutec cocircng cụ maacutey tiacutenh hoacutea hay caacutec phương phaacutep định lượng 2 Phugrave hợp cho caacutec cấp quản lyacute khaacutec nhau từ cao đến thấp 3 Phugrave hợp cho caacute nhacircn lẫn nhoacutem Caacutec bagravei toaacuten iacutet coacute tiacutenh cấu truacutec thường liecircn đới đến nhiều caacute nhacircn ở caacutec đơn vị chức năng hay mức tổ chức khaacutec nhau cũng như ở caacutec tổ chức khaacutec 4 Hỗ trợ cho caacutec quyết định tuần tự liecircn thuộc được đưa ra một lần vagravei lần hay lặp lại 5 Hỗ trợ cho caacutec giai đoạn của quaacute trigravenh ra quyết định tigravem hiểu thiết kế lựa chọn vagrave hiện thực 6 Phugrave hợp cho một số caacutec phong caacutech vagrave quaacute trigravenh ra quyết định 7 Coacute thể tiến hoacutea theo thời gian Người dugraveng coacute thể thecircm bỏ kết hợp thay đổi caacutec phần tử cơ bản của hệ thống 8 Dễ dugraveng vagrave thacircn thiện với người dugraveng 9 Nhằm vagraveo nacircng cao tiacutenh hiệu dụng của quyết định (chiacutenh xaacutec thời gian tiacutenh chất lượng) thay vigrave lagrave tiacutenh hiệu quả (giaacute phiacute của việc ra quyết định) 10 Người ra quyết định kiểm soaacutet toagraven bộ caacutec bước của quaacute trigravenh ra quyết định HHTQĐ chỉ trợ giuacutep khocircng thay thế người ra quyết định 11 Người dugraveng cuối cugraveng coacute thể tự kiến tạo vagrave sửa đổi caacutec hệ thống nhỏ vagrave đơn giản 12 Thường dugraveng mocirc higravenh để phacircn tiacutech caacutec tigravenh huống ra quyết định 13 Cung ứng caacutec truy đạt dữ liệu từ nhiều nguồn dạng thức vagrave kiểu khaacutec nhau 14 Coacute thể dugraveng như một cocircng cụ độc lập hay kết hợp với caacutec HHTQĐứng dụng khaacutec dugraveng đơn lẻ hay trecircn một mạng lưới maacutey tiacutenh (intranet extranet) bất kỳ với cocircng nghệ WEB

16Văn hoacutea tổ chứcVăn hoacutea của tổ chức lagrave tập hợp của rất nhiều thứ (lograveng tin biểu tượng đặc trưng regraven luyện) được phaacutet triển qua thời gian dagravei

Noacute gacircy ra ảnh hưởng mạnh mẽ cograven hơn cả những hoạt động của tổ chức đoacute 10 đặc điểm văn hoacutea của tổ chức

Điều khiển Hệ thống khen thưởng Sự đồng nhất Chịu đựng xung đột Mocirc higravenh giao tiếp Hỗ trợ quản lyacute Sự hogravea nhập Định hướng Chịu đựng rủi ro Caacute nhacircn khởi xướng

Mối quan hệ của văn hoacutea với hiệu năng lagravem việc1 tổ chức thagravenh cocircng phải coacute xu hướng hogravea hợp giữa văn hoacutea với mocirci trường trong vagrave ngoagravei tổ chức

Phugrave hợp trong nội bộ cho thấy một sự kết hợp giữa văn hoacutea của tổ chức với những cocircng nghệ của chiacutenh noacute

Phugrave hợp với becircn ngoagravei cho thấy một nền văn hoacutea phugrave hợp với chiến lược thị trường

Văn hoacutea vagrave sự thay đổi 1 tổ chức magrave khocircng biết thay đổi văn hoacutea sẽ khocircng thể giữ được vị triacute của migravenh trecircn thị trường Caacutec cocircng ty xuất sắc luocircn biết caacutech tiacutech cực tiếp cận khaacutech hagraveng động viecircn đầu tư

17Quyền lực vagrave chiacutenh trịQuyền lực vagrave chiacutenh trị luocircn đi liền với nhau

aQuyền lựclagrave khả năng ảnh hưởng đến việc phacircn phối caacutec nguồn lực trong tổ chứcGồm 5 yếu tố cơ bản

Phacircn quyền Uy quyền Quyền lực caacute nhacircn Sức ảnh hưởng Chiacutenh trị

Một vagravei thagravenh phần của quyền lực ra quyết định Quyết định việc nagraveo coacute sẵn

Quyết định sản phẩm nagraveo được sản xuất Quyết định đầu tư vagraveo đacircu Quyền đặt vagrave quản lyacute quản lyacute giaacute Thanh toaacuten vagrave khấu trừ tiền latildei

bChiacutenh trị Yếu tố cốt lotildei trong quaacute trigravenh higravenh thagravenh chiến lược ra quyết định Chiacutenh trị liecircn quan tới việc ra quyết định thocircng qua đagravem phaacutenảnh hưởngvagrave higravenh

thagravenh sự nhất triacute Trong nhiều trường hợp noacute coacute thể cho ta sự linh hoạt hơn

18Hệ trợ giuacutep quyết định trong tổ chức DSS của 1 tổ chức hỗ trợ cocircng nghệ tập trung vagraveo caacutec quyết định ảnh hưởng tới

rất nhiều người 1 hệ thống DSS hiện đại coacute thể chấp nhận nhiều quyết định vượt qua những giới

hạn phacircn cấp truyền thống aCaacutec hoạt động gần DSS

Giải quyết caacutec nhiệm vụ đặc biệt Thu thập thocircng tin Liecircn lạc qua caacutec chi nhaacutenh Động thaacutei chiacutenh trị

Phacircn loại tư duy chiến lược cho DSS Sắp xếp quyết địnhXếp hạng quyết định sao cho thứ tự đứng trước thigrave được

ưu tiecircn trước Chia sẻ thocircng tinCaacutec quyecirct định coacute thể độc lập nhưng người ra quyết định

phải chia sẻ caacutec thocircng tin liecircn quan Lựa chọn đagravem phaacutenVagravei quyết định coacute thể xaacutec lập thocircng qua đagravem phaacuten vagrave kết

quả được lagravem đồng thờiKhocircng phải cocircng nghệ tự noacute coacute thể đưa ra quyết định magrave noacute nằm ở trigravenh độ cocircng nghệ hỗ trợ caacutec chiến lược quyết định quyền lực vagrave chiacutenh trị cugraveng phối hợp với nhau

Chương 4Mocirc higravenh hoacutea quaacute trigravenh ra quyết định

(Cấu truacutec của hệ HTQD)19Vấn đề Mocirc higravenh

bull Lagrave phần tử chủ chốt trong hầu hết hệ hỗ trợ quyết định vagrave lagrave điều kiện cần trong hệ hỗ trợ quyết định dựa vagraveo mocirc higravenh (model-based DSS)

bull Coacute nhiều lớp mocirc higravenh kegravem theo lagrave caacutec kỹ thuật xử lyacute thao taacutec mocirc higravenh đặc thugrave tương ứng

bull Caacutec vấn đề chiacutenh nhận diện bagravei toaacuten vagrave phacircn tiacutech mocirci trường nhận diện biến số dự baacuteo đa mocirc higravenh caacutec phạm trugrave mocirc higravenh quản lyacute mocirc higravenh vagrave mocirc higravenh hoacutea dựa vagraveo kiến thức

bull Mocirc higravenh hoacutea lagrave taacutec vụ khocircng đơn giản Người xacircy dựng mocirc higravenh phải cacircn bằng giữa tiacutenh đơn giản của mocirc higravenh với caacutec yecircu cầu biểu diễn để mocirc higravenh coacute thể nắm bắt đủ thực tại cần thiết cho người ra quyết định

bull Mocirc phỏng lagrave kỹ thuật mocirc higravenh hoacutea thocircng dụng dugraveng để tigravem hiểu vấn đề tuy khocircng nhất thiết phải tigravem ra được caacutec giải phaacutep biến thể mở rộng quaacute trigravenh ra quyết định của tổ chức vagrave cho pheacutep tổ chức xem xeacutet taacutec độngảnh hưởng của caacutec chọn lựa tương lai

bull Mocirc phỏng tiết kiệm rất nhiều chi phiacute vagrave thời gian ndash rất dễ thay đổi mocirc higravenh hoạt động của một hệ thống vật lyacute bằng mocirc higravenh hoacutea maacutey tiacutenh

bull Mocirc higravenh coacute thể được phaacutet triển vagrave cagravei đặt bằng một số caacutec ngocircn ngữ lập trinh (thế hệ 3 4 ) vagrave hệ thống phần mềm khaacutec nhau

Mocirc higravenh tĩnh vagrave động

bull Mocirc higravenh tĩnh thể hiện bức tranh tại thời điểm của tigravenh huống Caacutec khiacutea cạnh của bagravei toaacuten được xeacutet một thời kỳ nhất định trong một khung thời gian nhất định (coacute thể ldquocuốnrdquo về tương lai) Caacutec tigravenh huống được giả sử lagrave sẽ lập lại với tập caacutec điều kiện đồng nhất

1048713 Giả định coacute được tiacutenh ổn định của dữ liệu 1048713 Mocirc phỏng quaacute trigravenh dạng tĩnh - lagravem việc trecircn caacutec trạng thaacutei ổn định để tigravem ra caacutec

thocircng số tối ưu ndash thường được dugraveng như cocircng cụ chủ yếu để thiết kế quaacute trigravenh 1048713 vd quyết định sản xuấtmua 1 sản phẩm baacuteo caacuteo thu nhập hagraveng quyacutenăm bull Mocirc higravenh động biểu diễn caacutec kịch bản thay đổi theo thời gian 1048713 Phụ thuộc thời gian caacutec trạng thaacutei thay đổi theo thời gian 1048713 Thường dugraveng để tạo sinh vagrave biểu diễn caacutec xu hướng vagrave khuocircn mẫu theo thời gian 1048713 Mocirc phỏng động thể hiện caacutec diễn tiến khi caacutec điều kiện theo thời gian khaacutec với caacutec

trạng thaacutei ổn định ndash thường được dugraveng để thiết kế việc kiểm soaacutet caacutec hệ thống 1048713 VD dự baacuteo lời-lỗ trong 5 năm với caacutec nhập lượng như giaacute phiacute số lượng thay đổi

theo từng năm

Mocirc higravenh chắc chắn tương đối dễ phaacutet triển giải quyết vagrave coacute thể sinh ra caacutec giải phaacutep tối ưu 1048713 Caacutec bagravei toaacuten coacute một số lớnvocirc hạn caacutec giải phaacutep khả thi đặc biệt quan trọng 1048713 Caacutec mocirc higravenh tagravei chaacutenh được xacircy dựng trong điều kiện chắc chắn

Mocirc higravenh bất địnhbằng caacutech thu thập thecircm thocircng tin cố gắng đưa bagravei toaacuten trở về dạng chắc chắn hay dạng

rủi ro Mocirc higravenh rủi ro caacutec quyết định kinh doanh được đưa ra dưới caacutec rủi ro giả định

1048713 Đocirci khi biết được xaacutec suất của caacutec sự kiện xảy ra trong tương lai 1048713 Caacutec trường hợp khaacutec (bất định) ước lượng caacutec rủi ro vagrave giả sử caacutec tigravenh huống rủi ro

xảy ra 20Mocirc higravenh hoacutea

MOcirc HIgraveNH HOacuteA BẰNG BẢNG TIacuteNH bull Bảng tiacutenh phần mềm mạnh linh hoạt vagrave dễ dugraveng cho pheacutep tạo sinh caacutec ứng dụng trong kinh doanh kỹ thuật toaacuten vagrave khoa học với tập caacutec hagravem mạnh về tagravei chaacutenh thống kecirc toaacuten bull Kegravem theo lagrave caacutec thagravenh phần cộng thecircm (add-ins) giuacutep xacircy dựng vagrave giải caacutec lớp mocirc higravenh đặc thugrave bull Lagrave cocircng cụ mocirc higravenh hoacutea thocircng dụng nhất của người dugraveng cuối cugraveng bull Coacute caacutec chức năng về phacircn tiacutech ldquowhat-ifrdquo dograve tigravem mục tiecircu quản lyacute dữ liệu vagrave lập trigravenh (dạng macro) bull Coacute khả năng đọc ghi caacutec cấu truacutec tập tin thocircng dụng để giao tiếp được với caacutec CSDL vagrave cocircng cụ khaacutec bull Coacute thể xacircy dựng mocirc higravenh tĩnh vagrave động bull Dugraveng trecircn maacutey tiacutenh caacute nhacircn vagrave maacutey tiacutenh lớn

bull Cơ sở để xacircy dựng caacutec bảng tiacutenh đa chiều vagrave caacutec cocircng cụ xử lyacute phacircn tiacutech trực tuyến (OLAP) MOcirc HIgraveNH HOacuteA BẰNG PHAcircN TIacuteCH QUYẾT ĐỊNH bull Tiếp cận mocirc higravenh hoacutea caacutec tigravenh huống quyết định coacute một số hữu hạnkhocircng quaacute nhiều caacutec phương aacuten ndash mỗi phương aacuten được trigravenh ra dưới dạng bảng hay đồ thị - caacutec kết quả tương ứng (dự baacuteo được kegravem xaacutec suất) theo mục tiecircu bagravei toaacuten ndash từ đoacute chọn phương aacuten tốt nhất bull Đơn mục tiecircu bảng quyết định hay cacircy quyết định bull Đa mục tiecircu AHP (analytic hierarchy process) khaacutec

MOcirc HIgraveNH HOacuteA BẰNG QUY HOẠCH TOAacuteN

bull Quy hoạch toaacuten học (mathematical programming) lagrave họ caacutec cocircng cụ giải quyết caacutec bagravei toaacuten quản lyacute theo đoacute người ra quyết định phải cấp phaacutet caacutec tagravei nguyecircn khan hiếm cho caacutec hoạt động cạnh tranh nhau (caacutec phương aacuten) nhằm tối ưu hoacutea mục tiecircu coacute khả năng đo lường được bull Caacutec mocirc higravenh quy hoạch tuyến tiacutenh (linear programming) thocircng dụng nhất trong quy hoạch toaacuten coacute nhiều ứng dụng trong thực tế được dugraveng nhiều trong caacutec hệ hỗ trợ quyết định bull Bagravei toaacuten quy hoạch tuyến tiacutenh 1048713 Caacutec biến quyết định (cần tigravem giaacute trị) 1048713 Hagravem mục tiecircu (hagravem toaacuten học dạng tuyến tiacutenh xaacutec định quan hệ giữa biến quyết định vagrave mục tiecircu đo lường mức độ đạt đạt mục tiecircu vagrave cần được tối ưu hoacutea) 1048713 Caacutec hệ số của hagravem mục tiecircu (cho biết mức đoacuteng goacutep vagraveo mục tiecircu của 1 đơn vị biến quyết định) 1048713 Ragraveng buộc (biểu thức tuyến tiacutenh cho biết giới hạn tagravei nguyecircn vagravehay caacutec quan hệ giữa caacutec biến số) 1048713 Dung lượng (mocirc tả cận trecircn vagrave dưới của caacutec biến vagrave ragraveng buộc) 1048713 Hệ số (cocircng nghệ) vagraveo-ra (cho biết mức độ sử dụng tagravei nguyecircn của biến quyết định) bull Đặc điểm của bagravei toaacuten quy hoạch tuyến tiacutenh 1048713 Tagravei nguyecircn kinh tế của bagravei toaacuten lagrave coacute hạn vagrave sẵn sagraveng 1048713 Coacute nhiều caacutech (gt2 caacutech) sử dụng tagravei nguyecircn được gọi lagrave giải phaacutep hay chương trigravenh 1048713 Mỗi hoạt động dugraveng tagravei nguyecircn đều sinh ra kết quả dưới dạng mục tiecircu đatilde phaacutet biểu trước 1048713 Việc cấp phaacutet nằm trong caacutec ragraveng buộc cho trước bull Giả định của bagravei toaacuten quy hoạch tuyến tiacutenh 1048713 Caacutec kết quả của caacutec cấp phaacutet coacute thể đem so saacutenh với nhau coacute thể đo lường bằng một đơn vị chung

1048713 Caacutec cấp phaacutet độc lập với nhau về mặt kết quả 1048713 Kết quả cuối cugraveng lagrave tổng của caacutec kết quả từ caacutec hoạt động riecircng rẽ khaacutec nhau 1048713 Dữ liệu coacute tiacutenh chắc chắn 1048713 Tagravei nguyecircn được dugraveng một caacutech kinh tế nhất 1048713 Thường coacute một số lớn caacutec giải phaacutep với kết quả khaacutec nhau 1048713 Trong số caacutec giải phaacutep coacute thể coacute 1 giải phaacutep tốt nhất ndash mức độ đạt được mục tiecircu cao nhất ndash gọi lagrave giải phaacutep tối ưu được tigravem ra bằng một giải thuật đặc biệt MOcirc HIgraveNH HOacuteA BẰNG HEURISTIC bull Việc tigravem giải phaacutep tối ưu của một số bagravei toaacuten quyết định phức tạp coacute thể tốn nhiều thời gian chi phiacute hay khocircng thể tigravem ra được Cograven nếu dugraveng tiếp cận mocirc phỏng cũng coacute thể keacuteo dagravei phức tạp khocircng thiacutech hợp hay thậm chiacute khocircng chiacutenh xaacutec

bull Lagrave một tiếp cận giuacutep tigravem ra caacutec giải phaacutep khả thithỏa matildenđủ tốt cho caacutec bagravei toaacuten phức tạp Coacute thể coacute giải phaacutep đủ tốt (90-999 giaacute trị của lời giải tối ưu) nhanh choacuteng vagrave đỡ tốn keacutem hơn bằng caacutech dugraveng heuristics bull Quaacute trigravenh heuristic lagrave datildey caacutec bước xacircy dựng caacutec quy luật giải quyết vấn đề thocircng qua việc tigravem kiếm caacutec con đường hứa hẹn nhất dẫn đến lời giải tigravem kiếm caacutech thức thu thập vagrave phacircn giải thocircng tin theo quaacute trigravenh giải vagrave phaacutet triền caacutec phương phaacutep dẫn đến một giải thuật tiacutenh toaacuten hay một lời giải tổng quaacutet đatilde coacute bull Aacutep dụng chủ yếu cho bagravei toaacuten cấu truacutec yếu cũng dugraveng để tigravem ra giải phaacutep chấp nhận được cho bagravei toaacuten cấu truacutec chặt bull Khocircng đủ tổng quaacutet như caacutec giải thuật thường chỉ dugraveng cho tigravenh huống đặc thugrave đang xeacutet bull Coacute thể dẫn đến một giải phaacutep dở - caacutec thủ tục từng bước giải quyết vấn đề khocircng đảm bảo tigravem ra giải phaacutep tối ưu bull Heuristic coacute thể lagrave định lượng vigrave vậy coacute thể đoacuteng vai trograve quan trọng trong cơ sở mocirc higravenh của hệ hỗ trợ quyết định bull Heuristic coacute thể lagrave định tiacutenh vigrave vậy coacute thể đoacuteng vai trograve quan trọng trong cung ứng kiến thức cho hệ chuyecircn gia bull Quaacute trigravenh heuristic liecircn quan đến tigravem kiếm học tập ước lượng phacircn xử vagrave lặp lại caacutec hoạt động nagravey dọc theo tiến trigravenh bull Kiến thức thu được dugrave thagravenh cocircng hay thất bại trong quaacute trigravenh đều được phản hồi vagrave sửa đổi chiacutenh quaacute trigravenh nhờ đoacute coacute thể định nghĩa lại mục tiecircu hay bagravei toaacuten 1048713 Giải thuật di truyền bắt đầu bằng tập caacutec giải phaacutep được sinh ngẫu nhiecircn taacutei kết hợp caacutec cặp giải phaacutep một caacutech ngẫu nhiecircn bull Tigravenh huống necircn dugraveng heuristics 1048713 Dữ liệu đầu vagraveo khocircng chiacutenh xaacutec hay coacute giới hạn 1048713 Thực tế quaacute phức tạp đến nỗi khocircng dugraveng được caacutec mocirc higravenh tối ưu 1048713 Chưa coacute được giải thuật chiacutenh xaacutec vagrave đủ tin cậy 1048713 Bagravei toaacuten phức tạp necircn sẽ khocircng kinh tế nếu dugraveng tối ưu hay mocirc phỏng hoặc tốn quaacute nhiều thời gian tiacutenh toaacuten 1048713 Coacute thể cải thiện tiacutenh hiệu quả của quaacute trigravenh tối ưu (tức coacute thể sinh ra caacutec giải phaacutep ban đầu tương đối tốt) 1048713 Liecircn quan đến xử lyacute kyacute hiệu chứ khocircng phải xử lyacute kyacute số (như hệ chuyecircn gia) 1048713 Cần coacute quyết định nhanh vagrave caacutec xử lyacute dựa vagraveo maacutey tiacutenh đều khocircng khả thi (một số heuristic khocircng cần đến maacutey tiacutenh) bull Thuận lợi 1048713 Dễ hiểu dễ giải thiacutech vagrave dễ cagravei đặt 1048713 Nacircng cao tiacutenh saacuteng tạo vagrave năng lực heuristic cho caacutec vấn đề khaacutec 1048713 Tiết kiệm thời gian xaacutec lập vấn đề 1048713 Tiết kiệm yecircu cầu về bộ chứa vagrave xử lyacute maacutey tiacutenh

1048713 Tiết kiệm thời gian tiacutenh toaacuten vagrave do vậy tiết kiệm thời gian thực trong ra quyết định Một số vấn đề phức tạp đến nỗi chỉ coacute thể giải được bằng heuristics 1048713 Thường sinh ra nhiều giải phaacutep chấp nhận được 1048713 Thường coacute thể phaacutet biểu lyacute thuyết hay đo lường thực nghiệm về chất lượng của giải phaacutep (tức giaacute trị mục tiecircu của giải phaacutep gần với giaacute trị tồi ưu đến mức nagraveo dugrave giaacute trị tối ưu chưa biết được) 1048713 Coacute thể kết hợp tiacutenh thocircng minh vagraveo để hướng dẫn pheacutep tigravem kiếm (tigravem kiếm tabu) Năng lực thocircng minh đoacute coacute thể lagrave đặc thugrave theo bagravei toaacuten hoặc dựa trecircn yacute kiến chuyecircn gia được cấy trong hệ chuyecircn gia hoặc cơ chế tigravem kiếm 1048713 Coacute thể dugraveng heuristic hiệu quả vagraveo caacutec mocirc higravenh coacute thể giải bằng quy hoạch toaacuten học Đocirci khi heuristic lagrave phương phaacutep được ưa thiacutech hơn khi khaacutec giải phaacutep heuristics được dugraveng như giải phaacutep ban đầu cho caacutec phương phaacutep quy hoạch toaacuten học bull Hạn chế 1048713 Khocircng đảm bảo coacute được giải phaacutep tối ưu 1048713 Caacutec quy luật coacute rất nhiều ngoại lệ 1048713 Caacutec lựa chọn quyết định tuần tự coacute thể khocircng tiecircn đoaacuten được caacutec kết cục tương lai của mỗi chọn lựa 1048713 Sự liecircn thuộc giữa caacutec phần trong hệ thống đocirci khi coacute thể gacircy ra caacutec ảnh hưởng lớn lao lecircn toagraven hệ thống bull Phacircn loại caacutec giải thuật heuristic 1048713 Heuristic xacircy dựng xacircy dựng giải phaacutep khả thi bằng caacutech cộng thecircm từng thagravenh phần một VD bagravei toaacuten người baacuten hagraveng ndash luocircn gheacute thagravenh phố chưa viếng thăm kế tiếp gần nhất

1048713 Heuristic cải tiến bắt đầu bằng một giải phaacutep khả thi vagrave cố gắng cải tiến liecircn tục trecircn đoacute VD trecircn thử hoaacuten đổi 2 thagravenh phố 1048713 Quy hoạch toaacuten aacutep dụng vagraveo caacutec mocirc higravenh chứa iacutet ragraveng buộc nhằm coacute được thocircng tin về thỏa hiệp tốt nhất với mocirc higravenh nguyecircn gốc Thường được dugraveng trong tối ưu hoacutea nguyecircn (integer optimization) 1048713 Chia giai đoạn giải quyết một vấn đề theo từng giai đoạn VD ở PampG trecircn đacircy bagravei toaacuten phacircn phối được giải quyết trước sau đoacute dugraveng giải quyết bagravei toaacuten chiến lược sản phẩm 1048713 Phacircn ratilde chia bagravei toaacuten thagravenh caacutec phần nhỏ hơn coacute thể giải quyết được sau đoacute kết hợp caacutec giải phaacutep đoacute lại VD chia latildenh thổ baacuten hagraveng thagravenh 4 vugraveng khaacutec nhau giải quyết cho từng vugraveng sau đoacute kết nối caacutec giải phaacutep

21Mocirc phỏngbull Giả định caacutec đặc điểm của thực tạibull Lagrave kỹ thuật tiến triển caacutec thực nghiệm (như phacircn tiacutech ldquowhat-ifrdquo) - bằng maacutey tiacutenh -trecircn một mocirc higravenh của hệ thocircng tin quản lyacute

bull Khocircng thực sự lagrave một mocirc higravenh vigrave khocircng biểu diễn thực tại magrave lagrave cố gắng bắtchước thực tạibull Một trong những phương phaacutep thocircng dụng nhất trong HHTQĐbull HHTQĐ lagravem việc với caacutec bagravei toaacuten phi cấu truacutec vagrave cấu truacutec yếu tigravenh huống thực tếphức tạp ndash khocircng dễ biểu diễn bằng mocirc higravenh tối ưu hay caacutec dạng mocirc higravenh khaacutecnhưng lại thường coacute thể xử lyacute được bằng mocirc phỏngbull Đặc điểm1048713 Iacutet đưa ra caacutec đơn giản hoacutea về thực tại hơn caacutec mocirc higravenh khaacutec1048713 Do triển khai caacutec thực nghiệm necircn noacute coacute thể kiểm thử caacutec giaacute trị cụ thể của caacutecbiến quyết địnhbiến khocircng kiểm soaacutet được của mocirc higravenh vagrave xem xeacutet ảnh hưởnglecircn caacutec biến kết quả1048713 Phương phaacutep coacute tiacutenh mocirc tả (như vậy khaacutec với phương phaacutep danh định)1048713 Khocircng tự động tigravem kiếm giải phaacutep tối ưu ndash noacute mocirc tảtiecircn đoaacuten caacutec đặc tiacutenh của hệthống đatilde cho dưới caacutec điều kiện khaacutec nhau từ đoacute coacute thể chọn ra phương aacuten tốtnhất1048713 Quaacute trigravenh mocirc phỏng thường lặp lại một thực nghiệm nhiều lần để coacute được ướclượng về hiệu ứng tổng quaacutet của một số hagravenh động nhất định1048713 Mocirc phỏng maacutey tiacutenh thiacutech hợp cho hầu hết caacutec tigravenh huống mặc dugrave cũng coacute một sốmocirc phỏng thủ cocircng thagravenh cocircng1048713 Thường chỉ được dugraveng khi bagravei toaacuten quaacute phức tạp khocircng thể xem xeacutet bằng caacutec kỹthuật tối ưu dạng số Tiacutenh phức tạp theo nghĩa bagravei toaacuten khocircng thể cocircng thức hoacuteacho tối ưu (do khocircng thotildea caacutec giả định) hoặc cocircng thức quaacute lớn quaacute nhiều tươngtaacutec giữa caacutec biến hoặc về bản chất bagravei toaacuten lagrave bất định hay rủi roPhương phaacutep mocirc phỏng thiết lập mocirc higravenh của hệ thống thực vagrave tiến hagravenh caacutec thựcnghiệm lặp lại trecircn mocirc higravenh

bull Thuận lợi1048713 Lyacute thuyết tương đối trực tiếp hiệu ứng dagravei hạn của nhiều chiacutenh saacutech -gt neacuten thờigian lớn1048713 Do tiacutenh chất mocirc tả (khaacutec với danh định)1048713 Coacute thể thấy được nhanh choacuteng coacute thể đặt ra caacutec cacircu hỏi ldquowhat-ifrdquo coacute thể dugravengtiếp cận thử-vagrave-sai vagraveo giải quyết vấn đề một caacutech nhanh choacuteng rẻ chiacutenh xaacutec iacutetrủi ro hơn1048713 Thử nghiệm được biến quyết định phần nagraveo của mocirci trường thực sự quan trọngvới caacutec phương aacuten khaacutec nhau1048713 Yecircu cầu kiến thức riecircng biệt về bagravei toaacuten vigrave thế buộc người xacircy dựng mocirc higravenh phảilagravem việc thường xuyecircn với nhagrave quản lyacute ndash đối tượng mong muốn của HHTQĐ để

từ đoacute bản chất bagravei toaacuten vagrave caacutec quyết định được hiểu tốt hơn1048713 Mocirc higravenh được xacircy dựng từ viễn cảnhcaacutech nhigraven của nhagrave quản lyacute1048713 Mocirc higravenh chỉ cho một bagravei toaacuten riecircng biệt thường khocircng thể dugraveng giải caacutec bagravei toaacutenkhaacutec Như vậy mỗi thagravenh phần của mocirc higravenh ứng với một phần của hệ thống thựcdo đoacute sẽ khocircng yecircu cầu nhagrave quản lyacute phải tổng quaacutet hoacutea caacutec hiểu biết của migravenh1048713 Phổ bagravei toaacuten giải được rất rộng tồn kho nhacircn sự hoạch định chiến lược 1048713 Coacute thể chứa caacutec phức tạp thực sự của bagravei toaacuten khocircng cần caacutec đơn giản hoacutea (TDdugraveng caacutec phacircn phối xaacutec suất thực thay vigrave phacircn phối lyacute thuyết xấp xỉ)1048713 Coacute thể tự động sinh ra nhiều đo lường hiệu năng quan trọng1048713 Thường lagrave phương phaacutep duy nhất của HHTQĐ coacute thể xử lyacute caacutec bagravei toaacuten tương đốiphi cấu truacutec1048713 Coacute một số caacutec goacutei phần mềm mocirc phỏng (Monte Carlo) tương đối dễ dugravengbull Điểm yếu1048713 Tuy thường tigravem được caacutec phương aacuten đủ tốt nhưng khocircng đảm bảo lời giải tối ưu1048713 Quaacute trigravenh xacircy dựng mocirc higravenh thường dagravei vagrave tốn keacutem1048713 Giải phaacutep vagrave suy diễn từ nghiecircn cứu mocirc phỏng thường khocircng thể chuyển sang bagraveitoaacuten khaacutec vigrave mocirc higravenh kết hợp caacutec yếu tố đặc thugrave1048713 Đocirci khi do mocirc higravenh quaacute dễ giải thiacutech cho nhagrave quản lyacute necircn caacutec phương phaacutep phacircntiacutech thường xem nhẹ1048713 Phần mềm mocirc phỏng đocirci khi yecircu cầu caacutec kỹ năng đặc biệt do độ phức tạp củaphương phaacutep giải higravenh thứcbull Caacutec loại mocirc phỏng1048713 Mocirc phỏng xaacutec suất một hay nhiều biến độc lập mang tiacutenh xaacutec suất với 2 loạiphacircn phối ndash thường dugraveng kỹ thuật Monte Carlo1048713 Phacircn phối rời rạc tigravenh huống coacute một số giới hạn caacutec biến cố (biến) với hữu hạncaacutec giaacute trị cho mỗi biến cố (biến)1048713 Phacircn phối liecircn tục tigravenh huống coacute số lượng khocircng giới hạn caacutec biến cố tuacircn theocaacutec hagravem mật độ xaacutec suất như phacircn phối chuẩn1048713 Mocirc phỏng độc lậpphụ thuộc theo thời gian1048713 Độc lập khocircng cần thiết phải biết chiacutenh xaacutec thời điểm xảy ra biến cố (nhu cầutiecircu thụ lượng sản phẩm trong ngagravey khocircng biết chiacutenh xaacutec thời điểm tiecircu thụ)1048713 Phụ thuộc cần biết chiacutenh xaacutec thời điểm xảy ra sự kiện (bagravei toaacuten hagraveng đợi)1048713 Mocirc phỏng tương taacutec trực quan1048713 Mocirc phỏng hướng đối tượng dugraveng tiếp cận hướng đối tượng để xacircy dựng mocirc higravenhmocirc phỏng Chuacute yacute ngocircn ngữ mocirc higravenh hoacutea nhất thể UML (unified modelinglanguage) kể cả khi mocirc phỏng caacutec hệ thời gian thựcMOcirc HIgraveNH HOacuteA ĐA CHIỀU ndash XỬ LYacute PHAcircN TIacuteCH TRỰC TUYẾNbull Người ra quyết định thường phải xem xeacutet nhiều chiều của dữ liệu (TD caacutec chiềucủa dữ liệu baacuten hagraveng lagrave sản phẩm vugraveng thời gian người baacuten ) dữ liệu cần đượcphacircn tiacutech trực tiếp bằng caacutec cocircng cụ chuẩn hay phacircn tiacutech tự động bằng caacutec

phương phaacutep khai mỏ dữ liệu (data mining)bull Hầu hết caacutec hệ thống phacircn tiacutech đa chiều được nhuacuteng trong caacutec hệ xử lyacute phacircn tiacutechtrực tuyến (HXLPTTT ndash online analytic processing - OLAP)bull Mục tiecircu của XLPTTT nắm bắt cấu truacutec của dữ liệu thực để hỗ trợ ra quyết địnhbull Trong HHTQĐ coacute sự gắn nối tự nhiecircn giữa mocirc higravenh hoacutea dữ liệu mocirc higravenh hoacutea kyacutehiệu vagrave caacutec khiacutea cạnh của phacircn tiacutech ldquowhat-ifrdquobull Caacutec baacuteo caacuteo của HXLPTTT đều coacute tiacutenh tương taacutec dễ khai thaacutec sử dụng đặc biệtphugrave hợp cho caacutec baacuteo caacuteo về chỉ số hiệu năng chủ yếu (key performance indicators- KPI) baacuteo caacuteo về đo lường hiệu năng kinh doanh bull Thế hệ hiện tại của HXLPTTT vagrave hệ khai mỏ dữ liệu (data mining) tiacutech hợp caacutecđặc tiacutenh của hệ thocircng tin latildenh đạo (executive information system ndashEIS- nhiềucaacutech nhigraven dữ liệu chi tiết hoacutea theo nhu cầu) vagrave caacutec hệ đồ họa khaacutec ndash thường coacutegiao diện người dugraveng dạng kiểu WEBbull Caacutec hệ thống như trecircn cograven được gọi lagrave caacutec cocircng cụ triacute tuệ kinh doanh (businessintelligence - BI) vigrave coacute caacutec đặc trưng về mocirc higravenh hoacutea vagrave tối ưu hoacutea nhưng lạitrong suốt đối với ngươigrave dugravengbull Hiện caacutec cocircng cụ được đưa ra bởi caacutec nhagrave cung cấp về CSDL về hoạch định tagraveinguyecircn tổ chức (ERP) về nhagrave kho dữ liệu (data warehouse) về HXLPTTT MOcirc HIgraveNH HOacuteA VAgrave MOcirc PHỎNG TƯƠNG TAacuteC TRỰC QUANbull Iacutech lợi Người ra quyết định tham gia vagraveo quaacute trigravenh phaacutet triển mocirc higravenh vagrave thựcnghiệm mocirc phỏng vigrave vậy sẽ tin tưởng khi sử dụng mocirc higravenhbull Mocirc higravenh hoacutea tương taacutec trực quan (visual interactive modeling - VIM) dugraveng caacutecbiểu diễn đồ họa maacutey tiacutenh để trigravenh bagravey caacutec ảnh hưởng của caacutec quyết định quản lyacutekhaacutec nhau ở một thời điểm (tĩnh) hay tiến triển theo thời gian (động với kỹ thuậthoạt higravenh)bull Mocirc phỏng tương taacutec trực quan (visual interactive simulation - VIS) cho pheacutepngười dugraveng theo dotildei tiến trigravenh xacircy dựng vagrave sử dụng khai thaacutec mocirc higravenh mocirc phỏngdưới dạng hoạt higravenhbull Mocirc higravenh hoacutea tương taacutec trực quan coacute thể kết hợp với tiếp cận triacute tuệ nhacircn tạo đểđưa ra caacutec khả năng mới thay đổi từ xacircy dựng hệ thống dạng đồ họa đến tigravem hiểuvề động học của hệ thốngbull Cần đến caacutec hệ thống maacutey tiacutenh xử lyacute song song tốc độ cao để xacircy dựng caacutec mocircphỏng - phức tạp quy mocirc lớn dạng hoạt higravenh - mang tiacutenh khả thi ở thời gian thực

22Caacutec dạng hệ thống hỗ trợ ra quyết địnhHệ hỗ trợ quyết định nhoacutemRa quyết định nhoacutem giao tiếp vagrave cộng taacutec- Caacutec đặc điểm của cocircng việc nhoacutem+ Một nhoacutem thực hiện một nhiệm vụ thỉnh thoảng ra quyết định thỉnh thoảngkhocircng ra quyết định+ Caacutec thagravenh viecircn trong nhoacutem coacute thể ở những nơi khaacutec nhau

+ Caacutec thagravenh viecircn trong nhoacutem coacute thể lagravem việc ở những thời gian khaacutec nhau+ Caacutec thagravenh viecircn trong nhoacutem coacute thể lagravem việc cugraveng nhau hoặc ở caacutec tổ chức khaacutecnhau+ Nhoacutem coacute thể vĩnh viễn hoặc tạm thời+ Nhoacutem coacute thể ở bất kỳ mức quản lyacute nagraveo hoặc mức thời gian nagraveo+ Coacute sự điều phối (quaacute trigravenh vagrave nhiệm vụ đạt được) hoặc macircu thuẩn trongnhoacutem+ Coacute sự đạt được hoặcvagrave mất maacutet năng suất trong tổ chức+ Nhiệm vụ phải hoagraven thagravenh rất nhanh+ Khocircng thể hoặc quaacute đắt cho tất cả caacutec thagravenh viecircn trong nhoacutem cugraveng hợp ở mộtnơi+ Một số dữ liệu thocircng tin hoặc kiến thức cần thiết nằm ở nhiều nơi một sốkhaacutec ở ngoagravei tổ chức+ Chuyecircn mocircn của caacutec thagravenh viecircn khocircng coacute trong nhoacutem lagrave cần thiết- Caacutec hoạt động vagrave caacutec quaacute trigravenh miecircu tả caacutec cuộc họp+ Cuộc họp lagrave hoạt động chung liecircn quan bởi một nhoacutem người coacute địa vị bằngnhau hoặc gần bằng nhau+ Kết quả của cuộc họp phụ thuộc một phần vagraveo kiến thức yacute kiến caacutec đaacutenh giaacutecủa caacutec thagravenh viecircn+ Kết quả của cuộc họp cũng phụ thuộc vagraveo sự kết hợp của nhoacutem vagrave phụ thuộcvagraveo quaacute trigravenh ra quyết định được sử dụng bởi nhoacutem đoacute+ Giải quyết caacutec yacute kiến khaacutec nhau bởi người coacute quyền hạn hoặc thương lượnghoặc phacircn xửHỗ trợ giao tiếp- Giao tiếp lagrave thagravenh phần quan trọng cho hỗ trợ quyết định Khocircng coacute giao tiếp thigravekhocircng coacute cộng taacutec Những người ra quyết định caacute nhacircn phải giao tiếp với caacutecđồng nghiệp chuyecircn gia cơ quan chiacutenh phủ khaacutech hagraveng đối taacutec kinh doanh hellipHọ cũng cần dữ liệu vagrave thocircng tin (vagrave kiến thức) từ nhiều nơi trecircn thế giới Caacutecnhoacutem ra quyết định phải giao tiếp cộng taacutec vagrave thương lượng trong cocircng việcHầu hết caacutec tổ chức sẽ nhanh trở thagravenh khocircng coacute chức năng nếu khocircng coacute caacutec hệthống giao tiếp Thương mại điện tử coacute thể hiệu quả chỉ qua caacutec kỹ thuật giao tiếphiện đại- Caacutec kỹ thuật thocircng tin hiện đại cung cấp caacutec phương tiện hỗ trợ giao tiếp rẻnhanh coacute khả năng coacute thể tin cậy Nền tảng hỗ trợ giao tiếp lagrave caacutec hệ thống maacuteytiacutenh mạng+ Bắt đầu bằng điện baacuteo điện thoại radio vagrave ti vi+ Trong 100 năm chuacuteng ta phaacutet triển maacutey fax thư điện tử chương trigravenh chatnhoacutem tin tức hệ thống hội nghị truyền higravenh Hầu hết caacutec kỹ thuật nagravey đềuhoạt động trecircn internet+ Sự phaacutet triển giao tiếp sau cugraveng lagrave hệ thống họp điện tử caacutec dịch vụ vagrave hệ

thống hội nghị điện tử thường sử dụng internet để kết nối caacutec người ra quyếtđịnh- Caacutec thuận lợi aacutep dụng caacutec phương phaacutep giao tiếp cải tiến trong caacutec tổ chức+ Cải tiến năng suất của nhacircn viecircn+ Liecircn quan đến nhiều người ra quyết định chiacutenh+ Khocircng quan tacircm nhiều đến đường biecircn giới địa lyacute+ Tạo nền văn hoacutea hợp taacutec nhất quaacuten+ Cải tiến chất lượng cuộc sống của nhacircn viecircnHỗ trợ cộng taacutec Maacutey tiacutenh hỗ trợ cộng taacutec- Khung thời giannơi chốn+ Sự hiệu quả của kỹ thuật tiacutenh toaacuten cộng taacutec phụ thuộc vagraveo vị triacute của caacutec thagravenhviecircn trong nhoacutem vagrave phụ thuộc vagraveo thời gian chia sẽ thocircng tin gởi vagrave nhận+ Chia sự giao tiếp thagravenh bốn ocirc vagrave tổ chức bốn ocirc dọc theo 2 chiều thời gian vagravenơi chốn1048713 Thời gian Khi gởi vagrave nhận thocircng tin hầu như đồng thời giao tiếp lagrave đồngthời Viacute dụ Điện thoại ti vi vagrave caacutec cuộc họp gặp mặt nhau Giao tiếp bấtđồng bộ xảy ra khi người nhận nhận thocircng tin ở thời điểm khaacutec thời điểmgởi thocircng tin đoacute1048713 Nơi chốn Người gởi vagrave người nhận coacute thể ở cugraveng phograveng hoặc khocircng+ Bốn ocirc lagrave1048713 Cugraveng thời giancugraveng nơi chốn Caacutec thagravenh viecircn gặp mặt nhau cugraveng một luacutecgiống như phograveng quyết định hoặc gặp mặt truyền thống1048713 Cugraveng thời giankhaacutec nơi chốn Caacutec thagravenh viecircn ở caacutec nơi khaacutec nhau nhưnggiao tiếp cugraveng nhau Viacute dụ hội nghị truyền higravenh (videoconferencing)1048713 Khaacutec thời giancugraveng nơi chốn Nhiều người lagravem việc theo ca Ca nagravey để lạithocircng tin cho ca khaacutec1048713 Khaacutec thời giankhaacutec nơi chốn Caacutec thagravenh viecircn ở caacutec nơi khaacutec nhau Caacutecthagravenh viecircn nagravey gởi vagrave nhận thocircng tin ở những lần khaacutec nhau

23Thực thi hệ DSSHệ thống hỗ trợ quản lyacute (MSS) khocircng phải luacutec nagraveo cũng luocircn thagravenh cocircng Nhiều trường hợpthất bại của ES khocircng hoagraven toagraven lagrave lyacute do kỹ thuật Thực thi hệ thống lagrave một quaacute trigravenh liecircn tụcnhằm đảm bảo cho tổ chức chuẩn bị tiếp nhận một hệ thống mới vagrave đưa hệ thống vagraveo sử dụngthagravenh cocircngThực hiện cocircng nghệ hệ thống hỗ trợ quản lyacute lagrave việc phức tạp vigrave caacutec hệ thống nagravey khocircng đơnthuần lagrave hệ thống thocircng tin chỉ thu thập thao taacutec vagrave phacircn phối thocircng tin Magrave xa hơn chuacuteng

liecircn quan tới caacutec cocircng việc coacute thể lagravem thay đổi đaacuteng kể caacutech thức hoạt động của tổ chức Tuyvậy đa số caacutec yếu tố thực thi đều liecircn quan tới hệ thống thocircng tinThực thi MSS lagrave quaacute trigravenh liecircn tục diễn ra trong suốt thời gian phaacutet triển hệ thống từ đề xuấtban đầu đến nghiecircn cứu khả thi thiết kế vagrave phacircn tiacutech hệ thống lập trigravenh huấn luyện chuyểnđổi vagrave lắp đặt Caacutec chuyecircn gia hệ thống thocircng tin thường gọi thực thi lagrave giai đoạn cuối trongvograveng đời hệ thống Định nghĩa thực thi MSS phức tạp hơn vigrave bản chất lặp của sự phaacutet triểncaacutec hệ thống

THỰC THI KHOcircNG HOAgraveN CHỈNHCaacutec quyết định về tiacutenh khả thi thường coacute giả định về lợi iacutech đạt được khi kế hoạch thực thiđược thực hiện hoagraven toagraven Trong thực tế thường chỉ thực hiện 90 thậm chiacute 70 phần trăm sovới phacircn tiacutech khả thi Lyacute do lagrave sự thay đổi tại một nơi trong hệ thống coacute thể ảnh hưởng vagrave coacutethể taacutec động tiecircu cực đến chỗ khaacutec Do vậy cấp quản lyacute coacute thể bỏ những phần trong dự aacuten coacutethể gacircy ra taacutec động xấu Do đoacute dự aacuten sẽ thực hiện iacutet hơn 100 so với dự aacuten kế hoạch Caacutec lyacutedo khaacutec coacute thể lagrave do khấu trừ ngacircn saacutech hoặc vượt chi phiacuteĐAacuteNH GIAacute SỰ THAgraveNH COcircNG CỦA THỰC THI HỆ THỐNGPhải coacute caacutec chỉ số đo lường thigrave mới coacute thể đaacutenh giaacute sự thagravenh cocircng khi thực thi một hệ thốngDickson va Powers (1973) đề ra 5 tiecircu chuẩn độc lậpbull Tỷ lệ thời gian thực hiện dự aacuten với thời gian ước lượngbull Tỷ lệ chi phiacute thực tế vagrave ngacircn saacutech thực hiệnbull Thaacutei độ của cấp quản lyacute đối với hệ thốngbull Nhu cầu thocircng tin của caacutec nhagrave quản lyacute được đaacutep ứng như thế nagraveo qua hệ thốngbull Taacutec động của dự aacuten đối với những hoạt động maacutey tiacutenh trong cocircng tyCaacutec đo lường khaacutec để đaacutenh giaacute thagravenh cocircng của hệ hỗ trợ quản lyacute (MSS)bull Sự sử dụng hệ thống (dự định dugraveng hoặc thực sự dugraveng)bull Thỏa matilden của người dugravengbull Thaacutei độ taacuten thagravenhbull Mức độ hệ thống hoagraven thagravenh caacutec mục tiecircu ban đầubull Phần thưởng đối với tổ chức (giảm chi phiacute tăng doanh thuhellip)bull Tỷ số lợi iacutech chi phiacute

bull Mức độ thể chế hoacutea của MSS trong tổ chứcDo bởi tiacutenh đa dạng của DSS necircn việc đaacutenh giaacute sự thagravenh cocircng của hệ nagravey cũng khoacute khăn tuynhiecircn cũng coacute thể coacute một số yếu tố giuacutep cho DSS thagravenh cocircng như sự tham gia người dugravenghuấn luyện người dugraveng hỗ trợ quản lyacute cấp cao nguồn thocircng tin đặc điểm của những nhiệmvụ coacute liecircn quan (cấu truacutec bất định độ khoacute phụ thuộc)

Chương5Nhoacutem hỗ trợ quyết định vagrave nhoacutemcocircng nghệ phần mềm

51Nhoacutem tạo quyết định

MDM-Holsapple đatilde gợi yacute chuacuteng ta sử dụng giới hạn người tạo quyết định

Một nhoacutem lagrave kết cấu MDM nơi magrave nhiều người ra quyết định hoagraven toagraven tương taacutec

Một đội lagrave kết cấu MDM nơi caacutec thagravenh viecircn tư vấn cho người đưa ra quyết định nhưng khocircng tương taacutec

Một Ủy ban lagrave kết cấu MDM với một người tạo quyết định duy nhất vagrave sự tương taacutec giữa caacutec thagravenh viecircn

Mạng thocircng tin

Mạng lưới baacutenh xe mỗi người tham gia coacute thể giao tiếp với người đưa ra quyết định ở trung tacircm nhưng khocircng phải với người tham gia khaacutecCấu truacutec nagravey lagrave khocircng thỏa matilden tất cả những người tham gia ngoại trừ người ra quyết định

Mạng dacircy chuyền Tham gia chuyển tiếp thocircng tin chỉ để noacute luocircn liền kề nhau trong chuỗi

Thagravenh viecircn cuối cugraveng ko được đaacutep ứng

Mạng vograveng trograven Tương tự như chuỗi nhưng kết thuacutec được kết nối

Mạng kết nối hoagraven toagraven khocircng coacute hạn chế về giao tiếp vagrave tương taacutec giữa caacutec thagravenh viecircnNoacutei chungnoacute đaacutep ứng hầu hết caacutec kết nối của người tham gia nhưng truyền đạt thocircng tin mất nhiều thời gian vagrave coacute nhiều cơ hội xảy ra lỗi

Nhoacutem hagravenh vi vagrave chuẩn mực

MDMs thiết lập caacutec chỉ tiecircu hướng dẫn quaacute trigravenh ra quyết định

Một chuẩn mực quy định cụ thể những gigrave thagravenh viecircn trong nhoacutem dự kiến sẽ lagravem trong những hoagraven cảnh nhất định

Quy tắc gửi coacute thể được thocircng qua viacute dụ đaacutenh giaacute ngang hagraveng hoặc xử phạt

Lagravem thế nagraveo để đưa ra quyết định

Việc chọn lựa magrave trong đoacute việc sử dụng cấu truacutec MDM phải được dựa trecircn một số yếu tố liecircn quan với bối cảnh quyết định

Viacute dụmột cấu truacutec riecircng lẻ sẽ lagravem việc nơi magrave quyết định được cấu truacutec cao vagrave thocircng tin lagrave coacute sẵn

Một ủy ban cơ cấu sẽ lagrave sự lựa chọn khi người ra quyết định khocircng thể đưa ra quyết định một migravenh

52Caacutec vấn đề thường gặp trong nhoacutem

Kiacutech thước Noacutei chung sự nhất triacute vagrave gắn kết giữa caacutec thagravenh viecircn tỉ lệ nghịch với phạm vi nhoacutem Trong nhoacutem lớn rất dễ higravenh thagravenh caacutec nhoacutem nhỏ vagrave hoạt động rời rạc

Tư duy tập thể Trong nhoacutem lớn mọi người coacute xu hướng suy nghĩ đểđạtđược sự nhất triacute necircn khocircng phaacutet huy được sự saacuteng tạo

Caacutec vấn đề về xatilde hội

Xung đột Trong 1 nhoacutem ai cũng muốn migravenh lagrave giỏi nhất necircn dễ dẫn đến xung đột

Ẩn danh(Giấu tecircn) Đacircy lagrave phương phaacutep được sử dụng để kiểm soaacutet xung đột Cho caacutec thagravenh viecircn tham gia ẩn danh

Vấn đề giới tiacutenh Nam vagrave nữ thường coacute những thế mạnh khaacutec nhau điều nagravey coacute thể lagrave sức mạnh trong 1 thiết lập MDM

Đagravem phaacuten vagrave quyết định

Một quyết định coacute thể liecircn quan đến nhiều quan điểm khaacutec nhau vigrave thế cần phải coacute sự đagravem phaacuten

Caacutec thiết kế của cơ chế hỗ trợ cho MDM phải phugrave hợp với caacutec hoạt độngđagravemphaacuten

Những hoạt động nagravey bao gồm việc thu nhận yacute kiến của caacutec thagravenh viecircn 1 caacutech cocircng bằng

53Cocircng nghệ hỗ trợ MDM

Organizational DSSndash 1 hệ thống cung cấp caacutec quyết định hỗ trợ

Group Support Systemndash Cocircng nghệ sử dụng sự hỗ trợ của nhiều becircn tham gia

Group DSS ndash Lagrave 1 hệ thống được thiết kế đặc biệt để hỗ trợ cho MDM

DSS ndash Lagrave 1 hệ thống dưới sự kiểm soaacutet của 1 người quyết định hệ thống nagravey cung cấp 1 bộ cocircng cụ giuacutep phacircn tiacutech hoagraven cảnh đểđưa ra quyết định vagrave nacircng cao hiệu quả của quyết địnhđoacute

53Cocircng nghệ hỗ trợ MDM

Organizational DSSndash 1 hệ thống cung cấp caacutec quyết định hỗ trợ

Group Support Systemndash Cocircng nghệ sử dụng sự hỗ trợ của nhiều becircn tham gia

Group DSS ndash Lagrave 1 hệ thống được thiết kế đặc biệt để hỗ trợ cho MDM

DSS ndash Lagrave 1 hệ thống dưới sự kiểm soaacutet của 1 người quyết định hệ thống nagravey cung cấp 1 bộ cocircng cụ giuacutep phacircn tiacutech hoagraven cảnh đểđưa ra quyết định vagrave nacircng cao hiệu quả của quyết địnhđoacute

Mục tiecircu của cocircng nghệ hỗ trợ MDM

Quy trigravenh hỗ trợ tập trung vagraveo quaacute trigravenh tạo điều kiện thuận lợi cho sự tương taacutec

Cơ chế cấu truacutec quaacute trigravenh chi phối caacutec hoạt động truyền thocircng

Nhiệm vụ hỗ trợ cocircng việc coacute thể chọn lựa tổ chức hoặc lấy thocircng tin

Nhiệm vụ cấu truacutec cocircng việc cho pheacutep truy cập đến kỹ thuật lọc kết hợp phacircn tiacutech kiến thức liecircn quan đến cocircng việc

Caacutec lớp loại cocircng nghệ hỗ trợ MDM

Phacircn loại theo đặc điểm do DeSanctis vagrave Gallupe đưa ra đề xuất một chương trigravenh ba cấp dựa trecircn caacutec tiacutenh năng được cung cấp

Hệ thống cấp 1 Mục điacutech chiacutenh lagrave tạo điều kiện thocircng tin liecircn lạc giữa caacutec thagravenh viecircn

Hệ thống cấp 2 Thiết kế để giảm thiểu rủi ro

Hệ thống cấp 3 Giuacutep điều chỉnh xử lyacute quyết định

Phacircn loại theo cocircng nghệ -Kraemer vagrave King tập trung vagraveo cocircng nghệ aacutep dụng

Cocircng nghệ bảng mạch điện tử

Hội nghị trực tuyến

Mạng lưới tập đoagraven

Trung tacircm thocircng tin

Mocirci trường cộng taacutec

Phograveng quyết định

Nhoacutem phần mềm

Phần mềm được thiết kế để hỗ trợ sự hợp taacutec bao gồm việc thu huacutet vagrave lưu trữ thocircng tin

Caacutec tổ chức dẫn đầu thị trường hiện tại lagrave Lotus Notes and Domino Microsoft Exchange Novell GroupWise and Oracle Office

Caacutec cocircng cụ trong một bộ phần mềm bao gồm người quản lyacute hội nghị (Lotus Sametime) vagrave trao đổi thocircng điệp (Lotus Notes Mail)

Xếp hạng phần mềm cho nhoacutem

Ellis vv đề xuất một hệ thống xếp hạng dựa vagraveo kiểu sự hỗ trợ noacute Cung cấp

Hệ thocircng điệp

Hệ thống hội thảo truyền higravenh

Hệ thống cộng taacutec soạn thảo

Nhoacutem phacircn phối giải phaacutep phần mền

Hệ thống phối hợp

Hệ thống thocircng minh đại diện

Lực lượng điều khiển phaacutet triển phần mềm cho nhoacutem

Một số nhacircn tố chiacutenh bao gồm

Tăng năng suất

Giảm số lượng caacutec cuộc họp

Tăng cường tự động hoacutea caacutec quy trigravenh lagravem việc thường xuyecircn

Cần phối hợp toagraven cầu tốt hơn

Tiacutenh sẵn sagraveng của những mạng lan rộng

Coleman vagrave Khanna liệt kecirc 10 nhacircn tố khaacutec

54Quản lyacute hoạt động MDM (Mobile Device Management - Quản lyacute thiết bị di động)

Một số phương phaacutep phối hợp phổ biến hơnMDM lagrave

Kỹ thuật nhoacutem định danh

Kỹ thuật Delphi

Sự phacircn xử

Hệ thocircng tin dựa trecircn vấn đề

Nemawashi

Kỹ thuật nhoacutem định danh

1-Mỗi người tham gia viết ra những yacute tưởng về những gigrave necircn quyết định

2-Lần lượt mỗi người tham gia trigravenh bagravey yacute tưởng của migravenh được ghi lại trecircn bảng Khocircng thảo luận ở đacircy

3-Sau khi tất cả caacutec yacute tưởng được trigravenh bagravey caacutec đại biểu coacute thể chất vấn những người khaacutec

4-Mỗi người tham gia bỏ phiếu cho mỗi yacute tưởng

Kỹ thuật Delphi

Về cơ bản tương tự như kỹ thuật nhoacutem định danh ngoại trừ những người khocircng bao giờ tham gia cuộc họp

Một cocircng cụ khảo saacutet được sử dụng để thu thập đầu vagraveo ban đầu từ caacutec thagravenh viecircn

Một cuộc khảo saacutet thứ hai được gửi đi với một bản toacutem tắt caacutec kết quả chung

Những bước lặp lại cho đến khi đạt được một sự đồng thuận hoặc nhigraven nhận của đa số

Sự phacircn xử(Arbitration )

Thiacutech hợp nhất khi caacutec thagravenh viecircn của MDM đại diện cho caacutec yếu tố đối lập

Những người tham gia đồng yacute rằng nếu lựa chọn thay thế hai becircn thỏa thuận khocircng được tigravem thấy thigrave một trọng tagravei viecircn becircn ngoagravei sẽ tham gia

Trọng tagravei sau đoacute lựa chọn thay thế ocircng hoặc xeacutet thấy thiacutech hợp nhất

Hệ thống thocircng tin dựa trecircn vấn đề (IBIS)

Lagrave một phương phaacutep lập luận cấu truacutec

Một đại diện cho IBIS lagrave một đồ thị với caacutec nuacutet vagrave caacutec liecircn kết

IBIS bắt đầu với lựa chọn của một nuacutet vấn đề gốc sau đoacute caacutec nuacutet vị triacute khaacutec nhau được liecircn kết với nuacutet gốc

Caacutec nuacutet vị triacute nagravey sau đoacute được đaacutenh giaacute dựa trecircn những lập luận gắn liền với chuacuteng

Nemawashi (được sử dụng rộng ratildei tại Nhật Bản)

1-Một hoặc nhiều thagravenh viecircn của MDM được chỉ định lagrave điều phối viecircnCaacutec điều phối viecircn sau đoacute chọn người tham gia cograven lại

2-Điều phối viecircn xacircy dựng một tổng hợp caacutec sự lựa chọn vagrave sau đoacute caacutec chuyecircn gia đaacutenh giaacute caacutec lựa chọn

3-Điều phối viecircn lựa chọn một sự lựa chọn dựa trecircn kết quả ở trecircn(ở 2)

4-Sự thay thế được luacircn chuyển điều phối viecircn tigravem kiếm sự đồng thuận thocircng qua sự thuyết phục vagrave đagravem phaacuten

5-Nếu đạt được sự đồng thuận điều phối viecircn cho lưu thocircng một tagravei liệu magrave mỗi thagravenh viecircn MDM để lại dấu hiệu trecircn đoacute

55Nơi lagravem việc ảo

Nhiều tổ chức trecircn toagraven thế giới kinh doanh bất động sản cho cocircng nghệ hợp taacutec

Cocircng việc được trở thagravenh một điều bạn lagravem hơn lagrave một nơi bạn đi

Những thay đổi lớn nhất mang lại bởi nơi lagravem việc ảo coacute thể lagrave về văn hoaacute hay xatilde hội hơn lagrave về cocircng nghệ

Chương 6 Hệ thống thocircng tin điều hagravenh

61 Yacute nghĩa của EIS- Hệ thống thocircng tin điều hagravenh

- EIS lagrave một dạng đặc biệt của DSS được thiết kế để hỗ trợ ra quyết định ở cấp cao nhất của một tổ chức

- Lagrave một hệ thống thocircng tin hỗ trợ nhu cầu lập kế hoạch vagrave đaacutenh giaacute của caacutec nhagrave quản lyacute điều hagravenh

- EIS coacute thể giuacutep một CEO coacute được bức tranh tổng thể chiacutenh xaacutec nhất về caacutec hoạt động vagrave một bản toacutem tắt những gigrave magrave đối thủ cạnh tranh đang lagravem

- Caacutec hệ thống nagravey noacutei chung hoạt động dễ dagraveng vagrave trigravenh bagravey thocircng tin theo những caacutech dễ hiểu để việc tiếp thu được nhanh choacuteng (biểu đồ đồ thịhellip)

(Tagravei liệu thecircm EIS lagrave những loại hệ thống lagrave rất phức tạp trong tự nhiecircn Coacute thể noacutei hệ thống nagravey cũng cung cấp cho caacutec nhagrave quản lyacute với caacutec thiết bị coacute khả năng ra quyết định bằng caacutech sử dụng của noacute Hệ thống nagravey hoạt động trong điều kiện như vậy quan trọng như trong caacutec hệ thống khaacutec khocircng hỗ trợ Khả năng lưu trữ dữ liệu nặng lagravem cho noacute lyacute tưởng để được thocircng qua khocircng chỉ bởi caacutec doanh nghiệp lớn magrave cograven bởi caacutec doanh nghiệp nhỏ hơn Nhigraven chung hệ thống nagravey lagrave dagravenh cho caacutec nhacircn viecircn cấp cao hỗ trợ thagravenh thạo trong việc đưa ra caacutec quyết định quan trọng)

Caacutec phiecircn EIS tiecircu biểu- Phiecircn lagravem việc coacute thể bắt đầu với một baacuteo caacuteo về tigravenh higravenh tagravei chiacutenh vagrave kinh

doanh của một cocircng ty caacutec chỉ số hoạt động quan trọng được hiển thị rotilde ragraveng- EIS sẽ cho pheacutep caacutec giaacutem đốc điều hagravenh coacute thể đi sacircu vagraveo dữ liệu từ những con

số bất kỳ magrave noacute hỗ trợ- Việc điều hagravenh coacute thể lựa chọn một mức độ chi tiết ( VD danh số baacuten hagraveng) nếu

như cần điều tra thecircm- Lagrave một phương phaacutep tiếp cận coacute thể giuacutep việc ra quyết định tốt hơn

Những điều magrave EIS ko coacute- EIS khocircng phải lagrave sự thay thế cho caacutec hệ thống dựa trecircn caacutec maacutey tiacutenh khaacutec EIS

thực sự chỉ cung cấp dữ liệu cho caacutec hệ thống nagravey- Noacute khocircng thể biến caacutec bộ hệ điều hagravenh của maacutey tiacutenh thagravenh những ldquochuyecircn viecircn

giỏirdquo- Coacute thể được viacute một caacutech cao hơn như lagrave một trợ lyacute đaacuteng tin cậy coacute thể được gọi

đến bất khi nagraveo vagrave mỗi khi cần thiết

Tagravei liệu thecircm Sự khaacutec nhau giữa EIS vagrave DSS+ EIS thiết kế để hỗ trợ những người điều hagravenh cấp cao giuacutep họ khaacutem phaacute caacutec vấn đề vagrave caacutec cơ hội DSS hỗ trợ những nười phacircn tiacutech cố gắng trả lời cacircu hỏi caacutei gigrave coacute thể lagravem cugraveng với một cơ hội hoặc một vấn đề

Chiều EIS DSSNhững người sử dụng thocircng thường

Duyệt dữ liệu đi xuống truy xuất trạng thaacutei

Hỗ trợ phacircn tiacutech vagrave quyết định

Sự thuacutec đẩy Tiacutenh thiacutech hợp Tiacutenh hiệu quảỨng dụng Queacutet mocirci trường đaacutenh giaacute

hiệu suất nhận dạng caacutec vấn đề vagrave caacutec cơ hội

Caacutec quyết định quản lyacute trecircn caacutec lĩnh vực đa dạng

Hỗ trợ quyết định Caacutec chiacutenh saacutech caacutec quyết định khocircng coacute cấu truacutec ở mức cao vagrave hỗ trợ giaacuten tiếp

Hỗ trợ caacutec quyết định lặp lại caacutec quyết định khocircng thể đoaacuten trước ra quyết định khocircng coacute cấu truacutec vagrave baacuten cấu truacutec

Loại thocircng tin Caacutec thocircng tin tin tức thocircng tin becircn ngoagravei về khaacutech hagraveng đối thủ cạnh tranh mocirci trường caacutec baacuteo caacuteo theo yecircu cầu vagrave định thời về caacutec hoạt động becircn trong

Caacutec thocircng tin hỗ trợ caacutec tigravenh huống đặc biệt

Sử dụng coacute nguyecircn tắc

Dograve theo vết vagrave điều khiển nhận dạng cơ hội

Hoạch định tổ chức phacircn nhoacutem vagrave điều khiển

Khả năng phugrave hợp với những người sử dụng caacute nhacircn

Thiết kế loại ra quyết định cho mỗi người điều hagravenh caacute nhacircn bằng nhiều lựa chọn đầu ra

Cho pheacutep caacutec đaacutenh giaacute caacute nhacircn caacutec khả năng what-if lựa chọn loại hộp hội thoại

Đồ họa Phải coacute Lagrave một phần quan trọng của nhiều DSS

Thacircn thiện người sử dụng

Phải coacute Phải coacute nếu khocircng coacute người sử dụng trung gian

Xử lyacute thocircng tin Lọc neacuten thocircng tin dograve theo vết dữ liệu vagrave thocircng tin quan trọng

EIS kiacutech thiacutech caacutec cacircu hỏi caacutec cacircu trả lời bằng caacutech sử dụng DSS vagrave phản hồi lại EIS

Hỗ trợ caacutec thocircng tin chi tiết

Truy xuất thường xuyecircn caacutec mức chi tiết của bất kỳ thocircng tin tổng hợp nagraveo (duyệt dữ

Coacute thể coacute trong DSS nhưng khocircng thường

liệu chi tiết)Cơ sở mocirc higravenh Caacutec chức năng coacute sẵn bị hạn

chếLagrave điểm cốt lotildei của DSS

Cấu truacutec Theo người baacuten sản phẩm hoặc theo caacutec chuyecircn gia hệ thống thocircng tin

Theo người sử dụng hoặc caacute nhacircn hoặc caacutec chuyecircn gia từ caacutec trung tacircm thocircng tin hoặc phograveng ban hệ thống thocircng tin

Phần cứng Mainframe caacutec trạm RISC mạng LANs hoặc caacutec hệ thống phacircn bố

Mainframe caacutec trạm RISC caacutec maacutey PC hoặc caacutec hệ thống phacircn bố

Bản chất caacutec goacutei phần mềm

Truy xuất tương taacutec dễ dagraveng đến nhiều cơ sở dữ liệu truy xuất trực tuyến caacutec khả năng DBMS phức tạp caacutec liecircn kết phức tạp

Caacutec khả năng tiacutenh toaacuten lớn caacutec ngocircn ngữ mocirc higravenh mocirc phỏng ứng dụng vagrave caacutec bộ tạo DSS

Bản chất caacutec thocircng tin

Trigravenh bagravey thocircng tin được phaacutet sinh trước về quaacute khứ vagrave hiện tại tạo caacutec thocircng tin mới về quaacute khứ hiện tại tương lai

Tạo thocircng tin mới về quaacute khứ hiện tại tương lai

62 Lịch sử EIS- EIS xuất hiện lần đầu tiecircn tại MIT vagraveo những năm 1970

- Những EIS đầu tiecircn được phaacutet triển bởi caacutec doanh ngiệp lớn sẵn sagraveng chấp nhận rủi ro để đạt được lợi thế cạnh tranh

- Vagraveo những năm 1980 caacutec nhagrave cung cấp đatilde phaacutet triển một số cơ sở khaacutech hagraveng rộng vagrave cocircng nghệ EIS được tiếp tục phaacutet triển cho đến ngagravey nay

(Tagravei liệu thecircm Sử dụng DSSEIS cho phaacutet triển bền vững + Một số nghiecircn cứu đatilde được tiến hagravenh để kiểm tra việc thực hiện của EIS trong khu vực cocircng cộng vagrave chiacutenh phủ caacutec nước tổ chức kể từ khi chuacuteng được phaacutet triển theo định hướng lợi nhuận cho caacutec cocircng ty tư nhacircn (Hasan vagrave Hasan năm 1997) Theo một nghiecircn cứu tiến hagravenh tại Mỹ ở hơn 300 cocircng ty kết quả cho thấy sự khaacutec biệt của EIS giữa tư nhacircn vagrave chiacutenh phủ một số kết quả thuacute vị được phaacutet hiệnViacute dụ khoacute khăn hơn để chuyển tiền từ một tagravei khoản khaacutec trong một EIS của chiacutenh phủ cũng lagrave khoacute khăn hơn để biện giải thiacutech cho những chi phiacute phaacutet triển EIS của chiacutenh phủ Một nghiecircn cứu khaacutec được tiến hagravenh ở Australia

cho thấy rằng EIS cung cấp cho quản lyacute một higravenh ảnh chiacutenh xaacutec hơn về tổ chức thực hiện vagrave cung cấp hỗ trợ cho caacutec lợi iacutech chiến lược cải thiện khocircng chỉ cho caacutec nhagrave quản lyacute nhưng cograven cho phần cograven lại của tổ chức Dựa trecircn caacutec hệ thống được thiết kế cho caacutec cocircng ty tư nhacircn với một caacutech rotilde ragravengxaacutec định mục tiecircu EIS lagrave thiacutech hợp cho caacutec tổ chức cocircng cộng hiện đại nhưng cần phải được linh hoạt hơn vagrave kết thagravenh chugravem một phạm vi rộng hơn khả năng vagrave phương tiện hơn so với khu vực tư nhacircn ban đầu theo định hướng sản phẩm (Hasan vagrave Hasan năm 1997) Điều nagravey coacute thể lagrave do thực tế rằng caacutec hoạt động khu vực cocircng lagrave bắt buộc coacute taacutec động rộng phải đaacutep ứng sự mong đợi duy nhất cocircng cộng thường coacute mục tiecircu mơ hồ vagrave macircu thuẫn iacutet quyền tự chủ vagrave kiểm soaacutet việc ra quyết định vagrave nhacircn viecircn lagrave khoacute khăn hơn (Watson vagrave Carte2000) + Toacutem lại EIS lagrave một khaacutei niệm thagravenh cocircng noacute phaacutet triển qua nhiều năm tuy nhiecircn EIS khắc phục khiếm khuyết của migravenh bằng caacutech tiến hagravenh nghiecircn cứu liecircn tục)

63 Tại sao những người điều hagravenh hagraveng đầu lại khaacutec nhau- Họ lagrave những doanh nghiệp theo định hướng coacute suy nghĩ

- Coacute một khoảng khocircng gian rộng để kiểm soaacutet

- Họ chịu traacutech nhiệm cho việc thiết lập chiacutenh saacutech

- Họ đại diện cho tổ chức mocirci trường becircn ngoagravei

- Hagravenh động của họ tạo ra những kết quả đaacuteng kể về tagravei chiacutenh vagrave con người

Tần số caacutec hoạt động điều hagravenh- Xử lyacute xaacuteo trộn 42

- Hoạt động kinh doanh 32

- Phacircn bổ nguồn lực 17

- Đagravem phaacuten 3

- Những điều khaacutec 6

Handling Disturbances 42

Entrepreneurial Activites 32

Resource Allocation 17

Negotiation 3

Other 6

Những thocircng tin điều hagravenh cần thiết- Quản lyacute xaacuteo trộn coacute thể yecircu cầu sự chuacute yacute xung quanh đồng hồ

- Hoạt động kinh doanh yecircu cầu điều hagravenh để dự đoaacuten những thay đổi trong mocirci trường

- Nhiệm vụ phacircn bổ tagravei nguyecircn yecircu cầu lựa chọn người quản lyacute vagrave caacutec nguồn lực hạn chế được triển khai

- Đagravem phaacuten yecircu cầu cập nhật thocircng tin từng phuacutet để coacute thể xacircy dựng được sự đồng thuận

Caacutec loại thocircng tin điều hagravenh- Hệ thống kế toaacuten coacute liecircn quan đến việc tiacutenh toaacuten thu nhập hoạt động cho caacutec lĩnh

vực cụ thể lagrave quan trọng hơn so với caacutec hệ thống kế toaacuten truyền thocircng- Thocircng tin về thị trường khaacutech hagraveng cung cấp giaacute trị trong việc quyết định chiến

lược- Caacutec thocircng tin cần thiết thường được truyền đi trecircn một số hệ thống maacutey tiacutenh vagrave

nằm trong toagraven tổ chức- Caacutec thocircng tin được sử dụng thường lagrave ngắn hạn vagrave dễ thay đổi

Phương thức để xaacutec định thocircng tin cần thiết

Rockart xaacutec định được năm phương thức cơ bản để xaacutec định thocircng tin cần thiết

- Phương thức dựa trecircn kết quả- Phương thức rỗng- Phương thức chỉ số khoacutea- Phương thức tổng hợp nghiecircn cứu- Phương thức dựa vagraveo nhacircn tố then chốt dẫn đến thagravenh cocircng

64 Thagravenh phần EIS

- Sản phẩm EIS đầu tiecircn được phaacutet triển để sử dụng trecircn maacutey tiacutenh cấu higravenh cao nhưng caacutec sản phẩm hiện nay nhằm mục tiecircu lagrave nền tảng ClientServer

- Những nền tảng linh hoạt hơn coacute thể thiacutech ứng với thay đổi trong tổ chức vagrave cocircng nghệ

- Sử dụng dữ liệu thời gian thực dẫn đến quyết định nhanh hơn nhiều thocircng tin hơn

Thagravenh phần phần cứng- Một EIS khocircng đogravei hỏi coacute phần cứng cụ thể hoặc duy nhất nagraveo- Chigravea khoacutea của vấn đề lagrave để đảm bảo rằng caacutec thagravenh phần của EIS tối ưu hoacutea vagrave

phugrave hợp với tagravei nguyecircn maacutey tiacutenh của tổ chức- Hệ thống nagravey phải được cấu higravenh để caacutec nguồn tagravei nguyecircn phugrave hợp với những

người điều hagravenh chuacuteng

Thagravenh phần phần mềm- Traacutei ngược với phần cứng phần mềm thường được chuyecircn mocircn hoacutea cao cho caacutec

bagravei toaacuten về miền- Sự chuyecircn mocircn hoacutea nagravey thường đạt được bằng caacutech sử dụng thagravenh phần off-the-

shelf cho toagraven bộ EIS vagrave caacutec mocirc-đun tugravey chỉnh để đaacutep ứng nhu cầu cụ thể- Lotus Notes lagrave một viacute dụ điển higravenh Noacute coacute thể được sử dụng một migravenh hoặc coacute

thể phục vụ becircn thứ ba mocirc-đun plug-in

Cocircng nghệ EIS hiện nay

Dobrzeniecki đề xuấtphacircn loạitừng cấptheo bachức năng- Loại 1 sản phẩm bao gồmmột bộ đầy đủcaacutec ứng dụngtừ mộtnhagrave cung cấp- Loại 2 sản phẩm đượcthựchiệnở phần đầu củacaacutecsản phẩmDSS đượcphaacutet triển

bởicugravengmộtnhagrave cung cấp- Loại 3 sản phẩmkết hợp với nhautheo bất kỳ số lượngthuộc sở hữu củacocircng ty

65 Xacircy dựng EIS

- Xacircy dựngmộtEISgiống nhưxacircydựngmột số hệ thống khaacutec củamocirc higravenh hệ thống thocircng tin

- Việcphaacutet triểncấu truacutecnecircn được theo dotildeitừ quaacute trigravenh thiết kế đến quaacute trigravenhthực hiện

- Tuy nhiecircn một dự aacuten phaacutet triển EIScoacute xu hướnglagrave thống nhấtvagraveyecircu cầu hỗ trợ caacutec nhagrave quản lyacute latildenh đạo

- Xacircy dựng một EIScoacute thểphaacutet hiện ra đượccaacutectigravenh huống khoacute khănmagravemột nhagrave phaacutet triển chưabao giờ gặp phải

Mocirc higravenh EIS

Khung phaacutet triển một EIS

- Watson et al đề nghị xacircy dựngkhung với ba thagravenh phần+ Caacutech tiếp cận tập trung vagraveo yếu tốcon người vagrave dữ liệu coacute liecircn quan đến EIS+ Quaacute trigravenh phaacutet triển cần sự linh hoạt vagrave tương taacutec+ Người sử dụng - hệ thống hộp thoại bao gồm một ngocircn ngữ hagravenh động để xử lyacute caacutec lệnh

Lợi iacutech của EIS- Dễ duy trigrave caacutec mục tiecircu coacute tổ chức- Dễ truy xuất thocircng tin- Cho pheacutep người sử dụng nacircng cao hiệu suất hơn

- Tăng chất lượng ra quyết định- Cung cấp sự cải tiến cạnh tranh- Tiết kiệm thời gian của người sử dụng- Tăng khả năng vagrave chất lượng giao tiếp- Cung cấp khả năng điều khiển tốt hơn trong tổ chức- Cho pheacutep tham gia caacutec vấn đề vagrave caacutec cơ hội- Cho pheacutep hoạch định- Cho pheacutep tigravem kiếm nguyecircn nhacircn của một vấn đề- Thảo matilden caacutec yecircu cầu của người điều hagravenh

Hạn chế của EIS vagrave 1 số sai lầm cần traacutenh

- Chi phiacute một cuộc khảo saacutetnăm1991 chothấychi phiacute phaacutet triểntrungbigravenh365000USDvớichi phiacute vận hagravenhhagraveng năm lagrave$200000 (EIS)

- Cocircng nghệ hạn chếEIScần phảiđượctiacutech hợp hoagraven toagravenvagraveokiếntruacuteccủadoanh nghiệphiện tại do đoacute noacutelagrave một thaacutech thứclớn đối vớithiết kế

- Hạn chế tổ chức cơ cấu tổ chứccoacute thể khocircng phugrave hợp

Sự hạn chế về tổ chức- Chương trigravenh nghị sự vagrave thời gian chệch EIS mocirc tả một phần việc thực hiện một

chương trigravenh nghị sự vagrave coacute thể dễ dagraveng đạt được sự tin cậy một caacutech chắc chắn- Đồng bộ hoacutea việc quản lyacute sự tin cậy đuacuteng luacutec đặc biệt baacuteo caacuteo EIS coacute thể phaacute

vỡ sự ổn định thiết lập caacutec chu trigravenh baacuteo caacuteo một caacutech tốt nhất- Sự bất ổn EIS phản ứng nhanh coacute thể gacircy ra việc taacutec động trở lại một caacutech

nhanh choacuteng dẫn đến sự thiếu ổn định trong tổ chức

Sự thất bại lagrave thay thế khocircng thể chấp nhận được- Một số yếu tố lagravem EIS thất bại

+ Thiếu sự hỗ trợ về mặt quản lyacute+ Vấn đề chiacutenh trị+ Thất bại của nhagrave phaacutet triển+ Lỗi về cocircng nghệ+ Giaacute cả+ Thời gian

66 Ra quyết định điều hagravenh trong tương lai vagrave EIS

- Coacute một vagravei điều kiện sẽ được hợp nhất cho việc chuyển đổi cocircng nghệ Trong đoacute một vagravei điều kiện coacute thể dễ dự đoaacuten Hai điều kiện magrave ta coacute thể thấy lagrave+ Phaacutet triển cocircng nghệ maacutey tiacutenh trong việc điều hagravenh sẽ tạo ra sự chuyển đổi được chấp nhận một caacutech dễ dagraveng hơn+ Mở rộng traacutech nhiệm điều hagravenh sẽ mở rộng nhu cầu thocircng tin

Tương lai của EIS- EIS thocircng minh Những tiến bộ trong cocircng nghệ AI sẽ được triển khai trong caacutec

EIS- EIS đa phương tiện Cơ sở dữ liệu đa phương tiện sẽ cho pheacutep tiacutech hợp văn bản

giọng noacutei vagrave higravenh ảnh trong tương lai- EIS thocircng tin Tương lai EIS sẽ mở rộng hơn trong việc sử dụng dữ liệu becircn

ngoagravei doanh nghiệp- EIS kết nối Giao tiếp với băng thocircng rộng cho pheacutep kết nối liecircn thocircng lớn hơn

Chương 7 HỆ CHUYEcircN GIA VAgrave TRIacute TUỆ NHAcircN TẠO

71 Caacutec khaacutei niệm

72 Triacute thocircng minh của triacute tuệ nhacircn tạo

73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia

74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia

75 Lợi iacutech vagrave hạn chế của hệ chuyecircn gia

71 Caacutec khaacutei niệm

Chuyecircn mocircn (Expertise) sự hiểu biết rộng trong 1 lĩnh vực hẹp

Hệ chuyecircn gia (Expert Systems)1 chương trigravenh maacutey tiacutenh sử dụng 1 tập caacutec luật dựa trecircn tri thức của con người để giải quyết caacutec vấn đề đogravei hogravei phải coacute sự chuyecircn mocircn

Một số hệ chuyecircn gia nổi tiếng

DENDRAL (Standford 1960s Edward Feigenbaum)

MYCIN (Standford1970s Edward Shortliffe)

PROSPECTOR (MIT 1979)

Triacute tuệ nhacircn tạo (Artificial Intelligence ndash AI)

Triacute tuệ nhacircn tạo một bộ phacircn của ngagravenh khoa học maacutey tiacutenh quan tacircm đến việc thiết kế caacutec hệ thống maacutey tiacutenh thocircng minh đoacute lagrave caacutec hệ thống đưa ra caacutec đặc điểm magrave từ đoacute chuacuteng ta liecircn hệ với sự thocircng minh trong hagravenh động của con người (Barr vagrave Feigenbaum 1981)

Mục điacutech của AI

Mục điacutech khoa học xaacutec định caacutec gợi yacute để giải thiacutech caacutec loại khaacutec nhau của triacute tuệ thực

Mục điacutech kỹ thuật giải quyết caacutec vấn đề trong thế giới thực

Triacute tuệ nhacircn tạo kế thừa nhiều yacute tưởng quan điểm kỹ thuật từ caacutec ngagravenh khoa học khaacutec

- Triết học

- Logic Toaacuten học

- Tiacutenh toaacuten

- Khoa học tacircm lyacute Khoa học nhận thức

- Sinh học Thần kinh học

- Tiến hoacutea

Caacutec lĩnh vực ứng dụng trong Triacute tuệ nhacircn tạo

Mạng nơ ron thần kinh (Neural Networks)

Tiacutenh toaacuten sự tiến hoacutea

(Evolutionary Computation)

Hệ chuyecircn gia (Expert Systems)

Kỹ thuật xử lyacute tiếng noacutei (Speech Processing)

Kỹ thuật xử lyacute ngocircn ngữ tự nhiecircn

(Natural Language Processing)

Lập kế hoạch (Planning)

Robot (Robotics)

Khoa học higravenh ảnh (Vision)

Caacutec kỹ thuật thocircng dụng dugraveng trong AI

Biểu diễn(Representation)

Học (Learning)

Caacutec luật (Rules)

Tigravem kiếm (Search)

72 Triacute thocircng minh của triacute tuệ nhacircn tạo

Con người suy diễn như thế nagraveo

Phacircn loại (Categorization)

Caacutec quy tắc cụ thể

Heuristics

Kinh nghiệm trước đoacute

Dự tiacutenh trước

Maacutey tiacutenh suy diễn như thế nagraveo

Lập luận dựa trecircn luật IF-THEN mocirc tả tri thức được matilde hoacutea dưới dạng caacutec luật

Caacutec khung (Frames) lagrave caacutec đại diện mocirc tả caacutec tigravenh huống giống nhau lagrave điển higravenh của một vagravei phacircn loại

Lập luận dựa trecircn caacutec trường hợp mocirc phỏng giải phaacutep trước đoacute cho một vấn đề hiện tại

Nhận dạng mẫu phaacutet hiện acircm thanh higravenh dạng hoặc caacutec chuỗi dagravei

Caacutec dạng khaacutec của Triacute tuệ nhacircn tạo

Học maacutey- mạng nơron vagrave giải thuật di truyền

Lập trigravenh tự động ndash lagrave những kỹ thuật tạo ra caacutec chương trigravenh để lagravem 1 nhiệm vụ riecircng biệt (cho pheacutep những người khocircng phải lagrave người lập trigravenh coacute thể lập trigravenh được)

Cuộc sống nhacircn tạo ndash nỗ lực để taacutei tạo caacutec hiện tượng sinh học trong caacutec hệ thống dựa trecircn maacutey tiacutenh

73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia(Expert Systems- ES)

Theo Jackson (1999) Một hệ chuyecircn gia lagrave một chương trigravenh maacutey tiacutenh mocirc tả vagrave suy diễn với tri thức của một vagravei lĩnh vực để giải quyết vấn đề hay đưa ra caacutec lời khuyecircn

Cấu truacutec cơ bản của ES được dựa theo cấu truacutec chung của DSS Sự khaacutec biệt chiacutenh giữa ES vagraveDSS lagrave hệ ES thu thập caacutec kiến thức từ những

chuyecircn gia trong lĩnh vực quan tacircmĐặc trưng của hệ chuyecircn gia Hiệu quả cao Thời gian trả lời thỏa đaacuteng Độ tin cậy cao Dễ hiểu

Giao diện người dugraveng trong ES

Thiết kế giao diện người dugraveng tập trung vagraveo caacutec yếu tố như dễ dagraveng sử dụngcoacute độ tin cậy cao giảm tải những khoacute khăn khi sử dụng

Thiết kế necircn coacute một số tương taacutec (đầu vagraveo kiểm soaacutet vagrave truy vấn)

Cấu tạo giao diện người dugraveng gồm coacute magraven higravenh cảm ứng bagraven phiacutem buacutet saacuteng lệnh thoại caacutec phiacutem chuyecircn dụng

Cơ sở tri thức (Knowledge Base)

Chứa đựng caacutec tri thức cụ thể miền thu được từ caacutec chuyecircn gia miền

Coacute thể chứa caacutec mocirc tả caacutec hagravenh vi giải quyết vấn đề caacutec ragraveng buộc caacutec heuristics

Thagravenh cocircng của một ES dựa trecircn tiacutenh đầy đủ vagrave tiacutenh chiacutenh xaacutec của cơ sở tri thức

Mocirc tơ suy diễn (Inference Engine)

Ở đacircy tri thức được đặt để sử dụng tạo ra caacutec giải phaacutep để giải quyết vấn đề

Mocirc tơ nagravey coacute khả năng thực hiện diễn dịch hoặc suy diễn dựa trecircn caacutec luật hay caacutec caacutec sự kiện

Đồng thời cũng coacute khả năng sử dụng caacutec suy diễn mờ hay khocircng chiacutenh xaacutec dựa trecircn xaacutec suất hay aacutenh xạ mẫu

Vograveng điều khiển suy diễn

1 Aacutenh xạ caacutec luật với caacutec sự kiện đatilde được cho

2 Chọn luật để thực hiện

3 Thực hiện luật bằng caacutech thecircm caacutec sự kiện được suy diễn ra vagraveo bộ nhớ lagravem việc

Chuỗi suy diễn (Chaining)

Suy diễn tiến (forward chaining) maacutey suy diễn bắt đầu từ dữ liệu ban đầu vagrave thực hiện việc suy luận để đưa ra caacutec kết luận cuối cugraveng

Suy diễn lugravei (backward chaining) maacutey suy diễn bắt đầu từ dữ liệu điacutech vagrave tigravem ra tri thức hỗ trợ cho dữ liệu điacutech đoacute

Viacute dụ suy diễn lugravei

R1 Nếu coacute A vagrave B thigrave suy ra coacute D

R2 Nếu coacute B thigrave suy ra coacute C

R3 Nếu coacute C vagrave D thigrave suy ra coacute E

Ta coacute E ta xem trong 3 luật R1 R2 R3 luật nagraveo coacute E ta thấy R3 chứa E đồng thời chứa C vagrave D Xeacutet tiếp trong 2 luật R1 R2 luật nagraveo chứa C vagrave D R2 chứa C R3 chứa D Từ đoacute ta coacute được caacutec tri thức hỗ trợ suy diễn vagrave kết luận lagrave nếu coacute A vagrave B thigrave sẽ coacute E Hay nếu A vagrave B đuacuteng thigrave sẽ coacute E

Viacute dụ suy diễn tiến

Giả sử coacute tập chứa 3 luật sau

R1 Nếu coacute A vagrave B thigrave suy ra coacute D

R2 Nếu coacute B thigrave suy ra coacute C

R3 Nếu coacute C vagrave D thigrave suy ra coacute E

Nếu ta coacute A vagrave B thigrave chuacuteng ta suy ra được D từ R1 vagrave suy ra C từ R2 Với D vagrave C đatilde được suy ra ở trecircn giờ chuacuteng ta suy ra được E từ R3

Viacute dụ thực tế

Giả sử muốn biết magraveu của một con vật nuocirci tecircn lagrave Fred biết rằng noacute kecircu ộp ộp vagrave ăn ruồi

Coacute tập 4 luật ban đầu như sau

R1 Nếu X kecircu ộp ộp vagrave ăn ruồi thigrave X lagrave con ếch

R2 Nếu X kecircu chiecircm chiếp vagrave biết hoacutet thigrave X lagrave con chim

R3 Nếu X lagrave con ếch thigrave X coacute magraveu xanh

R4 Nếu X lagrave con chim thigrave X coacute magraveu vagraveng

74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia

Expert system shells lagrave một tập caacutec goacutei phần mềm vagrave caacutec cocircng cụ dugraveng để phaacutet triển caacutec hệ chuyecircn gia

Những Expert system shells đầu tiecircn thường rất rườm ragrave Mặc dugrave vậy noacute vẫn giuacutep cho người sử dụng sẽ khocircng phải bắt đầu lại từ đầu khi xacircy dựng một hệ chuyecircn gia mới

Những shell hiện đại bao gồm hai mocirc-đun chiacutenh lagrave cocircng cụ xacircy dựng một tập quy tắc vagrave mocirc tơ suy diễn

Xacircy dựng hệ chuyecircn gia

Bước 1 xacircy dựng mocirc higravenh bagravei toaacuten xaacutec định vấn đề nhiệm vụ magrave hệ thống sẽ thực hiện Caacutec dạng bagravei toaacuten cần hệ chuyecircn gia

Bagravei toaacuten diễn giải (InterPretation)

Bagravei toaacuten dự baacuteo (Prediction)

Bagravei toaacuten chuẩn đoaacuten (Diagnose)

Bagravei toaacuten gỡ rối (Debugging)

Bagravei toaacuten thiết kế

Tương tự như một dự aacuten phần mềm để xacircy dựng một hệ chuyecircn gia cần phải coacute caacutec yếu tố về nhacircn lực tagravei nguyecircn vagrave thời gian Những yếu tố nagravey ảnh hưởng đến giaacute thah của một hệ chuyecircn giaTrong phần nagravey cacircu hỏi thường được đặt ra lagrave tại sao cần phải xacircy dựng một hệ chuyecircn giaTrước khi bắt đầu phải xaacute định rotilde bagravei toaacuten đạt ra lagrave jiAi lagrave chuyecircn giaAi lagrave người sử dụng

1 Diễn giải (InterPretation) Nghiecircn cứu 1 vấn đề -gt Dựa trecircn những biểu hiện thuộc tiacutenh đặc trưng becircn ngoagravei -gt Tư vấn

(hoặc đưa ra kết luận hay mocirc tả dễ hiểu từ tập dữ liệu thocirc)

2 Bagravei toaacuten dự baacuteo (Prediction) Coacute thể dự đoaacuten được hagravenh vi kết quả dựa trecircn caacutec hiện tượng -gt dự baacuteo

VD Dự baacuteo thời tiết động đấthellip

3 Bagravei toaacuten chẩn đoaacuten (Diagnoss) Xaacutec định caacutec lỗi caacutec bộ phận hỏng hoacutec của hệ thống dựa trecircn caacutec dữ liệu quan saacutet được

4 Bagravei toaacuten gỡ rối (Debugging) Mocirc tả caacutec phương phaacutep khắc phục hệ thống khi gặp sự cố

5 Bagravei toaacuten thiết kế Lựa chọn cấu higravenh caacutec đối tượng nhằm thoả matilden một số ragraveng buộc nagraveo đoacute

6 Giảng dạy Phần mềm dạy học coacute thể chuẩn đoaacuten vagrave sủa lỗi của học sinh trong quaacute trigravenh học tập

Để xaacutec định đuacuteng bagravei toaacuten magrave chuacuteng ta cần giải quyết thigrave phải trả lời đc một số cacircu hỏi

- cần hệ chuyecircn gia

Bước 2 thu thập tri thức lựa chọn cocircng cụ vagrave aacutep dụng

Trong bước thu thập tri thức vấn đề quan trọng lagrave lựa chọn chuyecircn gia những người magrave sẽ đoacuteng goacutep tri thức cho hệ thống Thocircng thường trong suốt quaacute trigravenh phaacutet triển thigrave chuyecircn gia được xem như một thagravenh viecircn của đội phaacutet triển

Hiện nay coacute rất nhiều cocircng cụ để xacircy dựng một hệ chuyecircn gia Phổ biến nhất lagrave JESS CLIPS vagrave OPS5

Bước 3 Thiết kế cơ sở tri thức thiết kế hệ thốngTri thức được biểu diễn trường minh trong cơ sở tri thức

Caacutec chuyecircn gia vagrave kỹ sư tri thức sẽ đối thoại với nhau bằng caacutec kỹ thuật đối thoại Suy diễn (SD) bảng Mocirc higravenh hoacutea SD quy nạp phacircn loại

Vấn đề bagraveo trigrave vagrave phaacutet triển

Caacutec hệ chuyecircn gia đogravei hỏi phải bảo trigrave vagrave phaacutet triển nhiều hơn so với caacutec hệ thống khaacutec Phải thường xuyecircn bổ sung tri thức mới vagrave thay đổi caacutec tri thức cũ để đổi mới hệ chuyecircn gia

Thu thập vagrave khắc phục lỗi do người sử dụng phaacutet hiện để kịp thời khắc phục những sai soacutet của hệ chuyecircn gia

75 Lợi iacutech vagrave hạn chế của caacutec hệ chuyecircn gia

Một số lợi iacutech chiacutenh

Thời gian trả lời hợp lyacute bằng hoặc nhanh hơn so với chuyecircn gia (người) để đi đến cugraveng một quyết định Hệ chuyecircn gia lagrave một hệ thống thời gian thực (real time system)

Khả năng trả lời với mức độ tinh thocircng bằng hoặc cao hơn so với chuyecircn gia (người) trong cugraveng lĩnh vực

Hệ chuyecircn gia giuacutep cho hiệu quả lagravem việc tăng bằng việc sử dụng tập caacutec luật một caacutech nhanh choacuteng magrave ko bị nhầm lẫn chuyecircn gia lagrave người coacute thể quecircn đi một số tri thức cơ sở lyacute luậ nhưng HCG thigrave ko

Quyết định của một người chuyecircn gia coacute thể bị thay đổi vagrave ko coacute tiacutenh thống nhất như quyết định của một hệ chuyecircn gia tạo ra

Hệ chuyecircn gia giuacutep cho người sử dụng coacute thể trau dồi sự hiểu biết trecircn lĩnh vuej cụ thể magrave noacute giải quyết hỗ trợ người ra quyết định coacute trigravenh độ như 1 chuyecircn gia trong quaacute trigravenh gia quyết định

Kiến thức của rất nhiều chuyecircn gia về một lĩnh vực nagraveo đoacute được đưa vagraveo hệ chuyecircn gia lagravem cho CSTT cuat HCG phong phuacute vagrave rộng lớn hơn rất nhiều

HCG giải thiacutech caacutec bước suy luận một caacutech dễ hiểu nhất quaacuten luacutec nagraveo cũng coacute thể sử dụng ko như chuyecircn gia con người

Hạn chế của caacutec hệ chuyecircn gia

Nhược điểm lớn nhất của hệ chuyecircn gia lagrave những yacute kiến chuyecircn mocircn thường rất khoacute matilde hoacutea vagrave giải neacuten

Hệ chuyecircn gia khocircng coacute khả năng tự học tự cập nhật kiến thức mới như caacutec chuyecircn gia magrave cần phải được matilde hoacutea lại khi noacute được cập nhật

Hệ chuyecircn gia khocircng thể nhận ra được vấn đề khocircng nằm trong miền kiến thức của hệ thống

Chương 8 Tri thức vagrave tiếp nhận

1 Bao gồm caacutec vấn đề

Dữ liệu thực tế đo lường hoặc quan saacutet coacute hoặc khocircng coacute bối cảnh

Thocircng tin dữ liệu được tổng hợp một caacutech hữu iacutech để giải quyết những khoacute khăn trong việc đưa ra quyết định

Tri thức bao gồm caacutec ứng dụng quy tắc thocircng tin hướng dẫn của người ra quyết định

2 Những caacutei nhigraven về tri thức

Đại diện lagravem thế nagraveo để diễn tả tri thức viacute dụ như một quyển saacutech khocircng phải lagrave tri thức nhưng noacute lại lagrave một đại diện của tri thức

Sản xuất tri thức lagrave một tập hơp của hagraveng tồn kho coacute thể được sản xuất cũng như mua lại

Tri thức lagrave 1 trong 6 trạng thaacutei của hệ thống

1Dữ liệu 2Thocircng tin 3Cấu truacutec thocircng tin 4Sự thấu hiểu 5Yacute kiến 6 Quyết định

3 Caacutec loại tri thức Phổ biến mocirc tả dữ liệu thocircng tin thủ tục mọi thứ lagravem như thế nagraveo lập luận chiacutenh saacutech hoặc caacutec quy tắc

4 Thu thập Tri thức hệ chuyecircn gia Hầu hết caacutec phương phaacutep đều bắt đầu với mocirc higravenh của caacutec taacutec vụ trong đoacute

hệ chuyecircn gia được xacircy dựng Trong đoacute mocirc tả về caacutec lĩnh vực được tạo ra Caacutec kỹ sư sử dụng caacutec mocirc higravenh giả thuyết vagrave nhận thức về quaacute trigravenh phacircn

tiacutech để gợi ra caacutech giải quyết vấn đề về tri thức từ caacutec chuyecircn gia

5 Caacutec chiều của thu thập tri thức KE- driven caacutec kỹ sư trao đổi trực tiếp với caacutec chuyecircn gia Expert-driven Caacutec chuyecircn gia trực tiếp đưa chuyecircn mocircn của họ vagraveo hệ

thống maacutey tiacutenh Machine-driven Sử dụng caacutec cocircng cụ suy luận để triacutech xuất tri thức từ một

tập caacutec viacute dụ

6 Kỹ thuật thu thập tri thức Trao đổi gồm 2 loại cơ bản lagrave coacute cấu truacutec(coacute kịch bản) vagrave khocircng coacute cấu

truacutec( đối thoại trực tiếp) Giao thức phacircn tiacutech bằng lời Khi caacutec chuyecircn gia thực hiện một cocircng việc

của họ thigrave một bản ghi về cocircng việc đoacute được thực hiện Caacutec kỹ sư sẽ xacircy dựng mocirc higravenh cho những gigrave được ghi lại trong bản ghi

Phương phaacutep sagraveng lọc caacutec chuyecircn gia so saacutenh caacutec nhoacutem liecircn tiếp trong ba đối tượng vagrave cho biết tại sao nhoacutem thứ hai lại khaacutec nhoacutem thứ ba

7 Thu thập tri thức từ nhiều nguồn Thu thập tri thức từ nhiều nguồn lagrave cần thiết để coacute được đầy đủ caacutec tri thức

cho một vấn đề quan điểm yacute kiến traacutei ngược nhau thường phaacutet sinh Phương phaacutep đồng thuận sẽ giuacutep giải quyết được vấn đề macircu thuẫn Kỹ thuật phacircn tiacutech Meta lagrave kỹ thuật được aacutep dụng trong caacutec trường hợp

khaacutec Caacutech tiếp cận bằng định lượng đogravei hỏi caacutec kỹ sư cần cacircn nhắc yếu tố đầu vagraveo của caacutec chuyecircn gia khaacutec nhau

8 Xaacutec nhận hợp lệ vagrave kiểm tra tri thức Một khi thu thập tri thức noacute phải được đaacutenh giaacute về khả năng sử dụng vagrave độ

chiacutenh xaacutec Hai vấn đề cụ thể lagrave hiệu lực của những kiến thức vagrave kiểm tra việc xacircy dựng cơ sở của tri thức

Cần xaacutec nhận xem liệu hệ thống coacute thể hoạt động ở mức độ tối thiểu khocircng

Xaacutec minh liecircn quan đến việc so saacutenh từng chi tiết kỹ thuật của hệ thống những gigrave đatilde được thực hiện cuối cugraveng

9 Một số caacutec biện phaacutep xaacutec nhận Độ chiacutenh xaacutec Khả năng thiacutech nghi Mức độ đầy đủ Bề rộng Độ sacircu Hiệu lực Tổng quan Chiacutenh xaacutec Hiện thực Độ tin cậy Tiacutenh hữu dụng Mức độ

Chương 9 Học maacutey

1 Logic mờ vagrave ngocircn ngữ mờ(Fuzzy Logic and Linguistic Ambiguity)

Ngocircn ngữ tự nhiecircn gồm những khaacutei niệm mơ hồ vagrave khocircng chiacutenh xaacutectruyền tải ngữ nghĩa thocircng qua tiacutenh xấp xỉkhocircng rotilde ragraveng

Những xấp xỉ nagravey giuacutep con người coacute thể truyền tải hết được yacute nghĩa nhưng maacutey thigrave khocircng hiểu

Lagravem sao biểu diễn caacutec tri thức sử dụng caacutec khaacutei niệm khocircng rotilde ragraveng(mờ) hoặc khocircng chiacutenh xaacutec

2 Khaacutei niệm cơ bản của logic mờ tập mờ lagrave những tập hợp khocircng coacute một giới hạn rotilde Mỗi phần tử của noacute chỉ

chứa một mức độ hagravem liecircn thuộc của từng phần tử Vigrave vậy tập mờ khocircng giống như tập cổ điển Tập mờ coacute thể kết hợp với nhau qua những luật mờ magrave đặc trưng cho những hagravenh động trạng thaacutei vagrave thuộc tiacutenh của logic mờ được tận dụng khi thực hiện một bộ điều khiển mờ

Logic mờ dựa trecircn yacute tưởng mỗi phần tử thuộc vagraveo một tập hợp ở một mức độ nagraveo đấy

Locircgic mờ cho pheacutep độ liecircn thuộc (microA )coacute giaacute trị trong khoảng (01) Locircgic mờ coacute thể được coi lagrave mặt ứng dụng của lyacute thuyết tập mờ để xử lyacute caacutec

giaacute trị trong thế giới thực cho caacutec bagravei toaacuten phức tạp

3 So saacutenh tiacutenh đuacuteng đắn logic mờ vagrave xaacutec suất Xaacutec suất thigrave đề cập đến khả năng xảy ra một biến cố hay một điều gigrave đoacute Logic mờ đề cập đến cấp độ magrave đặc tiacutenh ở hiện tại

o viacute dụ1 người coacute chiều cao 6 feet thigrave coacute cấp độ lagrave 05 về chiều cao

4 Ưu điểm của logic mờ Caacutech tiếp cận rất tự nhiecircnkhocircng phức tạp Coacute thể mocirc higravenh hoacutea caacutec hagravem phi tuyến tugravey yacute phức tạp

Coacute thể tận dụng được kinh nghiệm từ những chuyecircn gia hagraveng đầu trong mọi lĩnh vực

Logic mờ được xacircy dựng dựa trecircn ngocircn ngữ tự nhiecircnNền tảng của logic mờ lagrave dựa trecircn cơ sở giao tiếp của con người

5 Nhược điểm của logic mờ Trong 1 hệ thống phức tạpsử dụng logic mờ coacute thể trở thagravenh trở ngại cho

việc xaacutec thực độ tin cậy của hệ thống Cơ chế lập luận mờ khocircng thể học hỏi từ những lỗi sai

6 Mạng noron nhacircn tạo(ANN) Mạng noron nhacircn tạo lagrave một mocirc phỏng xử lyacute thocircng tinđược nghiecircn cứu ra

từ hệ thống thần kinh của sinh vậtgiống như bộ natildeo để xử lyacute thocircng tin ANNs lagrave chương trigravenh dựa trecircn maacutey tiacutenh đơn giản coacute chức năng lagrave một mocirc

higravenh bagravei toaacuten khocircng gian dựa trecircn thử nghiệm vagrave baacuteo lỗi

7 Học từ kinh nghiệm Tiến trigravenh Một mẫu dữ liệu được biểu diễn như một mạng lưới noronANN ldquodự

đoaacutenrdquo 1 đầu radự đoaacuten được so saacutenh với giaacute trị thực tế hoặc giaacute trị chiacutenh xaacutecNếu đoaacuten được chiacutenh xaacutec thigrave khocircng coacute hagravenh động nagraveo được thực hiện

Nếu dự đoaacuten sai ANN kiểm tra lại vagrave xaacutec định lại thocircng số để điều chỉnh Một mẫu dữ liệu khaacutec được biểu diễn vagrave quaacute trigravenh nagravey được lặp lại

8 Nguyecircn tắc cơ bản của cocircng nghệ nơron Caacutec yếu tố xử lyacute cơ bản trong hệ thống thần kinh của con người lagrave tế bagraveo

thần kinhMạng lưới của tế bagraveo nagravey lagrave liecircn kết với nhau nhận được thocircng tin từ caacutec cảm biến trong mắt taihellip

Thocircng tin nhận được bởi tế bagraveo thần kinh hoặc lagrave sẽ kiacutech thiacutech noacute(sẽ được chuyển qua 1 thocircng điệp dọc theo mạng lưới) hoặc lagrave sẽ ngăn cản noacute(ngăn cản dograveng thocircng tin)

Độ nhạy coacute thể thay đổi qua thời gian hoặc sau khi coacute được kinh nghiệm

9 Cấu truacutec mạng Một ANN gồm 3 lớp cơ bản

Lớp đầu vagraveo nhận dữ liệu Lớp becircn trong hoặc lagrave lớp ẩn xử lyacute dữ liệu Lớp đầu ra chuyển tiếp kết quả cuối cugraveng của mạng

10Mạng nơ ron Thường coacute nhiều đầu vagraveo mỗi đầu vagraveo với mức ảnh hưởng vagrave tầm quan

trọng riecircng của noacute Một đầu vagraveo quan trọng coacute thể được sử dụng để khuếch đại đầu ra caacutec hagravem trạng thaacutei tổng hợp caacutec trọng số của caacutec yếu tố

đầuvagraveo khaacutec nhauvagraveo một giaacute trị duy nhất Caacutec hagravem chuyển giao xử lyacute caacutec giaacute trị trạng thaacutei vagrave tạo đầu ra

11Huấn luyện mạng nơ ron Trong mocirc higravenh coacute giaacutem saacutetANN được đến so saacutenh dự đoaacuten của chiacutenh

noacute với thocircng tin phản hồi coacute chứa caacutec kết quả mong muốn ANN sẽ phải tigravem caacutech thay đổi caacutec tham số becircn trong củamigravenh (caacutec trọng số vagrave caacutec ngưỡng) để tạo necircn một aacutenh xạ coacute khả năng aacutenh xạcaacutec đầu vagraveo thagravenh caacutec đầu ra mong muốn Sự thay đổi nagravey được tiến hagravenh nhờ việc so saacutenh giữa đầu ra thực sự vagrave đầu ra mong muốn

Trong mocirc higravenh khocircng coacute giaacutem saacutetANN nhận được dữ liệu vagraveo nhưng khocircng phải coacute bất kỳ thocircng tin phản hồi về kết quả mong muốn

Phần lớn caacutec ứng dụng nằm trong vugraveng của caacutec bagravei toaacuten ước lượng như mocirc higravenh hoacuteathống kecirc neacuten lọc phacircn cụm

12Lợi iacutech Liecircn kết với mạng noron Traacutenh caacutech lập trigravenh tường minh Giảm nhu cầu của chuyecircn gia ANNs thigrave thiacutech nghi với caacutec yếu tố đầu vagraveo thay đổi Khocircng cần thiết cho cơ sở tri thức tinh chế ANNs coacute tiacutenh động vagrave cải thiện với việc sử dụng Coacute khả năng xử lyacute dữ liệu khocircng chiacutenh xaacutec hoặc khocircng đầy đủ Cho pheacutep tổng quaacutet hoacutea từ thocircng tin cụ thể Cho pheacutep thu thập cảm giaacutec thocircng thường vagraveo miền giải quyết vấn đề

13Hạn chế của việc liecircn kết với mạng noron ANNs khocircng thể giải thiacutech được suy luận Bản chất hộp đen thường khiến cho vấn đề traacutech nhiệm vagrave độ tin cậy phaacutet

sinh lagrave khoacute khăn Lặp đi lặp lại quaacute trigravenh huấn luyện rất tốn thời gian Nguồn lực caacutec nhagrave phacircn tiacutech vagrave thiết kế coacute tay nghề cao vẫn lagrave đaacuteng lo

ngại Cocircng nghệ ANN thuacutec đẩy hạn chế của phần cứng hiện tại ANN yecircu cầu phải coacute sự tin tưởng ở đầu ra

14Giới thiệu về thuật toaacuten di truyền Cũng như mạng lưới thần kinh caacutec thuật toaacuten di truyền được dựa trecircn lyacute

thuyết sinh học Thuật toaacuten di truyền tigravem thấy nguồn gốc của chuacuteng trong caacutec lyacute thuyết

tiến hoacutea của chọn lọc tự nhiecircn vagrave thiacutech ứng với biến đổi khiacute hậu Kết quả thuật toaacuten di truyền lagrave từ giao phối 2 caacute thể trong quần thế để tạo

ra con caacutei đocirci khi tốt hơn so với bậc cha mẹ của chuacuteng 15Caacutec thagravenh phần cơ bản của thuật toaacuten di truyền

Toaacuten tử chọn lọc Caacutec caacute thể tốt được chọn lọc để đưa vagraveo thế hệ sau Sự chọn lọc nagravey căn cứ vagraveo độ thiacutech nghi với mocirci trường của mỗi caacute thể

Toaacuten tử lai gheacutep (crossover) Hai caacute thể cha vagrave mẹ trao đổi caacutec gen với nhau để tạo ra caacute thể con

Toaacuten tử đột biến (mutation) Một caacute thể thay đổi một số gen để biến đổi thagravenh một caacute thể mớiTất cả caacutec toaacuten tử trecircn khi thực hiện đều mang tiacutenh ngẫu nhiecircn

16Quaacute trigravenh cơ bản của một thuật toaacuten di truyền Khởi tạo

Đaacutenh giaacute quần thể

Lựa chọn NST thiacutech hợp nhất vagrave loại bỏ NST yếu nhất

Quy trigravenh giao nhau vagrave cải thiện quần thể

đột biến tiến trigravenh để khaacutem phaacute ra NST mới

17Ưu nhược điểm của việc kết hợp với thuật toaacuten di truyền Kiacutech thước quần thể lagrave 1 yếu tố quan trọng trong tốc độ của việc tigravem

kiếmnhưng noacute tương đối dễ dagraveng để dự đoaacuten tốc độ nagravey Giao nhau hoặc đột biến lagrave khocircng necircn đc sử dụng quaacute thường xuyecircn Luocircn coacute được iacutet nhất 1 giải phaacutep hợp lyacute Necircn coacute thể aacutep dụng chuacuteng cho caacutec vấn đề magrave chuacuteng ta khocircng coacute hướng

về caacutech giải quyết Sức mạnh của thuật toaacuten xuất phaacutet từ khaacutei niệm đơn giảnkhocircng phải từ

một thủ tục thuật toaacuten phức tạp 18Tương lai của học maacutey

Mạng lưới thần kinh nhacircn tạo vượt quaacute năng lực của con người trong caacutec trường hợp bị cocirc lập

Về mặt lyacute thuyếtmột maacutey tiacutenh coacute thể xử lyacute dũ liệu nhanh hơn hagraveng triệu lần so với 1 con người

May mắn thay cho chuacuteng tacon người tốt hơn nhiều khi magrave coacute được dữ liệumaacutey tiacutenh khocircng coacute 1 số thứ như lagrave 5 giaacutec quan

CHƯƠNG 10 KHO DỮ LIỆU

1 Kho dữ liệu Kho dữ liệu lagrave tuyển tập caacutec cơ sở dữ liệu tiacutech hợp hướng chủ đề được

thiết kế để trợ giuacutep cho một hệ hỗ trợ quyết định

Theo John Ladley Cocircng nghệ kho dữ liệu lagrave tập caacutec phương phaacutep kỹ thuật vagrave caacutec cocircng cụ coacute thể kết hợp hỗ trợ nhau để cung cấp thocircng tin cho người sử dụng trecircn cơ sở tiacutech hợp từ nhiều nguồn dữ liệu nhiều mocirci trường khaacutec nhau

Kho dữ liệu thường rất lớn tới hagraveng trăm GB hay thậm chiacute hagraveng Terabyte

2 Kho dữ liệu vận hagravenh (ODS) Một kho dữ liệu vận hagravenh Aacutep dụng kỹ thuật kho dữ liệu vagraveo caacutec hệ xử

lyacute giao taacutec lưu trữ dữ liệu cho một ứng dụng đặc thugrave Noacute đưa vagraveo kho dữ liệu một dograveng caacutec dữ liệu thocirc được thiết kế

3 So saacutenh

Kho dữ liệu vận hagravenh Kho dữ liệu

Dữ liệu theo chủ đề Dữ liệu theo chủ đề

Dữ liệu tiacutech hợp Dữ liệu tiacutech hợp

Dữ liệu thay đổi Dữ liệu khocircng thay đổi

Dữ liệu được cập nhật khi thay đổi

Dữ liệu giữ nguyecircn

Chỉ coacute dữ liệu hiện tạiDữliệu hiện tại vagrave dữ liệu lịch sử

Chu kỳ lagravem tươi dữ liệu ngắn Chu kỳ lagravem tươi dữ liệu dagravei

Chỉ coacute dữ liệu chi tiết Dữ liệu chi tiết vagrave dữ liệu tổng kết

Dugraveng cho caacutec quyết định ngắn hạn

Dugraveng cho hoạch định dagravei hạn

4 Kho dữ liệu cục bộ (Data Mart - DM)

Kho dữ liệu cục bộ lagrave CSDL coacute những đặc điểm giống với kho dữ liệu nhưng với quy mocirc nhỏ hơn vagrave lưu trữ dữ liệu về một lĩnh vực một chuyecircn ngagravenh

Data mart phụ thuộc Chứa những dữ liệu được lấy từ DW vagrave những dữ liệu nagravey sẽ được triacutech lọc vagrave tinh chế tiacutech hợp lại ở mức cao hơn để phục vụ một chủ đề nhất định của Datamart

Data mart độc lập Khocircng giống như Datamart phụ thuộc Data mart độc lập được xacircy dựng trước DW vagrave dữ liệu được trực tiếp lấy từ caacutec nguồn khaacutec nhau

5 Siecircu dữ liệu Metadata lagrave dữ liệu để mocirc tả dữ liệu Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột

một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi Metadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu

6 Mocirci trường kho dữ liệu Hệ thống của tổ chức vagrave kho cung cấp dữ liệu để xacircy dựng kho dữ liệu Trong quaacute trigravenh chuyển dữ liệu từ caacutec nguồn khaacutec nhau dữ liệu coacute thể

được lagravem sạch hoặc chuyển đổi vagrave vigrave thế DW được xem như lagrave một chuẩn cho việc lưu trữ

Đồng thời siecircu dữ liệu được ghi lại Cuối cugraveng DW hoặc siecircu thị coacute thể được sử dụng để tạo ra một kho dữ

liệu ldquocaacute nhacircnrdquo 7 Caacutec đặc điểm của kho dữ liệu

Đặc điểm Mocirc tả

Hướng chủ đề - DL tổ chức theo caacutech thức người dugraveng tham chiếu

Tiacutech hợp - Dữ liệu ldquosạchrdquo loại bỏ tiacutenh thiếu nhất quaacuten

Khocircng thay đổi - DL ldquochỉ đọcrdquo người dugraveng khocircng thay đổi được

Chuỗi thời gian - DL lagrave chuỗi thời gian khocircng phải lagrave trạng thaacutei hiện tại

Được tổng kết - DL vận hagravenhthao taacutec khi cần thiết

được kết hợp lại thagravenh dạng coacute thể dugraveng được cho quyết định

Kiacutech cỡ lớn hơn - Lưu giữ theo chuỗi thời gian tức lagrave giữ lại nhiều DL

Khocircng được chuẩn hoacutea - Coacute thể dư thừa DLSiecircu dữ liệu - Dữ liệu của dữ liệu được lưu trữNguồn dữ liệu - DL vận hagravenh (caacutec hệ sẵn coacute) cugraveng

với caacutec nguồn ngoagravei 8 Kho dữ liệu hướng chủ đề

Hướng chủ để coacute nghĩa lagrave kho dữ liệu được tổ chức xung quanh caacutec chủ đề chiacutenh như khaacutech hagraveng sản phẩm sản xuất Tập trung vagraveo việc mocirc higravenh hoacutea vagrave phacircn tiacutech dữ liệu cho caacutec nhagrave ra quyết định magrave khocircng tập trung vagraveo caacutec xử lyacute thocircng thường Cung cấp cho người dugraveng một khung nhigraven toagraven vẹn đơn giản vagrave đầy đủ về caacutec sự kiện quanh caacutec chủ đề

9 Dữ liệu trong DW được tiacutech hợp Dữ liệu trong kho dữ liệu được xacircy dựng bằng caacutech tổng hợp dữ liệu từ

nhiều nguồn khaacutec nhau vagrave caacutec nguồn coacute tổ chức khaacutec nhau Cơ sở dữ liệu caacutec file excel caacutec flat file hoặc caacutec raw file Khi đưa vagraveo kho dữ liệu caacutec dữ liệu được lagravem sạch vagrave tiacutech hợp dữ liệu nhằm đảm bảo tiacutenh nhất quaacuten của dữ liệu

10Kiến truacutec kho dữ liệu Tầng cơ sở dữ liệu hoạt động Tầng truy xuất thocircng tin Tầng truy xuất dữ liệu Tầng siecircu dữ liệu Tầng quản lyacute tiến trigravenh Tầng thocircng điệp của ứng dụng Tầng vật liacute của kho dữ liệu Tầng trigravenh diễn dữ liệu

11Higravenh trạng kho dữ liệu Kho dữ liệu ảo - người dugraveng cuối coacute thể truy cập trực tiếp đến kho dữ liệu

sử dụng caacutec cocircng cụ cho pheacutep ở tầng truy xuất dữ liệu Kho dữ liệu trung tacircm-1 cơ sở dữ liệu vật lyacute chứa tất cả dữ liệu cho một

vugraveng chuyecircn dụng nagraveo đoacute

Kho dữ liệu phacircn taacuten- Thagravenh phần được phacircn taacuten qua nhiều hệ cơ sở dữ liệu vật lyacute

12METADATA- Siecircu dữ liệu Định nghĩa Siecircu dữ liệu lagrave dữ liệu về dữ liệu Lagrave 1 lưu trữ dugraveng để

Miecircu tả kho dữ liệu tổng thể Nhận dạng kiểu kho dữ liệu Quản liacute quaacute trigravenh tiacutech hợp dữ liệu Quản liacute quaacute trigravenh cập nhật kho dữ liệu Quản liacute bảo mật

Lagrave chigravea khoacutea quyết định sự thagravenh cocircng của kho dữ liệu luocircn được thay đổi vagrave cập nhật theo sự phaacutet triển của kho dữ liệu

Dugraveng để quản liacute điều khiển kho dữ liệu Sự ra đời của kho dữ liệu như 1 cấu truacutec hỗ trợ ra quyết định siecircu dữ liệu

được xem như nguồn tagravei nguyecircn dữ liệu Siecircu dữ liệu lagrave trừu tượng Chuacuteng lagrave dữ liệu bậc cao cung cấp mocirc tả ngắn

gọn caacutec dữ liệu bậc thấp hơn 13Hoạt động của Siecircu dữ liệu

Siecircu dữ liệu rất cần thiết trong việc chuyển hoacutea thocircng tin trở thagravenh tri thức Lagrave chigravea khoacutea giuacutep chuacuteng ta xử lyacute được dữ liệu thocirc Viacute dụ một dograveng dữ liệu baacuten hagraveng 1023 K596 11121 agraveNoacute sẽ khocircng coacute nghĩa gigrave cho đến khi chuacuteng ta đưa vagraveo siecircu dữ liệu (thư

mục chứa dữ liệu) agrave cửa hagraveng 1023 sản phẩm K596 vagrave số tiền baacuten được lagrave 11121 đocirc la

14Sự cần thiết phải nhất quaacuten trong kho dữ liệu Kho dữ liệu được xacircy dựng cho lợi iacutech của những nhagrave phacircn tiacutech kinh

doanh caacutec nhagrave quản trị cho tất cả caacutec khu vực chức năng Trong cơ sở dữ liệu riecircng caacutec khu vực khaacutec nhau coacute thể định nghĩa vagrave lưu

trữ dữ liệu thocircng qua phiecircn bản của chiacutenh noacute Khi dữ liệu được lấy từ những vugraveng khaacutec nhau đoacute vagrave được đặt vagraveo kho dữ

liệu Việc chuyển đổi vagrave lagravem sạch caacutec tiến trigravenh sẽ đảm bảo noacute lagrave duy nhất được tiacutech hợp tại một mức của tổ chức

15Ragrave soaacutet lại dữ liệu ndash Thực thi siecircu dữ liệu

Bất kể cấu truacutec tự nhiecircn của 1 cacircu truy vấn thế nagraveo thigrave caacutec thagravenh phần của siecircu dữ liệu rất quan trọng đối với người ra quyết định

Bảng thuộc tiacutenh khoacutea được lưu trữ bởi kho dữ liệu Tập hợp dữ liệu được lấy từ đacircu Những chuyển đổi nagraveo được thực thi với việc lagravem sạch

16Siecircu dữ liệu lagrave gigrave Metadata - lagrave thocircng tin mocirc tả nội dung của cơ sở dữ liệu (CSDL) Metadata baacuteo cho người dugraveng biết thời gian cập nhật sau cugraveng của dữ liệu

định dạng vagrave mục điacutech sử dụng của noacute Những thocircng tin nagravey coacute thể hướng dẫn người dugraveng duyệt qua CSDL vagrave

giuacutep họ hiểu được yacute nghĩa vagrave ngữ cảnh của dữ liệu Trong CSDL metadata lagrave caacutec dạng biểu diễn khaacutec nhau của caacutec đối tượng

trong CSDL Trong CSDL quan hệ metadata lagrave caacutec định nghĩa của bảng cột CSDL

view vagrave nhiều đối tượng khaacutec Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột

một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi -gtMetadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu

Bảng chuyển đổi Ghi lại những chuyển đổi đatilde được thực hiện

Lịch sử thực thi Ghi lại những dữ liệu đatilde được

phacircn tiacutech

Higravenh thaacutei kết nốiGhi lại những dữ liệu được kết nối vagrave tần suất

17Aacutenh xạ thocircng thường của siecircu dữ liệu Bản ghi aacutenh xạ chuyển đổi bao gồm

Định danh của nguồn gốc Chuyển đổi thuộc tiacutenh Chuyển đổi thuộc tiacutenh vật lyacute Matilde hoacutea tham chiếu bảng chuyển đổi Đổi tecircn Đổi khoacutea Gaacuten giaacute trị cho thuộc tiacutenh mặc định Chọn logic cho caacutec nguồn nhiều giaacute trị Đổi thuật toaacuten

18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để

phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai

lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave

tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec

Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm

Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo

19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua

caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau

SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được

Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra

một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức

Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ

Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ

Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech

CHƯƠNG 11 KHAI PHAacute DỮ LIỆU

1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn

ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993

Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng

2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd

1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều

2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP

3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn

4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng

5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server

6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo

7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động

8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời

9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều

10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện

11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech

12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP

3 Xử lyacute phacircn tiacutech trực tuyến OLAP

MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave

dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu

ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave

thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu

HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave

ROLAP4 Khai phaacute dữ liệu

Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh

khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn

Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan

5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp

6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại

Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp

Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec

Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt

Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra

Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh

vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho

Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec

Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm

Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục

Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng

gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp

Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn

Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec

Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper

Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2

Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25

Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước

Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng

Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện

trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp

Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute

độ hỗ trợ ge ngưỡng minsup

độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan

Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn

Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết

Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu

MOLAP ROLAP HOLAP

Lưu trữ dữ liệu cơ sở

Khối Bảng quan hệ Bảng quan hệ

Lưu trữ thocircng tin tổng hợp

Khối Bảng quan hệ Khối

Hiệu suất thực hiện truy vấn

Nhanh nhất Chậm nhất Nhanh

Tiecircu thụ khocircng gian lưu trữ

Nhiều Thấp Trung bigravenh

Chi phiacute bảo trigrave Cao Thấp Trung bigravenh

Page 9: De cuong(1-11)

Noacute gacircy ra ảnh hưởng mạnh mẽ cograven hơn cả những hoạt động của tổ chức đoacute 10 đặc điểm văn hoacutea của tổ chức

Điều khiển Hệ thống khen thưởng Sự đồng nhất Chịu đựng xung đột Mocirc higravenh giao tiếp Hỗ trợ quản lyacute Sự hogravea nhập Định hướng Chịu đựng rủi ro Caacute nhacircn khởi xướng

Mối quan hệ của văn hoacutea với hiệu năng lagravem việc1 tổ chức thagravenh cocircng phải coacute xu hướng hogravea hợp giữa văn hoacutea với mocirci trường trong vagrave ngoagravei tổ chức

Phugrave hợp trong nội bộ cho thấy một sự kết hợp giữa văn hoacutea của tổ chức với những cocircng nghệ của chiacutenh noacute

Phugrave hợp với becircn ngoagravei cho thấy một nền văn hoacutea phugrave hợp với chiến lược thị trường

Văn hoacutea vagrave sự thay đổi 1 tổ chức magrave khocircng biết thay đổi văn hoacutea sẽ khocircng thể giữ được vị triacute của migravenh trecircn thị trường Caacutec cocircng ty xuất sắc luocircn biết caacutech tiacutech cực tiếp cận khaacutech hagraveng động viecircn đầu tư

17Quyền lực vagrave chiacutenh trịQuyền lực vagrave chiacutenh trị luocircn đi liền với nhau

aQuyền lựclagrave khả năng ảnh hưởng đến việc phacircn phối caacutec nguồn lực trong tổ chứcGồm 5 yếu tố cơ bản

Phacircn quyền Uy quyền Quyền lực caacute nhacircn Sức ảnh hưởng Chiacutenh trị

Một vagravei thagravenh phần của quyền lực ra quyết định Quyết định việc nagraveo coacute sẵn

Quyết định sản phẩm nagraveo được sản xuất Quyết định đầu tư vagraveo đacircu Quyền đặt vagrave quản lyacute quản lyacute giaacute Thanh toaacuten vagrave khấu trừ tiền latildei

bChiacutenh trị Yếu tố cốt lotildei trong quaacute trigravenh higravenh thagravenh chiến lược ra quyết định Chiacutenh trị liecircn quan tới việc ra quyết định thocircng qua đagravem phaacutenảnh hưởngvagrave higravenh

thagravenh sự nhất triacute Trong nhiều trường hợp noacute coacute thể cho ta sự linh hoạt hơn

18Hệ trợ giuacutep quyết định trong tổ chức DSS của 1 tổ chức hỗ trợ cocircng nghệ tập trung vagraveo caacutec quyết định ảnh hưởng tới

rất nhiều người 1 hệ thống DSS hiện đại coacute thể chấp nhận nhiều quyết định vượt qua những giới

hạn phacircn cấp truyền thống aCaacutec hoạt động gần DSS

Giải quyết caacutec nhiệm vụ đặc biệt Thu thập thocircng tin Liecircn lạc qua caacutec chi nhaacutenh Động thaacutei chiacutenh trị

Phacircn loại tư duy chiến lược cho DSS Sắp xếp quyết địnhXếp hạng quyết định sao cho thứ tự đứng trước thigrave được

ưu tiecircn trước Chia sẻ thocircng tinCaacutec quyecirct định coacute thể độc lập nhưng người ra quyết định

phải chia sẻ caacutec thocircng tin liecircn quan Lựa chọn đagravem phaacutenVagravei quyết định coacute thể xaacutec lập thocircng qua đagravem phaacuten vagrave kết

quả được lagravem đồng thờiKhocircng phải cocircng nghệ tự noacute coacute thể đưa ra quyết định magrave noacute nằm ở trigravenh độ cocircng nghệ hỗ trợ caacutec chiến lược quyết định quyền lực vagrave chiacutenh trị cugraveng phối hợp với nhau

Chương 4Mocirc higravenh hoacutea quaacute trigravenh ra quyết định

(Cấu truacutec của hệ HTQD)19Vấn đề Mocirc higravenh

bull Lagrave phần tử chủ chốt trong hầu hết hệ hỗ trợ quyết định vagrave lagrave điều kiện cần trong hệ hỗ trợ quyết định dựa vagraveo mocirc higravenh (model-based DSS)

bull Coacute nhiều lớp mocirc higravenh kegravem theo lagrave caacutec kỹ thuật xử lyacute thao taacutec mocirc higravenh đặc thugrave tương ứng

bull Caacutec vấn đề chiacutenh nhận diện bagravei toaacuten vagrave phacircn tiacutech mocirci trường nhận diện biến số dự baacuteo đa mocirc higravenh caacutec phạm trugrave mocirc higravenh quản lyacute mocirc higravenh vagrave mocirc higravenh hoacutea dựa vagraveo kiến thức

bull Mocirc higravenh hoacutea lagrave taacutec vụ khocircng đơn giản Người xacircy dựng mocirc higravenh phải cacircn bằng giữa tiacutenh đơn giản của mocirc higravenh với caacutec yecircu cầu biểu diễn để mocirc higravenh coacute thể nắm bắt đủ thực tại cần thiết cho người ra quyết định

bull Mocirc phỏng lagrave kỹ thuật mocirc higravenh hoacutea thocircng dụng dugraveng để tigravem hiểu vấn đề tuy khocircng nhất thiết phải tigravem ra được caacutec giải phaacutep biến thể mở rộng quaacute trigravenh ra quyết định của tổ chức vagrave cho pheacutep tổ chức xem xeacutet taacutec độngảnh hưởng của caacutec chọn lựa tương lai

bull Mocirc phỏng tiết kiệm rất nhiều chi phiacute vagrave thời gian ndash rất dễ thay đổi mocirc higravenh hoạt động của một hệ thống vật lyacute bằng mocirc higravenh hoacutea maacutey tiacutenh

bull Mocirc higravenh coacute thể được phaacutet triển vagrave cagravei đặt bằng một số caacutec ngocircn ngữ lập trinh (thế hệ 3 4 ) vagrave hệ thống phần mềm khaacutec nhau

Mocirc higravenh tĩnh vagrave động

bull Mocirc higravenh tĩnh thể hiện bức tranh tại thời điểm của tigravenh huống Caacutec khiacutea cạnh của bagravei toaacuten được xeacutet một thời kỳ nhất định trong một khung thời gian nhất định (coacute thể ldquocuốnrdquo về tương lai) Caacutec tigravenh huống được giả sử lagrave sẽ lập lại với tập caacutec điều kiện đồng nhất

1048713 Giả định coacute được tiacutenh ổn định của dữ liệu 1048713 Mocirc phỏng quaacute trigravenh dạng tĩnh - lagravem việc trecircn caacutec trạng thaacutei ổn định để tigravem ra caacutec

thocircng số tối ưu ndash thường được dugraveng như cocircng cụ chủ yếu để thiết kế quaacute trigravenh 1048713 vd quyết định sản xuấtmua 1 sản phẩm baacuteo caacuteo thu nhập hagraveng quyacutenăm bull Mocirc higravenh động biểu diễn caacutec kịch bản thay đổi theo thời gian 1048713 Phụ thuộc thời gian caacutec trạng thaacutei thay đổi theo thời gian 1048713 Thường dugraveng để tạo sinh vagrave biểu diễn caacutec xu hướng vagrave khuocircn mẫu theo thời gian 1048713 Mocirc phỏng động thể hiện caacutec diễn tiến khi caacutec điều kiện theo thời gian khaacutec với caacutec

trạng thaacutei ổn định ndash thường được dugraveng để thiết kế việc kiểm soaacutet caacutec hệ thống 1048713 VD dự baacuteo lời-lỗ trong 5 năm với caacutec nhập lượng như giaacute phiacute số lượng thay đổi

theo từng năm

Mocirc higravenh chắc chắn tương đối dễ phaacutet triển giải quyết vagrave coacute thể sinh ra caacutec giải phaacutep tối ưu 1048713 Caacutec bagravei toaacuten coacute một số lớnvocirc hạn caacutec giải phaacutep khả thi đặc biệt quan trọng 1048713 Caacutec mocirc higravenh tagravei chaacutenh được xacircy dựng trong điều kiện chắc chắn

Mocirc higravenh bất địnhbằng caacutech thu thập thecircm thocircng tin cố gắng đưa bagravei toaacuten trở về dạng chắc chắn hay dạng

rủi ro Mocirc higravenh rủi ro caacutec quyết định kinh doanh được đưa ra dưới caacutec rủi ro giả định

1048713 Đocirci khi biết được xaacutec suất của caacutec sự kiện xảy ra trong tương lai 1048713 Caacutec trường hợp khaacutec (bất định) ước lượng caacutec rủi ro vagrave giả sử caacutec tigravenh huống rủi ro

xảy ra 20Mocirc higravenh hoacutea

MOcirc HIgraveNH HOacuteA BẰNG BẢNG TIacuteNH bull Bảng tiacutenh phần mềm mạnh linh hoạt vagrave dễ dugraveng cho pheacutep tạo sinh caacutec ứng dụng trong kinh doanh kỹ thuật toaacuten vagrave khoa học với tập caacutec hagravem mạnh về tagravei chaacutenh thống kecirc toaacuten bull Kegravem theo lagrave caacutec thagravenh phần cộng thecircm (add-ins) giuacutep xacircy dựng vagrave giải caacutec lớp mocirc higravenh đặc thugrave bull Lagrave cocircng cụ mocirc higravenh hoacutea thocircng dụng nhất của người dugraveng cuối cugraveng bull Coacute caacutec chức năng về phacircn tiacutech ldquowhat-ifrdquo dograve tigravem mục tiecircu quản lyacute dữ liệu vagrave lập trigravenh (dạng macro) bull Coacute khả năng đọc ghi caacutec cấu truacutec tập tin thocircng dụng để giao tiếp được với caacutec CSDL vagrave cocircng cụ khaacutec bull Coacute thể xacircy dựng mocirc higravenh tĩnh vagrave động bull Dugraveng trecircn maacutey tiacutenh caacute nhacircn vagrave maacutey tiacutenh lớn

bull Cơ sở để xacircy dựng caacutec bảng tiacutenh đa chiều vagrave caacutec cocircng cụ xử lyacute phacircn tiacutech trực tuyến (OLAP) MOcirc HIgraveNH HOacuteA BẰNG PHAcircN TIacuteCH QUYẾT ĐỊNH bull Tiếp cận mocirc higravenh hoacutea caacutec tigravenh huống quyết định coacute một số hữu hạnkhocircng quaacute nhiều caacutec phương aacuten ndash mỗi phương aacuten được trigravenh ra dưới dạng bảng hay đồ thị - caacutec kết quả tương ứng (dự baacuteo được kegravem xaacutec suất) theo mục tiecircu bagravei toaacuten ndash từ đoacute chọn phương aacuten tốt nhất bull Đơn mục tiecircu bảng quyết định hay cacircy quyết định bull Đa mục tiecircu AHP (analytic hierarchy process) khaacutec

MOcirc HIgraveNH HOacuteA BẰNG QUY HOẠCH TOAacuteN

bull Quy hoạch toaacuten học (mathematical programming) lagrave họ caacutec cocircng cụ giải quyết caacutec bagravei toaacuten quản lyacute theo đoacute người ra quyết định phải cấp phaacutet caacutec tagravei nguyecircn khan hiếm cho caacutec hoạt động cạnh tranh nhau (caacutec phương aacuten) nhằm tối ưu hoacutea mục tiecircu coacute khả năng đo lường được bull Caacutec mocirc higravenh quy hoạch tuyến tiacutenh (linear programming) thocircng dụng nhất trong quy hoạch toaacuten coacute nhiều ứng dụng trong thực tế được dugraveng nhiều trong caacutec hệ hỗ trợ quyết định bull Bagravei toaacuten quy hoạch tuyến tiacutenh 1048713 Caacutec biến quyết định (cần tigravem giaacute trị) 1048713 Hagravem mục tiecircu (hagravem toaacuten học dạng tuyến tiacutenh xaacutec định quan hệ giữa biến quyết định vagrave mục tiecircu đo lường mức độ đạt đạt mục tiecircu vagrave cần được tối ưu hoacutea) 1048713 Caacutec hệ số của hagravem mục tiecircu (cho biết mức đoacuteng goacutep vagraveo mục tiecircu của 1 đơn vị biến quyết định) 1048713 Ragraveng buộc (biểu thức tuyến tiacutenh cho biết giới hạn tagravei nguyecircn vagravehay caacutec quan hệ giữa caacutec biến số) 1048713 Dung lượng (mocirc tả cận trecircn vagrave dưới của caacutec biến vagrave ragraveng buộc) 1048713 Hệ số (cocircng nghệ) vagraveo-ra (cho biết mức độ sử dụng tagravei nguyecircn của biến quyết định) bull Đặc điểm của bagravei toaacuten quy hoạch tuyến tiacutenh 1048713 Tagravei nguyecircn kinh tế của bagravei toaacuten lagrave coacute hạn vagrave sẵn sagraveng 1048713 Coacute nhiều caacutech (gt2 caacutech) sử dụng tagravei nguyecircn được gọi lagrave giải phaacutep hay chương trigravenh 1048713 Mỗi hoạt động dugraveng tagravei nguyecircn đều sinh ra kết quả dưới dạng mục tiecircu đatilde phaacutet biểu trước 1048713 Việc cấp phaacutet nằm trong caacutec ragraveng buộc cho trước bull Giả định của bagravei toaacuten quy hoạch tuyến tiacutenh 1048713 Caacutec kết quả của caacutec cấp phaacutet coacute thể đem so saacutenh với nhau coacute thể đo lường bằng một đơn vị chung

1048713 Caacutec cấp phaacutet độc lập với nhau về mặt kết quả 1048713 Kết quả cuối cugraveng lagrave tổng của caacutec kết quả từ caacutec hoạt động riecircng rẽ khaacutec nhau 1048713 Dữ liệu coacute tiacutenh chắc chắn 1048713 Tagravei nguyecircn được dugraveng một caacutech kinh tế nhất 1048713 Thường coacute một số lớn caacutec giải phaacutep với kết quả khaacutec nhau 1048713 Trong số caacutec giải phaacutep coacute thể coacute 1 giải phaacutep tốt nhất ndash mức độ đạt được mục tiecircu cao nhất ndash gọi lagrave giải phaacutep tối ưu được tigravem ra bằng một giải thuật đặc biệt MOcirc HIgraveNH HOacuteA BẰNG HEURISTIC bull Việc tigravem giải phaacutep tối ưu của một số bagravei toaacuten quyết định phức tạp coacute thể tốn nhiều thời gian chi phiacute hay khocircng thể tigravem ra được Cograven nếu dugraveng tiếp cận mocirc phỏng cũng coacute thể keacuteo dagravei phức tạp khocircng thiacutech hợp hay thậm chiacute khocircng chiacutenh xaacutec

bull Lagrave một tiếp cận giuacutep tigravem ra caacutec giải phaacutep khả thithỏa matildenđủ tốt cho caacutec bagravei toaacuten phức tạp Coacute thể coacute giải phaacutep đủ tốt (90-999 giaacute trị của lời giải tối ưu) nhanh choacuteng vagrave đỡ tốn keacutem hơn bằng caacutech dugraveng heuristics bull Quaacute trigravenh heuristic lagrave datildey caacutec bước xacircy dựng caacutec quy luật giải quyết vấn đề thocircng qua việc tigravem kiếm caacutec con đường hứa hẹn nhất dẫn đến lời giải tigravem kiếm caacutech thức thu thập vagrave phacircn giải thocircng tin theo quaacute trigravenh giải vagrave phaacutet triền caacutec phương phaacutep dẫn đến một giải thuật tiacutenh toaacuten hay một lời giải tổng quaacutet đatilde coacute bull Aacutep dụng chủ yếu cho bagravei toaacuten cấu truacutec yếu cũng dugraveng để tigravem ra giải phaacutep chấp nhận được cho bagravei toaacuten cấu truacutec chặt bull Khocircng đủ tổng quaacutet như caacutec giải thuật thường chỉ dugraveng cho tigravenh huống đặc thugrave đang xeacutet bull Coacute thể dẫn đến một giải phaacutep dở - caacutec thủ tục từng bước giải quyết vấn đề khocircng đảm bảo tigravem ra giải phaacutep tối ưu bull Heuristic coacute thể lagrave định lượng vigrave vậy coacute thể đoacuteng vai trograve quan trọng trong cơ sở mocirc higravenh của hệ hỗ trợ quyết định bull Heuristic coacute thể lagrave định tiacutenh vigrave vậy coacute thể đoacuteng vai trograve quan trọng trong cung ứng kiến thức cho hệ chuyecircn gia bull Quaacute trigravenh heuristic liecircn quan đến tigravem kiếm học tập ước lượng phacircn xử vagrave lặp lại caacutec hoạt động nagravey dọc theo tiến trigravenh bull Kiến thức thu được dugrave thagravenh cocircng hay thất bại trong quaacute trigravenh đều được phản hồi vagrave sửa đổi chiacutenh quaacute trigravenh nhờ đoacute coacute thể định nghĩa lại mục tiecircu hay bagravei toaacuten 1048713 Giải thuật di truyền bắt đầu bằng tập caacutec giải phaacutep được sinh ngẫu nhiecircn taacutei kết hợp caacutec cặp giải phaacutep một caacutech ngẫu nhiecircn bull Tigravenh huống necircn dugraveng heuristics 1048713 Dữ liệu đầu vagraveo khocircng chiacutenh xaacutec hay coacute giới hạn 1048713 Thực tế quaacute phức tạp đến nỗi khocircng dugraveng được caacutec mocirc higravenh tối ưu 1048713 Chưa coacute được giải thuật chiacutenh xaacutec vagrave đủ tin cậy 1048713 Bagravei toaacuten phức tạp necircn sẽ khocircng kinh tế nếu dugraveng tối ưu hay mocirc phỏng hoặc tốn quaacute nhiều thời gian tiacutenh toaacuten 1048713 Coacute thể cải thiện tiacutenh hiệu quả của quaacute trigravenh tối ưu (tức coacute thể sinh ra caacutec giải phaacutep ban đầu tương đối tốt) 1048713 Liecircn quan đến xử lyacute kyacute hiệu chứ khocircng phải xử lyacute kyacute số (như hệ chuyecircn gia) 1048713 Cần coacute quyết định nhanh vagrave caacutec xử lyacute dựa vagraveo maacutey tiacutenh đều khocircng khả thi (một số heuristic khocircng cần đến maacutey tiacutenh) bull Thuận lợi 1048713 Dễ hiểu dễ giải thiacutech vagrave dễ cagravei đặt 1048713 Nacircng cao tiacutenh saacuteng tạo vagrave năng lực heuristic cho caacutec vấn đề khaacutec 1048713 Tiết kiệm thời gian xaacutec lập vấn đề 1048713 Tiết kiệm yecircu cầu về bộ chứa vagrave xử lyacute maacutey tiacutenh

1048713 Tiết kiệm thời gian tiacutenh toaacuten vagrave do vậy tiết kiệm thời gian thực trong ra quyết định Một số vấn đề phức tạp đến nỗi chỉ coacute thể giải được bằng heuristics 1048713 Thường sinh ra nhiều giải phaacutep chấp nhận được 1048713 Thường coacute thể phaacutet biểu lyacute thuyết hay đo lường thực nghiệm về chất lượng của giải phaacutep (tức giaacute trị mục tiecircu của giải phaacutep gần với giaacute trị tồi ưu đến mức nagraveo dugrave giaacute trị tối ưu chưa biết được) 1048713 Coacute thể kết hợp tiacutenh thocircng minh vagraveo để hướng dẫn pheacutep tigravem kiếm (tigravem kiếm tabu) Năng lực thocircng minh đoacute coacute thể lagrave đặc thugrave theo bagravei toaacuten hoặc dựa trecircn yacute kiến chuyecircn gia được cấy trong hệ chuyecircn gia hoặc cơ chế tigravem kiếm 1048713 Coacute thể dugraveng heuristic hiệu quả vagraveo caacutec mocirc higravenh coacute thể giải bằng quy hoạch toaacuten học Đocirci khi heuristic lagrave phương phaacutep được ưa thiacutech hơn khi khaacutec giải phaacutep heuristics được dugraveng như giải phaacutep ban đầu cho caacutec phương phaacutep quy hoạch toaacuten học bull Hạn chế 1048713 Khocircng đảm bảo coacute được giải phaacutep tối ưu 1048713 Caacutec quy luật coacute rất nhiều ngoại lệ 1048713 Caacutec lựa chọn quyết định tuần tự coacute thể khocircng tiecircn đoaacuten được caacutec kết cục tương lai của mỗi chọn lựa 1048713 Sự liecircn thuộc giữa caacutec phần trong hệ thống đocirci khi coacute thể gacircy ra caacutec ảnh hưởng lớn lao lecircn toagraven hệ thống bull Phacircn loại caacutec giải thuật heuristic 1048713 Heuristic xacircy dựng xacircy dựng giải phaacutep khả thi bằng caacutech cộng thecircm từng thagravenh phần một VD bagravei toaacuten người baacuten hagraveng ndash luocircn gheacute thagravenh phố chưa viếng thăm kế tiếp gần nhất

1048713 Heuristic cải tiến bắt đầu bằng một giải phaacutep khả thi vagrave cố gắng cải tiến liecircn tục trecircn đoacute VD trecircn thử hoaacuten đổi 2 thagravenh phố 1048713 Quy hoạch toaacuten aacutep dụng vagraveo caacutec mocirc higravenh chứa iacutet ragraveng buộc nhằm coacute được thocircng tin về thỏa hiệp tốt nhất với mocirc higravenh nguyecircn gốc Thường được dugraveng trong tối ưu hoacutea nguyecircn (integer optimization) 1048713 Chia giai đoạn giải quyết một vấn đề theo từng giai đoạn VD ở PampG trecircn đacircy bagravei toaacuten phacircn phối được giải quyết trước sau đoacute dugraveng giải quyết bagravei toaacuten chiến lược sản phẩm 1048713 Phacircn ratilde chia bagravei toaacuten thagravenh caacutec phần nhỏ hơn coacute thể giải quyết được sau đoacute kết hợp caacutec giải phaacutep đoacute lại VD chia latildenh thổ baacuten hagraveng thagravenh 4 vugraveng khaacutec nhau giải quyết cho từng vugraveng sau đoacute kết nối caacutec giải phaacutep

21Mocirc phỏngbull Giả định caacutec đặc điểm của thực tạibull Lagrave kỹ thuật tiến triển caacutec thực nghiệm (như phacircn tiacutech ldquowhat-ifrdquo) - bằng maacutey tiacutenh -trecircn một mocirc higravenh của hệ thocircng tin quản lyacute

bull Khocircng thực sự lagrave một mocirc higravenh vigrave khocircng biểu diễn thực tại magrave lagrave cố gắng bắtchước thực tạibull Một trong những phương phaacutep thocircng dụng nhất trong HHTQĐbull HHTQĐ lagravem việc với caacutec bagravei toaacuten phi cấu truacutec vagrave cấu truacutec yếu tigravenh huống thực tếphức tạp ndash khocircng dễ biểu diễn bằng mocirc higravenh tối ưu hay caacutec dạng mocirc higravenh khaacutecnhưng lại thường coacute thể xử lyacute được bằng mocirc phỏngbull Đặc điểm1048713 Iacutet đưa ra caacutec đơn giản hoacutea về thực tại hơn caacutec mocirc higravenh khaacutec1048713 Do triển khai caacutec thực nghiệm necircn noacute coacute thể kiểm thử caacutec giaacute trị cụ thể của caacutecbiến quyết địnhbiến khocircng kiểm soaacutet được của mocirc higravenh vagrave xem xeacutet ảnh hưởnglecircn caacutec biến kết quả1048713 Phương phaacutep coacute tiacutenh mocirc tả (như vậy khaacutec với phương phaacutep danh định)1048713 Khocircng tự động tigravem kiếm giải phaacutep tối ưu ndash noacute mocirc tảtiecircn đoaacuten caacutec đặc tiacutenh của hệthống đatilde cho dưới caacutec điều kiện khaacutec nhau từ đoacute coacute thể chọn ra phương aacuten tốtnhất1048713 Quaacute trigravenh mocirc phỏng thường lặp lại một thực nghiệm nhiều lần để coacute được ướclượng về hiệu ứng tổng quaacutet của một số hagravenh động nhất định1048713 Mocirc phỏng maacutey tiacutenh thiacutech hợp cho hầu hết caacutec tigravenh huống mặc dugrave cũng coacute một sốmocirc phỏng thủ cocircng thagravenh cocircng1048713 Thường chỉ được dugraveng khi bagravei toaacuten quaacute phức tạp khocircng thể xem xeacutet bằng caacutec kỹthuật tối ưu dạng số Tiacutenh phức tạp theo nghĩa bagravei toaacuten khocircng thể cocircng thức hoacuteacho tối ưu (do khocircng thotildea caacutec giả định) hoặc cocircng thức quaacute lớn quaacute nhiều tươngtaacutec giữa caacutec biến hoặc về bản chất bagravei toaacuten lagrave bất định hay rủi roPhương phaacutep mocirc phỏng thiết lập mocirc higravenh của hệ thống thực vagrave tiến hagravenh caacutec thựcnghiệm lặp lại trecircn mocirc higravenh

bull Thuận lợi1048713 Lyacute thuyết tương đối trực tiếp hiệu ứng dagravei hạn của nhiều chiacutenh saacutech -gt neacuten thờigian lớn1048713 Do tiacutenh chất mocirc tả (khaacutec với danh định)1048713 Coacute thể thấy được nhanh choacuteng coacute thể đặt ra caacutec cacircu hỏi ldquowhat-ifrdquo coacute thể dugravengtiếp cận thử-vagrave-sai vagraveo giải quyết vấn đề một caacutech nhanh choacuteng rẻ chiacutenh xaacutec iacutetrủi ro hơn1048713 Thử nghiệm được biến quyết định phần nagraveo của mocirci trường thực sự quan trọngvới caacutec phương aacuten khaacutec nhau1048713 Yecircu cầu kiến thức riecircng biệt về bagravei toaacuten vigrave thế buộc người xacircy dựng mocirc higravenh phảilagravem việc thường xuyecircn với nhagrave quản lyacute ndash đối tượng mong muốn của HHTQĐ để

từ đoacute bản chất bagravei toaacuten vagrave caacutec quyết định được hiểu tốt hơn1048713 Mocirc higravenh được xacircy dựng từ viễn cảnhcaacutech nhigraven của nhagrave quản lyacute1048713 Mocirc higravenh chỉ cho một bagravei toaacuten riecircng biệt thường khocircng thể dugraveng giải caacutec bagravei toaacutenkhaacutec Như vậy mỗi thagravenh phần của mocirc higravenh ứng với một phần của hệ thống thựcdo đoacute sẽ khocircng yecircu cầu nhagrave quản lyacute phải tổng quaacutet hoacutea caacutec hiểu biết của migravenh1048713 Phổ bagravei toaacuten giải được rất rộng tồn kho nhacircn sự hoạch định chiến lược 1048713 Coacute thể chứa caacutec phức tạp thực sự của bagravei toaacuten khocircng cần caacutec đơn giản hoacutea (TDdugraveng caacutec phacircn phối xaacutec suất thực thay vigrave phacircn phối lyacute thuyết xấp xỉ)1048713 Coacute thể tự động sinh ra nhiều đo lường hiệu năng quan trọng1048713 Thường lagrave phương phaacutep duy nhất của HHTQĐ coacute thể xử lyacute caacutec bagravei toaacuten tương đốiphi cấu truacutec1048713 Coacute một số caacutec goacutei phần mềm mocirc phỏng (Monte Carlo) tương đối dễ dugravengbull Điểm yếu1048713 Tuy thường tigravem được caacutec phương aacuten đủ tốt nhưng khocircng đảm bảo lời giải tối ưu1048713 Quaacute trigravenh xacircy dựng mocirc higravenh thường dagravei vagrave tốn keacutem1048713 Giải phaacutep vagrave suy diễn từ nghiecircn cứu mocirc phỏng thường khocircng thể chuyển sang bagraveitoaacuten khaacutec vigrave mocirc higravenh kết hợp caacutec yếu tố đặc thugrave1048713 Đocirci khi do mocirc higravenh quaacute dễ giải thiacutech cho nhagrave quản lyacute necircn caacutec phương phaacutep phacircntiacutech thường xem nhẹ1048713 Phần mềm mocirc phỏng đocirci khi yecircu cầu caacutec kỹ năng đặc biệt do độ phức tạp củaphương phaacutep giải higravenh thứcbull Caacutec loại mocirc phỏng1048713 Mocirc phỏng xaacutec suất một hay nhiều biến độc lập mang tiacutenh xaacutec suất với 2 loạiphacircn phối ndash thường dugraveng kỹ thuật Monte Carlo1048713 Phacircn phối rời rạc tigravenh huống coacute một số giới hạn caacutec biến cố (biến) với hữu hạncaacutec giaacute trị cho mỗi biến cố (biến)1048713 Phacircn phối liecircn tục tigravenh huống coacute số lượng khocircng giới hạn caacutec biến cố tuacircn theocaacutec hagravem mật độ xaacutec suất như phacircn phối chuẩn1048713 Mocirc phỏng độc lậpphụ thuộc theo thời gian1048713 Độc lập khocircng cần thiết phải biết chiacutenh xaacutec thời điểm xảy ra biến cố (nhu cầutiecircu thụ lượng sản phẩm trong ngagravey khocircng biết chiacutenh xaacutec thời điểm tiecircu thụ)1048713 Phụ thuộc cần biết chiacutenh xaacutec thời điểm xảy ra sự kiện (bagravei toaacuten hagraveng đợi)1048713 Mocirc phỏng tương taacutec trực quan1048713 Mocirc phỏng hướng đối tượng dugraveng tiếp cận hướng đối tượng để xacircy dựng mocirc higravenhmocirc phỏng Chuacute yacute ngocircn ngữ mocirc higravenh hoacutea nhất thể UML (unified modelinglanguage) kể cả khi mocirc phỏng caacutec hệ thời gian thựcMOcirc HIgraveNH HOacuteA ĐA CHIỀU ndash XỬ LYacute PHAcircN TIacuteCH TRỰC TUYẾNbull Người ra quyết định thường phải xem xeacutet nhiều chiều của dữ liệu (TD caacutec chiềucủa dữ liệu baacuten hagraveng lagrave sản phẩm vugraveng thời gian người baacuten ) dữ liệu cần đượcphacircn tiacutech trực tiếp bằng caacutec cocircng cụ chuẩn hay phacircn tiacutech tự động bằng caacutec

phương phaacutep khai mỏ dữ liệu (data mining)bull Hầu hết caacutec hệ thống phacircn tiacutech đa chiều được nhuacuteng trong caacutec hệ xử lyacute phacircn tiacutechtrực tuyến (HXLPTTT ndash online analytic processing - OLAP)bull Mục tiecircu của XLPTTT nắm bắt cấu truacutec của dữ liệu thực để hỗ trợ ra quyết địnhbull Trong HHTQĐ coacute sự gắn nối tự nhiecircn giữa mocirc higravenh hoacutea dữ liệu mocirc higravenh hoacutea kyacutehiệu vagrave caacutec khiacutea cạnh của phacircn tiacutech ldquowhat-ifrdquobull Caacutec baacuteo caacuteo của HXLPTTT đều coacute tiacutenh tương taacutec dễ khai thaacutec sử dụng đặc biệtphugrave hợp cho caacutec baacuteo caacuteo về chỉ số hiệu năng chủ yếu (key performance indicators- KPI) baacuteo caacuteo về đo lường hiệu năng kinh doanh bull Thế hệ hiện tại của HXLPTTT vagrave hệ khai mỏ dữ liệu (data mining) tiacutech hợp caacutecđặc tiacutenh của hệ thocircng tin latildenh đạo (executive information system ndashEIS- nhiềucaacutech nhigraven dữ liệu chi tiết hoacutea theo nhu cầu) vagrave caacutec hệ đồ họa khaacutec ndash thường coacutegiao diện người dugraveng dạng kiểu WEBbull Caacutec hệ thống như trecircn cograven được gọi lagrave caacutec cocircng cụ triacute tuệ kinh doanh (businessintelligence - BI) vigrave coacute caacutec đặc trưng về mocirc higravenh hoacutea vagrave tối ưu hoacutea nhưng lạitrong suốt đối với ngươigrave dugravengbull Hiện caacutec cocircng cụ được đưa ra bởi caacutec nhagrave cung cấp về CSDL về hoạch định tagraveinguyecircn tổ chức (ERP) về nhagrave kho dữ liệu (data warehouse) về HXLPTTT MOcirc HIgraveNH HOacuteA VAgrave MOcirc PHỎNG TƯƠNG TAacuteC TRỰC QUANbull Iacutech lợi Người ra quyết định tham gia vagraveo quaacute trigravenh phaacutet triển mocirc higravenh vagrave thựcnghiệm mocirc phỏng vigrave vậy sẽ tin tưởng khi sử dụng mocirc higravenhbull Mocirc higravenh hoacutea tương taacutec trực quan (visual interactive modeling - VIM) dugraveng caacutecbiểu diễn đồ họa maacutey tiacutenh để trigravenh bagravey caacutec ảnh hưởng của caacutec quyết định quản lyacutekhaacutec nhau ở một thời điểm (tĩnh) hay tiến triển theo thời gian (động với kỹ thuậthoạt higravenh)bull Mocirc phỏng tương taacutec trực quan (visual interactive simulation - VIS) cho pheacutepngười dugraveng theo dotildei tiến trigravenh xacircy dựng vagrave sử dụng khai thaacutec mocirc higravenh mocirc phỏngdưới dạng hoạt higravenhbull Mocirc higravenh hoacutea tương taacutec trực quan coacute thể kết hợp với tiếp cận triacute tuệ nhacircn tạo đểđưa ra caacutec khả năng mới thay đổi từ xacircy dựng hệ thống dạng đồ họa đến tigravem hiểuvề động học của hệ thốngbull Cần đến caacutec hệ thống maacutey tiacutenh xử lyacute song song tốc độ cao để xacircy dựng caacutec mocircphỏng - phức tạp quy mocirc lớn dạng hoạt higravenh - mang tiacutenh khả thi ở thời gian thực

22Caacutec dạng hệ thống hỗ trợ ra quyết địnhHệ hỗ trợ quyết định nhoacutemRa quyết định nhoacutem giao tiếp vagrave cộng taacutec- Caacutec đặc điểm của cocircng việc nhoacutem+ Một nhoacutem thực hiện một nhiệm vụ thỉnh thoảng ra quyết định thỉnh thoảngkhocircng ra quyết định+ Caacutec thagravenh viecircn trong nhoacutem coacute thể ở những nơi khaacutec nhau

+ Caacutec thagravenh viecircn trong nhoacutem coacute thể lagravem việc ở những thời gian khaacutec nhau+ Caacutec thagravenh viecircn trong nhoacutem coacute thể lagravem việc cugraveng nhau hoặc ở caacutec tổ chức khaacutecnhau+ Nhoacutem coacute thể vĩnh viễn hoặc tạm thời+ Nhoacutem coacute thể ở bất kỳ mức quản lyacute nagraveo hoặc mức thời gian nagraveo+ Coacute sự điều phối (quaacute trigravenh vagrave nhiệm vụ đạt được) hoặc macircu thuẩn trongnhoacutem+ Coacute sự đạt được hoặcvagrave mất maacutet năng suất trong tổ chức+ Nhiệm vụ phải hoagraven thagravenh rất nhanh+ Khocircng thể hoặc quaacute đắt cho tất cả caacutec thagravenh viecircn trong nhoacutem cugraveng hợp ở mộtnơi+ Một số dữ liệu thocircng tin hoặc kiến thức cần thiết nằm ở nhiều nơi một sốkhaacutec ở ngoagravei tổ chức+ Chuyecircn mocircn của caacutec thagravenh viecircn khocircng coacute trong nhoacutem lagrave cần thiết- Caacutec hoạt động vagrave caacutec quaacute trigravenh miecircu tả caacutec cuộc họp+ Cuộc họp lagrave hoạt động chung liecircn quan bởi một nhoacutem người coacute địa vị bằngnhau hoặc gần bằng nhau+ Kết quả của cuộc họp phụ thuộc một phần vagraveo kiến thức yacute kiến caacutec đaacutenh giaacutecủa caacutec thagravenh viecircn+ Kết quả của cuộc họp cũng phụ thuộc vagraveo sự kết hợp của nhoacutem vagrave phụ thuộcvagraveo quaacute trigravenh ra quyết định được sử dụng bởi nhoacutem đoacute+ Giải quyết caacutec yacute kiến khaacutec nhau bởi người coacute quyền hạn hoặc thương lượnghoặc phacircn xửHỗ trợ giao tiếp- Giao tiếp lagrave thagravenh phần quan trọng cho hỗ trợ quyết định Khocircng coacute giao tiếp thigravekhocircng coacute cộng taacutec Những người ra quyết định caacute nhacircn phải giao tiếp với caacutecđồng nghiệp chuyecircn gia cơ quan chiacutenh phủ khaacutech hagraveng đối taacutec kinh doanh hellipHọ cũng cần dữ liệu vagrave thocircng tin (vagrave kiến thức) từ nhiều nơi trecircn thế giới Caacutecnhoacutem ra quyết định phải giao tiếp cộng taacutec vagrave thương lượng trong cocircng việcHầu hết caacutec tổ chức sẽ nhanh trở thagravenh khocircng coacute chức năng nếu khocircng coacute caacutec hệthống giao tiếp Thương mại điện tử coacute thể hiệu quả chỉ qua caacutec kỹ thuật giao tiếphiện đại- Caacutec kỹ thuật thocircng tin hiện đại cung cấp caacutec phương tiện hỗ trợ giao tiếp rẻnhanh coacute khả năng coacute thể tin cậy Nền tảng hỗ trợ giao tiếp lagrave caacutec hệ thống maacuteytiacutenh mạng+ Bắt đầu bằng điện baacuteo điện thoại radio vagrave ti vi+ Trong 100 năm chuacuteng ta phaacutet triển maacutey fax thư điện tử chương trigravenh chatnhoacutem tin tức hệ thống hội nghị truyền higravenh Hầu hết caacutec kỹ thuật nagravey đềuhoạt động trecircn internet+ Sự phaacutet triển giao tiếp sau cugraveng lagrave hệ thống họp điện tử caacutec dịch vụ vagrave hệ

thống hội nghị điện tử thường sử dụng internet để kết nối caacutec người ra quyếtđịnh- Caacutec thuận lợi aacutep dụng caacutec phương phaacutep giao tiếp cải tiến trong caacutec tổ chức+ Cải tiến năng suất của nhacircn viecircn+ Liecircn quan đến nhiều người ra quyết định chiacutenh+ Khocircng quan tacircm nhiều đến đường biecircn giới địa lyacute+ Tạo nền văn hoacutea hợp taacutec nhất quaacuten+ Cải tiến chất lượng cuộc sống của nhacircn viecircnHỗ trợ cộng taacutec Maacutey tiacutenh hỗ trợ cộng taacutec- Khung thời giannơi chốn+ Sự hiệu quả của kỹ thuật tiacutenh toaacuten cộng taacutec phụ thuộc vagraveo vị triacute của caacutec thagravenhviecircn trong nhoacutem vagrave phụ thuộc vagraveo thời gian chia sẽ thocircng tin gởi vagrave nhận+ Chia sự giao tiếp thagravenh bốn ocirc vagrave tổ chức bốn ocirc dọc theo 2 chiều thời gian vagravenơi chốn1048713 Thời gian Khi gởi vagrave nhận thocircng tin hầu như đồng thời giao tiếp lagrave đồngthời Viacute dụ Điện thoại ti vi vagrave caacutec cuộc họp gặp mặt nhau Giao tiếp bấtđồng bộ xảy ra khi người nhận nhận thocircng tin ở thời điểm khaacutec thời điểmgởi thocircng tin đoacute1048713 Nơi chốn Người gởi vagrave người nhận coacute thể ở cugraveng phograveng hoặc khocircng+ Bốn ocirc lagrave1048713 Cugraveng thời giancugraveng nơi chốn Caacutec thagravenh viecircn gặp mặt nhau cugraveng một luacutecgiống như phograveng quyết định hoặc gặp mặt truyền thống1048713 Cugraveng thời giankhaacutec nơi chốn Caacutec thagravenh viecircn ở caacutec nơi khaacutec nhau nhưnggiao tiếp cugraveng nhau Viacute dụ hội nghị truyền higravenh (videoconferencing)1048713 Khaacutec thời giancugraveng nơi chốn Nhiều người lagravem việc theo ca Ca nagravey để lạithocircng tin cho ca khaacutec1048713 Khaacutec thời giankhaacutec nơi chốn Caacutec thagravenh viecircn ở caacutec nơi khaacutec nhau Caacutecthagravenh viecircn nagravey gởi vagrave nhận thocircng tin ở những lần khaacutec nhau

23Thực thi hệ DSSHệ thống hỗ trợ quản lyacute (MSS) khocircng phải luacutec nagraveo cũng luocircn thagravenh cocircng Nhiều trường hợpthất bại của ES khocircng hoagraven toagraven lagrave lyacute do kỹ thuật Thực thi hệ thống lagrave một quaacute trigravenh liecircn tụcnhằm đảm bảo cho tổ chức chuẩn bị tiếp nhận một hệ thống mới vagrave đưa hệ thống vagraveo sử dụngthagravenh cocircngThực hiện cocircng nghệ hệ thống hỗ trợ quản lyacute lagrave việc phức tạp vigrave caacutec hệ thống nagravey khocircng đơnthuần lagrave hệ thống thocircng tin chỉ thu thập thao taacutec vagrave phacircn phối thocircng tin Magrave xa hơn chuacuteng

liecircn quan tới caacutec cocircng việc coacute thể lagravem thay đổi đaacuteng kể caacutech thức hoạt động của tổ chức Tuyvậy đa số caacutec yếu tố thực thi đều liecircn quan tới hệ thống thocircng tinThực thi MSS lagrave quaacute trigravenh liecircn tục diễn ra trong suốt thời gian phaacutet triển hệ thống từ đề xuấtban đầu đến nghiecircn cứu khả thi thiết kế vagrave phacircn tiacutech hệ thống lập trigravenh huấn luyện chuyểnđổi vagrave lắp đặt Caacutec chuyecircn gia hệ thống thocircng tin thường gọi thực thi lagrave giai đoạn cuối trongvograveng đời hệ thống Định nghĩa thực thi MSS phức tạp hơn vigrave bản chất lặp của sự phaacutet triểncaacutec hệ thống

THỰC THI KHOcircNG HOAgraveN CHỈNHCaacutec quyết định về tiacutenh khả thi thường coacute giả định về lợi iacutech đạt được khi kế hoạch thực thiđược thực hiện hoagraven toagraven Trong thực tế thường chỉ thực hiện 90 thậm chiacute 70 phần trăm sovới phacircn tiacutech khả thi Lyacute do lagrave sự thay đổi tại một nơi trong hệ thống coacute thể ảnh hưởng vagrave coacutethể taacutec động tiecircu cực đến chỗ khaacutec Do vậy cấp quản lyacute coacute thể bỏ những phần trong dự aacuten coacutethể gacircy ra taacutec động xấu Do đoacute dự aacuten sẽ thực hiện iacutet hơn 100 so với dự aacuten kế hoạch Caacutec lyacutedo khaacutec coacute thể lagrave do khấu trừ ngacircn saacutech hoặc vượt chi phiacuteĐAacuteNH GIAacute SỰ THAgraveNH COcircNG CỦA THỰC THI HỆ THỐNGPhải coacute caacutec chỉ số đo lường thigrave mới coacute thể đaacutenh giaacute sự thagravenh cocircng khi thực thi một hệ thốngDickson va Powers (1973) đề ra 5 tiecircu chuẩn độc lậpbull Tỷ lệ thời gian thực hiện dự aacuten với thời gian ước lượngbull Tỷ lệ chi phiacute thực tế vagrave ngacircn saacutech thực hiệnbull Thaacutei độ của cấp quản lyacute đối với hệ thốngbull Nhu cầu thocircng tin của caacutec nhagrave quản lyacute được đaacutep ứng như thế nagraveo qua hệ thốngbull Taacutec động của dự aacuten đối với những hoạt động maacutey tiacutenh trong cocircng tyCaacutec đo lường khaacutec để đaacutenh giaacute thagravenh cocircng của hệ hỗ trợ quản lyacute (MSS)bull Sự sử dụng hệ thống (dự định dugraveng hoặc thực sự dugraveng)bull Thỏa matilden của người dugravengbull Thaacutei độ taacuten thagravenhbull Mức độ hệ thống hoagraven thagravenh caacutec mục tiecircu ban đầubull Phần thưởng đối với tổ chức (giảm chi phiacute tăng doanh thuhellip)bull Tỷ số lợi iacutech chi phiacute

bull Mức độ thể chế hoacutea của MSS trong tổ chứcDo bởi tiacutenh đa dạng của DSS necircn việc đaacutenh giaacute sự thagravenh cocircng của hệ nagravey cũng khoacute khăn tuynhiecircn cũng coacute thể coacute một số yếu tố giuacutep cho DSS thagravenh cocircng như sự tham gia người dugravenghuấn luyện người dugraveng hỗ trợ quản lyacute cấp cao nguồn thocircng tin đặc điểm của những nhiệmvụ coacute liecircn quan (cấu truacutec bất định độ khoacute phụ thuộc)

Chương5Nhoacutem hỗ trợ quyết định vagrave nhoacutemcocircng nghệ phần mềm

51Nhoacutem tạo quyết định

MDM-Holsapple đatilde gợi yacute chuacuteng ta sử dụng giới hạn người tạo quyết định

Một nhoacutem lagrave kết cấu MDM nơi magrave nhiều người ra quyết định hoagraven toagraven tương taacutec

Một đội lagrave kết cấu MDM nơi caacutec thagravenh viecircn tư vấn cho người đưa ra quyết định nhưng khocircng tương taacutec

Một Ủy ban lagrave kết cấu MDM với một người tạo quyết định duy nhất vagrave sự tương taacutec giữa caacutec thagravenh viecircn

Mạng thocircng tin

Mạng lưới baacutenh xe mỗi người tham gia coacute thể giao tiếp với người đưa ra quyết định ở trung tacircm nhưng khocircng phải với người tham gia khaacutecCấu truacutec nagravey lagrave khocircng thỏa matilden tất cả những người tham gia ngoại trừ người ra quyết định

Mạng dacircy chuyền Tham gia chuyển tiếp thocircng tin chỉ để noacute luocircn liền kề nhau trong chuỗi

Thagravenh viecircn cuối cugraveng ko được đaacutep ứng

Mạng vograveng trograven Tương tự như chuỗi nhưng kết thuacutec được kết nối

Mạng kết nối hoagraven toagraven khocircng coacute hạn chế về giao tiếp vagrave tương taacutec giữa caacutec thagravenh viecircnNoacutei chungnoacute đaacutep ứng hầu hết caacutec kết nối của người tham gia nhưng truyền đạt thocircng tin mất nhiều thời gian vagrave coacute nhiều cơ hội xảy ra lỗi

Nhoacutem hagravenh vi vagrave chuẩn mực

MDMs thiết lập caacutec chỉ tiecircu hướng dẫn quaacute trigravenh ra quyết định

Một chuẩn mực quy định cụ thể những gigrave thagravenh viecircn trong nhoacutem dự kiến sẽ lagravem trong những hoagraven cảnh nhất định

Quy tắc gửi coacute thể được thocircng qua viacute dụ đaacutenh giaacute ngang hagraveng hoặc xử phạt

Lagravem thế nagraveo để đưa ra quyết định

Việc chọn lựa magrave trong đoacute việc sử dụng cấu truacutec MDM phải được dựa trecircn một số yếu tố liecircn quan với bối cảnh quyết định

Viacute dụmột cấu truacutec riecircng lẻ sẽ lagravem việc nơi magrave quyết định được cấu truacutec cao vagrave thocircng tin lagrave coacute sẵn

Một ủy ban cơ cấu sẽ lagrave sự lựa chọn khi người ra quyết định khocircng thể đưa ra quyết định một migravenh

52Caacutec vấn đề thường gặp trong nhoacutem

Kiacutech thước Noacutei chung sự nhất triacute vagrave gắn kết giữa caacutec thagravenh viecircn tỉ lệ nghịch với phạm vi nhoacutem Trong nhoacutem lớn rất dễ higravenh thagravenh caacutec nhoacutem nhỏ vagrave hoạt động rời rạc

Tư duy tập thể Trong nhoacutem lớn mọi người coacute xu hướng suy nghĩ đểđạtđược sự nhất triacute necircn khocircng phaacutet huy được sự saacuteng tạo

Caacutec vấn đề về xatilde hội

Xung đột Trong 1 nhoacutem ai cũng muốn migravenh lagrave giỏi nhất necircn dễ dẫn đến xung đột

Ẩn danh(Giấu tecircn) Đacircy lagrave phương phaacutep được sử dụng để kiểm soaacutet xung đột Cho caacutec thagravenh viecircn tham gia ẩn danh

Vấn đề giới tiacutenh Nam vagrave nữ thường coacute những thế mạnh khaacutec nhau điều nagravey coacute thể lagrave sức mạnh trong 1 thiết lập MDM

Đagravem phaacuten vagrave quyết định

Một quyết định coacute thể liecircn quan đến nhiều quan điểm khaacutec nhau vigrave thế cần phải coacute sự đagravem phaacuten

Caacutec thiết kế của cơ chế hỗ trợ cho MDM phải phugrave hợp với caacutec hoạt độngđagravemphaacuten

Những hoạt động nagravey bao gồm việc thu nhận yacute kiến của caacutec thagravenh viecircn 1 caacutech cocircng bằng

53Cocircng nghệ hỗ trợ MDM

Organizational DSSndash 1 hệ thống cung cấp caacutec quyết định hỗ trợ

Group Support Systemndash Cocircng nghệ sử dụng sự hỗ trợ của nhiều becircn tham gia

Group DSS ndash Lagrave 1 hệ thống được thiết kế đặc biệt để hỗ trợ cho MDM

DSS ndash Lagrave 1 hệ thống dưới sự kiểm soaacutet của 1 người quyết định hệ thống nagravey cung cấp 1 bộ cocircng cụ giuacutep phacircn tiacutech hoagraven cảnh đểđưa ra quyết định vagrave nacircng cao hiệu quả của quyết địnhđoacute

53Cocircng nghệ hỗ trợ MDM

Organizational DSSndash 1 hệ thống cung cấp caacutec quyết định hỗ trợ

Group Support Systemndash Cocircng nghệ sử dụng sự hỗ trợ của nhiều becircn tham gia

Group DSS ndash Lagrave 1 hệ thống được thiết kế đặc biệt để hỗ trợ cho MDM

DSS ndash Lagrave 1 hệ thống dưới sự kiểm soaacutet của 1 người quyết định hệ thống nagravey cung cấp 1 bộ cocircng cụ giuacutep phacircn tiacutech hoagraven cảnh đểđưa ra quyết định vagrave nacircng cao hiệu quả của quyết địnhđoacute

Mục tiecircu của cocircng nghệ hỗ trợ MDM

Quy trigravenh hỗ trợ tập trung vagraveo quaacute trigravenh tạo điều kiện thuận lợi cho sự tương taacutec

Cơ chế cấu truacutec quaacute trigravenh chi phối caacutec hoạt động truyền thocircng

Nhiệm vụ hỗ trợ cocircng việc coacute thể chọn lựa tổ chức hoặc lấy thocircng tin

Nhiệm vụ cấu truacutec cocircng việc cho pheacutep truy cập đến kỹ thuật lọc kết hợp phacircn tiacutech kiến thức liecircn quan đến cocircng việc

Caacutec lớp loại cocircng nghệ hỗ trợ MDM

Phacircn loại theo đặc điểm do DeSanctis vagrave Gallupe đưa ra đề xuất một chương trigravenh ba cấp dựa trecircn caacutec tiacutenh năng được cung cấp

Hệ thống cấp 1 Mục điacutech chiacutenh lagrave tạo điều kiện thocircng tin liecircn lạc giữa caacutec thagravenh viecircn

Hệ thống cấp 2 Thiết kế để giảm thiểu rủi ro

Hệ thống cấp 3 Giuacutep điều chỉnh xử lyacute quyết định

Phacircn loại theo cocircng nghệ -Kraemer vagrave King tập trung vagraveo cocircng nghệ aacutep dụng

Cocircng nghệ bảng mạch điện tử

Hội nghị trực tuyến

Mạng lưới tập đoagraven

Trung tacircm thocircng tin

Mocirci trường cộng taacutec

Phograveng quyết định

Nhoacutem phần mềm

Phần mềm được thiết kế để hỗ trợ sự hợp taacutec bao gồm việc thu huacutet vagrave lưu trữ thocircng tin

Caacutec tổ chức dẫn đầu thị trường hiện tại lagrave Lotus Notes and Domino Microsoft Exchange Novell GroupWise and Oracle Office

Caacutec cocircng cụ trong một bộ phần mềm bao gồm người quản lyacute hội nghị (Lotus Sametime) vagrave trao đổi thocircng điệp (Lotus Notes Mail)

Xếp hạng phần mềm cho nhoacutem

Ellis vv đề xuất một hệ thống xếp hạng dựa vagraveo kiểu sự hỗ trợ noacute Cung cấp

Hệ thocircng điệp

Hệ thống hội thảo truyền higravenh

Hệ thống cộng taacutec soạn thảo

Nhoacutem phacircn phối giải phaacutep phần mền

Hệ thống phối hợp

Hệ thống thocircng minh đại diện

Lực lượng điều khiển phaacutet triển phần mềm cho nhoacutem

Một số nhacircn tố chiacutenh bao gồm

Tăng năng suất

Giảm số lượng caacutec cuộc họp

Tăng cường tự động hoacutea caacutec quy trigravenh lagravem việc thường xuyecircn

Cần phối hợp toagraven cầu tốt hơn

Tiacutenh sẵn sagraveng của những mạng lan rộng

Coleman vagrave Khanna liệt kecirc 10 nhacircn tố khaacutec

54Quản lyacute hoạt động MDM (Mobile Device Management - Quản lyacute thiết bị di động)

Một số phương phaacutep phối hợp phổ biến hơnMDM lagrave

Kỹ thuật nhoacutem định danh

Kỹ thuật Delphi

Sự phacircn xử

Hệ thocircng tin dựa trecircn vấn đề

Nemawashi

Kỹ thuật nhoacutem định danh

1-Mỗi người tham gia viết ra những yacute tưởng về những gigrave necircn quyết định

2-Lần lượt mỗi người tham gia trigravenh bagravey yacute tưởng của migravenh được ghi lại trecircn bảng Khocircng thảo luận ở đacircy

3-Sau khi tất cả caacutec yacute tưởng được trigravenh bagravey caacutec đại biểu coacute thể chất vấn những người khaacutec

4-Mỗi người tham gia bỏ phiếu cho mỗi yacute tưởng

Kỹ thuật Delphi

Về cơ bản tương tự như kỹ thuật nhoacutem định danh ngoại trừ những người khocircng bao giờ tham gia cuộc họp

Một cocircng cụ khảo saacutet được sử dụng để thu thập đầu vagraveo ban đầu từ caacutec thagravenh viecircn

Một cuộc khảo saacutet thứ hai được gửi đi với một bản toacutem tắt caacutec kết quả chung

Những bước lặp lại cho đến khi đạt được một sự đồng thuận hoặc nhigraven nhận của đa số

Sự phacircn xử(Arbitration )

Thiacutech hợp nhất khi caacutec thagravenh viecircn của MDM đại diện cho caacutec yếu tố đối lập

Những người tham gia đồng yacute rằng nếu lựa chọn thay thế hai becircn thỏa thuận khocircng được tigravem thấy thigrave một trọng tagravei viecircn becircn ngoagravei sẽ tham gia

Trọng tagravei sau đoacute lựa chọn thay thế ocircng hoặc xeacutet thấy thiacutech hợp nhất

Hệ thống thocircng tin dựa trecircn vấn đề (IBIS)

Lagrave một phương phaacutep lập luận cấu truacutec

Một đại diện cho IBIS lagrave một đồ thị với caacutec nuacutet vagrave caacutec liecircn kết

IBIS bắt đầu với lựa chọn của một nuacutet vấn đề gốc sau đoacute caacutec nuacutet vị triacute khaacutec nhau được liecircn kết với nuacutet gốc

Caacutec nuacutet vị triacute nagravey sau đoacute được đaacutenh giaacute dựa trecircn những lập luận gắn liền với chuacuteng

Nemawashi (được sử dụng rộng ratildei tại Nhật Bản)

1-Một hoặc nhiều thagravenh viecircn của MDM được chỉ định lagrave điều phối viecircnCaacutec điều phối viecircn sau đoacute chọn người tham gia cograven lại

2-Điều phối viecircn xacircy dựng một tổng hợp caacutec sự lựa chọn vagrave sau đoacute caacutec chuyecircn gia đaacutenh giaacute caacutec lựa chọn

3-Điều phối viecircn lựa chọn một sự lựa chọn dựa trecircn kết quả ở trecircn(ở 2)

4-Sự thay thế được luacircn chuyển điều phối viecircn tigravem kiếm sự đồng thuận thocircng qua sự thuyết phục vagrave đagravem phaacuten

5-Nếu đạt được sự đồng thuận điều phối viecircn cho lưu thocircng một tagravei liệu magrave mỗi thagravenh viecircn MDM để lại dấu hiệu trecircn đoacute

55Nơi lagravem việc ảo

Nhiều tổ chức trecircn toagraven thế giới kinh doanh bất động sản cho cocircng nghệ hợp taacutec

Cocircng việc được trở thagravenh một điều bạn lagravem hơn lagrave một nơi bạn đi

Những thay đổi lớn nhất mang lại bởi nơi lagravem việc ảo coacute thể lagrave về văn hoaacute hay xatilde hội hơn lagrave về cocircng nghệ

Chương 6 Hệ thống thocircng tin điều hagravenh

61 Yacute nghĩa của EIS- Hệ thống thocircng tin điều hagravenh

- EIS lagrave một dạng đặc biệt của DSS được thiết kế để hỗ trợ ra quyết định ở cấp cao nhất của một tổ chức

- Lagrave một hệ thống thocircng tin hỗ trợ nhu cầu lập kế hoạch vagrave đaacutenh giaacute của caacutec nhagrave quản lyacute điều hagravenh

- EIS coacute thể giuacutep một CEO coacute được bức tranh tổng thể chiacutenh xaacutec nhất về caacutec hoạt động vagrave một bản toacutem tắt những gigrave magrave đối thủ cạnh tranh đang lagravem

- Caacutec hệ thống nagravey noacutei chung hoạt động dễ dagraveng vagrave trigravenh bagravey thocircng tin theo những caacutech dễ hiểu để việc tiếp thu được nhanh choacuteng (biểu đồ đồ thịhellip)

(Tagravei liệu thecircm EIS lagrave những loại hệ thống lagrave rất phức tạp trong tự nhiecircn Coacute thể noacutei hệ thống nagravey cũng cung cấp cho caacutec nhagrave quản lyacute với caacutec thiết bị coacute khả năng ra quyết định bằng caacutech sử dụng của noacute Hệ thống nagravey hoạt động trong điều kiện như vậy quan trọng như trong caacutec hệ thống khaacutec khocircng hỗ trợ Khả năng lưu trữ dữ liệu nặng lagravem cho noacute lyacute tưởng để được thocircng qua khocircng chỉ bởi caacutec doanh nghiệp lớn magrave cograven bởi caacutec doanh nghiệp nhỏ hơn Nhigraven chung hệ thống nagravey lagrave dagravenh cho caacutec nhacircn viecircn cấp cao hỗ trợ thagravenh thạo trong việc đưa ra caacutec quyết định quan trọng)

Caacutec phiecircn EIS tiecircu biểu- Phiecircn lagravem việc coacute thể bắt đầu với một baacuteo caacuteo về tigravenh higravenh tagravei chiacutenh vagrave kinh

doanh của một cocircng ty caacutec chỉ số hoạt động quan trọng được hiển thị rotilde ragraveng- EIS sẽ cho pheacutep caacutec giaacutem đốc điều hagravenh coacute thể đi sacircu vagraveo dữ liệu từ những con

số bất kỳ magrave noacute hỗ trợ- Việc điều hagravenh coacute thể lựa chọn một mức độ chi tiết ( VD danh số baacuten hagraveng) nếu

như cần điều tra thecircm- Lagrave một phương phaacutep tiếp cận coacute thể giuacutep việc ra quyết định tốt hơn

Những điều magrave EIS ko coacute- EIS khocircng phải lagrave sự thay thế cho caacutec hệ thống dựa trecircn caacutec maacutey tiacutenh khaacutec EIS

thực sự chỉ cung cấp dữ liệu cho caacutec hệ thống nagravey- Noacute khocircng thể biến caacutec bộ hệ điều hagravenh của maacutey tiacutenh thagravenh những ldquochuyecircn viecircn

giỏirdquo- Coacute thể được viacute một caacutech cao hơn như lagrave một trợ lyacute đaacuteng tin cậy coacute thể được gọi

đến bất khi nagraveo vagrave mỗi khi cần thiết

Tagravei liệu thecircm Sự khaacutec nhau giữa EIS vagrave DSS+ EIS thiết kế để hỗ trợ những người điều hagravenh cấp cao giuacutep họ khaacutem phaacute caacutec vấn đề vagrave caacutec cơ hội DSS hỗ trợ những nười phacircn tiacutech cố gắng trả lời cacircu hỏi caacutei gigrave coacute thể lagravem cugraveng với một cơ hội hoặc một vấn đề

Chiều EIS DSSNhững người sử dụng thocircng thường

Duyệt dữ liệu đi xuống truy xuất trạng thaacutei

Hỗ trợ phacircn tiacutech vagrave quyết định

Sự thuacutec đẩy Tiacutenh thiacutech hợp Tiacutenh hiệu quảỨng dụng Queacutet mocirci trường đaacutenh giaacute

hiệu suất nhận dạng caacutec vấn đề vagrave caacutec cơ hội

Caacutec quyết định quản lyacute trecircn caacutec lĩnh vực đa dạng

Hỗ trợ quyết định Caacutec chiacutenh saacutech caacutec quyết định khocircng coacute cấu truacutec ở mức cao vagrave hỗ trợ giaacuten tiếp

Hỗ trợ caacutec quyết định lặp lại caacutec quyết định khocircng thể đoaacuten trước ra quyết định khocircng coacute cấu truacutec vagrave baacuten cấu truacutec

Loại thocircng tin Caacutec thocircng tin tin tức thocircng tin becircn ngoagravei về khaacutech hagraveng đối thủ cạnh tranh mocirci trường caacutec baacuteo caacuteo theo yecircu cầu vagrave định thời về caacutec hoạt động becircn trong

Caacutec thocircng tin hỗ trợ caacutec tigravenh huống đặc biệt

Sử dụng coacute nguyecircn tắc

Dograve theo vết vagrave điều khiển nhận dạng cơ hội

Hoạch định tổ chức phacircn nhoacutem vagrave điều khiển

Khả năng phugrave hợp với những người sử dụng caacute nhacircn

Thiết kế loại ra quyết định cho mỗi người điều hagravenh caacute nhacircn bằng nhiều lựa chọn đầu ra

Cho pheacutep caacutec đaacutenh giaacute caacute nhacircn caacutec khả năng what-if lựa chọn loại hộp hội thoại

Đồ họa Phải coacute Lagrave một phần quan trọng của nhiều DSS

Thacircn thiện người sử dụng

Phải coacute Phải coacute nếu khocircng coacute người sử dụng trung gian

Xử lyacute thocircng tin Lọc neacuten thocircng tin dograve theo vết dữ liệu vagrave thocircng tin quan trọng

EIS kiacutech thiacutech caacutec cacircu hỏi caacutec cacircu trả lời bằng caacutech sử dụng DSS vagrave phản hồi lại EIS

Hỗ trợ caacutec thocircng tin chi tiết

Truy xuất thường xuyecircn caacutec mức chi tiết của bất kỳ thocircng tin tổng hợp nagraveo (duyệt dữ

Coacute thể coacute trong DSS nhưng khocircng thường

liệu chi tiết)Cơ sở mocirc higravenh Caacutec chức năng coacute sẵn bị hạn

chếLagrave điểm cốt lotildei của DSS

Cấu truacutec Theo người baacuten sản phẩm hoặc theo caacutec chuyecircn gia hệ thống thocircng tin

Theo người sử dụng hoặc caacute nhacircn hoặc caacutec chuyecircn gia từ caacutec trung tacircm thocircng tin hoặc phograveng ban hệ thống thocircng tin

Phần cứng Mainframe caacutec trạm RISC mạng LANs hoặc caacutec hệ thống phacircn bố

Mainframe caacutec trạm RISC caacutec maacutey PC hoặc caacutec hệ thống phacircn bố

Bản chất caacutec goacutei phần mềm

Truy xuất tương taacutec dễ dagraveng đến nhiều cơ sở dữ liệu truy xuất trực tuyến caacutec khả năng DBMS phức tạp caacutec liecircn kết phức tạp

Caacutec khả năng tiacutenh toaacuten lớn caacutec ngocircn ngữ mocirc higravenh mocirc phỏng ứng dụng vagrave caacutec bộ tạo DSS

Bản chất caacutec thocircng tin

Trigravenh bagravey thocircng tin được phaacutet sinh trước về quaacute khứ vagrave hiện tại tạo caacutec thocircng tin mới về quaacute khứ hiện tại tương lai

Tạo thocircng tin mới về quaacute khứ hiện tại tương lai

62 Lịch sử EIS- EIS xuất hiện lần đầu tiecircn tại MIT vagraveo những năm 1970

- Những EIS đầu tiecircn được phaacutet triển bởi caacutec doanh ngiệp lớn sẵn sagraveng chấp nhận rủi ro để đạt được lợi thế cạnh tranh

- Vagraveo những năm 1980 caacutec nhagrave cung cấp đatilde phaacutet triển một số cơ sở khaacutech hagraveng rộng vagrave cocircng nghệ EIS được tiếp tục phaacutet triển cho đến ngagravey nay

(Tagravei liệu thecircm Sử dụng DSSEIS cho phaacutet triển bền vững + Một số nghiecircn cứu đatilde được tiến hagravenh để kiểm tra việc thực hiện của EIS trong khu vực cocircng cộng vagrave chiacutenh phủ caacutec nước tổ chức kể từ khi chuacuteng được phaacutet triển theo định hướng lợi nhuận cho caacutec cocircng ty tư nhacircn (Hasan vagrave Hasan năm 1997) Theo một nghiecircn cứu tiến hagravenh tại Mỹ ở hơn 300 cocircng ty kết quả cho thấy sự khaacutec biệt của EIS giữa tư nhacircn vagrave chiacutenh phủ một số kết quả thuacute vị được phaacutet hiệnViacute dụ khoacute khăn hơn để chuyển tiền từ một tagravei khoản khaacutec trong một EIS của chiacutenh phủ cũng lagrave khoacute khăn hơn để biện giải thiacutech cho những chi phiacute phaacutet triển EIS của chiacutenh phủ Một nghiecircn cứu khaacutec được tiến hagravenh ở Australia

cho thấy rằng EIS cung cấp cho quản lyacute một higravenh ảnh chiacutenh xaacutec hơn về tổ chức thực hiện vagrave cung cấp hỗ trợ cho caacutec lợi iacutech chiến lược cải thiện khocircng chỉ cho caacutec nhagrave quản lyacute nhưng cograven cho phần cograven lại của tổ chức Dựa trecircn caacutec hệ thống được thiết kế cho caacutec cocircng ty tư nhacircn với một caacutech rotilde ragravengxaacutec định mục tiecircu EIS lagrave thiacutech hợp cho caacutec tổ chức cocircng cộng hiện đại nhưng cần phải được linh hoạt hơn vagrave kết thagravenh chugravem một phạm vi rộng hơn khả năng vagrave phương tiện hơn so với khu vực tư nhacircn ban đầu theo định hướng sản phẩm (Hasan vagrave Hasan năm 1997) Điều nagravey coacute thể lagrave do thực tế rằng caacutec hoạt động khu vực cocircng lagrave bắt buộc coacute taacutec động rộng phải đaacutep ứng sự mong đợi duy nhất cocircng cộng thường coacute mục tiecircu mơ hồ vagrave macircu thuẫn iacutet quyền tự chủ vagrave kiểm soaacutet việc ra quyết định vagrave nhacircn viecircn lagrave khoacute khăn hơn (Watson vagrave Carte2000) + Toacutem lại EIS lagrave một khaacutei niệm thagravenh cocircng noacute phaacutet triển qua nhiều năm tuy nhiecircn EIS khắc phục khiếm khuyết của migravenh bằng caacutech tiến hagravenh nghiecircn cứu liecircn tục)

63 Tại sao những người điều hagravenh hagraveng đầu lại khaacutec nhau- Họ lagrave những doanh nghiệp theo định hướng coacute suy nghĩ

- Coacute một khoảng khocircng gian rộng để kiểm soaacutet

- Họ chịu traacutech nhiệm cho việc thiết lập chiacutenh saacutech

- Họ đại diện cho tổ chức mocirci trường becircn ngoagravei

- Hagravenh động của họ tạo ra những kết quả đaacuteng kể về tagravei chiacutenh vagrave con người

Tần số caacutec hoạt động điều hagravenh- Xử lyacute xaacuteo trộn 42

- Hoạt động kinh doanh 32

- Phacircn bổ nguồn lực 17

- Đagravem phaacuten 3

- Những điều khaacutec 6

Handling Disturbances 42

Entrepreneurial Activites 32

Resource Allocation 17

Negotiation 3

Other 6

Những thocircng tin điều hagravenh cần thiết- Quản lyacute xaacuteo trộn coacute thể yecircu cầu sự chuacute yacute xung quanh đồng hồ

- Hoạt động kinh doanh yecircu cầu điều hagravenh để dự đoaacuten những thay đổi trong mocirci trường

- Nhiệm vụ phacircn bổ tagravei nguyecircn yecircu cầu lựa chọn người quản lyacute vagrave caacutec nguồn lực hạn chế được triển khai

- Đagravem phaacuten yecircu cầu cập nhật thocircng tin từng phuacutet để coacute thể xacircy dựng được sự đồng thuận

Caacutec loại thocircng tin điều hagravenh- Hệ thống kế toaacuten coacute liecircn quan đến việc tiacutenh toaacuten thu nhập hoạt động cho caacutec lĩnh

vực cụ thể lagrave quan trọng hơn so với caacutec hệ thống kế toaacuten truyền thocircng- Thocircng tin về thị trường khaacutech hagraveng cung cấp giaacute trị trong việc quyết định chiến

lược- Caacutec thocircng tin cần thiết thường được truyền đi trecircn một số hệ thống maacutey tiacutenh vagrave

nằm trong toagraven tổ chức- Caacutec thocircng tin được sử dụng thường lagrave ngắn hạn vagrave dễ thay đổi

Phương thức để xaacutec định thocircng tin cần thiết

Rockart xaacutec định được năm phương thức cơ bản để xaacutec định thocircng tin cần thiết

- Phương thức dựa trecircn kết quả- Phương thức rỗng- Phương thức chỉ số khoacutea- Phương thức tổng hợp nghiecircn cứu- Phương thức dựa vagraveo nhacircn tố then chốt dẫn đến thagravenh cocircng

64 Thagravenh phần EIS

- Sản phẩm EIS đầu tiecircn được phaacutet triển để sử dụng trecircn maacutey tiacutenh cấu higravenh cao nhưng caacutec sản phẩm hiện nay nhằm mục tiecircu lagrave nền tảng ClientServer

- Những nền tảng linh hoạt hơn coacute thể thiacutech ứng với thay đổi trong tổ chức vagrave cocircng nghệ

- Sử dụng dữ liệu thời gian thực dẫn đến quyết định nhanh hơn nhiều thocircng tin hơn

Thagravenh phần phần cứng- Một EIS khocircng đogravei hỏi coacute phần cứng cụ thể hoặc duy nhất nagraveo- Chigravea khoacutea của vấn đề lagrave để đảm bảo rằng caacutec thagravenh phần của EIS tối ưu hoacutea vagrave

phugrave hợp với tagravei nguyecircn maacutey tiacutenh của tổ chức- Hệ thống nagravey phải được cấu higravenh để caacutec nguồn tagravei nguyecircn phugrave hợp với những

người điều hagravenh chuacuteng

Thagravenh phần phần mềm- Traacutei ngược với phần cứng phần mềm thường được chuyecircn mocircn hoacutea cao cho caacutec

bagravei toaacuten về miền- Sự chuyecircn mocircn hoacutea nagravey thường đạt được bằng caacutech sử dụng thagravenh phần off-the-

shelf cho toagraven bộ EIS vagrave caacutec mocirc-đun tugravey chỉnh để đaacutep ứng nhu cầu cụ thể- Lotus Notes lagrave một viacute dụ điển higravenh Noacute coacute thể được sử dụng một migravenh hoặc coacute

thể phục vụ becircn thứ ba mocirc-đun plug-in

Cocircng nghệ EIS hiện nay

Dobrzeniecki đề xuấtphacircn loạitừng cấptheo bachức năng- Loại 1 sản phẩm bao gồmmột bộ đầy đủcaacutec ứng dụngtừ mộtnhagrave cung cấp- Loại 2 sản phẩm đượcthựchiệnở phần đầu củacaacutecsản phẩmDSS đượcphaacutet triển

bởicugravengmộtnhagrave cung cấp- Loại 3 sản phẩmkết hợp với nhautheo bất kỳ số lượngthuộc sở hữu củacocircng ty

65 Xacircy dựng EIS

- Xacircy dựngmộtEISgiống nhưxacircydựngmột số hệ thống khaacutec củamocirc higravenh hệ thống thocircng tin

- Việcphaacutet triểncấu truacutecnecircn được theo dotildeitừ quaacute trigravenh thiết kế đến quaacute trigravenhthực hiện

- Tuy nhiecircn một dự aacuten phaacutet triển EIScoacute xu hướnglagrave thống nhấtvagraveyecircu cầu hỗ trợ caacutec nhagrave quản lyacute latildenh đạo

- Xacircy dựng một EIScoacute thểphaacutet hiện ra đượccaacutectigravenh huống khoacute khănmagravemột nhagrave phaacutet triển chưabao giờ gặp phải

Mocirc higravenh EIS

Khung phaacutet triển một EIS

- Watson et al đề nghị xacircy dựngkhung với ba thagravenh phần+ Caacutech tiếp cận tập trung vagraveo yếu tốcon người vagrave dữ liệu coacute liecircn quan đến EIS+ Quaacute trigravenh phaacutet triển cần sự linh hoạt vagrave tương taacutec+ Người sử dụng - hệ thống hộp thoại bao gồm một ngocircn ngữ hagravenh động để xử lyacute caacutec lệnh

Lợi iacutech của EIS- Dễ duy trigrave caacutec mục tiecircu coacute tổ chức- Dễ truy xuất thocircng tin- Cho pheacutep người sử dụng nacircng cao hiệu suất hơn

- Tăng chất lượng ra quyết định- Cung cấp sự cải tiến cạnh tranh- Tiết kiệm thời gian của người sử dụng- Tăng khả năng vagrave chất lượng giao tiếp- Cung cấp khả năng điều khiển tốt hơn trong tổ chức- Cho pheacutep tham gia caacutec vấn đề vagrave caacutec cơ hội- Cho pheacutep hoạch định- Cho pheacutep tigravem kiếm nguyecircn nhacircn của một vấn đề- Thảo matilden caacutec yecircu cầu của người điều hagravenh

Hạn chế của EIS vagrave 1 số sai lầm cần traacutenh

- Chi phiacute một cuộc khảo saacutetnăm1991 chothấychi phiacute phaacutet triểntrungbigravenh365000USDvớichi phiacute vận hagravenhhagraveng năm lagrave$200000 (EIS)

- Cocircng nghệ hạn chếEIScần phảiđượctiacutech hợp hoagraven toagravenvagraveokiếntruacuteccủadoanh nghiệphiện tại do đoacute noacutelagrave một thaacutech thứclớn đối vớithiết kế

- Hạn chế tổ chức cơ cấu tổ chứccoacute thể khocircng phugrave hợp

Sự hạn chế về tổ chức- Chương trigravenh nghị sự vagrave thời gian chệch EIS mocirc tả một phần việc thực hiện một

chương trigravenh nghị sự vagrave coacute thể dễ dagraveng đạt được sự tin cậy một caacutech chắc chắn- Đồng bộ hoacutea việc quản lyacute sự tin cậy đuacuteng luacutec đặc biệt baacuteo caacuteo EIS coacute thể phaacute

vỡ sự ổn định thiết lập caacutec chu trigravenh baacuteo caacuteo một caacutech tốt nhất- Sự bất ổn EIS phản ứng nhanh coacute thể gacircy ra việc taacutec động trở lại một caacutech

nhanh choacuteng dẫn đến sự thiếu ổn định trong tổ chức

Sự thất bại lagrave thay thế khocircng thể chấp nhận được- Một số yếu tố lagravem EIS thất bại

+ Thiếu sự hỗ trợ về mặt quản lyacute+ Vấn đề chiacutenh trị+ Thất bại của nhagrave phaacutet triển+ Lỗi về cocircng nghệ+ Giaacute cả+ Thời gian

66 Ra quyết định điều hagravenh trong tương lai vagrave EIS

- Coacute một vagravei điều kiện sẽ được hợp nhất cho việc chuyển đổi cocircng nghệ Trong đoacute một vagravei điều kiện coacute thể dễ dự đoaacuten Hai điều kiện magrave ta coacute thể thấy lagrave+ Phaacutet triển cocircng nghệ maacutey tiacutenh trong việc điều hagravenh sẽ tạo ra sự chuyển đổi được chấp nhận một caacutech dễ dagraveng hơn+ Mở rộng traacutech nhiệm điều hagravenh sẽ mở rộng nhu cầu thocircng tin

Tương lai của EIS- EIS thocircng minh Những tiến bộ trong cocircng nghệ AI sẽ được triển khai trong caacutec

EIS- EIS đa phương tiện Cơ sở dữ liệu đa phương tiện sẽ cho pheacutep tiacutech hợp văn bản

giọng noacutei vagrave higravenh ảnh trong tương lai- EIS thocircng tin Tương lai EIS sẽ mở rộng hơn trong việc sử dụng dữ liệu becircn

ngoagravei doanh nghiệp- EIS kết nối Giao tiếp với băng thocircng rộng cho pheacutep kết nối liecircn thocircng lớn hơn

Chương 7 HỆ CHUYEcircN GIA VAgrave TRIacute TUỆ NHAcircN TẠO

71 Caacutec khaacutei niệm

72 Triacute thocircng minh của triacute tuệ nhacircn tạo

73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia

74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia

75 Lợi iacutech vagrave hạn chế của hệ chuyecircn gia

71 Caacutec khaacutei niệm

Chuyecircn mocircn (Expertise) sự hiểu biết rộng trong 1 lĩnh vực hẹp

Hệ chuyecircn gia (Expert Systems)1 chương trigravenh maacutey tiacutenh sử dụng 1 tập caacutec luật dựa trecircn tri thức của con người để giải quyết caacutec vấn đề đogravei hogravei phải coacute sự chuyecircn mocircn

Một số hệ chuyecircn gia nổi tiếng

DENDRAL (Standford 1960s Edward Feigenbaum)

MYCIN (Standford1970s Edward Shortliffe)

PROSPECTOR (MIT 1979)

Triacute tuệ nhacircn tạo (Artificial Intelligence ndash AI)

Triacute tuệ nhacircn tạo một bộ phacircn của ngagravenh khoa học maacutey tiacutenh quan tacircm đến việc thiết kế caacutec hệ thống maacutey tiacutenh thocircng minh đoacute lagrave caacutec hệ thống đưa ra caacutec đặc điểm magrave từ đoacute chuacuteng ta liecircn hệ với sự thocircng minh trong hagravenh động của con người (Barr vagrave Feigenbaum 1981)

Mục điacutech của AI

Mục điacutech khoa học xaacutec định caacutec gợi yacute để giải thiacutech caacutec loại khaacutec nhau của triacute tuệ thực

Mục điacutech kỹ thuật giải quyết caacutec vấn đề trong thế giới thực

Triacute tuệ nhacircn tạo kế thừa nhiều yacute tưởng quan điểm kỹ thuật từ caacutec ngagravenh khoa học khaacutec

- Triết học

- Logic Toaacuten học

- Tiacutenh toaacuten

- Khoa học tacircm lyacute Khoa học nhận thức

- Sinh học Thần kinh học

- Tiến hoacutea

Caacutec lĩnh vực ứng dụng trong Triacute tuệ nhacircn tạo

Mạng nơ ron thần kinh (Neural Networks)

Tiacutenh toaacuten sự tiến hoacutea

(Evolutionary Computation)

Hệ chuyecircn gia (Expert Systems)

Kỹ thuật xử lyacute tiếng noacutei (Speech Processing)

Kỹ thuật xử lyacute ngocircn ngữ tự nhiecircn

(Natural Language Processing)

Lập kế hoạch (Planning)

Robot (Robotics)

Khoa học higravenh ảnh (Vision)

Caacutec kỹ thuật thocircng dụng dugraveng trong AI

Biểu diễn(Representation)

Học (Learning)

Caacutec luật (Rules)

Tigravem kiếm (Search)

72 Triacute thocircng minh của triacute tuệ nhacircn tạo

Con người suy diễn như thế nagraveo

Phacircn loại (Categorization)

Caacutec quy tắc cụ thể

Heuristics

Kinh nghiệm trước đoacute

Dự tiacutenh trước

Maacutey tiacutenh suy diễn như thế nagraveo

Lập luận dựa trecircn luật IF-THEN mocirc tả tri thức được matilde hoacutea dưới dạng caacutec luật

Caacutec khung (Frames) lagrave caacutec đại diện mocirc tả caacutec tigravenh huống giống nhau lagrave điển higravenh của một vagravei phacircn loại

Lập luận dựa trecircn caacutec trường hợp mocirc phỏng giải phaacutep trước đoacute cho một vấn đề hiện tại

Nhận dạng mẫu phaacutet hiện acircm thanh higravenh dạng hoặc caacutec chuỗi dagravei

Caacutec dạng khaacutec của Triacute tuệ nhacircn tạo

Học maacutey- mạng nơron vagrave giải thuật di truyền

Lập trigravenh tự động ndash lagrave những kỹ thuật tạo ra caacutec chương trigravenh để lagravem 1 nhiệm vụ riecircng biệt (cho pheacutep những người khocircng phải lagrave người lập trigravenh coacute thể lập trigravenh được)

Cuộc sống nhacircn tạo ndash nỗ lực để taacutei tạo caacutec hiện tượng sinh học trong caacutec hệ thống dựa trecircn maacutey tiacutenh

73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia(Expert Systems- ES)

Theo Jackson (1999) Một hệ chuyecircn gia lagrave một chương trigravenh maacutey tiacutenh mocirc tả vagrave suy diễn với tri thức của một vagravei lĩnh vực để giải quyết vấn đề hay đưa ra caacutec lời khuyecircn

Cấu truacutec cơ bản của ES được dựa theo cấu truacutec chung của DSS Sự khaacutec biệt chiacutenh giữa ES vagraveDSS lagrave hệ ES thu thập caacutec kiến thức từ những

chuyecircn gia trong lĩnh vực quan tacircmĐặc trưng của hệ chuyecircn gia Hiệu quả cao Thời gian trả lời thỏa đaacuteng Độ tin cậy cao Dễ hiểu

Giao diện người dugraveng trong ES

Thiết kế giao diện người dugraveng tập trung vagraveo caacutec yếu tố như dễ dagraveng sử dụngcoacute độ tin cậy cao giảm tải những khoacute khăn khi sử dụng

Thiết kế necircn coacute một số tương taacutec (đầu vagraveo kiểm soaacutet vagrave truy vấn)

Cấu tạo giao diện người dugraveng gồm coacute magraven higravenh cảm ứng bagraven phiacutem buacutet saacuteng lệnh thoại caacutec phiacutem chuyecircn dụng

Cơ sở tri thức (Knowledge Base)

Chứa đựng caacutec tri thức cụ thể miền thu được từ caacutec chuyecircn gia miền

Coacute thể chứa caacutec mocirc tả caacutec hagravenh vi giải quyết vấn đề caacutec ragraveng buộc caacutec heuristics

Thagravenh cocircng của một ES dựa trecircn tiacutenh đầy đủ vagrave tiacutenh chiacutenh xaacutec của cơ sở tri thức

Mocirc tơ suy diễn (Inference Engine)

Ở đacircy tri thức được đặt để sử dụng tạo ra caacutec giải phaacutep để giải quyết vấn đề

Mocirc tơ nagravey coacute khả năng thực hiện diễn dịch hoặc suy diễn dựa trecircn caacutec luật hay caacutec caacutec sự kiện

Đồng thời cũng coacute khả năng sử dụng caacutec suy diễn mờ hay khocircng chiacutenh xaacutec dựa trecircn xaacutec suất hay aacutenh xạ mẫu

Vograveng điều khiển suy diễn

1 Aacutenh xạ caacutec luật với caacutec sự kiện đatilde được cho

2 Chọn luật để thực hiện

3 Thực hiện luật bằng caacutech thecircm caacutec sự kiện được suy diễn ra vagraveo bộ nhớ lagravem việc

Chuỗi suy diễn (Chaining)

Suy diễn tiến (forward chaining) maacutey suy diễn bắt đầu từ dữ liệu ban đầu vagrave thực hiện việc suy luận để đưa ra caacutec kết luận cuối cugraveng

Suy diễn lugravei (backward chaining) maacutey suy diễn bắt đầu từ dữ liệu điacutech vagrave tigravem ra tri thức hỗ trợ cho dữ liệu điacutech đoacute

Viacute dụ suy diễn lugravei

R1 Nếu coacute A vagrave B thigrave suy ra coacute D

R2 Nếu coacute B thigrave suy ra coacute C

R3 Nếu coacute C vagrave D thigrave suy ra coacute E

Ta coacute E ta xem trong 3 luật R1 R2 R3 luật nagraveo coacute E ta thấy R3 chứa E đồng thời chứa C vagrave D Xeacutet tiếp trong 2 luật R1 R2 luật nagraveo chứa C vagrave D R2 chứa C R3 chứa D Từ đoacute ta coacute được caacutec tri thức hỗ trợ suy diễn vagrave kết luận lagrave nếu coacute A vagrave B thigrave sẽ coacute E Hay nếu A vagrave B đuacuteng thigrave sẽ coacute E

Viacute dụ suy diễn tiến

Giả sử coacute tập chứa 3 luật sau

R1 Nếu coacute A vagrave B thigrave suy ra coacute D

R2 Nếu coacute B thigrave suy ra coacute C

R3 Nếu coacute C vagrave D thigrave suy ra coacute E

Nếu ta coacute A vagrave B thigrave chuacuteng ta suy ra được D từ R1 vagrave suy ra C từ R2 Với D vagrave C đatilde được suy ra ở trecircn giờ chuacuteng ta suy ra được E từ R3

Viacute dụ thực tế

Giả sử muốn biết magraveu của một con vật nuocirci tecircn lagrave Fred biết rằng noacute kecircu ộp ộp vagrave ăn ruồi

Coacute tập 4 luật ban đầu như sau

R1 Nếu X kecircu ộp ộp vagrave ăn ruồi thigrave X lagrave con ếch

R2 Nếu X kecircu chiecircm chiếp vagrave biết hoacutet thigrave X lagrave con chim

R3 Nếu X lagrave con ếch thigrave X coacute magraveu xanh

R4 Nếu X lagrave con chim thigrave X coacute magraveu vagraveng

74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia

Expert system shells lagrave một tập caacutec goacutei phần mềm vagrave caacutec cocircng cụ dugraveng để phaacutet triển caacutec hệ chuyecircn gia

Những Expert system shells đầu tiecircn thường rất rườm ragrave Mặc dugrave vậy noacute vẫn giuacutep cho người sử dụng sẽ khocircng phải bắt đầu lại từ đầu khi xacircy dựng một hệ chuyecircn gia mới

Những shell hiện đại bao gồm hai mocirc-đun chiacutenh lagrave cocircng cụ xacircy dựng một tập quy tắc vagrave mocirc tơ suy diễn

Xacircy dựng hệ chuyecircn gia

Bước 1 xacircy dựng mocirc higravenh bagravei toaacuten xaacutec định vấn đề nhiệm vụ magrave hệ thống sẽ thực hiện Caacutec dạng bagravei toaacuten cần hệ chuyecircn gia

Bagravei toaacuten diễn giải (InterPretation)

Bagravei toaacuten dự baacuteo (Prediction)

Bagravei toaacuten chuẩn đoaacuten (Diagnose)

Bagravei toaacuten gỡ rối (Debugging)

Bagravei toaacuten thiết kế

Tương tự như một dự aacuten phần mềm để xacircy dựng một hệ chuyecircn gia cần phải coacute caacutec yếu tố về nhacircn lực tagravei nguyecircn vagrave thời gian Những yếu tố nagravey ảnh hưởng đến giaacute thah của một hệ chuyecircn giaTrong phần nagravey cacircu hỏi thường được đặt ra lagrave tại sao cần phải xacircy dựng một hệ chuyecircn giaTrước khi bắt đầu phải xaacute định rotilde bagravei toaacuten đạt ra lagrave jiAi lagrave chuyecircn giaAi lagrave người sử dụng

1 Diễn giải (InterPretation) Nghiecircn cứu 1 vấn đề -gt Dựa trecircn những biểu hiện thuộc tiacutenh đặc trưng becircn ngoagravei -gt Tư vấn

(hoặc đưa ra kết luận hay mocirc tả dễ hiểu từ tập dữ liệu thocirc)

2 Bagravei toaacuten dự baacuteo (Prediction) Coacute thể dự đoaacuten được hagravenh vi kết quả dựa trecircn caacutec hiện tượng -gt dự baacuteo

VD Dự baacuteo thời tiết động đấthellip

3 Bagravei toaacuten chẩn đoaacuten (Diagnoss) Xaacutec định caacutec lỗi caacutec bộ phận hỏng hoacutec của hệ thống dựa trecircn caacutec dữ liệu quan saacutet được

4 Bagravei toaacuten gỡ rối (Debugging) Mocirc tả caacutec phương phaacutep khắc phục hệ thống khi gặp sự cố

5 Bagravei toaacuten thiết kế Lựa chọn cấu higravenh caacutec đối tượng nhằm thoả matilden một số ragraveng buộc nagraveo đoacute

6 Giảng dạy Phần mềm dạy học coacute thể chuẩn đoaacuten vagrave sủa lỗi của học sinh trong quaacute trigravenh học tập

Để xaacutec định đuacuteng bagravei toaacuten magrave chuacuteng ta cần giải quyết thigrave phải trả lời đc một số cacircu hỏi

- cần hệ chuyecircn gia

Bước 2 thu thập tri thức lựa chọn cocircng cụ vagrave aacutep dụng

Trong bước thu thập tri thức vấn đề quan trọng lagrave lựa chọn chuyecircn gia những người magrave sẽ đoacuteng goacutep tri thức cho hệ thống Thocircng thường trong suốt quaacute trigravenh phaacutet triển thigrave chuyecircn gia được xem như một thagravenh viecircn của đội phaacutet triển

Hiện nay coacute rất nhiều cocircng cụ để xacircy dựng một hệ chuyecircn gia Phổ biến nhất lagrave JESS CLIPS vagrave OPS5

Bước 3 Thiết kế cơ sở tri thức thiết kế hệ thốngTri thức được biểu diễn trường minh trong cơ sở tri thức

Caacutec chuyecircn gia vagrave kỹ sư tri thức sẽ đối thoại với nhau bằng caacutec kỹ thuật đối thoại Suy diễn (SD) bảng Mocirc higravenh hoacutea SD quy nạp phacircn loại

Vấn đề bagraveo trigrave vagrave phaacutet triển

Caacutec hệ chuyecircn gia đogravei hỏi phải bảo trigrave vagrave phaacutet triển nhiều hơn so với caacutec hệ thống khaacutec Phải thường xuyecircn bổ sung tri thức mới vagrave thay đổi caacutec tri thức cũ để đổi mới hệ chuyecircn gia

Thu thập vagrave khắc phục lỗi do người sử dụng phaacutet hiện để kịp thời khắc phục những sai soacutet của hệ chuyecircn gia

75 Lợi iacutech vagrave hạn chế của caacutec hệ chuyecircn gia

Một số lợi iacutech chiacutenh

Thời gian trả lời hợp lyacute bằng hoặc nhanh hơn so với chuyecircn gia (người) để đi đến cugraveng một quyết định Hệ chuyecircn gia lagrave một hệ thống thời gian thực (real time system)

Khả năng trả lời với mức độ tinh thocircng bằng hoặc cao hơn so với chuyecircn gia (người) trong cugraveng lĩnh vực

Hệ chuyecircn gia giuacutep cho hiệu quả lagravem việc tăng bằng việc sử dụng tập caacutec luật một caacutech nhanh choacuteng magrave ko bị nhầm lẫn chuyecircn gia lagrave người coacute thể quecircn đi một số tri thức cơ sở lyacute luậ nhưng HCG thigrave ko

Quyết định của một người chuyecircn gia coacute thể bị thay đổi vagrave ko coacute tiacutenh thống nhất như quyết định của một hệ chuyecircn gia tạo ra

Hệ chuyecircn gia giuacutep cho người sử dụng coacute thể trau dồi sự hiểu biết trecircn lĩnh vuej cụ thể magrave noacute giải quyết hỗ trợ người ra quyết định coacute trigravenh độ như 1 chuyecircn gia trong quaacute trigravenh gia quyết định

Kiến thức của rất nhiều chuyecircn gia về một lĩnh vực nagraveo đoacute được đưa vagraveo hệ chuyecircn gia lagravem cho CSTT cuat HCG phong phuacute vagrave rộng lớn hơn rất nhiều

HCG giải thiacutech caacutec bước suy luận một caacutech dễ hiểu nhất quaacuten luacutec nagraveo cũng coacute thể sử dụng ko như chuyecircn gia con người

Hạn chế của caacutec hệ chuyecircn gia

Nhược điểm lớn nhất của hệ chuyecircn gia lagrave những yacute kiến chuyecircn mocircn thường rất khoacute matilde hoacutea vagrave giải neacuten

Hệ chuyecircn gia khocircng coacute khả năng tự học tự cập nhật kiến thức mới như caacutec chuyecircn gia magrave cần phải được matilde hoacutea lại khi noacute được cập nhật

Hệ chuyecircn gia khocircng thể nhận ra được vấn đề khocircng nằm trong miền kiến thức của hệ thống

Chương 8 Tri thức vagrave tiếp nhận

1 Bao gồm caacutec vấn đề

Dữ liệu thực tế đo lường hoặc quan saacutet coacute hoặc khocircng coacute bối cảnh

Thocircng tin dữ liệu được tổng hợp một caacutech hữu iacutech để giải quyết những khoacute khăn trong việc đưa ra quyết định

Tri thức bao gồm caacutec ứng dụng quy tắc thocircng tin hướng dẫn của người ra quyết định

2 Những caacutei nhigraven về tri thức

Đại diện lagravem thế nagraveo để diễn tả tri thức viacute dụ như một quyển saacutech khocircng phải lagrave tri thức nhưng noacute lại lagrave một đại diện của tri thức

Sản xuất tri thức lagrave một tập hơp của hagraveng tồn kho coacute thể được sản xuất cũng như mua lại

Tri thức lagrave 1 trong 6 trạng thaacutei của hệ thống

1Dữ liệu 2Thocircng tin 3Cấu truacutec thocircng tin 4Sự thấu hiểu 5Yacute kiến 6 Quyết định

3 Caacutec loại tri thức Phổ biến mocirc tả dữ liệu thocircng tin thủ tục mọi thứ lagravem như thế nagraveo lập luận chiacutenh saacutech hoặc caacutec quy tắc

4 Thu thập Tri thức hệ chuyecircn gia Hầu hết caacutec phương phaacutep đều bắt đầu với mocirc higravenh của caacutec taacutec vụ trong đoacute

hệ chuyecircn gia được xacircy dựng Trong đoacute mocirc tả về caacutec lĩnh vực được tạo ra Caacutec kỹ sư sử dụng caacutec mocirc higravenh giả thuyết vagrave nhận thức về quaacute trigravenh phacircn

tiacutech để gợi ra caacutech giải quyết vấn đề về tri thức từ caacutec chuyecircn gia

5 Caacutec chiều của thu thập tri thức KE- driven caacutec kỹ sư trao đổi trực tiếp với caacutec chuyecircn gia Expert-driven Caacutec chuyecircn gia trực tiếp đưa chuyecircn mocircn của họ vagraveo hệ

thống maacutey tiacutenh Machine-driven Sử dụng caacutec cocircng cụ suy luận để triacutech xuất tri thức từ một

tập caacutec viacute dụ

6 Kỹ thuật thu thập tri thức Trao đổi gồm 2 loại cơ bản lagrave coacute cấu truacutec(coacute kịch bản) vagrave khocircng coacute cấu

truacutec( đối thoại trực tiếp) Giao thức phacircn tiacutech bằng lời Khi caacutec chuyecircn gia thực hiện một cocircng việc

của họ thigrave một bản ghi về cocircng việc đoacute được thực hiện Caacutec kỹ sư sẽ xacircy dựng mocirc higravenh cho những gigrave được ghi lại trong bản ghi

Phương phaacutep sagraveng lọc caacutec chuyecircn gia so saacutenh caacutec nhoacutem liecircn tiếp trong ba đối tượng vagrave cho biết tại sao nhoacutem thứ hai lại khaacutec nhoacutem thứ ba

7 Thu thập tri thức từ nhiều nguồn Thu thập tri thức từ nhiều nguồn lagrave cần thiết để coacute được đầy đủ caacutec tri thức

cho một vấn đề quan điểm yacute kiến traacutei ngược nhau thường phaacutet sinh Phương phaacutep đồng thuận sẽ giuacutep giải quyết được vấn đề macircu thuẫn Kỹ thuật phacircn tiacutech Meta lagrave kỹ thuật được aacutep dụng trong caacutec trường hợp

khaacutec Caacutech tiếp cận bằng định lượng đogravei hỏi caacutec kỹ sư cần cacircn nhắc yếu tố đầu vagraveo của caacutec chuyecircn gia khaacutec nhau

8 Xaacutec nhận hợp lệ vagrave kiểm tra tri thức Một khi thu thập tri thức noacute phải được đaacutenh giaacute về khả năng sử dụng vagrave độ

chiacutenh xaacutec Hai vấn đề cụ thể lagrave hiệu lực của những kiến thức vagrave kiểm tra việc xacircy dựng cơ sở của tri thức

Cần xaacutec nhận xem liệu hệ thống coacute thể hoạt động ở mức độ tối thiểu khocircng

Xaacutec minh liecircn quan đến việc so saacutenh từng chi tiết kỹ thuật của hệ thống những gigrave đatilde được thực hiện cuối cugraveng

9 Một số caacutec biện phaacutep xaacutec nhận Độ chiacutenh xaacutec Khả năng thiacutech nghi Mức độ đầy đủ Bề rộng Độ sacircu Hiệu lực Tổng quan Chiacutenh xaacutec Hiện thực Độ tin cậy Tiacutenh hữu dụng Mức độ

Chương 9 Học maacutey

1 Logic mờ vagrave ngocircn ngữ mờ(Fuzzy Logic and Linguistic Ambiguity)

Ngocircn ngữ tự nhiecircn gồm những khaacutei niệm mơ hồ vagrave khocircng chiacutenh xaacutectruyền tải ngữ nghĩa thocircng qua tiacutenh xấp xỉkhocircng rotilde ragraveng

Những xấp xỉ nagravey giuacutep con người coacute thể truyền tải hết được yacute nghĩa nhưng maacutey thigrave khocircng hiểu

Lagravem sao biểu diễn caacutec tri thức sử dụng caacutec khaacutei niệm khocircng rotilde ragraveng(mờ) hoặc khocircng chiacutenh xaacutec

2 Khaacutei niệm cơ bản của logic mờ tập mờ lagrave những tập hợp khocircng coacute một giới hạn rotilde Mỗi phần tử của noacute chỉ

chứa một mức độ hagravem liecircn thuộc của từng phần tử Vigrave vậy tập mờ khocircng giống như tập cổ điển Tập mờ coacute thể kết hợp với nhau qua những luật mờ magrave đặc trưng cho những hagravenh động trạng thaacutei vagrave thuộc tiacutenh của logic mờ được tận dụng khi thực hiện một bộ điều khiển mờ

Logic mờ dựa trecircn yacute tưởng mỗi phần tử thuộc vagraveo một tập hợp ở một mức độ nagraveo đấy

Locircgic mờ cho pheacutep độ liecircn thuộc (microA )coacute giaacute trị trong khoảng (01) Locircgic mờ coacute thể được coi lagrave mặt ứng dụng của lyacute thuyết tập mờ để xử lyacute caacutec

giaacute trị trong thế giới thực cho caacutec bagravei toaacuten phức tạp

3 So saacutenh tiacutenh đuacuteng đắn logic mờ vagrave xaacutec suất Xaacutec suất thigrave đề cập đến khả năng xảy ra một biến cố hay một điều gigrave đoacute Logic mờ đề cập đến cấp độ magrave đặc tiacutenh ở hiện tại

o viacute dụ1 người coacute chiều cao 6 feet thigrave coacute cấp độ lagrave 05 về chiều cao

4 Ưu điểm của logic mờ Caacutech tiếp cận rất tự nhiecircnkhocircng phức tạp Coacute thể mocirc higravenh hoacutea caacutec hagravem phi tuyến tugravey yacute phức tạp

Coacute thể tận dụng được kinh nghiệm từ những chuyecircn gia hagraveng đầu trong mọi lĩnh vực

Logic mờ được xacircy dựng dựa trecircn ngocircn ngữ tự nhiecircnNền tảng của logic mờ lagrave dựa trecircn cơ sở giao tiếp của con người

5 Nhược điểm của logic mờ Trong 1 hệ thống phức tạpsử dụng logic mờ coacute thể trở thagravenh trở ngại cho

việc xaacutec thực độ tin cậy của hệ thống Cơ chế lập luận mờ khocircng thể học hỏi từ những lỗi sai

6 Mạng noron nhacircn tạo(ANN) Mạng noron nhacircn tạo lagrave một mocirc phỏng xử lyacute thocircng tinđược nghiecircn cứu ra

từ hệ thống thần kinh của sinh vậtgiống như bộ natildeo để xử lyacute thocircng tin ANNs lagrave chương trigravenh dựa trecircn maacutey tiacutenh đơn giản coacute chức năng lagrave một mocirc

higravenh bagravei toaacuten khocircng gian dựa trecircn thử nghiệm vagrave baacuteo lỗi

7 Học từ kinh nghiệm Tiến trigravenh Một mẫu dữ liệu được biểu diễn như một mạng lưới noronANN ldquodự

đoaacutenrdquo 1 đầu radự đoaacuten được so saacutenh với giaacute trị thực tế hoặc giaacute trị chiacutenh xaacutecNếu đoaacuten được chiacutenh xaacutec thigrave khocircng coacute hagravenh động nagraveo được thực hiện

Nếu dự đoaacuten sai ANN kiểm tra lại vagrave xaacutec định lại thocircng số để điều chỉnh Một mẫu dữ liệu khaacutec được biểu diễn vagrave quaacute trigravenh nagravey được lặp lại

8 Nguyecircn tắc cơ bản của cocircng nghệ nơron Caacutec yếu tố xử lyacute cơ bản trong hệ thống thần kinh của con người lagrave tế bagraveo

thần kinhMạng lưới của tế bagraveo nagravey lagrave liecircn kết với nhau nhận được thocircng tin từ caacutec cảm biến trong mắt taihellip

Thocircng tin nhận được bởi tế bagraveo thần kinh hoặc lagrave sẽ kiacutech thiacutech noacute(sẽ được chuyển qua 1 thocircng điệp dọc theo mạng lưới) hoặc lagrave sẽ ngăn cản noacute(ngăn cản dograveng thocircng tin)

Độ nhạy coacute thể thay đổi qua thời gian hoặc sau khi coacute được kinh nghiệm

9 Cấu truacutec mạng Một ANN gồm 3 lớp cơ bản

Lớp đầu vagraveo nhận dữ liệu Lớp becircn trong hoặc lagrave lớp ẩn xử lyacute dữ liệu Lớp đầu ra chuyển tiếp kết quả cuối cugraveng của mạng

10Mạng nơ ron Thường coacute nhiều đầu vagraveo mỗi đầu vagraveo với mức ảnh hưởng vagrave tầm quan

trọng riecircng của noacute Một đầu vagraveo quan trọng coacute thể được sử dụng để khuếch đại đầu ra caacutec hagravem trạng thaacutei tổng hợp caacutec trọng số của caacutec yếu tố

đầuvagraveo khaacutec nhauvagraveo một giaacute trị duy nhất Caacutec hagravem chuyển giao xử lyacute caacutec giaacute trị trạng thaacutei vagrave tạo đầu ra

11Huấn luyện mạng nơ ron Trong mocirc higravenh coacute giaacutem saacutetANN được đến so saacutenh dự đoaacuten của chiacutenh

noacute với thocircng tin phản hồi coacute chứa caacutec kết quả mong muốn ANN sẽ phải tigravem caacutech thay đổi caacutec tham số becircn trong củamigravenh (caacutec trọng số vagrave caacutec ngưỡng) để tạo necircn một aacutenh xạ coacute khả năng aacutenh xạcaacutec đầu vagraveo thagravenh caacutec đầu ra mong muốn Sự thay đổi nagravey được tiến hagravenh nhờ việc so saacutenh giữa đầu ra thực sự vagrave đầu ra mong muốn

Trong mocirc higravenh khocircng coacute giaacutem saacutetANN nhận được dữ liệu vagraveo nhưng khocircng phải coacute bất kỳ thocircng tin phản hồi về kết quả mong muốn

Phần lớn caacutec ứng dụng nằm trong vugraveng của caacutec bagravei toaacuten ước lượng như mocirc higravenh hoacuteathống kecirc neacuten lọc phacircn cụm

12Lợi iacutech Liecircn kết với mạng noron Traacutenh caacutech lập trigravenh tường minh Giảm nhu cầu của chuyecircn gia ANNs thigrave thiacutech nghi với caacutec yếu tố đầu vagraveo thay đổi Khocircng cần thiết cho cơ sở tri thức tinh chế ANNs coacute tiacutenh động vagrave cải thiện với việc sử dụng Coacute khả năng xử lyacute dữ liệu khocircng chiacutenh xaacutec hoặc khocircng đầy đủ Cho pheacutep tổng quaacutet hoacutea từ thocircng tin cụ thể Cho pheacutep thu thập cảm giaacutec thocircng thường vagraveo miền giải quyết vấn đề

13Hạn chế của việc liecircn kết với mạng noron ANNs khocircng thể giải thiacutech được suy luận Bản chất hộp đen thường khiến cho vấn đề traacutech nhiệm vagrave độ tin cậy phaacutet

sinh lagrave khoacute khăn Lặp đi lặp lại quaacute trigravenh huấn luyện rất tốn thời gian Nguồn lực caacutec nhagrave phacircn tiacutech vagrave thiết kế coacute tay nghề cao vẫn lagrave đaacuteng lo

ngại Cocircng nghệ ANN thuacutec đẩy hạn chế của phần cứng hiện tại ANN yecircu cầu phải coacute sự tin tưởng ở đầu ra

14Giới thiệu về thuật toaacuten di truyền Cũng như mạng lưới thần kinh caacutec thuật toaacuten di truyền được dựa trecircn lyacute

thuyết sinh học Thuật toaacuten di truyền tigravem thấy nguồn gốc của chuacuteng trong caacutec lyacute thuyết

tiến hoacutea của chọn lọc tự nhiecircn vagrave thiacutech ứng với biến đổi khiacute hậu Kết quả thuật toaacuten di truyền lagrave từ giao phối 2 caacute thể trong quần thế để tạo

ra con caacutei đocirci khi tốt hơn so với bậc cha mẹ của chuacuteng 15Caacutec thagravenh phần cơ bản của thuật toaacuten di truyền

Toaacuten tử chọn lọc Caacutec caacute thể tốt được chọn lọc để đưa vagraveo thế hệ sau Sự chọn lọc nagravey căn cứ vagraveo độ thiacutech nghi với mocirci trường của mỗi caacute thể

Toaacuten tử lai gheacutep (crossover) Hai caacute thể cha vagrave mẹ trao đổi caacutec gen với nhau để tạo ra caacute thể con

Toaacuten tử đột biến (mutation) Một caacute thể thay đổi một số gen để biến đổi thagravenh một caacute thể mớiTất cả caacutec toaacuten tử trecircn khi thực hiện đều mang tiacutenh ngẫu nhiecircn

16Quaacute trigravenh cơ bản của một thuật toaacuten di truyền Khởi tạo

Đaacutenh giaacute quần thể

Lựa chọn NST thiacutech hợp nhất vagrave loại bỏ NST yếu nhất

Quy trigravenh giao nhau vagrave cải thiện quần thể

đột biến tiến trigravenh để khaacutem phaacute ra NST mới

17Ưu nhược điểm của việc kết hợp với thuật toaacuten di truyền Kiacutech thước quần thể lagrave 1 yếu tố quan trọng trong tốc độ của việc tigravem

kiếmnhưng noacute tương đối dễ dagraveng để dự đoaacuten tốc độ nagravey Giao nhau hoặc đột biến lagrave khocircng necircn đc sử dụng quaacute thường xuyecircn Luocircn coacute được iacutet nhất 1 giải phaacutep hợp lyacute Necircn coacute thể aacutep dụng chuacuteng cho caacutec vấn đề magrave chuacuteng ta khocircng coacute hướng

về caacutech giải quyết Sức mạnh của thuật toaacuten xuất phaacutet từ khaacutei niệm đơn giảnkhocircng phải từ

một thủ tục thuật toaacuten phức tạp 18Tương lai của học maacutey

Mạng lưới thần kinh nhacircn tạo vượt quaacute năng lực của con người trong caacutec trường hợp bị cocirc lập

Về mặt lyacute thuyếtmột maacutey tiacutenh coacute thể xử lyacute dũ liệu nhanh hơn hagraveng triệu lần so với 1 con người

May mắn thay cho chuacuteng tacon người tốt hơn nhiều khi magrave coacute được dữ liệumaacutey tiacutenh khocircng coacute 1 số thứ như lagrave 5 giaacutec quan

CHƯƠNG 10 KHO DỮ LIỆU

1 Kho dữ liệu Kho dữ liệu lagrave tuyển tập caacutec cơ sở dữ liệu tiacutech hợp hướng chủ đề được

thiết kế để trợ giuacutep cho một hệ hỗ trợ quyết định

Theo John Ladley Cocircng nghệ kho dữ liệu lagrave tập caacutec phương phaacutep kỹ thuật vagrave caacutec cocircng cụ coacute thể kết hợp hỗ trợ nhau để cung cấp thocircng tin cho người sử dụng trecircn cơ sở tiacutech hợp từ nhiều nguồn dữ liệu nhiều mocirci trường khaacutec nhau

Kho dữ liệu thường rất lớn tới hagraveng trăm GB hay thậm chiacute hagraveng Terabyte

2 Kho dữ liệu vận hagravenh (ODS) Một kho dữ liệu vận hagravenh Aacutep dụng kỹ thuật kho dữ liệu vagraveo caacutec hệ xử

lyacute giao taacutec lưu trữ dữ liệu cho một ứng dụng đặc thugrave Noacute đưa vagraveo kho dữ liệu một dograveng caacutec dữ liệu thocirc được thiết kế

3 So saacutenh

Kho dữ liệu vận hagravenh Kho dữ liệu

Dữ liệu theo chủ đề Dữ liệu theo chủ đề

Dữ liệu tiacutech hợp Dữ liệu tiacutech hợp

Dữ liệu thay đổi Dữ liệu khocircng thay đổi

Dữ liệu được cập nhật khi thay đổi

Dữ liệu giữ nguyecircn

Chỉ coacute dữ liệu hiện tạiDữliệu hiện tại vagrave dữ liệu lịch sử

Chu kỳ lagravem tươi dữ liệu ngắn Chu kỳ lagravem tươi dữ liệu dagravei

Chỉ coacute dữ liệu chi tiết Dữ liệu chi tiết vagrave dữ liệu tổng kết

Dugraveng cho caacutec quyết định ngắn hạn

Dugraveng cho hoạch định dagravei hạn

4 Kho dữ liệu cục bộ (Data Mart - DM)

Kho dữ liệu cục bộ lagrave CSDL coacute những đặc điểm giống với kho dữ liệu nhưng với quy mocirc nhỏ hơn vagrave lưu trữ dữ liệu về một lĩnh vực một chuyecircn ngagravenh

Data mart phụ thuộc Chứa những dữ liệu được lấy từ DW vagrave những dữ liệu nagravey sẽ được triacutech lọc vagrave tinh chế tiacutech hợp lại ở mức cao hơn để phục vụ một chủ đề nhất định của Datamart

Data mart độc lập Khocircng giống như Datamart phụ thuộc Data mart độc lập được xacircy dựng trước DW vagrave dữ liệu được trực tiếp lấy từ caacutec nguồn khaacutec nhau

5 Siecircu dữ liệu Metadata lagrave dữ liệu để mocirc tả dữ liệu Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột

một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi Metadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu

6 Mocirci trường kho dữ liệu Hệ thống của tổ chức vagrave kho cung cấp dữ liệu để xacircy dựng kho dữ liệu Trong quaacute trigravenh chuyển dữ liệu từ caacutec nguồn khaacutec nhau dữ liệu coacute thể

được lagravem sạch hoặc chuyển đổi vagrave vigrave thế DW được xem như lagrave một chuẩn cho việc lưu trữ

Đồng thời siecircu dữ liệu được ghi lại Cuối cugraveng DW hoặc siecircu thị coacute thể được sử dụng để tạo ra một kho dữ

liệu ldquocaacute nhacircnrdquo 7 Caacutec đặc điểm của kho dữ liệu

Đặc điểm Mocirc tả

Hướng chủ đề - DL tổ chức theo caacutech thức người dugraveng tham chiếu

Tiacutech hợp - Dữ liệu ldquosạchrdquo loại bỏ tiacutenh thiếu nhất quaacuten

Khocircng thay đổi - DL ldquochỉ đọcrdquo người dugraveng khocircng thay đổi được

Chuỗi thời gian - DL lagrave chuỗi thời gian khocircng phải lagrave trạng thaacutei hiện tại

Được tổng kết - DL vận hagravenhthao taacutec khi cần thiết

được kết hợp lại thagravenh dạng coacute thể dugraveng được cho quyết định

Kiacutech cỡ lớn hơn - Lưu giữ theo chuỗi thời gian tức lagrave giữ lại nhiều DL

Khocircng được chuẩn hoacutea - Coacute thể dư thừa DLSiecircu dữ liệu - Dữ liệu của dữ liệu được lưu trữNguồn dữ liệu - DL vận hagravenh (caacutec hệ sẵn coacute) cugraveng

với caacutec nguồn ngoagravei 8 Kho dữ liệu hướng chủ đề

Hướng chủ để coacute nghĩa lagrave kho dữ liệu được tổ chức xung quanh caacutec chủ đề chiacutenh như khaacutech hagraveng sản phẩm sản xuất Tập trung vagraveo việc mocirc higravenh hoacutea vagrave phacircn tiacutech dữ liệu cho caacutec nhagrave ra quyết định magrave khocircng tập trung vagraveo caacutec xử lyacute thocircng thường Cung cấp cho người dugraveng một khung nhigraven toagraven vẹn đơn giản vagrave đầy đủ về caacutec sự kiện quanh caacutec chủ đề

9 Dữ liệu trong DW được tiacutech hợp Dữ liệu trong kho dữ liệu được xacircy dựng bằng caacutech tổng hợp dữ liệu từ

nhiều nguồn khaacutec nhau vagrave caacutec nguồn coacute tổ chức khaacutec nhau Cơ sở dữ liệu caacutec file excel caacutec flat file hoặc caacutec raw file Khi đưa vagraveo kho dữ liệu caacutec dữ liệu được lagravem sạch vagrave tiacutech hợp dữ liệu nhằm đảm bảo tiacutenh nhất quaacuten của dữ liệu

10Kiến truacutec kho dữ liệu Tầng cơ sở dữ liệu hoạt động Tầng truy xuất thocircng tin Tầng truy xuất dữ liệu Tầng siecircu dữ liệu Tầng quản lyacute tiến trigravenh Tầng thocircng điệp của ứng dụng Tầng vật liacute của kho dữ liệu Tầng trigravenh diễn dữ liệu

11Higravenh trạng kho dữ liệu Kho dữ liệu ảo - người dugraveng cuối coacute thể truy cập trực tiếp đến kho dữ liệu

sử dụng caacutec cocircng cụ cho pheacutep ở tầng truy xuất dữ liệu Kho dữ liệu trung tacircm-1 cơ sở dữ liệu vật lyacute chứa tất cả dữ liệu cho một

vugraveng chuyecircn dụng nagraveo đoacute

Kho dữ liệu phacircn taacuten- Thagravenh phần được phacircn taacuten qua nhiều hệ cơ sở dữ liệu vật lyacute

12METADATA- Siecircu dữ liệu Định nghĩa Siecircu dữ liệu lagrave dữ liệu về dữ liệu Lagrave 1 lưu trữ dugraveng để

Miecircu tả kho dữ liệu tổng thể Nhận dạng kiểu kho dữ liệu Quản liacute quaacute trigravenh tiacutech hợp dữ liệu Quản liacute quaacute trigravenh cập nhật kho dữ liệu Quản liacute bảo mật

Lagrave chigravea khoacutea quyết định sự thagravenh cocircng của kho dữ liệu luocircn được thay đổi vagrave cập nhật theo sự phaacutet triển của kho dữ liệu

Dugraveng để quản liacute điều khiển kho dữ liệu Sự ra đời của kho dữ liệu như 1 cấu truacutec hỗ trợ ra quyết định siecircu dữ liệu

được xem như nguồn tagravei nguyecircn dữ liệu Siecircu dữ liệu lagrave trừu tượng Chuacuteng lagrave dữ liệu bậc cao cung cấp mocirc tả ngắn

gọn caacutec dữ liệu bậc thấp hơn 13Hoạt động của Siecircu dữ liệu

Siecircu dữ liệu rất cần thiết trong việc chuyển hoacutea thocircng tin trở thagravenh tri thức Lagrave chigravea khoacutea giuacutep chuacuteng ta xử lyacute được dữ liệu thocirc Viacute dụ một dograveng dữ liệu baacuten hagraveng 1023 K596 11121 agraveNoacute sẽ khocircng coacute nghĩa gigrave cho đến khi chuacuteng ta đưa vagraveo siecircu dữ liệu (thư

mục chứa dữ liệu) agrave cửa hagraveng 1023 sản phẩm K596 vagrave số tiền baacuten được lagrave 11121 đocirc la

14Sự cần thiết phải nhất quaacuten trong kho dữ liệu Kho dữ liệu được xacircy dựng cho lợi iacutech của những nhagrave phacircn tiacutech kinh

doanh caacutec nhagrave quản trị cho tất cả caacutec khu vực chức năng Trong cơ sở dữ liệu riecircng caacutec khu vực khaacutec nhau coacute thể định nghĩa vagrave lưu

trữ dữ liệu thocircng qua phiecircn bản của chiacutenh noacute Khi dữ liệu được lấy từ những vugraveng khaacutec nhau đoacute vagrave được đặt vagraveo kho dữ

liệu Việc chuyển đổi vagrave lagravem sạch caacutec tiến trigravenh sẽ đảm bảo noacute lagrave duy nhất được tiacutech hợp tại một mức của tổ chức

15Ragrave soaacutet lại dữ liệu ndash Thực thi siecircu dữ liệu

Bất kể cấu truacutec tự nhiecircn của 1 cacircu truy vấn thế nagraveo thigrave caacutec thagravenh phần của siecircu dữ liệu rất quan trọng đối với người ra quyết định

Bảng thuộc tiacutenh khoacutea được lưu trữ bởi kho dữ liệu Tập hợp dữ liệu được lấy từ đacircu Những chuyển đổi nagraveo được thực thi với việc lagravem sạch

16Siecircu dữ liệu lagrave gigrave Metadata - lagrave thocircng tin mocirc tả nội dung của cơ sở dữ liệu (CSDL) Metadata baacuteo cho người dugraveng biết thời gian cập nhật sau cugraveng của dữ liệu

định dạng vagrave mục điacutech sử dụng của noacute Những thocircng tin nagravey coacute thể hướng dẫn người dugraveng duyệt qua CSDL vagrave

giuacutep họ hiểu được yacute nghĩa vagrave ngữ cảnh của dữ liệu Trong CSDL metadata lagrave caacutec dạng biểu diễn khaacutec nhau của caacutec đối tượng

trong CSDL Trong CSDL quan hệ metadata lagrave caacutec định nghĩa của bảng cột CSDL

view vagrave nhiều đối tượng khaacutec Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột

một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi -gtMetadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu

Bảng chuyển đổi Ghi lại những chuyển đổi đatilde được thực hiện

Lịch sử thực thi Ghi lại những dữ liệu đatilde được

phacircn tiacutech

Higravenh thaacutei kết nốiGhi lại những dữ liệu được kết nối vagrave tần suất

17Aacutenh xạ thocircng thường của siecircu dữ liệu Bản ghi aacutenh xạ chuyển đổi bao gồm

Định danh của nguồn gốc Chuyển đổi thuộc tiacutenh Chuyển đổi thuộc tiacutenh vật lyacute Matilde hoacutea tham chiếu bảng chuyển đổi Đổi tecircn Đổi khoacutea Gaacuten giaacute trị cho thuộc tiacutenh mặc định Chọn logic cho caacutec nguồn nhiều giaacute trị Đổi thuật toaacuten

18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để

phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai

lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave

tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec

Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm

Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo

19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua

caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau

SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được

Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra

một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức

Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ

Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ

Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech

CHƯƠNG 11 KHAI PHAacute DỮ LIỆU

1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn

ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993

Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng

2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd

1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều

2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP

3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn

4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng

5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server

6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo

7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động

8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời

9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều

10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện

11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech

12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP

3 Xử lyacute phacircn tiacutech trực tuyến OLAP

MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave

dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu

ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave

thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu

HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave

ROLAP4 Khai phaacute dữ liệu

Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh

khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn

Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan

5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp

6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại

Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp

Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec

Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt

Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra

Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh

vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho

Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec

Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm

Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục

Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng

gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp

Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn

Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec

Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper

Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2

Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25

Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước

Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng

Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện

trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp

Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute

độ hỗ trợ ge ngưỡng minsup

độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan

Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn

Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết

Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu

MOLAP ROLAP HOLAP

Lưu trữ dữ liệu cơ sở

Khối Bảng quan hệ Bảng quan hệ

Lưu trữ thocircng tin tổng hợp

Khối Bảng quan hệ Khối

Hiệu suất thực hiện truy vấn

Nhanh nhất Chậm nhất Nhanh

Tiecircu thụ khocircng gian lưu trữ

Nhiều Thấp Trung bigravenh

Chi phiacute bảo trigrave Cao Thấp Trung bigravenh

Page 10: De cuong(1-11)

Quyết định sản phẩm nagraveo được sản xuất Quyết định đầu tư vagraveo đacircu Quyền đặt vagrave quản lyacute quản lyacute giaacute Thanh toaacuten vagrave khấu trừ tiền latildei

bChiacutenh trị Yếu tố cốt lotildei trong quaacute trigravenh higravenh thagravenh chiến lược ra quyết định Chiacutenh trị liecircn quan tới việc ra quyết định thocircng qua đagravem phaacutenảnh hưởngvagrave higravenh

thagravenh sự nhất triacute Trong nhiều trường hợp noacute coacute thể cho ta sự linh hoạt hơn

18Hệ trợ giuacutep quyết định trong tổ chức DSS của 1 tổ chức hỗ trợ cocircng nghệ tập trung vagraveo caacutec quyết định ảnh hưởng tới

rất nhiều người 1 hệ thống DSS hiện đại coacute thể chấp nhận nhiều quyết định vượt qua những giới

hạn phacircn cấp truyền thống aCaacutec hoạt động gần DSS

Giải quyết caacutec nhiệm vụ đặc biệt Thu thập thocircng tin Liecircn lạc qua caacutec chi nhaacutenh Động thaacutei chiacutenh trị

Phacircn loại tư duy chiến lược cho DSS Sắp xếp quyết địnhXếp hạng quyết định sao cho thứ tự đứng trước thigrave được

ưu tiecircn trước Chia sẻ thocircng tinCaacutec quyecirct định coacute thể độc lập nhưng người ra quyết định

phải chia sẻ caacutec thocircng tin liecircn quan Lựa chọn đagravem phaacutenVagravei quyết định coacute thể xaacutec lập thocircng qua đagravem phaacuten vagrave kết

quả được lagravem đồng thờiKhocircng phải cocircng nghệ tự noacute coacute thể đưa ra quyết định magrave noacute nằm ở trigravenh độ cocircng nghệ hỗ trợ caacutec chiến lược quyết định quyền lực vagrave chiacutenh trị cugraveng phối hợp với nhau

Chương 4Mocirc higravenh hoacutea quaacute trigravenh ra quyết định

(Cấu truacutec của hệ HTQD)19Vấn đề Mocirc higravenh

bull Lagrave phần tử chủ chốt trong hầu hết hệ hỗ trợ quyết định vagrave lagrave điều kiện cần trong hệ hỗ trợ quyết định dựa vagraveo mocirc higravenh (model-based DSS)

bull Coacute nhiều lớp mocirc higravenh kegravem theo lagrave caacutec kỹ thuật xử lyacute thao taacutec mocirc higravenh đặc thugrave tương ứng

bull Caacutec vấn đề chiacutenh nhận diện bagravei toaacuten vagrave phacircn tiacutech mocirci trường nhận diện biến số dự baacuteo đa mocirc higravenh caacutec phạm trugrave mocirc higravenh quản lyacute mocirc higravenh vagrave mocirc higravenh hoacutea dựa vagraveo kiến thức

bull Mocirc higravenh hoacutea lagrave taacutec vụ khocircng đơn giản Người xacircy dựng mocirc higravenh phải cacircn bằng giữa tiacutenh đơn giản của mocirc higravenh với caacutec yecircu cầu biểu diễn để mocirc higravenh coacute thể nắm bắt đủ thực tại cần thiết cho người ra quyết định

bull Mocirc phỏng lagrave kỹ thuật mocirc higravenh hoacutea thocircng dụng dugraveng để tigravem hiểu vấn đề tuy khocircng nhất thiết phải tigravem ra được caacutec giải phaacutep biến thể mở rộng quaacute trigravenh ra quyết định của tổ chức vagrave cho pheacutep tổ chức xem xeacutet taacutec độngảnh hưởng của caacutec chọn lựa tương lai

bull Mocirc phỏng tiết kiệm rất nhiều chi phiacute vagrave thời gian ndash rất dễ thay đổi mocirc higravenh hoạt động của một hệ thống vật lyacute bằng mocirc higravenh hoacutea maacutey tiacutenh

bull Mocirc higravenh coacute thể được phaacutet triển vagrave cagravei đặt bằng một số caacutec ngocircn ngữ lập trinh (thế hệ 3 4 ) vagrave hệ thống phần mềm khaacutec nhau

Mocirc higravenh tĩnh vagrave động

bull Mocirc higravenh tĩnh thể hiện bức tranh tại thời điểm của tigravenh huống Caacutec khiacutea cạnh của bagravei toaacuten được xeacutet một thời kỳ nhất định trong một khung thời gian nhất định (coacute thể ldquocuốnrdquo về tương lai) Caacutec tigravenh huống được giả sử lagrave sẽ lập lại với tập caacutec điều kiện đồng nhất

1048713 Giả định coacute được tiacutenh ổn định của dữ liệu 1048713 Mocirc phỏng quaacute trigravenh dạng tĩnh - lagravem việc trecircn caacutec trạng thaacutei ổn định để tigravem ra caacutec

thocircng số tối ưu ndash thường được dugraveng như cocircng cụ chủ yếu để thiết kế quaacute trigravenh 1048713 vd quyết định sản xuấtmua 1 sản phẩm baacuteo caacuteo thu nhập hagraveng quyacutenăm bull Mocirc higravenh động biểu diễn caacutec kịch bản thay đổi theo thời gian 1048713 Phụ thuộc thời gian caacutec trạng thaacutei thay đổi theo thời gian 1048713 Thường dugraveng để tạo sinh vagrave biểu diễn caacutec xu hướng vagrave khuocircn mẫu theo thời gian 1048713 Mocirc phỏng động thể hiện caacutec diễn tiến khi caacutec điều kiện theo thời gian khaacutec với caacutec

trạng thaacutei ổn định ndash thường được dugraveng để thiết kế việc kiểm soaacutet caacutec hệ thống 1048713 VD dự baacuteo lời-lỗ trong 5 năm với caacutec nhập lượng như giaacute phiacute số lượng thay đổi

theo từng năm

Mocirc higravenh chắc chắn tương đối dễ phaacutet triển giải quyết vagrave coacute thể sinh ra caacutec giải phaacutep tối ưu 1048713 Caacutec bagravei toaacuten coacute một số lớnvocirc hạn caacutec giải phaacutep khả thi đặc biệt quan trọng 1048713 Caacutec mocirc higravenh tagravei chaacutenh được xacircy dựng trong điều kiện chắc chắn

Mocirc higravenh bất địnhbằng caacutech thu thập thecircm thocircng tin cố gắng đưa bagravei toaacuten trở về dạng chắc chắn hay dạng

rủi ro Mocirc higravenh rủi ro caacutec quyết định kinh doanh được đưa ra dưới caacutec rủi ro giả định

1048713 Đocirci khi biết được xaacutec suất của caacutec sự kiện xảy ra trong tương lai 1048713 Caacutec trường hợp khaacutec (bất định) ước lượng caacutec rủi ro vagrave giả sử caacutec tigravenh huống rủi ro

xảy ra 20Mocirc higravenh hoacutea

MOcirc HIgraveNH HOacuteA BẰNG BẢNG TIacuteNH bull Bảng tiacutenh phần mềm mạnh linh hoạt vagrave dễ dugraveng cho pheacutep tạo sinh caacutec ứng dụng trong kinh doanh kỹ thuật toaacuten vagrave khoa học với tập caacutec hagravem mạnh về tagravei chaacutenh thống kecirc toaacuten bull Kegravem theo lagrave caacutec thagravenh phần cộng thecircm (add-ins) giuacutep xacircy dựng vagrave giải caacutec lớp mocirc higravenh đặc thugrave bull Lagrave cocircng cụ mocirc higravenh hoacutea thocircng dụng nhất của người dugraveng cuối cugraveng bull Coacute caacutec chức năng về phacircn tiacutech ldquowhat-ifrdquo dograve tigravem mục tiecircu quản lyacute dữ liệu vagrave lập trigravenh (dạng macro) bull Coacute khả năng đọc ghi caacutec cấu truacutec tập tin thocircng dụng để giao tiếp được với caacutec CSDL vagrave cocircng cụ khaacutec bull Coacute thể xacircy dựng mocirc higravenh tĩnh vagrave động bull Dugraveng trecircn maacutey tiacutenh caacute nhacircn vagrave maacutey tiacutenh lớn

bull Cơ sở để xacircy dựng caacutec bảng tiacutenh đa chiều vagrave caacutec cocircng cụ xử lyacute phacircn tiacutech trực tuyến (OLAP) MOcirc HIgraveNH HOacuteA BẰNG PHAcircN TIacuteCH QUYẾT ĐỊNH bull Tiếp cận mocirc higravenh hoacutea caacutec tigravenh huống quyết định coacute một số hữu hạnkhocircng quaacute nhiều caacutec phương aacuten ndash mỗi phương aacuten được trigravenh ra dưới dạng bảng hay đồ thị - caacutec kết quả tương ứng (dự baacuteo được kegravem xaacutec suất) theo mục tiecircu bagravei toaacuten ndash từ đoacute chọn phương aacuten tốt nhất bull Đơn mục tiecircu bảng quyết định hay cacircy quyết định bull Đa mục tiecircu AHP (analytic hierarchy process) khaacutec

MOcirc HIgraveNH HOacuteA BẰNG QUY HOẠCH TOAacuteN

bull Quy hoạch toaacuten học (mathematical programming) lagrave họ caacutec cocircng cụ giải quyết caacutec bagravei toaacuten quản lyacute theo đoacute người ra quyết định phải cấp phaacutet caacutec tagravei nguyecircn khan hiếm cho caacutec hoạt động cạnh tranh nhau (caacutec phương aacuten) nhằm tối ưu hoacutea mục tiecircu coacute khả năng đo lường được bull Caacutec mocirc higravenh quy hoạch tuyến tiacutenh (linear programming) thocircng dụng nhất trong quy hoạch toaacuten coacute nhiều ứng dụng trong thực tế được dugraveng nhiều trong caacutec hệ hỗ trợ quyết định bull Bagravei toaacuten quy hoạch tuyến tiacutenh 1048713 Caacutec biến quyết định (cần tigravem giaacute trị) 1048713 Hagravem mục tiecircu (hagravem toaacuten học dạng tuyến tiacutenh xaacutec định quan hệ giữa biến quyết định vagrave mục tiecircu đo lường mức độ đạt đạt mục tiecircu vagrave cần được tối ưu hoacutea) 1048713 Caacutec hệ số của hagravem mục tiecircu (cho biết mức đoacuteng goacutep vagraveo mục tiecircu của 1 đơn vị biến quyết định) 1048713 Ragraveng buộc (biểu thức tuyến tiacutenh cho biết giới hạn tagravei nguyecircn vagravehay caacutec quan hệ giữa caacutec biến số) 1048713 Dung lượng (mocirc tả cận trecircn vagrave dưới của caacutec biến vagrave ragraveng buộc) 1048713 Hệ số (cocircng nghệ) vagraveo-ra (cho biết mức độ sử dụng tagravei nguyecircn của biến quyết định) bull Đặc điểm của bagravei toaacuten quy hoạch tuyến tiacutenh 1048713 Tagravei nguyecircn kinh tế của bagravei toaacuten lagrave coacute hạn vagrave sẵn sagraveng 1048713 Coacute nhiều caacutech (gt2 caacutech) sử dụng tagravei nguyecircn được gọi lagrave giải phaacutep hay chương trigravenh 1048713 Mỗi hoạt động dugraveng tagravei nguyecircn đều sinh ra kết quả dưới dạng mục tiecircu đatilde phaacutet biểu trước 1048713 Việc cấp phaacutet nằm trong caacutec ragraveng buộc cho trước bull Giả định của bagravei toaacuten quy hoạch tuyến tiacutenh 1048713 Caacutec kết quả của caacutec cấp phaacutet coacute thể đem so saacutenh với nhau coacute thể đo lường bằng một đơn vị chung

1048713 Caacutec cấp phaacutet độc lập với nhau về mặt kết quả 1048713 Kết quả cuối cugraveng lagrave tổng của caacutec kết quả từ caacutec hoạt động riecircng rẽ khaacutec nhau 1048713 Dữ liệu coacute tiacutenh chắc chắn 1048713 Tagravei nguyecircn được dugraveng một caacutech kinh tế nhất 1048713 Thường coacute một số lớn caacutec giải phaacutep với kết quả khaacutec nhau 1048713 Trong số caacutec giải phaacutep coacute thể coacute 1 giải phaacutep tốt nhất ndash mức độ đạt được mục tiecircu cao nhất ndash gọi lagrave giải phaacutep tối ưu được tigravem ra bằng một giải thuật đặc biệt MOcirc HIgraveNH HOacuteA BẰNG HEURISTIC bull Việc tigravem giải phaacutep tối ưu của một số bagravei toaacuten quyết định phức tạp coacute thể tốn nhiều thời gian chi phiacute hay khocircng thể tigravem ra được Cograven nếu dugraveng tiếp cận mocirc phỏng cũng coacute thể keacuteo dagravei phức tạp khocircng thiacutech hợp hay thậm chiacute khocircng chiacutenh xaacutec

bull Lagrave một tiếp cận giuacutep tigravem ra caacutec giải phaacutep khả thithỏa matildenđủ tốt cho caacutec bagravei toaacuten phức tạp Coacute thể coacute giải phaacutep đủ tốt (90-999 giaacute trị của lời giải tối ưu) nhanh choacuteng vagrave đỡ tốn keacutem hơn bằng caacutech dugraveng heuristics bull Quaacute trigravenh heuristic lagrave datildey caacutec bước xacircy dựng caacutec quy luật giải quyết vấn đề thocircng qua việc tigravem kiếm caacutec con đường hứa hẹn nhất dẫn đến lời giải tigravem kiếm caacutech thức thu thập vagrave phacircn giải thocircng tin theo quaacute trigravenh giải vagrave phaacutet triền caacutec phương phaacutep dẫn đến một giải thuật tiacutenh toaacuten hay một lời giải tổng quaacutet đatilde coacute bull Aacutep dụng chủ yếu cho bagravei toaacuten cấu truacutec yếu cũng dugraveng để tigravem ra giải phaacutep chấp nhận được cho bagravei toaacuten cấu truacutec chặt bull Khocircng đủ tổng quaacutet như caacutec giải thuật thường chỉ dugraveng cho tigravenh huống đặc thugrave đang xeacutet bull Coacute thể dẫn đến một giải phaacutep dở - caacutec thủ tục từng bước giải quyết vấn đề khocircng đảm bảo tigravem ra giải phaacutep tối ưu bull Heuristic coacute thể lagrave định lượng vigrave vậy coacute thể đoacuteng vai trograve quan trọng trong cơ sở mocirc higravenh của hệ hỗ trợ quyết định bull Heuristic coacute thể lagrave định tiacutenh vigrave vậy coacute thể đoacuteng vai trograve quan trọng trong cung ứng kiến thức cho hệ chuyecircn gia bull Quaacute trigravenh heuristic liecircn quan đến tigravem kiếm học tập ước lượng phacircn xử vagrave lặp lại caacutec hoạt động nagravey dọc theo tiến trigravenh bull Kiến thức thu được dugrave thagravenh cocircng hay thất bại trong quaacute trigravenh đều được phản hồi vagrave sửa đổi chiacutenh quaacute trigravenh nhờ đoacute coacute thể định nghĩa lại mục tiecircu hay bagravei toaacuten 1048713 Giải thuật di truyền bắt đầu bằng tập caacutec giải phaacutep được sinh ngẫu nhiecircn taacutei kết hợp caacutec cặp giải phaacutep một caacutech ngẫu nhiecircn bull Tigravenh huống necircn dugraveng heuristics 1048713 Dữ liệu đầu vagraveo khocircng chiacutenh xaacutec hay coacute giới hạn 1048713 Thực tế quaacute phức tạp đến nỗi khocircng dugraveng được caacutec mocirc higravenh tối ưu 1048713 Chưa coacute được giải thuật chiacutenh xaacutec vagrave đủ tin cậy 1048713 Bagravei toaacuten phức tạp necircn sẽ khocircng kinh tế nếu dugraveng tối ưu hay mocirc phỏng hoặc tốn quaacute nhiều thời gian tiacutenh toaacuten 1048713 Coacute thể cải thiện tiacutenh hiệu quả của quaacute trigravenh tối ưu (tức coacute thể sinh ra caacutec giải phaacutep ban đầu tương đối tốt) 1048713 Liecircn quan đến xử lyacute kyacute hiệu chứ khocircng phải xử lyacute kyacute số (như hệ chuyecircn gia) 1048713 Cần coacute quyết định nhanh vagrave caacutec xử lyacute dựa vagraveo maacutey tiacutenh đều khocircng khả thi (một số heuristic khocircng cần đến maacutey tiacutenh) bull Thuận lợi 1048713 Dễ hiểu dễ giải thiacutech vagrave dễ cagravei đặt 1048713 Nacircng cao tiacutenh saacuteng tạo vagrave năng lực heuristic cho caacutec vấn đề khaacutec 1048713 Tiết kiệm thời gian xaacutec lập vấn đề 1048713 Tiết kiệm yecircu cầu về bộ chứa vagrave xử lyacute maacutey tiacutenh

1048713 Tiết kiệm thời gian tiacutenh toaacuten vagrave do vậy tiết kiệm thời gian thực trong ra quyết định Một số vấn đề phức tạp đến nỗi chỉ coacute thể giải được bằng heuristics 1048713 Thường sinh ra nhiều giải phaacutep chấp nhận được 1048713 Thường coacute thể phaacutet biểu lyacute thuyết hay đo lường thực nghiệm về chất lượng của giải phaacutep (tức giaacute trị mục tiecircu của giải phaacutep gần với giaacute trị tồi ưu đến mức nagraveo dugrave giaacute trị tối ưu chưa biết được) 1048713 Coacute thể kết hợp tiacutenh thocircng minh vagraveo để hướng dẫn pheacutep tigravem kiếm (tigravem kiếm tabu) Năng lực thocircng minh đoacute coacute thể lagrave đặc thugrave theo bagravei toaacuten hoặc dựa trecircn yacute kiến chuyecircn gia được cấy trong hệ chuyecircn gia hoặc cơ chế tigravem kiếm 1048713 Coacute thể dugraveng heuristic hiệu quả vagraveo caacutec mocirc higravenh coacute thể giải bằng quy hoạch toaacuten học Đocirci khi heuristic lagrave phương phaacutep được ưa thiacutech hơn khi khaacutec giải phaacutep heuristics được dugraveng như giải phaacutep ban đầu cho caacutec phương phaacutep quy hoạch toaacuten học bull Hạn chế 1048713 Khocircng đảm bảo coacute được giải phaacutep tối ưu 1048713 Caacutec quy luật coacute rất nhiều ngoại lệ 1048713 Caacutec lựa chọn quyết định tuần tự coacute thể khocircng tiecircn đoaacuten được caacutec kết cục tương lai của mỗi chọn lựa 1048713 Sự liecircn thuộc giữa caacutec phần trong hệ thống đocirci khi coacute thể gacircy ra caacutec ảnh hưởng lớn lao lecircn toagraven hệ thống bull Phacircn loại caacutec giải thuật heuristic 1048713 Heuristic xacircy dựng xacircy dựng giải phaacutep khả thi bằng caacutech cộng thecircm từng thagravenh phần một VD bagravei toaacuten người baacuten hagraveng ndash luocircn gheacute thagravenh phố chưa viếng thăm kế tiếp gần nhất

1048713 Heuristic cải tiến bắt đầu bằng một giải phaacutep khả thi vagrave cố gắng cải tiến liecircn tục trecircn đoacute VD trecircn thử hoaacuten đổi 2 thagravenh phố 1048713 Quy hoạch toaacuten aacutep dụng vagraveo caacutec mocirc higravenh chứa iacutet ragraveng buộc nhằm coacute được thocircng tin về thỏa hiệp tốt nhất với mocirc higravenh nguyecircn gốc Thường được dugraveng trong tối ưu hoacutea nguyecircn (integer optimization) 1048713 Chia giai đoạn giải quyết một vấn đề theo từng giai đoạn VD ở PampG trecircn đacircy bagravei toaacuten phacircn phối được giải quyết trước sau đoacute dugraveng giải quyết bagravei toaacuten chiến lược sản phẩm 1048713 Phacircn ratilde chia bagravei toaacuten thagravenh caacutec phần nhỏ hơn coacute thể giải quyết được sau đoacute kết hợp caacutec giải phaacutep đoacute lại VD chia latildenh thổ baacuten hagraveng thagravenh 4 vugraveng khaacutec nhau giải quyết cho từng vugraveng sau đoacute kết nối caacutec giải phaacutep

21Mocirc phỏngbull Giả định caacutec đặc điểm của thực tạibull Lagrave kỹ thuật tiến triển caacutec thực nghiệm (như phacircn tiacutech ldquowhat-ifrdquo) - bằng maacutey tiacutenh -trecircn một mocirc higravenh của hệ thocircng tin quản lyacute

bull Khocircng thực sự lagrave một mocirc higravenh vigrave khocircng biểu diễn thực tại magrave lagrave cố gắng bắtchước thực tạibull Một trong những phương phaacutep thocircng dụng nhất trong HHTQĐbull HHTQĐ lagravem việc với caacutec bagravei toaacuten phi cấu truacutec vagrave cấu truacutec yếu tigravenh huống thực tếphức tạp ndash khocircng dễ biểu diễn bằng mocirc higravenh tối ưu hay caacutec dạng mocirc higravenh khaacutecnhưng lại thường coacute thể xử lyacute được bằng mocirc phỏngbull Đặc điểm1048713 Iacutet đưa ra caacutec đơn giản hoacutea về thực tại hơn caacutec mocirc higravenh khaacutec1048713 Do triển khai caacutec thực nghiệm necircn noacute coacute thể kiểm thử caacutec giaacute trị cụ thể của caacutecbiến quyết địnhbiến khocircng kiểm soaacutet được của mocirc higravenh vagrave xem xeacutet ảnh hưởnglecircn caacutec biến kết quả1048713 Phương phaacutep coacute tiacutenh mocirc tả (như vậy khaacutec với phương phaacutep danh định)1048713 Khocircng tự động tigravem kiếm giải phaacutep tối ưu ndash noacute mocirc tảtiecircn đoaacuten caacutec đặc tiacutenh của hệthống đatilde cho dưới caacutec điều kiện khaacutec nhau từ đoacute coacute thể chọn ra phương aacuten tốtnhất1048713 Quaacute trigravenh mocirc phỏng thường lặp lại một thực nghiệm nhiều lần để coacute được ướclượng về hiệu ứng tổng quaacutet của một số hagravenh động nhất định1048713 Mocirc phỏng maacutey tiacutenh thiacutech hợp cho hầu hết caacutec tigravenh huống mặc dugrave cũng coacute một sốmocirc phỏng thủ cocircng thagravenh cocircng1048713 Thường chỉ được dugraveng khi bagravei toaacuten quaacute phức tạp khocircng thể xem xeacutet bằng caacutec kỹthuật tối ưu dạng số Tiacutenh phức tạp theo nghĩa bagravei toaacuten khocircng thể cocircng thức hoacuteacho tối ưu (do khocircng thotildea caacutec giả định) hoặc cocircng thức quaacute lớn quaacute nhiều tươngtaacutec giữa caacutec biến hoặc về bản chất bagravei toaacuten lagrave bất định hay rủi roPhương phaacutep mocirc phỏng thiết lập mocirc higravenh của hệ thống thực vagrave tiến hagravenh caacutec thựcnghiệm lặp lại trecircn mocirc higravenh

bull Thuận lợi1048713 Lyacute thuyết tương đối trực tiếp hiệu ứng dagravei hạn của nhiều chiacutenh saacutech -gt neacuten thờigian lớn1048713 Do tiacutenh chất mocirc tả (khaacutec với danh định)1048713 Coacute thể thấy được nhanh choacuteng coacute thể đặt ra caacutec cacircu hỏi ldquowhat-ifrdquo coacute thể dugravengtiếp cận thử-vagrave-sai vagraveo giải quyết vấn đề một caacutech nhanh choacuteng rẻ chiacutenh xaacutec iacutetrủi ro hơn1048713 Thử nghiệm được biến quyết định phần nagraveo của mocirci trường thực sự quan trọngvới caacutec phương aacuten khaacutec nhau1048713 Yecircu cầu kiến thức riecircng biệt về bagravei toaacuten vigrave thế buộc người xacircy dựng mocirc higravenh phảilagravem việc thường xuyecircn với nhagrave quản lyacute ndash đối tượng mong muốn của HHTQĐ để

từ đoacute bản chất bagravei toaacuten vagrave caacutec quyết định được hiểu tốt hơn1048713 Mocirc higravenh được xacircy dựng từ viễn cảnhcaacutech nhigraven của nhagrave quản lyacute1048713 Mocirc higravenh chỉ cho một bagravei toaacuten riecircng biệt thường khocircng thể dugraveng giải caacutec bagravei toaacutenkhaacutec Như vậy mỗi thagravenh phần của mocirc higravenh ứng với một phần của hệ thống thựcdo đoacute sẽ khocircng yecircu cầu nhagrave quản lyacute phải tổng quaacutet hoacutea caacutec hiểu biết của migravenh1048713 Phổ bagravei toaacuten giải được rất rộng tồn kho nhacircn sự hoạch định chiến lược 1048713 Coacute thể chứa caacutec phức tạp thực sự của bagravei toaacuten khocircng cần caacutec đơn giản hoacutea (TDdugraveng caacutec phacircn phối xaacutec suất thực thay vigrave phacircn phối lyacute thuyết xấp xỉ)1048713 Coacute thể tự động sinh ra nhiều đo lường hiệu năng quan trọng1048713 Thường lagrave phương phaacutep duy nhất của HHTQĐ coacute thể xử lyacute caacutec bagravei toaacuten tương đốiphi cấu truacutec1048713 Coacute một số caacutec goacutei phần mềm mocirc phỏng (Monte Carlo) tương đối dễ dugravengbull Điểm yếu1048713 Tuy thường tigravem được caacutec phương aacuten đủ tốt nhưng khocircng đảm bảo lời giải tối ưu1048713 Quaacute trigravenh xacircy dựng mocirc higravenh thường dagravei vagrave tốn keacutem1048713 Giải phaacutep vagrave suy diễn từ nghiecircn cứu mocirc phỏng thường khocircng thể chuyển sang bagraveitoaacuten khaacutec vigrave mocirc higravenh kết hợp caacutec yếu tố đặc thugrave1048713 Đocirci khi do mocirc higravenh quaacute dễ giải thiacutech cho nhagrave quản lyacute necircn caacutec phương phaacutep phacircntiacutech thường xem nhẹ1048713 Phần mềm mocirc phỏng đocirci khi yecircu cầu caacutec kỹ năng đặc biệt do độ phức tạp củaphương phaacutep giải higravenh thứcbull Caacutec loại mocirc phỏng1048713 Mocirc phỏng xaacutec suất một hay nhiều biến độc lập mang tiacutenh xaacutec suất với 2 loạiphacircn phối ndash thường dugraveng kỹ thuật Monte Carlo1048713 Phacircn phối rời rạc tigravenh huống coacute một số giới hạn caacutec biến cố (biến) với hữu hạncaacutec giaacute trị cho mỗi biến cố (biến)1048713 Phacircn phối liecircn tục tigravenh huống coacute số lượng khocircng giới hạn caacutec biến cố tuacircn theocaacutec hagravem mật độ xaacutec suất như phacircn phối chuẩn1048713 Mocirc phỏng độc lậpphụ thuộc theo thời gian1048713 Độc lập khocircng cần thiết phải biết chiacutenh xaacutec thời điểm xảy ra biến cố (nhu cầutiecircu thụ lượng sản phẩm trong ngagravey khocircng biết chiacutenh xaacutec thời điểm tiecircu thụ)1048713 Phụ thuộc cần biết chiacutenh xaacutec thời điểm xảy ra sự kiện (bagravei toaacuten hagraveng đợi)1048713 Mocirc phỏng tương taacutec trực quan1048713 Mocirc phỏng hướng đối tượng dugraveng tiếp cận hướng đối tượng để xacircy dựng mocirc higravenhmocirc phỏng Chuacute yacute ngocircn ngữ mocirc higravenh hoacutea nhất thể UML (unified modelinglanguage) kể cả khi mocirc phỏng caacutec hệ thời gian thựcMOcirc HIgraveNH HOacuteA ĐA CHIỀU ndash XỬ LYacute PHAcircN TIacuteCH TRỰC TUYẾNbull Người ra quyết định thường phải xem xeacutet nhiều chiều của dữ liệu (TD caacutec chiềucủa dữ liệu baacuten hagraveng lagrave sản phẩm vugraveng thời gian người baacuten ) dữ liệu cần đượcphacircn tiacutech trực tiếp bằng caacutec cocircng cụ chuẩn hay phacircn tiacutech tự động bằng caacutec

phương phaacutep khai mỏ dữ liệu (data mining)bull Hầu hết caacutec hệ thống phacircn tiacutech đa chiều được nhuacuteng trong caacutec hệ xử lyacute phacircn tiacutechtrực tuyến (HXLPTTT ndash online analytic processing - OLAP)bull Mục tiecircu của XLPTTT nắm bắt cấu truacutec của dữ liệu thực để hỗ trợ ra quyết địnhbull Trong HHTQĐ coacute sự gắn nối tự nhiecircn giữa mocirc higravenh hoacutea dữ liệu mocirc higravenh hoacutea kyacutehiệu vagrave caacutec khiacutea cạnh của phacircn tiacutech ldquowhat-ifrdquobull Caacutec baacuteo caacuteo của HXLPTTT đều coacute tiacutenh tương taacutec dễ khai thaacutec sử dụng đặc biệtphugrave hợp cho caacutec baacuteo caacuteo về chỉ số hiệu năng chủ yếu (key performance indicators- KPI) baacuteo caacuteo về đo lường hiệu năng kinh doanh bull Thế hệ hiện tại của HXLPTTT vagrave hệ khai mỏ dữ liệu (data mining) tiacutech hợp caacutecđặc tiacutenh của hệ thocircng tin latildenh đạo (executive information system ndashEIS- nhiềucaacutech nhigraven dữ liệu chi tiết hoacutea theo nhu cầu) vagrave caacutec hệ đồ họa khaacutec ndash thường coacutegiao diện người dugraveng dạng kiểu WEBbull Caacutec hệ thống như trecircn cograven được gọi lagrave caacutec cocircng cụ triacute tuệ kinh doanh (businessintelligence - BI) vigrave coacute caacutec đặc trưng về mocirc higravenh hoacutea vagrave tối ưu hoacutea nhưng lạitrong suốt đối với ngươigrave dugravengbull Hiện caacutec cocircng cụ được đưa ra bởi caacutec nhagrave cung cấp về CSDL về hoạch định tagraveinguyecircn tổ chức (ERP) về nhagrave kho dữ liệu (data warehouse) về HXLPTTT MOcirc HIgraveNH HOacuteA VAgrave MOcirc PHỎNG TƯƠNG TAacuteC TRỰC QUANbull Iacutech lợi Người ra quyết định tham gia vagraveo quaacute trigravenh phaacutet triển mocirc higravenh vagrave thựcnghiệm mocirc phỏng vigrave vậy sẽ tin tưởng khi sử dụng mocirc higravenhbull Mocirc higravenh hoacutea tương taacutec trực quan (visual interactive modeling - VIM) dugraveng caacutecbiểu diễn đồ họa maacutey tiacutenh để trigravenh bagravey caacutec ảnh hưởng của caacutec quyết định quản lyacutekhaacutec nhau ở một thời điểm (tĩnh) hay tiến triển theo thời gian (động với kỹ thuậthoạt higravenh)bull Mocirc phỏng tương taacutec trực quan (visual interactive simulation - VIS) cho pheacutepngười dugraveng theo dotildei tiến trigravenh xacircy dựng vagrave sử dụng khai thaacutec mocirc higravenh mocirc phỏngdưới dạng hoạt higravenhbull Mocirc higravenh hoacutea tương taacutec trực quan coacute thể kết hợp với tiếp cận triacute tuệ nhacircn tạo đểđưa ra caacutec khả năng mới thay đổi từ xacircy dựng hệ thống dạng đồ họa đến tigravem hiểuvề động học của hệ thốngbull Cần đến caacutec hệ thống maacutey tiacutenh xử lyacute song song tốc độ cao để xacircy dựng caacutec mocircphỏng - phức tạp quy mocirc lớn dạng hoạt higravenh - mang tiacutenh khả thi ở thời gian thực

22Caacutec dạng hệ thống hỗ trợ ra quyết địnhHệ hỗ trợ quyết định nhoacutemRa quyết định nhoacutem giao tiếp vagrave cộng taacutec- Caacutec đặc điểm của cocircng việc nhoacutem+ Một nhoacutem thực hiện một nhiệm vụ thỉnh thoảng ra quyết định thỉnh thoảngkhocircng ra quyết định+ Caacutec thagravenh viecircn trong nhoacutem coacute thể ở những nơi khaacutec nhau

+ Caacutec thagravenh viecircn trong nhoacutem coacute thể lagravem việc ở những thời gian khaacutec nhau+ Caacutec thagravenh viecircn trong nhoacutem coacute thể lagravem việc cugraveng nhau hoặc ở caacutec tổ chức khaacutecnhau+ Nhoacutem coacute thể vĩnh viễn hoặc tạm thời+ Nhoacutem coacute thể ở bất kỳ mức quản lyacute nagraveo hoặc mức thời gian nagraveo+ Coacute sự điều phối (quaacute trigravenh vagrave nhiệm vụ đạt được) hoặc macircu thuẩn trongnhoacutem+ Coacute sự đạt được hoặcvagrave mất maacutet năng suất trong tổ chức+ Nhiệm vụ phải hoagraven thagravenh rất nhanh+ Khocircng thể hoặc quaacute đắt cho tất cả caacutec thagravenh viecircn trong nhoacutem cugraveng hợp ở mộtnơi+ Một số dữ liệu thocircng tin hoặc kiến thức cần thiết nằm ở nhiều nơi một sốkhaacutec ở ngoagravei tổ chức+ Chuyecircn mocircn của caacutec thagravenh viecircn khocircng coacute trong nhoacutem lagrave cần thiết- Caacutec hoạt động vagrave caacutec quaacute trigravenh miecircu tả caacutec cuộc họp+ Cuộc họp lagrave hoạt động chung liecircn quan bởi một nhoacutem người coacute địa vị bằngnhau hoặc gần bằng nhau+ Kết quả của cuộc họp phụ thuộc một phần vagraveo kiến thức yacute kiến caacutec đaacutenh giaacutecủa caacutec thagravenh viecircn+ Kết quả của cuộc họp cũng phụ thuộc vagraveo sự kết hợp của nhoacutem vagrave phụ thuộcvagraveo quaacute trigravenh ra quyết định được sử dụng bởi nhoacutem đoacute+ Giải quyết caacutec yacute kiến khaacutec nhau bởi người coacute quyền hạn hoặc thương lượnghoặc phacircn xửHỗ trợ giao tiếp- Giao tiếp lagrave thagravenh phần quan trọng cho hỗ trợ quyết định Khocircng coacute giao tiếp thigravekhocircng coacute cộng taacutec Những người ra quyết định caacute nhacircn phải giao tiếp với caacutecđồng nghiệp chuyecircn gia cơ quan chiacutenh phủ khaacutech hagraveng đối taacutec kinh doanh hellipHọ cũng cần dữ liệu vagrave thocircng tin (vagrave kiến thức) từ nhiều nơi trecircn thế giới Caacutecnhoacutem ra quyết định phải giao tiếp cộng taacutec vagrave thương lượng trong cocircng việcHầu hết caacutec tổ chức sẽ nhanh trở thagravenh khocircng coacute chức năng nếu khocircng coacute caacutec hệthống giao tiếp Thương mại điện tử coacute thể hiệu quả chỉ qua caacutec kỹ thuật giao tiếphiện đại- Caacutec kỹ thuật thocircng tin hiện đại cung cấp caacutec phương tiện hỗ trợ giao tiếp rẻnhanh coacute khả năng coacute thể tin cậy Nền tảng hỗ trợ giao tiếp lagrave caacutec hệ thống maacuteytiacutenh mạng+ Bắt đầu bằng điện baacuteo điện thoại radio vagrave ti vi+ Trong 100 năm chuacuteng ta phaacutet triển maacutey fax thư điện tử chương trigravenh chatnhoacutem tin tức hệ thống hội nghị truyền higravenh Hầu hết caacutec kỹ thuật nagravey đềuhoạt động trecircn internet+ Sự phaacutet triển giao tiếp sau cugraveng lagrave hệ thống họp điện tử caacutec dịch vụ vagrave hệ

thống hội nghị điện tử thường sử dụng internet để kết nối caacutec người ra quyếtđịnh- Caacutec thuận lợi aacutep dụng caacutec phương phaacutep giao tiếp cải tiến trong caacutec tổ chức+ Cải tiến năng suất của nhacircn viecircn+ Liecircn quan đến nhiều người ra quyết định chiacutenh+ Khocircng quan tacircm nhiều đến đường biecircn giới địa lyacute+ Tạo nền văn hoacutea hợp taacutec nhất quaacuten+ Cải tiến chất lượng cuộc sống của nhacircn viecircnHỗ trợ cộng taacutec Maacutey tiacutenh hỗ trợ cộng taacutec- Khung thời giannơi chốn+ Sự hiệu quả của kỹ thuật tiacutenh toaacuten cộng taacutec phụ thuộc vagraveo vị triacute của caacutec thagravenhviecircn trong nhoacutem vagrave phụ thuộc vagraveo thời gian chia sẽ thocircng tin gởi vagrave nhận+ Chia sự giao tiếp thagravenh bốn ocirc vagrave tổ chức bốn ocirc dọc theo 2 chiều thời gian vagravenơi chốn1048713 Thời gian Khi gởi vagrave nhận thocircng tin hầu như đồng thời giao tiếp lagrave đồngthời Viacute dụ Điện thoại ti vi vagrave caacutec cuộc họp gặp mặt nhau Giao tiếp bấtđồng bộ xảy ra khi người nhận nhận thocircng tin ở thời điểm khaacutec thời điểmgởi thocircng tin đoacute1048713 Nơi chốn Người gởi vagrave người nhận coacute thể ở cugraveng phograveng hoặc khocircng+ Bốn ocirc lagrave1048713 Cugraveng thời giancugraveng nơi chốn Caacutec thagravenh viecircn gặp mặt nhau cugraveng một luacutecgiống như phograveng quyết định hoặc gặp mặt truyền thống1048713 Cugraveng thời giankhaacutec nơi chốn Caacutec thagravenh viecircn ở caacutec nơi khaacutec nhau nhưnggiao tiếp cugraveng nhau Viacute dụ hội nghị truyền higravenh (videoconferencing)1048713 Khaacutec thời giancugraveng nơi chốn Nhiều người lagravem việc theo ca Ca nagravey để lạithocircng tin cho ca khaacutec1048713 Khaacutec thời giankhaacutec nơi chốn Caacutec thagravenh viecircn ở caacutec nơi khaacutec nhau Caacutecthagravenh viecircn nagravey gởi vagrave nhận thocircng tin ở những lần khaacutec nhau

23Thực thi hệ DSSHệ thống hỗ trợ quản lyacute (MSS) khocircng phải luacutec nagraveo cũng luocircn thagravenh cocircng Nhiều trường hợpthất bại của ES khocircng hoagraven toagraven lagrave lyacute do kỹ thuật Thực thi hệ thống lagrave một quaacute trigravenh liecircn tụcnhằm đảm bảo cho tổ chức chuẩn bị tiếp nhận một hệ thống mới vagrave đưa hệ thống vagraveo sử dụngthagravenh cocircngThực hiện cocircng nghệ hệ thống hỗ trợ quản lyacute lagrave việc phức tạp vigrave caacutec hệ thống nagravey khocircng đơnthuần lagrave hệ thống thocircng tin chỉ thu thập thao taacutec vagrave phacircn phối thocircng tin Magrave xa hơn chuacuteng

liecircn quan tới caacutec cocircng việc coacute thể lagravem thay đổi đaacuteng kể caacutech thức hoạt động của tổ chức Tuyvậy đa số caacutec yếu tố thực thi đều liecircn quan tới hệ thống thocircng tinThực thi MSS lagrave quaacute trigravenh liecircn tục diễn ra trong suốt thời gian phaacutet triển hệ thống từ đề xuấtban đầu đến nghiecircn cứu khả thi thiết kế vagrave phacircn tiacutech hệ thống lập trigravenh huấn luyện chuyểnđổi vagrave lắp đặt Caacutec chuyecircn gia hệ thống thocircng tin thường gọi thực thi lagrave giai đoạn cuối trongvograveng đời hệ thống Định nghĩa thực thi MSS phức tạp hơn vigrave bản chất lặp của sự phaacutet triểncaacutec hệ thống

THỰC THI KHOcircNG HOAgraveN CHỈNHCaacutec quyết định về tiacutenh khả thi thường coacute giả định về lợi iacutech đạt được khi kế hoạch thực thiđược thực hiện hoagraven toagraven Trong thực tế thường chỉ thực hiện 90 thậm chiacute 70 phần trăm sovới phacircn tiacutech khả thi Lyacute do lagrave sự thay đổi tại một nơi trong hệ thống coacute thể ảnh hưởng vagrave coacutethể taacutec động tiecircu cực đến chỗ khaacutec Do vậy cấp quản lyacute coacute thể bỏ những phần trong dự aacuten coacutethể gacircy ra taacutec động xấu Do đoacute dự aacuten sẽ thực hiện iacutet hơn 100 so với dự aacuten kế hoạch Caacutec lyacutedo khaacutec coacute thể lagrave do khấu trừ ngacircn saacutech hoặc vượt chi phiacuteĐAacuteNH GIAacute SỰ THAgraveNH COcircNG CỦA THỰC THI HỆ THỐNGPhải coacute caacutec chỉ số đo lường thigrave mới coacute thể đaacutenh giaacute sự thagravenh cocircng khi thực thi một hệ thốngDickson va Powers (1973) đề ra 5 tiecircu chuẩn độc lậpbull Tỷ lệ thời gian thực hiện dự aacuten với thời gian ước lượngbull Tỷ lệ chi phiacute thực tế vagrave ngacircn saacutech thực hiệnbull Thaacutei độ của cấp quản lyacute đối với hệ thốngbull Nhu cầu thocircng tin của caacutec nhagrave quản lyacute được đaacutep ứng như thế nagraveo qua hệ thốngbull Taacutec động của dự aacuten đối với những hoạt động maacutey tiacutenh trong cocircng tyCaacutec đo lường khaacutec để đaacutenh giaacute thagravenh cocircng của hệ hỗ trợ quản lyacute (MSS)bull Sự sử dụng hệ thống (dự định dugraveng hoặc thực sự dugraveng)bull Thỏa matilden của người dugravengbull Thaacutei độ taacuten thagravenhbull Mức độ hệ thống hoagraven thagravenh caacutec mục tiecircu ban đầubull Phần thưởng đối với tổ chức (giảm chi phiacute tăng doanh thuhellip)bull Tỷ số lợi iacutech chi phiacute

bull Mức độ thể chế hoacutea của MSS trong tổ chứcDo bởi tiacutenh đa dạng của DSS necircn việc đaacutenh giaacute sự thagravenh cocircng của hệ nagravey cũng khoacute khăn tuynhiecircn cũng coacute thể coacute một số yếu tố giuacutep cho DSS thagravenh cocircng như sự tham gia người dugravenghuấn luyện người dugraveng hỗ trợ quản lyacute cấp cao nguồn thocircng tin đặc điểm của những nhiệmvụ coacute liecircn quan (cấu truacutec bất định độ khoacute phụ thuộc)

Chương5Nhoacutem hỗ trợ quyết định vagrave nhoacutemcocircng nghệ phần mềm

51Nhoacutem tạo quyết định

MDM-Holsapple đatilde gợi yacute chuacuteng ta sử dụng giới hạn người tạo quyết định

Một nhoacutem lagrave kết cấu MDM nơi magrave nhiều người ra quyết định hoagraven toagraven tương taacutec

Một đội lagrave kết cấu MDM nơi caacutec thagravenh viecircn tư vấn cho người đưa ra quyết định nhưng khocircng tương taacutec

Một Ủy ban lagrave kết cấu MDM với một người tạo quyết định duy nhất vagrave sự tương taacutec giữa caacutec thagravenh viecircn

Mạng thocircng tin

Mạng lưới baacutenh xe mỗi người tham gia coacute thể giao tiếp với người đưa ra quyết định ở trung tacircm nhưng khocircng phải với người tham gia khaacutecCấu truacutec nagravey lagrave khocircng thỏa matilden tất cả những người tham gia ngoại trừ người ra quyết định

Mạng dacircy chuyền Tham gia chuyển tiếp thocircng tin chỉ để noacute luocircn liền kề nhau trong chuỗi

Thagravenh viecircn cuối cugraveng ko được đaacutep ứng

Mạng vograveng trograven Tương tự như chuỗi nhưng kết thuacutec được kết nối

Mạng kết nối hoagraven toagraven khocircng coacute hạn chế về giao tiếp vagrave tương taacutec giữa caacutec thagravenh viecircnNoacutei chungnoacute đaacutep ứng hầu hết caacutec kết nối của người tham gia nhưng truyền đạt thocircng tin mất nhiều thời gian vagrave coacute nhiều cơ hội xảy ra lỗi

Nhoacutem hagravenh vi vagrave chuẩn mực

MDMs thiết lập caacutec chỉ tiecircu hướng dẫn quaacute trigravenh ra quyết định

Một chuẩn mực quy định cụ thể những gigrave thagravenh viecircn trong nhoacutem dự kiến sẽ lagravem trong những hoagraven cảnh nhất định

Quy tắc gửi coacute thể được thocircng qua viacute dụ đaacutenh giaacute ngang hagraveng hoặc xử phạt

Lagravem thế nagraveo để đưa ra quyết định

Việc chọn lựa magrave trong đoacute việc sử dụng cấu truacutec MDM phải được dựa trecircn một số yếu tố liecircn quan với bối cảnh quyết định

Viacute dụmột cấu truacutec riecircng lẻ sẽ lagravem việc nơi magrave quyết định được cấu truacutec cao vagrave thocircng tin lagrave coacute sẵn

Một ủy ban cơ cấu sẽ lagrave sự lựa chọn khi người ra quyết định khocircng thể đưa ra quyết định một migravenh

52Caacutec vấn đề thường gặp trong nhoacutem

Kiacutech thước Noacutei chung sự nhất triacute vagrave gắn kết giữa caacutec thagravenh viecircn tỉ lệ nghịch với phạm vi nhoacutem Trong nhoacutem lớn rất dễ higravenh thagravenh caacutec nhoacutem nhỏ vagrave hoạt động rời rạc

Tư duy tập thể Trong nhoacutem lớn mọi người coacute xu hướng suy nghĩ đểđạtđược sự nhất triacute necircn khocircng phaacutet huy được sự saacuteng tạo

Caacutec vấn đề về xatilde hội

Xung đột Trong 1 nhoacutem ai cũng muốn migravenh lagrave giỏi nhất necircn dễ dẫn đến xung đột

Ẩn danh(Giấu tecircn) Đacircy lagrave phương phaacutep được sử dụng để kiểm soaacutet xung đột Cho caacutec thagravenh viecircn tham gia ẩn danh

Vấn đề giới tiacutenh Nam vagrave nữ thường coacute những thế mạnh khaacutec nhau điều nagravey coacute thể lagrave sức mạnh trong 1 thiết lập MDM

Đagravem phaacuten vagrave quyết định

Một quyết định coacute thể liecircn quan đến nhiều quan điểm khaacutec nhau vigrave thế cần phải coacute sự đagravem phaacuten

Caacutec thiết kế của cơ chế hỗ trợ cho MDM phải phugrave hợp với caacutec hoạt độngđagravemphaacuten

Những hoạt động nagravey bao gồm việc thu nhận yacute kiến của caacutec thagravenh viecircn 1 caacutech cocircng bằng

53Cocircng nghệ hỗ trợ MDM

Organizational DSSndash 1 hệ thống cung cấp caacutec quyết định hỗ trợ

Group Support Systemndash Cocircng nghệ sử dụng sự hỗ trợ của nhiều becircn tham gia

Group DSS ndash Lagrave 1 hệ thống được thiết kế đặc biệt để hỗ trợ cho MDM

DSS ndash Lagrave 1 hệ thống dưới sự kiểm soaacutet của 1 người quyết định hệ thống nagravey cung cấp 1 bộ cocircng cụ giuacutep phacircn tiacutech hoagraven cảnh đểđưa ra quyết định vagrave nacircng cao hiệu quả của quyết địnhđoacute

53Cocircng nghệ hỗ trợ MDM

Organizational DSSndash 1 hệ thống cung cấp caacutec quyết định hỗ trợ

Group Support Systemndash Cocircng nghệ sử dụng sự hỗ trợ của nhiều becircn tham gia

Group DSS ndash Lagrave 1 hệ thống được thiết kế đặc biệt để hỗ trợ cho MDM

DSS ndash Lagrave 1 hệ thống dưới sự kiểm soaacutet của 1 người quyết định hệ thống nagravey cung cấp 1 bộ cocircng cụ giuacutep phacircn tiacutech hoagraven cảnh đểđưa ra quyết định vagrave nacircng cao hiệu quả của quyết địnhđoacute

Mục tiecircu của cocircng nghệ hỗ trợ MDM

Quy trigravenh hỗ trợ tập trung vagraveo quaacute trigravenh tạo điều kiện thuận lợi cho sự tương taacutec

Cơ chế cấu truacutec quaacute trigravenh chi phối caacutec hoạt động truyền thocircng

Nhiệm vụ hỗ trợ cocircng việc coacute thể chọn lựa tổ chức hoặc lấy thocircng tin

Nhiệm vụ cấu truacutec cocircng việc cho pheacutep truy cập đến kỹ thuật lọc kết hợp phacircn tiacutech kiến thức liecircn quan đến cocircng việc

Caacutec lớp loại cocircng nghệ hỗ trợ MDM

Phacircn loại theo đặc điểm do DeSanctis vagrave Gallupe đưa ra đề xuất một chương trigravenh ba cấp dựa trecircn caacutec tiacutenh năng được cung cấp

Hệ thống cấp 1 Mục điacutech chiacutenh lagrave tạo điều kiện thocircng tin liecircn lạc giữa caacutec thagravenh viecircn

Hệ thống cấp 2 Thiết kế để giảm thiểu rủi ro

Hệ thống cấp 3 Giuacutep điều chỉnh xử lyacute quyết định

Phacircn loại theo cocircng nghệ -Kraemer vagrave King tập trung vagraveo cocircng nghệ aacutep dụng

Cocircng nghệ bảng mạch điện tử

Hội nghị trực tuyến

Mạng lưới tập đoagraven

Trung tacircm thocircng tin

Mocirci trường cộng taacutec

Phograveng quyết định

Nhoacutem phần mềm

Phần mềm được thiết kế để hỗ trợ sự hợp taacutec bao gồm việc thu huacutet vagrave lưu trữ thocircng tin

Caacutec tổ chức dẫn đầu thị trường hiện tại lagrave Lotus Notes and Domino Microsoft Exchange Novell GroupWise and Oracle Office

Caacutec cocircng cụ trong một bộ phần mềm bao gồm người quản lyacute hội nghị (Lotus Sametime) vagrave trao đổi thocircng điệp (Lotus Notes Mail)

Xếp hạng phần mềm cho nhoacutem

Ellis vv đề xuất một hệ thống xếp hạng dựa vagraveo kiểu sự hỗ trợ noacute Cung cấp

Hệ thocircng điệp

Hệ thống hội thảo truyền higravenh

Hệ thống cộng taacutec soạn thảo

Nhoacutem phacircn phối giải phaacutep phần mền

Hệ thống phối hợp

Hệ thống thocircng minh đại diện

Lực lượng điều khiển phaacutet triển phần mềm cho nhoacutem

Một số nhacircn tố chiacutenh bao gồm

Tăng năng suất

Giảm số lượng caacutec cuộc họp

Tăng cường tự động hoacutea caacutec quy trigravenh lagravem việc thường xuyecircn

Cần phối hợp toagraven cầu tốt hơn

Tiacutenh sẵn sagraveng của những mạng lan rộng

Coleman vagrave Khanna liệt kecirc 10 nhacircn tố khaacutec

54Quản lyacute hoạt động MDM (Mobile Device Management - Quản lyacute thiết bị di động)

Một số phương phaacutep phối hợp phổ biến hơnMDM lagrave

Kỹ thuật nhoacutem định danh

Kỹ thuật Delphi

Sự phacircn xử

Hệ thocircng tin dựa trecircn vấn đề

Nemawashi

Kỹ thuật nhoacutem định danh

1-Mỗi người tham gia viết ra những yacute tưởng về những gigrave necircn quyết định

2-Lần lượt mỗi người tham gia trigravenh bagravey yacute tưởng của migravenh được ghi lại trecircn bảng Khocircng thảo luận ở đacircy

3-Sau khi tất cả caacutec yacute tưởng được trigravenh bagravey caacutec đại biểu coacute thể chất vấn những người khaacutec

4-Mỗi người tham gia bỏ phiếu cho mỗi yacute tưởng

Kỹ thuật Delphi

Về cơ bản tương tự như kỹ thuật nhoacutem định danh ngoại trừ những người khocircng bao giờ tham gia cuộc họp

Một cocircng cụ khảo saacutet được sử dụng để thu thập đầu vagraveo ban đầu từ caacutec thagravenh viecircn

Một cuộc khảo saacutet thứ hai được gửi đi với một bản toacutem tắt caacutec kết quả chung

Những bước lặp lại cho đến khi đạt được một sự đồng thuận hoặc nhigraven nhận của đa số

Sự phacircn xử(Arbitration )

Thiacutech hợp nhất khi caacutec thagravenh viecircn của MDM đại diện cho caacutec yếu tố đối lập

Những người tham gia đồng yacute rằng nếu lựa chọn thay thế hai becircn thỏa thuận khocircng được tigravem thấy thigrave một trọng tagravei viecircn becircn ngoagravei sẽ tham gia

Trọng tagravei sau đoacute lựa chọn thay thế ocircng hoặc xeacutet thấy thiacutech hợp nhất

Hệ thống thocircng tin dựa trecircn vấn đề (IBIS)

Lagrave một phương phaacutep lập luận cấu truacutec

Một đại diện cho IBIS lagrave một đồ thị với caacutec nuacutet vagrave caacutec liecircn kết

IBIS bắt đầu với lựa chọn của một nuacutet vấn đề gốc sau đoacute caacutec nuacutet vị triacute khaacutec nhau được liecircn kết với nuacutet gốc

Caacutec nuacutet vị triacute nagravey sau đoacute được đaacutenh giaacute dựa trecircn những lập luận gắn liền với chuacuteng

Nemawashi (được sử dụng rộng ratildei tại Nhật Bản)

1-Một hoặc nhiều thagravenh viecircn của MDM được chỉ định lagrave điều phối viecircnCaacutec điều phối viecircn sau đoacute chọn người tham gia cograven lại

2-Điều phối viecircn xacircy dựng một tổng hợp caacutec sự lựa chọn vagrave sau đoacute caacutec chuyecircn gia đaacutenh giaacute caacutec lựa chọn

3-Điều phối viecircn lựa chọn một sự lựa chọn dựa trecircn kết quả ở trecircn(ở 2)

4-Sự thay thế được luacircn chuyển điều phối viecircn tigravem kiếm sự đồng thuận thocircng qua sự thuyết phục vagrave đagravem phaacuten

5-Nếu đạt được sự đồng thuận điều phối viecircn cho lưu thocircng một tagravei liệu magrave mỗi thagravenh viecircn MDM để lại dấu hiệu trecircn đoacute

55Nơi lagravem việc ảo

Nhiều tổ chức trecircn toagraven thế giới kinh doanh bất động sản cho cocircng nghệ hợp taacutec

Cocircng việc được trở thagravenh một điều bạn lagravem hơn lagrave một nơi bạn đi

Những thay đổi lớn nhất mang lại bởi nơi lagravem việc ảo coacute thể lagrave về văn hoaacute hay xatilde hội hơn lagrave về cocircng nghệ

Chương 6 Hệ thống thocircng tin điều hagravenh

61 Yacute nghĩa của EIS- Hệ thống thocircng tin điều hagravenh

- EIS lagrave một dạng đặc biệt của DSS được thiết kế để hỗ trợ ra quyết định ở cấp cao nhất của một tổ chức

- Lagrave một hệ thống thocircng tin hỗ trợ nhu cầu lập kế hoạch vagrave đaacutenh giaacute của caacutec nhagrave quản lyacute điều hagravenh

- EIS coacute thể giuacutep một CEO coacute được bức tranh tổng thể chiacutenh xaacutec nhất về caacutec hoạt động vagrave một bản toacutem tắt những gigrave magrave đối thủ cạnh tranh đang lagravem

- Caacutec hệ thống nagravey noacutei chung hoạt động dễ dagraveng vagrave trigravenh bagravey thocircng tin theo những caacutech dễ hiểu để việc tiếp thu được nhanh choacuteng (biểu đồ đồ thịhellip)

(Tagravei liệu thecircm EIS lagrave những loại hệ thống lagrave rất phức tạp trong tự nhiecircn Coacute thể noacutei hệ thống nagravey cũng cung cấp cho caacutec nhagrave quản lyacute với caacutec thiết bị coacute khả năng ra quyết định bằng caacutech sử dụng của noacute Hệ thống nagravey hoạt động trong điều kiện như vậy quan trọng như trong caacutec hệ thống khaacutec khocircng hỗ trợ Khả năng lưu trữ dữ liệu nặng lagravem cho noacute lyacute tưởng để được thocircng qua khocircng chỉ bởi caacutec doanh nghiệp lớn magrave cograven bởi caacutec doanh nghiệp nhỏ hơn Nhigraven chung hệ thống nagravey lagrave dagravenh cho caacutec nhacircn viecircn cấp cao hỗ trợ thagravenh thạo trong việc đưa ra caacutec quyết định quan trọng)

Caacutec phiecircn EIS tiecircu biểu- Phiecircn lagravem việc coacute thể bắt đầu với một baacuteo caacuteo về tigravenh higravenh tagravei chiacutenh vagrave kinh

doanh của một cocircng ty caacutec chỉ số hoạt động quan trọng được hiển thị rotilde ragraveng- EIS sẽ cho pheacutep caacutec giaacutem đốc điều hagravenh coacute thể đi sacircu vagraveo dữ liệu từ những con

số bất kỳ magrave noacute hỗ trợ- Việc điều hagravenh coacute thể lựa chọn một mức độ chi tiết ( VD danh số baacuten hagraveng) nếu

như cần điều tra thecircm- Lagrave một phương phaacutep tiếp cận coacute thể giuacutep việc ra quyết định tốt hơn

Những điều magrave EIS ko coacute- EIS khocircng phải lagrave sự thay thế cho caacutec hệ thống dựa trecircn caacutec maacutey tiacutenh khaacutec EIS

thực sự chỉ cung cấp dữ liệu cho caacutec hệ thống nagravey- Noacute khocircng thể biến caacutec bộ hệ điều hagravenh của maacutey tiacutenh thagravenh những ldquochuyecircn viecircn

giỏirdquo- Coacute thể được viacute một caacutech cao hơn như lagrave một trợ lyacute đaacuteng tin cậy coacute thể được gọi

đến bất khi nagraveo vagrave mỗi khi cần thiết

Tagravei liệu thecircm Sự khaacutec nhau giữa EIS vagrave DSS+ EIS thiết kế để hỗ trợ những người điều hagravenh cấp cao giuacutep họ khaacutem phaacute caacutec vấn đề vagrave caacutec cơ hội DSS hỗ trợ những nười phacircn tiacutech cố gắng trả lời cacircu hỏi caacutei gigrave coacute thể lagravem cugraveng với một cơ hội hoặc một vấn đề

Chiều EIS DSSNhững người sử dụng thocircng thường

Duyệt dữ liệu đi xuống truy xuất trạng thaacutei

Hỗ trợ phacircn tiacutech vagrave quyết định

Sự thuacutec đẩy Tiacutenh thiacutech hợp Tiacutenh hiệu quảỨng dụng Queacutet mocirci trường đaacutenh giaacute

hiệu suất nhận dạng caacutec vấn đề vagrave caacutec cơ hội

Caacutec quyết định quản lyacute trecircn caacutec lĩnh vực đa dạng

Hỗ trợ quyết định Caacutec chiacutenh saacutech caacutec quyết định khocircng coacute cấu truacutec ở mức cao vagrave hỗ trợ giaacuten tiếp

Hỗ trợ caacutec quyết định lặp lại caacutec quyết định khocircng thể đoaacuten trước ra quyết định khocircng coacute cấu truacutec vagrave baacuten cấu truacutec

Loại thocircng tin Caacutec thocircng tin tin tức thocircng tin becircn ngoagravei về khaacutech hagraveng đối thủ cạnh tranh mocirci trường caacutec baacuteo caacuteo theo yecircu cầu vagrave định thời về caacutec hoạt động becircn trong

Caacutec thocircng tin hỗ trợ caacutec tigravenh huống đặc biệt

Sử dụng coacute nguyecircn tắc

Dograve theo vết vagrave điều khiển nhận dạng cơ hội

Hoạch định tổ chức phacircn nhoacutem vagrave điều khiển

Khả năng phugrave hợp với những người sử dụng caacute nhacircn

Thiết kế loại ra quyết định cho mỗi người điều hagravenh caacute nhacircn bằng nhiều lựa chọn đầu ra

Cho pheacutep caacutec đaacutenh giaacute caacute nhacircn caacutec khả năng what-if lựa chọn loại hộp hội thoại

Đồ họa Phải coacute Lagrave một phần quan trọng của nhiều DSS

Thacircn thiện người sử dụng

Phải coacute Phải coacute nếu khocircng coacute người sử dụng trung gian

Xử lyacute thocircng tin Lọc neacuten thocircng tin dograve theo vết dữ liệu vagrave thocircng tin quan trọng

EIS kiacutech thiacutech caacutec cacircu hỏi caacutec cacircu trả lời bằng caacutech sử dụng DSS vagrave phản hồi lại EIS

Hỗ trợ caacutec thocircng tin chi tiết

Truy xuất thường xuyecircn caacutec mức chi tiết của bất kỳ thocircng tin tổng hợp nagraveo (duyệt dữ

Coacute thể coacute trong DSS nhưng khocircng thường

liệu chi tiết)Cơ sở mocirc higravenh Caacutec chức năng coacute sẵn bị hạn

chếLagrave điểm cốt lotildei của DSS

Cấu truacutec Theo người baacuten sản phẩm hoặc theo caacutec chuyecircn gia hệ thống thocircng tin

Theo người sử dụng hoặc caacute nhacircn hoặc caacutec chuyecircn gia từ caacutec trung tacircm thocircng tin hoặc phograveng ban hệ thống thocircng tin

Phần cứng Mainframe caacutec trạm RISC mạng LANs hoặc caacutec hệ thống phacircn bố

Mainframe caacutec trạm RISC caacutec maacutey PC hoặc caacutec hệ thống phacircn bố

Bản chất caacutec goacutei phần mềm

Truy xuất tương taacutec dễ dagraveng đến nhiều cơ sở dữ liệu truy xuất trực tuyến caacutec khả năng DBMS phức tạp caacutec liecircn kết phức tạp

Caacutec khả năng tiacutenh toaacuten lớn caacutec ngocircn ngữ mocirc higravenh mocirc phỏng ứng dụng vagrave caacutec bộ tạo DSS

Bản chất caacutec thocircng tin

Trigravenh bagravey thocircng tin được phaacutet sinh trước về quaacute khứ vagrave hiện tại tạo caacutec thocircng tin mới về quaacute khứ hiện tại tương lai

Tạo thocircng tin mới về quaacute khứ hiện tại tương lai

62 Lịch sử EIS- EIS xuất hiện lần đầu tiecircn tại MIT vagraveo những năm 1970

- Những EIS đầu tiecircn được phaacutet triển bởi caacutec doanh ngiệp lớn sẵn sagraveng chấp nhận rủi ro để đạt được lợi thế cạnh tranh

- Vagraveo những năm 1980 caacutec nhagrave cung cấp đatilde phaacutet triển một số cơ sở khaacutech hagraveng rộng vagrave cocircng nghệ EIS được tiếp tục phaacutet triển cho đến ngagravey nay

(Tagravei liệu thecircm Sử dụng DSSEIS cho phaacutet triển bền vững + Một số nghiecircn cứu đatilde được tiến hagravenh để kiểm tra việc thực hiện của EIS trong khu vực cocircng cộng vagrave chiacutenh phủ caacutec nước tổ chức kể từ khi chuacuteng được phaacutet triển theo định hướng lợi nhuận cho caacutec cocircng ty tư nhacircn (Hasan vagrave Hasan năm 1997) Theo một nghiecircn cứu tiến hagravenh tại Mỹ ở hơn 300 cocircng ty kết quả cho thấy sự khaacutec biệt của EIS giữa tư nhacircn vagrave chiacutenh phủ một số kết quả thuacute vị được phaacutet hiệnViacute dụ khoacute khăn hơn để chuyển tiền từ một tagravei khoản khaacutec trong một EIS của chiacutenh phủ cũng lagrave khoacute khăn hơn để biện giải thiacutech cho những chi phiacute phaacutet triển EIS của chiacutenh phủ Một nghiecircn cứu khaacutec được tiến hagravenh ở Australia

cho thấy rằng EIS cung cấp cho quản lyacute một higravenh ảnh chiacutenh xaacutec hơn về tổ chức thực hiện vagrave cung cấp hỗ trợ cho caacutec lợi iacutech chiến lược cải thiện khocircng chỉ cho caacutec nhagrave quản lyacute nhưng cograven cho phần cograven lại của tổ chức Dựa trecircn caacutec hệ thống được thiết kế cho caacutec cocircng ty tư nhacircn với một caacutech rotilde ragravengxaacutec định mục tiecircu EIS lagrave thiacutech hợp cho caacutec tổ chức cocircng cộng hiện đại nhưng cần phải được linh hoạt hơn vagrave kết thagravenh chugravem một phạm vi rộng hơn khả năng vagrave phương tiện hơn so với khu vực tư nhacircn ban đầu theo định hướng sản phẩm (Hasan vagrave Hasan năm 1997) Điều nagravey coacute thể lagrave do thực tế rằng caacutec hoạt động khu vực cocircng lagrave bắt buộc coacute taacutec động rộng phải đaacutep ứng sự mong đợi duy nhất cocircng cộng thường coacute mục tiecircu mơ hồ vagrave macircu thuẫn iacutet quyền tự chủ vagrave kiểm soaacutet việc ra quyết định vagrave nhacircn viecircn lagrave khoacute khăn hơn (Watson vagrave Carte2000) + Toacutem lại EIS lagrave một khaacutei niệm thagravenh cocircng noacute phaacutet triển qua nhiều năm tuy nhiecircn EIS khắc phục khiếm khuyết của migravenh bằng caacutech tiến hagravenh nghiecircn cứu liecircn tục)

63 Tại sao những người điều hagravenh hagraveng đầu lại khaacutec nhau- Họ lagrave những doanh nghiệp theo định hướng coacute suy nghĩ

- Coacute một khoảng khocircng gian rộng để kiểm soaacutet

- Họ chịu traacutech nhiệm cho việc thiết lập chiacutenh saacutech

- Họ đại diện cho tổ chức mocirci trường becircn ngoagravei

- Hagravenh động của họ tạo ra những kết quả đaacuteng kể về tagravei chiacutenh vagrave con người

Tần số caacutec hoạt động điều hagravenh- Xử lyacute xaacuteo trộn 42

- Hoạt động kinh doanh 32

- Phacircn bổ nguồn lực 17

- Đagravem phaacuten 3

- Những điều khaacutec 6

Handling Disturbances 42

Entrepreneurial Activites 32

Resource Allocation 17

Negotiation 3

Other 6

Những thocircng tin điều hagravenh cần thiết- Quản lyacute xaacuteo trộn coacute thể yecircu cầu sự chuacute yacute xung quanh đồng hồ

- Hoạt động kinh doanh yecircu cầu điều hagravenh để dự đoaacuten những thay đổi trong mocirci trường

- Nhiệm vụ phacircn bổ tagravei nguyecircn yecircu cầu lựa chọn người quản lyacute vagrave caacutec nguồn lực hạn chế được triển khai

- Đagravem phaacuten yecircu cầu cập nhật thocircng tin từng phuacutet để coacute thể xacircy dựng được sự đồng thuận

Caacutec loại thocircng tin điều hagravenh- Hệ thống kế toaacuten coacute liecircn quan đến việc tiacutenh toaacuten thu nhập hoạt động cho caacutec lĩnh

vực cụ thể lagrave quan trọng hơn so với caacutec hệ thống kế toaacuten truyền thocircng- Thocircng tin về thị trường khaacutech hagraveng cung cấp giaacute trị trong việc quyết định chiến

lược- Caacutec thocircng tin cần thiết thường được truyền đi trecircn một số hệ thống maacutey tiacutenh vagrave

nằm trong toagraven tổ chức- Caacutec thocircng tin được sử dụng thường lagrave ngắn hạn vagrave dễ thay đổi

Phương thức để xaacutec định thocircng tin cần thiết

Rockart xaacutec định được năm phương thức cơ bản để xaacutec định thocircng tin cần thiết

- Phương thức dựa trecircn kết quả- Phương thức rỗng- Phương thức chỉ số khoacutea- Phương thức tổng hợp nghiecircn cứu- Phương thức dựa vagraveo nhacircn tố then chốt dẫn đến thagravenh cocircng

64 Thagravenh phần EIS

- Sản phẩm EIS đầu tiecircn được phaacutet triển để sử dụng trecircn maacutey tiacutenh cấu higravenh cao nhưng caacutec sản phẩm hiện nay nhằm mục tiecircu lagrave nền tảng ClientServer

- Những nền tảng linh hoạt hơn coacute thể thiacutech ứng với thay đổi trong tổ chức vagrave cocircng nghệ

- Sử dụng dữ liệu thời gian thực dẫn đến quyết định nhanh hơn nhiều thocircng tin hơn

Thagravenh phần phần cứng- Một EIS khocircng đogravei hỏi coacute phần cứng cụ thể hoặc duy nhất nagraveo- Chigravea khoacutea của vấn đề lagrave để đảm bảo rằng caacutec thagravenh phần của EIS tối ưu hoacutea vagrave

phugrave hợp với tagravei nguyecircn maacutey tiacutenh của tổ chức- Hệ thống nagravey phải được cấu higravenh để caacutec nguồn tagravei nguyecircn phugrave hợp với những

người điều hagravenh chuacuteng

Thagravenh phần phần mềm- Traacutei ngược với phần cứng phần mềm thường được chuyecircn mocircn hoacutea cao cho caacutec

bagravei toaacuten về miền- Sự chuyecircn mocircn hoacutea nagravey thường đạt được bằng caacutech sử dụng thagravenh phần off-the-

shelf cho toagraven bộ EIS vagrave caacutec mocirc-đun tugravey chỉnh để đaacutep ứng nhu cầu cụ thể- Lotus Notes lagrave một viacute dụ điển higravenh Noacute coacute thể được sử dụng một migravenh hoặc coacute

thể phục vụ becircn thứ ba mocirc-đun plug-in

Cocircng nghệ EIS hiện nay

Dobrzeniecki đề xuấtphacircn loạitừng cấptheo bachức năng- Loại 1 sản phẩm bao gồmmột bộ đầy đủcaacutec ứng dụngtừ mộtnhagrave cung cấp- Loại 2 sản phẩm đượcthựchiệnở phần đầu củacaacutecsản phẩmDSS đượcphaacutet triển

bởicugravengmộtnhagrave cung cấp- Loại 3 sản phẩmkết hợp với nhautheo bất kỳ số lượngthuộc sở hữu củacocircng ty

65 Xacircy dựng EIS

- Xacircy dựngmộtEISgiống nhưxacircydựngmột số hệ thống khaacutec củamocirc higravenh hệ thống thocircng tin

- Việcphaacutet triểncấu truacutecnecircn được theo dotildeitừ quaacute trigravenh thiết kế đến quaacute trigravenhthực hiện

- Tuy nhiecircn một dự aacuten phaacutet triển EIScoacute xu hướnglagrave thống nhấtvagraveyecircu cầu hỗ trợ caacutec nhagrave quản lyacute latildenh đạo

- Xacircy dựng một EIScoacute thểphaacutet hiện ra đượccaacutectigravenh huống khoacute khănmagravemột nhagrave phaacutet triển chưabao giờ gặp phải

Mocirc higravenh EIS

Khung phaacutet triển một EIS

- Watson et al đề nghị xacircy dựngkhung với ba thagravenh phần+ Caacutech tiếp cận tập trung vagraveo yếu tốcon người vagrave dữ liệu coacute liecircn quan đến EIS+ Quaacute trigravenh phaacutet triển cần sự linh hoạt vagrave tương taacutec+ Người sử dụng - hệ thống hộp thoại bao gồm một ngocircn ngữ hagravenh động để xử lyacute caacutec lệnh

Lợi iacutech của EIS- Dễ duy trigrave caacutec mục tiecircu coacute tổ chức- Dễ truy xuất thocircng tin- Cho pheacutep người sử dụng nacircng cao hiệu suất hơn

- Tăng chất lượng ra quyết định- Cung cấp sự cải tiến cạnh tranh- Tiết kiệm thời gian của người sử dụng- Tăng khả năng vagrave chất lượng giao tiếp- Cung cấp khả năng điều khiển tốt hơn trong tổ chức- Cho pheacutep tham gia caacutec vấn đề vagrave caacutec cơ hội- Cho pheacutep hoạch định- Cho pheacutep tigravem kiếm nguyecircn nhacircn của một vấn đề- Thảo matilden caacutec yecircu cầu của người điều hagravenh

Hạn chế của EIS vagrave 1 số sai lầm cần traacutenh

- Chi phiacute một cuộc khảo saacutetnăm1991 chothấychi phiacute phaacutet triểntrungbigravenh365000USDvớichi phiacute vận hagravenhhagraveng năm lagrave$200000 (EIS)

- Cocircng nghệ hạn chếEIScần phảiđượctiacutech hợp hoagraven toagravenvagraveokiếntruacuteccủadoanh nghiệphiện tại do đoacute noacutelagrave một thaacutech thứclớn đối vớithiết kế

- Hạn chế tổ chức cơ cấu tổ chứccoacute thể khocircng phugrave hợp

Sự hạn chế về tổ chức- Chương trigravenh nghị sự vagrave thời gian chệch EIS mocirc tả một phần việc thực hiện một

chương trigravenh nghị sự vagrave coacute thể dễ dagraveng đạt được sự tin cậy một caacutech chắc chắn- Đồng bộ hoacutea việc quản lyacute sự tin cậy đuacuteng luacutec đặc biệt baacuteo caacuteo EIS coacute thể phaacute

vỡ sự ổn định thiết lập caacutec chu trigravenh baacuteo caacuteo một caacutech tốt nhất- Sự bất ổn EIS phản ứng nhanh coacute thể gacircy ra việc taacutec động trở lại một caacutech

nhanh choacuteng dẫn đến sự thiếu ổn định trong tổ chức

Sự thất bại lagrave thay thế khocircng thể chấp nhận được- Một số yếu tố lagravem EIS thất bại

+ Thiếu sự hỗ trợ về mặt quản lyacute+ Vấn đề chiacutenh trị+ Thất bại của nhagrave phaacutet triển+ Lỗi về cocircng nghệ+ Giaacute cả+ Thời gian

66 Ra quyết định điều hagravenh trong tương lai vagrave EIS

- Coacute một vagravei điều kiện sẽ được hợp nhất cho việc chuyển đổi cocircng nghệ Trong đoacute một vagravei điều kiện coacute thể dễ dự đoaacuten Hai điều kiện magrave ta coacute thể thấy lagrave+ Phaacutet triển cocircng nghệ maacutey tiacutenh trong việc điều hagravenh sẽ tạo ra sự chuyển đổi được chấp nhận một caacutech dễ dagraveng hơn+ Mở rộng traacutech nhiệm điều hagravenh sẽ mở rộng nhu cầu thocircng tin

Tương lai của EIS- EIS thocircng minh Những tiến bộ trong cocircng nghệ AI sẽ được triển khai trong caacutec

EIS- EIS đa phương tiện Cơ sở dữ liệu đa phương tiện sẽ cho pheacutep tiacutech hợp văn bản

giọng noacutei vagrave higravenh ảnh trong tương lai- EIS thocircng tin Tương lai EIS sẽ mở rộng hơn trong việc sử dụng dữ liệu becircn

ngoagravei doanh nghiệp- EIS kết nối Giao tiếp với băng thocircng rộng cho pheacutep kết nối liecircn thocircng lớn hơn

Chương 7 HỆ CHUYEcircN GIA VAgrave TRIacute TUỆ NHAcircN TẠO

71 Caacutec khaacutei niệm

72 Triacute thocircng minh của triacute tuệ nhacircn tạo

73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia

74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia

75 Lợi iacutech vagrave hạn chế của hệ chuyecircn gia

71 Caacutec khaacutei niệm

Chuyecircn mocircn (Expertise) sự hiểu biết rộng trong 1 lĩnh vực hẹp

Hệ chuyecircn gia (Expert Systems)1 chương trigravenh maacutey tiacutenh sử dụng 1 tập caacutec luật dựa trecircn tri thức của con người để giải quyết caacutec vấn đề đogravei hogravei phải coacute sự chuyecircn mocircn

Một số hệ chuyecircn gia nổi tiếng

DENDRAL (Standford 1960s Edward Feigenbaum)

MYCIN (Standford1970s Edward Shortliffe)

PROSPECTOR (MIT 1979)

Triacute tuệ nhacircn tạo (Artificial Intelligence ndash AI)

Triacute tuệ nhacircn tạo một bộ phacircn của ngagravenh khoa học maacutey tiacutenh quan tacircm đến việc thiết kế caacutec hệ thống maacutey tiacutenh thocircng minh đoacute lagrave caacutec hệ thống đưa ra caacutec đặc điểm magrave từ đoacute chuacuteng ta liecircn hệ với sự thocircng minh trong hagravenh động của con người (Barr vagrave Feigenbaum 1981)

Mục điacutech của AI

Mục điacutech khoa học xaacutec định caacutec gợi yacute để giải thiacutech caacutec loại khaacutec nhau của triacute tuệ thực

Mục điacutech kỹ thuật giải quyết caacutec vấn đề trong thế giới thực

Triacute tuệ nhacircn tạo kế thừa nhiều yacute tưởng quan điểm kỹ thuật từ caacutec ngagravenh khoa học khaacutec

- Triết học

- Logic Toaacuten học

- Tiacutenh toaacuten

- Khoa học tacircm lyacute Khoa học nhận thức

- Sinh học Thần kinh học

- Tiến hoacutea

Caacutec lĩnh vực ứng dụng trong Triacute tuệ nhacircn tạo

Mạng nơ ron thần kinh (Neural Networks)

Tiacutenh toaacuten sự tiến hoacutea

(Evolutionary Computation)

Hệ chuyecircn gia (Expert Systems)

Kỹ thuật xử lyacute tiếng noacutei (Speech Processing)

Kỹ thuật xử lyacute ngocircn ngữ tự nhiecircn

(Natural Language Processing)

Lập kế hoạch (Planning)

Robot (Robotics)

Khoa học higravenh ảnh (Vision)

Caacutec kỹ thuật thocircng dụng dugraveng trong AI

Biểu diễn(Representation)

Học (Learning)

Caacutec luật (Rules)

Tigravem kiếm (Search)

72 Triacute thocircng minh của triacute tuệ nhacircn tạo

Con người suy diễn như thế nagraveo

Phacircn loại (Categorization)

Caacutec quy tắc cụ thể

Heuristics

Kinh nghiệm trước đoacute

Dự tiacutenh trước

Maacutey tiacutenh suy diễn như thế nagraveo

Lập luận dựa trecircn luật IF-THEN mocirc tả tri thức được matilde hoacutea dưới dạng caacutec luật

Caacutec khung (Frames) lagrave caacutec đại diện mocirc tả caacutec tigravenh huống giống nhau lagrave điển higravenh của một vagravei phacircn loại

Lập luận dựa trecircn caacutec trường hợp mocirc phỏng giải phaacutep trước đoacute cho một vấn đề hiện tại

Nhận dạng mẫu phaacutet hiện acircm thanh higravenh dạng hoặc caacutec chuỗi dagravei

Caacutec dạng khaacutec của Triacute tuệ nhacircn tạo

Học maacutey- mạng nơron vagrave giải thuật di truyền

Lập trigravenh tự động ndash lagrave những kỹ thuật tạo ra caacutec chương trigravenh để lagravem 1 nhiệm vụ riecircng biệt (cho pheacutep những người khocircng phải lagrave người lập trigravenh coacute thể lập trigravenh được)

Cuộc sống nhacircn tạo ndash nỗ lực để taacutei tạo caacutec hiện tượng sinh học trong caacutec hệ thống dựa trecircn maacutey tiacutenh

73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia(Expert Systems- ES)

Theo Jackson (1999) Một hệ chuyecircn gia lagrave một chương trigravenh maacutey tiacutenh mocirc tả vagrave suy diễn với tri thức của một vagravei lĩnh vực để giải quyết vấn đề hay đưa ra caacutec lời khuyecircn

Cấu truacutec cơ bản của ES được dựa theo cấu truacutec chung của DSS Sự khaacutec biệt chiacutenh giữa ES vagraveDSS lagrave hệ ES thu thập caacutec kiến thức từ những

chuyecircn gia trong lĩnh vực quan tacircmĐặc trưng của hệ chuyecircn gia Hiệu quả cao Thời gian trả lời thỏa đaacuteng Độ tin cậy cao Dễ hiểu

Giao diện người dugraveng trong ES

Thiết kế giao diện người dugraveng tập trung vagraveo caacutec yếu tố như dễ dagraveng sử dụngcoacute độ tin cậy cao giảm tải những khoacute khăn khi sử dụng

Thiết kế necircn coacute một số tương taacutec (đầu vagraveo kiểm soaacutet vagrave truy vấn)

Cấu tạo giao diện người dugraveng gồm coacute magraven higravenh cảm ứng bagraven phiacutem buacutet saacuteng lệnh thoại caacutec phiacutem chuyecircn dụng

Cơ sở tri thức (Knowledge Base)

Chứa đựng caacutec tri thức cụ thể miền thu được từ caacutec chuyecircn gia miền

Coacute thể chứa caacutec mocirc tả caacutec hagravenh vi giải quyết vấn đề caacutec ragraveng buộc caacutec heuristics

Thagravenh cocircng của một ES dựa trecircn tiacutenh đầy đủ vagrave tiacutenh chiacutenh xaacutec của cơ sở tri thức

Mocirc tơ suy diễn (Inference Engine)

Ở đacircy tri thức được đặt để sử dụng tạo ra caacutec giải phaacutep để giải quyết vấn đề

Mocirc tơ nagravey coacute khả năng thực hiện diễn dịch hoặc suy diễn dựa trecircn caacutec luật hay caacutec caacutec sự kiện

Đồng thời cũng coacute khả năng sử dụng caacutec suy diễn mờ hay khocircng chiacutenh xaacutec dựa trecircn xaacutec suất hay aacutenh xạ mẫu

Vograveng điều khiển suy diễn

1 Aacutenh xạ caacutec luật với caacutec sự kiện đatilde được cho

2 Chọn luật để thực hiện

3 Thực hiện luật bằng caacutech thecircm caacutec sự kiện được suy diễn ra vagraveo bộ nhớ lagravem việc

Chuỗi suy diễn (Chaining)

Suy diễn tiến (forward chaining) maacutey suy diễn bắt đầu từ dữ liệu ban đầu vagrave thực hiện việc suy luận để đưa ra caacutec kết luận cuối cugraveng

Suy diễn lugravei (backward chaining) maacutey suy diễn bắt đầu từ dữ liệu điacutech vagrave tigravem ra tri thức hỗ trợ cho dữ liệu điacutech đoacute

Viacute dụ suy diễn lugravei

R1 Nếu coacute A vagrave B thigrave suy ra coacute D

R2 Nếu coacute B thigrave suy ra coacute C

R3 Nếu coacute C vagrave D thigrave suy ra coacute E

Ta coacute E ta xem trong 3 luật R1 R2 R3 luật nagraveo coacute E ta thấy R3 chứa E đồng thời chứa C vagrave D Xeacutet tiếp trong 2 luật R1 R2 luật nagraveo chứa C vagrave D R2 chứa C R3 chứa D Từ đoacute ta coacute được caacutec tri thức hỗ trợ suy diễn vagrave kết luận lagrave nếu coacute A vagrave B thigrave sẽ coacute E Hay nếu A vagrave B đuacuteng thigrave sẽ coacute E

Viacute dụ suy diễn tiến

Giả sử coacute tập chứa 3 luật sau

R1 Nếu coacute A vagrave B thigrave suy ra coacute D

R2 Nếu coacute B thigrave suy ra coacute C

R3 Nếu coacute C vagrave D thigrave suy ra coacute E

Nếu ta coacute A vagrave B thigrave chuacuteng ta suy ra được D từ R1 vagrave suy ra C từ R2 Với D vagrave C đatilde được suy ra ở trecircn giờ chuacuteng ta suy ra được E từ R3

Viacute dụ thực tế

Giả sử muốn biết magraveu của một con vật nuocirci tecircn lagrave Fred biết rằng noacute kecircu ộp ộp vagrave ăn ruồi

Coacute tập 4 luật ban đầu như sau

R1 Nếu X kecircu ộp ộp vagrave ăn ruồi thigrave X lagrave con ếch

R2 Nếu X kecircu chiecircm chiếp vagrave biết hoacutet thigrave X lagrave con chim

R3 Nếu X lagrave con ếch thigrave X coacute magraveu xanh

R4 Nếu X lagrave con chim thigrave X coacute magraveu vagraveng

74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia

Expert system shells lagrave một tập caacutec goacutei phần mềm vagrave caacutec cocircng cụ dugraveng để phaacutet triển caacutec hệ chuyecircn gia

Những Expert system shells đầu tiecircn thường rất rườm ragrave Mặc dugrave vậy noacute vẫn giuacutep cho người sử dụng sẽ khocircng phải bắt đầu lại từ đầu khi xacircy dựng một hệ chuyecircn gia mới

Những shell hiện đại bao gồm hai mocirc-đun chiacutenh lagrave cocircng cụ xacircy dựng một tập quy tắc vagrave mocirc tơ suy diễn

Xacircy dựng hệ chuyecircn gia

Bước 1 xacircy dựng mocirc higravenh bagravei toaacuten xaacutec định vấn đề nhiệm vụ magrave hệ thống sẽ thực hiện Caacutec dạng bagravei toaacuten cần hệ chuyecircn gia

Bagravei toaacuten diễn giải (InterPretation)

Bagravei toaacuten dự baacuteo (Prediction)

Bagravei toaacuten chuẩn đoaacuten (Diagnose)

Bagravei toaacuten gỡ rối (Debugging)

Bagravei toaacuten thiết kế

Tương tự như một dự aacuten phần mềm để xacircy dựng một hệ chuyecircn gia cần phải coacute caacutec yếu tố về nhacircn lực tagravei nguyecircn vagrave thời gian Những yếu tố nagravey ảnh hưởng đến giaacute thah của một hệ chuyecircn giaTrong phần nagravey cacircu hỏi thường được đặt ra lagrave tại sao cần phải xacircy dựng một hệ chuyecircn giaTrước khi bắt đầu phải xaacute định rotilde bagravei toaacuten đạt ra lagrave jiAi lagrave chuyecircn giaAi lagrave người sử dụng

1 Diễn giải (InterPretation) Nghiecircn cứu 1 vấn đề -gt Dựa trecircn những biểu hiện thuộc tiacutenh đặc trưng becircn ngoagravei -gt Tư vấn

(hoặc đưa ra kết luận hay mocirc tả dễ hiểu từ tập dữ liệu thocirc)

2 Bagravei toaacuten dự baacuteo (Prediction) Coacute thể dự đoaacuten được hagravenh vi kết quả dựa trecircn caacutec hiện tượng -gt dự baacuteo

VD Dự baacuteo thời tiết động đấthellip

3 Bagravei toaacuten chẩn đoaacuten (Diagnoss) Xaacutec định caacutec lỗi caacutec bộ phận hỏng hoacutec của hệ thống dựa trecircn caacutec dữ liệu quan saacutet được

4 Bagravei toaacuten gỡ rối (Debugging) Mocirc tả caacutec phương phaacutep khắc phục hệ thống khi gặp sự cố

5 Bagravei toaacuten thiết kế Lựa chọn cấu higravenh caacutec đối tượng nhằm thoả matilden một số ragraveng buộc nagraveo đoacute

6 Giảng dạy Phần mềm dạy học coacute thể chuẩn đoaacuten vagrave sủa lỗi của học sinh trong quaacute trigravenh học tập

Để xaacutec định đuacuteng bagravei toaacuten magrave chuacuteng ta cần giải quyết thigrave phải trả lời đc một số cacircu hỏi

- cần hệ chuyecircn gia

Bước 2 thu thập tri thức lựa chọn cocircng cụ vagrave aacutep dụng

Trong bước thu thập tri thức vấn đề quan trọng lagrave lựa chọn chuyecircn gia những người magrave sẽ đoacuteng goacutep tri thức cho hệ thống Thocircng thường trong suốt quaacute trigravenh phaacutet triển thigrave chuyecircn gia được xem như một thagravenh viecircn của đội phaacutet triển

Hiện nay coacute rất nhiều cocircng cụ để xacircy dựng một hệ chuyecircn gia Phổ biến nhất lagrave JESS CLIPS vagrave OPS5

Bước 3 Thiết kế cơ sở tri thức thiết kế hệ thốngTri thức được biểu diễn trường minh trong cơ sở tri thức

Caacutec chuyecircn gia vagrave kỹ sư tri thức sẽ đối thoại với nhau bằng caacutec kỹ thuật đối thoại Suy diễn (SD) bảng Mocirc higravenh hoacutea SD quy nạp phacircn loại

Vấn đề bagraveo trigrave vagrave phaacutet triển

Caacutec hệ chuyecircn gia đogravei hỏi phải bảo trigrave vagrave phaacutet triển nhiều hơn so với caacutec hệ thống khaacutec Phải thường xuyecircn bổ sung tri thức mới vagrave thay đổi caacutec tri thức cũ để đổi mới hệ chuyecircn gia

Thu thập vagrave khắc phục lỗi do người sử dụng phaacutet hiện để kịp thời khắc phục những sai soacutet của hệ chuyecircn gia

75 Lợi iacutech vagrave hạn chế của caacutec hệ chuyecircn gia

Một số lợi iacutech chiacutenh

Thời gian trả lời hợp lyacute bằng hoặc nhanh hơn so với chuyecircn gia (người) để đi đến cugraveng một quyết định Hệ chuyecircn gia lagrave một hệ thống thời gian thực (real time system)

Khả năng trả lời với mức độ tinh thocircng bằng hoặc cao hơn so với chuyecircn gia (người) trong cugraveng lĩnh vực

Hệ chuyecircn gia giuacutep cho hiệu quả lagravem việc tăng bằng việc sử dụng tập caacutec luật một caacutech nhanh choacuteng magrave ko bị nhầm lẫn chuyecircn gia lagrave người coacute thể quecircn đi một số tri thức cơ sở lyacute luậ nhưng HCG thigrave ko

Quyết định của một người chuyecircn gia coacute thể bị thay đổi vagrave ko coacute tiacutenh thống nhất như quyết định của một hệ chuyecircn gia tạo ra

Hệ chuyecircn gia giuacutep cho người sử dụng coacute thể trau dồi sự hiểu biết trecircn lĩnh vuej cụ thể magrave noacute giải quyết hỗ trợ người ra quyết định coacute trigravenh độ như 1 chuyecircn gia trong quaacute trigravenh gia quyết định

Kiến thức của rất nhiều chuyecircn gia về một lĩnh vực nagraveo đoacute được đưa vagraveo hệ chuyecircn gia lagravem cho CSTT cuat HCG phong phuacute vagrave rộng lớn hơn rất nhiều

HCG giải thiacutech caacutec bước suy luận một caacutech dễ hiểu nhất quaacuten luacutec nagraveo cũng coacute thể sử dụng ko như chuyecircn gia con người

Hạn chế của caacutec hệ chuyecircn gia

Nhược điểm lớn nhất của hệ chuyecircn gia lagrave những yacute kiến chuyecircn mocircn thường rất khoacute matilde hoacutea vagrave giải neacuten

Hệ chuyecircn gia khocircng coacute khả năng tự học tự cập nhật kiến thức mới như caacutec chuyecircn gia magrave cần phải được matilde hoacutea lại khi noacute được cập nhật

Hệ chuyecircn gia khocircng thể nhận ra được vấn đề khocircng nằm trong miền kiến thức của hệ thống

Chương 8 Tri thức vagrave tiếp nhận

1 Bao gồm caacutec vấn đề

Dữ liệu thực tế đo lường hoặc quan saacutet coacute hoặc khocircng coacute bối cảnh

Thocircng tin dữ liệu được tổng hợp một caacutech hữu iacutech để giải quyết những khoacute khăn trong việc đưa ra quyết định

Tri thức bao gồm caacutec ứng dụng quy tắc thocircng tin hướng dẫn của người ra quyết định

2 Những caacutei nhigraven về tri thức

Đại diện lagravem thế nagraveo để diễn tả tri thức viacute dụ như một quyển saacutech khocircng phải lagrave tri thức nhưng noacute lại lagrave một đại diện của tri thức

Sản xuất tri thức lagrave một tập hơp của hagraveng tồn kho coacute thể được sản xuất cũng như mua lại

Tri thức lagrave 1 trong 6 trạng thaacutei của hệ thống

1Dữ liệu 2Thocircng tin 3Cấu truacutec thocircng tin 4Sự thấu hiểu 5Yacute kiến 6 Quyết định

3 Caacutec loại tri thức Phổ biến mocirc tả dữ liệu thocircng tin thủ tục mọi thứ lagravem như thế nagraveo lập luận chiacutenh saacutech hoặc caacutec quy tắc

4 Thu thập Tri thức hệ chuyecircn gia Hầu hết caacutec phương phaacutep đều bắt đầu với mocirc higravenh của caacutec taacutec vụ trong đoacute

hệ chuyecircn gia được xacircy dựng Trong đoacute mocirc tả về caacutec lĩnh vực được tạo ra Caacutec kỹ sư sử dụng caacutec mocirc higravenh giả thuyết vagrave nhận thức về quaacute trigravenh phacircn

tiacutech để gợi ra caacutech giải quyết vấn đề về tri thức từ caacutec chuyecircn gia

5 Caacutec chiều của thu thập tri thức KE- driven caacutec kỹ sư trao đổi trực tiếp với caacutec chuyecircn gia Expert-driven Caacutec chuyecircn gia trực tiếp đưa chuyecircn mocircn của họ vagraveo hệ

thống maacutey tiacutenh Machine-driven Sử dụng caacutec cocircng cụ suy luận để triacutech xuất tri thức từ một

tập caacutec viacute dụ

6 Kỹ thuật thu thập tri thức Trao đổi gồm 2 loại cơ bản lagrave coacute cấu truacutec(coacute kịch bản) vagrave khocircng coacute cấu

truacutec( đối thoại trực tiếp) Giao thức phacircn tiacutech bằng lời Khi caacutec chuyecircn gia thực hiện một cocircng việc

của họ thigrave một bản ghi về cocircng việc đoacute được thực hiện Caacutec kỹ sư sẽ xacircy dựng mocirc higravenh cho những gigrave được ghi lại trong bản ghi

Phương phaacutep sagraveng lọc caacutec chuyecircn gia so saacutenh caacutec nhoacutem liecircn tiếp trong ba đối tượng vagrave cho biết tại sao nhoacutem thứ hai lại khaacutec nhoacutem thứ ba

7 Thu thập tri thức từ nhiều nguồn Thu thập tri thức từ nhiều nguồn lagrave cần thiết để coacute được đầy đủ caacutec tri thức

cho một vấn đề quan điểm yacute kiến traacutei ngược nhau thường phaacutet sinh Phương phaacutep đồng thuận sẽ giuacutep giải quyết được vấn đề macircu thuẫn Kỹ thuật phacircn tiacutech Meta lagrave kỹ thuật được aacutep dụng trong caacutec trường hợp

khaacutec Caacutech tiếp cận bằng định lượng đogravei hỏi caacutec kỹ sư cần cacircn nhắc yếu tố đầu vagraveo của caacutec chuyecircn gia khaacutec nhau

8 Xaacutec nhận hợp lệ vagrave kiểm tra tri thức Một khi thu thập tri thức noacute phải được đaacutenh giaacute về khả năng sử dụng vagrave độ

chiacutenh xaacutec Hai vấn đề cụ thể lagrave hiệu lực của những kiến thức vagrave kiểm tra việc xacircy dựng cơ sở của tri thức

Cần xaacutec nhận xem liệu hệ thống coacute thể hoạt động ở mức độ tối thiểu khocircng

Xaacutec minh liecircn quan đến việc so saacutenh từng chi tiết kỹ thuật của hệ thống những gigrave đatilde được thực hiện cuối cugraveng

9 Một số caacutec biện phaacutep xaacutec nhận Độ chiacutenh xaacutec Khả năng thiacutech nghi Mức độ đầy đủ Bề rộng Độ sacircu Hiệu lực Tổng quan Chiacutenh xaacutec Hiện thực Độ tin cậy Tiacutenh hữu dụng Mức độ

Chương 9 Học maacutey

1 Logic mờ vagrave ngocircn ngữ mờ(Fuzzy Logic and Linguistic Ambiguity)

Ngocircn ngữ tự nhiecircn gồm những khaacutei niệm mơ hồ vagrave khocircng chiacutenh xaacutectruyền tải ngữ nghĩa thocircng qua tiacutenh xấp xỉkhocircng rotilde ragraveng

Những xấp xỉ nagravey giuacutep con người coacute thể truyền tải hết được yacute nghĩa nhưng maacutey thigrave khocircng hiểu

Lagravem sao biểu diễn caacutec tri thức sử dụng caacutec khaacutei niệm khocircng rotilde ragraveng(mờ) hoặc khocircng chiacutenh xaacutec

2 Khaacutei niệm cơ bản của logic mờ tập mờ lagrave những tập hợp khocircng coacute một giới hạn rotilde Mỗi phần tử của noacute chỉ

chứa một mức độ hagravem liecircn thuộc của từng phần tử Vigrave vậy tập mờ khocircng giống như tập cổ điển Tập mờ coacute thể kết hợp với nhau qua những luật mờ magrave đặc trưng cho những hagravenh động trạng thaacutei vagrave thuộc tiacutenh của logic mờ được tận dụng khi thực hiện một bộ điều khiển mờ

Logic mờ dựa trecircn yacute tưởng mỗi phần tử thuộc vagraveo một tập hợp ở một mức độ nagraveo đấy

Locircgic mờ cho pheacutep độ liecircn thuộc (microA )coacute giaacute trị trong khoảng (01) Locircgic mờ coacute thể được coi lagrave mặt ứng dụng của lyacute thuyết tập mờ để xử lyacute caacutec

giaacute trị trong thế giới thực cho caacutec bagravei toaacuten phức tạp

3 So saacutenh tiacutenh đuacuteng đắn logic mờ vagrave xaacutec suất Xaacutec suất thigrave đề cập đến khả năng xảy ra một biến cố hay một điều gigrave đoacute Logic mờ đề cập đến cấp độ magrave đặc tiacutenh ở hiện tại

o viacute dụ1 người coacute chiều cao 6 feet thigrave coacute cấp độ lagrave 05 về chiều cao

4 Ưu điểm của logic mờ Caacutech tiếp cận rất tự nhiecircnkhocircng phức tạp Coacute thể mocirc higravenh hoacutea caacutec hagravem phi tuyến tugravey yacute phức tạp

Coacute thể tận dụng được kinh nghiệm từ những chuyecircn gia hagraveng đầu trong mọi lĩnh vực

Logic mờ được xacircy dựng dựa trecircn ngocircn ngữ tự nhiecircnNền tảng của logic mờ lagrave dựa trecircn cơ sở giao tiếp của con người

5 Nhược điểm của logic mờ Trong 1 hệ thống phức tạpsử dụng logic mờ coacute thể trở thagravenh trở ngại cho

việc xaacutec thực độ tin cậy của hệ thống Cơ chế lập luận mờ khocircng thể học hỏi từ những lỗi sai

6 Mạng noron nhacircn tạo(ANN) Mạng noron nhacircn tạo lagrave một mocirc phỏng xử lyacute thocircng tinđược nghiecircn cứu ra

từ hệ thống thần kinh của sinh vậtgiống như bộ natildeo để xử lyacute thocircng tin ANNs lagrave chương trigravenh dựa trecircn maacutey tiacutenh đơn giản coacute chức năng lagrave một mocirc

higravenh bagravei toaacuten khocircng gian dựa trecircn thử nghiệm vagrave baacuteo lỗi

7 Học từ kinh nghiệm Tiến trigravenh Một mẫu dữ liệu được biểu diễn như một mạng lưới noronANN ldquodự

đoaacutenrdquo 1 đầu radự đoaacuten được so saacutenh với giaacute trị thực tế hoặc giaacute trị chiacutenh xaacutecNếu đoaacuten được chiacutenh xaacutec thigrave khocircng coacute hagravenh động nagraveo được thực hiện

Nếu dự đoaacuten sai ANN kiểm tra lại vagrave xaacutec định lại thocircng số để điều chỉnh Một mẫu dữ liệu khaacutec được biểu diễn vagrave quaacute trigravenh nagravey được lặp lại

8 Nguyecircn tắc cơ bản của cocircng nghệ nơron Caacutec yếu tố xử lyacute cơ bản trong hệ thống thần kinh của con người lagrave tế bagraveo

thần kinhMạng lưới của tế bagraveo nagravey lagrave liecircn kết với nhau nhận được thocircng tin từ caacutec cảm biến trong mắt taihellip

Thocircng tin nhận được bởi tế bagraveo thần kinh hoặc lagrave sẽ kiacutech thiacutech noacute(sẽ được chuyển qua 1 thocircng điệp dọc theo mạng lưới) hoặc lagrave sẽ ngăn cản noacute(ngăn cản dograveng thocircng tin)

Độ nhạy coacute thể thay đổi qua thời gian hoặc sau khi coacute được kinh nghiệm

9 Cấu truacutec mạng Một ANN gồm 3 lớp cơ bản

Lớp đầu vagraveo nhận dữ liệu Lớp becircn trong hoặc lagrave lớp ẩn xử lyacute dữ liệu Lớp đầu ra chuyển tiếp kết quả cuối cugraveng của mạng

10Mạng nơ ron Thường coacute nhiều đầu vagraveo mỗi đầu vagraveo với mức ảnh hưởng vagrave tầm quan

trọng riecircng của noacute Một đầu vagraveo quan trọng coacute thể được sử dụng để khuếch đại đầu ra caacutec hagravem trạng thaacutei tổng hợp caacutec trọng số của caacutec yếu tố

đầuvagraveo khaacutec nhauvagraveo một giaacute trị duy nhất Caacutec hagravem chuyển giao xử lyacute caacutec giaacute trị trạng thaacutei vagrave tạo đầu ra

11Huấn luyện mạng nơ ron Trong mocirc higravenh coacute giaacutem saacutetANN được đến so saacutenh dự đoaacuten của chiacutenh

noacute với thocircng tin phản hồi coacute chứa caacutec kết quả mong muốn ANN sẽ phải tigravem caacutech thay đổi caacutec tham số becircn trong củamigravenh (caacutec trọng số vagrave caacutec ngưỡng) để tạo necircn một aacutenh xạ coacute khả năng aacutenh xạcaacutec đầu vagraveo thagravenh caacutec đầu ra mong muốn Sự thay đổi nagravey được tiến hagravenh nhờ việc so saacutenh giữa đầu ra thực sự vagrave đầu ra mong muốn

Trong mocirc higravenh khocircng coacute giaacutem saacutetANN nhận được dữ liệu vagraveo nhưng khocircng phải coacute bất kỳ thocircng tin phản hồi về kết quả mong muốn

Phần lớn caacutec ứng dụng nằm trong vugraveng của caacutec bagravei toaacuten ước lượng như mocirc higravenh hoacuteathống kecirc neacuten lọc phacircn cụm

12Lợi iacutech Liecircn kết với mạng noron Traacutenh caacutech lập trigravenh tường minh Giảm nhu cầu của chuyecircn gia ANNs thigrave thiacutech nghi với caacutec yếu tố đầu vagraveo thay đổi Khocircng cần thiết cho cơ sở tri thức tinh chế ANNs coacute tiacutenh động vagrave cải thiện với việc sử dụng Coacute khả năng xử lyacute dữ liệu khocircng chiacutenh xaacutec hoặc khocircng đầy đủ Cho pheacutep tổng quaacutet hoacutea từ thocircng tin cụ thể Cho pheacutep thu thập cảm giaacutec thocircng thường vagraveo miền giải quyết vấn đề

13Hạn chế của việc liecircn kết với mạng noron ANNs khocircng thể giải thiacutech được suy luận Bản chất hộp đen thường khiến cho vấn đề traacutech nhiệm vagrave độ tin cậy phaacutet

sinh lagrave khoacute khăn Lặp đi lặp lại quaacute trigravenh huấn luyện rất tốn thời gian Nguồn lực caacutec nhagrave phacircn tiacutech vagrave thiết kế coacute tay nghề cao vẫn lagrave đaacuteng lo

ngại Cocircng nghệ ANN thuacutec đẩy hạn chế của phần cứng hiện tại ANN yecircu cầu phải coacute sự tin tưởng ở đầu ra

14Giới thiệu về thuật toaacuten di truyền Cũng như mạng lưới thần kinh caacutec thuật toaacuten di truyền được dựa trecircn lyacute

thuyết sinh học Thuật toaacuten di truyền tigravem thấy nguồn gốc của chuacuteng trong caacutec lyacute thuyết

tiến hoacutea của chọn lọc tự nhiecircn vagrave thiacutech ứng với biến đổi khiacute hậu Kết quả thuật toaacuten di truyền lagrave từ giao phối 2 caacute thể trong quần thế để tạo

ra con caacutei đocirci khi tốt hơn so với bậc cha mẹ của chuacuteng 15Caacutec thagravenh phần cơ bản của thuật toaacuten di truyền

Toaacuten tử chọn lọc Caacutec caacute thể tốt được chọn lọc để đưa vagraveo thế hệ sau Sự chọn lọc nagravey căn cứ vagraveo độ thiacutech nghi với mocirci trường của mỗi caacute thể

Toaacuten tử lai gheacutep (crossover) Hai caacute thể cha vagrave mẹ trao đổi caacutec gen với nhau để tạo ra caacute thể con

Toaacuten tử đột biến (mutation) Một caacute thể thay đổi một số gen để biến đổi thagravenh một caacute thể mớiTất cả caacutec toaacuten tử trecircn khi thực hiện đều mang tiacutenh ngẫu nhiecircn

16Quaacute trigravenh cơ bản của một thuật toaacuten di truyền Khởi tạo

Đaacutenh giaacute quần thể

Lựa chọn NST thiacutech hợp nhất vagrave loại bỏ NST yếu nhất

Quy trigravenh giao nhau vagrave cải thiện quần thể

đột biến tiến trigravenh để khaacutem phaacute ra NST mới

17Ưu nhược điểm của việc kết hợp với thuật toaacuten di truyền Kiacutech thước quần thể lagrave 1 yếu tố quan trọng trong tốc độ của việc tigravem

kiếmnhưng noacute tương đối dễ dagraveng để dự đoaacuten tốc độ nagravey Giao nhau hoặc đột biến lagrave khocircng necircn đc sử dụng quaacute thường xuyecircn Luocircn coacute được iacutet nhất 1 giải phaacutep hợp lyacute Necircn coacute thể aacutep dụng chuacuteng cho caacutec vấn đề magrave chuacuteng ta khocircng coacute hướng

về caacutech giải quyết Sức mạnh của thuật toaacuten xuất phaacutet từ khaacutei niệm đơn giảnkhocircng phải từ

một thủ tục thuật toaacuten phức tạp 18Tương lai của học maacutey

Mạng lưới thần kinh nhacircn tạo vượt quaacute năng lực của con người trong caacutec trường hợp bị cocirc lập

Về mặt lyacute thuyếtmột maacutey tiacutenh coacute thể xử lyacute dũ liệu nhanh hơn hagraveng triệu lần so với 1 con người

May mắn thay cho chuacuteng tacon người tốt hơn nhiều khi magrave coacute được dữ liệumaacutey tiacutenh khocircng coacute 1 số thứ như lagrave 5 giaacutec quan

CHƯƠNG 10 KHO DỮ LIỆU

1 Kho dữ liệu Kho dữ liệu lagrave tuyển tập caacutec cơ sở dữ liệu tiacutech hợp hướng chủ đề được

thiết kế để trợ giuacutep cho một hệ hỗ trợ quyết định

Theo John Ladley Cocircng nghệ kho dữ liệu lagrave tập caacutec phương phaacutep kỹ thuật vagrave caacutec cocircng cụ coacute thể kết hợp hỗ trợ nhau để cung cấp thocircng tin cho người sử dụng trecircn cơ sở tiacutech hợp từ nhiều nguồn dữ liệu nhiều mocirci trường khaacutec nhau

Kho dữ liệu thường rất lớn tới hagraveng trăm GB hay thậm chiacute hagraveng Terabyte

2 Kho dữ liệu vận hagravenh (ODS) Một kho dữ liệu vận hagravenh Aacutep dụng kỹ thuật kho dữ liệu vagraveo caacutec hệ xử

lyacute giao taacutec lưu trữ dữ liệu cho một ứng dụng đặc thugrave Noacute đưa vagraveo kho dữ liệu một dograveng caacutec dữ liệu thocirc được thiết kế

3 So saacutenh

Kho dữ liệu vận hagravenh Kho dữ liệu

Dữ liệu theo chủ đề Dữ liệu theo chủ đề

Dữ liệu tiacutech hợp Dữ liệu tiacutech hợp

Dữ liệu thay đổi Dữ liệu khocircng thay đổi

Dữ liệu được cập nhật khi thay đổi

Dữ liệu giữ nguyecircn

Chỉ coacute dữ liệu hiện tạiDữliệu hiện tại vagrave dữ liệu lịch sử

Chu kỳ lagravem tươi dữ liệu ngắn Chu kỳ lagravem tươi dữ liệu dagravei

Chỉ coacute dữ liệu chi tiết Dữ liệu chi tiết vagrave dữ liệu tổng kết

Dugraveng cho caacutec quyết định ngắn hạn

Dugraveng cho hoạch định dagravei hạn

4 Kho dữ liệu cục bộ (Data Mart - DM)

Kho dữ liệu cục bộ lagrave CSDL coacute những đặc điểm giống với kho dữ liệu nhưng với quy mocirc nhỏ hơn vagrave lưu trữ dữ liệu về một lĩnh vực một chuyecircn ngagravenh

Data mart phụ thuộc Chứa những dữ liệu được lấy từ DW vagrave những dữ liệu nagravey sẽ được triacutech lọc vagrave tinh chế tiacutech hợp lại ở mức cao hơn để phục vụ một chủ đề nhất định của Datamart

Data mart độc lập Khocircng giống như Datamart phụ thuộc Data mart độc lập được xacircy dựng trước DW vagrave dữ liệu được trực tiếp lấy từ caacutec nguồn khaacutec nhau

5 Siecircu dữ liệu Metadata lagrave dữ liệu để mocirc tả dữ liệu Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột

một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi Metadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu

6 Mocirci trường kho dữ liệu Hệ thống của tổ chức vagrave kho cung cấp dữ liệu để xacircy dựng kho dữ liệu Trong quaacute trigravenh chuyển dữ liệu từ caacutec nguồn khaacutec nhau dữ liệu coacute thể

được lagravem sạch hoặc chuyển đổi vagrave vigrave thế DW được xem như lagrave một chuẩn cho việc lưu trữ

Đồng thời siecircu dữ liệu được ghi lại Cuối cugraveng DW hoặc siecircu thị coacute thể được sử dụng để tạo ra một kho dữ

liệu ldquocaacute nhacircnrdquo 7 Caacutec đặc điểm của kho dữ liệu

Đặc điểm Mocirc tả

Hướng chủ đề - DL tổ chức theo caacutech thức người dugraveng tham chiếu

Tiacutech hợp - Dữ liệu ldquosạchrdquo loại bỏ tiacutenh thiếu nhất quaacuten

Khocircng thay đổi - DL ldquochỉ đọcrdquo người dugraveng khocircng thay đổi được

Chuỗi thời gian - DL lagrave chuỗi thời gian khocircng phải lagrave trạng thaacutei hiện tại

Được tổng kết - DL vận hagravenhthao taacutec khi cần thiết

được kết hợp lại thagravenh dạng coacute thể dugraveng được cho quyết định

Kiacutech cỡ lớn hơn - Lưu giữ theo chuỗi thời gian tức lagrave giữ lại nhiều DL

Khocircng được chuẩn hoacutea - Coacute thể dư thừa DLSiecircu dữ liệu - Dữ liệu của dữ liệu được lưu trữNguồn dữ liệu - DL vận hagravenh (caacutec hệ sẵn coacute) cugraveng

với caacutec nguồn ngoagravei 8 Kho dữ liệu hướng chủ đề

Hướng chủ để coacute nghĩa lagrave kho dữ liệu được tổ chức xung quanh caacutec chủ đề chiacutenh như khaacutech hagraveng sản phẩm sản xuất Tập trung vagraveo việc mocirc higravenh hoacutea vagrave phacircn tiacutech dữ liệu cho caacutec nhagrave ra quyết định magrave khocircng tập trung vagraveo caacutec xử lyacute thocircng thường Cung cấp cho người dugraveng một khung nhigraven toagraven vẹn đơn giản vagrave đầy đủ về caacutec sự kiện quanh caacutec chủ đề

9 Dữ liệu trong DW được tiacutech hợp Dữ liệu trong kho dữ liệu được xacircy dựng bằng caacutech tổng hợp dữ liệu từ

nhiều nguồn khaacutec nhau vagrave caacutec nguồn coacute tổ chức khaacutec nhau Cơ sở dữ liệu caacutec file excel caacutec flat file hoặc caacutec raw file Khi đưa vagraveo kho dữ liệu caacutec dữ liệu được lagravem sạch vagrave tiacutech hợp dữ liệu nhằm đảm bảo tiacutenh nhất quaacuten của dữ liệu

10Kiến truacutec kho dữ liệu Tầng cơ sở dữ liệu hoạt động Tầng truy xuất thocircng tin Tầng truy xuất dữ liệu Tầng siecircu dữ liệu Tầng quản lyacute tiến trigravenh Tầng thocircng điệp của ứng dụng Tầng vật liacute của kho dữ liệu Tầng trigravenh diễn dữ liệu

11Higravenh trạng kho dữ liệu Kho dữ liệu ảo - người dugraveng cuối coacute thể truy cập trực tiếp đến kho dữ liệu

sử dụng caacutec cocircng cụ cho pheacutep ở tầng truy xuất dữ liệu Kho dữ liệu trung tacircm-1 cơ sở dữ liệu vật lyacute chứa tất cả dữ liệu cho một

vugraveng chuyecircn dụng nagraveo đoacute

Kho dữ liệu phacircn taacuten- Thagravenh phần được phacircn taacuten qua nhiều hệ cơ sở dữ liệu vật lyacute

12METADATA- Siecircu dữ liệu Định nghĩa Siecircu dữ liệu lagrave dữ liệu về dữ liệu Lagrave 1 lưu trữ dugraveng để

Miecircu tả kho dữ liệu tổng thể Nhận dạng kiểu kho dữ liệu Quản liacute quaacute trigravenh tiacutech hợp dữ liệu Quản liacute quaacute trigravenh cập nhật kho dữ liệu Quản liacute bảo mật

Lagrave chigravea khoacutea quyết định sự thagravenh cocircng của kho dữ liệu luocircn được thay đổi vagrave cập nhật theo sự phaacutet triển của kho dữ liệu

Dugraveng để quản liacute điều khiển kho dữ liệu Sự ra đời của kho dữ liệu như 1 cấu truacutec hỗ trợ ra quyết định siecircu dữ liệu

được xem như nguồn tagravei nguyecircn dữ liệu Siecircu dữ liệu lagrave trừu tượng Chuacuteng lagrave dữ liệu bậc cao cung cấp mocirc tả ngắn

gọn caacutec dữ liệu bậc thấp hơn 13Hoạt động của Siecircu dữ liệu

Siecircu dữ liệu rất cần thiết trong việc chuyển hoacutea thocircng tin trở thagravenh tri thức Lagrave chigravea khoacutea giuacutep chuacuteng ta xử lyacute được dữ liệu thocirc Viacute dụ một dograveng dữ liệu baacuten hagraveng 1023 K596 11121 agraveNoacute sẽ khocircng coacute nghĩa gigrave cho đến khi chuacuteng ta đưa vagraveo siecircu dữ liệu (thư

mục chứa dữ liệu) agrave cửa hagraveng 1023 sản phẩm K596 vagrave số tiền baacuten được lagrave 11121 đocirc la

14Sự cần thiết phải nhất quaacuten trong kho dữ liệu Kho dữ liệu được xacircy dựng cho lợi iacutech của những nhagrave phacircn tiacutech kinh

doanh caacutec nhagrave quản trị cho tất cả caacutec khu vực chức năng Trong cơ sở dữ liệu riecircng caacutec khu vực khaacutec nhau coacute thể định nghĩa vagrave lưu

trữ dữ liệu thocircng qua phiecircn bản của chiacutenh noacute Khi dữ liệu được lấy từ những vugraveng khaacutec nhau đoacute vagrave được đặt vagraveo kho dữ

liệu Việc chuyển đổi vagrave lagravem sạch caacutec tiến trigravenh sẽ đảm bảo noacute lagrave duy nhất được tiacutech hợp tại một mức của tổ chức

15Ragrave soaacutet lại dữ liệu ndash Thực thi siecircu dữ liệu

Bất kể cấu truacutec tự nhiecircn của 1 cacircu truy vấn thế nagraveo thigrave caacutec thagravenh phần của siecircu dữ liệu rất quan trọng đối với người ra quyết định

Bảng thuộc tiacutenh khoacutea được lưu trữ bởi kho dữ liệu Tập hợp dữ liệu được lấy từ đacircu Những chuyển đổi nagraveo được thực thi với việc lagravem sạch

16Siecircu dữ liệu lagrave gigrave Metadata - lagrave thocircng tin mocirc tả nội dung của cơ sở dữ liệu (CSDL) Metadata baacuteo cho người dugraveng biết thời gian cập nhật sau cugraveng của dữ liệu

định dạng vagrave mục điacutech sử dụng của noacute Những thocircng tin nagravey coacute thể hướng dẫn người dugraveng duyệt qua CSDL vagrave

giuacutep họ hiểu được yacute nghĩa vagrave ngữ cảnh của dữ liệu Trong CSDL metadata lagrave caacutec dạng biểu diễn khaacutec nhau của caacutec đối tượng

trong CSDL Trong CSDL quan hệ metadata lagrave caacutec định nghĩa của bảng cột CSDL

view vagrave nhiều đối tượng khaacutec Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột

một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi -gtMetadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu

Bảng chuyển đổi Ghi lại những chuyển đổi đatilde được thực hiện

Lịch sử thực thi Ghi lại những dữ liệu đatilde được

phacircn tiacutech

Higravenh thaacutei kết nốiGhi lại những dữ liệu được kết nối vagrave tần suất

17Aacutenh xạ thocircng thường của siecircu dữ liệu Bản ghi aacutenh xạ chuyển đổi bao gồm

Định danh của nguồn gốc Chuyển đổi thuộc tiacutenh Chuyển đổi thuộc tiacutenh vật lyacute Matilde hoacutea tham chiếu bảng chuyển đổi Đổi tecircn Đổi khoacutea Gaacuten giaacute trị cho thuộc tiacutenh mặc định Chọn logic cho caacutec nguồn nhiều giaacute trị Đổi thuật toaacuten

18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để

phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai

lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave

tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec

Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm

Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo

19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua

caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau

SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được

Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra

một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức

Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ

Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ

Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech

CHƯƠNG 11 KHAI PHAacute DỮ LIỆU

1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn

ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993

Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng

2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd

1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều

2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP

3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn

4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng

5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server

6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo

7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động

8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời

9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều

10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện

11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech

12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP

3 Xử lyacute phacircn tiacutech trực tuyến OLAP

MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave

dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu

ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave

thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu

HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave

ROLAP4 Khai phaacute dữ liệu

Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh

khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn

Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan

5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp

6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại

Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp

Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec

Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt

Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra

Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh

vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho

Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec

Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm

Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục

Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng

gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp

Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn

Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec

Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper

Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2

Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25

Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước

Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng

Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện

trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp

Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute

độ hỗ trợ ge ngưỡng minsup

độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan

Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn

Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết

Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu

MOLAP ROLAP HOLAP

Lưu trữ dữ liệu cơ sở

Khối Bảng quan hệ Bảng quan hệ

Lưu trữ thocircng tin tổng hợp

Khối Bảng quan hệ Khối

Hiệu suất thực hiện truy vấn

Nhanh nhất Chậm nhất Nhanh

Tiecircu thụ khocircng gian lưu trữ

Nhiều Thấp Trung bigravenh

Chi phiacute bảo trigrave Cao Thấp Trung bigravenh

Page 11: De cuong(1-11)

bull Lagrave phần tử chủ chốt trong hầu hết hệ hỗ trợ quyết định vagrave lagrave điều kiện cần trong hệ hỗ trợ quyết định dựa vagraveo mocirc higravenh (model-based DSS)

bull Coacute nhiều lớp mocirc higravenh kegravem theo lagrave caacutec kỹ thuật xử lyacute thao taacutec mocirc higravenh đặc thugrave tương ứng

bull Caacutec vấn đề chiacutenh nhận diện bagravei toaacuten vagrave phacircn tiacutech mocirci trường nhận diện biến số dự baacuteo đa mocirc higravenh caacutec phạm trugrave mocirc higravenh quản lyacute mocirc higravenh vagrave mocirc higravenh hoacutea dựa vagraveo kiến thức

bull Mocirc higravenh hoacutea lagrave taacutec vụ khocircng đơn giản Người xacircy dựng mocirc higravenh phải cacircn bằng giữa tiacutenh đơn giản của mocirc higravenh với caacutec yecircu cầu biểu diễn để mocirc higravenh coacute thể nắm bắt đủ thực tại cần thiết cho người ra quyết định

bull Mocirc phỏng lagrave kỹ thuật mocirc higravenh hoacutea thocircng dụng dugraveng để tigravem hiểu vấn đề tuy khocircng nhất thiết phải tigravem ra được caacutec giải phaacutep biến thể mở rộng quaacute trigravenh ra quyết định của tổ chức vagrave cho pheacutep tổ chức xem xeacutet taacutec độngảnh hưởng của caacutec chọn lựa tương lai

bull Mocirc phỏng tiết kiệm rất nhiều chi phiacute vagrave thời gian ndash rất dễ thay đổi mocirc higravenh hoạt động của một hệ thống vật lyacute bằng mocirc higravenh hoacutea maacutey tiacutenh

bull Mocirc higravenh coacute thể được phaacutet triển vagrave cagravei đặt bằng một số caacutec ngocircn ngữ lập trinh (thế hệ 3 4 ) vagrave hệ thống phần mềm khaacutec nhau

Mocirc higravenh tĩnh vagrave động

bull Mocirc higravenh tĩnh thể hiện bức tranh tại thời điểm của tigravenh huống Caacutec khiacutea cạnh của bagravei toaacuten được xeacutet một thời kỳ nhất định trong một khung thời gian nhất định (coacute thể ldquocuốnrdquo về tương lai) Caacutec tigravenh huống được giả sử lagrave sẽ lập lại với tập caacutec điều kiện đồng nhất

1048713 Giả định coacute được tiacutenh ổn định của dữ liệu 1048713 Mocirc phỏng quaacute trigravenh dạng tĩnh - lagravem việc trecircn caacutec trạng thaacutei ổn định để tigravem ra caacutec

thocircng số tối ưu ndash thường được dugraveng như cocircng cụ chủ yếu để thiết kế quaacute trigravenh 1048713 vd quyết định sản xuấtmua 1 sản phẩm baacuteo caacuteo thu nhập hagraveng quyacutenăm bull Mocirc higravenh động biểu diễn caacutec kịch bản thay đổi theo thời gian 1048713 Phụ thuộc thời gian caacutec trạng thaacutei thay đổi theo thời gian 1048713 Thường dugraveng để tạo sinh vagrave biểu diễn caacutec xu hướng vagrave khuocircn mẫu theo thời gian 1048713 Mocirc phỏng động thể hiện caacutec diễn tiến khi caacutec điều kiện theo thời gian khaacutec với caacutec

trạng thaacutei ổn định ndash thường được dugraveng để thiết kế việc kiểm soaacutet caacutec hệ thống 1048713 VD dự baacuteo lời-lỗ trong 5 năm với caacutec nhập lượng như giaacute phiacute số lượng thay đổi

theo từng năm

Mocirc higravenh chắc chắn tương đối dễ phaacutet triển giải quyết vagrave coacute thể sinh ra caacutec giải phaacutep tối ưu 1048713 Caacutec bagravei toaacuten coacute một số lớnvocirc hạn caacutec giải phaacutep khả thi đặc biệt quan trọng 1048713 Caacutec mocirc higravenh tagravei chaacutenh được xacircy dựng trong điều kiện chắc chắn

Mocirc higravenh bất địnhbằng caacutech thu thập thecircm thocircng tin cố gắng đưa bagravei toaacuten trở về dạng chắc chắn hay dạng

rủi ro Mocirc higravenh rủi ro caacutec quyết định kinh doanh được đưa ra dưới caacutec rủi ro giả định

1048713 Đocirci khi biết được xaacutec suất của caacutec sự kiện xảy ra trong tương lai 1048713 Caacutec trường hợp khaacutec (bất định) ước lượng caacutec rủi ro vagrave giả sử caacutec tigravenh huống rủi ro

xảy ra 20Mocirc higravenh hoacutea

MOcirc HIgraveNH HOacuteA BẰNG BẢNG TIacuteNH bull Bảng tiacutenh phần mềm mạnh linh hoạt vagrave dễ dugraveng cho pheacutep tạo sinh caacutec ứng dụng trong kinh doanh kỹ thuật toaacuten vagrave khoa học với tập caacutec hagravem mạnh về tagravei chaacutenh thống kecirc toaacuten bull Kegravem theo lagrave caacutec thagravenh phần cộng thecircm (add-ins) giuacutep xacircy dựng vagrave giải caacutec lớp mocirc higravenh đặc thugrave bull Lagrave cocircng cụ mocirc higravenh hoacutea thocircng dụng nhất của người dugraveng cuối cugraveng bull Coacute caacutec chức năng về phacircn tiacutech ldquowhat-ifrdquo dograve tigravem mục tiecircu quản lyacute dữ liệu vagrave lập trigravenh (dạng macro) bull Coacute khả năng đọc ghi caacutec cấu truacutec tập tin thocircng dụng để giao tiếp được với caacutec CSDL vagrave cocircng cụ khaacutec bull Coacute thể xacircy dựng mocirc higravenh tĩnh vagrave động bull Dugraveng trecircn maacutey tiacutenh caacute nhacircn vagrave maacutey tiacutenh lớn

bull Cơ sở để xacircy dựng caacutec bảng tiacutenh đa chiều vagrave caacutec cocircng cụ xử lyacute phacircn tiacutech trực tuyến (OLAP) MOcirc HIgraveNH HOacuteA BẰNG PHAcircN TIacuteCH QUYẾT ĐỊNH bull Tiếp cận mocirc higravenh hoacutea caacutec tigravenh huống quyết định coacute một số hữu hạnkhocircng quaacute nhiều caacutec phương aacuten ndash mỗi phương aacuten được trigravenh ra dưới dạng bảng hay đồ thị - caacutec kết quả tương ứng (dự baacuteo được kegravem xaacutec suất) theo mục tiecircu bagravei toaacuten ndash từ đoacute chọn phương aacuten tốt nhất bull Đơn mục tiecircu bảng quyết định hay cacircy quyết định bull Đa mục tiecircu AHP (analytic hierarchy process) khaacutec

MOcirc HIgraveNH HOacuteA BẰNG QUY HOẠCH TOAacuteN

bull Quy hoạch toaacuten học (mathematical programming) lagrave họ caacutec cocircng cụ giải quyết caacutec bagravei toaacuten quản lyacute theo đoacute người ra quyết định phải cấp phaacutet caacutec tagravei nguyecircn khan hiếm cho caacutec hoạt động cạnh tranh nhau (caacutec phương aacuten) nhằm tối ưu hoacutea mục tiecircu coacute khả năng đo lường được bull Caacutec mocirc higravenh quy hoạch tuyến tiacutenh (linear programming) thocircng dụng nhất trong quy hoạch toaacuten coacute nhiều ứng dụng trong thực tế được dugraveng nhiều trong caacutec hệ hỗ trợ quyết định bull Bagravei toaacuten quy hoạch tuyến tiacutenh 1048713 Caacutec biến quyết định (cần tigravem giaacute trị) 1048713 Hagravem mục tiecircu (hagravem toaacuten học dạng tuyến tiacutenh xaacutec định quan hệ giữa biến quyết định vagrave mục tiecircu đo lường mức độ đạt đạt mục tiecircu vagrave cần được tối ưu hoacutea) 1048713 Caacutec hệ số của hagravem mục tiecircu (cho biết mức đoacuteng goacutep vagraveo mục tiecircu của 1 đơn vị biến quyết định) 1048713 Ragraveng buộc (biểu thức tuyến tiacutenh cho biết giới hạn tagravei nguyecircn vagravehay caacutec quan hệ giữa caacutec biến số) 1048713 Dung lượng (mocirc tả cận trecircn vagrave dưới của caacutec biến vagrave ragraveng buộc) 1048713 Hệ số (cocircng nghệ) vagraveo-ra (cho biết mức độ sử dụng tagravei nguyecircn của biến quyết định) bull Đặc điểm của bagravei toaacuten quy hoạch tuyến tiacutenh 1048713 Tagravei nguyecircn kinh tế của bagravei toaacuten lagrave coacute hạn vagrave sẵn sagraveng 1048713 Coacute nhiều caacutech (gt2 caacutech) sử dụng tagravei nguyecircn được gọi lagrave giải phaacutep hay chương trigravenh 1048713 Mỗi hoạt động dugraveng tagravei nguyecircn đều sinh ra kết quả dưới dạng mục tiecircu đatilde phaacutet biểu trước 1048713 Việc cấp phaacutet nằm trong caacutec ragraveng buộc cho trước bull Giả định của bagravei toaacuten quy hoạch tuyến tiacutenh 1048713 Caacutec kết quả của caacutec cấp phaacutet coacute thể đem so saacutenh với nhau coacute thể đo lường bằng một đơn vị chung

1048713 Caacutec cấp phaacutet độc lập với nhau về mặt kết quả 1048713 Kết quả cuối cugraveng lagrave tổng của caacutec kết quả từ caacutec hoạt động riecircng rẽ khaacutec nhau 1048713 Dữ liệu coacute tiacutenh chắc chắn 1048713 Tagravei nguyecircn được dugraveng một caacutech kinh tế nhất 1048713 Thường coacute một số lớn caacutec giải phaacutep với kết quả khaacutec nhau 1048713 Trong số caacutec giải phaacutep coacute thể coacute 1 giải phaacutep tốt nhất ndash mức độ đạt được mục tiecircu cao nhất ndash gọi lagrave giải phaacutep tối ưu được tigravem ra bằng một giải thuật đặc biệt MOcirc HIgraveNH HOacuteA BẰNG HEURISTIC bull Việc tigravem giải phaacutep tối ưu của một số bagravei toaacuten quyết định phức tạp coacute thể tốn nhiều thời gian chi phiacute hay khocircng thể tigravem ra được Cograven nếu dugraveng tiếp cận mocirc phỏng cũng coacute thể keacuteo dagravei phức tạp khocircng thiacutech hợp hay thậm chiacute khocircng chiacutenh xaacutec

bull Lagrave một tiếp cận giuacutep tigravem ra caacutec giải phaacutep khả thithỏa matildenđủ tốt cho caacutec bagravei toaacuten phức tạp Coacute thể coacute giải phaacutep đủ tốt (90-999 giaacute trị của lời giải tối ưu) nhanh choacuteng vagrave đỡ tốn keacutem hơn bằng caacutech dugraveng heuristics bull Quaacute trigravenh heuristic lagrave datildey caacutec bước xacircy dựng caacutec quy luật giải quyết vấn đề thocircng qua việc tigravem kiếm caacutec con đường hứa hẹn nhất dẫn đến lời giải tigravem kiếm caacutech thức thu thập vagrave phacircn giải thocircng tin theo quaacute trigravenh giải vagrave phaacutet triền caacutec phương phaacutep dẫn đến một giải thuật tiacutenh toaacuten hay một lời giải tổng quaacutet đatilde coacute bull Aacutep dụng chủ yếu cho bagravei toaacuten cấu truacutec yếu cũng dugraveng để tigravem ra giải phaacutep chấp nhận được cho bagravei toaacuten cấu truacutec chặt bull Khocircng đủ tổng quaacutet như caacutec giải thuật thường chỉ dugraveng cho tigravenh huống đặc thugrave đang xeacutet bull Coacute thể dẫn đến một giải phaacutep dở - caacutec thủ tục từng bước giải quyết vấn đề khocircng đảm bảo tigravem ra giải phaacutep tối ưu bull Heuristic coacute thể lagrave định lượng vigrave vậy coacute thể đoacuteng vai trograve quan trọng trong cơ sở mocirc higravenh của hệ hỗ trợ quyết định bull Heuristic coacute thể lagrave định tiacutenh vigrave vậy coacute thể đoacuteng vai trograve quan trọng trong cung ứng kiến thức cho hệ chuyecircn gia bull Quaacute trigravenh heuristic liecircn quan đến tigravem kiếm học tập ước lượng phacircn xử vagrave lặp lại caacutec hoạt động nagravey dọc theo tiến trigravenh bull Kiến thức thu được dugrave thagravenh cocircng hay thất bại trong quaacute trigravenh đều được phản hồi vagrave sửa đổi chiacutenh quaacute trigravenh nhờ đoacute coacute thể định nghĩa lại mục tiecircu hay bagravei toaacuten 1048713 Giải thuật di truyền bắt đầu bằng tập caacutec giải phaacutep được sinh ngẫu nhiecircn taacutei kết hợp caacutec cặp giải phaacutep một caacutech ngẫu nhiecircn bull Tigravenh huống necircn dugraveng heuristics 1048713 Dữ liệu đầu vagraveo khocircng chiacutenh xaacutec hay coacute giới hạn 1048713 Thực tế quaacute phức tạp đến nỗi khocircng dugraveng được caacutec mocirc higravenh tối ưu 1048713 Chưa coacute được giải thuật chiacutenh xaacutec vagrave đủ tin cậy 1048713 Bagravei toaacuten phức tạp necircn sẽ khocircng kinh tế nếu dugraveng tối ưu hay mocirc phỏng hoặc tốn quaacute nhiều thời gian tiacutenh toaacuten 1048713 Coacute thể cải thiện tiacutenh hiệu quả của quaacute trigravenh tối ưu (tức coacute thể sinh ra caacutec giải phaacutep ban đầu tương đối tốt) 1048713 Liecircn quan đến xử lyacute kyacute hiệu chứ khocircng phải xử lyacute kyacute số (như hệ chuyecircn gia) 1048713 Cần coacute quyết định nhanh vagrave caacutec xử lyacute dựa vagraveo maacutey tiacutenh đều khocircng khả thi (một số heuristic khocircng cần đến maacutey tiacutenh) bull Thuận lợi 1048713 Dễ hiểu dễ giải thiacutech vagrave dễ cagravei đặt 1048713 Nacircng cao tiacutenh saacuteng tạo vagrave năng lực heuristic cho caacutec vấn đề khaacutec 1048713 Tiết kiệm thời gian xaacutec lập vấn đề 1048713 Tiết kiệm yecircu cầu về bộ chứa vagrave xử lyacute maacutey tiacutenh

1048713 Tiết kiệm thời gian tiacutenh toaacuten vagrave do vậy tiết kiệm thời gian thực trong ra quyết định Một số vấn đề phức tạp đến nỗi chỉ coacute thể giải được bằng heuristics 1048713 Thường sinh ra nhiều giải phaacutep chấp nhận được 1048713 Thường coacute thể phaacutet biểu lyacute thuyết hay đo lường thực nghiệm về chất lượng của giải phaacutep (tức giaacute trị mục tiecircu của giải phaacutep gần với giaacute trị tồi ưu đến mức nagraveo dugrave giaacute trị tối ưu chưa biết được) 1048713 Coacute thể kết hợp tiacutenh thocircng minh vagraveo để hướng dẫn pheacutep tigravem kiếm (tigravem kiếm tabu) Năng lực thocircng minh đoacute coacute thể lagrave đặc thugrave theo bagravei toaacuten hoặc dựa trecircn yacute kiến chuyecircn gia được cấy trong hệ chuyecircn gia hoặc cơ chế tigravem kiếm 1048713 Coacute thể dugraveng heuristic hiệu quả vagraveo caacutec mocirc higravenh coacute thể giải bằng quy hoạch toaacuten học Đocirci khi heuristic lagrave phương phaacutep được ưa thiacutech hơn khi khaacutec giải phaacutep heuristics được dugraveng như giải phaacutep ban đầu cho caacutec phương phaacutep quy hoạch toaacuten học bull Hạn chế 1048713 Khocircng đảm bảo coacute được giải phaacutep tối ưu 1048713 Caacutec quy luật coacute rất nhiều ngoại lệ 1048713 Caacutec lựa chọn quyết định tuần tự coacute thể khocircng tiecircn đoaacuten được caacutec kết cục tương lai của mỗi chọn lựa 1048713 Sự liecircn thuộc giữa caacutec phần trong hệ thống đocirci khi coacute thể gacircy ra caacutec ảnh hưởng lớn lao lecircn toagraven hệ thống bull Phacircn loại caacutec giải thuật heuristic 1048713 Heuristic xacircy dựng xacircy dựng giải phaacutep khả thi bằng caacutech cộng thecircm từng thagravenh phần một VD bagravei toaacuten người baacuten hagraveng ndash luocircn gheacute thagravenh phố chưa viếng thăm kế tiếp gần nhất

1048713 Heuristic cải tiến bắt đầu bằng một giải phaacutep khả thi vagrave cố gắng cải tiến liecircn tục trecircn đoacute VD trecircn thử hoaacuten đổi 2 thagravenh phố 1048713 Quy hoạch toaacuten aacutep dụng vagraveo caacutec mocirc higravenh chứa iacutet ragraveng buộc nhằm coacute được thocircng tin về thỏa hiệp tốt nhất với mocirc higravenh nguyecircn gốc Thường được dugraveng trong tối ưu hoacutea nguyecircn (integer optimization) 1048713 Chia giai đoạn giải quyết một vấn đề theo từng giai đoạn VD ở PampG trecircn đacircy bagravei toaacuten phacircn phối được giải quyết trước sau đoacute dugraveng giải quyết bagravei toaacuten chiến lược sản phẩm 1048713 Phacircn ratilde chia bagravei toaacuten thagravenh caacutec phần nhỏ hơn coacute thể giải quyết được sau đoacute kết hợp caacutec giải phaacutep đoacute lại VD chia latildenh thổ baacuten hagraveng thagravenh 4 vugraveng khaacutec nhau giải quyết cho từng vugraveng sau đoacute kết nối caacutec giải phaacutep

21Mocirc phỏngbull Giả định caacutec đặc điểm của thực tạibull Lagrave kỹ thuật tiến triển caacutec thực nghiệm (như phacircn tiacutech ldquowhat-ifrdquo) - bằng maacutey tiacutenh -trecircn một mocirc higravenh của hệ thocircng tin quản lyacute

bull Khocircng thực sự lagrave một mocirc higravenh vigrave khocircng biểu diễn thực tại magrave lagrave cố gắng bắtchước thực tạibull Một trong những phương phaacutep thocircng dụng nhất trong HHTQĐbull HHTQĐ lagravem việc với caacutec bagravei toaacuten phi cấu truacutec vagrave cấu truacutec yếu tigravenh huống thực tếphức tạp ndash khocircng dễ biểu diễn bằng mocirc higravenh tối ưu hay caacutec dạng mocirc higravenh khaacutecnhưng lại thường coacute thể xử lyacute được bằng mocirc phỏngbull Đặc điểm1048713 Iacutet đưa ra caacutec đơn giản hoacutea về thực tại hơn caacutec mocirc higravenh khaacutec1048713 Do triển khai caacutec thực nghiệm necircn noacute coacute thể kiểm thử caacutec giaacute trị cụ thể của caacutecbiến quyết địnhbiến khocircng kiểm soaacutet được của mocirc higravenh vagrave xem xeacutet ảnh hưởnglecircn caacutec biến kết quả1048713 Phương phaacutep coacute tiacutenh mocirc tả (như vậy khaacutec với phương phaacutep danh định)1048713 Khocircng tự động tigravem kiếm giải phaacutep tối ưu ndash noacute mocirc tảtiecircn đoaacuten caacutec đặc tiacutenh của hệthống đatilde cho dưới caacutec điều kiện khaacutec nhau từ đoacute coacute thể chọn ra phương aacuten tốtnhất1048713 Quaacute trigravenh mocirc phỏng thường lặp lại một thực nghiệm nhiều lần để coacute được ướclượng về hiệu ứng tổng quaacutet của một số hagravenh động nhất định1048713 Mocirc phỏng maacutey tiacutenh thiacutech hợp cho hầu hết caacutec tigravenh huống mặc dugrave cũng coacute một sốmocirc phỏng thủ cocircng thagravenh cocircng1048713 Thường chỉ được dugraveng khi bagravei toaacuten quaacute phức tạp khocircng thể xem xeacutet bằng caacutec kỹthuật tối ưu dạng số Tiacutenh phức tạp theo nghĩa bagravei toaacuten khocircng thể cocircng thức hoacuteacho tối ưu (do khocircng thotildea caacutec giả định) hoặc cocircng thức quaacute lớn quaacute nhiều tươngtaacutec giữa caacutec biến hoặc về bản chất bagravei toaacuten lagrave bất định hay rủi roPhương phaacutep mocirc phỏng thiết lập mocirc higravenh của hệ thống thực vagrave tiến hagravenh caacutec thựcnghiệm lặp lại trecircn mocirc higravenh

bull Thuận lợi1048713 Lyacute thuyết tương đối trực tiếp hiệu ứng dagravei hạn của nhiều chiacutenh saacutech -gt neacuten thờigian lớn1048713 Do tiacutenh chất mocirc tả (khaacutec với danh định)1048713 Coacute thể thấy được nhanh choacuteng coacute thể đặt ra caacutec cacircu hỏi ldquowhat-ifrdquo coacute thể dugravengtiếp cận thử-vagrave-sai vagraveo giải quyết vấn đề một caacutech nhanh choacuteng rẻ chiacutenh xaacutec iacutetrủi ro hơn1048713 Thử nghiệm được biến quyết định phần nagraveo của mocirci trường thực sự quan trọngvới caacutec phương aacuten khaacutec nhau1048713 Yecircu cầu kiến thức riecircng biệt về bagravei toaacuten vigrave thế buộc người xacircy dựng mocirc higravenh phảilagravem việc thường xuyecircn với nhagrave quản lyacute ndash đối tượng mong muốn của HHTQĐ để

từ đoacute bản chất bagravei toaacuten vagrave caacutec quyết định được hiểu tốt hơn1048713 Mocirc higravenh được xacircy dựng từ viễn cảnhcaacutech nhigraven của nhagrave quản lyacute1048713 Mocirc higravenh chỉ cho một bagravei toaacuten riecircng biệt thường khocircng thể dugraveng giải caacutec bagravei toaacutenkhaacutec Như vậy mỗi thagravenh phần của mocirc higravenh ứng với một phần của hệ thống thựcdo đoacute sẽ khocircng yecircu cầu nhagrave quản lyacute phải tổng quaacutet hoacutea caacutec hiểu biết của migravenh1048713 Phổ bagravei toaacuten giải được rất rộng tồn kho nhacircn sự hoạch định chiến lược 1048713 Coacute thể chứa caacutec phức tạp thực sự của bagravei toaacuten khocircng cần caacutec đơn giản hoacutea (TDdugraveng caacutec phacircn phối xaacutec suất thực thay vigrave phacircn phối lyacute thuyết xấp xỉ)1048713 Coacute thể tự động sinh ra nhiều đo lường hiệu năng quan trọng1048713 Thường lagrave phương phaacutep duy nhất của HHTQĐ coacute thể xử lyacute caacutec bagravei toaacuten tương đốiphi cấu truacutec1048713 Coacute một số caacutec goacutei phần mềm mocirc phỏng (Monte Carlo) tương đối dễ dugravengbull Điểm yếu1048713 Tuy thường tigravem được caacutec phương aacuten đủ tốt nhưng khocircng đảm bảo lời giải tối ưu1048713 Quaacute trigravenh xacircy dựng mocirc higravenh thường dagravei vagrave tốn keacutem1048713 Giải phaacutep vagrave suy diễn từ nghiecircn cứu mocirc phỏng thường khocircng thể chuyển sang bagraveitoaacuten khaacutec vigrave mocirc higravenh kết hợp caacutec yếu tố đặc thugrave1048713 Đocirci khi do mocirc higravenh quaacute dễ giải thiacutech cho nhagrave quản lyacute necircn caacutec phương phaacutep phacircntiacutech thường xem nhẹ1048713 Phần mềm mocirc phỏng đocirci khi yecircu cầu caacutec kỹ năng đặc biệt do độ phức tạp củaphương phaacutep giải higravenh thứcbull Caacutec loại mocirc phỏng1048713 Mocirc phỏng xaacutec suất một hay nhiều biến độc lập mang tiacutenh xaacutec suất với 2 loạiphacircn phối ndash thường dugraveng kỹ thuật Monte Carlo1048713 Phacircn phối rời rạc tigravenh huống coacute một số giới hạn caacutec biến cố (biến) với hữu hạncaacutec giaacute trị cho mỗi biến cố (biến)1048713 Phacircn phối liecircn tục tigravenh huống coacute số lượng khocircng giới hạn caacutec biến cố tuacircn theocaacutec hagravem mật độ xaacutec suất như phacircn phối chuẩn1048713 Mocirc phỏng độc lậpphụ thuộc theo thời gian1048713 Độc lập khocircng cần thiết phải biết chiacutenh xaacutec thời điểm xảy ra biến cố (nhu cầutiecircu thụ lượng sản phẩm trong ngagravey khocircng biết chiacutenh xaacutec thời điểm tiecircu thụ)1048713 Phụ thuộc cần biết chiacutenh xaacutec thời điểm xảy ra sự kiện (bagravei toaacuten hagraveng đợi)1048713 Mocirc phỏng tương taacutec trực quan1048713 Mocirc phỏng hướng đối tượng dugraveng tiếp cận hướng đối tượng để xacircy dựng mocirc higravenhmocirc phỏng Chuacute yacute ngocircn ngữ mocirc higravenh hoacutea nhất thể UML (unified modelinglanguage) kể cả khi mocirc phỏng caacutec hệ thời gian thựcMOcirc HIgraveNH HOacuteA ĐA CHIỀU ndash XỬ LYacute PHAcircN TIacuteCH TRỰC TUYẾNbull Người ra quyết định thường phải xem xeacutet nhiều chiều của dữ liệu (TD caacutec chiềucủa dữ liệu baacuten hagraveng lagrave sản phẩm vugraveng thời gian người baacuten ) dữ liệu cần đượcphacircn tiacutech trực tiếp bằng caacutec cocircng cụ chuẩn hay phacircn tiacutech tự động bằng caacutec

phương phaacutep khai mỏ dữ liệu (data mining)bull Hầu hết caacutec hệ thống phacircn tiacutech đa chiều được nhuacuteng trong caacutec hệ xử lyacute phacircn tiacutechtrực tuyến (HXLPTTT ndash online analytic processing - OLAP)bull Mục tiecircu của XLPTTT nắm bắt cấu truacutec của dữ liệu thực để hỗ trợ ra quyết địnhbull Trong HHTQĐ coacute sự gắn nối tự nhiecircn giữa mocirc higravenh hoacutea dữ liệu mocirc higravenh hoacutea kyacutehiệu vagrave caacutec khiacutea cạnh của phacircn tiacutech ldquowhat-ifrdquobull Caacutec baacuteo caacuteo của HXLPTTT đều coacute tiacutenh tương taacutec dễ khai thaacutec sử dụng đặc biệtphugrave hợp cho caacutec baacuteo caacuteo về chỉ số hiệu năng chủ yếu (key performance indicators- KPI) baacuteo caacuteo về đo lường hiệu năng kinh doanh bull Thế hệ hiện tại của HXLPTTT vagrave hệ khai mỏ dữ liệu (data mining) tiacutech hợp caacutecđặc tiacutenh của hệ thocircng tin latildenh đạo (executive information system ndashEIS- nhiềucaacutech nhigraven dữ liệu chi tiết hoacutea theo nhu cầu) vagrave caacutec hệ đồ họa khaacutec ndash thường coacutegiao diện người dugraveng dạng kiểu WEBbull Caacutec hệ thống như trecircn cograven được gọi lagrave caacutec cocircng cụ triacute tuệ kinh doanh (businessintelligence - BI) vigrave coacute caacutec đặc trưng về mocirc higravenh hoacutea vagrave tối ưu hoacutea nhưng lạitrong suốt đối với ngươigrave dugravengbull Hiện caacutec cocircng cụ được đưa ra bởi caacutec nhagrave cung cấp về CSDL về hoạch định tagraveinguyecircn tổ chức (ERP) về nhagrave kho dữ liệu (data warehouse) về HXLPTTT MOcirc HIgraveNH HOacuteA VAgrave MOcirc PHỎNG TƯƠNG TAacuteC TRỰC QUANbull Iacutech lợi Người ra quyết định tham gia vagraveo quaacute trigravenh phaacutet triển mocirc higravenh vagrave thựcnghiệm mocirc phỏng vigrave vậy sẽ tin tưởng khi sử dụng mocirc higravenhbull Mocirc higravenh hoacutea tương taacutec trực quan (visual interactive modeling - VIM) dugraveng caacutecbiểu diễn đồ họa maacutey tiacutenh để trigravenh bagravey caacutec ảnh hưởng của caacutec quyết định quản lyacutekhaacutec nhau ở một thời điểm (tĩnh) hay tiến triển theo thời gian (động với kỹ thuậthoạt higravenh)bull Mocirc phỏng tương taacutec trực quan (visual interactive simulation - VIS) cho pheacutepngười dugraveng theo dotildei tiến trigravenh xacircy dựng vagrave sử dụng khai thaacutec mocirc higravenh mocirc phỏngdưới dạng hoạt higravenhbull Mocirc higravenh hoacutea tương taacutec trực quan coacute thể kết hợp với tiếp cận triacute tuệ nhacircn tạo đểđưa ra caacutec khả năng mới thay đổi từ xacircy dựng hệ thống dạng đồ họa đến tigravem hiểuvề động học của hệ thốngbull Cần đến caacutec hệ thống maacutey tiacutenh xử lyacute song song tốc độ cao để xacircy dựng caacutec mocircphỏng - phức tạp quy mocirc lớn dạng hoạt higravenh - mang tiacutenh khả thi ở thời gian thực

22Caacutec dạng hệ thống hỗ trợ ra quyết địnhHệ hỗ trợ quyết định nhoacutemRa quyết định nhoacutem giao tiếp vagrave cộng taacutec- Caacutec đặc điểm của cocircng việc nhoacutem+ Một nhoacutem thực hiện một nhiệm vụ thỉnh thoảng ra quyết định thỉnh thoảngkhocircng ra quyết định+ Caacutec thagravenh viecircn trong nhoacutem coacute thể ở những nơi khaacutec nhau

+ Caacutec thagravenh viecircn trong nhoacutem coacute thể lagravem việc ở những thời gian khaacutec nhau+ Caacutec thagravenh viecircn trong nhoacutem coacute thể lagravem việc cugraveng nhau hoặc ở caacutec tổ chức khaacutecnhau+ Nhoacutem coacute thể vĩnh viễn hoặc tạm thời+ Nhoacutem coacute thể ở bất kỳ mức quản lyacute nagraveo hoặc mức thời gian nagraveo+ Coacute sự điều phối (quaacute trigravenh vagrave nhiệm vụ đạt được) hoặc macircu thuẩn trongnhoacutem+ Coacute sự đạt được hoặcvagrave mất maacutet năng suất trong tổ chức+ Nhiệm vụ phải hoagraven thagravenh rất nhanh+ Khocircng thể hoặc quaacute đắt cho tất cả caacutec thagravenh viecircn trong nhoacutem cugraveng hợp ở mộtnơi+ Một số dữ liệu thocircng tin hoặc kiến thức cần thiết nằm ở nhiều nơi một sốkhaacutec ở ngoagravei tổ chức+ Chuyecircn mocircn của caacutec thagravenh viecircn khocircng coacute trong nhoacutem lagrave cần thiết- Caacutec hoạt động vagrave caacutec quaacute trigravenh miecircu tả caacutec cuộc họp+ Cuộc họp lagrave hoạt động chung liecircn quan bởi một nhoacutem người coacute địa vị bằngnhau hoặc gần bằng nhau+ Kết quả của cuộc họp phụ thuộc một phần vagraveo kiến thức yacute kiến caacutec đaacutenh giaacutecủa caacutec thagravenh viecircn+ Kết quả của cuộc họp cũng phụ thuộc vagraveo sự kết hợp của nhoacutem vagrave phụ thuộcvagraveo quaacute trigravenh ra quyết định được sử dụng bởi nhoacutem đoacute+ Giải quyết caacutec yacute kiến khaacutec nhau bởi người coacute quyền hạn hoặc thương lượnghoặc phacircn xửHỗ trợ giao tiếp- Giao tiếp lagrave thagravenh phần quan trọng cho hỗ trợ quyết định Khocircng coacute giao tiếp thigravekhocircng coacute cộng taacutec Những người ra quyết định caacute nhacircn phải giao tiếp với caacutecđồng nghiệp chuyecircn gia cơ quan chiacutenh phủ khaacutech hagraveng đối taacutec kinh doanh hellipHọ cũng cần dữ liệu vagrave thocircng tin (vagrave kiến thức) từ nhiều nơi trecircn thế giới Caacutecnhoacutem ra quyết định phải giao tiếp cộng taacutec vagrave thương lượng trong cocircng việcHầu hết caacutec tổ chức sẽ nhanh trở thagravenh khocircng coacute chức năng nếu khocircng coacute caacutec hệthống giao tiếp Thương mại điện tử coacute thể hiệu quả chỉ qua caacutec kỹ thuật giao tiếphiện đại- Caacutec kỹ thuật thocircng tin hiện đại cung cấp caacutec phương tiện hỗ trợ giao tiếp rẻnhanh coacute khả năng coacute thể tin cậy Nền tảng hỗ trợ giao tiếp lagrave caacutec hệ thống maacuteytiacutenh mạng+ Bắt đầu bằng điện baacuteo điện thoại radio vagrave ti vi+ Trong 100 năm chuacuteng ta phaacutet triển maacutey fax thư điện tử chương trigravenh chatnhoacutem tin tức hệ thống hội nghị truyền higravenh Hầu hết caacutec kỹ thuật nagravey đềuhoạt động trecircn internet+ Sự phaacutet triển giao tiếp sau cugraveng lagrave hệ thống họp điện tử caacutec dịch vụ vagrave hệ

thống hội nghị điện tử thường sử dụng internet để kết nối caacutec người ra quyếtđịnh- Caacutec thuận lợi aacutep dụng caacutec phương phaacutep giao tiếp cải tiến trong caacutec tổ chức+ Cải tiến năng suất của nhacircn viecircn+ Liecircn quan đến nhiều người ra quyết định chiacutenh+ Khocircng quan tacircm nhiều đến đường biecircn giới địa lyacute+ Tạo nền văn hoacutea hợp taacutec nhất quaacuten+ Cải tiến chất lượng cuộc sống của nhacircn viecircnHỗ trợ cộng taacutec Maacutey tiacutenh hỗ trợ cộng taacutec- Khung thời giannơi chốn+ Sự hiệu quả của kỹ thuật tiacutenh toaacuten cộng taacutec phụ thuộc vagraveo vị triacute của caacutec thagravenhviecircn trong nhoacutem vagrave phụ thuộc vagraveo thời gian chia sẽ thocircng tin gởi vagrave nhận+ Chia sự giao tiếp thagravenh bốn ocirc vagrave tổ chức bốn ocirc dọc theo 2 chiều thời gian vagravenơi chốn1048713 Thời gian Khi gởi vagrave nhận thocircng tin hầu như đồng thời giao tiếp lagrave đồngthời Viacute dụ Điện thoại ti vi vagrave caacutec cuộc họp gặp mặt nhau Giao tiếp bấtđồng bộ xảy ra khi người nhận nhận thocircng tin ở thời điểm khaacutec thời điểmgởi thocircng tin đoacute1048713 Nơi chốn Người gởi vagrave người nhận coacute thể ở cugraveng phograveng hoặc khocircng+ Bốn ocirc lagrave1048713 Cugraveng thời giancugraveng nơi chốn Caacutec thagravenh viecircn gặp mặt nhau cugraveng một luacutecgiống như phograveng quyết định hoặc gặp mặt truyền thống1048713 Cugraveng thời giankhaacutec nơi chốn Caacutec thagravenh viecircn ở caacutec nơi khaacutec nhau nhưnggiao tiếp cugraveng nhau Viacute dụ hội nghị truyền higravenh (videoconferencing)1048713 Khaacutec thời giancugraveng nơi chốn Nhiều người lagravem việc theo ca Ca nagravey để lạithocircng tin cho ca khaacutec1048713 Khaacutec thời giankhaacutec nơi chốn Caacutec thagravenh viecircn ở caacutec nơi khaacutec nhau Caacutecthagravenh viecircn nagravey gởi vagrave nhận thocircng tin ở những lần khaacutec nhau

23Thực thi hệ DSSHệ thống hỗ trợ quản lyacute (MSS) khocircng phải luacutec nagraveo cũng luocircn thagravenh cocircng Nhiều trường hợpthất bại của ES khocircng hoagraven toagraven lagrave lyacute do kỹ thuật Thực thi hệ thống lagrave một quaacute trigravenh liecircn tụcnhằm đảm bảo cho tổ chức chuẩn bị tiếp nhận một hệ thống mới vagrave đưa hệ thống vagraveo sử dụngthagravenh cocircngThực hiện cocircng nghệ hệ thống hỗ trợ quản lyacute lagrave việc phức tạp vigrave caacutec hệ thống nagravey khocircng đơnthuần lagrave hệ thống thocircng tin chỉ thu thập thao taacutec vagrave phacircn phối thocircng tin Magrave xa hơn chuacuteng

liecircn quan tới caacutec cocircng việc coacute thể lagravem thay đổi đaacuteng kể caacutech thức hoạt động của tổ chức Tuyvậy đa số caacutec yếu tố thực thi đều liecircn quan tới hệ thống thocircng tinThực thi MSS lagrave quaacute trigravenh liecircn tục diễn ra trong suốt thời gian phaacutet triển hệ thống từ đề xuấtban đầu đến nghiecircn cứu khả thi thiết kế vagrave phacircn tiacutech hệ thống lập trigravenh huấn luyện chuyểnđổi vagrave lắp đặt Caacutec chuyecircn gia hệ thống thocircng tin thường gọi thực thi lagrave giai đoạn cuối trongvograveng đời hệ thống Định nghĩa thực thi MSS phức tạp hơn vigrave bản chất lặp của sự phaacutet triểncaacutec hệ thống

THỰC THI KHOcircNG HOAgraveN CHỈNHCaacutec quyết định về tiacutenh khả thi thường coacute giả định về lợi iacutech đạt được khi kế hoạch thực thiđược thực hiện hoagraven toagraven Trong thực tế thường chỉ thực hiện 90 thậm chiacute 70 phần trăm sovới phacircn tiacutech khả thi Lyacute do lagrave sự thay đổi tại một nơi trong hệ thống coacute thể ảnh hưởng vagrave coacutethể taacutec động tiecircu cực đến chỗ khaacutec Do vậy cấp quản lyacute coacute thể bỏ những phần trong dự aacuten coacutethể gacircy ra taacutec động xấu Do đoacute dự aacuten sẽ thực hiện iacutet hơn 100 so với dự aacuten kế hoạch Caacutec lyacutedo khaacutec coacute thể lagrave do khấu trừ ngacircn saacutech hoặc vượt chi phiacuteĐAacuteNH GIAacute SỰ THAgraveNH COcircNG CỦA THỰC THI HỆ THỐNGPhải coacute caacutec chỉ số đo lường thigrave mới coacute thể đaacutenh giaacute sự thagravenh cocircng khi thực thi một hệ thốngDickson va Powers (1973) đề ra 5 tiecircu chuẩn độc lậpbull Tỷ lệ thời gian thực hiện dự aacuten với thời gian ước lượngbull Tỷ lệ chi phiacute thực tế vagrave ngacircn saacutech thực hiệnbull Thaacutei độ của cấp quản lyacute đối với hệ thốngbull Nhu cầu thocircng tin của caacutec nhagrave quản lyacute được đaacutep ứng như thế nagraveo qua hệ thốngbull Taacutec động của dự aacuten đối với những hoạt động maacutey tiacutenh trong cocircng tyCaacutec đo lường khaacutec để đaacutenh giaacute thagravenh cocircng của hệ hỗ trợ quản lyacute (MSS)bull Sự sử dụng hệ thống (dự định dugraveng hoặc thực sự dugraveng)bull Thỏa matilden của người dugravengbull Thaacutei độ taacuten thagravenhbull Mức độ hệ thống hoagraven thagravenh caacutec mục tiecircu ban đầubull Phần thưởng đối với tổ chức (giảm chi phiacute tăng doanh thuhellip)bull Tỷ số lợi iacutech chi phiacute

bull Mức độ thể chế hoacutea của MSS trong tổ chứcDo bởi tiacutenh đa dạng của DSS necircn việc đaacutenh giaacute sự thagravenh cocircng của hệ nagravey cũng khoacute khăn tuynhiecircn cũng coacute thể coacute một số yếu tố giuacutep cho DSS thagravenh cocircng như sự tham gia người dugravenghuấn luyện người dugraveng hỗ trợ quản lyacute cấp cao nguồn thocircng tin đặc điểm của những nhiệmvụ coacute liecircn quan (cấu truacutec bất định độ khoacute phụ thuộc)

Chương5Nhoacutem hỗ trợ quyết định vagrave nhoacutemcocircng nghệ phần mềm

51Nhoacutem tạo quyết định

MDM-Holsapple đatilde gợi yacute chuacuteng ta sử dụng giới hạn người tạo quyết định

Một nhoacutem lagrave kết cấu MDM nơi magrave nhiều người ra quyết định hoagraven toagraven tương taacutec

Một đội lagrave kết cấu MDM nơi caacutec thagravenh viecircn tư vấn cho người đưa ra quyết định nhưng khocircng tương taacutec

Một Ủy ban lagrave kết cấu MDM với một người tạo quyết định duy nhất vagrave sự tương taacutec giữa caacutec thagravenh viecircn

Mạng thocircng tin

Mạng lưới baacutenh xe mỗi người tham gia coacute thể giao tiếp với người đưa ra quyết định ở trung tacircm nhưng khocircng phải với người tham gia khaacutecCấu truacutec nagravey lagrave khocircng thỏa matilden tất cả những người tham gia ngoại trừ người ra quyết định

Mạng dacircy chuyền Tham gia chuyển tiếp thocircng tin chỉ để noacute luocircn liền kề nhau trong chuỗi

Thagravenh viecircn cuối cugraveng ko được đaacutep ứng

Mạng vograveng trograven Tương tự như chuỗi nhưng kết thuacutec được kết nối

Mạng kết nối hoagraven toagraven khocircng coacute hạn chế về giao tiếp vagrave tương taacutec giữa caacutec thagravenh viecircnNoacutei chungnoacute đaacutep ứng hầu hết caacutec kết nối của người tham gia nhưng truyền đạt thocircng tin mất nhiều thời gian vagrave coacute nhiều cơ hội xảy ra lỗi

Nhoacutem hagravenh vi vagrave chuẩn mực

MDMs thiết lập caacutec chỉ tiecircu hướng dẫn quaacute trigravenh ra quyết định

Một chuẩn mực quy định cụ thể những gigrave thagravenh viecircn trong nhoacutem dự kiến sẽ lagravem trong những hoagraven cảnh nhất định

Quy tắc gửi coacute thể được thocircng qua viacute dụ đaacutenh giaacute ngang hagraveng hoặc xử phạt

Lagravem thế nagraveo để đưa ra quyết định

Việc chọn lựa magrave trong đoacute việc sử dụng cấu truacutec MDM phải được dựa trecircn một số yếu tố liecircn quan với bối cảnh quyết định

Viacute dụmột cấu truacutec riecircng lẻ sẽ lagravem việc nơi magrave quyết định được cấu truacutec cao vagrave thocircng tin lagrave coacute sẵn

Một ủy ban cơ cấu sẽ lagrave sự lựa chọn khi người ra quyết định khocircng thể đưa ra quyết định một migravenh

52Caacutec vấn đề thường gặp trong nhoacutem

Kiacutech thước Noacutei chung sự nhất triacute vagrave gắn kết giữa caacutec thagravenh viecircn tỉ lệ nghịch với phạm vi nhoacutem Trong nhoacutem lớn rất dễ higravenh thagravenh caacutec nhoacutem nhỏ vagrave hoạt động rời rạc

Tư duy tập thể Trong nhoacutem lớn mọi người coacute xu hướng suy nghĩ đểđạtđược sự nhất triacute necircn khocircng phaacutet huy được sự saacuteng tạo

Caacutec vấn đề về xatilde hội

Xung đột Trong 1 nhoacutem ai cũng muốn migravenh lagrave giỏi nhất necircn dễ dẫn đến xung đột

Ẩn danh(Giấu tecircn) Đacircy lagrave phương phaacutep được sử dụng để kiểm soaacutet xung đột Cho caacutec thagravenh viecircn tham gia ẩn danh

Vấn đề giới tiacutenh Nam vagrave nữ thường coacute những thế mạnh khaacutec nhau điều nagravey coacute thể lagrave sức mạnh trong 1 thiết lập MDM

Đagravem phaacuten vagrave quyết định

Một quyết định coacute thể liecircn quan đến nhiều quan điểm khaacutec nhau vigrave thế cần phải coacute sự đagravem phaacuten

Caacutec thiết kế của cơ chế hỗ trợ cho MDM phải phugrave hợp với caacutec hoạt độngđagravemphaacuten

Những hoạt động nagravey bao gồm việc thu nhận yacute kiến của caacutec thagravenh viecircn 1 caacutech cocircng bằng

53Cocircng nghệ hỗ trợ MDM

Organizational DSSndash 1 hệ thống cung cấp caacutec quyết định hỗ trợ

Group Support Systemndash Cocircng nghệ sử dụng sự hỗ trợ của nhiều becircn tham gia

Group DSS ndash Lagrave 1 hệ thống được thiết kế đặc biệt để hỗ trợ cho MDM

DSS ndash Lagrave 1 hệ thống dưới sự kiểm soaacutet của 1 người quyết định hệ thống nagravey cung cấp 1 bộ cocircng cụ giuacutep phacircn tiacutech hoagraven cảnh đểđưa ra quyết định vagrave nacircng cao hiệu quả của quyết địnhđoacute

53Cocircng nghệ hỗ trợ MDM

Organizational DSSndash 1 hệ thống cung cấp caacutec quyết định hỗ trợ

Group Support Systemndash Cocircng nghệ sử dụng sự hỗ trợ của nhiều becircn tham gia

Group DSS ndash Lagrave 1 hệ thống được thiết kế đặc biệt để hỗ trợ cho MDM

DSS ndash Lagrave 1 hệ thống dưới sự kiểm soaacutet của 1 người quyết định hệ thống nagravey cung cấp 1 bộ cocircng cụ giuacutep phacircn tiacutech hoagraven cảnh đểđưa ra quyết định vagrave nacircng cao hiệu quả của quyết địnhđoacute

Mục tiecircu của cocircng nghệ hỗ trợ MDM

Quy trigravenh hỗ trợ tập trung vagraveo quaacute trigravenh tạo điều kiện thuận lợi cho sự tương taacutec

Cơ chế cấu truacutec quaacute trigravenh chi phối caacutec hoạt động truyền thocircng

Nhiệm vụ hỗ trợ cocircng việc coacute thể chọn lựa tổ chức hoặc lấy thocircng tin

Nhiệm vụ cấu truacutec cocircng việc cho pheacutep truy cập đến kỹ thuật lọc kết hợp phacircn tiacutech kiến thức liecircn quan đến cocircng việc

Caacutec lớp loại cocircng nghệ hỗ trợ MDM

Phacircn loại theo đặc điểm do DeSanctis vagrave Gallupe đưa ra đề xuất một chương trigravenh ba cấp dựa trecircn caacutec tiacutenh năng được cung cấp

Hệ thống cấp 1 Mục điacutech chiacutenh lagrave tạo điều kiện thocircng tin liecircn lạc giữa caacutec thagravenh viecircn

Hệ thống cấp 2 Thiết kế để giảm thiểu rủi ro

Hệ thống cấp 3 Giuacutep điều chỉnh xử lyacute quyết định

Phacircn loại theo cocircng nghệ -Kraemer vagrave King tập trung vagraveo cocircng nghệ aacutep dụng

Cocircng nghệ bảng mạch điện tử

Hội nghị trực tuyến

Mạng lưới tập đoagraven

Trung tacircm thocircng tin

Mocirci trường cộng taacutec

Phograveng quyết định

Nhoacutem phần mềm

Phần mềm được thiết kế để hỗ trợ sự hợp taacutec bao gồm việc thu huacutet vagrave lưu trữ thocircng tin

Caacutec tổ chức dẫn đầu thị trường hiện tại lagrave Lotus Notes and Domino Microsoft Exchange Novell GroupWise and Oracle Office

Caacutec cocircng cụ trong một bộ phần mềm bao gồm người quản lyacute hội nghị (Lotus Sametime) vagrave trao đổi thocircng điệp (Lotus Notes Mail)

Xếp hạng phần mềm cho nhoacutem

Ellis vv đề xuất một hệ thống xếp hạng dựa vagraveo kiểu sự hỗ trợ noacute Cung cấp

Hệ thocircng điệp

Hệ thống hội thảo truyền higravenh

Hệ thống cộng taacutec soạn thảo

Nhoacutem phacircn phối giải phaacutep phần mền

Hệ thống phối hợp

Hệ thống thocircng minh đại diện

Lực lượng điều khiển phaacutet triển phần mềm cho nhoacutem

Một số nhacircn tố chiacutenh bao gồm

Tăng năng suất

Giảm số lượng caacutec cuộc họp

Tăng cường tự động hoacutea caacutec quy trigravenh lagravem việc thường xuyecircn

Cần phối hợp toagraven cầu tốt hơn

Tiacutenh sẵn sagraveng của những mạng lan rộng

Coleman vagrave Khanna liệt kecirc 10 nhacircn tố khaacutec

54Quản lyacute hoạt động MDM (Mobile Device Management - Quản lyacute thiết bị di động)

Một số phương phaacutep phối hợp phổ biến hơnMDM lagrave

Kỹ thuật nhoacutem định danh

Kỹ thuật Delphi

Sự phacircn xử

Hệ thocircng tin dựa trecircn vấn đề

Nemawashi

Kỹ thuật nhoacutem định danh

1-Mỗi người tham gia viết ra những yacute tưởng về những gigrave necircn quyết định

2-Lần lượt mỗi người tham gia trigravenh bagravey yacute tưởng của migravenh được ghi lại trecircn bảng Khocircng thảo luận ở đacircy

3-Sau khi tất cả caacutec yacute tưởng được trigravenh bagravey caacutec đại biểu coacute thể chất vấn những người khaacutec

4-Mỗi người tham gia bỏ phiếu cho mỗi yacute tưởng

Kỹ thuật Delphi

Về cơ bản tương tự như kỹ thuật nhoacutem định danh ngoại trừ những người khocircng bao giờ tham gia cuộc họp

Một cocircng cụ khảo saacutet được sử dụng để thu thập đầu vagraveo ban đầu từ caacutec thagravenh viecircn

Một cuộc khảo saacutet thứ hai được gửi đi với một bản toacutem tắt caacutec kết quả chung

Những bước lặp lại cho đến khi đạt được một sự đồng thuận hoặc nhigraven nhận của đa số

Sự phacircn xử(Arbitration )

Thiacutech hợp nhất khi caacutec thagravenh viecircn của MDM đại diện cho caacutec yếu tố đối lập

Những người tham gia đồng yacute rằng nếu lựa chọn thay thế hai becircn thỏa thuận khocircng được tigravem thấy thigrave một trọng tagravei viecircn becircn ngoagravei sẽ tham gia

Trọng tagravei sau đoacute lựa chọn thay thế ocircng hoặc xeacutet thấy thiacutech hợp nhất

Hệ thống thocircng tin dựa trecircn vấn đề (IBIS)

Lagrave một phương phaacutep lập luận cấu truacutec

Một đại diện cho IBIS lagrave một đồ thị với caacutec nuacutet vagrave caacutec liecircn kết

IBIS bắt đầu với lựa chọn của một nuacutet vấn đề gốc sau đoacute caacutec nuacutet vị triacute khaacutec nhau được liecircn kết với nuacutet gốc

Caacutec nuacutet vị triacute nagravey sau đoacute được đaacutenh giaacute dựa trecircn những lập luận gắn liền với chuacuteng

Nemawashi (được sử dụng rộng ratildei tại Nhật Bản)

1-Một hoặc nhiều thagravenh viecircn của MDM được chỉ định lagrave điều phối viecircnCaacutec điều phối viecircn sau đoacute chọn người tham gia cograven lại

2-Điều phối viecircn xacircy dựng một tổng hợp caacutec sự lựa chọn vagrave sau đoacute caacutec chuyecircn gia đaacutenh giaacute caacutec lựa chọn

3-Điều phối viecircn lựa chọn một sự lựa chọn dựa trecircn kết quả ở trecircn(ở 2)

4-Sự thay thế được luacircn chuyển điều phối viecircn tigravem kiếm sự đồng thuận thocircng qua sự thuyết phục vagrave đagravem phaacuten

5-Nếu đạt được sự đồng thuận điều phối viecircn cho lưu thocircng một tagravei liệu magrave mỗi thagravenh viecircn MDM để lại dấu hiệu trecircn đoacute

55Nơi lagravem việc ảo

Nhiều tổ chức trecircn toagraven thế giới kinh doanh bất động sản cho cocircng nghệ hợp taacutec

Cocircng việc được trở thagravenh một điều bạn lagravem hơn lagrave một nơi bạn đi

Những thay đổi lớn nhất mang lại bởi nơi lagravem việc ảo coacute thể lagrave về văn hoaacute hay xatilde hội hơn lagrave về cocircng nghệ

Chương 6 Hệ thống thocircng tin điều hagravenh

61 Yacute nghĩa của EIS- Hệ thống thocircng tin điều hagravenh

- EIS lagrave một dạng đặc biệt của DSS được thiết kế để hỗ trợ ra quyết định ở cấp cao nhất của một tổ chức

- Lagrave một hệ thống thocircng tin hỗ trợ nhu cầu lập kế hoạch vagrave đaacutenh giaacute của caacutec nhagrave quản lyacute điều hagravenh

- EIS coacute thể giuacutep một CEO coacute được bức tranh tổng thể chiacutenh xaacutec nhất về caacutec hoạt động vagrave một bản toacutem tắt những gigrave magrave đối thủ cạnh tranh đang lagravem

- Caacutec hệ thống nagravey noacutei chung hoạt động dễ dagraveng vagrave trigravenh bagravey thocircng tin theo những caacutech dễ hiểu để việc tiếp thu được nhanh choacuteng (biểu đồ đồ thịhellip)

(Tagravei liệu thecircm EIS lagrave những loại hệ thống lagrave rất phức tạp trong tự nhiecircn Coacute thể noacutei hệ thống nagravey cũng cung cấp cho caacutec nhagrave quản lyacute với caacutec thiết bị coacute khả năng ra quyết định bằng caacutech sử dụng của noacute Hệ thống nagravey hoạt động trong điều kiện như vậy quan trọng như trong caacutec hệ thống khaacutec khocircng hỗ trợ Khả năng lưu trữ dữ liệu nặng lagravem cho noacute lyacute tưởng để được thocircng qua khocircng chỉ bởi caacutec doanh nghiệp lớn magrave cograven bởi caacutec doanh nghiệp nhỏ hơn Nhigraven chung hệ thống nagravey lagrave dagravenh cho caacutec nhacircn viecircn cấp cao hỗ trợ thagravenh thạo trong việc đưa ra caacutec quyết định quan trọng)

Caacutec phiecircn EIS tiecircu biểu- Phiecircn lagravem việc coacute thể bắt đầu với một baacuteo caacuteo về tigravenh higravenh tagravei chiacutenh vagrave kinh

doanh của một cocircng ty caacutec chỉ số hoạt động quan trọng được hiển thị rotilde ragraveng- EIS sẽ cho pheacutep caacutec giaacutem đốc điều hagravenh coacute thể đi sacircu vagraveo dữ liệu từ những con

số bất kỳ magrave noacute hỗ trợ- Việc điều hagravenh coacute thể lựa chọn một mức độ chi tiết ( VD danh số baacuten hagraveng) nếu

như cần điều tra thecircm- Lagrave một phương phaacutep tiếp cận coacute thể giuacutep việc ra quyết định tốt hơn

Những điều magrave EIS ko coacute- EIS khocircng phải lagrave sự thay thế cho caacutec hệ thống dựa trecircn caacutec maacutey tiacutenh khaacutec EIS

thực sự chỉ cung cấp dữ liệu cho caacutec hệ thống nagravey- Noacute khocircng thể biến caacutec bộ hệ điều hagravenh của maacutey tiacutenh thagravenh những ldquochuyecircn viecircn

giỏirdquo- Coacute thể được viacute một caacutech cao hơn như lagrave một trợ lyacute đaacuteng tin cậy coacute thể được gọi

đến bất khi nagraveo vagrave mỗi khi cần thiết

Tagravei liệu thecircm Sự khaacutec nhau giữa EIS vagrave DSS+ EIS thiết kế để hỗ trợ những người điều hagravenh cấp cao giuacutep họ khaacutem phaacute caacutec vấn đề vagrave caacutec cơ hội DSS hỗ trợ những nười phacircn tiacutech cố gắng trả lời cacircu hỏi caacutei gigrave coacute thể lagravem cugraveng với một cơ hội hoặc một vấn đề

Chiều EIS DSSNhững người sử dụng thocircng thường

Duyệt dữ liệu đi xuống truy xuất trạng thaacutei

Hỗ trợ phacircn tiacutech vagrave quyết định

Sự thuacutec đẩy Tiacutenh thiacutech hợp Tiacutenh hiệu quảỨng dụng Queacutet mocirci trường đaacutenh giaacute

hiệu suất nhận dạng caacutec vấn đề vagrave caacutec cơ hội

Caacutec quyết định quản lyacute trecircn caacutec lĩnh vực đa dạng

Hỗ trợ quyết định Caacutec chiacutenh saacutech caacutec quyết định khocircng coacute cấu truacutec ở mức cao vagrave hỗ trợ giaacuten tiếp

Hỗ trợ caacutec quyết định lặp lại caacutec quyết định khocircng thể đoaacuten trước ra quyết định khocircng coacute cấu truacutec vagrave baacuten cấu truacutec

Loại thocircng tin Caacutec thocircng tin tin tức thocircng tin becircn ngoagravei về khaacutech hagraveng đối thủ cạnh tranh mocirci trường caacutec baacuteo caacuteo theo yecircu cầu vagrave định thời về caacutec hoạt động becircn trong

Caacutec thocircng tin hỗ trợ caacutec tigravenh huống đặc biệt

Sử dụng coacute nguyecircn tắc

Dograve theo vết vagrave điều khiển nhận dạng cơ hội

Hoạch định tổ chức phacircn nhoacutem vagrave điều khiển

Khả năng phugrave hợp với những người sử dụng caacute nhacircn

Thiết kế loại ra quyết định cho mỗi người điều hagravenh caacute nhacircn bằng nhiều lựa chọn đầu ra

Cho pheacutep caacutec đaacutenh giaacute caacute nhacircn caacutec khả năng what-if lựa chọn loại hộp hội thoại

Đồ họa Phải coacute Lagrave một phần quan trọng của nhiều DSS

Thacircn thiện người sử dụng

Phải coacute Phải coacute nếu khocircng coacute người sử dụng trung gian

Xử lyacute thocircng tin Lọc neacuten thocircng tin dograve theo vết dữ liệu vagrave thocircng tin quan trọng

EIS kiacutech thiacutech caacutec cacircu hỏi caacutec cacircu trả lời bằng caacutech sử dụng DSS vagrave phản hồi lại EIS

Hỗ trợ caacutec thocircng tin chi tiết

Truy xuất thường xuyecircn caacutec mức chi tiết của bất kỳ thocircng tin tổng hợp nagraveo (duyệt dữ

Coacute thể coacute trong DSS nhưng khocircng thường

liệu chi tiết)Cơ sở mocirc higravenh Caacutec chức năng coacute sẵn bị hạn

chếLagrave điểm cốt lotildei của DSS

Cấu truacutec Theo người baacuten sản phẩm hoặc theo caacutec chuyecircn gia hệ thống thocircng tin

Theo người sử dụng hoặc caacute nhacircn hoặc caacutec chuyecircn gia từ caacutec trung tacircm thocircng tin hoặc phograveng ban hệ thống thocircng tin

Phần cứng Mainframe caacutec trạm RISC mạng LANs hoặc caacutec hệ thống phacircn bố

Mainframe caacutec trạm RISC caacutec maacutey PC hoặc caacutec hệ thống phacircn bố

Bản chất caacutec goacutei phần mềm

Truy xuất tương taacutec dễ dagraveng đến nhiều cơ sở dữ liệu truy xuất trực tuyến caacutec khả năng DBMS phức tạp caacutec liecircn kết phức tạp

Caacutec khả năng tiacutenh toaacuten lớn caacutec ngocircn ngữ mocirc higravenh mocirc phỏng ứng dụng vagrave caacutec bộ tạo DSS

Bản chất caacutec thocircng tin

Trigravenh bagravey thocircng tin được phaacutet sinh trước về quaacute khứ vagrave hiện tại tạo caacutec thocircng tin mới về quaacute khứ hiện tại tương lai

Tạo thocircng tin mới về quaacute khứ hiện tại tương lai

62 Lịch sử EIS- EIS xuất hiện lần đầu tiecircn tại MIT vagraveo những năm 1970

- Những EIS đầu tiecircn được phaacutet triển bởi caacutec doanh ngiệp lớn sẵn sagraveng chấp nhận rủi ro để đạt được lợi thế cạnh tranh

- Vagraveo những năm 1980 caacutec nhagrave cung cấp đatilde phaacutet triển một số cơ sở khaacutech hagraveng rộng vagrave cocircng nghệ EIS được tiếp tục phaacutet triển cho đến ngagravey nay

(Tagravei liệu thecircm Sử dụng DSSEIS cho phaacutet triển bền vững + Một số nghiecircn cứu đatilde được tiến hagravenh để kiểm tra việc thực hiện của EIS trong khu vực cocircng cộng vagrave chiacutenh phủ caacutec nước tổ chức kể từ khi chuacuteng được phaacutet triển theo định hướng lợi nhuận cho caacutec cocircng ty tư nhacircn (Hasan vagrave Hasan năm 1997) Theo một nghiecircn cứu tiến hagravenh tại Mỹ ở hơn 300 cocircng ty kết quả cho thấy sự khaacutec biệt của EIS giữa tư nhacircn vagrave chiacutenh phủ một số kết quả thuacute vị được phaacutet hiệnViacute dụ khoacute khăn hơn để chuyển tiền từ một tagravei khoản khaacutec trong một EIS của chiacutenh phủ cũng lagrave khoacute khăn hơn để biện giải thiacutech cho những chi phiacute phaacutet triển EIS của chiacutenh phủ Một nghiecircn cứu khaacutec được tiến hagravenh ở Australia

cho thấy rằng EIS cung cấp cho quản lyacute một higravenh ảnh chiacutenh xaacutec hơn về tổ chức thực hiện vagrave cung cấp hỗ trợ cho caacutec lợi iacutech chiến lược cải thiện khocircng chỉ cho caacutec nhagrave quản lyacute nhưng cograven cho phần cograven lại của tổ chức Dựa trecircn caacutec hệ thống được thiết kế cho caacutec cocircng ty tư nhacircn với một caacutech rotilde ragravengxaacutec định mục tiecircu EIS lagrave thiacutech hợp cho caacutec tổ chức cocircng cộng hiện đại nhưng cần phải được linh hoạt hơn vagrave kết thagravenh chugravem một phạm vi rộng hơn khả năng vagrave phương tiện hơn so với khu vực tư nhacircn ban đầu theo định hướng sản phẩm (Hasan vagrave Hasan năm 1997) Điều nagravey coacute thể lagrave do thực tế rằng caacutec hoạt động khu vực cocircng lagrave bắt buộc coacute taacutec động rộng phải đaacutep ứng sự mong đợi duy nhất cocircng cộng thường coacute mục tiecircu mơ hồ vagrave macircu thuẫn iacutet quyền tự chủ vagrave kiểm soaacutet việc ra quyết định vagrave nhacircn viecircn lagrave khoacute khăn hơn (Watson vagrave Carte2000) + Toacutem lại EIS lagrave một khaacutei niệm thagravenh cocircng noacute phaacutet triển qua nhiều năm tuy nhiecircn EIS khắc phục khiếm khuyết của migravenh bằng caacutech tiến hagravenh nghiecircn cứu liecircn tục)

63 Tại sao những người điều hagravenh hagraveng đầu lại khaacutec nhau- Họ lagrave những doanh nghiệp theo định hướng coacute suy nghĩ

- Coacute một khoảng khocircng gian rộng để kiểm soaacutet

- Họ chịu traacutech nhiệm cho việc thiết lập chiacutenh saacutech

- Họ đại diện cho tổ chức mocirci trường becircn ngoagravei

- Hagravenh động của họ tạo ra những kết quả đaacuteng kể về tagravei chiacutenh vagrave con người

Tần số caacutec hoạt động điều hagravenh- Xử lyacute xaacuteo trộn 42

- Hoạt động kinh doanh 32

- Phacircn bổ nguồn lực 17

- Đagravem phaacuten 3

- Những điều khaacutec 6

Handling Disturbances 42

Entrepreneurial Activites 32

Resource Allocation 17

Negotiation 3

Other 6

Những thocircng tin điều hagravenh cần thiết- Quản lyacute xaacuteo trộn coacute thể yecircu cầu sự chuacute yacute xung quanh đồng hồ

- Hoạt động kinh doanh yecircu cầu điều hagravenh để dự đoaacuten những thay đổi trong mocirci trường

- Nhiệm vụ phacircn bổ tagravei nguyecircn yecircu cầu lựa chọn người quản lyacute vagrave caacutec nguồn lực hạn chế được triển khai

- Đagravem phaacuten yecircu cầu cập nhật thocircng tin từng phuacutet để coacute thể xacircy dựng được sự đồng thuận

Caacutec loại thocircng tin điều hagravenh- Hệ thống kế toaacuten coacute liecircn quan đến việc tiacutenh toaacuten thu nhập hoạt động cho caacutec lĩnh

vực cụ thể lagrave quan trọng hơn so với caacutec hệ thống kế toaacuten truyền thocircng- Thocircng tin về thị trường khaacutech hagraveng cung cấp giaacute trị trong việc quyết định chiến

lược- Caacutec thocircng tin cần thiết thường được truyền đi trecircn một số hệ thống maacutey tiacutenh vagrave

nằm trong toagraven tổ chức- Caacutec thocircng tin được sử dụng thường lagrave ngắn hạn vagrave dễ thay đổi

Phương thức để xaacutec định thocircng tin cần thiết

Rockart xaacutec định được năm phương thức cơ bản để xaacutec định thocircng tin cần thiết

- Phương thức dựa trecircn kết quả- Phương thức rỗng- Phương thức chỉ số khoacutea- Phương thức tổng hợp nghiecircn cứu- Phương thức dựa vagraveo nhacircn tố then chốt dẫn đến thagravenh cocircng

64 Thagravenh phần EIS

- Sản phẩm EIS đầu tiecircn được phaacutet triển để sử dụng trecircn maacutey tiacutenh cấu higravenh cao nhưng caacutec sản phẩm hiện nay nhằm mục tiecircu lagrave nền tảng ClientServer

- Những nền tảng linh hoạt hơn coacute thể thiacutech ứng với thay đổi trong tổ chức vagrave cocircng nghệ

- Sử dụng dữ liệu thời gian thực dẫn đến quyết định nhanh hơn nhiều thocircng tin hơn

Thagravenh phần phần cứng- Một EIS khocircng đogravei hỏi coacute phần cứng cụ thể hoặc duy nhất nagraveo- Chigravea khoacutea của vấn đề lagrave để đảm bảo rằng caacutec thagravenh phần của EIS tối ưu hoacutea vagrave

phugrave hợp với tagravei nguyecircn maacutey tiacutenh của tổ chức- Hệ thống nagravey phải được cấu higravenh để caacutec nguồn tagravei nguyecircn phugrave hợp với những

người điều hagravenh chuacuteng

Thagravenh phần phần mềm- Traacutei ngược với phần cứng phần mềm thường được chuyecircn mocircn hoacutea cao cho caacutec

bagravei toaacuten về miền- Sự chuyecircn mocircn hoacutea nagravey thường đạt được bằng caacutech sử dụng thagravenh phần off-the-

shelf cho toagraven bộ EIS vagrave caacutec mocirc-đun tugravey chỉnh để đaacutep ứng nhu cầu cụ thể- Lotus Notes lagrave một viacute dụ điển higravenh Noacute coacute thể được sử dụng một migravenh hoặc coacute

thể phục vụ becircn thứ ba mocirc-đun plug-in

Cocircng nghệ EIS hiện nay

Dobrzeniecki đề xuấtphacircn loạitừng cấptheo bachức năng- Loại 1 sản phẩm bao gồmmột bộ đầy đủcaacutec ứng dụngtừ mộtnhagrave cung cấp- Loại 2 sản phẩm đượcthựchiệnở phần đầu củacaacutecsản phẩmDSS đượcphaacutet triển

bởicugravengmộtnhagrave cung cấp- Loại 3 sản phẩmkết hợp với nhautheo bất kỳ số lượngthuộc sở hữu củacocircng ty

65 Xacircy dựng EIS

- Xacircy dựngmộtEISgiống nhưxacircydựngmột số hệ thống khaacutec củamocirc higravenh hệ thống thocircng tin

- Việcphaacutet triểncấu truacutecnecircn được theo dotildeitừ quaacute trigravenh thiết kế đến quaacute trigravenhthực hiện

- Tuy nhiecircn một dự aacuten phaacutet triển EIScoacute xu hướnglagrave thống nhấtvagraveyecircu cầu hỗ trợ caacutec nhagrave quản lyacute latildenh đạo

- Xacircy dựng một EIScoacute thểphaacutet hiện ra đượccaacutectigravenh huống khoacute khănmagravemột nhagrave phaacutet triển chưabao giờ gặp phải

Mocirc higravenh EIS

Khung phaacutet triển một EIS

- Watson et al đề nghị xacircy dựngkhung với ba thagravenh phần+ Caacutech tiếp cận tập trung vagraveo yếu tốcon người vagrave dữ liệu coacute liecircn quan đến EIS+ Quaacute trigravenh phaacutet triển cần sự linh hoạt vagrave tương taacutec+ Người sử dụng - hệ thống hộp thoại bao gồm một ngocircn ngữ hagravenh động để xử lyacute caacutec lệnh

Lợi iacutech của EIS- Dễ duy trigrave caacutec mục tiecircu coacute tổ chức- Dễ truy xuất thocircng tin- Cho pheacutep người sử dụng nacircng cao hiệu suất hơn

- Tăng chất lượng ra quyết định- Cung cấp sự cải tiến cạnh tranh- Tiết kiệm thời gian của người sử dụng- Tăng khả năng vagrave chất lượng giao tiếp- Cung cấp khả năng điều khiển tốt hơn trong tổ chức- Cho pheacutep tham gia caacutec vấn đề vagrave caacutec cơ hội- Cho pheacutep hoạch định- Cho pheacutep tigravem kiếm nguyecircn nhacircn của một vấn đề- Thảo matilden caacutec yecircu cầu của người điều hagravenh

Hạn chế của EIS vagrave 1 số sai lầm cần traacutenh

- Chi phiacute một cuộc khảo saacutetnăm1991 chothấychi phiacute phaacutet triểntrungbigravenh365000USDvớichi phiacute vận hagravenhhagraveng năm lagrave$200000 (EIS)

- Cocircng nghệ hạn chếEIScần phảiđượctiacutech hợp hoagraven toagravenvagraveokiếntruacuteccủadoanh nghiệphiện tại do đoacute noacutelagrave một thaacutech thứclớn đối vớithiết kế

- Hạn chế tổ chức cơ cấu tổ chứccoacute thể khocircng phugrave hợp

Sự hạn chế về tổ chức- Chương trigravenh nghị sự vagrave thời gian chệch EIS mocirc tả một phần việc thực hiện một

chương trigravenh nghị sự vagrave coacute thể dễ dagraveng đạt được sự tin cậy một caacutech chắc chắn- Đồng bộ hoacutea việc quản lyacute sự tin cậy đuacuteng luacutec đặc biệt baacuteo caacuteo EIS coacute thể phaacute

vỡ sự ổn định thiết lập caacutec chu trigravenh baacuteo caacuteo một caacutech tốt nhất- Sự bất ổn EIS phản ứng nhanh coacute thể gacircy ra việc taacutec động trở lại một caacutech

nhanh choacuteng dẫn đến sự thiếu ổn định trong tổ chức

Sự thất bại lagrave thay thế khocircng thể chấp nhận được- Một số yếu tố lagravem EIS thất bại

+ Thiếu sự hỗ trợ về mặt quản lyacute+ Vấn đề chiacutenh trị+ Thất bại của nhagrave phaacutet triển+ Lỗi về cocircng nghệ+ Giaacute cả+ Thời gian

66 Ra quyết định điều hagravenh trong tương lai vagrave EIS

- Coacute một vagravei điều kiện sẽ được hợp nhất cho việc chuyển đổi cocircng nghệ Trong đoacute một vagravei điều kiện coacute thể dễ dự đoaacuten Hai điều kiện magrave ta coacute thể thấy lagrave+ Phaacutet triển cocircng nghệ maacutey tiacutenh trong việc điều hagravenh sẽ tạo ra sự chuyển đổi được chấp nhận một caacutech dễ dagraveng hơn+ Mở rộng traacutech nhiệm điều hagravenh sẽ mở rộng nhu cầu thocircng tin

Tương lai của EIS- EIS thocircng minh Những tiến bộ trong cocircng nghệ AI sẽ được triển khai trong caacutec

EIS- EIS đa phương tiện Cơ sở dữ liệu đa phương tiện sẽ cho pheacutep tiacutech hợp văn bản

giọng noacutei vagrave higravenh ảnh trong tương lai- EIS thocircng tin Tương lai EIS sẽ mở rộng hơn trong việc sử dụng dữ liệu becircn

ngoagravei doanh nghiệp- EIS kết nối Giao tiếp với băng thocircng rộng cho pheacutep kết nối liecircn thocircng lớn hơn

Chương 7 HỆ CHUYEcircN GIA VAgrave TRIacute TUỆ NHAcircN TẠO

71 Caacutec khaacutei niệm

72 Triacute thocircng minh của triacute tuệ nhacircn tạo

73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia

74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia

75 Lợi iacutech vagrave hạn chế của hệ chuyecircn gia

71 Caacutec khaacutei niệm

Chuyecircn mocircn (Expertise) sự hiểu biết rộng trong 1 lĩnh vực hẹp

Hệ chuyecircn gia (Expert Systems)1 chương trigravenh maacutey tiacutenh sử dụng 1 tập caacutec luật dựa trecircn tri thức của con người để giải quyết caacutec vấn đề đogravei hogravei phải coacute sự chuyecircn mocircn

Một số hệ chuyecircn gia nổi tiếng

DENDRAL (Standford 1960s Edward Feigenbaum)

MYCIN (Standford1970s Edward Shortliffe)

PROSPECTOR (MIT 1979)

Triacute tuệ nhacircn tạo (Artificial Intelligence ndash AI)

Triacute tuệ nhacircn tạo một bộ phacircn của ngagravenh khoa học maacutey tiacutenh quan tacircm đến việc thiết kế caacutec hệ thống maacutey tiacutenh thocircng minh đoacute lagrave caacutec hệ thống đưa ra caacutec đặc điểm magrave từ đoacute chuacuteng ta liecircn hệ với sự thocircng minh trong hagravenh động của con người (Barr vagrave Feigenbaum 1981)

Mục điacutech của AI

Mục điacutech khoa học xaacutec định caacutec gợi yacute để giải thiacutech caacutec loại khaacutec nhau của triacute tuệ thực

Mục điacutech kỹ thuật giải quyết caacutec vấn đề trong thế giới thực

Triacute tuệ nhacircn tạo kế thừa nhiều yacute tưởng quan điểm kỹ thuật từ caacutec ngagravenh khoa học khaacutec

- Triết học

- Logic Toaacuten học

- Tiacutenh toaacuten

- Khoa học tacircm lyacute Khoa học nhận thức

- Sinh học Thần kinh học

- Tiến hoacutea

Caacutec lĩnh vực ứng dụng trong Triacute tuệ nhacircn tạo

Mạng nơ ron thần kinh (Neural Networks)

Tiacutenh toaacuten sự tiến hoacutea

(Evolutionary Computation)

Hệ chuyecircn gia (Expert Systems)

Kỹ thuật xử lyacute tiếng noacutei (Speech Processing)

Kỹ thuật xử lyacute ngocircn ngữ tự nhiecircn

(Natural Language Processing)

Lập kế hoạch (Planning)

Robot (Robotics)

Khoa học higravenh ảnh (Vision)

Caacutec kỹ thuật thocircng dụng dugraveng trong AI

Biểu diễn(Representation)

Học (Learning)

Caacutec luật (Rules)

Tigravem kiếm (Search)

72 Triacute thocircng minh của triacute tuệ nhacircn tạo

Con người suy diễn như thế nagraveo

Phacircn loại (Categorization)

Caacutec quy tắc cụ thể

Heuristics

Kinh nghiệm trước đoacute

Dự tiacutenh trước

Maacutey tiacutenh suy diễn như thế nagraveo

Lập luận dựa trecircn luật IF-THEN mocirc tả tri thức được matilde hoacutea dưới dạng caacutec luật

Caacutec khung (Frames) lagrave caacutec đại diện mocirc tả caacutec tigravenh huống giống nhau lagrave điển higravenh của một vagravei phacircn loại

Lập luận dựa trecircn caacutec trường hợp mocirc phỏng giải phaacutep trước đoacute cho một vấn đề hiện tại

Nhận dạng mẫu phaacutet hiện acircm thanh higravenh dạng hoặc caacutec chuỗi dagravei

Caacutec dạng khaacutec của Triacute tuệ nhacircn tạo

Học maacutey- mạng nơron vagrave giải thuật di truyền

Lập trigravenh tự động ndash lagrave những kỹ thuật tạo ra caacutec chương trigravenh để lagravem 1 nhiệm vụ riecircng biệt (cho pheacutep những người khocircng phải lagrave người lập trigravenh coacute thể lập trigravenh được)

Cuộc sống nhacircn tạo ndash nỗ lực để taacutei tạo caacutec hiện tượng sinh học trong caacutec hệ thống dựa trecircn maacutey tiacutenh

73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia(Expert Systems- ES)

Theo Jackson (1999) Một hệ chuyecircn gia lagrave một chương trigravenh maacutey tiacutenh mocirc tả vagrave suy diễn với tri thức của một vagravei lĩnh vực để giải quyết vấn đề hay đưa ra caacutec lời khuyecircn

Cấu truacutec cơ bản của ES được dựa theo cấu truacutec chung của DSS Sự khaacutec biệt chiacutenh giữa ES vagraveDSS lagrave hệ ES thu thập caacutec kiến thức từ những

chuyecircn gia trong lĩnh vực quan tacircmĐặc trưng của hệ chuyecircn gia Hiệu quả cao Thời gian trả lời thỏa đaacuteng Độ tin cậy cao Dễ hiểu

Giao diện người dugraveng trong ES

Thiết kế giao diện người dugraveng tập trung vagraveo caacutec yếu tố như dễ dagraveng sử dụngcoacute độ tin cậy cao giảm tải những khoacute khăn khi sử dụng

Thiết kế necircn coacute một số tương taacutec (đầu vagraveo kiểm soaacutet vagrave truy vấn)

Cấu tạo giao diện người dugraveng gồm coacute magraven higravenh cảm ứng bagraven phiacutem buacutet saacuteng lệnh thoại caacutec phiacutem chuyecircn dụng

Cơ sở tri thức (Knowledge Base)

Chứa đựng caacutec tri thức cụ thể miền thu được từ caacutec chuyecircn gia miền

Coacute thể chứa caacutec mocirc tả caacutec hagravenh vi giải quyết vấn đề caacutec ragraveng buộc caacutec heuristics

Thagravenh cocircng của một ES dựa trecircn tiacutenh đầy đủ vagrave tiacutenh chiacutenh xaacutec của cơ sở tri thức

Mocirc tơ suy diễn (Inference Engine)

Ở đacircy tri thức được đặt để sử dụng tạo ra caacutec giải phaacutep để giải quyết vấn đề

Mocirc tơ nagravey coacute khả năng thực hiện diễn dịch hoặc suy diễn dựa trecircn caacutec luật hay caacutec caacutec sự kiện

Đồng thời cũng coacute khả năng sử dụng caacutec suy diễn mờ hay khocircng chiacutenh xaacutec dựa trecircn xaacutec suất hay aacutenh xạ mẫu

Vograveng điều khiển suy diễn

1 Aacutenh xạ caacutec luật với caacutec sự kiện đatilde được cho

2 Chọn luật để thực hiện

3 Thực hiện luật bằng caacutech thecircm caacutec sự kiện được suy diễn ra vagraveo bộ nhớ lagravem việc

Chuỗi suy diễn (Chaining)

Suy diễn tiến (forward chaining) maacutey suy diễn bắt đầu từ dữ liệu ban đầu vagrave thực hiện việc suy luận để đưa ra caacutec kết luận cuối cugraveng

Suy diễn lugravei (backward chaining) maacutey suy diễn bắt đầu từ dữ liệu điacutech vagrave tigravem ra tri thức hỗ trợ cho dữ liệu điacutech đoacute

Viacute dụ suy diễn lugravei

R1 Nếu coacute A vagrave B thigrave suy ra coacute D

R2 Nếu coacute B thigrave suy ra coacute C

R3 Nếu coacute C vagrave D thigrave suy ra coacute E

Ta coacute E ta xem trong 3 luật R1 R2 R3 luật nagraveo coacute E ta thấy R3 chứa E đồng thời chứa C vagrave D Xeacutet tiếp trong 2 luật R1 R2 luật nagraveo chứa C vagrave D R2 chứa C R3 chứa D Từ đoacute ta coacute được caacutec tri thức hỗ trợ suy diễn vagrave kết luận lagrave nếu coacute A vagrave B thigrave sẽ coacute E Hay nếu A vagrave B đuacuteng thigrave sẽ coacute E

Viacute dụ suy diễn tiến

Giả sử coacute tập chứa 3 luật sau

R1 Nếu coacute A vagrave B thigrave suy ra coacute D

R2 Nếu coacute B thigrave suy ra coacute C

R3 Nếu coacute C vagrave D thigrave suy ra coacute E

Nếu ta coacute A vagrave B thigrave chuacuteng ta suy ra được D từ R1 vagrave suy ra C từ R2 Với D vagrave C đatilde được suy ra ở trecircn giờ chuacuteng ta suy ra được E từ R3

Viacute dụ thực tế

Giả sử muốn biết magraveu của một con vật nuocirci tecircn lagrave Fred biết rằng noacute kecircu ộp ộp vagrave ăn ruồi

Coacute tập 4 luật ban đầu như sau

R1 Nếu X kecircu ộp ộp vagrave ăn ruồi thigrave X lagrave con ếch

R2 Nếu X kecircu chiecircm chiếp vagrave biết hoacutet thigrave X lagrave con chim

R3 Nếu X lagrave con ếch thigrave X coacute magraveu xanh

R4 Nếu X lagrave con chim thigrave X coacute magraveu vagraveng

74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia

Expert system shells lagrave một tập caacutec goacutei phần mềm vagrave caacutec cocircng cụ dugraveng để phaacutet triển caacutec hệ chuyecircn gia

Những Expert system shells đầu tiecircn thường rất rườm ragrave Mặc dugrave vậy noacute vẫn giuacutep cho người sử dụng sẽ khocircng phải bắt đầu lại từ đầu khi xacircy dựng một hệ chuyecircn gia mới

Những shell hiện đại bao gồm hai mocirc-đun chiacutenh lagrave cocircng cụ xacircy dựng một tập quy tắc vagrave mocirc tơ suy diễn

Xacircy dựng hệ chuyecircn gia

Bước 1 xacircy dựng mocirc higravenh bagravei toaacuten xaacutec định vấn đề nhiệm vụ magrave hệ thống sẽ thực hiện Caacutec dạng bagravei toaacuten cần hệ chuyecircn gia

Bagravei toaacuten diễn giải (InterPretation)

Bagravei toaacuten dự baacuteo (Prediction)

Bagravei toaacuten chuẩn đoaacuten (Diagnose)

Bagravei toaacuten gỡ rối (Debugging)

Bagravei toaacuten thiết kế

Tương tự như một dự aacuten phần mềm để xacircy dựng một hệ chuyecircn gia cần phải coacute caacutec yếu tố về nhacircn lực tagravei nguyecircn vagrave thời gian Những yếu tố nagravey ảnh hưởng đến giaacute thah của một hệ chuyecircn giaTrong phần nagravey cacircu hỏi thường được đặt ra lagrave tại sao cần phải xacircy dựng một hệ chuyecircn giaTrước khi bắt đầu phải xaacute định rotilde bagravei toaacuten đạt ra lagrave jiAi lagrave chuyecircn giaAi lagrave người sử dụng

1 Diễn giải (InterPretation) Nghiecircn cứu 1 vấn đề -gt Dựa trecircn những biểu hiện thuộc tiacutenh đặc trưng becircn ngoagravei -gt Tư vấn

(hoặc đưa ra kết luận hay mocirc tả dễ hiểu từ tập dữ liệu thocirc)

2 Bagravei toaacuten dự baacuteo (Prediction) Coacute thể dự đoaacuten được hagravenh vi kết quả dựa trecircn caacutec hiện tượng -gt dự baacuteo

VD Dự baacuteo thời tiết động đấthellip

3 Bagravei toaacuten chẩn đoaacuten (Diagnoss) Xaacutec định caacutec lỗi caacutec bộ phận hỏng hoacutec của hệ thống dựa trecircn caacutec dữ liệu quan saacutet được

4 Bagravei toaacuten gỡ rối (Debugging) Mocirc tả caacutec phương phaacutep khắc phục hệ thống khi gặp sự cố

5 Bagravei toaacuten thiết kế Lựa chọn cấu higravenh caacutec đối tượng nhằm thoả matilden một số ragraveng buộc nagraveo đoacute

6 Giảng dạy Phần mềm dạy học coacute thể chuẩn đoaacuten vagrave sủa lỗi của học sinh trong quaacute trigravenh học tập

Để xaacutec định đuacuteng bagravei toaacuten magrave chuacuteng ta cần giải quyết thigrave phải trả lời đc một số cacircu hỏi

- cần hệ chuyecircn gia

Bước 2 thu thập tri thức lựa chọn cocircng cụ vagrave aacutep dụng

Trong bước thu thập tri thức vấn đề quan trọng lagrave lựa chọn chuyecircn gia những người magrave sẽ đoacuteng goacutep tri thức cho hệ thống Thocircng thường trong suốt quaacute trigravenh phaacutet triển thigrave chuyecircn gia được xem như một thagravenh viecircn của đội phaacutet triển

Hiện nay coacute rất nhiều cocircng cụ để xacircy dựng một hệ chuyecircn gia Phổ biến nhất lagrave JESS CLIPS vagrave OPS5

Bước 3 Thiết kế cơ sở tri thức thiết kế hệ thốngTri thức được biểu diễn trường minh trong cơ sở tri thức

Caacutec chuyecircn gia vagrave kỹ sư tri thức sẽ đối thoại với nhau bằng caacutec kỹ thuật đối thoại Suy diễn (SD) bảng Mocirc higravenh hoacutea SD quy nạp phacircn loại

Vấn đề bagraveo trigrave vagrave phaacutet triển

Caacutec hệ chuyecircn gia đogravei hỏi phải bảo trigrave vagrave phaacutet triển nhiều hơn so với caacutec hệ thống khaacutec Phải thường xuyecircn bổ sung tri thức mới vagrave thay đổi caacutec tri thức cũ để đổi mới hệ chuyecircn gia

Thu thập vagrave khắc phục lỗi do người sử dụng phaacutet hiện để kịp thời khắc phục những sai soacutet của hệ chuyecircn gia

75 Lợi iacutech vagrave hạn chế của caacutec hệ chuyecircn gia

Một số lợi iacutech chiacutenh

Thời gian trả lời hợp lyacute bằng hoặc nhanh hơn so với chuyecircn gia (người) để đi đến cugraveng một quyết định Hệ chuyecircn gia lagrave một hệ thống thời gian thực (real time system)

Khả năng trả lời với mức độ tinh thocircng bằng hoặc cao hơn so với chuyecircn gia (người) trong cugraveng lĩnh vực

Hệ chuyecircn gia giuacutep cho hiệu quả lagravem việc tăng bằng việc sử dụng tập caacutec luật một caacutech nhanh choacuteng magrave ko bị nhầm lẫn chuyecircn gia lagrave người coacute thể quecircn đi một số tri thức cơ sở lyacute luậ nhưng HCG thigrave ko

Quyết định của một người chuyecircn gia coacute thể bị thay đổi vagrave ko coacute tiacutenh thống nhất như quyết định của một hệ chuyecircn gia tạo ra

Hệ chuyecircn gia giuacutep cho người sử dụng coacute thể trau dồi sự hiểu biết trecircn lĩnh vuej cụ thể magrave noacute giải quyết hỗ trợ người ra quyết định coacute trigravenh độ như 1 chuyecircn gia trong quaacute trigravenh gia quyết định

Kiến thức của rất nhiều chuyecircn gia về một lĩnh vực nagraveo đoacute được đưa vagraveo hệ chuyecircn gia lagravem cho CSTT cuat HCG phong phuacute vagrave rộng lớn hơn rất nhiều

HCG giải thiacutech caacutec bước suy luận một caacutech dễ hiểu nhất quaacuten luacutec nagraveo cũng coacute thể sử dụng ko như chuyecircn gia con người

Hạn chế của caacutec hệ chuyecircn gia

Nhược điểm lớn nhất của hệ chuyecircn gia lagrave những yacute kiến chuyecircn mocircn thường rất khoacute matilde hoacutea vagrave giải neacuten

Hệ chuyecircn gia khocircng coacute khả năng tự học tự cập nhật kiến thức mới như caacutec chuyecircn gia magrave cần phải được matilde hoacutea lại khi noacute được cập nhật

Hệ chuyecircn gia khocircng thể nhận ra được vấn đề khocircng nằm trong miền kiến thức của hệ thống

Chương 8 Tri thức vagrave tiếp nhận

1 Bao gồm caacutec vấn đề

Dữ liệu thực tế đo lường hoặc quan saacutet coacute hoặc khocircng coacute bối cảnh

Thocircng tin dữ liệu được tổng hợp một caacutech hữu iacutech để giải quyết những khoacute khăn trong việc đưa ra quyết định

Tri thức bao gồm caacutec ứng dụng quy tắc thocircng tin hướng dẫn của người ra quyết định

2 Những caacutei nhigraven về tri thức

Đại diện lagravem thế nagraveo để diễn tả tri thức viacute dụ như một quyển saacutech khocircng phải lagrave tri thức nhưng noacute lại lagrave một đại diện của tri thức

Sản xuất tri thức lagrave một tập hơp của hagraveng tồn kho coacute thể được sản xuất cũng như mua lại

Tri thức lagrave 1 trong 6 trạng thaacutei của hệ thống

1Dữ liệu 2Thocircng tin 3Cấu truacutec thocircng tin 4Sự thấu hiểu 5Yacute kiến 6 Quyết định

3 Caacutec loại tri thức Phổ biến mocirc tả dữ liệu thocircng tin thủ tục mọi thứ lagravem như thế nagraveo lập luận chiacutenh saacutech hoặc caacutec quy tắc

4 Thu thập Tri thức hệ chuyecircn gia Hầu hết caacutec phương phaacutep đều bắt đầu với mocirc higravenh của caacutec taacutec vụ trong đoacute

hệ chuyecircn gia được xacircy dựng Trong đoacute mocirc tả về caacutec lĩnh vực được tạo ra Caacutec kỹ sư sử dụng caacutec mocirc higravenh giả thuyết vagrave nhận thức về quaacute trigravenh phacircn

tiacutech để gợi ra caacutech giải quyết vấn đề về tri thức từ caacutec chuyecircn gia

5 Caacutec chiều của thu thập tri thức KE- driven caacutec kỹ sư trao đổi trực tiếp với caacutec chuyecircn gia Expert-driven Caacutec chuyecircn gia trực tiếp đưa chuyecircn mocircn của họ vagraveo hệ

thống maacutey tiacutenh Machine-driven Sử dụng caacutec cocircng cụ suy luận để triacutech xuất tri thức từ một

tập caacutec viacute dụ

6 Kỹ thuật thu thập tri thức Trao đổi gồm 2 loại cơ bản lagrave coacute cấu truacutec(coacute kịch bản) vagrave khocircng coacute cấu

truacutec( đối thoại trực tiếp) Giao thức phacircn tiacutech bằng lời Khi caacutec chuyecircn gia thực hiện một cocircng việc

của họ thigrave một bản ghi về cocircng việc đoacute được thực hiện Caacutec kỹ sư sẽ xacircy dựng mocirc higravenh cho những gigrave được ghi lại trong bản ghi

Phương phaacutep sagraveng lọc caacutec chuyecircn gia so saacutenh caacutec nhoacutem liecircn tiếp trong ba đối tượng vagrave cho biết tại sao nhoacutem thứ hai lại khaacutec nhoacutem thứ ba

7 Thu thập tri thức từ nhiều nguồn Thu thập tri thức từ nhiều nguồn lagrave cần thiết để coacute được đầy đủ caacutec tri thức

cho một vấn đề quan điểm yacute kiến traacutei ngược nhau thường phaacutet sinh Phương phaacutep đồng thuận sẽ giuacutep giải quyết được vấn đề macircu thuẫn Kỹ thuật phacircn tiacutech Meta lagrave kỹ thuật được aacutep dụng trong caacutec trường hợp

khaacutec Caacutech tiếp cận bằng định lượng đogravei hỏi caacutec kỹ sư cần cacircn nhắc yếu tố đầu vagraveo của caacutec chuyecircn gia khaacutec nhau

8 Xaacutec nhận hợp lệ vagrave kiểm tra tri thức Một khi thu thập tri thức noacute phải được đaacutenh giaacute về khả năng sử dụng vagrave độ

chiacutenh xaacutec Hai vấn đề cụ thể lagrave hiệu lực của những kiến thức vagrave kiểm tra việc xacircy dựng cơ sở của tri thức

Cần xaacutec nhận xem liệu hệ thống coacute thể hoạt động ở mức độ tối thiểu khocircng

Xaacutec minh liecircn quan đến việc so saacutenh từng chi tiết kỹ thuật của hệ thống những gigrave đatilde được thực hiện cuối cugraveng

9 Một số caacutec biện phaacutep xaacutec nhận Độ chiacutenh xaacutec Khả năng thiacutech nghi Mức độ đầy đủ Bề rộng Độ sacircu Hiệu lực Tổng quan Chiacutenh xaacutec Hiện thực Độ tin cậy Tiacutenh hữu dụng Mức độ

Chương 9 Học maacutey

1 Logic mờ vagrave ngocircn ngữ mờ(Fuzzy Logic and Linguistic Ambiguity)

Ngocircn ngữ tự nhiecircn gồm những khaacutei niệm mơ hồ vagrave khocircng chiacutenh xaacutectruyền tải ngữ nghĩa thocircng qua tiacutenh xấp xỉkhocircng rotilde ragraveng

Những xấp xỉ nagravey giuacutep con người coacute thể truyền tải hết được yacute nghĩa nhưng maacutey thigrave khocircng hiểu

Lagravem sao biểu diễn caacutec tri thức sử dụng caacutec khaacutei niệm khocircng rotilde ragraveng(mờ) hoặc khocircng chiacutenh xaacutec

2 Khaacutei niệm cơ bản của logic mờ tập mờ lagrave những tập hợp khocircng coacute một giới hạn rotilde Mỗi phần tử của noacute chỉ

chứa một mức độ hagravem liecircn thuộc của từng phần tử Vigrave vậy tập mờ khocircng giống như tập cổ điển Tập mờ coacute thể kết hợp với nhau qua những luật mờ magrave đặc trưng cho những hagravenh động trạng thaacutei vagrave thuộc tiacutenh của logic mờ được tận dụng khi thực hiện một bộ điều khiển mờ

Logic mờ dựa trecircn yacute tưởng mỗi phần tử thuộc vagraveo một tập hợp ở một mức độ nagraveo đấy

Locircgic mờ cho pheacutep độ liecircn thuộc (microA )coacute giaacute trị trong khoảng (01) Locircgic mờ coacute thể được coi lagrave mặt ứng dụng của lyacute thuyết tập mờ để xử lyacute caacutec

giaacute trị trong thế giới thực cho caacutec bagravei toaacuten phức tạp

3 So saacutenh tiacutenh đuacuteng đắn logic mờ vagrave xaacutec suất Xaacutec suất thigrave đề cập đến khả năng xảy ra một biến cố hay một điều gigrave đoacute Logic mờ đề cập đến cấp độ magrave đặc tiacutenh ở hiện tại

o viacute dụ1 người coacute chiều cao 6 feet thigrave coacute cấp độ lagrave 05 về chiều cao

4 Ưu điểm của logic mờ Caacutech tiếp cận rất tự nhiecircnkhocircng phức tạp Coacute thể mocirc higravenh hoacutea caacutec hagravem phi tuyến tugravey yacute phức tạp

Coacute thể tận dụng được kinh nghiệm từ những chuyecircn gia hagraveng đầu trong mọi lĩnh vực

Logic mờ được xacircy dựng dựa trecircn ngocircn ngữ tự nhiecircnNền tảng của logic mờ lagrave dựa trecircn cơ sở giao tiếp của con người

5 Nhược điểm của logic mờ Trong 1 hệ thống phức tạpsử dụng logic mờ coacute thể trở thagravenh trở ngại cho

việc xaacutec thực độ tin cậy của hệ thống Cơ chế lập luận mờ khocircng thể học hỏi từ những lỗi sai

6 Mạng noron nhacircn tạo(ANN) Mạng noron nhacircn tạo lagrave một mocirc phỏng xử lyacute thocircng tinđược nghiecircn cứu ra

từ hệ thống thần kinh của sinh vậtgiống như bộ natildeo để xử lyacute thocircng tin ANNs lagrave chương trigravenh dựa trecircn maacutey tiacutenh đơn giản coacute chức năng lagrave một mocirc

higravenh bagravei toaacuten khocircng gian dựa trecircn thử nghiệm vagrave baacuteo lỗi

7 Học từ kinh nghiệm Tiến trigravenh Một mẫu dữ liệu được biểu diễn như một mạng lưới noronANN ldquodự

đoaacutenrdquo 1 đầu radự đoaacuten được so saacutenh với giaacute trị thực tế hoặc giaacute trị chiacutenh xaacutecNếu đoaacuten được chiacutenh xaacutec thigrave khocircng coacute hagravenh động nagraveo được thực hiện

Nếu dự đoaacuten sai ANN kiểm tra lại vagrave xaacutec định lại thocircng số để điều chỉnh Một mẫu dữ liệu khaacutec được biểu diễn vagrave quaacute trigravenh nagravey được lặp lại

8 Nguyecircn tắc cơ bản của cocircng nghệ nơron Caacutec yếu tố xử lyacute cơ bản trong hệ thống thần kinh của con người lagrave tế bagraveo

thần kinhMạng lưới của tế bagraveo nagravey lagrave liecircn kết với nhau nhận được thocircng tin từ caacutec cảm biến trong mắt taihellip

Thocircng tin nhận được bởi tế bagraveo thần kinh hoặc lagrave sẽ kiacutech thiacutech noacute(sẽ được chuyển qua 1 thocircng điệp dọc theo mạng lưới) hoặc lagrave sẽ ngăn cản noacute(ngăn cản dograveng thocircng tin)

Độ nhạy coacute thể thay đổi qua thời gian hoặc sau khi coacute được kinh nghiệm

9 Cấu truacutec mạng Một ANN gồm 3 lớp cơ bản

Lớp đầu vagraveo nhận dữ liệu Lớp becircn trong hoặc lagrave lớp ẩn xử lyacute dữ liệu Lớp đầu ra chuyển tiếp kết quả cuối cugraveng của mạng

10Mạng nơ ron Thường coacute nhiều đầu vagraveo mỗi đầu vagraveo với mức ảnh hưởng vagrave tầm quan

trọng riecircng của noacute Một đầu vagraveo quan trọng coacute thể được sử dụng để khuếch đại đầu ra caacutec hagravem trạng thaacutei tổng hợp caacutec trọng số của caacutec yếu tố

đầuvagraveo khaacutec nhauvagraveo một giaacute trị duy nhất Caacutec hagravem chuyển giao xử lyacute caacutec giaacute trị trạng thaacutei vagrave tạo đầu ra

11Huấn luyện mạng nơ ron Trong mocirc higravenh coacute giaacutem saacutetANN được đến so saacutenh dự đoaacuten của chiacutenh

noacute với thocircng tin phản hồi coacute chứa caacutec kết quả mong muốn ANN sẽ phải tigravem caacutech thay đổi caacutec tham số becircn trong củamigravenh (caacutec trọng số vagrave caacutec ngưỡng) để tạo necircn một aacutenh xạ coacute khả năng aacutenh xạcaacutec đầu vagraveo thagravenh caacutec đầu ra mong muốn Sự thay đổi nagravey được tiến hagravenh nhờ việc so saacutenh giữa đầu ra thực sự vagrave đầu ra mong muốn

Trong mocirc higravenh khocircng coacute giaacutem saacutetANN nhận được dữ liệu vagraveo nhưng khocircng phải coacute bất kỳ thocircng tin phản hồi về kết quả mong muốn

Phần lớn caacutec ứng dụng nằm trong vugraveng của caacutec bagravei toaacuten ước lượng như mocirc higravenh hoacuteathống kecirc neacuten lọc phacircn cụm

12Lợi iacutech Liecircn kết với mạng noron Traacutenh caacutech lập trigravenh tường minh Giảm nhu cầu của chuyecircn gia ANNs thigrave thiacutech nghi với caacutec yếu tố đầu vagraveo thay đổi Khocircng cần thiết cho cơ sở tri thức tinh chế ANNs coacute tiacutenh động vagrave cải thiện với việc sử dụng Coacute khả năng xử lyacute dữ liệu khocircng chiacutenh xaacutec hoặc khocircng đầy đủ Cho pheacutep tổng quaacutet hoacutea từ thocircng tin cụ thể Cho pheacutep thu thập cảm giaacutec thocircng thường vagraveo miền giải quyết vấn đề

13Hạn chế của việc liecircn kết với mạng noron ANNs khocircng thể giải thiacutech được suy luận Bản chất hộp đen thường khiến cho vấn đề traacutech nhiệm vagrave độ tin cậy phaacutet

sinh lagrave khoacute khăn Lặp đi lặp lại quaacute trigravenh huấn luyện rất tốn thời gian Nguồn lực caacutec nhagrave phacircn tiacutech vagrave thiết kế coacute tay nghề cao vẫn lagrave đaacuteng lo

ngại Cocircng nghệ ANN thuacutec đẩy hạn chế của phần cứng hiện tại ANN yecircu cầu phải coacute sự tin tưởng ở đầu ra

14Giới thiệu về thuật toaacuten di truyền Cũng như mạng lưới thần kinh caacutec thuật toaacuten di truyền được dựa trecircn lyacute

thuyết sinh học Thuật toaacuten di truyền tigravem thấy nguồn gốc của chuacuteng trong caacutec lyacute thuyết

tiến hoacutea của chọn lọc tự nhiecircn vagrave thiacutech ứng với biến đổi khiacute hậu Kết quả thuật toaacuten di truyền lagrave từ giao phối 2 caacute thể trong quần thế để tạo

ra con caacutei đocirci khi tốt hơn so với bậc cha mẹ của chuacuteng 15Caacutec thagravenh phần cơ bản của thuật toaacuten di truyền

Toaacuten tử chọn lọc Caacutec caacute thể tốt được chọn lọc để đưa vagraveo thế hệ sau Sự chọn lọc nagravey căn cứ vagraveo độ thiacutech nghi với mocirci trường của mỗi caacute thể

Toaacuten tử lai gheacutep (crossover) Hai caacute thể cha vagrave mẹ trao đổi caacutec gen với nhau để tạo ra caacute thể con

Toaacuten tử đột biến (mutation) Một caacute thể thay đổi một số gen để biến đổi thagravenh một caacute thể mớiTất cả caacutec toaacuten tử trecircn khi thực hiện đều mang tiacutenh ngẫu nhiecircn

16Quaacute trigravenh cơ bản của một thuật toaacuten di truyền Khởi tạo

Đaacutenh giaacute quần thể

Lựa chọn NST thiacutech hợp nhất vagrave loại bỏ NST yếu nhất

Quy trigravenh giao nhau vagrave cải thiện quần thể

đột biến tiến trigravenh để khaacutem phaacute ra NST mới

17Ưu nhược điểm của việc kết hợp với thuật toaacuten di truyền Kiacutech thước quần thể lagrave 1 yếu tố quan trọng trong tốc độ của việc tigravem

kiếmnhưng noacute tương đối dễ dagraveng để dự đoaacuten tốc độ nagravey Giao nhau hoặc đột biến lagrave khocircng necircn đc sử dụng quaacute thường xuyecircn Luocircn coacute được iacutet nhất 1 giải phaacutep hợp lyacute Necircn coacute thể aacutep dụng chuacuteng cho caacutec vấn đề magrave chuacuteng ta khocircng coacute hướng

về caacutech giải quyết Sức mạnh của thuật toaacuten xuất phaacutet từ khaacutei niệm đơn giảnkhocircng phải từ

một thủ tục thuật toaacuten phức tạp 18Tương lai của học maacutey

Mạng lưới thần kinh nhacircn tạo vượt quaacute năng lực của con người trong caacutec trường hợp bị cocirc lập

Về mặt lyacute thuyếtmột maacutey tiacutenh coacute thể xử lyacute dũ liệu nhanh hơn hagraveng triệu lần so với 1 con người

May mắn thay cho chuacuteng tacon người tốt hơn nhiều khi magrave coacute được dữ liệumaacutey tiacutenh khocircng coacute 1 số thứ như lagrave 5 giaacutec quan

CHƯƠNG 10 KHO DỮ LIỆU

1 Kho dữ liệu Kho dữ liệu lagrave tuyển tập caacutec cơ sở dữ liệu tiacutech hợp hướng chủ đề được

thiết kế để trợ giuacutep cho một hệ hỗ trợ quyết định

Theo John Ladley Cocircng nghệ kho dữ liệu lagrave tập caacutec phương phaacutep kỹ thuật vagrave caacutec cocircng cụ coacute thể kết hợp hỗ trợ nhau để cung cấp thocircng tin cho người sử dụng trecircn cơ sở tiacutech hợp từ nhiều nguồn dữ liệu nhiều mocirci trường khaacutec nhau

Kho dữ liệu thường rất lớn tới hagraveng trăm GB hay thậm chiacute hagraveng Terabyte

2 Kho dữ liệu vận hagravenh (ODS) Một kho dữ liệu vận hagravenh Aacutep dụng kỹ thuật kho dữ liệu vagraveo caacutec hệ xử

lyacute giao taacutec lưu trữ dữ liệu cho một ứng dụng đặc thugrave Noacute đưa vagraveo kho dữ liệu một dograveng caacutec dữ liệu thocirc được thiết kế

3 So saacutenh

Kho dữ liệu vận hagravenh Kho dữ liệu

Dữ liệu theo chủ đề Dữ liệu theo chủ đề

Dữ liệu tiacutech hợp Dữ liệu tiacutech hợp

Dữ liệu thay đổi Dữ liệu khocircng thay đổi

Dữ liệu được cập nhật khi thay đổi

Dữ liệu giữ nguyecircn

Chỉ coacute dữ liệu hiện tạiDữliệu hiện tại vagrave dữ liệu lịch sử

Chu kỳ lagravem tươi dữ liệu ngắn Chu kỳ lagravem tươi dữ liệu dagravei

Chỉ coacute dữ liệu chi tiết Dữ liệu chi tiết vagrave dữ liệu tổng kết

Dugraveng cho caacutec quyết định ngắn hạn

Dugraveng cho hoạch định dagravei hạn

4 Kho dữ liệu cục bộ (Data Mart - DM)

Kho dữ liệu cục bộ lagrave CSDL coacute những đặc điểm giống với kho dữ liệu nhưng với quy mocirc nhỏ hơn vagrave lưu trữ dữ liệu về một lĩnh vực một chuyecircn ngagravenh

Data mart phụ thuộc Chứa những dữ liệu được lấy từ DW vagrave những dữ liệu nagravey sẽ được triacutech lọc vagrave tinh chế tiacutech hợp lại ở mức cao hơn để phục vụ một chủ đề nhất định của Datamart

Data mart độc lập Khocircng giống như Datamart phụ thuộc Data mart độc lập được xacircy dựng trước DW vagrave dữ liệu được trực tiếp lấy từ caacutec nguồn khaacutec nhau

5 Siecircu dữ liệu Metadata lagrave dữ liệu để mocirc tả dữ liệu Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột

một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi Metadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu

6 Mocirci trường kho dữ liệu Hệ thống của tổ chức vagrave kho cung cấp dữ liệu để xacircy dựng kho dữ liệu Trong quaacute trigravenh chuyển dữ liệu từ caacutec nguồn khaacutec nhau dữ liệu coacute thể

được lagravem sạch hoặc chuyển đổi vagrave vigrave thế DW được xem như lagrave một chuẩn cho việc lưu trữ

Đồng thời siecircu dữ liệu được ghi lại Cuối cugraveng DW hoặc siecircu thị coacute thể được sử dụng để tạo ra một kho dữ

liệu ldquocaacute nhacircnrdquo 7 Caacutec đặc điểm của kho dữ liệu

Đặc điểm Mocirc tả

Hướng chủ đề - DL tổ chức theo caacutech thức người dugraveng tham chiếu

Tiacutech hợp - Dữ liệu ldquosạchrdquo loại bỏ tiacutenh thiếu nhất quaacuten

Khocircng thay đổi - DL ldquochỉ đọcrdquo người dugraveng khocircng thay đổi được

Chuỗi thời gian - DL lagrave chuỗi thời gian khocircng phải lagrave trạng thaacutei hiện tại

Được tổng kết - DL vận hagravenhthao taacutec khi cần thiết

được kết hợp lại thagravenh dạng coacute thể dugraveng được cho quyết định

Kiacutech cỡ lớn hơn - Lưu giữ theo chuỗi thời gian tức lagrave giữ lại nhiều DL

Khocircng được chuẩn hoacutea - Coacute thể dư thừa DLSiecircu dữ liệu - Dữ liệu của dữ liệu được lưu trữNguồn dữ liệu - DL vận hagravenh (caacutec hệ sẵn coacute) cugraveng

với caacutec nguồn ngoagravei 8 Kho dữ liệu hướng chủ đề

Hướng chủ để coacute nghĩa lagrave kho dữ liệu được tổ chức xung quanh caacutec chủ đề chiacutenh như khaacutech hagraveng sản phẩm sản xuất Tập trung vagraveo việc mocirc higravenh hoacutea vagrave phacircn tiacutech dữ liệu cho caacutec nhagrave ra quyết định magrave khocircng tập trung vagraveo caacutec xử lyacute thocircng thường Cung cấp cho người dugraveng một khung nhigraven toagraven vẹn đơn giản vagrave đầy đủ về caacutec sự kiện quanh caacutec chủ đề

9 Dữ liệu trong DW được tiacutech hợp Dữ liệu trong kho dữ liệu được xacircy dựng bằng caacutech tổng hợp dữ liệu từ

nhiều nguồn khaacutec nhau vagrave caacutec nguồn coacute tổ chức khaacutec nhau Cơ sở dữ liệu caacutec file excel caacutec flat file hoặc caacutec raw file Khi đưa vagraveo kho dữ liệu caacutec dữ liệu được lagravem sạch vagrave tiacutech hợp dữ liệu nhằm đảm bảo tiacutenh nhất quaacuten của dữ liệu

10Kiến truacutec kho dữ liệu Tầng cơ sở dữ liệu hoạt động Tầng truy xuất thocircng tin Tầng truy xuất dữ liệu Tầng siecircu dữ liệu Tầng quản lyacute tiến trigravenh Tầng thocircng điệp của ứng dụng Tầng vật liacute của kho dữ liệu Tầng trigravenh diễn dữ liệu

11Higravenh trạng kho dữ liệu Kho dữ liệu ảo - người dugraveng cuối coacute thể truy cập trực tiếp đến kho dữ liệu

sử dụng caacutec cocircng cụ cho pheacutep ở tầng truy xuất dữ liệu Kho dữ liệu trung tacircm-1 cơ sở dữ liệu vật lyacute chứa tất cả dữ liệu cho một

vugraveng chuyecircn dụng nagraveo đoacute

Kho dữ liệu phacircn taacuten- Thagravenh phần được phacircn taacuten qua nhiều hệ cơ sở dữ liệu vật lyacute

12METADATA- Siecircu dữ liệu Định nghĩa Siecircu dữ liệu lagrave dữ liệu về dữ liệu Lagrave 1 lưu trữ dugraveng để

Miecircu tả kho dữ liệu tổng thể Nhận dạng kiểu kho dữ liệu Quản liacute quaacute trigravenh tiacutech hợp dữ liệu Quản liacute quaacute trigravenh cập nhật kho dữ liệu Quản liacute bảo mật

Lagrave chigravea khoacutea quyết định sự thagravenh cocircng của kho dữ liệu luocircn được thay đổi vagrave cập nhật theo sự phaacutet triển của kho dữ liệu

Dugraveng để quản liacute điều khiển kho dữ liệu Sự ra đời của kho dữ liệu như 1 cấu truacutec hỗ trợ ra quyết định siecircu dữ liệu

được xem như nguồn tagravei nguyecircn dữ liệu Siecircu dữ liệu lagrave trừu tượng Chuacuteng lagrave dữ liệu bậc cao cung cấp mocirc tả ngắn

gọn caacutec dữ liệu bậc thấp hơn 13Hoạt động của Siecircu dữ liệu

Siecircu dữ liệu rất cần thiết trong việc chuyển hoacutea thocircng tin trở thagravenh tri thức Lagrave chigravea khoacutea giuacutep chuacuteng ta xử lyacute được dữ liệu thocirc Viacute dụ một dograveng dữ liệu baacuten hagraveng 1023 K596 11121 agraveNoacute sẽ khocircng coacute nghĩa gigrave cho đến khi chuacuteng ta đưa vagraveo siecircu dữ liệu (thư

mục chứa dữ liệu) agrave cửa hagraveng 1023 sản phẩm K596 vagrave số tiền baacuten được lagrave 11121 đocirc la

14Sự cần thiết phải nhất quaacuten trong kho dữ liệu Kho dữ liệu được xacircy dựng cho lợi iacutech của những nhagrave phacircn tiacutech kinh

doanh caacutec nhagrave quản trị cho tất cả caacutec khu vực chức năng Trong cơ sở dữ liệu riecircng caacutec khu vực khaacutec nhau coacute thể định nghĩa vagrave lưu

trữ dữ liệu thocircng qua phiecircn bản của chiacutenh noacute Khi dữ liệu được lấy từ những vugraveng khaacutec nhau đoacute vagrave được đặt vagraveo kho dữ

liệu Việc chuyển đổi vagrave lagravem sạch caacutec tiến trigravenh sẽ đảm bảo noacute lagrave duy nhất được tiacutech hợp tại một mức của tổ chức

15Ragrave soaacutet lại dữ liệu ndash Thực thi siecircu dữ liệu

Bất kể cấu truacutec tự nhiecircn của 1 cacircu truy vấn thế nagraveo thigrave caacutec thagravenh phần của siecircu dữ liệu rất quan trọng đối với người ra quyết định

Bảng thuộc tiacutenh khoacutea được lưu trữ bởi kho dữ liệu Tập hợp dữ liệu được lấy từ đacircu Những chuyển đổi nagraveo được thực thi với việc lagravem sạch

16Siecircu dữ liệu lagrave gigrave Metadata - lagrave thocircng tin mocirc tả nội dung của cơ sở dữ liệu (CSDL) Metadata baacuteo cho người dugraveng biết thời gian cập nhật sau cugraveng của dữ liệu

định dạng vagrave mục điacutech sử dụng của noacute Những thocircng tin nagravey coacute thể hướng dẫn người dugraveng duyệt qua CSDL vagrave

giuacutep họ hiểu được yacute nghĩa vagrave ngữ cảnh của dữ liệu Trong CSDL metadata lagrave caacutec dạng biểu diễn khaacutec nhau của caacutec đối tượng

trong CSDL Trong CSDL quan hệ metadata lagrave caacutec định nghĩa của bảng cột CSDL

view vagrave nhiều đối tượng khaacutec Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột

một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi -gtMetadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu

Bảng chuyển đổi Ghi lại những chuyển đổi đatilde được thực hiện

Lịch sử thực thi Ghi lại những dữ liệu đatilde được

phacircn tiacutech

Higravenh thaacutei kết nốiGhi lại những dữ liệu được kết nối vagrave tần suất

17Aacutenh xạ thocircng thường của siecircu dữ liệu Bản ghi aacutenh xạ chuyển đổi bao gồm

Định danh của nguồn gốc Chuyển đổi thuộc tiacutenh Chuyển đổi thuộc tiacutenh vật lyacute Matilde hoacutea tham chiếu bảng chuyển đổi Đổi tecircn Đổi khoacutea Gaacuten giaacute trị cho thuộc tiacutenh mặc định Chọn logic cho caacutec nguồn nhiều giaacute trị Đổi thuật toaacuten

18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để

phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai

lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave

tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec

Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm

Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo

19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua

caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau

SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được

Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra

một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức

Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ

Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ

Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech

CHƯƠNG 11 KHAI PHAacute DỮ LIỆU

1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn

ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993

Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng

2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd

1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều

2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP

3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn

4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng

5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server

6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo

7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động

8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời

9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều

10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện

11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech

12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP

3 Xử lyacute phacircn tiacutech trực tuyến OLAP

MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave

dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu

ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave

thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu

HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave

ROLAP4 Khai phaacute dữ liệu

Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh

khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn

Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan

5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp

6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại

Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp

Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec

Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt

Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra

Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh

vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho

Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec

Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm

Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục

Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng

gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp

Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn

Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec

Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper

Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2

Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25

Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước

Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng

Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện

trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp

Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute

độ hỗ trợ ge ngưỡng minsup

độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan

Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn

Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết

Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu

MOLAP ROLAP HOLAP

Lưu trữ dữ liệu cơ sở

Khối Bảng quan hệ Bảng quan hệ

Lưu trữ thocircng tin tổng hợp

Khối Bảng quan hệ Khối

Hiệu suất thực hiện truy vấn

Nhanh nhất Chậm nhất Nhanh

Tiecircu thụ khocircng gian lưu trữ

Nhiều Thấp Trung bigravenh

Chi phiacute bảo trigrave Cao Thấp Trung bigravenh

Page 12: De cuong(1-11)

Mocirc higravenh chắc chắn tương đối dễ phaacutet triển giải quyết vagrave coacute thể sinh ra caacutec giải phaacutep tối ưu 1048713 Caacutec bagravei toaacuten coacute một số lớnvocirc hạn caacutec giải phaacutep khả thi đặc biệt quan trọng 1048713 Caacutec mocirc higravenh tagravei chaacutenh được xacircy dựng trong điều kiện chắc chắn

Mocirc higravenh bất địnhbằng caacutech thu thập thecircm thocircng tin cố gắng đưa bagravei toaacuten trở về dạng chắc chắn hay dạng

rủi ro Mocirc higravenh rủi ro caacutec quyết định kinh doanh được đưa ra dưới caacutec rủi ro giả định

1048713 Đocirci khi biết được xaacutec suất của caacutec sự kiện xảy ra trong tương lai 1048713 Caacutec trường hợp khaacutec (bất định) ước lượng caacutec rủi ro vagrave giả sử caacutec tigravenh huống rủi ro

xảy ra 20Mocirc higravenh hoacutea

MOcirc HIgraveNH HOacuteA BẰNG BẢNG TIacuteNH bull Bảng tiacutenh phần mềm mạnh linh hoạt vagrave dễ dugraveng cho pheacutep tạo sinh caacutec ứng dụng trong kinh doanh kỹ thuật toaacuten vagrave khoa học với tập caacutec hagravem mạnh về tagravei chaacutenh thống kecirc toaacuten bull Kegravem theo lagrave caacutec thagravenh phần cộng thecircm (add-ins) giuacutep xacircy dựng vagrave giải caacutec lớp mocirc higravenh đặc thugrave bull Lagrave cocircng cụ mocirc higravenh hoacutea thocircng dụng nhất của người dugraveng cuối cugraveng bull Coacute caacutec chức năng về phacircn tiacutech ldquowhat-ifrdquo dograve tigravem mục tiecircu quản lyacute dữ liệu vagrave lập trigravenh (dạng macro) bull Coacute khả năng đọc ghi caacutec cấu truacutec tập tin thocircng dụng để giao tiếp được với caacutec CSDL vagrave cocircng cụ khaacutec bull Coacute thể xacircy dựng mocirc higravenh tĩnh vagrave động bull Dugraveng trecircn maacutey tiacutenh caacute nhacircn vagrave maacutey tiacutenh lớn

bull Cơ sở để xacircy dựng caacutec bảng tiacutenh đa chiều vagrave caacutec cocircng cụ xử lyacute phacircn tiacutech trực tuyến (OLAP) MOcirc HIgraveNH HOacuteA BẰNG PHAcircN TIacuteCH QUYẾT ĐỊNH bull Tiếp cận mocirc higravenh hoacutea caacutec tigravenh huống quyết định coacute một số hữu hạnkhocircng quaacute nhiều caacutec phương aacuten ndash mỗi phương aacuten được trigravenh ra dưới dạng bảng hay đồ thị - caacutec kết quả tương ứng (dự baacuteo được kegravem xaacutec suất) theo mục tiecircu bagravei toaacuten ndash từ đoacute chọn phương aacuten tốt nhất bull Đơn mục tiecircu bảng quyết định hay cacircy quyết định bull Đa mục tiecircu AHP (analytic hierarchy process) khaacutec

MOcirc HIgraveNH HOacuteA BẰNG QUY HOẠCH TOAacuteN

bull Quy hoạch toaacuten học (mathematical programming) lagrave họ caacutec cocircng cụ giải quyết caacutec bagravei toaacuten quản lyacute theo đoacute người ra quyết định phải cấp phaacutet caacutec tagravei nguyecircn khan hiếm cho caacutec hoạt động cạnh tranh nhau (caacutec phương aacuten) nhằm tối ưu hoacutea mục tiecircu coacute khả năng đo lường được bull Caacutec mocirc higravenh quy hoạch tuyến tiacutenh (linear programming) thocircng dụng nhất trong quy hoạch toaacuten coacute nhiều ứng dụng trong thực tế được dugraveng nhiều trong caacutec hệ hỗ trợ quyết định bull Bagravei toaacuten quy hoạch tuyến tiacutenh 1048713 Caacutec biến quyết định (cần tigravem giaacute trị) 1048713 Hagravem mục tiecircu (hagravem toaacuten học dạng tuyến tiacutenh xaacutec định quan hệ giữa biến quyết định vagrave mục tiecircu đo lường mức độ đạt đạt mục tiecircu vagrave cần được tối ưu hoacutea) 1048713 Caacutec hệ số của hagravem mục tiecircu (cho biết mức đoacuteng goacutep vagraveo mục tiecircu của 1 đơn vị biến quyết định) 1048713 Ragraveng buộc (biểu thức tuyến tiacutenh cho biết giới hạn tagravei nguyecircn vagravehay caacutec quan hệ giữa caacutec biến số) 1048713 Dung lượng (mocirc tả cận trecircn vagrave dưới của caacutec biến vagrave ragraveng buộc) 1048713 Hệ số (cocircng nghệ) vagraveo-ra (cho biết mức độ sử dụng tagravei nguyecircn của biến quyết định) bull Đặc điểm của bagravei toaacuten quy hoạch tuyến tiacutenh 1048713 Tagravei nguyecircn kinh tế của bagravei toaacuten lagrave coacute hạn vagrave sẵn sagraveng 1048713 Coacute nhiều caacutech (gt2 caacutech) sử dụng tagravei nguyecircn được gọi lagrave giải phaacutep hay chương trigravenh 1048713 Mỗi hoạt động dugraveng tagravei nguyecircn đều sinh ra kết quả dưới dạng mục tiecircu đatilde phaacutet biểu trước 1048713 Việc cấp phaacutet nằm trong caacutec ragraveng buộc cho trước bull Giả định của bagravei toaacuten quy hoạch tuyến tiacutenh 1048713 Caacutec kết quả của caacutec cấp phaacutet coacute thể đem so saacutenh với nhau coacute thể đo lường bằng một đơn vị chung

1048713 Caacutec cấp phaacutet độc lập với nhau về mặt kết quả 1048713 Kết quả cuối cugraveng lagrave tổng của caacutec kết quả từ caacutec hoạt động riecircng rẽ khaacutec nhau 1048713 Dữ liệu coacute tiacutenh chắc chắn 1048713 Tagravei nguyecircn được dugraveng một caacutech kinh tế nhất 1048713 Thường coacute một số lớn caacutec giải phaacutep với kết quả khaacutec nhau 1048713 Trong số caacutec giải phaacutep coacute thể coacute 1 giải phaacutep tốt nhất ndash mức độ đạt được mục tiecircu cao nhất ndash gọi lagrave giải phaacutep tối ưu được tigravem ra bằng một giải thuật đặc biệt MOcirc HIgraveNH HOacuteA BẰNG HEURISTIC bull Việc tigravem giải phaacutep tối ưu của một số bagravei toaacuten quyết định phức tạp coacute thể tốn nhiều thời gian chi phiacute hay khocircng thể tigravem ra được Cograven nếu dugraveng tiếp cận mocirc phỏng cũng coacute thể keacuteo dagravei phức tạp khocircng thiacutech hợp hay thậm chiacute khocircng chiacutenh xaacutec

bull Lagrave một tiếp cận giuacutep tigravem ra caacutec giải phaacutep khả thithỏa matildenđủ tốt cho caacutec bagravei toaacuten phức tạp Coacute thể coacute giải phaacutep đủ tốt (90-999 giaacute trị của lời giải tối ưu) nhanh choacuteng vagrave đỡ tốn keacutem hơn bằng caacutech dugraveng heuristics bull Quaacute trigravenh heuristic lagrave datildey caacutec bước xacircy dựng caacutec quy luật giải quyết vấn đề thocircng qua việc tigravem kiếm caacutec con đường hứa hẹn nhất dẫn đến lời giải tigravem kiếm caacutech thức thu thập vagrave phacircn giải thocircng tin theo quaacute trigravenh giải vagrave phaacutet triền caacutec phương phaacutep dẫn đến một giải thuật tiacutenh toaacuten hay một lời giải tổng quaacutet đatilde coacute bull Aacutep dụng chủ yếu cho bagravei toaacuten cấu truacutec yếu cũng dugraveng để tigravem ra giải phaacutep chấp nhận được cho bagravei toaacuten cấu truacutec chặt bull Khocircng đủ tổng quaacutet như caacutec giải thuật thường chỉ dugraveng cho tigravenh huống đặc thugrave đang xeacutet bull Coacute thể dẫn đến một giải phaacutep dở - caacutec thủ tục từng bước giải quyết vấn đề khocircng đảm bảo tigravem ra giải phaacutep tối ưu bull Heuristic coacute thể lagrave định lượng vigrave vậy coacute thể đoacuteng vai trograve quan trọng trong cơ sở mocirc higravenh của hệ hỗ trợ quyết định bull Heuristic coacute thể lagrave định tiacutenh vigrave vậy coacute thể đoacuteng vai trograve quan trọng trong cung ứng kiến thức cho hệ chuyecircn gia bull Quaacute trigravenh heuristic liecircn quan đến tigravem kiếm học tập ước lượng phacircn xử vagrave lặp lại caacutec hoạt động nagravey dọc theo tiến trigravenh bull Kiến thức thu được dugrave thagravenh cocircng hay thất bại trong quaacute trigravenh đều được phản hồi vagrave sửa đổi chiacutenh quaacute trigravenh nhờ đoacute coacute thể định nghĩa lại mục tiecircu hay bagravei toaacuten 1048713 Giải thuật di truyền bắt đầu bằng tập caacutec giải phaacutep được sinh ngẫu nhiecircn taacutei kết hợp caacutec cặp giải phaacutep một caacutech ngẫu nhiecircn bull Tigravenh huống necircn dugraveng heuristics 1048713 Dữ liệu đầu vagraveo khocircng chiacutenh xaacutec hay coacute giới hạn 1048713 Thực tế quaacute phức tạp đến nỗi khocircng dugraveng được caacutec mocirc higravenh tối ưu 1048713 Chưa coacute được giải thuật chiacutenh xaacutec vagrave đủ tin cậy 1048713 Bagravei toaacuten phức tạp necircn sẽ khocircng kinh tế nếu dugraveng tối ưu hay mocirc phỏng hoặc tốn quaacute nhiều thời gian tiacutenh toaacuten 1048713 Coacute thể cải thiện tiacutenh hiệu quả của quaacute trigravenh tối ưu (tức coacute thể sinh ra caacutec giải phaacutep ban đầu tương đối tốt) 1048713 Liecircn quan đến xử lyacute kyacute hiệu chứ khocircng phải xử lyacute kyacute số (như hệ chuyecircn gia) 1048713 Cần coacute quyết định nhanh vagrave caacutec xử lyacute dựa vagraveo maacutey tiacutenh đều khocircng khả thi (một số heuristic khocircng cần đến maacutey tiacutenh) bull Thuận lợi 1048713 Dễ hiểu dễ giải thiacutech vagrave dễ cagravei đặt 1048713 Nacircng cao tiacutenh saacuteng tạo vagrave năng lực heuristic cho caacutec vấn đề khaacutec 1048713 Tiết kiệm thời gian xaacutec lập vấn đề 1048713 Tiết kiệm yecircu cầu về bộ chứa vagrave xử lyacute maacutey tiacutenh

1048713 Tiết kiệm thời gian tiacutenh toaacuten vagrave do vậy tiết kiệm thời gian thực trong ra quyết định Một số vấn đề phức tạp đến nỗi chỉ coacute thể giải được bằng heuristics 1048713 Thường sinh ra nhiều giải phaacutep chấp nhận được 1048713 Thường coacute thể phaacutet biểu lyacute thuyết hay đo lường thực nghiệm về chất lượng của giải phaacutep (tức giaacute trị mục tiecircu của giải phaacutep gần với giaacute trị tồi ưu đến mức nagraveo dugrave giaacute trị tối ưu chưa biết được) 1048713 Coacute thể kết hợp tiacutenh thocircng minh vagraveo để hướng dẫn pheacutep tigravem kiếm (tigravem kiếm tabu) Năng lực thocircng minh đoacute coacute thể lagrave đặc thugrave theo bagravei toaacuten hoặc dựa trecircn yacute kiến chuyecircn gia được cấy trong hệ chuyecircn gia hoặc cơ chế tigravem kiếm 1048713 Coacute thể dugraveng heuristic hiệu quả vagraveo caacutec mocirc higravenh coacute thể giải bằng quy hoạch toaacuten học Đocirci khi heuristic lagrave phương phaacutep được ưa thiacutech hơn khi khaacutec giải phaacutep heuristics được dugraveng như giải phaacutep ban đầu cho caacutec phương phaacutep quy hoạch toaacuten học bull Hạn chế 1048713 Khocircng đảm bảo coacute được giải phaacutep tối ưu 1048713 Caacutec quy luật coacute rất nhiều ngoại lệ 1048713 Caacutec lựa chọn quyết định tuần tự coacute thể khocircng tiecircn đoaacuten được caacutec kết cục tương lai của mỗi chọn lựa 1048713 Sự liecircn thuộc giữa caacutec phần trong hệ thống đocirci khi coacute thể gacircy ra caacutec ảnh hưởng lớn lao lecircn toagraven hệ thống bull Phacircn loại caacutec giải thuật heuristic 1048713 Heuristic xacircy dựng xacircy dựng giải phaacutep khả thi bằng caacutech cộng thecircm từng thagravenh phần một VD bagravei toaacuten người baacuten hagraveng ndash luocircn gheacute thagravenh phố chưa viếng thăm kế tiếp gần nhất

1048713 Heuristic cải tiến bắt đầu bằng một giải phaacutep khả thi vagrave cố gắng cải tiến liecircn tục trecircn đoacute VD trecircn thử hoaacuten đổi 2 thagravenh phố 1048713 Quy hoạch toaacuten aacutep dụng vagraveo caacutec mocirc higravenh chứa iacutet ragraveng buộc nhằm coacute được thocircng tin về thỏa hiệp tốt nhất với mocirc higravenh nguyecircn gốc Thường được dugraveng trong tối ưu hoacutea nguyecircn (integer optimization) 1048713 Chia giai đoạn giải quyết một vấn đề theo từng giai đoạn VD ở PampG trecircn đacircy bagravei toaacuten phacircn phối được giải quyết trước sau đoacute dugraveng giải quyết bagravei toaacuten chiến lược sản phẩm 1048713 Phacircn ratilde chia bagravei toaacuten thagravenh caacutec phần nhỏ hơn coacute thể giải quyết được sau đoacute kết hợp caacutec giải phaacutep đoacute lại VD chia latildenh thổ baacuten hagraveng thagravenh 4 vugraveng khaacutec nhau giải quyết cho từng vugraveng sau đoacute kết nối caacutec giải phaacutep

21Mocirc phỏngbull Giả định caacutec đặc điểm của thực tạibull Lagrave kỹ thuật tiến triển caacutec thực nghiệm (như phacircn tiacutech ldquowhat-ifrdquo) - bằng maacutey tiacutenh -trecircn một mocirc higravenh của hệ thocircng tin quản lyacute

bull Khocircng thực sự lagrave một mocirc higravenh vigrave khocircng biểu diễn thực tại magrave lagrave cố gắng bắtchước thực tạibull Một trong những phương phaacutep thocircng dụng nhất trong HHTQĐbull HHTQĐ lagravem việc với caacutec bagravei toaacuten phi cấu truacutec vagrave cấu truacutec yếu tigravenh huống thực tếphức tạp ndash khocircng dễ biểu diễn bằng mocirc higravenh tối ưu hay caacutec dạng mocirc higravenh khaacutecnhưng lại thường coacute thể xử lyacute được bằng mocirc phỏngbull Đặc điểm1048713 Iacutet đưa ra caacutec đơn giản hoacutea về thực tại hơn caacutec mocirc higravenh khaacutec1048713 Do triển khai caacutec thực nghiệm necircn noacute coacute thể kiểm thử caacutec giaacute trị cụ thể của caacutecbiến quyết địnhbiến khocircng kiểm soaacutet được của mocirc higravenh vagrave xem xeacutet ảnh hưởnglecircn caacutec biến kết quả1048713 Phương phaacutep coacute tiacutenh mocirc tả (như vậy khaacutec với phương phaacutep danh định)1048713 Khocircng tự động tigravem kiếm giải phaacutep tối ưu ndash noacute mocirc tảtiecircn đoaacuten caacutec đặc tiacutenh của hệthống đatilde cho dưới caacutec điều kiện khaacutec nhau từ đoacute coacute thể chọn ra phương aacuten tốtnhất1048713 Quaacute trigravenh mocirc phỏng thường lặp lại một thực nghiệm nhiều lần để coacute được ướclượng về hiệu ứng tổng quaacutet của một số hagravenh động nhất định1048713 Mocirc phỏng maacutey tiacutenh thiacutech hợp cho hầu hết caacutec tigravenh huống mặc dugrave cũng coacute một sốmocirc phỏng thủ cocircng thagravenh cocircng1048713 Thường chỉ được dugraveng khi bagravei toaacuten quaacute phức tạp khocircng thể xem xeacutet bằng caacutec kỹthuật tối ưu dạng số Tiacutenh phức tạp theo nghĩa bagravei toaacuten khocircng thể cocircng thức hoacuteacho tối ưu (do khocircng thotildea caacutec giả định) hoặc cocircng thức quaacute lớn quaacute nhiều tươngtaacutec giữa caacutec biến hoặc về bản chất bagravei toaacuten lagrave bất định hay rủi roPhương phaacutep mocirc phỏng thiết lập mocirc higravenh của hệ thống thực vagrave tiến hagravenh caacutec thựcnghiệm lặp lại trecircn mocirc higravenh

bull Thuận lợi1048713 Lyacute thuyết tương đối trực tiếp hiệu ứng dagravei hạn của nhiều chiacutenh saacutech -gt neacuten thờigian lớn1048713 Do tiacutenh chất mocirc tả (khaacutec với danh định)1048713 Coacute thể thấy được nhanh choacuteng coacute thể đặt ra caacutec cacircu hỏi ldquowhat-ifrdquo coacute thể dugravengtiếp cận thử-vagrave-sai vagraveo giải quyết vấn đề một caacutech nhanh choacuteng rẻ chiacutenh xaacutec iacutetrủi ro hơn1048713 Thử nghiệm được biến quyết định phần nagraveo của mocirci trường thực sự quan trọngvới caacutec phương aacuten khaacutec nhau1048713 Yecircu cầu kiến thức riecircng biệt về bagravei toaacuten vigrave thế buộc người xacircy dựng mocirc higravenh phảilagravem việc thường xuyecircn với nhagrave quản lyacute ndash đối tượng mong muốn của HHTQĐ để

từ đoacute bản chất bagravei toaacuten vagrave caacutec quyết định được hiểu tốt hơn1048713 Mocirc higravenh được xacircy dựng từ viễn cảnhcaacutech nhigraven của nhagrave quản lyacute1048713 Mocirc higravenh chỉ cho một bagravei toaacuten riecircng biệt thường khocircng thể dugraveng giải caacutec bagravei toaacutenkhaacutec Như vậy mỗi thagravenh phần của mocirc higravenh ứng với một phần của hệ thống thựcdo đoacute sẽ khocircng yecircu cầu nhagrave quản lyacute phải tổng quaacutet hoacutea caacutec hiểu biết của migravenh1048713 Phổ bagravei toaacuten giải được rất rộng tồn kho nhacircn sự hoạch định chiến lược 1048713 Coacute thể chứa caacutec phức tạp thực sự của bagravei toaacuten khocircng cần caacutec đơn giản hoacutea (TDdugraveng caacutec phacircn phối xaacutec suất thực thay vigrave phacircn phối lyacute thuyết xấp xỉ)1048713 Coacute thể tự động sinh ra nhiều đo lường hiệu năng quan trọng1048713 Thường lagrave phương phaacutep duy nhất của HHTQĐ coacute thể xử lyacute caacutec bagravei toaacuten tương đốiphi cấu truacutec1048713 Coacute một số caacutec goacutei phần mềm mocirc phỏng (Monte Carlo) tương đối dễ dugravengbull Điểm yếu1048713 Tuy thường tigravem được caacutec phương aacuten đủ tốt nhưng khocircng đảm bảo lời giải tối ưu1048713 Quaacute trigravenh xacircy dựng mocirc higravenh thường dagravei vagrave tốn keacutem1048713 Giải phaacutep vagrave suy diễn từ nghiecircn cứu mocirc phỏng thường khocircng thể chuyển sang bagraveitoaacuten khaacutec vigrave mocirc higravenh kết hợp caacutec yếu tố đặc thugrave1048713 Đocirci khi do mocirc higravenh quaacute dễ giải thiacutech cho nhagrave quản lyacute necircn caacutec phương phaacutep phacircntiacutech thường xem nhẹ1048713 Phần mềm mocirc phỏng đocirci khi yecircu cầu caacutec kỹ năng đặc biệt do độ phức tạp củaphương phaacutep giải higravenh thứcbull Caacutec loại mocirc phỏng1048713 Mocirc phỏng xaacutec suất một hay nhiều biến độc lập mang tiacutenh xaacutec suất với 2 loạiphacircn phối ndash thường dugraveng kỹ thuật Monte Carlo1048713 Phacircn phối rời rạc tigravenh huống coacute một số giới hạn caacutec biến cố (biến) với hữu hạncaacutec giaacute trị cho mỗi biến cố (biến)1048713 Phacircn phối liecircn tục tigravenh huống coacute số lượng khocircng giới hạn caacutec biến cố tuacircn theocaacutec hagravem mật độ xaacutec suất như phacircn phối chuẩn1048713 Mocirc phỏng độc lậpphụ thuộc theo thời gian1048713 Độc lập khocircng cần thiết phải biết chiacutenh xaacutec thời điểm xảy ra biến cố (nhu cầutiecircu thụ lượng sản phẩm trong ngagravey khocircng biết chiacutenh xaacutec thời điểm tiecircu thụ)1048713 Phụ thuộc cần biết chiacutenh xaacutec thời điểm xảy ra sự kiện (bagravei toaacuten hagraveng đợi)1048713 Mocirc phỏng tương taacutec trực quan1048713 Mocirc phỏng hướng đối tượng dugraveng tiếp cận hướng đối tượng để xacircy dựng mocirc higravenhmocirc phỏng Chuacute yacute ngocircn ngữ mocirc higravenh hoacutea nhất thể UML (unified modelinglanguage) kể cả khi mocirc phỏng caacutec hệ thời gian thựcMOcirc HIgraveNH HOacuteA ĐA CHIỀU ndash XỬ LYacute PHAcircN TIacuteCH TRỰC TUYẾNbull Người ra quyết định thường phải xem xeacutet nhiều chiều của dữ liệu (TD caacutec chiềucủa dữ liệu baacuten hagraveng lagrave sản phẩm vugraveng thời gian người baacuten ) dữ liệu cần đượcphacircn tiacutech trực tiếp bằng caacutec cocircng cụ chuẩn hay phacircn tiacutech tự động bằng caacutec

phương phaacutep khai mỏ dữ liệu (data mining)bull Hầu hết caacutec hệ thống phacircn tiacutech đa chiều được nhuacuteng trong caacutec hệ xử lyacute phacircn tiacutechtrực tuyến (HXLPTTT ndash online analytic processing - OLAP)bull Mục tiecircu của XLPTTT nắm bắt cấu truacutec của dữ liệu thực để hỗ trợ ra quyết địnhbull Trong HHTQĐ coacute sự gắn nối tự nhiecircn giữa mocirc higravenh hoacutea dữ liệu mocirc higravenh hoacutea kyacutehiệu vagrave caacutec khiacutea cạnh của phacircn tiacutech ldquowhat-ifrdquobull Caacutec baacuteo caacuteo của HXLPTTT đều coacute tiacutenh tương taacutec dễ khai thaacutec sử dụng đặc biệtphugrave hợp cho caacutec baacuteo caacuteo về chỉ số hiệu năng chủ yếu (key performance indicators- KPI) baacuteo caacuteo về đo lường hiệu năng kinh doanh bull Thế hệ hiện tại của HXLPTTT vagrave hệ khai mỏ dữ liệu (data mining) tiacutech hợp caacutecđặc tiacutenh của hệ thocircng tin latildenh đạo (executive information system ndashEIS- nhiềucaacutech nhigraven dữ liệu chi tiết hoacutea theo nhu cầu) vagrave caacutec hệ đồ họa khaacutec ndash thường coacutegiao diện người dugraveng dạng kiểu WEBbull Caacutec hệ thống như trecircn cograven được gọi lagrave caacutec cocircng cụ triacute tuệ kinh doanh (businessintelligence - BI) vigrave coacute caacutec đặc trưng về mocirc higravenh hoacutea vagrave tối ưu hoacutea nhưng lạitrong suốt đối với ngươigrave dugravengbull Hiện caacutec cocircng cụ được đưa ra bởi caacutec nhagrave cung cấp về CSDL về hoạch định tagraveinguyecircn tổ chức (ERP) về nhagrave kho dữ liệu (data warehouse) về HXLPTTT MOcirc HIgraveNH HOacuteA VAgrave MOcirc PHỎNG TƯƠNG TAacuteC TRỰC QUANbull Iacutech lợi Người ra quyết định tham gia vagraveo quaacute trigravenh phaacutet triển mocirc higravenh vagrave thựcnghiệm mocirc phỏng vigrave vậy sẽ tin tưởng khi sử dụng mocirc higravenhbull Mocirc higravenh hoacutea tương taacutec trực quan (visual interactive modeling - VIM) dugraveng caacutecbiểu diễn đồ họa maacutey tiacutenh để trigravenh bagravey caacutec ảnh hưởng của caacutec quyết định quản lyacutekhaacutec nhau ở một thời điểm (tĩnh) hay tiến triển theo thời gian (động với kỹ thuậthoạt higravenh)bull Mocirc phỏng tương taacutec trực quan (visual interactive simulation - VIS) cho pheacutepngười dugraveng theo dotildei tiến trigravenh xacircy dựng vagrave sử dụng khai thaacutec mocirc higravenh mocirc phỏngdưới dạng hoạt higravenhbull Mocirc higravenh hoacutea tương taacutec trực quan coacute thể kết hợp với tiếp cận triacute tuệ nhacircn tạo đểđưa ra caacutec khả năng mới thay đổi từ xacircy dựng hệ thống dạng đồ họa đến tigravem hiểuvề động học của hệ thốngbull Cần đến caacutec hệ thống maacutey tiacutenh xử lyacute song song tốc độ cao để xacircy dựng caacutec mocircphỏng - phức tạp quy mocirc lớn dạng hoạt higravenh - mang tiacutenh khả thi ở thời gian thực

22Caacutec dạng hệ thống hỗ trợ ra quyết địnhHệ hỗ trợ quyết định nhoacutemRa quyết định nhoacutem giao tiếp vagrave cộng taacutec- Caacutec đặc điểm của cocircng việc nhoacutem+ Một nhoacutem thực hiện một nhiệm vụ thỉnh thoảng ra quyết định thỉnh thoảngkhocircng ra quyết định+ Caacutec thagravenh viecircn trong nhoacutem coacute thể ở những nơi khaacutec nhau

+ Caacutec thagravenh viecircn trong nhoacutem coacute thể lagravem việc ở những thời gian khaacutec nhau+ Caacutec thagravenh viecircn trong nhoacutem coacute thể lagravem việc cugraveng nhau hoặc ở caacutec tổ chức khaacutecnhau+ Nhoacutem coacute thể vĩnh viễn hoặc tạm thời+ Nhoacutem coacute thể ở bất kỳ mức quản lyacute nagraveo hoặc mức thời gian nagraveo+ Coacute sự điều phối (quaacute trigravenh vagrave nhiệm vụ đạt được) hoặc macircu thuẩn trongnhoacutem+ Coacute sự đạt được hoặcvagrave mất maacutet năng suất trong tổ chức+ Nhiệm vụ phải hoagraven thagravenh rất nhanh+ Khocircng thể hoặc quaacute đắt cho tất cả caacutec thagravenh viecircn trong nhoacutem cugraveng hợp ở mộtnơi+ Một số dữ liệu thocircng tin hoặc kiến thức cần thiết nằm ở nhiều nơi một sốkhaacutec ở ngoagravei tổ chức+ Chuyecircn mocircn của caacutec thagravenh viecircn khocircng coacute trong nhoacutem lagrave cần thiết- Caacutec hoạt động vagrave caacutec quaacute trigravenh miecircu tả caacutec cuộc họp+ Cuộc họp lagrave hoạt động chung liecircn quan bởi một nhoacutem người coacute địa vị bằngnhau hoặc gần bằng nhau+ Kết quả của cuộc họp phụ thuộc một phần vagraveo kiến thức yacute kiến caacutec đaacutenh giaacutecủa caacutec thagravenh viecircn+ Kết quả của cuộc họp cũng phụ thuộc vagraveo sự kết hợp của nhoacutem vagrave phụ thuộcvagraveo quaacute trigravenh ra quyết định được sử dụng bởi nhoacutem đoacute+ Giải quyết caacutec yacute kiến khaacutec nhau bởi người coacute quyền hạn hoặc thương lượnghoặc phacircn xửHỗ trợ giao tiếp- Giao tiếp lagrave thagravenh phần quan trọng cho hỗ trợ quyết định Khocircng coacute giao tiếp thigravekhocircng coacute cộng taacutec Những người ra quyết định caacute nhacircn phải giao tiếp với caacutecđồng nghiệp chuyecircn gia cơ quan chiacutenh phủ khaacutech hagraveng đối taacutec kinh doanh hellipHọ cũng cần dữ liệu vagrave thocircng tin (vagrave kiến thức) từ nhiều nơi trecircn thế giới Caacutecnhoacutem ra quyết định phải giao tiếp cộng taacutec vagrave thương lượng trong cocircng việcHầu hết caacutec tổ chức sẽ nhanh trở thagravenh khocircng coacute chức năng nếu khocircng coacute caacutec hệthống giao tiếp Thương mại điện tử coacute thể hiệu quả chỉ qua caacutec kỹ thuật giao tiếphiện đại- Caacutec kỹ thuật thocircng tin hiện đại cung cấp caacutec phương tiện hỗ trợ giao tiếp rẻnhanh coacute khả năng coacute thể tin cậy Nền tảng hỗ trợ giao tiếp lagrave caacutec hệ thống maacuteytiacutenh mạng+ Bắt đầu bằng điện baacuteo điện thoại radio vagrave ti vi+ Trong 100 năm chuacuteng ta phaacutet triển maacutey fax thư điện tử chương trigravenh chatnhoacutem tin tức hệ thống hội nghị truyền higravenh Hầu hết caacutec kỹ thuật nagravey đềuhoạt động trecircn internet+ Sự phaacutet triển giao tiếp sau cugraveng lagrave hệ thống họp điện tử caacutec dịch vụ vagrave hệ

thống hội nghị điện tử thường sử dụng internet để kết nối caacutec người ra quyếtđịnh- Caacutec thuận lợi aacutep dụng caacutec phương phaacutep giao tiếp cải tiến trong caacutec tổ chức+ Cải tiến năng suất của nhacircn viecircn+ Liecircn quan đến nhiều người ra quyết định chiacutenh+ Khocircng quan tacircm nhiều đến đường biecircn giới địa lyacute+ Tạo nền văn hoacutea hợp taacutec nhất quaacuten+ Cải tiến chất lượng cuộc sống của nhacircn viecircnHỗ trợ cộng taacutec Maacutey tiacutenh hỗ trợ cộng taacutec- Khung thời giannơi chốn+ Sự hiệu quả của kỹ thuật tiacutenh toaacuten cộng taacutec phụ thuộc vagraveo vị triacute của caacutec thagravenhviecircn trong nhoacutem vagrave phụ thuộc vagraveo thời gian chia sẽ thocircng tin gởi vagrave nhận+ Chia sự giao tiếp thagravenh bốn ocirc vagrave tổ chức bốn ocirc dọc theo 2 chiều thời gian vagravenơi chốn1048713 Thời gian Khi gởi vagrave nhận thocircng tin hầu như đồng thời giao tiếp lagrave đồngthời Viacute dụ Điện thoại ti vi vagrave caacutec cuộc họp gặp mặt nhau Giao tiếp bấtđồng bộ xảy ra khi người nhận nhận thocircng tin ở thời điểm khaacutec thời điểmgởi thocircng tin đoacute1048713 Nơi chốn Người gởi vagrave người nhận coacute thể ở cugraveng phograveng hoặc khocircng+ Bốn ocirc lagrave1048713 Cugraveng thời giancugraveng nơi chốn Caacutec thagravenh viecircn gặp mặt nhau cugraveng một luacutecgiống như phograveng quyết định hoặc gặp mặt truyền thống1048713 Cugraveng thời giankhaacutec nơi chốn Caacutec thagravenh viecircn ở caacutec nơi khaacutec nhau nhưnggiao tiếp cugraveng nhau Viacute dụ hội nghị truyền higravenh (videoconferencing)1048713 Khaacutec thời giancugraveng nơi chốn Nhiều người lagravem việc theo ca Ca nagravey để lạithocircng tin cho ca khaacutec1048713 Khaacutec thời giankhaacutec nơi chốn Caacutec thagravenh viecircn ở caacutec nơi khaacutec nhau Caacutecthagravenh viecircn nagravey gởi vagrave nhận thocircng tin ở những lần khaacutec nhau

23Thực thi hệ DSSHệ thống hỗ trợ quản lyacute (MSS) khocircng phải luacutec nagraveo cũng luocircn thagravenh cocircng Nhiều trường hợpthất bại của ES khocircng hoagraven toagraven lagrave lyacute do kỹ thuật Thực thi hệ thống lagrave một quaacute trigravenh liecircn tụcnhằm đảm bảo cho tổ chức chuẩn bị tiếp nhận một hệ thống mới vagrave đưa hệ thống vagraveo sử dụngthagravenh cocircngThực hiện cocircng nghệ hệ thống hỗ trợ quản lyacute lagrave việc phức tạp vigrave caacutec hệ thống nagravey khocircng đơnthuần lagrave hệ thống thocircng tin chỉ thu thập thao taacutec vagrave phacircn phối thocircng tin Magrave xa hơn chuacuteng

liecircn quan tới caacutec cocircng việc coacute thể lagravem thay đổi đaacuteng kể caacutech thức hoạt động của tổ chức Tuyvậy đa số caacutec yếu tố thực thi đều liecircn quan tới hệ thống thocircng tinThực thi MSS lagrave quaacute trigravenh liecircn tục diễn ra trong suốt thời gian phaacutet triển hệ thống từ đề xuấtban đầu đến nghiecircn cứu khả thi thiết kế vagrave phacircn tiacutech hệ thống lập trigravenh huấn luyện chuyểnđổi vagrave lắp đặt Caacutec chuyecircn gia hệ thống thocircng tin thường gọi thực thi lagrave giai đoạn cuối trongvograveng đời hệ thống Định nghĩa thực thi MSS phức tạp hơn vigrave bản chất lặp của sự phaacutet triểncaacutec hệ thống

THỰC THI KHOcircNG HOAgraveN CHỈNHCaacutec quyết định về tiacutenh khả thi thường coacute giả định về lợi iacutech đạt được khi kế hoạch thực thiđược thực hiện hoagraven toagraven Trong thực tế thường chỉ thực hiện 90 thậm chiacute 70 phần trăm sovới phacircn tiacutech khả thi Lyacute do lagrave sự thay đổi tại một nơi trong hệ thống coacute thể ảnh hưởng vagrave coacutethể taacutec động tiecircu cực đến chỗ khaacutec Do vậy cấp quản lyacute coacute thể bỏ những phần trong dự aacuten coacutethể gacircy ra taacutec động xấu Do đoacute dự aacuten sẽ thực hiện iacutet hơn 100 so với dự aacuten kế hoạch Caacutec lyacutedo khaacutec coacute thể lagrave do khấu trừ ngacircn saacutech hoặc vượt chi phiacuteĐAacuteNH GIAacute SỰ THAgraveNH COcircNG CỦA THỰC THI HỆ THỐNGPhải coacute caacutec chỉ số đo lường thigrave mới coacute thể đaacutenh giaacute sự thagravenh cocircng khi thực thi một hệ thốngDickson va Powers (1973) đề ra 5 tiecircu chuẩn độc lậpbull Tỷ lệ thời gian thực hiện dự aacuten với thời gian ước lượngbull Tỷ lệ chi phiacute thực tế vagrave ngacircn saacutech thực hiệnbull Thaacutei độ của cấp quản lyacute đối với hệ thốngbull Nhu cầu thocircng tin của caacutec nhagrave quản lyacute được đaacutep ứng như thế nagraveo qua hệ thốngbull Taacutec động của dự aacuten đối với những hoạt động maacutey tiacutenh trong cocircng tyCaacutec đo lường khaacutec để đaacutenh giaacute thagravenh cocircng của hệ hỗ trợ quản lyacute (MSS)bull Sự sử dụng hệ thống (dự định dugraveng hoặc thực sự dugraveng)bull Thỏa matilden của người dugravengbull Thaacutei độ taacuten thagravenhbull Mức độ hệ thống hoagraven thagravenh caacutec mục tiecircu ban đầubull Phần thưởng đối với tổ chức (giảm chi phiacute tăng doanh thuhellip)bull Tỷ số lợi iacutech chi phiacute

bull Mức độ thể chế hoacutea của MSS trong tổ chứcDo bởi tiacutenh đa dạng của DSS necircn việc đaacutenh giaacute sự thagravenh cocircng của hệ nagravey cũng khoacute khăn tuynhiecircn cũng coacute thể coacute một số yếu tố giuacutep cho DSS thagravenh cocircng như sự tham gia người dugravenghuấn luyện người dugraveng hỗ trợ quản lyacute cấp cao nguồn thocircng tin đặc điểm của những nhiệmvụ coacute liecircn quan (cấu truacutec bất định độ khoacute phụ thuộc)

Chương5Nhoacutem hỗ trợ quyết định vagrave nhoacutemcocircng nghệ phần mềm

51Nhoacutem tạo quyết định

MDM-Holsapple đatilde gợi yacute chuacuteng ta sử dụng giới hạn người tạo quyết định

Một nhoacutem lagrave kết cấu MDM nơi magrave nhiều người ra quyết định hoagraven toagraven tương taacutec

Một đội lagrave kết cấu MDM nơi caacutec thagravenh viecircn tư vấn cho người đưa ra quyết định nhưng khocircng tương taacutec

Một Ủy ban lagrave kết cấu MDM với một người tạo quyết định duy nhất vagrave sự tương taacutec giữa caacutec thagravenh viecircn

Mạng thocircng tin

Mạng lưới baacutenh xe mỗi người tham gia coacute thể giao tiếp với người đưa ra quyết định ở trung tacircm nhưng khocircng phải với người tham gia khaacutecCấu truacutec nagravey lagrave khocircng thỏa matilden tất cả những người tham gia ngoại trừ người ra quyết định

Mạng dacircy chuyền Tham gia chuyển tiếp thocircng tin chỉ để noacute luocircn liền kề nhau trong chuỗi

Thagravenh viecircn cuối cugraveng ko được đaacutep ứng

Mạng vograveng trograven Tương tự như chuỗi nhưng kết thuacutec được kết nối

Mạng kết nối hoagraven toagraven khocircng coacute hạn chế về giao tiếp vagrave tương taacutec giữa caacutec thagravenh viecircnNoacutei chungnoacute đaacutep ứng hầu hết caacutec kết nối của người tham gia nhưng truyền đạt thocircng tin mất nhiều thời gian vagrave coacute nhiều cơ hội xảy ra lỗi

Nhoacutem hagravenh vi vagrave chuẩn mực

MDMs thiết lập caacutec chỉ tiecircu hướng dẫn quaacute trigravenh ra quyết định

Một chuẩn mực quy định cụ thể những gigrave thagravenh viecircn trong nhoacutem dự kiến sẽ lagravem trong những hoagraven cảnh nhất định

Quy tắc gửi coacute thể được thocircng qua viacute dụ đaacutenh giaacute ngang hagraveng hoặc xử phạt

Lagravem thế nagraveo để đưa ra quyết định

Việc chọn lựa magrave trong đoacute việc sử dụng cấu truacutec MDM phải được dựa trecircn một số yếu tố liecircn quan với bối cảnh quyết định

Viacute dụmột cấu truacutec riecircng lẻ sẽ lagravem việc nơi magrave quyết định được cấu truacutec cao vagrave thocircng tin lagrave coacute sẵn

Một ủy ban cơ cấu sẽ lagrave sự lựa chọn khi người ra quyết định khocircng thể đưa ra quyết định một migravenh

52Caacutec vấn đề thường gặp trong nhoacutem

Kiacutech thước Noacutei chung sự nhất triacute vagrave gắn kết giữa caacutec thagravenh viecircn tỉ lệ nghịch với phạm vi nhoacutem Trong nhoacutem lớn rất dễ higravenh thagravenh caacutec nhoacutem nhỏ vagrave hoạt động rời rạc

Tư duy tập thể Trong nhoacutem lớn mọi người coacute xu hướng suy nghĩ đểđạtđược sự nhất triacute necircn khocircng phaacutet huy được sự saacuteng tạo

Caacutec vấn đề về xatilde hội

Xung đột Trong 1 nhoacutem ai cũng muốn migravenh lagrave giỏi nhất necircn dễ dẫn đến xung đột

Ẩn danh(Giấu tecircn) Đacircy lagrave phương phaacutep được sử dụng để kiểm soaacutet xung đột Cho caacutec thagravenh viecircn tham gia ẩn danh

Vấn đề giới tiacutenh Nam vagrave nữ thường coacute những thế mạnh khaacutec nhau điều nagravey coacute thể lagrave sức mạnh trong 1 thiết lập MDM

Đagravem phaacuten vagrave quyết định

Một quyết định coacute thể liecircn quan đến nhiều quan điểm khaacutec nhau vigrave thế cần phải coacute sự đagravem phaacuten

Caacutec thiết kế của cơ chế hỗ trợ cho MDM phải phugrave hợp với caacutec hoạt độngđagravemphaacuten

Những hoạt động nagravey bao gồm việc thu nhận yacute kiến của caacutec thagravenh viecircn 1 caacutech cocircng bằng

53Cocircng nghệ hỗ trợ MDM

Organizational DSSndash 1 hệ thống cung cấp caacutec quyết định hỗ trợ

Group Support Systemndash Cocircng nghệ sử dụng sự hỗ trợ của nhiều becircn tham gia

Group DSS ndash Lagrave 1 hệ thống được thiết kế đặc biệt để hỗ trợ cho MDM

DSS ndash Lagrave 1 hệ thống dưới sự kiểm soaacutet của 1 người quyết định hệ thống nagravey cung cấp 1 bộ cocircng cụ giuacutep phacircn tiacutech hoagraven cảnh đểđưa ra quyết định vagrave nacircng cao hiệu quả của quyết địnhđoacute

53Cocircng nghệ hỗ trợ MDM

Organizational DSSndash 1 hệ thống cung cấp caacutec quyết định hỗ trợ

Group Support Systemndash Cocircng nghệ sử dụng sự hỗ trợ của nhiều becircn tham gia

Group DSS ndash Lagrave 1 hệ thống được thiết kế đặc biệt để hỗ trợ cho MDM

DSS ndash Lagrave 1 hệ thống dưới sự kiểm soaacutet của 1 người quyết định hệ thống nagravey cung cấp 1 bộ cocircng cụ giuacutep phacircn tiacutech hoagraven cảnh đểđưa ra quyết định vagrave nacircng cao hiệu quả của quyết địnhđoacute

Mục tiecircu của cocircng nghệ hỗ trợ MDM

Quy trigravenh hỗ trợ tập trung vagraveo quaacute trigravenh tạo điều kiện thuận lợi cho sự tương taacutec

Cơ chế cấu truacutec quaacute trigravenh chi phối caacutec hoạt động truyền thocircng

Nhiệm vụ hỗ trợ cocircng việc coacute thể chọn lựa tổ chức hoặc lấy thocircng tin

Nhiệm vụ cấu truacutec cocircng việc cho pheacutep truy cập đến kỹ thuật lọc kết hợp phacircn tiacutech kiến thức liecircn quan đến cocircng việc

Caacutec lớp loại cocircng nghệ hỗ trợ MDM

Phacircn loại theo đặc điểm do DeSanctis vagrave Gallupe đưa ra đề xuất một chương trigravenh ba cấp dựa trecircn caacutec tiacutenh năng được cung cấp

Hệ thống cấp 1 Mục điacutech chiacutenh lagrave tạo điều kiện thocircng tin liecircn lạc giữa caacutec thagravenh viecircn

Hệ thống cấp 2 Thiết kế để giảm thiểu rủi ro

Hệ thống cấp 3 Giuacutep điều chỉnh xử lyacute quyết định

Phacircn loại theo cocircng nghệ -Kraemer vagrave King tập trung vagraveo cocircng nghệ aacutep dụng

Cocircng nghệ bảng mạch điện tử

Hội nghị trực tuyến

Mạng lưới tập đoagraven

Trung tacircm thocircng tin

Mocirci trường cộng taacutec

Phograveng quyết định

Nhoacutem phần mềm

Phần mềm được thiết kế để hỗ trợ sự hợp taacutec bao gồm việc thu huacutet vagrave lưu trữ thocircng tin

Caacutec tổ chức dẫn đầu thị trường hiện tại lagrave Lotus Notes and Domino Microsoft Exchange Novell GroupWise and Oracle Office

Caacutec cocircng cụ trong một bộ phần mềm bao gồm người quản lyacute hội nghị (Lotus Sametime) vagrave trao đổi thocircng điệp (Lotus Notes Mail)

Xếp hạng phần mềm cho nhoacutem

Ellis vv đề xuất một hệ thống xếp hạng dựa vagraveo kiểu sự hỗ trợ noacute Cung cấp

Hệ thocircng điệp

Hệ thống hội thảo truyền higravenh

Hệ thống cộng taacutec soạn thảo

Nhoacutem phacircn phối giải phaacutep phần mền

Hệ thống phối hợp

Hệ thống thocircng minh đại diện

Lực lượng điều khiển phaacutet triển phần mềm cho nhoacutem

Một số nhacircn tố chiacutenh bao gồm

Tăng năng suất

Giảm số lượng caacutec cuộc họp

Tăng cường tự động hoacutea caacutec quy trigravenh lagravem việc thường xuyecircn

Cần phối hợp toagraven cầu tốt hơn

Tiacutenh sẵn sagraveng của những mạng lan rộng

Coleman vagrave Khanna liệt kecirc 10 nhacircn tố khaacutec

54Quản lyacute hoạt động MDM (Mobile Device Management - Quản lyacute thiết bị di động)

Một số phương phaacutep phối hợp phổ biến hơnMDM lagrave

Kỹ thuật nhoacutem định danh

Kỹ thuật Delphi

Sự phacircn xử

Hệ thocircng tin dựa trecircn vấn đề

Nemawashi

Kỹ thuật nhoacutem định danh

1-Mỗi người tham gia viết ra những yacute tưởng về những gigrave necircn quyết định

2-Lần lượt mỗi người tham gia trigravenh bagravey yacute tưởng của migravenh được ghi lại trecircn bảng Khocircng thảo luận ở đacircy

3-Sau khi tất cả caacutec yacute tưởng được trigravenh bagravey caacutec đại biểu coacute thể chất vấn những người khaacutec

4-Mỗi người tham gia bỏ phiếu cho mỗi yacute tưởng

Kỹ thuật Delphi

Về cơ bản tương tự như kỹ thuật nhoacutem định danh ngoại trừ những người khocircng bao giờ tham gia cuộc họp

Một cocircng cụ khảo saacutet được sử dụng để thu thập đầu vagraveo ban đầu từ caacutec thagravenh viecircn

Một cuộc khảo saacutet thứ hai được gửi đi với một bản toacutem tắt caacutec kết quả chung

Những bước lặp lại cho đến khi đạt được một sự đồng thuận hoặc nhigraven nhận của đa số

Sự phacircn xử(Arbitration )

Thiacutech hợp nhất khi caacutec thagravenh viecircn của MDM đại diện cho caacutec yếu tố đối lập

Những người tham gia đồng yacute rằng nếu lựa chọn thay thế hai becircn thỏa thuận khocircng được tigravem thấy thigrave một trọng tagravei viecircn becircn ngoagravei sẽ tham gia

Trọng tagravei sau đoacute lựa chọn thay thế ocircng hoặc xeacutet thấy thiacutech hợp nhất

Hệ thống thocircng tin dựa trecircn vấn đề (IBIS)

Lagrave một phương phaacutep lập luận cấu truacutec

Một đại diện cho IBIS lagrave một đồ thị với caacutec nuacutet vagrave caacutec liecircn kết

IBIS bắt đầu với lựa chọn của một nuacutet vấn đề gốc sau đoacute caacutec nuacutet vị triacute khaacutec nhau được liecircn kết với nuacutet gốc

Caacutec nuacutet vị triacute nagravey sau đoacute được đaacutenh giaacute dựa trecircn những lập luận gắn liền với chuacuteng

Nemawashi (được sử dụng rộng ratildei tại Nhật Bản)

1-Một hoặc nhiều thagravenh viecircn của MDM được chỉ định lagrave điều phối viecircnCaacutec điều phối viecircn sau đoacute chọn người tham gia cograven lại

2-Điều phối viecircn xacircy dựng một tổng hợp caacutec sự lựa chọn vagrave sau đoacute caacutec chuyecircn gia đaacutenh giaacute caacutec lựa chọn

3-Điều phối viecircn lựa chọn một sự lựa chọn dựa trecircn kết quả ở trecircn(ở 2)

4-Sự thay thế được luacircn chuyển điều phối viecircn tigravem kiếm sự đồng thuận thocircng qua sự thuyết phục vagrave đagravem phaacuten

5-Nếu đạt được sự đồng thuận điều phối viecircn cho lưu thocircng một tagravei liệu magrave mỗi thagravenh viecircn MDM để lại dấu hiệu trecircn đoacute

55Nơi lagravem việc ảo

Nhiều tổ chức trecircn toagraven thế giới kinh doanh bất động sản cho cocircng nghệ hợp taacutec

Cocircng việc được trở thagravenh một điều bạn lagravem hơn lagrave một nơi bạn đi

Những thay đổi lớn nhất mang lại bởi nơi lagravem việc ảo coacute thể lagrave về văn hoaacute hay xatilde hội hơn lagrave về cocircng nghệ

Chương 6 Hệ thống thocircng tin điều hagravenh

61 Yacute nghĩa của EIS- Hệ thống thocircng tin điều hagravenh

- EIS lagrave một dạng đặc biệt của DSS được thiết kế để hỗ trợ ra quyết định ở cấp cao nhất của một tổ chức

- Lagrave một hệ thống thocircng tin hỗ trợ nhu cầu lập kế hoạch vagrave đaacutenh giaacute của caacutec nhagrave quản lyacute điều hagravenh

- EIS coacute thể giuacutep một CEO coacute được bức tranh tổng thể chiacutenh xaacutec nhất về caacutec hoạt động vagrave một bản toacutem tắt những gigrave magrave đối thủ cạnh tranh đang lagravem

- Caacutec hệ thống nagravey noacutei chung hoạt động dễ dagraveng vagrave trigravenh bagravey thocircng tin theo những caacutech dễ hiểu để việc tiếp thu được nhanh choacuteng (biểu đồ đồ thịhellip)

(Tagravei liệu thecircm EIS lagrave những loại hệ thống lagrave rất phức tạp trong tự nhiecircn Coacute thể noacutei hệ thống nagravey cũng cung cấp cho caacutec nhagrave quản lyacute với caacutec thiết bị coacute khả năng ra quyết định bằng caacutech sử dụng của noacute Hệ thống nagravey hoạt động trong điều kiện như vậy quan trọng như trong caacutec hệ thống khaacutec khocircng hỗ trợ Khả năng lưu trữ dữ liệu nặng lagravem cho noacute lyacute tưởng để được thocircng qua khocircng chỉ bởi caacutec doanh nghiệp lớn magrave cograven bởi caacutec doanh nghiệp nhỏ hơn Nhigraven chung hệ thống nagravey lagrave dagravenh cho caacutec nhacircn viecircn cấp cao hỗ trợ thagravenh thạo trong việc đưa ra caacutec quyết định quan trọng)

Caacutec phiecircn EIS tiecircu biểu- Phiecircn lagravem việc coacute thể bắt đầu với một baacuteo caacuteo về tigravenh higravenh tagravei chiacutenh vagrave kinh

doanh của một cocircng ty caacutec chỉ số hoạt động quan trọng được hiển thị rotilde ragraveng- EIS sẽ cho pheacutep caacutec giaacutem đốc điều hagravenh coacute thể đi sacircu vagraveo dữ liệu từ những con

số bất kỳ magrave noacute hỗ trợ- Việc điều hagravenh coacute thể lựa chọn một mức độ chi tiết ( VD danh số baacuten hagraveng) nếu

như cần điều tra thecircm- Lagrave một phương phaacutep tiếp cận coacute thể giuacutep việc ra quyết định tốt hơn

Những điều magrave EIS ko coacute- EIS khocircng phải lagrave sự thay thế cho caacutec hệ thống dựa trecircn caacutec maacutey tiacutenh khaacutec EIS

thực sự chỉ cung cấp dữ liệu cho caacutec hệ thống nagravey- Noacute khocircng thể biến caacutec bộ hệ điều hagravenh của maacutey tiacutenh thagravenh những ldquochuyecircn viecircn

giỏirdquo- Coacute thể được viacute một caacutech cao hơn như lagrave một trợ lyacute đaacuteng tin cậy coacute thể được gọi

đến bất khi nagraveo vagrave mỗi khi cần thiết

Tagravei liệu thecircm Sự khaacutec nhau giữa EIS vagrave DSS+ EIS thiết kế để hỗ trợ những người điều hagravenh cấp cao giuacutep họ khaacutem phaacute caacutec vấn đề vagrave caacutec cơ hội DSS hỗ trợ những nười phacircn tiacutech cố gắng trả lời cacircu hỏi caacutei gigrave coacute thể lagravem cugraveng với một cơ hội hoặc một vấn đề

Chiều EIS DSSNhững người sử dụng thocircng thường

Duyệt dữ liệu đi xuống truy xuất trạng thaacutei

Hỗ trợ phacircn tiacutech vagrave quyết định

Sự thuacutec đẩy Tiacutenh thiacutech hợp Tiacutenh hiệu quảỨng dụng Queacutet mocirci trường đaacutenh giaacute

hiệu suất nhận dạng caacutec vấn đề vagrave caacutec cơ hội

Caacutec quyết định quản lyacute trecircn caacutec lĩnh vực đa dạng

Hỗ trợ quyết định Caacutec chiacutenh saacutech caacutec quyết định khocircng coacute cấu truacutec ở mức cao vagrave hỗ trợ giaacuten tiếp

Hỗ trợ caacutec quyết định lặp lại caacutec quyết định khocircng thể đoaacuten trước ra quyết định khocircng coacute cấu truacutec vagrave baacuten cấu truacutec

Loại thocircng tin Caacutec thocircng tin tin tức thocircng tin becircn ngoagravei về khaacutech hagraveng đối thủ cạnh tranh mocirci trường caacutec baacuteo caacuteo theo yecircu cầu vagrave định thời về caacutec hoạt động becircn trong

Caacutec thocircng tin hỗ trợ caacutec tigravenh huống đặc biệt

Sử dụng coacute nguyecircn tắc

Dograve theo vết vagrave điều khiển nhận dạng cơ hội

Hoạch định tổ chức phacircn nhoacutem vagrave điều khiển

Khả năng phugrave hợp với những người sử dụng caacute nhacircn

Thiết kế loại ra quyết định cho mỗi người điều hagravenh caacute nhacircn bằng nhiều lựa chọn đầu ra

Cho pheacutep caacutec đaacutenh giaacute caacute nhacircn caacutec khả năng what-if lựa chọn loại hộp hội thoại

Đồ họa Phải coacute Lagrave một phần quan trọng của nhiều DSS

Thacircn thiện người sử dụng

Phải coacute Phải coacute nếu khocircng coacute người sử dụng trung gian

Xử lyacute thocircng tin Lọc neacuten thocircng tin dograve theo vết dữ liệu vagrave thocircng tin quan trọng

EIS kiacutech thiacutech caacutec cacircu hỏi caacutec cacircu trả lời bằng caacutech sử dụng DSS vagrave phản hồi lại EIS

Hỗ trợ caacutec thocircng tin chi tiết

Truy xuất thường xuyecircn caacutec mức chi tiết của bất kỳ thocircng tin tổng hợp nagraveo (duyệt dữ

Coacute thể coacute trong DSS nhưng khocircng thường

liệu chi tiết)Cơ sở mocirc higravenh Caacutec chức năng coacute sẵn bị hạn

chếLagrave điểm cốt lotildei của DSS

Cấu truacutec Theo người baacuten sản phẩm hoặc theo caacutec chuyecircn gia hệ thống thocircng tin

Theo người sử dụng hoặc caacute nhacircn hoặc caacutec chuyecircn gia từ caacutec trung tacircm thocircng tin hoặc phograveng ban hệ thống thocircng tin

Phần cứng Mainframe caacutec trạm RISC mạng LANs hoặc caacutec hệ thống phacircn bố

Mainframe caacutec trạm RISC caacutec maacutey PC hoặc caacutec hệ thống phacircn bố

Bản chất caacutec goacutei phần mềm

Truy xuất tương taacutec dễ dagraveng đến nhiều cơ sở dữ liệu truy xuất trực tuyến caacutec khả năng DBMS phức tạp caacutec liecircn kết phức tạp

Caacutec khả năng tiacutenh toaacuten lớn caacutec ngocircn ngữ mocirc higravenh mocirc phỏng ứng dụng vagrave caacutec bộ tạo DSS

Bản chất caacutec thocircng tin

Trigravenh bagravey thocircng tin được phaacutet sinh trước về quaacute khứ vagrave hiện tại tạo caacutec thocircng tin mới về quaacute khứ hiện tại tương lai

Tạo thocircng tin mới về quaacute khứ hiện tại tương lai

62 Lịch sử EIS- EIS xuất hiện lần đầu tiecircn tại MIT vagraveo những năm 1970

- Những EIS đầu tiecircn được phaacutet triển bởi caacutec doanh ngiệp lớn sẵn sagraveng chấp nhận rủi ro để đạt được lợi thế cạnh tranh

- Vagraveo những năm 1980 caacutec nhagrave cung cấp đatilde phaacutet triển một số cơ sở khaacutech hagraveng rộng vagrave cocircng nghệ EIS được tiếp tục phaacutet triển cho đến ngagravey nay

(Tagravei liệu thecircm Sử dụng DSSEIS cho phaacutet triển bền vững + Một số nghiecircn cứu đatilde được tiến hagravenh để kiểm tra việc thực hiện của EIS trong khu vực cocircng cộng vagrave chiacutenh phủ caacutec nước tổ chức kể từ khi chuacuteng được phaacutet triển theo định hướng lợi nhuận cho caacutec cocircng ty tư nhacircn (Hasan vagrave Hasan năm 1997) Theo một nghiecircn cứu tiến hagravenh tại Mỹ ở hơn 300 cocircng ty kết quả cho thấy sự khaacutec biệt của EIS giữa tư nhacircn vagrave chiacutenh phủ một số kết quả thuacute vị được phaacutet hiệnViacute dụ khoacute khăn hơn để chuyển tiền từ một tagravei khoản khaacutec trong một EIS của chiacutenh phủ cũng lagrave khoacute khăn hơn để biện giải thiacutech cho những chi phiacute phaacutet triển EIS của chiacutenh phủ Một nghiecircn cứu khaacutec được tiến hagravenh ở Australia

cho thấy rằng EIS cung cấp cho quản lyacute một higravenh ảnh chiacutenh xaacutec hơn về tổ chức thực hiện vagrave cung cấp hỗ trợ cho caacutec lợi iacutech chiến lược cải thiện khocircng chỉ cho caacutec nhagrave quản lyacute nhưng cograven cho phần cograven lại của tổ chức Dựa trecircn caacutec hệ thống được thiết kế cho caacutec cocircng ty tư nhacircn với một caacutech rotilde ragravengxaacutec định mục tiecircu EIS lagrave thiacutech hợp cho caacutec tổ chức cocircng cộng hiện đại nhưng cần phải được linh hoạt hơn vagrave kết thagravenh chugravem một phạm vi rộng hơn khả năng vagrave phương tiện hơn so với khu vực tư nhacircn ban đầu theo định hướng sản phẩm (Hasan vagrave Hasan năm 1997) Điều nagravey coacute thể lagrave do thực tế rằng caacutec hoạt động khu vực cocircng lagrave bắt buộc coacute taacutec động rộng phải đaacutep ứng sự mong đợi duy nhất cocircng cộng thường coacute mục tiecircu mơ hồ vagrave macircu thuẫn iacutet quyền tự chủ vagrave kiểm soaacutet việc ra quyết định vagrave nhacircn viecircn lagrave khoacute khăn hơn (Watson vagrave Carte2000) + Toacutem lại EIS lagrave một khaacutei niệm thagravenh cocircng noacute phaacutet triển qua nhiều năm tuy nhiecircn EIS khắc phục khiếm khuyết của migravenh bằng caacutech tiến hagravenh nghiecircn cứu liecircn tục)

63 Tại sao những người điều hagravenh hagraveng đầu lại khaacutec nhau- Họ lagrave những doanh nghiệp theo định hướng coacute suy nghĩ

- Coacute một khoảng khocircng gian rộng để kiểm soaacutet

- Họ chịu traacutech nhiệm cho việc thiết lập chiacutenh saacutech

- Họ đại diện cho tổ chức mocirci trường becircn ngoagravei

- Hagravenh động của họ tạo ra những kết quả đaacuteng kể về tagravei chiacutenh vagrave con người

Tần số caacutec hoạt động điều hagravenh- Xử lyacute xaacuteo trộn 42

- Hoạt động kinh doanh 32

- Phacircn bổ nguồn lực 17

- Đagravem phaacuten 3

- Những điều khaacutec 6

Handling Disturbances 42

Entrepreneurial Activites 32

Resource Allocation 17

Negotiation 3

Other 6

Những thocircng tin điều hagravenh cần thiết- Quản lyacute xaacuteo trộn coacute thể yecircu cầu sự chuacute yacute xung quanh đồng hồ

- Hoạt động kinh doanh yecircu cầu điều hagravenh để dự đoaacuten những thay đổi trong mocirci trường

- Nhiệm vụ phacircn bổ tagravei nguyecircn yecircu cầu lựa chọn người quản lyacute vagrave caacutec nguồn lực hạn chế được triển khai

- Đagravem phaacuten yecircu cầu cập nhật thocircng tin từng phuacutet để coacute thể xacircy dựng được sự đồng thuận

Caacutec loại thocircng tin điều hagravenh- Hệ thống kế toaacuten coacute liecircn quan đến việc tiacutenh toaacuten thu nhập hoạt động cho caacutec lĩnh

vực cụ thể lagrave quan trọng hơn so với caacutec hệ thống kế toaacuten truyền thocircng- Thocircng tin về thị trường khaacutech hagraveng cung cấp giaacute trị trong việc quyết định chiến

lược- Caacutec thocircng tin cần thiết thường được truyền đi trecircn một số hệ thống maacutey tiacutenh vagrave

nằm trong toagraven tổ chức- Caacutec thocircng tin được sử dụng thường lagrave ngắn hạn vagrave dễ thay đổi

Phương thức để xaacutec định thocircng tin cần thiết

Rockart xaacutec định được năm phương thức cơ bản để xaacutec định thocircng tin cần thiết

- Phương thức dựa trecircn kết quả- Phương thức rỗng- Phương thức chỉ số khoacutea- Phương thức tổng hợp nghiecircn cứu- Phương thức dựa vagraveo nhacircn tố then chốt dẫn đến thagravenh cocircng

64 Thagravenh phần EIS

- Sản phẩm EIS đầu tiecircn được phaacutet triển để sử dụng trecircn maacutey tiacutenh cấu higravenh cao nhưng caacutec sản phẩm hiện nay nhằm mục tiecircu lagrave nền tảng ClientServer

- Những nền tảng linh hoạt hơn coacute thể thiacutech ứng với thay đổi trong tổ chức vagrave cocircng nghệ

- Sử dụng dữ liệu thời gian thực dẫn đến quyết định nhanh hơn nhiều thocircng tin hơn

Thagravenh phần phần cứng- Một EIS khocircng đogravei hỏi coacute phần cứng cụ thể hoặc duy nhất nagraveo- Chigravea khoacutea của vấn đề lagrave để đảm bảo rằng caacutec thagravenh phần của EIS tối ưu hoacutea vagrave

phugrave hợp với tagravei nguyecircn maacutey tiacutenh của tổ chức- Hệ thống nagravey phải được cấu higravenh để caacutec nguồn tagravei nguyecircn phugrave hợp với những

người điều hagravenh chuacuteng

Thagravenh phần phần mềm- Traacutei ngược với phần cứng phần mềm thường được chuyecircn mocircn hoacutea cao cho caacutec

bagravei toaacuten về miền- Sự chuyecircn mocircn hoacutea nagravey thường đạt được bằng caacutech sử dụng thagravenh phần off-the-

shelf cho toagraven bộ EIS vagrave caacutec mocirc-đun tugravey chỉnh để đaacutep ứng nhu cầu cụ thể- Lotus Notes lagrave một viacute dụ điển higravenh Noacute coacute thể được sử dụng một migravenh hoặc coacute

thể phục vụ becircn thứ ba mocirc-đun plug-in

Cocircng nghệ EIS hiện nay

Dobrzeniecki đề xuấtphacircn loạitừng cấptheo bachức năng- Loại 1 sản phẩm bao gồmmột bộ đầy đủcaacutec ứng dụngtừ mộtnhagrave cung cấp- Loại 2 sản phẩm đượcthựchiệnở phần đầu củacaacutecsản phẩmDSS đượcphaacutet triển

bởicugravengmộtnhagrave cung cấp- Loại 3 sản phẩmkết hợp với nhautheo bất kỳ số lượngthuộc sở hữu củacocircng ty

65 Xacircy dựng EIS

- Xacircy dựngmộtEISgiống nhưxacircydựngmột số hệ thống khaacutec củamocirc higravenh hệ thống thocircng tin

- Việcphaacutet triểncấu truacutecnecircn được theo dotildeitừ quaacute trigravenh thiết kế đến quaacute trigravenhthực hiện

- Tuy nhiecircn một dự aacuten phaacutet triển EIScoacute xu hướnglagrave thống nhấtvagraveyecircu cầu hỗ trợ caacutec nhagrave quản lyacute latildenh đạo

- Xacircy dựng một EIScoacute thểphaacutet hiện ra đượccaacutectigravenh huống khoacute khănmagravemột nhagrave phaacutet triển chưabao giờ gặp phải

Mocirc higravenh EIS

Khung phaacutet triển một EIS

- Watson et al đề nghị xacircy dựngkhung với ba thagravenh phần+ Caacutech tiếp cận tập trung vagraveo yếu tốcon người vagrave dữ liệu coacute liecircn quan đến EIS+ Quaacute trigravenh phaacutet triển cần sự linh hoạt vagrave tương taacutec+ Người sử dụng - hệ thống hộp thoại bao gồm một ngocircn ngữ hagravenh động để xử lyacute caacutec lệnh

Lợi iacutech của EIS- Dễ duy trigrave caacutec mục tiecircu coacute tổ chức- Dễ truy xuất thocircng tin- Cho pheacutep người sử dụng nacircng cao hiệu suất hơn

- Tăng chất lượng ra quyết định- Cung cấp sự cải tiến cạnh tranh- Tiết kiệm thời gian của người sử dụng- Tăng khả năng vagrave chất lượng giao tiếp- Cung cấp khả năng điều khiển tốt hơn trong tổ chức- Cho pheacutep tham gia caacutec vấn đề vagrave caacutec cơ hội- Cho pheacutep hoạch định- Cho pheacutep tigravem kiếm nguyecircn nhacircn của một vấn đề- Thảo matilden caacutec yecircu cầu của người điều hagravenh

Hạn chế của EIS vagrave 1 số sai lầm cần traacutenh

- Chi phiacute một cuộc khảo saacutetnăm1991 chothấychi phiacute phaacutet triểntrungbigravenh365000USDvớichi phiacute vận hagravenhhagraveng năm lagrave$200000 (EIS)

- Cocircng nghệ hạn chếEIScần phảiđượctiacutech hợp hoagraven toagravenvagraveokiếntruacuteccủadoanh nghiệphiện tại do đoacute noacutelagrave một thaacutech thứclớn đối vớithiết kế

- Hạn chế tổ chức cơ cấu tổ chứccoacute thể khocircng phugrave hợp

Sự hạn chế về tổ chức- Chương trigravenh nghị sự vagrave thời gian chệch EIS mocirc tả một phần việc thực hiện một

chương trigravenh nghị sự vagrave coacute thể dễ dagraveng đạt được sự tin cậy một caacutech chắc chắn- Đồng bộ hoacutea việc quản lyacute sự tin cậy đuacuteng luacutec đặc biệt baacuteo caacuteo EIS coacute thể phaacute

vỡ sự ổn định thiết lập caacutec chu trigravenh baacuteo caacuteo một caacutech tốt nhất- Sự bất ổn EIS phản ứng nhanh coacute thể gacircy ra việc taacutec động trở lại một caacutech

nhanh choacuteng dẫn đến sự thiếu ổn định trong tổ chức

Sự thất bại lagrave thay thế khocircng thể chấp nhận được- Một số yếu tố lagravem EIS thất bại

+ Thiếu sự hỗ trợ về mặt quản lyacute+ Vấn đề chiacutenh trị+ Thất bại của nhagrave phaacutet triển+ Lỗi về cocircng nghệ+ Giaacute cả+ Thời gian

66 Ra quyết định điều hagravenh trong tương lai vagrave EIS

- Coacute một vagravei điều kiện sẽ được hợp nhất cho việc chuyển đổi cocircng nghệ Trong đoacute một vagravei điều kiện coacute thể dễ dự đoaacuten Hai điều kiện magrave ta coacute thể thấy lagrave+ Phaacutet triển cocircng nghệ maacutey tiacutenh trong việc điều hagravenh sẽ tạo ra sự chuyển đổi được chấp nhận một caacutech dễ dagraveng hơn+ Mở rộng traacutech nhiệm điều hagravenh sẽ mở rộng nhu cầu thocircng tin

Tương lai của EIS- EIS thocircng minh Những tiến bộ trong cocircng nghệ AI sẽ được triển khai trong caacutec

EIS- EIS đa phương tiện Cơ sở dữ liệu đa phương tiện sẽ cho pheacutep tiacutech hợp văn bản

giọng noacutei vagrave higravenh ảnh trong tương lai- EIS thocircng tin Tương lai EIS sẽ mở rộng hơn trong việc sử dụng dữ liệu becircn

ngoagravei doanh nghiệp- EIS kết nối Giao tiếp với băng thocircng rộng cho pheacutep kết nối liecircn thocircng lớn hơn

Chương 7 HỆ CHUYEcircN GIA VAgrave TRIacute TUỆ NHAcircN TẠO

71 Caacutec khaacutei niệm

72 Triacute thocircng minh của triacute tuệ nhacircn tạo

73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia

74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia

75 Lợi iacutech vagrave hạn chế của hệ chuyecircn gia

71 Caacutec khaacutei niệm

Chuyecircn mocircn (Expertise) sự hiểu biết rộng trong 1 lĩnh vực hẹp

Hệ chuyecircn gia (Expert Systems)1 chương trigravenh maacutey tiacutenh sử dụng 1 tập caacutec luật dựa trecircn tri thức của con người để giải quyết caacutec vấn đề đogravei hogravei phải coacute sự chuyecircn mocircn

Một số hệ chuyecircn gia nổi tiếng

DENDRAL (Standford 1960s Edward Feigenbaum)

MYCIN (Standford1970s Edward Shortliffe)

PROSPECTOR (MIT 1979)

Triacute tuệ nhacircn tạo (Artificial Intelligence ndash AI)

Triacute tuệ nhacircn tạo một bộ phacircn của ngagravenh khoa học maacutey tiacutenh quan tacircm đến việc thiết kế caacutec hệ thống maacutey tiacutenh thocircng minh đoacute lagrave caacutec hệ thống đưa ra caacutec đặc điểm magrave từ đoacute chuacuteng ta liecircn hệ với sự thocircng minh trong hagravenh động của con người (Barr vagrave Feigenbaum 1981)

Mục điacutech của AI

Mục điacutech khoa học xaacutec định caacutec gợi yacute để giải thiacutech caacutec loại khaacutec nhau của triacute tuệ thực

Mục điacutech kỹ thuật giải quyết caacutec vấn đề trong thế giới thực

Triacute tuệ nhacircn tạo kế thừa nhiều yacute tưởng quan điểm kỹ thuật từ caacutec ngagravenh khoa học khaacutec

- Triết học

- Logic Toaacuten học

- Tiacutenh toaacuten

- Khoa học tacircm lyacute Khoa học nhận thức

- Sinh học Thần kinh học

- Tiến hoacutea

Caacutec lĩnh vực ứng dụng trong Triacute tuệ nhacircn tạo

Mạng nơ ron thần kinh (Neural Networks)

Tiacutenh toaacuten sự tiến hoacutea

(Evolutionary Computation)

Hệ chuyecircn gia (Expert Systems)

Kỹ thuật xử lyacute tiếng noacutei (Speech Processing)

Kỹ thuật xử lyacute ngocircn ngữ tự nhiecircn

(Natural Language Processing)

Lập kế hoạch (Planning)

Robot (Robotics)

Khoa học higravenh ảnh (Vision)

Caacutec kỹ thuật thocircng dụng dugraveng trong AI

Biểu diễn(Representation)

Học (Learning)

Caacutec luật (Rules)

Tigravem kiếm (Search)

72 Triacute thocircng minh của triacute tuệ nhacircn tạo

Con người suy diễn như thế nagraveo

Phacircn loại (Categorization)

Caacutec quy tắc cụ thể

Heuristics

Kinh nghiệm trước đoacute

Dự tiacutenh trước

Maacutey tiacutenh suy diễn như thế nagraveo

Lập luận dựa trecircn luật IF-THEN mocirc tả tri thức được matilde hoacutea dưới dạng caacutec luật

Caacutec khung (Frames) lagrave caacutec đại diện mocirc tả caacutec tigravenh huống giống nhau lagrave điển higravenh của một vagravei phacircn loại

Lập luận dựa trecircn caacutec trường hợp mocirc phỏng giải phaacutep trước đoacute cho một vấn đề hiện tại

Nhận dạng mẫu phaacutet hiện acircm thanh higravenh dạng hoặc caacutec chuỗi dagravei

Caacutec dạng khaacutec của Triacute tuệ nhacircn tạo

Học maacutey- mạng nơron vagrave giải thuật di truyền

Lập trigravenh tự động ndash lagrave những kỹ thuật tạo ra caacutec chương trigravenh để lagravem 1 nhiệm vụ riecircng biệt (cho pheacutep những người khocircng phải lagrave người lập trigravenh coacute thể lập trigravenh được)

Cuộc sống nhacircn tạo ndash nỗ lực để taacutei tạo caacutec hiện tượng sinh học trong caacutec hệ thống dựa trecircn maacutey tiacutenh

73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia(Expert Systems- ES)

Theo Jackson (1999) Một hệ chuyecircn gia lagrave một chương trigravenh maacutey tiacutenh mocirc tả vagrave suy diễn với tri thức của một vagravei lĩnh vực để giải quyết vấn đề hay đưa ra caacutec lời khuyecircn

Cấu truacutec cơ bản của ES được dựa theo cấu truacutec chung của DSS Sự khaacutec biệt chiacutenh giữa ES vagraveDSS lagrave hệ ES thu thập caacutec kiến thức từ những

chuyecircn gia trong lĩnh vực quan tacircmĐặc trưng của hệ chuyecircn gia Hiệu quả cao Thời gian trả lời thỏa đaacuteng Độ tin cậy cao Dễ hiểu

Giao diện người dugraveng trong ES

Thiết kế giao diện người dugraveng tập trung vagraveo caacutec yếu tố như dễ dagraveng sử dụngcoacute độ tin cậy cao giảm tải những khoacute khăn khi sử dụng

Thiết kế necircn coacute một số tương taacutec (đầu vagraveo kiểm soaacutet vagrave truy vấn)

Cấu tạo giao diện người dugraveng gồm coacute magraven higravenh cảm ứng bagraven phiacutem buacutet saacuteng lệnh thoại caacutec phiacutem chuyecircn dụng

Cơ sở tri thức (Knowledge Base)

Chứa đựng caacutec tri thức cụ thể miền thu được từ caacutec chuyecircn gia miền

Coacute thể chứa caacutec mocirc tả caacutec hagravenh vi giải quyết vấn đề caacutec ragraveng buộc caacutec heuristics

Thagravenh cocircng của một ES dựa trecircn tiacutenh đầy đủ vagrave tiacutenh chiacutenh xaacutec của cơ sở tri thức

Mocirc tơ suy diễn (Inference Engine)

Ở đacircy tri thức được đặt để sử dụng tạo ra caacutec giải phaacutep để giải quyết vấn đề

Mocirc tơ nagravey coacute khả năng thực hiện diễn dịch hoặc suy diễn dựa trecircn caacutec luật hay caacutec caacutec sự kiện

Đồng thời cũng coacute khả năng sử dụng caacutec suy diễn mờ hay khocircng chiacutenh xaacutec dựa trecircn xaacutec suất hay aacutenh xạ mẫu

Vograveng điều khiển suy diễn

1 Aacutenh xạ caacutec luật với caacutec sự kiện đatilde được cho

2 Chọn luật để thực hiện

3 Thực hiện luật bằng caacutech thecircm caacutec sự kiện được suy diễn ra vagraveo bộ nhớ lagravem việc

Chuỗi suy diễn (Chaining)

Suy diễn tiến (forward chaining) maacutey suy diễn bắt đầu từ dữ liệu ban đầu vagrave thực hiện việc suy luận để đưa ra caacutec kết luận cuối cugraveng

Suy diễn lugravei (backward chaining) maacutey suy diễn bắt đầu từ dữ liệu điacutech vagrave tigravem ra tri thức hỗ trợ cho dữ liệu điacutech đoacute

Viacute dụ suy diễn lugravei

R1 Nếu coacute A vagrave B thigrave suy ra coacute D

R2 Nếu coacute B thigrave suy ra coacute C

R3 Nếu coacute C vagrave D thigrave suy ra coacute E

Ta coacute E ta xem trong 3 luật R1 R2 R3 luật nagraveo coacute E ta thấy R3 chứa E đồng thời chứa C vagrave D Xeacutet tiếp trong 2 luật R1 R2 luật nagraveo chứa C vagrave D R2 chứa C R3 chứa D Từ đoacute ta coacute được caacutec tri thức hỗ trợ suy diễn vagrave kết luận lagrave nếu coacute A vagrave B thigrave sẽ coacute E Hay nếu A vagrave B đuacuteng thigrave sẽ coacute E

Viacute dụ suy diễn tiến

Giả sử coacute tập chứa 3 luật sau

R1 Nếu coacute A vagrave B thigrave suy ra coacute D

R2 Nếu coacute B thigrave suy ra coacute C

R3 Nếu coacute C vagrave D thigrave suy ra coacute E

Nếu ta coacute A vagrave B thigrave chuacuteng ta suy ra được D từ R1 vagrave suy ra C từ R2 Với D vagrave C đatilde được suy ra ở trecircn giờ chuacuteng ta suy ra được E từ R3

Viacute dụ thực tế

Giả sử muốn biết magraveu của một con vật nuocirci tecircn lagrave Fred biết rằng noacute kecircu ộp ộp vagrave ăn ruồi

Coacute tập 4 luật ban đầu như sau

R1 Nếu X kecircu ộp ộp vagrave ăn ruồi thigrave X lagrave con ếch

R2 Nếu X kecircu chiecircm chiếp vagrave biết hoacutet thigrave X lagrave con chim

R3 Nếu X lagrave con ếch thigrave X coacute magraveu xanh

R4 Nếu X lagrave con chim thigrave X coacute magraveu vagraveng

74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia

Expert system shells lagrave một tập caacutec goacutei phần mềm vagrave caacutec cocircng cụ dugraveng để phaacutet triển caacutec hệ chuyecircn gia

Những Expert system shells đầu tiecircn thường rất rườm ragrave Mặc dugrave vậy noacute vẫn giuacutep cho người sử dụng sẽ khocircng phải bắt đầu lại từ đầu khi xacircy dựng một hệ chuyecircn gia mới

Những shell hiện đại bao gồm hai mocirc-đun chiacutenh lagrave cocircng cụ xacircy dựng một tập quy tắc vagrave mocirc tơ suy diễn

Xacircy dựng hệ chuyecircn gia

Bước 1 xacircy dựng mocirc higravenh bagravei toaacuten xaacutec định vấn đề nhiệm vụ magrave hệ thống sẽ thực hiện Caacutec dạng bagravei toaacuten cần hệ chuyecircn gia

Bagravei toaacuten diễn giải (InterPretation)

Bagravei toaacuten dự baacuteo (Prediction)

Bagravei toaacuten chuẩn đoaacuten (Diagnose)

Bagravei toaacuten gỡ rối (Debugging)

Bagravei toaacuten thiết kế

Tương tự như một dự aacuten phần mềm để xacircy dựng một hệ chuyecircn gia cần phải coacute caacutec yếu tố về nhacircn lực tagravei nguyecircn vagrave thời gian Những yếu tố nagravey ảnh hưởng đến giaacute thah của một hệ chuyecircn giaTrong phần nagravey cacircu hỏi thường được đặt ra lagrave tại sao cần phải xacircy dựng một hệ chuyecircn giaTrước khi bắt đầu phải xaacute định rotilde bagravei toaacuten đạt ra lagrave jiAi lagrave chuyecircn giaAi lagrave người sử dụng

1 Diễn giải (InterPretation) Nghiecircn cứu 1 vấn đề -gt Dựa trecircn những biểu hiện thuộc tiacutenh đặc trưng becircn ngoagravei -gt Tư vấn

(hoặc đưa ra kết luận hay mocirc tả dễ hiểu từ tập dữ liệu thocirc)

2 Bagravei toaacuten dự baacuteo (Prediction) Coacute thể dự đoaacuten được hagravenh vi kết quả dựa trecircn caacutec hiện tượng -gt dự baacuteo

VD Dự baacuteo thời tiết động đấthellip

3 Bagravei toaacuten chẩn đoaacuten (Diagnoss) Xaacutec định caacutec lỗi caacutec bộ phận hỏng hoacutec của hệ thống dựa trecircn caacutec dữ liệu quan saacutet được

4 Bagravei toaacuten gỡ rối (Debugging) Mocirc tả caacutec phương phaacutep khắc phục hệ thống khi gặp sự cố

5 Bagravei toaacuten thiết kế Lựa chọn cấu higravenh caacutec đối tượng nhằm thoả matilden một số ragraveng buộc nagraveo đoacute

6 Giảng dạy Phần mềm dạy học coacute thể chuẩn đoaacuten vagrave sủa lỗi của học sinh trong quaacute trigravenh học tập

Để xaacutec định đuacuteng bagravei toaacuten magrave chuacuteng ta cần giải quyết thigrave phải trả lời đc một số cacircu hỏi

- cần hệ chuyecircn gia

Bước 2 thu thập tri thức lựa chọn cocircng cụ vagrave aacutep dụng

Trong bước thu thập tri thức vấn đề quan trọng lagrave lựa chọn chuyecircn gia những người magrave sẽ đoacuteng goacutep tri thức cho hệ thống Thocircng thường trong suốt quaacute trigravenh phaacutet triển thigrave chuyecircn gia được xem như một thagravenh viecircn của đội phaacutet triển

Hiện nay coacute rất nhiều cocircng cụ để xacircy dựng một hệ chuyecircn gia Phổ biến nhất lagrave JESS CLIPS vagrave OPS5

Bước 3 Thiết kế cơ sở tri thức thiết kế hệ thốngTri thức được biểu diễn trường minh trong cơ sở tri thức

Caacutec chuyecircn gia vagrave kỹ sư tri thức sẽ đối thoại với nhau bằng caacutec kỹ thuật đối thoại Suy diễn (SD) bảng Mocirc higravenh hoacutea SD quy nạp phacircn loại

Vấn đề bagraveo trigrave vagrave phaacutet triển

Caacutec hệ chuyecircn gia đogravei hỏi phải bảo trigrave vagrave phaacutet triển nhiều hơn so với caacutec hệ thống khaacutec Phải thường xuyecircn bổ sung tri thức mới vagrave thay đổi caacutec tri thức cũ để đổi mới hệ chuyecircn gia

Thu thập vagrave khắc phục lỗi do người sử dụng phaacutet hiện để kịp thời khắc phục những sai soacutet của hệ chuyecircn gia

75 Lợi iacutech vagrave hạn chế của caacutec hệ chuyecircn gia

Một số lợi iacutech chiacutenh

Thời gian trả lời hợp lyacute bằng hoặc nhanh hơn so với chuyecircn gia (người) để đi đến cugraveng một quyết định Hệ chuyecircn gia lagrave một hệ thống thời gian thực (real time system)

Khả năng trả lời với mức độ tinh thocircng bằng hoặc cao hơn so với chuyecircn gia (người) trong cugraveng lĩnh vực

Hệ chuyecircn gia giuacutep cho hiệu quả lagravem việc tăng bằng việc sử dụng tập caacutec luật một caacutech nhanh choacuteng magrave ko bị nhầm lẫn chuyecircn gia lagrave người coacute thể quecircn đi một số tri thức cơ sở lyacute luậ nhưng HCG thigrave ko

Quyết định của một người chuyecircn gia coacute thể bị thay đổi vagrave ko coacute tiacutenh thống nhất như quyết định của một hệ chuyecircn gia tạo ra

Hệ chuyecircn gia giuacutep cho người sử dụng coacute thể trau dồi sự hiểu biết trecircn lĩnh vuej cụ thể magrave noacute giải quyết hỗ trợ người ra quyết định coacute trigravenh độ như 1 chuyecircn gia trong quaacute trigravenh gia quyết định

Kiến thức của rất nhiều chuyecircn gia về một lĩnh vực nagraveo đoacute được đưa vagraveo hệ chuyecircn gia lagravem cho CSTT cuat HCG phong phuacute vagrave rộng lớn hơn rất nhiều

HCG giải thiacutech caacutec bước suy luận một caacutech dễ hiểu nhất quaacuten luacutec nagraveo cũng coacute thể sử dụng ko như chuyecircn gia con người

Hạn chế của caacutec hệ chuyecircn gia

Nhược điểm lớn nhất của hệ chuyecircn gia lagrave những yacute kiến chuyecircn mocircn thường rất khoacute matilde hoacutea vagrave giải neacuten

Hệ chuyecircn gia khocircng coacute khả năng tự học tự cập nhật kiến thức mới như caacutec chuyecircn gia magrave cần phải được matilde hoacutea lại khi noacute được cập nhật

Hệ chuyecircn gia khocircng thể nhận ra được vấn đề khocircng nằm trong miền kiến thức của hệ thống

Chương 8 Tri thức vagrave tiếp nhận

1 Bao gồm caacutec vấn đề

Dữ liệu thực tế đo lường hoặc quan saacutet coacute hoặc khocircng coacute bối cảnh

Thocircng tin dữ liệu được tổng hợp một caacutech hữu iacutech để giải quyết những khoacute khăn trong việc đưa ra quyết định

Tri thức bao gồm caacutec ứng dụng quy tắc thocircng tin hướng dẫn của người ra quyết định

2 Những caacutei nhigraven về tri thức

Đại diện lagravem thế nagraveo để diễn tả tri thức viacute dụ như một quyển saacutech khocircng phải lagrave tri thức nhưng noacute lại lagrave một đại diện của tri thức

Sản xuất tri thức lagrave một tập hơp của hagraveng tồn kho coacute thể được sản xuất cũng như mua lại

Tri thức lagrave 1 trong 6 trạng thaacutei của hệ thống

1Dữ liệu 2Thocircng tin 3Cấu truacutec thocircng tin 4Sự thấu hiểu 5Yacute kiến 6 Quyết định

3 Caacutec loại tri thức Phổ biến mocirc tả dữ liệu thocircng tin thủ tục mọi thứ lagravem như thế nagraveo lập luận chiacutenh saacutech hoặc caacutec quy tắc

4 Thu thập Tri thức hệ chuyecircn gia Hầu hết caacutec phương phaacutep đều bắt đầu với mocirc higravenh của caacutec taacutec vụ trong đoacute

hệ chuyecircn gia được xacircy dựng Trong đoacute mocirc tả về caacutec lĩnh vực được tạo ra Caacutec kỹ sư sử dụng caacutec mocirc higravenh giả thuyết vagrave nhận thức về quaacute trigravenh phacircn

tiacutech để gợi ra caacutech giải quyết vấn đề về tri thức từ caacutec chuyecircn gia

5 Caacutec chiều của thu thập tri thức KE- driven caacutec kỹ sư trao đổi trực tiếp với caacutec chuyecircn gia Expert-driven Caacutec chuyecircn gia trực tiếp đưa chuyecircn mocircn của họ vagraveo hệ

thống maacutey tiacutenh Machine-driven Sử dụng caacutec cocircng cụ suy luận để triacutech xuất tri thức từ một

tập caacutec viacute dụ

6 Kỹ thuật thu thập tri thức Trao đổi gồm 2 loại cơ bản lagrave coacute cấu truacutec(coacute kịch bản) vagrave khocircng coacute cấu

truacutec( đối thoại trực tiếp) Giao thức phacircn tiacutech bằng lời Khi caacutec chuyecircn gia thực hiện một cocircng việc

của họ thigrave một bản ghi về cocircng việc đoacute được thực hiện Caacutec kỹ sư sẽ xacircy dựng mocirc higravenh cho những gigrave được ghi lại trong bản ghi

Phương phaacutep sagraveng lọc caacutec chuyecircn gia so saacutenh caacutec nhoacutem liecircn tiếp trong ba đối tượng vagrave cho biết tại sao nhoacutem thứ hai lại khaacutec nhoacutem thứ ba

7 Thu thập tri thức từ nhiều nguồn Thu thập tri thức từ nhiều nguồn lagrave cần thiết để coacute được đầy đủ caacutec tri thức

cho một vấn đề quan điểm yacute kiến traacutei ngược nhau thường phaacutet sinh Phương phaacutep đồng thuận sẽ giuacutep giải quyết được vấn đề macircu thuẫn Kỹ thuật phacircn tiacutech Meta lagrave kỹ thuật được aacutep dụng trong caacutec trường hợp

khaacutec Caacutech tiếp cận bằng định lượng đogravei hỏi caacutec kỹ sư cần cacircn nhắc yếu tố đầu vagraveo của caacutec chuyecircn gia khaacutec nhau

8 Xaacutec nhận hợp lệ vagrave kiểm tra tri thức Một khi thu thập tri thức noacute phải được đaacutenh giaacute về khả năng sử dụng vagrave độ

chiacutenh xaacutec Hai vấn đề cụ thể lagrave hiệu lực của những kiến thức vagrave kiểm tra việc xacircy dựng cơ sở của tri thức

Cần xaacutec nhận xem liệu hệ thống coacute thể hoạt động ở mức độ tối thiểu khocircng

Xaacutec minh liecircn quan đến việc so saacutenh từng chi tiết kỹ thuật của hệ thống những gigrave đatilde được thực hiện cuối cugraveng

9 Một số caacutec biện phaacutep xaacutec nhận Độ chiacutenh xaacutec Khả năng thiacutech nghi Mức độ đầy đủ Bề rộng Độ sacircu Hiệu lực Tổng quan Chiacutenh xaacutec Hiện thực Độ tin cậy Tiacutenh hữu dụng Mức độ

Chương 9 Học maacutey

1 Logic mờ vagrave ngocircn ngữ mờ(Fuzzy Logic and Linguistic Ambiguity)

Ngocircn ngữ tự nhiecircn gồm những khaacutei niệm mơ hồ vagrave khocircng chiacutenh xaacutectruyền tải ngữ nghĩa thocircng qua tiacutenh xấp xỉkhocircng rotilde ragraveng

Những xấp xỉ nagravey giuacutep con người coacute thể truyền tải hết được yacute nghĩa nhưng maacutey thigrave khocircng hiểu

Lagravem sao biểu diễn caacutec tri thức sử dụng caacutec khaacutei niệm khocircng rotilde ragraveng(mờ) hoặc khocircng chiacutenh xaacutec

2 Khaacutei niệm cơ bản của logic mờ tập mờ lagrave những tập hợp khocircng coacute một giới hạn rotilde Mỗi phần tử của noacute chỉ

chứa một mức độ hagravem liecircn thuộc của từng phần tử Vigrave vậy tập mờ khocircng giống như tập cổ điển Tập mờ coacute thể kết hợp với nhau qua những luật mờ magrave đặc trưng cho những hagravenh động trạng thaacutei vagrave thuộc tiacutenh của logic mờ được tận dụng khi thực hiện một bộ điều khiển mờ

Logic mờ dựa trecircn yacute tưởng mỗi phần tử thuộc vagraveo một tập hợp ở một mức độ nagraveo đấy

Locircgic mờ cho pheacutep độ liecircn thuộc (microA )coacute giaacute trị trong khoảng (01) Locircgic mờ coacute thể được coi lagrave mặt ứng dụng của lyacute thuyết tập mờ để xử lyacute caacutec

giaacute trị trong thế giới thực cho caacutec bagravei toaacuten phức tạp

3 So saacutenh tiacutenh đuacuteng đắn logic mờ vagrave xaacutec suất Xaacutec suất thigrave đề cập đến khả năng xảy ra một biến cố hay một điều gigrave đoacute Logic mờ đề cập đến cấp độ magrave đặc tiacutenh ở hiện tại

o viacute dụ1 người coacute chiều cao 6 feet thigrave coacute cấp độ lagrave 05 về chiều cao

4 Ưu điểm của logic mờ Caacutech tiếp cận rất tự nhiecircnkhocircng phức tạp Coacute thể mocirc higravenh hoacutea caacutec hagravem phi tuyến tugravey yacute phức tạp

Coacute thể tận dụng được kinh nghiệm từ những chuyecircn gia hagraveng đầu trong mọi lĩnh vực

Logic mờ được xacircy dựng dựa trecircn ngocircn ngữ tự nhiecircnNền tảng của logic mờ lagrave dựa trecircn cơ sở giao tiếp của con người

5 Nhược điểm của logic mờ Trong 1 hệ thống phức tạpsử dụng logic mờ coacute thể trở thagravenh trở ngại cho

việc xaacutec thực độ tin cậy của hệ thống Cơ chế lập luận mờ khocircng thể học hỏi từ những lỗi sai

6 Mạng noron nhacircn tạo(ANN) Mạng noron nhacircn tạo lagrave một mocirc phỏng xử lyacute thocircng tinđược nghiecircn cứu ra

từ hệ thống thần kinh của sinh vậtgiống như bộ natildeo để xử lyacute thocircng tin ANNs lagrave chương trigravenh dựa trecircn maacutey tiacutenh đơn giản coacute chức năng lagrave một mocirc

higravenh bagravei toaacuten khocircng gian dựa trecircn thử nghiệm vagrave baacuteo lỗi

7 Học từ kinh nghiệm Tiến trigravenh Một mẫu dữ liệu được biểu diễn như một mạng lưới noronANN ldquodự

đoaacutenrdquo 1 đầu radự đoaacuten được so saacutenh với giaacute trị thực tế hoặc giaacute trị chiacutenh xaacutecNếu đoaacuten được chiacutenh xaacutec thigrave khocircng coacute hagravenh động nagraveo được thực hiện

Nếu dự đoaacuten sai ANN kiểm tra lại vagrave xaacutec định lại thocircng số để điều chỉnh Một mẫu dữ liệu khaacutec được biểu diễn vagrave quaacute trigravenh nagravey được lặp lại

8 Nguyecircn tắc cơ bản của cocircng nghệ nơron Caacutec yếu tố xử lyacute cơ bản trong hệ thống thần kinh của con người lagrave tế bagraveo

thần kinhMạng lưới của tế bagraveo nagravey lagrave liecircn kết với nhau nhận được thocircng tin từ caacutec cảm biến trong mắt taihellip

Thocircng tin nhận được bởi tế bagraveo thần kinh hoặc lagrave sẽ kiacutech thiacutech noacute(sẽ được chuyển qua 1 thocircng điệp dọc theo mạng lưới) hoặc lagrave sẽ ngăn cản noacute(ngăn cản dograveng thocircng tin)

Độ nhạy coacute thể thay đổi qua thời gian hoặc sau khi coacute được kinh nghiệm

9 Cấu truacutec mạng Một ANN gồm 3 lớp cơ bản

Lớp đầu vagraveo nhận dữ liệu Lớp becircn trong hoặc lagrave lớp ẩn xử lyacute dữ liệu Lớp đầu ra chuyển tiếp kết quả cuối cugraveng của mạng

10Mạng nơ ron Thường coacute nhiều đầu vagraveo mỗi đầu vagraveo với mức ảnh hưởng vagrave tầm quan

trọng riecircng của noacute Một đầu vagraveo quan trọng coacute thể được sử dụng để khuếch đại đầu ra caacutec hagravem trạng thaacutei tổng hợp caacutec trọng số của caacutec yếu tố

đầuvagraveo khaacutec nhauvagraveo một giaacute trị duy nhất Caacutec hagravem chuyển giao xử lyacute caacutec giaacute trị trạng thaacutei vagrave tạo đầu ra

11Huấn luyện mạng nơ ron Trong mocirc higravenh coacute giaacutem saacutetANN được đến so saacutenh dự đoaacuten của chiacutenh

noacute với thocircng tin phản hồi coacute chứa caacutec kết quả mong muốn ANN sẽ phải tigravem caacutech thay đổi caacutec tham số becircn trong củamigravenh (caacutec trọng số vagrave caacutec ngưỡng) để tạo necircn một aacutenh xạ coacute khả năng aacutenh xạcaacutec đầu vagraveo thagravenh caacutec đầu ra mong muốn Sự thay đổi nagravey được tiến hagravenh nhờ việc so saacutenh giữa đầu ra thực sự vagrave đầu ra mong muốn

Trong mocirc higravenh khocircng coacute giaacutem saacutetANN nhận được dữ liệu vagraveo nhưng khocircng phải coacute bất kỳ thocircng tin phản hồi về kết quả mong muốn

Phần lớn caacutec ứng dụng nằm trong vugraveng của caacutec bagravei toaacuten ước lượng như mocirc higravenh hoacuteathống kecirc neacuten lọc phacircn cụm

12Lợi iacutech Liecircn kết với mạng noron Traacutenh caacutech lập trigravenh tường minh Giảm nhu cầu của chuyecircn gia ANNs thigrave thiacutech nghi với caacutec yếu tố đầu vagraveo thay đổi Khocircng cần thiết cho cơ sở tri thức tinh chế ANNs coacute tiacutenh động vagrave cải thiện với việc sử dụng Coacute khả năng xử lyacute dữ liệu khocircng chiacutenh xaacutec hoặc khocircng đầy đủ Cho pheacutep tổng quaacutet hoacutea từ thocircng tin cụ thể Cho pheacutep thu thập cảm giaacutec thocircng thường vagraveo miền giải quyết vấn đề

13Hạn chế của việc liecircn kết với mạng noron ANNs khocircng thể giải thiacutech được suy luận Bản chất hộp đen thường khiến cho vấn đề traacutech nhiệm vagrave độ tin cậy phaacutet

sinh lagrave khoacute khăn Lặp đi lặp lại quaacute trigravenh huấn luyện rất tốn thời gian Nguồn lực caacutec nhagrave phacircn tiacutech vagrave thiết kế coacute tay nghề cao vẫn lagrave đaacuteng lo

ngại Cocircng nghệ ANN thuacutec đẩy hạn chế của phần cứng hiện tại ANN yecircu cầu phải coacute sự tin tưởng ở đầu ra

14Giới thiệu về thuật toaacuten di truyền Cũng như mạng lưới thần kinh caacutec thuật toaacuten di truyền được dựa trecircn lyacute

thuyết sinh học Thuật toaacuten di truyền tigravem thấy nguồn gốc của chuacuteng trong caacutec lyacute thuyết

tiến hoacutea của chọn lọc tự nhiecircn vagrave thiacutech ứng với biến đổi khiacute hậu Kết quả thuật toaacuten di truyền lagrave từ giao phối 2 caacute thể trong quần thế để tạo

ra con caacutei đocirci khi tốt hơn so với bậc cha mẹ của chuacuteng 15Caacutec thagravenh phần cơ bản của thuật toaacuten di truyền

Toaacuten tử chọn lọc Caacutec caacute thể tốt được chọn lọc để đưa vagraveo thế hệ sau Sự chọn lọc nagravey căn cứ vagraveo độ thiacutech nghi với mocirci trường của mỗi caacute thể

Toaacuten tử lai gheacutep (crossover) Hai caacute thể cha vagrave mẹ trao đổi caacutec gen với nhau để tạo ra caacute thể con

Toaacuten tử đột biến (mutation) Một caacute thể thay đổi một số gen để biến đổi thagravenh một caacute thể mớiTất cả caacutec toaacuten tử trecircn khi thực hiện đều mang tiacutenh ngẫu nhiecircn

16Quaacute trigravenh cơ bản của một thuật toaacuten di truyền Khởi tạo

Đaacutenh giaacute quần thể

Lựa chọn NST thiacutech hợp nhất vagrave loại bỏ NST yếu nhất

Quy trigravenh giao nhau vagrave cải thiện quần thể

đột biến tiến trigravenh để khaacutem phaacute ra NST mới

17Ưu nhược điểm của việc kết hợp với thuật toaacuten di truyền Kiacutech thước quần thể lagrave 1 yếu tố quan trọng trong tốc độ của việc tigravem

kiếmnhưng noacute tương đối dễ dagraveng để dự đoaacuten tốc độ nagravey Giao nhau hoặc đột biến lagrave khocircng necircn đc sử dụng quaacute thường xuyecircn Luocircn coacute được iacutet nhất 1 giải phaacutep hợp lyacute Necircn coacute thể aacutep dụng chuacuteng cho caacutec vấn đề magrave chuacuteng ta khocircng coacute hướng

về caacutech giải quyết Sức mạnh của thuật toaacuten xuất phaacutet từ khaacutei niệm đơn giảnkhocircng phải từ

một thủ tục thuật toaacuten phức tạp 18Tương lai của học maacutey

Mạng lưới thần kinh nhacircn tạo vượt quaacute năng lực của con người trong caacutec trường hợp bị cocirc lập

Về mặt lyacute thuyếtmột maacutey tiacutenh coacute thể xử lyacute dũ liệu nhanh hơn hagraveng triệu lần so với 1 con người

May mắn thay cho chuacuteng tacon người tốt hơn nhiều khi magrave coacute được dữ liệumaacutey tiacutenh khocircng coacute 1 số thứ như lagrave 5 giaacutec quan

CHƯƠNG 10 KHO DỮ LIỆU

1 Kho dữ liệu Kho dữ liệu lagrave tuyển tập caacutec cơ sở dữ liệu tiacutech hợp hướng chủ đề được

thiết kế để trợ giuacutep cho một hệ hỗ trợ quyết định

Theo John Ladley Cocircng nghệ kho dữ liệu lagrave tập caacutec phương phaacutep kỹ thuật vagrave caacutec cocircng cụ coacute thể kết hợp hỗ trợ nhau để cung cấp thocircng tin cho người sử dụng trecircn cơ sở tiacutech hợp từ nhiều nguồn dữ liệu nhiều mocirci trường khaacutec nhau

Kho dữ liệu thường rất lớn tới hagraveng trăm GB hay thậm chiacute hagraveng Terabyte

2 Kho dữ liệu vận hagravenh (ODS) Một kho dữ liệu vận hagravenh Aacutep dụng kỹ thuật kho dữ liệu vagraveo caacutec hệ xử

lyacute giao taacutec lưu trữ dữ liệu cho một ứng dụng đặc thugrave Noacute đưa vagraveo kho dữ liệu một dograveng caacutec dữ liệu thocirc được thiết kế

3 So saacutenh

Kho dữ liệu vận hagravenh Kho dữ liệu

Dữ liệu theo chủ đề Dữ liệu theo chủ đề

Dữ liệu tiacutech hợp Dữ liệu tiacutech hợp

Dữ liệu thay đổi Dữ liệu khocircng thay đổi

Dữ liệu được cập nhật khi thay đổi

Dữ liệu giữ nguyecircn

Chỉ coacute dữ liệu hiện tạiDữliệu hiện tại vagrave dữ liệu lịch sử

Chu kỳ lagravem tươi dữ liệu ngắn Chu kỳ lagravem tươi dữ liệu dagravei

Chỉ coacute dữ liệu chi tiết Dữ liệu chi tiết vagrave dữ liệu tổng kết

Dugraveng cho caacutec quyết định ngắn hạn

Dugraveng cho hoạch định dagravei hạn

4 Kho dữ liệu cục bộ (Data Mart - DM)

Kho dữ liệu cục bộ lagrave CSDL coacute những đặc điểm giống với kho dữ liệu nhưng với quy mocirc nhỏ hơn vagrave lưu trữ dữ liệu về một lĩnh vực một chuyecircn ngagravenh

Data mart phụ thuộc Chứa những dữ liệu được lấy từ DW vagrave những dữ liệu nagravey sẽ được triacutech lọc vagrave tinh chế tiacutech hợp lại ở mức cao hơn để phục vụ một chủ đề nhất định của Datamart

Data mart độc lập Khocircng giống như Datamart phụ thuộc Data mart độc lập được xacircy dựng trước DW vagrave dữ liệu được trực tiếp lấy từ caacutec nguồn khaacutec nhau

5 Siecircu dữ liệu Metadata lagrave dữ liệu để mocirc tả dữ liệu Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột

một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi Metadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu

6 Mocirci trường kho dữ liệu Hệ thống của tổ chức vagrave kho cung cấp dữ liệu để xacircy dựng kho dữ liệu Trong quaacute trigravenh chuyển dữ liệu từ caacutec nguồn khaacutec nhau dữ liệu coacute thể

được lagravem sạch hoặc chuyển đổi vagrave vigrave thế DW được xem như lagrave một chuẩn cho việc lưu trữ

Đồng thời siecircu dữ liệu được ghi lại Cuối cugraveng DW hoặc siecircu thị coacute thể được sử dụng để tạo ra một kho dữ

liệu ldquocaacute nhacircnrdquo 7 Caacutec đặc điểm của kho dữ liệu

Đặc điểm Mocirc tả

Hướng chủ đề - DL tổ chức theo caacutech thức người dugraveng tham chiếu

Tiacutech hợp - Dữ liệu ldquosạchrdquo loại bỏ tiacutenh thiếu nhất quaacuten

Khocircng thay đổi - DL ldquochỉ đọcrdquo người dugraveng khocircng thay đổi được

Chuỗi thời gian - DL lagrave chuỗi thời gian khocircng phải lagrave trạng thaacutei hiện tại

Được tổng kết - DL vận hagravenhthao taacutec khi cần thiết

được kết hợp lại thagravenh dạng coacute thể dugraveng được cho quyết định

Kiacutech cỡ lớn hơn - Lưu giữ theo chuỗi thời gian tức lagrave giữ lại nhiều DL

Khocircng được chuẩn hoacutea - Coacute thể dư thừa DLSiecircu dữ liệu - Dữ liệu của dữ liệu được lưu trữNguồn dữ liệu - DL vận hagravenh (caacutec hệ sẵn coacute) cugraveng

với caacutec nguồn ngoagravei 8 Kho dữ liệu hướng chủ đề

Hướng chủ để coacute nghĩa lagrave kho dữ liệu được tổ chức xung quanh caacutec chủ đề chiacutenh như khaacutech hagraveng sản phẩm sản xuất Tập trung vagraveo việc mocirc higravenh hoacutea vagrave phacircn tiacutech dữ liệu cho caacutec nhagrave ra quyết định magrave khocircng tập trung vagraveo caacutec xử lyacute thocircng thường Cung cấp cho người dugraveng một khung nhigraven toagraven vẹn đơn giản vagrave đầy đủ về caacutec sự kiện quanh caacutec chủ đề

9 Dữ liệu trong DW được tiacutech hợp Dữ liệu trong kho dữ liệu được xacircy dựng bằng caacutech tổng hợp dữ liệu từ

nhiều nguồn khaacutec nhau vagrave caacutec nguồn coacute tổ chức khaacutec nhau Cơ sở dữ liệu caacutec file excel caacutec flat file hoặc caacutec raw file Khi đưa vagraveo kho dữ liệu caacutec dữ liệu được lagravem sạch vagrave tiacutech hợp dữ liệu nhằm đảm bảo tiacutenh nhất quaacuten của dữ liệu

10Kiến truacutec kho dữ liệu Tầng cơ sở dữ liệu hoạt động Tầng truy xuất thocircng tin Tầng truy xuất dữ liệu Tầng siecircu dữ liệu Tầng quản lyacute tiến trigravenh Tầng thocircng điệp của ứng dụng Tầng vật liacute của kho dữ liệu Tầng trigravenh diễn dữ liệu

11Higravenh trạng kho dữ liệu Kho dữ liệu ảo - người dugraveng cuối coacute thể truy cập trực tiếp đến kho dữ liệu

sử dụng caacutec cocircng cụ cho pheacutep ở tầng truy xuất dữ liệu Kho dữ liệu trung tacircm-1 cơ sở dữ liệu vật lyacute chứa tất cả dữ liệu cho một

vugraveng chuyecircn dụng nagraveo đoacute

Kho dữ liệu phacircn taacuten- Thagravenh phần được phacircn taacuten qua nhiều hệ cơ sở dữ liệu vật lyacute

12METADATA- Siecircu dữ liệu Định nghĩa Siecircu dữ liệu lagrave dữ liệu về dữ liệu Lagrave 1 lưu trữ dugraveng để

Miecircu tả kho dữ liệu tổng thể Nhận dạng kiểu kho dữ liệu Quản liacute quaacute trigravenh tiacutech hợp dữ liệu Quản liacute quaacute trigravenh cập nhật kho dữ liệu Quản liacute bảo mật

Lagrave chigravea khoacutea quyết định sự thagravenh cocircng của kho dữ liệu luocircn được thay đổi vagrave cập nhật theo sự phaacutet triển của kho dữ liệu

Dugraveng để quản liacute điều khiển kho dữ liệu Sự ra đời của kho dữ liệu như 1 cấu truacutec hỗ trợ ra quyết định siecircu dữ liệu

được xem như nguồn tagravei nguyecircn dữ liệu Siecircu dữ liệu lagrave trừu tượng Chuacuteng lagrave dữ liệu bậc cao cung cấp mocirc tả ngắn

gọn caacutec dữ liệu bậc thấp hơn 13Hoạt động của Siecircu dữ liệu

Siecircu dữ liệu rất cần thiết trong việc chuyển hoacutea thocircng tin trở thagravenh tri thức Lagrave chigravea khoacutea giuacutep chuacuteng ta xử lyacute được dữ liệu thocirc Viacute dụ một dograveng dữ liệu baacuten hagraveng 1023 K596 11121 agraveNoacute sẽ khocircng coacute nghĩa gigrave cho đến khi chuacuteng ta đưa vagraveo siecircu dữ liệu (thư

mục chứa dữ liệu) agrave cửa hagraveng 1023 sản phẩm K596 vagrave số tiền baacuten được lagrave 11121 đocirc la

14Sự cần thiết phải nhất quaacuten trong kho dữ liệu Kho dữ liệu được xacircy dựng cho lợi iacutech của những nhagrave phacircn tiacutech kinh

doanh caacutec nhagrave quản trị cho tất cả caacutec khu vực chức năng Trong cơ sở dữ liệu riecircng caacutec khu vực khaacutec nhau coacute thể định nghĩa vagrave lưu

trữ dữ liệu thocircng qua phiecircn bản của chiacutenh noacute Khi dữ liệu được lấy từ những vugraveng khaacutec nhau đoacute vagrave được đặt vagraveo kho dữ

liệu Việc chuyển đổi vagrave lagravem sạch caacutec tiến trigravenh sẽ đảm bảo noacute lagrave duy nhất được tiacutech hợp tại một mức của tổ chức

15Ragrave soaacutet lại dữ liệu ndash Thực thi siecircu dữ liệu

Bất kể cấu truacutec tự nhiecircn của 1 cacircu truy vấn thế nagraveo thigrave caacutec thagravenh phần của siecircu dữ liệu rất quan trọng đối với người ra quyết định

Bảng thuộc tiacutenh khoacutea được lưu trữ bởi kho dữ liệu Tập hợp dữ liệu được lấy từ đacircu Những chuyển đổi nagraveo được thực thi với việc lagravem sạch

16Siecircu dữ liệu lagrave gigrave Metadata - lagrave thocircng tin mocirc tả nội dung của cơ sở dữ liệu (CSDL) Metadata baacuteo cho người dugraveng biết thời gian cập nhật sau cugraveng của dữ liệu

định dạng vagrave mục điacutech sử dụng của noacute Những thocircng tin nagravey coacute thể hướng dẫn người dugraveng duyệt qua CSDL vagrave

giuacutep họ hiểu được yacute nghĩa vagrave ngữ cảnh của dữ liệu Trong CSDL metadata lagrave caacutec dạng biểu diễn khaacutec nhau của caacutec đối tượng

trong CSDL Trong CSDL quan hệ metadata lagrave caacutec định nghĩa của bảng cột CSDL

view vagrave nhiều đối tượng khaacutec Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột

một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi -gtMetadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu

Bảng chuyển đổi Ghi lại những chuyển đổi đatilde được thực hiện

Lịch sử thực thi Ghi lại những dữ liệu đatilde được

phacircn tiacutech

Higravenh thaacutei kết nốiGhi lại những dữ liệu được kết nối vagrave tần suất

17Aacutenh xạ thocircng thường của siecircu dữ liệu Bản ghi aacutenh xạ chuyển đổi bao gồm

Định danh của nguồn gốc Chuyển đổi thuộc tiacutenh Chuyển đổi thuộc tiacutenh vật lyacute Matilde hoacutea tham chiếu bảng chuyển đổi Đổi tecircn Đổi khoacutea Gaacuten giaacute trị cho thuộc tiacutenh mặc định Chọn logic cho caacutec nguồn nhiều giaacute trị Đổi thuật toaacuten

18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để

phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai

lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave

tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec

Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm

Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo

19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua

caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau

SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được

Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra

một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức

Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ

Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ

Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech

CHƯƠNG 11 KHAI PHAacute DỮ LIỆU

1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn

ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993

Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng

2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd

1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều

2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP

3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn

4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng

5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server

6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo

7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động

8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời

9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều

10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện

11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech

12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP

3 Xử lyacute phacircn tiacutech trực tuyến OLAP

MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave

dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu

ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave

thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu

HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave

ROLAP4 Khai phaacute dữ liệu

Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh

khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn

Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan

5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp

6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại

Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp

Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec

Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt

Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra

Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh

vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho

Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec

Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm

Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục

Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng

gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp

Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn

Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec

Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper

Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2

Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25

Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước

Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng

Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện

trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp

Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute

độ hỗ trợ ge ngưỡng minsup

độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan

Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn

Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết

Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu

MOLAP ROLAP HOLAP

Lưu trữ dữ liệu cơ sở

Khối Bảng quan hệ Bảng quan hệ

Lưu trữ thocircng tin tổng hợp

Khối Bảng quan hệ Khối

Hiệu suất thực hiện truy vấn

Nhanh nhất Chậm nhất Nhanh

Tiecircu thụ khocircng gian lưu trữ

Nhiều Thấp Trung bigravenh

Chi phiacute bảo trigrave Cao Thấp Trung bigravenh

Page 13: De cuong(1-11)

bull Quy hoạch toaacuten học (mathematical programming) lagrave họ caacutec cocircng cụ giải quyết caacutec bagravei toaacuten quản lyacute theo đoacute người ra quyết định phải cấp phaacutet caacutec tagravei nguyecircn khan hiếm cho caacutec hoạt động cạnh tranh nhau (caacutec phương aacuten) nhằm tối ưu hoacutea mục tiecircu coacute khả năng đo lường được bull Caacutec mocirc higravenh quy hoạch tuyến tiacutenh (linear programming) thocircng dụng nhất trong quy hoạch toaacuten coacute nhiều ứng dụng trong thực tế được dugraveng nhiều trong caacutec hệ hỗ trợ quyết định bull Bagravei toaacuten quy hoạch tuyến tiacutenh 1048713 Caacutec biến quyết định (cần tigravem giaacute trị) 1048713 Hagravem mục tiecircu (hagravem toaacuten học dạng tuyến tiacutenh xaacutec định quan hệ giữa biến quyết định vagrave mục tiecircu đo lường mức độ đạt đạt mục tiecircu vagrave cần được tối ưu hoacutea) 1048713 Caacutec hệ số của hagravem mục tiecircu (cho biết mức đoacuteng goacutep vagraveo mục tiecircu của 1 đơn vị biến quyết định) 1048713 Ragraveng buộc (biểu thức tuyến tiacutenh cho biết giới hạn tagravei nguyecircn vagravehay caacutec quan hệ giữa caacutec biến số) 1048713 Dung lượng (mocirc tả cận trecircn vagrave dưới của caacutec biến vagrave ragraveng buộc) 1048713 Hệ số (cocircng nghệ) vagraveo-ra (cho biết mức độ sử dụng tagravei nguyecircn của biến quyết định) bull Đặc điểm của bagravei toaacuten quy hoạch tuyến tiacutenh 1048713 Tagravei nguyecircn kinh tế của bagravei toaacuten lagrave coacute hạn vagrave sẵn sagraveng 1048713 Coacute nhiều caacutech (gt2 caacutech) sử dụng tagravei nguyecircn được gọi lagrave giải phaacutep hay chương trigravenh 1048713 Mỗi hoạt động dugraveng tagravei nguyecircn đều sinh ra kết quả dưới dạng mục tiecircu đatilde phaacutet biểu trước 1048713 Việc cấp phaacutet nằm trong caacutec ragraveng buộc cho trước bull Giả định của bagravei toaacuten quy hoạch tuyến tiacutenh 1048713 Caacutec kết quả của caacutec cấp phaacutet coacute thể đem so saacutenh với nhau coacute thể đo lường bằng một đơn vị chung

1048713 Caacutec cấp phaacutet độc lập với nhau về mặt kết quả 1048713 Kết quả cuối cugraveng lagrave tổng của caacutec kết quả từ caacutec hoạt động riecircng rẽ khaacutec nhau 1048713 Dữ liệu coacute tiacutenh chắc chắn 1048713 Tagravei nguyecircn được dugraveng một caacutech kinh tế nhất 1048713 Thường coacute một số lớn caacutec giải phaacutep với kết quả khaacutec nhau 1048713 Trong số caacutec giải phaacutep coacute thể coacute 1 giải phaacutep tốt nhất ndash mức độ đạt được mục tiecircu cao nhất ndash gọi lagrave giải phaacutep tối ưu được tigravem ra bằng một giải thuật đặc biệt MOcirc HIgraveNH HOacuteA BẰNG HEURISTIC bull Việc tigravem giải phaacutep tối ưu của một số bagravei toaacuten quyết định phức tạp coacute thể tốn nhiều thời gian chi phiacute hay khocircng thể tigravem ra được Cograven nếu dugraveng tiếp cận mocirc phỏng cũng coacute thể keacuteo dagravei phức tạp khocircng thiacutech hợp hay thậm chiacute khocircng chiacutenh xaacutec

bull Lagrave một tiếp cận giuacutep tigravem ra caacutec giải phaacutep khả thithỏa matildenđủ tốt cho caacutec bagravei toaacuten phức tạp Coacute thể coacute giải phaacutep đủ tốt (90-999 giaacute trị của lời giải tối ưu) nhanh choacuteng vagrave đỡ tốn keacutem hơn bằng caacutech dugraveng heuristics bull Quaacute trigravenh heuristic lagrave datildey caacutec bước xacircy dựng caacutec quy luật giải quyết vấn đề thocircng qua việc tigravem kiếm caacutec con đường hứa hẹn nhất dẫn đến lời giải tigravem kiếm caacutech thức thu thập vagrave phacircn giải thocircng tin theo quaacute trigravenh giải vagrave phaacutet triền caacutec phương phaacutep dẫn đến một giải thuật tiacutenh toaacuten hay một lời giải tổng quaacutet đatilde coacute bull Aacutep dụng chủ yếu cho bagravei toaacuten cấu truacutec yếu cũng dugraveng để tigravem ra giải phaacutep chấp nhận được cho bagravei toaacuten cấu truacutec chặt bull Khocircng đủ tổng quaacutet như caacutec giải thuật thường chỉ dugraveng cho tigravenh huống đặc thugrave đang xeacutet bull Coacute thể dẫn đến một giải phaacutep dở - caacutec thủ tục từng bước giải quyết vấn đề khocircng đảm bảo tigravem ra giải phaacutep tối ưu bull Heuristic coacute thể lagrave định lượng vigrave vậy coacute thể đoacuteng vai trograve quan trọng trong cơ sở mocirc higravenh của hệ hỗ trợ quyết định bull Heuristic coacute thể lagrave định tiacutenh vigrave vậy coacute thể đoacuteng vai trograve quan trọng trong cung ứng kiến thức cho hệ chuyecircn gia bull Quaacute trigravenh heuristic liecircn quan đến tigravem kiếm học tập ước lượng phacircn xử vagrave lặp lại caacutec hoạt động nagravey dọc theo tiến trigravenh bull Kiến thức thu được dugrave thagravenh cocircng hay thất bại trong quaacute trigravenh đều được phản hồi vagrave sửa đổi chiacutenh quaacute trigravenh nhờ đoacute coacute thể định nghĩa lại mục tiecircu hay bagravei toaacuten 1048713 Giải thuật di truyền bắt đầu bằng tập caacutec giải phaacutep được sinh ngẫu nhiecircn taacutei kết hợp caacutec cặp giải phaacutep một caacutech ngẫu nhiecircn bull Tigravenh huống necircn dugraveng heuristics 1048713 Dữ liệu đầu vagraveo khocircng chiacutenh xaacutec hay coacute giới hạn 1048713 Thực tế quaacute phức tạp đến nỗi khocircng dugraveng được caacutec mocirc higravenh tối ưu 1048713 Chưa coacute được giải thuật chiacutenh xaacutec vagrave đủ tin cậy 1048713 Bagravei toaacuten phức tạp necircn sẽ khocircng kinh tế nếu dugraveng tối ưu hay mocirc phỏng hoặc tốn quaacute nhiều thời gian tiacutenh toaacuten 1048713 Coacute thể cải thiện tiacutenh hiệu quả của quaacute trigravenh tối ưu (tức coacute thể sinh ra caacutec giải phaacutep ban đầu tương đối tốt) 1048713 Liecircn quan đến xử lyacute kyacute hiệu chứ khocircng phải xử lyacute kyacute số (như hệ chuyecircn gia) 1048713 Cần coacute quyết định nhanh vagrave caacutec xử lyacute dựa vagraveo maacutey tiacutenh đều khocircng khả thi (một số heuristic khocircng cần đến maacutey tiacutenh) bull Thuận lợi 1048713 Dễ hiểu dễ giải thiacutech vagrave dễ cagravei đặt 1048713 Nacircng cao tiacutenh saacuteng tạo vagrave năng lực heuristic cho caacutec vấn đề khaacutec 1048713 Tiết kiệm thời gian xaacutec lập vấn đề 1048713 Tiết kiệm yecircu cầu về bộ chứa vagrave xử lyacute maacutey tiacutenh

1048713 Tiết kiệm thời gian tiacutenh toaacuten vagrave do vậy tiết kiệm thời gian thực trong ra quyết định Một số vấn đề phức tạp đến nỗi chỉ coacute thể giải được bằng heuristics 1048713 Thường sinh ra nhiều giải phaacutep chấp nhận được 1048713 Thường coacute thể phaacutet biểu lyacute thuyết hay đo lường thực nghiệm về chất lượng của giải phaacutep (tức giaacute trị mục tiecircu của giải phaacutep gần với giaacute trị tồi ưu đến mức nagraveo dugrave giaacute trị tối ưu chưa biết được) 1048713 Coacute thể kết hợp tiacutenh thocircng minh vagraveo để hướng dẫn pheacutep tigravem kiếm (tigravem kiếm tabu) Năng lực thocircng minh đoacute coacute thể lagrave đặc thugrave theo bagravei toaacuten hoặc dựa trecircn yacute kiến chuyecircn gia được cấy trong hệ chuyecircn gia hoặc cơ chế tigravem kiếm 1048713 Coacute thể dugraveng heuristic hiệu quả vagraveo caacutec mocirc higravenh coacute thể giải bằng quy hoạch toaacuten học Đocirci khi heuristic lagrave phương phaacutep được ưa thiacutech hơn khi khaacutec giải phaacutep heuristics được dugraveng như giải phaacutep ban đầu cho caacutec phương phaacutep quy hoạch toaacuten học bull Hạn chế 1048713 Khocircng đảm bảo coacute được giải phaacutep tối ưu 1048713 Caacutec quy luật coacute rất nhiều ngoại lệ 1048713 Caacutec lựa chọn quyết định tuần tự coacute thể khocircng tiecircn đoaacuten được caacutec kết cục tương lai của mỗi chọn lựa 1048713 Sự liecircn thuộc giữa caacutec phần trong hệ thống đocirci khi coacute thể gacircy ra caacutec ảnh hưởng lớn lao lecircn toagraven hệ thống bull Phacircn loại caacutec giải thuật heuristic 1048713 Heuristic xacircy dựng xacircy dựng giải phaacutep khả thi bằng caacutech cộng thecircm từng thagravenh phần một VD bagravei toaacuten người baacuten hagraveng ndash luocircn gheacute thagravenh phố chưa viếng thăm kế tiếp gần nhất

1048713 Heuristic cải tiến bắt đầu bằng một giải phaacutep khả thi vagrave cố gắng cải tiến liecircn tục trecircn đoacute VD trecircn thử hoaacuten đổi 2 thagravenh phố 1048713 Quy hoạch toaacuten aacutep dụng vagraveo caacutec mocirc higravenh chứa iacutet ragraveng buộc nhằm coacute được thocircng tin về thỏa hiệp tốt nhất với mocirc higravenh nguyecircn gốc Thường được dugraveng trong tối ưu hoacutea nguyecircn (integer optimization) 1048713 Chia giai đoạn giải quyết một vấn đề theo từng giai đoạn VD ở PampG trecircn đacircy bagravei toaacuten phacircn phối được giải quyết trước sau đoacute dugraveng giải quyết bagravei toaacuten chiến lược sản phẩm 1048713 Phacircn ratilde chia bagravei toaacuten thagravenh caacutec phần nhỏ hơn coacute thể giải quyết được sau đoacute kết hợp caacutec giải phaacutep đoacute lại VD chia latildenh thổ baacuten hagraveng thagravenh 4 vugraveng khaacutec nhau giải quyết cho từng vugraveng sau đoacute kết nối caacutec giải phaacutep

21Mocirc phỏngbull Giả định caacutec đặc điểm của thực tạibull Lagrave kỹ thuật tiến triển caacutec thực nghiệm (như phacircn tiacutech ldquowhat-ifrdquo) - bằng maacutey tiacutenh -trecircn một mocirc higravenh của hệ thocircng tin quản lyacute

bull Khocircng thực sự lagrave một mocirc higravenh vigrave khocircng biểu diễn thực tại magrave lagrave cố gắng bắtchước thực tạibull Một trong những phương phaacutep thocircng dụng nhất trong HHTQĐbull HHTQĐ lagravem việc với caacutec bagravei toaacuten phi cấu truacutec vagrave cấu truacutec yếu tigravenh huống thực tếphức tạp ndash khocircng dễ biểu diễn bằng mocirc higravenh tối ưu hay caacutec dạng mocirc higravenh khaacutecnhưng lại thường coacute thể xử lyacute được bằng mocirc phỏngbull Đặc điểm1048713 Iacutet đưa ra caacutec đơn giản hoacutea về thực tại hơn caacutec mocirc higravenh khaacutec1048713 Do triển khai caacutec thực nghiệm necircn noacute coacute thể kiểm thử caacutec giaacute trị cụ thể của caacutecbiến quyết địnhbiến khocircng kiểm soaacutet được của mocirc higravenh vagrave xem xeacutet ảnh hưởnglecircn caacutec biến kết quả1048713 Phương phaacutep coacute tiacutenh mocirc tả (như vậy khaacutec với phương phaacutep danh định)1048713 Khocircng tự động tigravem kiếm giải phaacutep tối ưu ndash noacute mocirc tảtiecircn đoaacuten caacutec đặc tiacutenh của hệthống đatilde cho dưới caacutec điều kiện khaacutec nhau từ đoacute coacute thể chọn ra phương aacuten tốtnhất1048713 Quaacute trigravenh mocirc phỏng thường lặp lại một thực nghiệm nhiều lần để coacute được ướclượng về hiệu ứng tổng quaacutet của một số hagravenh động nhất định1048713 Mocirc phỏng maacutey tiacutenh thiacutech hợp cho hầu hết caacutec tigravenh huống mặc dugrave cũng coacute một sốmocirc phỏng thủ cocircng thagravenh cocircng1048713 Thường chỉ được dugraveng khi bagravei toaacuten quaacute phức tạp khocircng thể xem xeacutet bằng caacutec kỹthuật tối ưu dạng số Tiacutenh phức tạp theo nghĩa bagravei toaacuten khocircng thể cocircng thức hoacuteacho tối ưu (do khocircng thotildea caacutec giả định) hoặc cocircng thức quaacute lớn quaacute nhiều tươngtaacutec giữa caacutec biến hoặc về bản chất bagravei toaacuten lagrave bất định hay rủi roPhương phaacutep mocirc phỏng thiết lập mocirc higravenh của hệ thống thực vagrave tiến hagravenh caacutec thựcnghiệm lặp lại trecircn mocirc higravenh

bull Thuận lợi1048713 Lyacute thuyết tương đối trực tiếp hiệu ứng dagravei hạn của nhiều chiacutenh saacutech -gt neacuten thờigian lớn1048713 Do tiacutenh chất mocirc tả (khaacutec với danh định)1048713 Coacute thể thấy được nhanh choacuteng coacute thể đặt ra caacutec cacircu hỏi ldquowhat-ifrdquo coacute thể dugravengtiếp cận thử-vagrave-sai vagraveo giải quyết vấn đề một caacutech nhanh choacuteng rẻ chiacutenh xaacutec iacutetrủi ro hơn1048713 Thử nghiệm được biến quyết định phần nagraveo của mocirci trường thực sự quan trọngvới caacutec phương aacuten khaacutec nhau1048713 Yecircu cầu kiến thức riecircng biệt về bagravei toaacuten vigrave thế buộc người xacircy dựng mocirc higravenh phảilagravem việc thường xuyecircn với nhagrave quản lyacute ndash đối tượng mong muốn của HHTQĐ để

từ đoacute bản chất bagravei toaacuten vagrave caacutec quyết định được hiểu tốt hơn1048713 Mocirc higravenh được xacircy dựng từ viễn cảnhcaacutech nhigraven của nhagrave quản lyacute1048713 Mocirc higravenh chỉ cho một bagravei toaacuten riecircng biệt thường khocircng thể dugraveng giải caacutec bagravei toaacutenkhaacutec Như vậy mỗi thagravenh phần của mocirc higravenh ứng với một phần của hệ thống thựcdo đoacute sẽ khocircng yecircu cầu nhagrave quản lyacute phải tổng quaacutet hoacutea caacutec hiểu biết của migravenh1048713 Phổ bagravei toaacuten giải được rất rộng tồn kho nhacircn sự hoạch định chiến lược 1048713 Coacute thể chứa caacutec phức tạp thực sự của bagravei toaacuten khocircng cần caacutec đơn giản hoacutea (TDdugraveng caacutec phacircn phối xaacutec suất thực thay vigrave phacircn phối lyacute thuyết xấp xỉ)1048713 Coacute thể tự động sinh ra nhiều đo lường hiệu năng quan trọng1048713 Thường lagrave phương phaacutep duy nhất của HHTQĐ coacute thể xử lyacute caacutec bagravei toaacuten tương đốiphi cấu truacutec1048713 Coacute một số caacutec goacutei phần mềm mocirc phỏng (Monte Carlo) tương đối dễ dugravengbull Điểm yếu1048713 Tuy thường tigravem được caacutec phương aacuten đủ tốt nhưng khocircng đảm bảo lời giải tối ưu1048713 Quaacute trigravenh xacircy dựng mocirc higravenh thường dagravei vagrave tốn keacutem1048713 Giải phaacutep vagrave suy diễn từ nghiecircn cứu mocirc phỏng thường khocircng thể chuyển sang bagraveitoaacuten khaacutec vigrave mocirc higravenh kết hợp caacutec yếu tố đặc thugrave1048713 Đocirci khi do mocirc higravenh quaacute dễ giải thiacutech cho nhagrave quản lyacute necircn caacutec phương phaacutep phacircntiacutech thường xem nhẹ1048713 Phần mềm mocirc phỏng đocirci khi yecircu cầu caacutec kỹ năng đặc biệt do độ phức tạp củaphương phaacutep giải higravenh thứcbull Caacutec loại mocirc phỏng1048713 Mocirc phỏng xaacutec suất một hay nhiều biến độc lập mang tiacutenh xaacutec suất với 2 loạiphacircn phối ndash thường dugraveng kỹ thuật Monte Carlo1048713 Phacircn phối rời rạc tigravenh huống coacute một số giới hạn caacutec biến cố (biến) với hữu hạncaacutec giaacute trị cho mỗi biến cố (biến)1048713 Phacircn phối liecircn tục tigravenh huống coacute số lượng khocircng giới hạn caacutec biến cố tuacircn theocaacutec hagravem mật độ xaacutec suất như phacircn phối chuẩn1048713 Mocirc phỏng độc lậpphụ thuộc theo thời gian1048713 Độc lập khocircng cần thiết phải biết chiacutenh xaacutec thời điểm xảy ra biến cố (nhu cầutiecircu thụ lượng sản phẩm trong ngagravey khocircng biết chiacutenh xaacutec thời điểm tiecircu thụ)1048713 Phụ thuộc cần biết chiacutenh xaacutec thời điểm xảy ra sự kiện (bagravei toaacuten hagraveng đợi)1048713 Mocirc phỏng tương taacutec trực quan1048713 Mocirc phỏng hướng đối tượng dugraveng tiếp cận hướng đối tượng để xacircy dựng mocirc higravenhmocirc phỏng Chuacute yacute ngocircn ngữ mocirc higravenh hoacutea nhất thể UML (unified modelinglanguage) kể cả khi mocirc phỏng caacutec hệ thời gian thựcMOcirc HIgraveNH HOacuteA ĐA CHIỀU ndash XỬ LYacute PHAcircN TIacuteCH TRỰC TUYẾNbull Người ra quyết định thường phải xem xeacutet nhiều chiều của dữ liệu (TD caacutec chiềucủa dữ liệu baacuten hagraveng lagrave sản phẩm vugraveng thời gian người baacuten ) dữ liệu cần đượcphacircn tiacutech trực tiếp bằng caacutec cocircng cụ chuẩn hay phacircn tiacutech tự động bằng caacutec

phương phaacutep khai mỏ dữ liệu (data mining)bull Hầu hết caacutec hệ thống phacircn tiacutech đa chiều được nhuacuteng trong caacutec hệ xử lyacute phacircn tiacutechtrực tuyến (HXLPTTT ndash online analytic processing - OLAP)bull Mục tiecircu của XLPTTT nắm bắt cấu truacutec của dữ liệu thực để hỗ trợ ra quyết địnhbull Trong HHTQĐ coacute sự gắn nối tự nhiecircn giữa mocirc higravenh hoacutea dữ liệu mocirc higravenh hoacutea kyacutehiệu vagrave caacutec khiacutea cạnh của phacircn tiacutech ldquowhat-ifrdquobull Caacutec baacuteo caacuteo của HXLPTTT đều coacute tiacutenh tương taacutec dễ khai thaacutec sử dụng đặc biệtphugrave hợp cho caacutec baacuteo caacuteo về chỉ số hiệu năng chủ yếu (key performance indicators- KPI) baacuteo caacuteo về đo lường hiệu năng kinh doanh bull Thế hệ hiện tại của HXLPTTT vagrave hệ khai mỏ dữ liệu (data mining) tiacutech hợp caacutecđặc tiacutenh của hệ thocircng tin latildenh đạo (executive information system ndashEIS- nhiềucaacutech nhigraven dữ liệu chi tiết hoacutea theo nhu cầu) vagrave caacutec hệ đồ họa khaacutec ndash thường coacutegiao diện người dugraveng dạng kiểu WEBbull Caacutec hệ thống như trecircn cograven được gọi lagrave caacutec cocircng cụ triacute tuệ kinh doanh (businessintelligence - BI) vigrave coacute caacutec đặc trưng về mocirc higravenh hoacutea vagrave tối ưu hoacutea nhưng lạitrong suốt đối với ngươigrave dugravengbull Hiện caacutec cocircng cụ được đưa ra bởi caacutec nhagrave cung cấp về CSDL về hoạch định tagraveinguyecircn tổ chức (ERP) về nhagrave kho dữ liệu (data warehouse) về HXLPTTT MOcirc HIgraveNH HOacuteA VAgrave MOcirc PHỎNG TƯƠNG TAacuteC TRỰC QUANbull Iacutech lợi Người ra quyết định tham gia vagraveo quaacute trigravenh phaacutet triển mocirc higravenh vagrave thựcnghiệm mocirc phỏng vigrave vậy sẽ tin tưởng khi sử dụng mocirc higravenhbull Mocirc higravenh hoacutea tương taacutec trực quan (visual interactive modeling - VIM) dugraveng caacutecbiểu diễn đồ họa maacutey tiacutenh để trigravenh bagravey caacutec ảnh hưởng của caacutec quyết định quản lyacutekhaacutec nhau ở một thời điểm (tĩnh) hay tiến triển theo thời gian (động với kỹ thuậthoạt higravenh)bull Mocirc phỏng tương taacutec trực quan (visual interactive simulation - VIS) cho pheacutepngười dugraveng theo dotildei tiến trigravenh xacircy dựng vagrave sử dụng khai thaacutec mocirc higravenh mocirc phỏngdưới dạng hoạt higravenhbull Mocirc higravenh hoacutea tương taacutec trực quan coacute thể kết hợp với tiếp cận triacute tuệ nhacircn tạo đểđưa ra caacutec khả năng mới thay đổi từ xacircy dựng hệ thống dạng đồ họa đến tigravem hiểuvề động học của hệ thốngbull Cần đến caacutec hệ thống maacutey tiacutenh xử lyacute song song tốc độ cao để xacircy dựng caacutec mocircphỏng - phức tạp quy mocirc lớn dạng hoạt higravenh - mang tiacutenh khả thi ở thời gian thực

22Caacutec dạng hệ thống hỗ trợ ra quyết địnhHệ hỗ trợ quyết định nhoacutemRa quyết định nhoacutem giao tiếp vagrave cộng taacutec- Caacutec đặc điểm của cocircng việc nhoacutem+ Một nhoacutem thực hiện một nhiệm vụ thỉnh thoảng ra quyết định thỉnh thoảngkhocircng ra quyết định+ Caacutec thagravenh viecircn trong nhoacutem coacute thể ở những nơi khaacutec nhau

+ Caacutec thagravenh viecircn trong nhoacutem coacute thể lagravem việc ở những thời gian khaacutec nhau+ Caacutec thagravenh viecircn trong nhoacutem coacute thể lagravem việc cugraveng nhau hoặc ở caacutec tổ chức khaacutecnhau+ Nhoacutem coacute thể vĩnh viễn hoặc tạm thời+ Nhoacutem coacute thể ở bất kỳ mức quản lyacute nagraveo hoặc mức thời gian nagraveo+ Coacute sự điều phối (quaacute trigravenh vagrave nhiệm vụ đạt được) hoặc macircu thuẩn trongnhoacutem+ Coacute sự đạt được hoặcvagrave mất maacutet năng suất trong tổ chức+ Nhiệm vụ phải hoagraven thagravenh rất nhanh+ Khocircng thể hoặc quaacute đắt cho tất cả caacutec thagravenh viecircn trong nhoacutem cugraveng hợp ở mộtnơi+ Một số dữ liệu thocircng tin hoặc kiến thức cần thiết nằm ở nhiều nơi một sốkhaacutec ở ngoagravei tổ chức+ Chuyecircn mocircn của caacutec thagravenh viecircn khocircng coacute trong nhoacutem lagrave cần thiết- Caacutec hoạt động vagrave caacutec quaacute trigravenh miecircu tả caacutec cuộc họp+ Cuộc họp lagrave hoạt động chung liecircn quan bởi một nhoacutem người coacute địa vị bằngnhau hoặc gần bằng nhau+ Kết quả của cuộc họp phụ thuộc một phần vagraveo kiến thức yacute kiến caacutec đaacutenh giaacutecủa caacutec thagravenh viecircn+ Kết quả của cuộc họp cũng phụ thuộc vagraveo sự kết hợp của nhoacutem vagrave phụ thuộcvagraveo quaacute trigravenh ra quyết định được sử dụng bởi nhoacutem đoacute+ Giải quyết caacutec yacute kiến khaacutec nhau bởi người coacute quyền hạn hoặc thương lượnghoặc phacircn xửHỗ trợ giao tiếp- Giao tiếp lagrave thagravenh phần quan trọng cho hỗ trợ quyết định Khocircng coacute giao tiếp thigravekhocircng coacute cộng taacutec Những người ra quyết định caacute nhacircn phải giao tiếp với caacutecđồng nghiệp chuyecircn gia cơ quan chiacutenh phủ khaacutech hagraveng đối taacutec kinh doanh hellipHọ cũng cần dữ liệu vagrave thocircng tin (vagrave kiến thức) từ nhiều nơi trecircn thế giới Caacutecnhoacutem ra quyết định phải giao tiếp cộng taacutec vagrave thương lượng trong cocircng việcHầu hết caacutec tổ chức sẽ nhanh trở thagravenh khocircng coacute chức năng nếu khocircng coacute caacutec hệthống giao tiếp Thương mại điện tử coacute thể hiệu quả chỉ qua caacutec kỹ thuật giao tiếphiện đại- Caacutec kỹ thuật thocircng tin hiện đại cung cấp caacutec phương tiện hỗ trợ giao tiếp rẻnhanh coacute khả năng coacute thể tin cậy Nền tảng hỗ trợ giao tiếp lagrave caacutec hệ thống maacuteytiacutenh mạng+ Bắt đầu bằng điện baacuteo điện thoại radio vagrave ti vi+ Trong 100 năm chuacuteng ta phaacutet triển maacutey fax thư điện tử chương trigravenh chatnhoacutem tin tức hệ thống hội nghị truyền higravenh Hầu hết caacutec kỹ thuật nagravey đềuhoạt động trecircn internet+ Sự phaacutet triển giao tiếp sau cugraveng lagrave hệ thống họp điện tử caacutec dịch vụ vagrave hệ

thống hội nghị điện tử thường sử dụng internet để kết nối caacutec người ra quyếtđịnh- Caacutec thuận lợi aacutep dụng caacutec phương phaacutep giao tiếp cải tiến trong caacutec tổ chức+ Cải tiến năng suất của nhacircn viecircn+ Liecircn quan đến nhiều người ra quyết định chiacutenh+ Khocircng quan tacircm nhiều đến đường biecircn giới địa lyacute+ Tạo nền văn hoacutea hợp taacutec nhất quaacuten+ Cải tiến chất lượng cuộc sống của nhacircn viecircnHỗ trợ cộng taacutec Maacutey tiacutenh hỗ trợ cộng taacutec- Khung thời giannơi chốn+ Sự hiệu quả của kỹ thuật tiacutenh toaacuten cộng taacutec phụ thuộc vagraveo vị triacute của caacutec thagravenhviecircn trong nhoacutem vagrave phụ thuộc vagraveo thời gian chia sẽ thocircng tin gởi vagrave nhận+ Chia sự giao tiếp thagravenh bốn ocirc vagrave tổ chức bốn ocirc dọc theo 2 chiều thời gian vagravenơi chốn1048713 Thời gian Khi gởi vagrave nhận thocircng tin hầu như đồng thời giao tiếp lagrave đồngthời Viacute dụ Điện thoại ti vi vagrave caacutec cuộc họp gặp mặt nhau Giao tiếp bấtđồng bộ xảy ra khi người nhận nhận thocircng tin ở thời điểm khaacutec thời điểmgởi thocircng tin đoacute1048713 Nơi chốn Người gởi vagrave người nhận coacute thể ở cugraveng phograveng hoặc khocircng+ Bốn ocirc lagrave1048713 Cugraveng thời giancugraveng nơi chốn Caacutec thagravenh viecircn gặp mặt nhau cugraveng một luacutecgiống như phograveng quyết định hoặc gặp mặt truyền thống1048713 Cugraveng thời giankhaacutec nơi chốn Caacutec thagravenh viecircn ở caacutec nơi khaacutec nhau nhưnggiao tiếp cugraveng nhau Viacute dụ hội nghị truyền higravenh (videoconferencing)1048713 Khaacutec thời giancugraveng nơi chốn Nhiều người lagravem việc theo ca Ca nagravey để lạithocircng tin cho ca khaacutec1048713 Khaacutec thời giankhaacutec nơi chốn Caacutec thagravenh viecircn ở caacutec nơi khaacutec nhau Caacutecthagravenh viecircn nagravey gởi vagrave nhận thocircng tin ở những lần khaacutec nhau

23Thực thi hệ DSSHệ thống hỗ trợ quản lyacute (MSS) khocircng phải luacutec nagraveo cũng luocircn thagravenh cocircng Nhiều trường hợpthất bại của ES khocircng hoagraven toagraven lagrave lyacute do kỹ thuật Thực thi hệ thống lagrave một quaacute trigravenh liecircn tụcnhằm đảm bảo cho tổ chức chuẩn bị tiếp nhận một hệ thống mới vagrave đưa hệ thống vagraveo sử dụngthagravenh cocircngThực hiện cocircng nghệ hệ thống hỗ trợ quản lyacute lagrave việc phức tạp vigrave caacutec hệ thống nagravey khocircng đơnthuần lagrave hệ thống thocircng tin chỉ thu thập thao taacutec vagrave phacircn phối thocircng tin Magrave xa hơn chuacuteng

liecircn quan tới caacutec cocircng việc coacute thể lagravem thay đổi đaacuteng kể caacutech thức hoạt động của tổ chức Tuyvậy đa số caacutec yếu tố thực thi đều liecircn quan tới hệ thống thocircng tinThực thi MSS lagrave quaacute trigravenh liecircn tục diễn ra trong suốt thời gian phaacutet triển hệ thống từ đề xuấtban đầu đến nghiecircn cứu khả thi thiết kế vagrave phacircn tiacutech hệ thống lập trigravenh huấn luyện chuyểnđổi vagrave lắp đặt Caacutec chuyecircn gia hệ thống thocircng tin thường gọi thực thi lagrave giai đoạn cuối trongvograveng đời hệ thống Định nghĩa thực thi MSS phức tạp hơn vigrave bản chất lặp của sự phaacutet triểncaacutec hệ thống

THỰC THI KHOcircNG HOAgraveN CHỈNHCaacutec quyết định về tiacutenh khả thi thường coacute giả định về lợi iacutech đạt được khi kế hoạch thực thiđược thực hiện hoagraven toagraven Trong thực tế thường chỉ thực hiện 90 thậm chiacute 70 phần trăm sovới phacircn tiacutech khả thi Lyacute do lagrave sự thay đổi tại một nơi trong hệ thống coacute thể ảnh hưởng vagrave coacutethể taacutec động tiecircu cực đến chỗ khaacutec Do vậy cấp quản lyacute coacute thể bỏ những phần trong dự aacuten coacutethể gacircy ra taacutec động xấu Do đoacute dự aacuten sẽ thực hiện iacutet hơn 100 so với dự aacuten kế hoạch Caacutec lyacutedo khaacutec coacute thể lagrave do khấu trừ ngacircn saacutech hoặc vượt chi phiacuteĐAacuteNH GIAacute SỰ THAgraveNH COcircNG CỦA THỰC THI HỆ THỐNGPhải coacute caacutec chỉ số đo lường thigrave mới coacute thể đaacutenh giaacute sự thagravenh cocircng khi thực thi một hệ thốngDickson va Powers (1973) đề ra 5 tiecircu chuẩn độc lậpbull Tỷ lệ thời gian thực hiện dự aacuten với thời gian ước lượngbull Tỷ lệ chi phiacute thực tế vagrave ngacircn saacutech thực hiệnbull Thaacutei độ của cấp quản lyacute đối với hệ thốngbull Nhu cầu thocircng tin của caacutec nhagrave quản lyacute được đaacutep ứng như thế nagraveo qua hệ thốngbull Taacutec động của dự aacuten đối với những hoạt động maacutey tiacutenh trong cocircng tyCaacutec đo lường khaacutec để đaacutenh giaacute thagravenh cocircng của hệ hỗ trợ quản lyacute (MSS)bull Sự sử dụng hệ thống (dự định dugraveng hoặc thực sự dugraveng)bull Thỏa matilden của người dugravengbull Thaacutei độ taacuten thagravenhbull Mức độ hệ thống hoagraven thagravenh caacutec mục tiecircu ban đầubull Phần thưởng đối với tổ chức (giảm chi phiacute tăng doanh thuhellip)bull Tỷ số lợi iacutech chi phiacute

bull Mức độ thể chế hoacutea của MSS trong tổ chứcDo bởi tiacutenh đa dạng của DSS necircn việc đaacutenh giaacute sự thagravenh cocircng của hệ nagravey cũng khoacute khăn tuynhiecircn cũng coacute thể coacute một số yếu tố giuacutep cho DSS thagravenh cocircng như sự tham gia người dugravenghuấn luyện người dugraveng hỗ trợ quản lyacute cấp cao nguồn thocircng tin đặc điểm của những nhiệmvụ coacute liecircn quan (cấu truacutec bất định độ khoacute phụ thuộc)

Chương5Nhoacutem hỗ trợ quyết định vagrave nhoacutemcocircng nghệ phần mềm

51Nhoacutem tạo quyết định

MDM-Holsapple đatilde gợi yacute chuacuteng ta sử dụng giới hạn người tạo quyết định

Một nhoacutem lagrave kết cấu MDM nơi magrave nhiều người ra quyết định hoagraven toagraven tương taacutec

Một đội lagrave kết cấu MDM nơi caacutec thagravenh viecircn tư vấn cho người đưa ra quyết định nhưng khocircng tương taacutec

Một Ủy ban lagrave kết cấu MDM với một người tạo quyết định duy nhất vagrave sự tương taacutec giữa caacutec thagravenh viecircn

Mạng thocircng tin

Mạng lưới baacutenh xe mỗi người tham gia coacute thể giao tiếp với người đưa ra quyết định ở trung tacircm nhưng khocircng phải với người tham gia khaacutecCấu truacutec nagravey lagrave khocircng thỏa matilden tất cả những người tham gia ngoại trừ người ra quyết định

Mạng dacircy chuyền Tham gia chuyển tiếp thocircng tin chỉ để noacute luocircn liền kề nhau trong chuỗi

Thagravenh viecircn cuối cugraveng ko được đaacutep ứng

Mạng vograveng trograven Tương tự như chuỗi nhưng kết thuacutec được kết nối

Mạng kết nối hoagraven toagraven khocircng coacute hạn chế về giao tiếp vagrave tương taacutec giữa caacutec thagravenh viecircnNoacutei chungnoacute đaacutep ứng hầu hết caacutec kết nối của người tham gia nhưng truyền đạt thocircng tin mất nhiều thời gian vagrave coacute nhiều cơ hội xảy ra lỗi

Nhoacutem hagravenh vi vagrave chuẩn mực

MDMs thiết lập caacutec chỉ tiecircu hướng dẫn quaacute trigravenh ra quyết định

Một chuẩn mực quy định cụ thể những gigrave thagravenh viecircn trong nhoacutem dự kiến sẽ lagravem trong những hoagraven cảnh nhất định

Quy tắc gửi coacute thể được thocircng qua viacute dụ đaacutenh giaacute ngang hagraveng hoặc xử phạt

Lagravem thế nagraveo để đưa ra quyết định

Việc chọn lựa magrave trong đoacute việc sử dụng cấu truacutec MDM phải được dựa trecircn một số yếu tố liecircn quan với bối cảnh quyết định

Viacute dụmột cấu truacutec riecircng lẻ sẽ lagravem việc nơi magrave quyết định được cấu truacutec cao vagrave thocircng tin lagrave coacute sẵn

Một ủy ban cơ cấu sẽ lagrave sự lựa chọn khi người ra quyết định khocircng thể đưa ra quyết định một migravenh

52Caacutec vấn đề thường gặp trong nhoacutem

Kiacutech thước Noacutei chung sự nhất triacute vagrave gắn kết giữa caacutec thagravenh viecircn tỉ lệ nghịch với phạm vi nhoacutem Trong nhoacutem lớn rất dễ higravenh thagravenh caacutec nhoacutem nhỏ vagrave hoạt động rời rạc

Tư duy tập thể Trong nhoacutem lớn mọi người coacute xu hướng suy nghĩ đểđạtđược sự nhất triacute necircn khocircng phaacutet huy được sự saacuteng tạo

Caacutec vấn đề về xatilde hội

Xung đột Trong 1 nhoacutem ai cũng muốn migravenh lagrave giỏi nhất necircn dễ dẫn đến xung đột

Ẩn danh(Giấu tecircn) Đacircy lagrave phương phaacutep được sử dụng để kiểm soaacutet xung đột Cho caacutec thagravenh viecircn tham gia ẩn danh

Vấn đề giới tiacutenh Nam vagrave nữ thường coacute những thế mạnh khaacutec nhau điều nagravey coacute thể lagrave sức mạnh trong 1 thiết lập MDM

Đagravem phaacuten vagrave quyết định

Một quyết định coacute thể liecircn quan đến nhiều quan điểm khaacutec nhau vigrave thế cần phải coacute sự đagravem phaacuten

Caacutec thiết kế của cơ chế hỗ trợ cho MDM phải phugrave hợp với caacutec hoạt độngđagravemphaacuten

Những hoạt động nagravey bao gồm việc thu nhận yacute kiến của caacutec thagravenh viecircn 1 caacutech cocircng bằng

53Cocircng nghệ hỗ trợ MDM

Organizational DSSndash 1 hệ thống cung cấp caacutec quyết định hỗ trợ

Group Support Systemndash Cocircng nghệ sử dụng sự hỗ trợ của nhiều becircn tham gia

Group DSS ndash Lagrave 1 hệ thống được thiết kế đặc biệt để hỗ trợ cho MDM

DSS ndash Lagrave 1 hệ thống dưới sự kiểm soaacutet của 1 người quyết định hệ thống nagravey cung cấp 1 bộ cocircng cụ giuacutep phacircn tiacutech hoagraven cảnh đểđưa ra quyết định vagrave nacircng cao hiệu quả của quyết địnhđoacute

53Cocircng nghệ hỗ trợ MDM

Organizational DSSndash 1 hệ thống cung cấp caacutec quyết định hỗ trợ

Group Support Systemndash Cocircng nghệ sử dụng sự hỗ trợ của nhiều becircn tham gia

Group DSS ndash Lagrave 1 hệ thống được thiết kế đặc biệt để hỗ trợ cho MDM

DSS ndash Lagrave 1 hệ thống dưới sự kiểm soaacutet của 1 người quyết định hệ thống nagravey cung cấp 1 bộ cocircng cụ giuacutep phacircn tiacutech hoagraven cảnh đểđưa ra quyết định vagrave nacircng cao hiệu quả của quyết địnhđoacute

Mục tiecircu của cocircng nghệ hỗ trợ MDM

Quy trigravenh hỗ trợ tập trung vagraveo quaacute trigravenh tạo điều kiện thuận lợi cho sự tương taacutec

Cơ chế cấu truacutec quaacute trigravenh chi phối caacutec hoạt động truyền thocircng

Nhiệm vụ hỗ trợ cocircng việc coacute thể chọn lựa tổ chức hoặc lấy thocircng tin

Nhiệm vụ cấu truacutec cocircng việc cho pheacutep truy cập đến kỹ thuật lọc kết hợp phacircn tiacutech kiến thức liecircn quan đến cocircng việc

Caacutec lớp loại cocircng nghệ hỗ trợ MDM

Phacircn loại theo đặc điểm do DeSanctis vagrave Gallupe đưa ra đề xuất một chương trigravenh ba cấp dựa trecircn caacutec tiacutenh năng được cung cấp

Hệ thống cấp 1 Mục điacutech chiacutenh lagrave tạo điều kiện thocircng tin liecircn lạc giữa caacutec thagravenh viecircn

Hệ thống cấp 2 Thiết kế để giảm thiểu rủi ro

Hệ thống cấp 3 Giuacutep điều chỉnh xử lyacute quyết định

Phacircn loại theo cocircng nghệ -Kraemer vagrave King tập trung vagraveo cocircng nghệ aacutep dụng

Cocircng nghệ bảng mạch điện tử

Hội nghị trực tuyến

Mạng lưới tập đoagraven

Trung tacircm thocircng tin

Mocirci trường cộng taacutec

Phograveng quyết định

Nhoacutem phần mềm

Phần mềm được thiết kế để hỗ trợ sự hợp taacutec bao gồm việc thu huacutet vagrave lưu trữ thocircng tin

Caacutec tổ chức dẫn đầu thị trường hiện tại lagrave Lotus Notes and Domino Microsoft Exchange Novell GroupWise and Oracle Office

Caacutec cocircng cụ trong một bộ phần mềm bao gồm người quản lyacute hội nghị (Lotus Sametime) vagrave trao đổi thocircng điệp (Lotus Notes Mail)

Xếp hạng phần mềm cho nhoacutem

Ellis vv đề xuất một hệ thống xếp hạng dựa vagraveo kiểu sự hỗ trợ noacute Cung cấp

Hệ thocircng điệp

Hệ thống hội thảo truyền higravenh

Hệ thống cộng taacutec soạn thảo

Nhoacutem phacircn phối giải phaacutep phần mền

Hệ thống phối hợp

Hệ thống thocircng minh đại diện

Lực lượng điều khiển phaacutet triển phần mềm cho nhoacutem

Một số nhacircn tố chiacutenh bao gồm

Tăng năng suất

Giảm số lượng caacutec cuộc họp

Tăng cường tự động hoacutea caacutec quy trigravenh lagravem việc thường xuyecircn

Cần phối hợp toagraven cầu tốt hơn

Tiacutenh sẵn sagraveng của những mạng lan rộng

Coleman vagrave Khanna liệt kecirc 10 nhacircn tố khaacutec

54Quản lyacute hoạt động MDM (Mobile Device Management - Quản lyacute thiết bị di động)

Một số phương phaacutep phối hợp phổ biến hơnMDM lagrave

Kỹ thuật nhoacutem định danh

Kỹ thuật Delphi

Sự phacircn xử

Hệ thocircng tin dựa trecircn vấn đề

Nemawashi

Kỹ thuật nhoacutem định danh

1-Mỗi người tham gia viết ra những yacute tưởng về những gigrave necircn quyết định

2-Lần lượt mỗi người tham gia trigravenh bagravey yacute tưởng của migravenh được ghi lại trecircn bảng Khocircng thảo luận ở đacircy

3-Sau khi tất cả caacutec yacute tưởng được trigravenh bagravey caacutec đại biểu coacute thể chất vấn những người khaacutec

4-Mỗi người tham gia bỏ phiếu cho mỗi yacute tưởng

Kỹ thuật Delphi

Về cơ bản tương tự như kỹ thuật nhoacutem định danh ngoại trừ những người khocircng bao giờ tham gia cuộc họp

Một cocircng cụ khảo saacutet được sử dụng để thu thập đầu vagraveo ban đầu từ caacutec thagravenh viecircn

Một cuộc khảo saacutet thứ hai được gửi đi với một bản toacutem tắt caacutec kết quả chung

Những bước lặp lại cho đến khi đạt được một sự đồng thuận hoặc nhigraven nhận của đa số

Sự phacircn xử(Arbitration )

Thiacutech hợp nhất khi caacutec thagravenh viecircn của MDM đại diện cho caacutec yếu tố đối lập

Những người tham gia đồng yacute rằng nếu lựa chọn thay thế hai becircn thỏa thuận khocircng được tigravem thấy thigrave một trọng tagravei viecircn becircn ngoagravei sẽ tham gia

Trọng tagravei sau đoacute lựa chọn thay thế ocircng hoặc xeacutet thấy thiacutech hợp nhất

Hệ thống thocircng tin dựa trecircn vấn đề (IBIS)

Lagrave một phương phaacutep lập luận cấu truacutec

Một đại diện cho IBIS lagrave một đồ thị với caacutec nuacutet vagrave caacutec liecircn kết

IBIS bắt đầu với lựa chọn của một nuacutet vấn đề gốc sau đoacute caacutec nuacutet vị triacute khaacutec nhau được liecircn kết với nuacutet gốc

Caacutec nuacutet vị triacute nagravey sau đoacute được đaacutenh giaacute dựa trecircn những lập luận gắn liền với chuacuteng

Nemawashi (được sử dụng rộng ratildei tại Nhật Bản)

1-Một hoặc nhiều thagravenh viecircn của MDM được chỉ định lagrave điều phối viecircnCaacutec điều phối viecircn sau đoacute chọn người tham gia cograven lại

2-Điều phối viecircn xacircy dựng một tổng hợp caacutec sự lựa chọn vagrave sau đoacute caacutec chuyecircn gia đaacutenh giaacute caacutec lựa chọn

3-Điều phối viecircn lựa chọn một sự lựa chọn dựa trecircn kết quả ở trecircn(ở 2)

4-Sự thay thế được luacircn chuyển điều phối viecircn tigravem kiếm sự đồng thuận thocircng qua sự thuyết phục vagrave đagravem phaacuten

5-Nếu đạt được sự đồng thuận điều phối viecircn cho lưu thocircng một tagravei liệu magrave mỗi thagravenh viecircn MDM để lại dấu hiệu trecircn đoacute

55Nơi lagravem việc ảo

Nhiều tổ chức trecircn toagraven thế giới kinh doanh bất động sản cho cocircng nghệ hợp taacutec

Cocircng việc được trở thagravenh một điều bạn lagravem hơn lagrave một nơi bạn đi

Những thay đổi lớn nhất mang lại bởi nơi lagravem việc ảo coacute thể lagrave về văn hoaacute hay xatilde hội hơn lagrave về cocircng nghệ

Chương 6 Hệ thống thocircng tin điều hagravenh

61 Yacute nghĩa của EIS- Hệ thống thocircng tin điều hagravenh

- EIS lagrave một dạng đặc biệt của DSS được thiết kế để hỗ trợ ra quyết định ở cấp cao nhất của một tổ chức

- Lagrave một hệ thống thocircng tin hỗ trợ nhu cầu lập kế hoạch vagrave đaacutenh giaacute của caacutec nhagrave quản lyacute điều hagravenh

- EIS coacute thể giuacutep một CEO coacute được bức tranh tổng thể chiacutenh xaacutec nhất về caacutec hoạt động vagrave một bản toacutem tắt những gigrave magrave đối thủ cạnh tranh đang lagravem

- Caacutec hệ thống nagravey noacutei chung hoạt động dễ dagraveng vagrave trigravenh bagravey thocircng tin theo những caacutech dễ hiểu để việc tiếp thu được nhanh choacuteng (biểu đồ đồ thịhellip)

(Tagravei liệu thecircm EIS lagrave những loại hệ thống lagrave rất phức tạp trong tự nhiecircn Coacute thể noacutei hệ thống nagravey cũng cung cấp cho caacutec nhagrave quản lyacute với caacutec thiết bị coacute khả năng ra quyết định bằng caacutech sử dụng của noacute Hệ thống nagravey hoạt động trong điều kiện như vậy quan trọng như trong caacutec hệ thống khaacutec khocircng hỗ trợ Khả năng lưu trữ dữ liệu nặng lagravem cho noacute lyacute tưởng để được thocircng qua khocircng chỉ bởi caacutec doanh nghiệp lớn magrave cograven bởi caacutec doanh nghiệp nhỏ hơn Nhigraven chung hệ thống nagravey lagrave dagravenh cho caacutec nhacircn viecircn cấp cao hỗ trợ thagravenh thạo trong việc đưa ra caacutec quyết định quan trọng)

Caacutec phiecircn EIS tiecircu biểu- Phiecircn lagravem việc coacute thể bắt đầu với một baacuteo caacuteo về tigravenh higravenh tagravei chiacutenh vagrave kinh

doanh của một cocircng ty caacutec chỉ số hoạt động quan trọng được hiển thị rotilde ragraveng- EIS sẽ cho pheacutep caacutec giaacutem đốc điều hagravenh coacute thể đi sacircu vagraveo dữ liệu từ những con

số bất kỳ magrave noacute hỗ trợ- Việc điều hagravenh coacute thể lựa chọn một mức độ chi tiết ( VD danh số baacuten hagraveng) nếu

như cần điều tra thecircm- Lagrave một phương phaacutep tiếp cận coacute thể giuacutep việc ra quyết định tốt hơn

Những điều magrave EIS ko coacute- EIS khocircng phải lagrave sự thay thế cho caacutec hệ thống dựa trecircn caacutec maacutey tiacutenh khaacutec EIS

thực sự chỉ cung cấp dữ liệu cho caacutec hệ thống nagravey- Noacute khocircng thể biến caacutec bộ hệ điều hagravenh của maacutey tiacutenh thagravenh những ldquochuyecircn viecircn

giỏirdquo- Coacute thể được viacute một caacutech cao hơn như lagrave một trợ lyacute đaacuteng tin cậy coacute thể được gọi

đến bất khi nagraveo vagrave mỗi khi cần thiết

Tagravei liệu thecircm Sự khaacutec nhau giữa EIS vagrave DSS+ EIS thiết kế để hỗ trợ những người điều hagravenh cấp cao giuacutep họ khaacutem phaacute caacutec vấn đề vagrave caacutec cơ hội DSS hỗ trợ những nười phacircn tiacutech cố gắng trả lời cacircu hỏi caacutei gigrave coacute thể lagravem cugraveng với một cơ hội hoặc một vấn đề

Chiều EIS DSSNhững người sử dụng thocircng thường

Duyệt dữ liệu đi xuống truy xuất trạng thaacutei

Hỗ trợ phacircn tiacutech vagrave quyết định

Sự thuacutec đẩy Tiacutenh thiacutech hợp Tiacutenh hiệu quảỨng dụng Queacutet mocirci trường đaacutenh giaacute

hiệu suất nhận dạng caacutec vấn đề vagrave caacutec cơ hội

Caacutec quyết định quản lyacute trecircn caacutec lĩnh vực đa dạng

Hỗ trợ quyết định Caacutec chiacutenh saacutech caacutec quyết định khocircng coacute cấu truacutec ở mức cao vagrave hỗ trợ giaacuten tiếp

Hỗ trợ caacutec quyết định lặp lại caacutec quyết định khocircng thể đoaacuten trước ra quyết định khocircng coacute cấu truacutec vagrave baacuten cấu truacutec

Loại thocircng tin Caacutec thocircng tin tin tức thocircng tin becircn ngoagravei về khaacutech hagraveng đối thủ cạnh tranh mocirci trường caacutec baacuteo caacuteo theo yecircu cầu vagrave định thời về caacutec hoạt động becircn trong

Caacutec thocircng tin hỗ trợ caacutec tigravenh huống đặc biệt

Sử dụng coacute nguyecircn tắc

Dograve theo vết vagrave điều khiển nhận dạng cơ hội

Hoạch định tổ chức phacircn nhoacutem vagrave điều khiển

Khả năng phugrave hợp với những người sử dụng caacute nhacircn

Thiết kế loại ra quyết định cho mỗi người điều hagravenh caacute nhacircn bằng nhiều lựa chọn đầu ra

Cho pheacutep caacutec đaacutenh giaacute caacute nhacircn caacutec khả năng what-if lựa chọn loại hộp hội thoại

Đồ họa Phải coacute Lagrave một phần quan trọng của nhiều DSS

Thacircn thiện người sử dụng

Phải coacute Phải coacute nếu khocircng coacute người sử dụng trung gian

Xử lyacute thocircng tin Lọc neacuten thocircng tin dograve theo vết dữ liệu vagrave thocircng tin quan trọng

EIS kiacutech thiacutech caacutec cacircu hỏi caacutec cacircu trả lời bằng caacutech sử dụng DSS vagrave phản hồi lại EIS

Hỗ trợ caacutec thocircng tin chi tiết

Truy xuất thường xuyecircn caacutec mức chi tiết của bất kỳ thocircng tin tổng hợp nagraveo (duyệt dữ

Coacute thể coacute trong DSS nhưng khocircng thường

liệu chi tiết)Cơ sở mocirc higravenh Caacutec chức năng coacute sẵn bị hạn

chếLagrave điểm cốt lotildei của DSS

Cấu truacutec Theo người baacuten sản phẩm hoặc theo caacutec chuyecircn gia hệ thống thocircng tin

Theo người sử dụng hoặc caacute nhacircn hoặc caacutec chuyecircn gia từ caacutec trung tacircm thocircng tin hoặc phograveng ban hệ thống thocircng tin

Phần cứng Mainframe caacutec trạm RISC mạng LANs hoặc caacutec hệ thống phacircn bố

Mainframe caacutec trạm RISC caacutec maacutey PC hoặc caacutec hệ thống phacircn bố

Bản chất caacutec goacutei phần mềm

Truy xuất tương taacutec dễ dagraveng đến nhiều cơ sở dữ liệu truy xuất trực tuyến caacutec khả năng DBMS phức tạp caacutec liecircn kết phức tạp

Caacutec khả năng tiacutenh toaacuten lớn caacutec ngocircn ngữ mocirc higravenh mocirc phỏng ứng dụng vagrave caacutec bộ tạo DSS

Bản chất caacutec thocircng tin

Trigravenh bagravey thocircng tin được phaacutet sinh trước về quaacute khứ vagrave hiện tại tạo caacutec thocircng tin mới về quaacute khứ hiện tại tương lai

Tạo thocircng tin mới về quaacute khứ hiện tại tương lai

62 Lịch sử EIS- EIS xuất hiện lần đầu tiecircn tại MIT vagraveo những năm 1970

- Những EIS đầu tiecircn được phaacutet triển bởi caacutec doanh ngiệp lớn sẵn sagraveng chấp nhận rủi ro để đạt được lợi thế cạnh tranh

- Vagraveo những năm 1980 caacutec nhagrave cung cấp đatilde phaacutet triển một số cơ sở khaacutech hagraveng rộng vagrave cocircng nghệ EIS được tiếp tục phaacutet triển cho đến ngagravey nay

(Tagravei liệu thecircm Sử dụng DSSEIS cho phaacutet triển bền vững + Một số nghiecircn cứu đatilde được tiến hagravenh để kiểm tra việc thực hiện của EIS trong khu vực cocircng cộng vagrave chiacutenh phủ caacutec nước tổ chức kể từ khi chuacuteng được phaacutet triển theo định hướng lợi nhuận cho caacutec cocircng ty tư nhacircn (Hasan vagrave Hasan năm 1997) Theo một nghiecircn cứu tiến hagravenh tại Mỹ ở hơn 300 cocircng ty kết quả cho thấy sự khaacutec biệt của EIS giữa tư nhacircn vagrave chiacutenh phủ một số kết quả thuacute vị được phaacutet hiệnViacute dụ khoacute khăn hơn để chuyển tiền từ một tagravei khoản khaacutec trong một EIS của chiacutenh phủ cũng lagrave khoacute khăn hơn để biện giải thiacutech cho những chi phiacute phaacutet triển EIS của chiacutenh phủ Một nghiecircn cứu khaacutec được tiến hagravenh ở Australia

cho thấy rằng EIS cung cấp cho quản lyacute một higravenh ảnh chiacutenh xaacutec hơn về tổ chức thực hiện vagrave cung cấp hỗ trợ cho caacutec lợi iacutech chiến lược cải thiện khocircng chỉ cho caacutec nhagrave quản lyacute nhưng cograven cho phần cograven lại của tổ chức Dựa trecircn caacutec hệ thống được thiết kế cho caacutec cocircng ty tư nhacircn với một caacutech rotilde ragravengxaacutec định mục tiecircu EIS lagrave thiacutech hợp cho caacutec tổ chức cocircng cộng hiện đại nhưng cần phải được linh hoạt hơn vagrave kết thagravenh chugravem một phạm vi rộng hơn khả năng vagrave phương tiện hơn so với khu vực tư nhacircn ban đầu theo định hướng sản phẩm (Hasan vagrave Hasan năm 1997) Điều nagravey coacute thể lagrave do thực tế rằng caacutec hoạt động khu vực cocircng lagrave bắt buộc coacute taacutec động rộng phải đaacutep ứng sự mong đợi duy nhất cocircng cộng thường coacute mục tiecircu mơ hồ vagrave macircu thuẫn iacutet quyền tự chủ vagrave kiểm soaacutet việc ra quyết định vagrave nhacircn viecircn lagrave khoacute khăn hơn (Watson vagrave Carte2000) + Toacutem lại EIS lagrave một khaacutei niệm thagravenh cocircng noacute phaacutet triển qua nhiều năm tuy nhiecircn EIS khắc phục khiếm khuyết của migravenh bằng caacutech tiến hagravenh nghiecircn cứu liecircn tục)

63 Tại sao những người điều hagravenh hagraveng đầu lại khaacutec nhau- Họ lagrave những doanh nghiệp theo định hướng coacute suy nghĩ

- Coacute một khoảng khocircng gian rộng để kiểm soaacutet

- Họ chịu traacutech nhiệm cho việc thiết lập chiacutenh saacutech

- Họ đại diện cho tổ chức mocirci trường becircn ngoagravei

- Hagravenh động của họ tạo ra những kết quả đaacuteng kể về tagravei chiacutenh vagrave con người

Tần số caacutec hoạt động điều hagravenh- Xử lyacute xaacuteo trộn 42

- Hoạt động kinh doanh 32

- Phacircn bổ nguồn lực 17

- Đagravem phaacuten 3

- Những điều khaacutec 6

Handling Disturbances 42

Entrepreneurial Activites 32

Resource Allocation 17

Negotiation 3

Other 6

Những thocircng tin điều hagravenh cần thiết- Quản lyacute xaacuteo trộn coacute thể yecircu cầu sự chuacute yacute xung quanh đồng hồ

- Hoạt động kinh doanh yecircu cầu điều hagravenh để dự đoaacuten những thay đổi trong mocirci trường

- Nhiệm vụ phacircn bổ tagravei nguyecircn yecircu cầu lựa chọn người quản lyacute vagrave caacutec nguồn lực hạn chế được triển khai

- Đagravem phaacuten yecircu cầu cập nhật thocircng tin từng phuacutet để coacute thể xacircy dựng được sự đồng thuận

Caacutec loại thocircng tin điều hagravenh- Hệ thống kế toaacuten coacute liecircn quan đến việc tiacutenh toaacuten thu nhập hoạt động cho caacutec lĩnh

vực cụ thể lagrave quan trọng hơn so với caacutec hệ thống kế toaacuten truyền thocircng- Thocircng tin về thị trường khaacutech hagraveng cung cấp giaacute trị trong việc quyết định chiến

lược- Caacutec thocircng tin cần thiết thường được truyền đi trecircn một số hệ thống maacutey tiacutenh vagrave

nằm trong toagraven tổ chức- Caacutec thocircng tin được sử dụng thường lagrave ngắn hạn vagrave dễ thay đổi

Phương thức để xaacutec định thocircng tin cần thiết

Rockart xaacutec định được năm phương thức cơ bản để xaacutec định thocircng tin cần thiết

- Phương thức dựa trecircn kết quả- Phương thức rỗng- Phương thức chỉ số khoacutea- Phương thức tổng hợp nghiecircn cứu- Phương thức dựa vagraveo nhacircn tố then chốt dẫn đến thagravenh cocircng

64 Thagravenh phần EIS

- Sản phẩm EIS đầu tiecircn được phaacutet triển để sử dụng trecircn maacutey tiacutenh cấu higravenh cao nhưng caacutec sản phẩm hiện nay nhằm mục tiecircu lagrave nền tảng ClientServer

- Những nền tảng linh hoạt hơn coacute thể thiacutech ứng với thay đổi trong tổ chức vagrave cocircng nghệ

- Sử dụng dữ liệu thời gian thực dẫn đến quyết định nhanh hơn nhiều thocircng tin hơn

Thagravenh phần phần cứng- Một EIS khocircng đogravei hỏi coacute phần cứng cụ thể hoặc duy nhất nagraveo- Chigravea khoacutea của vấn đề lagrave để đảm bảo rằng caacutec thagravenh phần của EIS tối ưu hoacutea vagrave

phugrave hợp với tagravei nguyecircn maacutey tiacutenh của tổ chức- Hệ thống nagravey phải được cấu higravenh để caacutec nguồn tagravei nguyecircn phugrave hợp với những

người điều hagravenh chuacuteng

Thagravenh phần phần mềm- Traacutei ngược với phần cứng phần mềm thường được chuyecircn mocircn hoacutea cao cho caacutec

bagravei toaacuten về miền- Sự chuyecircn mocircn hoacutea nagravey thường đạt được bằng caacutech sử dụng thagravenh phần off-the-

shelf cho toagraven bộ EIS vagrave caacutec mocirc-đun tugravey chỉnh để đaacutep ứng nhu cầu cụ thể- Lotus Notes lagrave một viacute dụ điển higravenh Noacute coacute thể được sử dụng một migravenh hoặc coacute

thể phục vụ becircn thứ ba mocirc-đun plug-in

Cocircng nghệ EIS hiện nay

Dobrzeniecki đề xuấtphacircn loạitừng cấptheo bachức năng- Loại 1 sản phẩm bao gồmmột bộ đầy đủcaacutec ứng dụngtừ mộtnhagrave cung cấp- Loại 2 sản phẩm đượcthựchiệnở phần đầu củacaacutecsản phẩmDSS đượcphaacutet triển

bởicugravengmộtnhagrave cung cấp- Loại 3 sản phẩmkết hợp với nhautheo bất kỳ số lượngthuộc sở hữu củacocircng ty

65 Xacircy dựng EIS

- Xacircy dựngmộtEISgiống nhưxacircydựngmột số hệ thống khaacutec củamocirc higravenh hệ thống thocircng tin

- Việcphaacutet triểncấu truacutecnecircn được theo dotildeitừ quaacute trigravenh thiết kế đến quaacute trigravenhthực hiện

- Tuy nhiecircn một dự aacuten phaacutet triển EIScoacute xu hướnglagrave thống nhấtvagraveyecircu cầu hỗ trợ caacutec nhagrave quản lyacute latildenh đạo

- Xacircy dựng một EIScoacute thểphaacutet hiện ra đượccaacutectigravenh huống khoacute khănmagravemột nhagrave phaacutet triển chưabao giờ gặp phải

Mocirc higravenh EIS

Khung phaacutet triển một EIS

- Watson et al đề nghị xacircy dựngkhung với ba thagravenh phần+ Caacutech tiếp cận tập trung vagraveo yếu tốcon người vagrave dữ liệu coacute liecircn quan đến EIS+ Quaacute trigravenh phaacutet triển cần sự linh hoạt vagrave tương taacutec+ Người sử dụng - hệ thống hộp thoại bao gồm một ngocircn ngữ hagravenh động để xử lyacute caacutec lệnh

Lợi iacutech của EIS- Dễ duy trigrave caacutec mục tiecircu coacute tổ chức- Dễ truy xuất thocircng tin- Cho pheacutep người sử dụng nacircng cao hiệu suất hơn

- Tăng chất lượng ra quyết định- Cung cấp sự cải tiến cạnh tranh- Tiết kiệm thời gian của người sử dụng- Tăng khả năng vagrave chất lượng giao tiếp- Cung cấp khả năng điều khiển tốt hơn trong tổ chức- Cho pheacutep tham gia caacutec vấn đề vagrave caacutec cơ hội- Cho pheacutep hoạch định- Cho pheacutep tigravem kiếm nguyecircn nhacircn của một vấn đề- Thảo matilden caacutec yecircu cầu của người điều hagravenh

Hạn chế của EIS vagrave 1 số sai lầm cần traacutenh

- Chi phiacute một cuộc khảo saacutetnăm1991 chothấychi phiacute phaacutet triểntrungbigravenh365000USDvớichi phiacute vận hagravenhhagraveng năm lagrave$200000 (EIS)

- Cocircng nghệ hạn chếEIScần phảiđượctiacutech hợp hoagraven toagravenvagraveokiếntruacuteccủadoanh nghiệphiện tại do đoacute noacutelagrave một thaacutech thứclớn đối vớithiết kế

- Hạn chế tổ chức cơ cấu tổ chứccoacute thể khocircng phugrave hợp

Sự hạn chế về tổ chức- Chương trigravenh nghị sự vagrave thời gian chệch EIS mocirc tả một phần việc thực hiện một

chương trigravenh nghị sự vagrave coacute thể dễ dagraveng đạt được sự tin cậy một caacutech chắc chắn- Đồng bộ hoacutea việc quản lyacute sự tin cậy đuacuteng luacutec đặc biệt baacuteo caacuteo EIS coacute thể phaacute

vỡ sự ổn định thiết lập caacutec chu trigravenh baacuteo caacuteo một caacutech tốt nhất- Sự bất ổn EIS phản ứng nhanh coacute thể gacircy ra việc taacutec động trở lại một caacutech

nhanh choacuteng dẫn đến sự thiếu ổn định trong tổ chức

Sự thất bại lagrave thay thế khocircng thể chấp nhận được- Một số yếu tố lagravem EIS thất bại

+ Thiếu sự hỗ trợ về mặt quản lyacute+ Vấn đề chiacutenh trị+ Thất bại của nhagrave phaacutet triển+ Lỗi về cocircng nghệ+ Giaacute cả+ Thời gian

66 Ra quyết định điều hagravenh trong tương lai vagrave EIS

- Coacute một vagravei điều kiện sẽ được hợp nhất cho việc chuyển đổi cocircng nghệ Trong đoacute một vagravei điều kiện coacute thể dễ dự đoaacuten Hai điều kiện magrave ta coacute thể thấy lagrave+ Phaacutet triển cocircng nghệ maacutey tiacutenh trong việc điều hagravenh sẽ tạo ra sự chuyển đổi được chấp nhận một caacutech dễ dagraveng hơn+ Mở rộng traacutech nhiệm điều hagravenh sẽ mở rộng nhu cầu thocircng tin

Tương lai của EIS- EIS thocircng minh Những tiến bộ trong cocircng nghệ AI sẽ được triển khai trong caacutec

EIS- EIS đa phương tiện Cơ sở dữ liệu đa phương tiện sẽ cho pheacutep tiacutech hợp văn bản

giọng noacutei vagrave higravenh ảnh trong tương lai- EIS thocircng tin Tương lai EIS sẽ mở rộng hơn trong việc sử dụng dữ liệu becircn

ngoagravei doanh nghiệp- EIS kết nối Giao tiếp với băng thocircng rộng cho pheacutep kết nối liecircn thocircng lớn hơn

Chương 7 HỆ CHUYEcircN GIA VAgrave TRIacute TUỆ NHAcircN TẠO

71 Caacutec khaacutei niệm

72 Triacute thocircng minh của triacute tuệ nhacircn tạo

73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia

74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia

75 Lợi iacutech vagrave hạn chế của hệ chuyecircn gia

71 Caacutec khaacutei niệm

Chuyecircn mocircn (Expertise) sự hiểu biết rộng trong 1 lĩnh vực hẹp

Hệ chuyecircn gia (Expert Systems)1 chương trigravenh maacutey tiacutenh sử dụng 1 tập caacutec luật dựa trecircn tri thức của con người để giải quyết caacutec vấn đề đogravei hogravei phải coacute sự chuyecircn mocircn

Một số hệ chuyecircn gia nổi tiếng

DENDRAL (Standford 1960s Edward Feigenbaum)

MYCIN (Standford1970s Edward Shortliffe)

PROSPECTOR (MIT 1979)

Triacute tuệ nhacircn tạo (Artificial Intelligence ndash AI)

Triacute tuệ nhacircn tạo một bộ phacircn của ngagravenh khoa học maacutey tiacutenh quan tacircm đến việc thiết kế caacutec hệ thống maacutey tiacutenh thocircng minh đoacute lagrave caacutec hệ thống đưa ra caacutec đặc điểm magrave từ đoacute chuacuteng ta liecircn hệ với sự thocircng minh trong hagravenh động của con người (Barr vagrave Feigenbaum 1981)

Mục điacutech của AI

Mục điacutech khoa học xaacutec định caacutec gợi yacute để giải thiacutech caacutec loại khaacutec nhau của triacute tuệ thực

Mục điacutech kỹ thuật giải quyết caacutec vấn đề trong thế giới thực

Triacute tuệ nhacircn tạo kế thừa nhiều yacute tưởng quan điểm kỹ thuật từ caacutec ngagravenh khoa học khaacutec

- Triết học

- Logic Toaacuten học

- Tiacutenh toaacuten

- Khoa học tacircm lyacute Khoa học nhận thức

- Sinh học Thần kinh học

- Tiến hoacutea

Caacutec lĩnh vực ứng dụng trong Triacute tuệ nhacircn tạo

Mạng nơ ron thần kinh (Neural Networks)

Tiacutenh toaacuten sự tiến hoacutea

(Evolutionary Computation)

Hệ chuyecircn gia (Expert Systems)

Kỹ thuật xử lyacute tiếng noacutei (Speech Processing)

Kỹ thuật xử lyacute ngocircn ngữ tự nhiecircn

(Natural Language Processing)

Lập kế hoạch (Planning)

Robot (Robotics)

Khoa học higravenh ảnh (Vision)

Caacutec kỹ thuật thocircng dụng dugraveng trong AI

Biểu diễn(Representation)

Học (Learning)

Caacutec luật (Rules)

Tigravem kiếm (Search)

72 Triacute thocircng minh của triacute tuệ nhacircn tạo

Con người suy diễn như thế nagraveo

Phacircn loại (Categorization)

Caacutec quy tắc cụ thể

Heuristics

Kinh nghiệm trước đoacute

Dự tiacutenh trước

Maacutey tiacutenh suy diễn như thế nagraveo

Lập luận dựa trecircn luật IF-THEN mocirc tả tri thức được matilde hoacutea dưới dạng caacutec luật

Caacutec khung (Frames) lagrave caacutec đại diện mocirc tả caacutec tigravenh huống giống nhau lagrave điển higravenh của một vagravei phacircn loại

Lập luận dựa trecircn caacutec trường hợp mocirc phỏng giải phaacutep trước đoacute cho một vấn đề hiện tại

Nhận dạng mẫu phaacutet hiện acircm thanh higravenh dạng hoặc caacutec chuỗi dagravei

Caacutec dạng khaacutec của Triacute tuệ nhacircn tạo

Học maacutey- mạng nơron vagrave giải thuật di truyền

Lập trigravenh tự động ndash lagrave những kỹ thuật tạo ra caacutec chương trigravenh để lagravem 1 nhiệm vụ riecircng biệt (cho pheacutep những người khocircng phải lagrave người lập trigravenh coacute thể lập trigravenh được)

Cuộc sống nhacircn tạo ndash nỗ lực để taacutei tạo caacutec hiện tượng sinh học trong caacutec hệ thống dựa trecircn maacutey tiacutenh

73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia(Expert Systems- ES)

Theo Jackson (1999) Một hệ chuyecircn gia lagrave một chương trigravenh maacutey tiacutenh mocirc tả vagrave suy diễn với tri thức của một vagravei lĩnh vực để giải quyết vấn đề hay đưa ra caacutec lời khuyecircn

Cấu truacutec cơ bản của ES được dựa theo cấu truacutec chung của DSS Sự khaacutec biệt chiacutenh giữa ES vagraveDSS lagrave hệ ES thu thập caacutec kiến thức từ những

chuyecircn gia trong lĩnh vực quan tacircmĐặc trưng của hệ chuyecircn gia Hiệu quả cao Thời gian trả lời thỏa đaacuteng Độ tin cậy cao Dễ hiểu

Giao diện người dugraveng trong ES

Thiết kế giao diện người dugraveng tập trung vagraveo caacutec yếu tố như dễ dagraveng sử dụngcoacute độ tin cậy cao giảm tải những khoacute khăn khi sử dụng

Thiết kế necircn coacute một số tương taacutec (đầu vagraveo kiểm soaacutet vagrave truy vấn)

Cấu tạo giao diện người dugraveng gồm coacute magraven higravenh cảm ứng bagraven phiacutem buacutet saacuteng lệnh thoại caacutec phiacutem chuyecircn dụng

Cơ sở tri thức (Knowledge Base)

Chứa đựng caacutec tri thức cụ thể miền thu được từ caacutec chuyecircn gia miền

Coacute thể chứa caacutec mocirc tả caacutec hagravenh vi giải quyết vấn đề caacutec ragraveng buộc caacutec heuristics

Thagravenh cocircng của một ES dựa trecircn tiacutenh đầy đủ vagrave tiacutenh chiacutenh xaacutec của cơ sở tri thức

Mocirc tơ suy diễn (Inference Engine)

Ở đacircy tri thức được đặt để sử dụng tạo ra caacutec giải phaacutep để giải quyết vấn đề

Mocirc tơ nagravey coacute khả năng thực hiện diễn dịch hoặc suy diễn dựa trecircn caacutec luật hay caacutec caacutec sự kiện

Đồng thời cũng coacute khả năng sử dụng caacutec suy diễn mờ hay khocircng chiacutenh xaacutec dựa trecircn xaacutec suất hay aacutenh xạ mẫu

Vograveng điều khiển suy diễn

1 Aacutenh xạ caacutec luật với caacutec sự kiện đatilde được cho

2 Chọn luật để thực hiện

3 Thực hiện luật bằng caacutech thecircm caacutec sự kiện được suy diễn ra vagraveo bộ nhớ lagravem việc

Chuỗi suy diễn (Chaining)

Suy diễn tiến (forward chaining) maacutey suy diễn bắt đầu từ dữ liệu ban đầu vagrave thực hiện việc suy luận để đưa ra caacutec kết luận cuối cugraveng

Suy diễn lugravei (backward chaining) maacutey suy diễn bắt đầu từ dữ liệu điacutech vagrave tigravem ra tri thức hỗ trợ cho dữ liệu điacutech đoacute

Viacute dụ suy diễn lugravei

R1 Nếu coacute A vagrave B thigrave suy ra coacute D

R2 Nếu coacute B thigrave suy ra coacute C

R3 Nếu coacute C vagrave D thigrave suy ra coacute E

Ta coacute E ta xem trong 3 luật R1 R2 R3 luật nagraveo coacute E ta thấy R3 chứa E đồng thời chứa C vagrave D Xeacutet tiếp trong 2 luật R1 R2 luật nagraveo chứa C vagrave D R2 chứa C R3 chứa D Từ đoacute ta coacute được caacutec tri thức hỗ trợ suy diễn vagrave kết luận lagrave nếu coacute A vagrave B thigrave sẽ coacute E Hay nếu A vagrave B đuacuteng thigrave sẽ coacute E

Viacute dụ suy diễn tiến

Giả sử coacute tập chứa 3 luật sau

R1 Nếu coacute A vagrave B thigrave suy ra coacute D

R2 Nếu coacute B thigrave suy ra coacute C

R3 Nếu coacute C vagrave D thigrave suy ra coacute E

Nếu ta coacute A vagrave B thigrave chuacuteng ta suy ra được D từ R1 vagrave suy ra C từ R2 Với D vagrave C đatilde được suy ra ở trecircn giờ chuacuteng ta suy ra được E từ R3

Viacute dụ thực tế

Giả sử muốn biết magraveu của một con vật nuocirci tecircn lagrave Fred biết rằng noacute kecircu ộp ộp vagrave ăn ruồi

Coacute tập 4 luật ban đầu như sau

R1 Nếu X kecircu ộp ộp vagrave ăn ruồi thigrave X lagrave con ếch

R2 Nếu X kecircu chiecircm chiếp vagrave biết hoacutet thigrave X lagrave con chim

R3 Nếu X lagrave con ếch thigrave X coacute magraveu xanh

R4 Nếu X lagrave con chim thigrave X coacute magraveu vagraveng

74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia

Expert system shells lagrave một tập caacutec goacutei phần mềm vagrave caacutec cocircng cụ dugraveng để phaacutet triển caacutec hệ chuyecircn gia

Những Expert system shells đầu tiecircn thường rất rườm ragrave Mặc dugrave vậy noacute vẫn giuacutep cho người sử dụng sẽ khocircng phải bắt đầu lại từ đầu khi xacircy dựng một hệ chuyecircn gia mới

Những shell hiện đại bao gồm hai mocirc-đun chiacutenh lagrave cocircng cụ xacircy dựng một tập quy tắc vagrave mocirc tơ suy diễn

Xacircy dựng hệ chuyecircn gia

Bước 1 xacircy dựng mocirc higravenh bagravei toaacuten xaacutec định vấn đề nhiệm vụ magrave hệ thống sẽ thực hiện Caacutec dạng bagravei toaacuten cần hệ chuyecircn gia

Bagravei toaacuten diễn giải (InterPretation)

Bagravei toaacuten dự baacuteo (Prediction)

Bagravei toaacuten chuẩn đoaacuten (Diagnose)

Bagravei toaacuten gỡ rối (Debugging)

Bagravei toaacuten thiết kế

Tương tự như một dự aacuten phần mềm để xacircy dựng một hệ chuyecircn gia cần phải coacute caacutec yếu tố về nhacircn lực tagravei nguyecircn vagrave thời gian Những yếu tố nagravey ảnh hưởng đến giaacute thah của một hệ chuyecircn giaTrong phần nagravey cacircu hỏi thường được đặt ra lagrave tại sao cần phải xacircy dựng một hệ chuyecircn giaTrước khi bắt đầu phải xaacute định rotilde bagravei toaacuten đạt ra lagrave jiAi lagrave chuyecircn giaAi lagrave người sử dụng

1 Diễn giải (InterPretation) Nghiecircn cứu 1 vấn đề -gt Dựa trecircn những biểu hiện thuộc tiacutenh đặc trưng becircn ngoagravei -gt Tư vấn

(hoặc đưa ra kết luận hay mocirc tả dễ hiểu từ tập dữ liệu thocirc)

2 Bagravei toaacuten dự baacuteo (Prediction) Coacute thể dự đoaacuten được hagravenh vi kết quả dựa trecircn caacutec hiện tượng -gt dự baacuteo

VD Dự baacuteo thời tiết động đấthellip

3 Bagravei toaacuten chẩn đoaacuten (Diagnoss) Xaacutec định caacutec lỗi caacutec bộ phận hỏng hoacutec của hệ thống dựa trecircn caacutec dữ liệu quan saacutet được

4 Bagravei toaacuten gỡ rối (Debugging) Mocirc tả caacutec phương phaacutep khắc phục hệ thống khi gặp sự cố

5 Bagravei toaacuten thiết kế Lựa chọn cấu higravenh caacutec đối tượng nhằm thoả matilden một số ragraveng buộc nagraveo đoacute

6 Giảng dạy Phần mềm dạy học coacute thể chuẩn đoaacuten vagrave sủa lỗi của học sinh trong quaacute trigravenh học tập

Để xaacutec định đuacuteng bagravei toaacuten magrave chuacuteng ta cần giải quyết thigrave phải trả lời đc một số cacircu hỏi

- cần hệ chuyecircn gia

Bước 2 thu thập tri thức lựa chọn cocircng cụ vagrave aacutep dụng

Trong bước thu thập tri thức vấn đề quan trọng lagrave lựa chọn chuyecircn gia những người magrave sẽ đoacuteng goacutep tri thức cho hệ thống Thocircng thường trong suốt quaacute trigravenh phaacutet triển thigrave chuyecircn gia được xem như một thagravenh viecircn của đội phaacutet triển

Hiện nay coacute rất nhiều cocircng cụ để xacircy dựng một hệ chuyecircn gia Phổ biến nhất lagrave JESS CLIPS vagrave OPS5

Bước 3 Thiết kế cơ sở tri thức thiết kế hệ thốngTri thức được biểu diễn trường minh trong cơ sở tri thức

Caacutec chuyecircn gia vagrave kỹ sư tri thức sẽ đối thoại với nhau bằng caacutec kỹ thuật đối thoại Suy diễn (SD) bảng Mocirc higravenh hoacutea SD quy nạp phacircn loại

Vấn đề bagraveo trigrave vagrave phaacutet triển

Caacutec hệ chuyecircn gia đogravei hỏi phải bảo trigrave vagrave phaacutet triển nhiều hơn so với caacutec hệ thống khaacutec Phải thường xuyecircn bổ sung tri thức mới vagrave thay đổi caacutec tri thức cũ để đổi mới hệ chuyecircn gia

Thu thập vagrave khắc phục lỗi do người sử dụng phaacutet hiện để kịp thời khắc phục những sai soacutet của hệ chuyecircn gia

75 Lợi iacutech vagrave hạn chế của caacutec hệ chuyecircn gia

Một số lợi iacutech chiacutenh

Thời gian trả lời hợp lyacute bằng hoặc nhanh hơn so với chuyecircn gia (người) để đi đến cugraveng một quyết định Hệ chuyecircn gia lagrave một hệ thống thời gian thực (real time system)

Khả năng trả lời với mức độ tinh thocircng bằng hoặc cao hơn so với chuyecircn gia (người) trong cugraveng lĩnh vực

Hệ chuyecircn gia giuacutep cho hiệu quả lagravem việc tăng bằng việc sử dụng tập caacutec luật một caacutech nhanh choacuteng magrave ko bị nhầm lẫn chuyecircn gia lagrave người coacute thể quecircn đi một số tri thức cơ sở lyacute luậ nhưng HCG thigrave ko

Quyết định của một người chuyecircn gia coacute thể bị thay đổi vagrave ko coacute tiacutenh thống nhất như quyết định của một hệ chuyecircn gia tạo ra

Hệ chuyecircn gia giuacutep cho người sử dụng coacute thể trau dồi sự hiểu biết trecircn lĩnh vuej cụ thể magrave noacute giải quyết hỗ trợ người ra quyết định coacute trigravenh độ như 1 chuyecircn gia trong quaacute trigravenh gia quyết định

Kiến thức của rất nhiều chuyecircn gia về một lĩnh vực nagraveo đoacute được đưa vagraveo hệ chuyecircn gia lagravem cho CSTT cuat HCG phong phuacute vagrave rộng lớn hơn rất nhiều

HCG giải thiacutech caacutec bước suy luận một caacutech dễ hiểu nhất quaacuten luacutec nagraveo cũng coacute thể sử dụng ko như chuyecircn gia con người

Hạn chế của caacutec hệ chuyecircn gia

Nhược điểm lớn nhất của hệ chuyecircn gia lagrave những yacute kiến chuyecircn mocircn thường rất khoacute matilde hoacutea vagrave giải neacuten

Hệ chuyecircn gia khocircng coacute khả năng tự học tự cập nhật kiến thức mới như caacutec chuyecircn gia magrave cần phải được matilde hoacutea lại khi noacute được cập nhật

Hệ chuyecircn gia khocircng thể nhận ra được vấn đề khocircng nằm trong miền kiến thức của hệ thống

Chương 8 Tri thức vagrave tiếp nhận

1 Bao gồm caacutec vấn đề

Dữ liệu thực tế đo lường hoặc quan saacutet coacute hoặc khocircng coacute bối cảnh

Thocircng tin dữ liệu được tổng hợp một caacutech hữu iacutech để giải quyết những khoacute khăn trong việc đưa ra quyết định

Tri thức bao gồm caacutec ứng dụng quy tắc thocircng tin hướng dẫn của người ra quyết định

2 Những caacutei nhigraven về tri thức

Đại diện lagravem thế nagraveo để diễn tả tri thức viacute dụ như một quyển saacutech khocircng phải lagrave tri thức nhưng noacute lại lagrave một đại diện của tri thức

Sản xuất tri thức lagrave một tập hơp của hagraveng tồn kho coacute thể được sản xuất cũng như mua lại

Tri thức lagrave 1 trong 6 trạng thaacutei của hệ thống

1Dữ liệu 2Thocircng tin 3Cấu truacutec thocircng tin 4Sự thấu hiểu 5Yacute kiến 6 Quyết định

3 Caacutec loại tri thức Phổ biến mocirc tả dữ liệu thocircng tin thủ tục mọi thứ lagravem như thế nagraveo lập luận chiacutenh saacutech hoặc caacutec quy tắc

4 Thu thập Tri thức hệ chuyecircn gia Hầu hết caacutec phương phaacutep đều bắt đầu với mocirc higravenh của caacutec taacutec vụ trong đoacute

hệ chuyecircn gia được xacircy dựng Trong đoacute mocirc tả về caacutec lĩnh vực được tạo ra Caacutec kỹ sư sử dụng caacutec mocirc higravenh giả thuyết vagrave nhận thức về quaacute trigravenh phacircn

tiacutech để gợi ra caacutech giải quyết vấn đề về tri thức từ caacutec chuyecircn gia

5 Caacutec chiều của thu thập tri thức KE- driven caacutec kỹ sư trao đổi trực tiếp với caacutec chuyecircn gia Expert-driven Caacutec chuyecircn gia trực tiếp đưa chuyecircn mocircn của họ vagraveo hệ

thống maacutey tiacutenh Machine-driven Sử dụng caacutec cocircng cụ suy luận để triacutech xuất tri thức từ một

tập caacutec viacute dụ

6 Kỹ thuật thu thập tri thức Trao đổi gồm 2 loại cơ bản lagrave coacute cấu truacutec(coacute kịch bản) vagrave khocircng coacute cấu

truacutec( đối thoại trực tiếp) Giao thức phacircn tiacutech bằng lời Khi caacutec chuyecircn gia thực hiện một cocircng việc

của họ thigrave một bản ghi về cocircng việc đoacute được thực hiện Caacutec kỹ sư sẽ xacircy dựng mocirc higravenh cho những gigrave được ghi lại trong bản ghi

Phương phaacutep sagraveng lọc caacutec chuyecircn gia so saacutenh caacutec nhoacutem liecircn tiếp trong ba đối tượng vagrave cho biết tại sao nhoacutem thứ hai lại khaacutec nhoacutem thứ ba

7 Thu thập tri thức từ nhiều nguồn Thu thập tri thức từ nhiều nguồn lagrave cần thiết để coacute được đầy đủ caacutec tri thức

cho một vấn đề quan điểm yacute kiến traacutei ngược nhau thường phaacutet sinh Phương phaacutep đồng thuận sẽ giuacutep giải quyết được vấn đề macircu thuẫn Kỹ thuật phacircn tiacutech Meta lagrave kỹ thuật được aacutep dụng trong caacutec trường hợp

khaacutec Caacutech tiếp cận bằng định lượng đogravei hỏi caacutec kỹ sư cần cacircn nhắc yếu tố đầu vagraveo của caacutec chuyecircn gia khaacutec nhau

8 Xaacutec nhận hợp lệ vagrave kiểm tra tri thức Một khi thu thập tri thức noacute phải được đaacutenh giaacute về khả năng sử dụng vagrave độ

chiacutenh xaacutec Hai vấn đề cụ thể lagrave hiệu lực của những kiến thức vagrave kiểm tra việc xacircy dựng cơ sở của tri thức

Cần xaacutec nhận xem liệu hệ thống coacute thể hoạt động ở mức độ tối thiểu khocircng

Xaacutec minh liecircn quan đến việc so saacutenh từng chi tiết kỹ thuật của hệ thống những gigrave đatilde được thực hiện cuối cugraveng

9 Một số caacutec biện phaacutep xaacutec nhận Độ chiacutenh xaacutec Khả năng thiacutech nghi Mức độ đầy đủ Bề rộng Độ sacircu Hiệu lực Tổng quan Chiacutenh xaacutec Hiện thực Độ tin cậy Tiacutenh hữu dụng Mức độ

Chương 9 Học maacutey

1 Logic mờ vagrave ngocircn ngữ mờ(Fuzzy Logic and Linguistic Ambiguity)

Ngocircn ngữ tự nhiecircn gồm những khaacutei niệm mơ hồ vagrave khocircng chiacutenh xaacutectruyền tải ngữ nghĩa thocircng qua tiacutenh xấp xỉkhocircng rotilde ragraveng

Những xấp xỉ nagravey giuacutep con người coacute thể truyền tải hết được yacute nghĩa nhưng maacutey thigrave khocircng hiểu

Lagravem sao biểu diễn caacutec tri thức sử dụng caacutec khaacutei niệm khocircng rotilde ragraveng(mờ) hoặc khocircng chiacutenh xaacutec

2 Khaacutei niệm cơ bản của logic mờ tập mờ lagrave những tập hợp khocircng coacute một giới hạn rotilde Mỗi phần tử của noacute chỉ

chứa một mức độ hagravem liecircn thuộc của từng phần tử Vigrave vậy tập mờ khocircng giống như tập cổ điển Tập mờ coacute thể kết hợp với nhau qua những luật mờ magrave đặc trưng cho những hagravenh động trạng thaacutei vagrave thuộc tiacutenh của logic mờ được tận dụng khi thực hiện một bộ điều khiển mờ

Logic mờ dựa trecircn yacute tưởng mỗi phần tử thuộc vagraveo một tập hợp ở một mức độ nagraveo đấy

Locircgic mờ cho pheacutep độ liecircn thuộc (microA )coacute giaacute trị trong khoảng (01) Locircgic mờ coacute thể được coi lagrave mặt ứng dụng của lyacute thuyết tập mờ để xử lyacute caacutec

giaacute trị trong thế giới thực cho caacutec bagravei toaacuten phức tạp

3 So saacutenh tiacutenh đuacuteng đắn logic mờ vagrave xaacutec suất Xaacutec suất thigrave đề cập đến khả năng xảy ra một biến cố hay một điều gigrave đoacute Logic mờ đề cập đến cấp độ magrave đặc tiacutenh ở hiện tại

o viacute dụ1 người coacute chiều cao 6 feet thigrave coacute cấp độ lagrave 05 về chiều cao

4 Ưu điểm của logic mờ Caacutech tiếp cận rất tự nhiecircnkhocircng phức tạp Coacute thể mocirc higravenh hoacutea caacutec hagravem phi tuyến tugravey yacute phức tạp

Coacute thể tận dụng được kinh nghiệm từ những chuyecircn gia hagraveng đầu trong mọi lĩnh vực

Logic mờ được xacircy dựng dựa trecircn ngocircn ngữ tự nhiecircnNền tảng của logic mờ lagrave dựa trecircn cơ sở giao tiếp của con người

5 Nhược điểm của logic mờ Trong 1 hệ thống phức tạpsử dụng logic mờ coacute thể trở thagravenh trở ngại cho

việc xaacutec thực độ tin cậy của hệ thống Cơ chế lập luận mờ khocircng thể học hỏi từ những lỗi sai

6 Mạng noron nhacircn tạo(ANN) Mạng noron nhacircn tạo lagrave một mocirc phỏng xử lyacute thocircng tinđược nghiecircn cứu ra

từ hệ thống thần kinh của sinh vậtgiống như bộ natildeo để xử lyacute thocircng tin ANNs lagrave chương trigravenh dựa trecircn maacutey tiacutenh đơn giản coacute chức năng lagrave một mocirc

higravenh bagravei toaacuten khocircng gian dựa trecircn thử nghiệm vagrave baacuteo lỗi

7 Học từ kinh nghiệm Tiến trigravenh Một mẫu dữ liệu được biểu diễn như một mạng lưới noronANN ldquodự

đoaacutenrdquo 1 đầu radự đoaacuten được so saacutenh với giaacute trị thực tế hoặc giaacute trị chiacutenh xaacutecNếu đoaacuten được chiacutenh xaacutec thigrave khocircng coacute hagravenh động nagraveo được thực hiện

Nếu dự đoaacuten sai ANN kiểm tra lại vagrave xaacutec định lại thocircng số để điều chỉnh Một mẫu dữ liệu khaacutec được biểu diễn vagrave quaacute trigravenh nagravey được lặp lại

8 Nguyecircn tắc cơ bản của cocircng nghệ nơron Caacutec yếu tố xử lyacute cơ bản trong hệ thống thần kinh của con người lagrave tế bagraveo

thần kinhMạng lưới của tế bagraveo nagravey lagrave liecircn kết với nhau nhận được thocircng tin từ caacutec cảm biến trong mắt taihellip

Thocircng tin nhận được bởi tế bagraveo thần kinh hoặc lagrave sẽ kiacutech thiacutech noacute(sẽ được chuyển qua 1 thocircng điệp dọc theo mạng lưới) hoặc lagrave sẽ ngăn cản noacute(ngăn cản dograveng thocircng tin)

Độ nhạy coacute thể thay đổi qua thời gian hoặc sau khi coacute được kinh nghiệm

9 Cấu truacutec mạng Một ANN gồm 3 lớp cơ bản

Lớp đầu vagraveo nhận dữ liệu Lớp becircn trong hoặc lagrave lớp ẩn xử lyacute dữ liệu Lớp đầu ra chuyển tiếp kết quả cuối cugraveng của mạng

10Mạng nơ ron Thường coacute nhiều đầu vagraveo mỗi đầu vagraveo với mức ảnh hưởng vagrave tầm quan

trọng riecircng của noacute Một đầu vagraveo quan trọng coacute thể được sử dụng để khuếch đại đầu ra caacutec hagravem trạng thaacutei tổng hợp caacutec trọng số của caacutec yếu tố

đầuvagraveo khaacutec nhauvagraveo một giaacute trị duy nhất Caacutec hagravem chuyển giao xử lyacute caacutec giaacute trị trạng thaacutei vagrave tạo đầu ra

11Huấn luyện mạng nơ ron Trong mocirc higravenh coacute giaacutem saacutetANN được đến so saacutenh dự đoaacuten của chiacutenh

noacute với thocircng tin phản hồi coacute chứa caacutec kết quả mong muốn ANN sẽ phải tigravem caacutech thay đổi caacutec tham số becircn trong củamigravenh (caacutec trọng số vagrave caacutec ngưỡng) để tạo necircn một aacutenh xạ coacute khả năng aacutenh xạcaacutec đầu vagraveo thagravenh caacutec đầu ra mong muốn Sự thay đổi nagravey được tiến hagravenh nhờ việc so saacutenh giữa đầu ra thực sự vagrave đầu ra mong muốn

Trong mocirc higravenh khocircng coacute giaacutem saacutetANN nhận được dữ liệu vagraveo nhưng khocircng phải coacute bất kỳ thocircng tin phản hồi về kết quả mong muốn

Phần lớn caacutec ứng dụng nằm trong vugraveng của caacutec bagravei toaacuten ước lượng như mocirc higravenh hoacuteathống kecirc neacuten lọc phacircn cụm

12Lợi iacutech Liecircn kết với mạng noron Traacutenh caacutech lập trigravenh tường minh Giảm nhu cầu của chuyecircn gia ANNs thigrave thiacutech nghi với caacutec yếu tố đầu vagraveo thay đổi Khocircng cần thiết cho cơ sở tri thức tinh chế ANNs coacute tiacutenh động vagrave cải thiện với việc sử dụng Coacute khả năng xử lyacute dữ liệu khocircng chiacutenh xaacutec hoặc khocircng đầy đủ Cho pheacutep tổng quaacutet hoacutea từ thocircng tin cụ thể Cho pheacutep thu thập cảm giaacutec thocircng thường vagraveo miền giải quyết vấn đề

13Hạn chế của việc liecircn kết với mạng noron ANNs khocircng thể giải thiacutech được suy luận Bản chất hộp đen thường khiến cho vấn đề traacutech nhiệm vagrave độ tin cậy phaacutet

sinh lagrave khoacute khăn Lặp đi lặp lại quaacute trigravenh huấn luyện rất tốn thời gian Nguồn lực caacutec nhagrave phacircn tiacutech vagrave thiết kế coacute tay nghề cao vẫn lagrave đaacuteng lo

ngại Cocircng nghệ ANN thuacutec đẩy hạn chế của phần cứng hiện tại ANN yecircu cầu phải coacute sự tin tưởng ở đầu ra

14Giới thiệu về thuật toaacuten di truyền Cũng như mạng lưới thần kinh caacutec thuật toaacuten di truyền được dựa trecircn lyacute

thuyết sinh học Thuật toaacuten di truyền tigravem thấy nguồn gốc của chuacuteng trong caacutec lyacute thuyết

tiến hoacutea của chọn lọc tự nhiecircn vagrave thiacutech ứng với biến đổi khiacute hậu Kết quả thuật toaacuten di truyền lagrave từ giao phối 2 caacute thể trong quần thế để tạo

ra con caacutei đocirci khi tốt hơn so với bậc cha mẹ của chuacuteng 15Caacutec thagravenh phần cơ bản của thuật toaacuten di truyền

Toaacuten tử chọn lọc Caacutec caacute thể tốt được chọn lọc để đưa vagraveo thế hệ sau Sự chọn lọc nagravey căn cứ vagraveo độ thiacutech nghi với mocirci trường của mỗi caacute thể

Toaacuten tử lai gheacutep (crossover) Hai caacute thể cha vagrave mẹ trao đổi caacutec gen với nhau để tạo ra caacute thể con

Toaacuten tử đột biến (mutation) Một caacute thể thay đổi một số gen để biến đổi thagravenh một caacute thể mớiTất cả caacutec toaacuten tử trecircn khi thực hiện đều mang tiacutenh ngẫu nhiecircn

16Quaacute trigravenh cơ bản của một thuật toaacuten di truyền Khởi tạo

Đaacutenh giaacute quần thể

Lựa chọn NST thiacutech hợp nhất vagrave loại bỏ NST yếu nhất

Quy trigravenh giao nhau vagrave cải thiện quần thể

đột biến tiến trigravenh để khaacutem phaacute ra NST mới

17Ưu nhược điểm của việc kết hợp với thuật toaacuten di truyền Kiacutech thước quần thể lagrave 1 yếu tố quan trọng trong tốc độ của việc tigravem

kiếmnhưng noacute tương đối dễ dagraveng để dự đoaacuten tốc độ nagravey Giao nhau hoặc đột biến lagrave khocircng necircn đc sử dụng quaacute thường xuyecircn Luocircn coacute được iacutet nhất 1 giải phaacutep hợp lyacute Necircn coacute thể aacutep dụng chuacuteng cho caacutec vấn đề magrave chuacuteng ta khocircng coacute hướng

về caacutech giải quyết Sức mạnh của thuật toaacuten xuất phaacutet từ khaacutei niệm đơn giảnkhocircng phải từ

một thủ tục thuật toaacuten phức tạp 18Tương lai của học maacutey

Mạng lưới thần kinh nhacircn tạo vượt quaacute năng lực của con người trong caacutec trường hợp bị cocirc lập

Về mặt lyacute thuyếtmột maacutey tiacutenh coacute thể xử lyacute dũ liệu nhanh hơn hagraveng triệu lần so với 1 con người

May mắn thay cho chuacuteng tacon người tốt hơn nhiều khi magrave coacute được dữ liệumaacutey tiacutenh khocircng coacute 1 số thứ như lagrave 5 giaacutec quan

CHƯƠNG 10 KHO DỮ LIỆU

1 Kho dữ liệu Kho dữ liệu lagrave tuyển tập caacutec cơ sở dữ liệu tiacutech hợp hướng chủ đề được

thiết kế để trợ giuacutep cho một hệ hỗ trợ quyết định

Theo John Ladley Cocircng nghệ kho dữ liệu lagrave tập caacutec phương phaacutep kỹ thuật vagrave caacutec cocircng cụ coacute thể kết hợp hỗ trợ nhau để cung cấp thocircng tin cho người sử dụng trecircn cơ sở tiacutech hợp từ nhiều nguồn dữ liệu nhiều mocirci trường khaacutec nhau

Kho dữ liệu thường rất lớn tới hagraveng trăm GB hay thậm chiacute hagraveng Terabyte

2 Kho dữ liệu vận hagravenh (ODS) Một kho dữ liệu vận hagravenh Aacutep dụng kỹ thuật kho dữ liệu vagraveo caacutec hệ xử

lyacute giao taacutec lưu trữ dữ liệu cho một ứng dụng đặc thugrave Noacute đưa vagraveo kho dữ liệu một dograveng caacutec dữ liệu thocirc được thiết kế

3 So saacutenh

Kho dữ liệu vận hagravenh Kho dữ liệu

Dữ liệu theo chủ đề Dữ liệu theo chủ đề

Dữ liệu tiacutech hợp Dữ liệu tiacutech hợp

Dữ liệu thay đổi Dữ liệu khocircng thay đổi

Dữ liệu được cập nhật khi thay đổi

Dữ liệu giữ nguyecircn

Chỉ coacute dữ liệu hiện tạiDữliệu hiện tại vagrave dữ liệu lịch sử

Chu kỳ lagravem tươi dữ liệu ngắn Chu kỳ lagravem tươi dữ liệu dagravei

Chỉ coacute dữ liệu chi tiết Dữ liệu chi tiết vagrave dữ liệu tổng kết

Dugraveng cho caacutec quyết định ngắn hạn

Dugraveng cho hoạch định dagravei hạn

4 Kho dữ liệu cục bộ (Data Mart - DM)

Kho dữ liệu cục bộ lagrave CSDL coacute những đặc điểm giống với kho dữ liệu nhưng với quy mocirc nhỏ hơn vagrave lưu trữ dữ liệu về một lĩnh vực một chuyecircn ngagravenh

Data mart phụ thuộc Chứa những dữ liệu được lấy từ DW vagrave những dữ liệu nagravey sẽ được triacutech lọc vagrave tinh chế tiacutech hợp lại ở mức cao hơn để phục vụ một chủ đề nhất định của Datamart

Data mart độc lập Khocircng giống như Datamart phụ thuộc Data mart độc lập được xacircy dựng trước DW vagrave dữ liệu được trực tiếp lấy từ caacutec nguồn khaacutec nhau

5 Siecircu dữ liệu Metadata lagrave dữ liệu để mocirc tả dữ liệu Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột

một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi Metadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu

6 Mocirci trường kho dữ liệu Hệ thống của tổ chức vagrave kho cung cấp dữ liệu để xacircy dựng kho dữ liệu Trong quaacute trigravenh chuyển dữ liệu từ caacutec nguồn khaacutec nhau dữ liệu coacute thể

được lagravem sạch hoặc chuyển đổi vagrave vigrave thế DW được xem như lagrave một chuẩn cho việc lưu trữ

Đồng thời siecircu dữ liệu được ghi lại Cuối cugraveng DW hoặc siecircu thị coacute thể được sử dụng để tạo ra một kho dữ

liệu ldquocaacute nhacircnrdquo 7 Caacutec đặc điểm của kho dữ liệu

Đặc điểm Mocirc tả

Hướng chủ đề - DL tổ chức theo caacutech thức người dugraveng tham chiếu

Tiacutech hợp - Dữ liệu ldquosạchrdquo loại bỏ tiacutenh thiếu nhất quaacuten

Khocircng thay đổi - DL ldquochỉ đọcrdquo người dugraveng khocircng thay đổi được

Chuỗi thời gian - DL lagrave chuỗi thời gian khocircng phải lagrave trạng thaacutei hiện tại

Được tổng kết - DL vận hagravenhthao taacutec khi cần thiết

được kết hợp lại thagravenh dạng coacute thể dugraveng được cho quyết định

Kiacutech cỡ lớn hơn - Lưu giữ theo chuỗi thời gian tức lagrave giữ lại nhiều DL

Khocircng được chuẩn hoacutea - Coacute thể dư thừa DLSiecircu dữ liệu - Dữ liệu của dữ liệu được lưu trữNguồn dữ liệu - DL vận hagravenh (caacutec hệ sẵn coacute) cugraveng

với caacutec nguồn ngoagravei 8 Kho dữ liệu hướng chủ đề

Hướng chủ để coacute nghĩa lagrave kho dữ liệu được tổ chức xung quanh caacutec chủ đề chiacutenh như khaacutech hagraveng sản phẩm sản xuất Tập trung vagraveo việc mocirc higravenh hoacutea vagrave phacircn tiacutech dữ liệu cho caacutec nhagrave ra quyết định magrave khocircng tập trung vagraveo caacutec xử lyacute thocircng thường Cung cấp cho người dugraveng một khung nhigraven toagraven vẹn đơn giản vagrave đầy đủ về caacutec sự kiện quanh caacutec chủ đề

9 Dữ liệu trong DW được tiacutech hợp Dữ liệu trong kho dữ liệu được xacircy dựng bằng caacutech tổng hợp dữ liệu từ

nhiều nguồn khaacutec nhau vagrave caacutec nguồn coacute tổ chức khaacutec nhau Cơ sở dữ liệu caacutec file excel caacutec flat file hoặc caacutec raw file Khi đưa vagraveo kho dữ liệu caacutec dữ liệu được lagravem sạch vagrave tiacutech hợp dữ liệu nhằm đảm bảo tiacutenh nhất quaacuten của dữ liệu

10Kiến truacutec kho dữ liệu Tầng cơ sở dữ liệu hoạt động Tầng truy xuất thocircng tin Tầng truy xuất dữ liệu Tầng siecircu dữ liệu Tầng quản lyacute tiến trigravenh Tầng thocircng điệp của ứng dụng Tầng vật liacute của kho dữ liệu Tầng trigravenh diễn dữ liệu

11Higravenh trạng kho dữ liệu Kho dữ liệu ảo - người dugraveng cuối coacute thể truy cập trực tiếp đến kho dữ liệu

sử dụng caacutec cocircng cụ cho pheacutep ở tầng truy xuất dữ liệu Kho dữ liệu trung tacircm-1 cơ sở dữ liệu vật lyacute chứa tất cả dữ liệu cho một

vugraveng chuyecircn dụng nagraveo đoacute

Kho dữ liệu phacircn taacuten- Thagravenh phần được phacircn taacuten qua nhiều hệ cơ sở dữ liệu vật lyacute

12METADATA- Siecircu dữ liệu Định nghĩa Siecircu dữ liệu lagrave dữ liệu về dữ liệu Lagrave 1 lưu trữ dugraveng để

Miecircu tả kho dữ liệu tổng thể Nhận dạng kiểu kho dữ liệu Quản liacute quaacute trigravenh tiacutech hợp dữ liệu Quản liacute quaacute trigravenh cập nhật kho dữ liệu Quản liacute bảo mật

Lagrave chigravea khoacutea quyết định sự thagravenh cocircng của kho dữ liệu luocircn được thay đổi vagrave cập nhật theo sự phaacutet triển của kho dữ liệu

Dugraveng để quản liacute điều khiển kho dữ liệu Sự ra đời của kho dữ liệu như 1 cấu truacutec hỗ trợ ra quyết định siecircu dữ liệu

được xem như nguồn tagravei nguyecircn dữ liệu Siecircu dữ liệu lagrave trừu tượng Chuacuteng lagrave dữ liệu bậc cao cung cấp mocirc tả ngắn

gọn caacutec dữ liệu bậc thấp hơn 13Hoạt động của Siecircu dữ liệu

Siecircu dữ liệu rất cần thiết trong việc chuyển hoacutea thocircng tin trở thagravenh tri thức Lagrave chigravea khoacutea giuacutep chuacuteng ta xử lyacute được dữ liệu thocirc Viacute dụ một dograveng dữ liệu baacuten hagraveng 1023 K596 11121 agraveNoacute sẽ khocircng coacute nghĩa gigrave cho đến khi chuacuteng ta đưa vagraveo siecircu dữ liệu (thư

mục chứa dữ liệu) agrave cửa hagraveng 1023 sản phẩm K596 vagrave số tiền baacuten được lagrave 11121 đocirc la

14Sự cần thiết phải nhất quaacuten trong kho dữ liệu Kho dữ liệu được xacircy dựng cho lợi iacutech của những nhagrave phacircn tiacutech kinh

doanh caacutec nhagrave quản trị cho tất cả caacutec khu vực chức năng Trong cơ sở dữ liệu riecircng caacutec khu vực khaacutec nhau coacute thể định nghĩa vagrave lưu

trữ dữ liệu thocircng qua phiecircn bản của chiacutenh noacute Khi dữ liệu được lấy từ những vugraveng khaacutec nhau đoacute vagrave được đặt vagraveo kho dữ

liệu Việc chuyển đổi vagrave lagravem sạch caacutec tiến trigravenh sẽ đảm bảo noacute lagrave duy nhất được tiacutech hợp tại một mức của tổ chức

15Ragrave soaacutet lại dữ liệu ndash Thực thi siecircu dữ liệu

Bất kể cấu truacutec tự nhiecircn của 1 cacircu truy vấn thế nagraveo thigrave caacutec thagravenh phần của siecircu dữ liệu rất quan trọng đối với người ra quyết định

Bảng thuộc tiacutenh khoacutea được lưu trữ bởi kho dữ liệu Tập hợp dữ liệu được lấy từ đacircu Những chuyển đổi nagraveo được thực thi với việc lagravem sạch

16Siecircu dữ liệu lagrave gigrave Metadata - lagrave thocircng tin mocirc tả nội dung của cơ sở dữ liệu (CSDL) Metadata baacuteo cho người dugraveng biết thời gian cập nhật sau cugraveng của dữ liệu

định dạng vagrave mục điacutech sử dụng của noacute Những thocircng tin nagravey coacute thể hướng dẫn người dugraveng duyệt qua CSDL vagrave

giuacutep họ hiểu được yacute nghĩa vagrave ngữ cảnh của dữ liệu Trong CSDL metadata lagrave caacutec dạng biểu diễn khaacutec nhau của caacutec đối tượng

trong CSDL Trong CSDL quan hệ metadata lagrave caacutec định nghĩa của bảng cột CSDL

view vagrave nhiều đối tượng khaacutec Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột

một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi -gtMetadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu

Bảng chuyển đổi Ghi lại những chuyển đổi đatilde được thực hiện

Lịch sử thực thi Ghi lại những dữ liệu đatilde được

phacircn tiacutech

Higravenh thaacutei kết nốiGhi lại những dữ liệu được kết nối vagrave tần suất

17Aacutenh xạ thocircng thường của siecircu dữ liệu Bản ghi aacutenh xạ chuyển đổi bao gồm

Định danh của nguồn gốc Chuyển đổi thuộc tiacutenh Chuyển đổi thuộc tiacutenh vật lyacute Matilde hoacutea tham chiếu bảng chuyển đổi Đổi tecircn Đổi khoacutea Gaacuten giaacute trị cho thuộc tiacutenh mặc định Chọn logic cho caacutec nguồn nhiều giaacute trị Đổi thuật toaacuten

18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để

phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai

lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave

tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec

Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm

Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo

19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua

caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau

SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được

Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra

một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức

Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ

Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ

Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech

CHƯƠNG 11 KHAI PHAacute DỮ LIỆU

1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn

ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993

Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng

2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd

1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều

2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP

3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn

4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng

5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server

6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo

7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động

8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời

9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều

10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện

11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech

12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP

3 Xử lyacute phacircn tiacutech trực tuyến OLAP

MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave

dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu

ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave

thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu

HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave

ROLAP4 Khai phaacute dữ liệu

Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh

khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn

Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan

5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp

6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại

Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp

Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec

Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt

Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra

Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh

vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho

Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec

Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm

Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục

Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng

gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp

Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn

Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec

Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper

Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2

Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25

Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước

Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng

Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện

trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp

Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute

độ hỗ trợ ge ngưỡng minsup

độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan

Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn

Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết

Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu

MOLAP ROLAP HOLAP

Lưu trữ dữ liệu cơ sở

Khối Bảng quan hệ Bảng quan hệ

Lưu trữ thocircng tin tổng hợp

Khối Bảng quan hệ Khối

Hiệu suất thực hiện truy vấn

Nhanh nhất Chậm nhất Nhanh

Tiecircu thụ khocircng gian lưu trữ

Nhiều Thấp Trung bigravenh

Chi phiacute bảo trigrave Cao Thấp Trung bigravenh

Page 14: De cuong(1-11)

bull Lagrave một tiếp cận giuacutep tigravem ra caacutec giải phaacutep khả thithỏa matildenđủ tốt cho caacutec bagravei toaacuten phức tạp Coacute thể coacute giải phaacutep đủ tốt (90-999 giaacute trị của lời giải tối ưu) nhanh choacuteng vagrave đỡ tốn keacutem hơn bằng caacutech dugraveng heuristics bull Quaacute trigravenh heuristic lagrave datildey caacutec bước xacircy dựng caacutec quy luật giải quyết vấn đề thocircng qua việc tigravem kiếm caacutec con đường hứa hẹn nhất dẫn đến lời giải tigravem kiếm caacutech thức thu thập vagrave phacircn giải thocircng tin theo quaacute trigravenh giải vagrave phaacutet triền caacutec phương phaacutep dẫn đến một giải thuật tiacutenh toaacuten hay một lời giải tổng quaacutet đatilde coacute bull Aacutep dụng chủ yếu cho bagravei toaacuten cấu truacutec yếu cũng dugraveng để tigravem ra giải phaacutep chấp nhận được cho bagravei toaacuten cấu truacutec chặt bull Khocircng đủ tổng quaacutet như caacutec giải thuật thường chỉ dugraveng cho tigravenh huống đặc thugrave đang xeacutet bull Coacute thể dẫn đến một giải phaacutep dở - caacutec thủ tục từng bước giải quyết vấn đề khocircng đảm bảo tigravem ra giải phaacutep tối ưu bull Heuristic coacute thể lagrave định lượng vigrave vậy coacute thể đoacuteng vai trograve quan trọng trong cơ sở mocirc higravenh của hệ hỗ trợ quyết định bull Heuristic coacute thể lagrave định tiacutenh vigrave vậy coacute thể đoacuteng vai trograve quan trọng trong cung ứng kiến thức cho hệ chuyecircn gia bull Quaacute trigravenh heuristic liecircn quan đến tigravem kiếm học tập ước lượng phacircn xử vagrave lặp lại caacutec hoạt động nagravey dọc theo tiến trigravenh bull Kiến thức thu được dugrave thagravenh cocircng hay thất bại trong quaacute trigravenh đều được phản hồi vagrave sửa đổi chiacutenh quaacute trigravenh nhờ đoacute coacute thể định nghĩa lại mục tiecircu hay bagravei toaacuten 1048713 Giải thuật di truyền bắt đầu bằng tập caacutec giải phaacutep được sinh ngẫu nhiecircn taacutei kết hợp caacutec cặp giải phaacutep một caacutech ngẫu nhiecircn bull Tigravenh huống necircn dugraveng heuristics 1048713 Dữ liệu đầu vagraveo khocircng chiacutenh xaacutec hay coacute giới hạn 1048713 Thực tế quaacute phức tạp đến nỗi khocircng dugraveng được caacutec mocirc higravenh tối ưu 1048713 Chưa coacute được giải thuật chiacutenh xaacutec vagrave đủ tin cậy 1048713 Bagravei toaacuten phức tạp necircn sẽ khocircng kinh tế nếu dugraveng tối ưu hay mocirc phỏng hoặc tốn quaacute nhiều thời gian tiacutenh toaacuten 1048713 Coacute thể cải thiện tiacutenh hiệu quả của quaacute trigravenh tối ưu (tức coacute thể sinh ra caacutec giải phaacutep ban đầu tương đối tốt) 1048713 Liecircn quan đến xử lyacute kyacute hiệu chứ khocircng phải xử lyacute kyacute số (như hệ chuyecircn gia) 1048713 Cần coacute quyết định nhanh vagrave caacutec xử lyacute dựa vagraveo maacutey tiacutenh đều khocircng khả thi (một số heuristic khocircng cần đến maacutey tiacutenh) bull Thuận lợi 1048713 Dễ hiểu dễ giải thiacutech vagrave dễ cagravei đặt 1048713 Nacircng cao tiacutenh saacuteng tạo vagrave năng lực heuristic cho caacutec vấn đề khaacutec 1048713 Tiết kiệm thời gian xaacutec lập vấn đề 1048713 Tiết kiệm yecircu cầu về bộ chứa vagrave xử lyacute maacutey tiacutenh

1048713 Tiết kiệm thời gian tiacutenh toaacuten vagrave do vậy tiết kiệm thời gian thực trong ra quyết định Một số vấn đề phức tạp đến nỗi chỉ coacute thể giải được bằng heuristics 1048713 Thường sinh ra nhiều giải phaacutep chấp nhận được 1048713 Thường coacute thể phaacutet biểu lyacute thuyết hay đo lường thực nghiệm về chất lượng của giải phaacutep (tức giaacute trị mục tiecircu của giải phaacutep gần với giaacute trị tồi ưu đến mức nagraveo dugrave giaacute trị tối ưu chưa biết được) 1048713 Coacute thể kết hợp tiacutenh thocircng minh vagraveo để hướng dẫn pheacutep tigravem kiếm (tigravem kiếm tabu) Năng lực thocircng minh đoacute coacute thể lagrave đặc thugrave theo bagravei toaacuten hoặc dựa trecircn yacute kiến chuyecircn gia được cấy trong hệ chuyecircn gia hoặc cơ chế tigravem kiếm 1048713 Coacute thể dugraveng heuristic hiệu quả vagraveo caacutec mocirc higravenh coacute thể giải bằng quy hoạch toaacuten học Đocirci khi heuristic lagrave phương phaacutep được ưa thiacutech hơn khi khaacutec giải phaacutep heuristics được dugraveng như giải phaacutep ban đầu cho caacutec phương phaacutep quy hoạch toaacuten học bull Hạn chế 1048713 Khocircng đảm bảo coacute được giải phaacutep tối ưu 1048713 Caacutec quy luật coacute rất nhiều ngoại lệ 1048713 Caacutec lựa chọn quyết định tuần tự coacute thể khocircng tiecircn đoaacuten được caacutec kết cục tương lai của mỗi chọn lựa 1048713 Sự liecircn thuộc giữa caacutec phần trong hệ thống đocirci khi coacute thể gacircy ra caacutec ảnh hưởng lớn lao lecircn toagraven hệ thống bull Phacircn loại caacutec giải thuật heuristic 1048713 Heuristic xacircy dựng xacircy dựng giải phaacutep khả thi bằng caacutech cộng thecircm từng thagravenh phần một VD bagravei toaacuten người baacuten hagraveng ndash luocircn gheacute thagravenh phố chưa viếng thăm kế tiếp gần nhất

1048713 Heuristic cải tiến bắt đầu bằng một giải phaacutep khả thi vagrave cố gắng cải tiến liecircn tục trecircn đoacute VD trecircn thử hoaacuten đổi 2 thagravenh phố 1048713 Quy hoạch toaacuten aacutep dụng vagraveo caacutec mocirc higravenh chứa iacutet ragraveng buộc nhằm coacute được thocircng tin về thỏa hiệp tốt nhất với mocirc higravenh nguyecircn gốc Thường được dugraveng trong tối ưu hoacutea nguyecircn (integer optimization) 1048713 Chia giai đoạn giải quyết một vấn đề theo từng giai đoạn VD ở PampG trecircn đacircy bagravei toaacuten phacircn phối được giải quyết trước sau đoacute dugraveng giải quyết bagravei toaacuten chiến lược sản phẩm 1048713 Phacircn ratilde chia bagravei toaacuten thagravenh caacutec phần nhỏ hơn coacute thể giải quyết được sau đoacute kết hợp caacutec giải phaacutep đoacute lại VD chia latildenh thổ baacuten hagraveng thagravenh 4 vugraveng khaacutec nhau giải quyết cho từng vugraveng sau đoacute kết nối caacutec giải phaacutep

21Mocirc phỏngbull Giả định caacutec đặc điểm của thực tạibull Lagrave kỹ thuật tiến triển caacutec thực nghiệm (như phacircn tiacutech ldquowhat-ifrdquo) - bằng maacutey tiacutenh -trecircn một mocirc higravenh của hệ thocircng tin quản lyacute

bull Khocircng thực sự lagrave một mocirc higravenh vigrave khocircng biểu diễn thực tại magrave lagrave cố gắng bắtchước thực tạibull Một trong những phương phaacutep thocircng dụng nhất trong HHTQĐbull HHTQĐ lagravem việc với caacutec bagravei toaacuten phi cấu truacutec vagrave cấu truacutec yếu tigravenh huống thực tếphức tạp ndash khocircng dễ biểu diễn bằng mocirc higravenh tối ưu hay caacutec dạng mocirc higravenh khaacutecnhưng lại thường coacute thể xử lyacute được bằng mocirc phỏngbull Đặc điểm1048713 Iacutet đưa ra caacutec đơn giản hoacutea về thực tại hơn caacutec mocirc higravenh khaacutec1048713 Do triển khai caacutec thực nghiệm necircn noacute coacute thể kiểm thử caacutec giaacute trị cụ thể của caacutecbiến quyết địnhbiến khocircng kiểm soaacutet được của mocirc higravenh vagrave xem xeacutet ảnh hưởnglecircn caacutec biến kết quả1048713 Phương phaacutep coacute tiacutenh mocirc tả (như vậy khaacutec với phương phaacutep danh định)1048713 Khocircng tự động tigravem kiếm giải phaacutep tối ưu ndash noacute mocirc tảtiecircn đoaacuten caacutec đặc tiacutenh của hệthống đatilde cho dưới caacutec điều kiện khaacutec nhau từ đoacute coacute thể chọn ra phương aacuten tốtnhất1048713 Quaacute trigravenh mocirc phỏng thường lặp lại một thực nghiệm nhiều lần để coacute được ướclượng về hiệu ứng tổng quaacutet của một số hagravenh động nhất định1048713 Mocirc phỏng maacutey tiacutenh thiacutech hợp cho hầu hết caacutec tigravenh huống mặc dugrave cũng coacute một sốmocirc phỏng thủ cocircng thagravenh cocircng1048713 Thường chỉ được dugraveng khi bagravei toaacuten quaacute phức tạp khocircng thể xem xeacutet bằng caacutec kỹthuật tối ưu dạng số Tiacutenh phức tạp theo nghĩa bagravei toaacuten khocircng thể cocircng thức hoacuteacho tối ưu (do khocircng thotildea caacutec giả định) hoặc cocircng thức quaacute lớn quaacute nhiều tươngtaacutec giữa caacutec biến hoặc về bản chất bagravei toaacuten lagrave bất định hay rủi roPhương phaacutep mocirc phỏng thiết lập mocirc higravenh của hệ thống thực vagrave tiến hagravenh caacutec thựcnghiệm lặp lại trecircn mocirc higravenh

bull Thuận lợi1048713 Lyacute thuyết tương đối trực tiếp hiệu ứng dagravei hạn của nhiều chiacutenh saacutech -gt neacuten thờigian lớn1048713 Do tiacutenh chất mocirc tả (khaacutec với danh định)1048713 Coacute thể thấy được nhanh choacuteng coacute thể đặt ra caacutec cacircu hỏi ldquowhat-ifrdquo coacute thể dugravengtiếp cận thử-vagrave-sai vagraveo giải quyết vấn đề một caacutech nhanh choacuteng rẻ chiacutenh xaacutec iacutetrủi ro hơn1048713 Thử nghiệm được biến quyết định phần nagraveo của mocirci trường thực sự quan trọngvới caacutec phương aacuten khaacutec nhau1048713 Yecircu cầu kiến thức riecircng biệt về bagravei toaacuten vigrave thế buộc người xacircy dựng mocirc higravenh phảilagravem việc thường xuyecircn với nhagrave quản lyacute ndash đối tượng mong muốn của HHTQĐ để

từ đoacute bản chất bagravei toaacuten vagrave caacutec quyết định được hiểu tốt hơn1048713 Mocirc higravenh được xacircy dựng từ viễn cảnhcaacutech nhigraven của nhagrave quản lyacute1048713 Mocirc higravenh chỉ cho một bagravei toaacuten riecircng biệt thường khocircng thể dugraveng giải caacutec bagravei toaacutenkhaacutec Như vậy mỗi thagravenh phần của mocirc higravenh ứng với một phần của hệ thống thựcdo đoacute sẽ khocircng yecircu cầu nhagrave quản lyacute phải tổng quaacutet hoacutea caacutec hiểu biết của migravenh1048713 Phổ bagravei toaacuten giải được rất rộng tồn kho nhacircn sự hoạch định chiến lược 1048713 Coacute thể chứa caacutec phức tạp thực sự của bagravei toaacuten khocircng cần caacutec đơn giản hoacutea (TDdugraveng caacutec phacircn phối xaacutec suất thực thay vigrave phacircn phối lyacute thuyết xấp xỉ)1048713 Coacute thể tự động sinh ra nhiều đo lường hiệu năng quan trọng1048713 Thường lagrave phương phaacutep duy nhất của HHTQĐ coacute thể xử lyacute caacutec bagravei toaacuten tương đốiphi cấu truacutec1048713 Coacute một số caacutec goacutei phần mềm mocirc phỏng (Monte Carlo) tương đối dễ dugravengbull Điểm yếu1048713 Tuy thường tigravem được caacutec phương aacuten đủ tốt nhưng khocircng đảm bảo lời giải tối ưu1048713 Quaacute trigravenh xacircy dựng mocirc higravenh thường dagravei vagrave tốn keacutem1048713 Giải phaacutep vagrave suy diễn từ nghiecircn cứu mocirc phỏng thường khocircng thể chuyển sang bagraveitoaacuten khaacutec vigrave mocirc higravenh kết hợp caacutec yếu tố đặc thugrave1048713 Đocirci khi do mocirc higravenh quaacute dễ giải thiacutech cho nhagrave quản lyacute necircn caacutec phương phaacutep phacircntiacutech thường xem nhẹ1048713 Phần mềm mocirc phỏng đocirci khi yecircu cầu caacutec kỹ năng đặc biệt do độ phức tạp củaphương phaacutep giải higravenh thứcbull Caacutec loại mocirc phỏng1048713 Mocirc phỏng xaacutec suất một hay nhiều biến độc lập mang tiacutenh xaacutec suất với 2 loạiphacircn phối ndash thường dugraveng kỹ thuật Monte Carlo1048713 Phacircn phối rời rạc tigravenh huống coacute một số giới hạn caacutec biến cố (biến) với hữu hạncaacutec giaacute trị cho mỗi biến cố (biến)1048713 Phacircn phối liecircn tục tigravenh huống coacute số lượng khocircng giới hạn caacutec biến cố tuacircn theocaacutec hagravem mật độ xaacutec suất như phacircn phối chuẩn1048713 Mocirc phỏng độc lậpphụ thuộc theo thời gian1048713 Độc lập khocircng cần thiết phải biết chiacutenh xaacutec thời điểm xảy ra biến cố (nhu cầutiecircu thụ lượng sản phẩm trong ngagravey khocircng biết chiacutenh xaacutec thời điểm tiecircu thụ)1048713 Phụ thuộc cần biết chiacutenh xaacutec thời điểm xảy ra sự kiện (bagravei toaacuten hagraveng đợi)1048713 Mocirc phỏng tương taacutec trực quan1048713 Mocirc phỏng hướng đối tượng dugraveng tiếp cận hướng đối tượng để xacircy dựng mocirc higravenhmocirc phỏng Chuacute yacute ngocircn ngữ mocirc higravenh hoacutea nhất thể UML (unified modelinglanguage) kể cả khi mocirc phỏng caacutec hệ thời gian thựcMOcirc HIgraveNH HOacuteA ĐA CHIỀU ndash XỬ LYacute PHAcircN TIacuteCH TRỰC TUYẾNbull Người ra quyết định thường phải xem xeacutet nhiều chiều của dữ liệu (TD caacutec chiềucủa dữ liệu baacuten hagraveng lagrave sản phẩm vugraveng thời gian người baacuten ) dữ liệu cần đượcphacircn tiacutech trực tiếp bằng caacutec cocircng cụ chuẩn hay phacircn tiacutech tự động bằng caacutec

phương phaacutep khai mỏ dữ liệu (data mining)bull Hầu hết caacutec hệ thống phacircn tiacutech đa chiều được nhuacuteng trong caacutec hệ xử lyacute phacircn tiacutechtrực tuyến (HXLPTTT ndash online analytic processing - OLAP)bull Mục tiecircu của XLPTTT nắm bắt cấu truacutec của dữ liệu thực để hỗ trợ ra quyết địnhbull Trong HHTQĐ coacute sự gắn nối tự nhiecircn giữa mocirc higravenh hoacutea dữ liệu mocirc higravenh hoacutea kyacutehiệu vagrave caacutec khiacutea cạnh của phacircn tiacutech ldquowhat-ifrdquobull Caacutec baacuteo caacuteo của HXLPTTT đều coacute tiacutenh tương taacutec dễ khai thaacutec sử dụng đặc biệtphugrave hợp cho caacutec baacuteo caacuteo về chỉ số hiệu năng chủ yếu (key performance indicators- KPI) baacuteo caacuteo về đo lường hiệu năng kinh doanh bull Thế hệ hiện tại của HXLPTTT vagrave hệ khai mỏ dữ liệu (data mining) tiacutech hợp caacutecđặc tiacutenh của hệ thocircng tin latildenh đạo (executive information system ndashEIS- nhiềucaacutech nhigraven dữ liệu chi tiết hoacutea theo nhu cầu) vagrave caacutec hệ đồ họa khaacutec ndash thường coacutegiao diện người dugraveng dạng kiểu WEBbull Caacutec hệ thống như trecircn cograven được gọi lagrave caacutec cocircng cụ triacute tuệ kinh doanh (businessintelligence - BI) vigrave coacute caacutec đặc trưng về mocirc higravenh hoacutea vagrave tối ưu hoacutea nhưng lạitrong suốt đối với ngươigrave dugravengbull Hiện caacutec cocircng cụ được đưa ra bởi caacutec nhagrave cung cấp về CSDL về hoạch định tagraveinguyecircn tổ chức (ERP) về nhagrave kho dữ liệu (data warehouse) về HXLPTTT MOcirc HIgraveNH HOacuteA VAgrave MOcirc PHỎNG TƯƠNG TAacuteC TRỰC QUANbull Iacutech lợi Người ra quyết định tham gia vagraveo quaacute trigravenh phaacutet triển mocirc higravenh vagrave thựcnghiệm mocirc phỏng vigrave vậy sẽ tin tưởng khi sử dụng mocirc higravenhbull Mocirc higravenh hoacutea tương taacutec trực quan (visual interactive modeling - VIM) dugraveng caacutecbiểu diễn đồ họa maacutey tiacutenh để trigravenh bagravey caacutec ảnh hưởng của caacutec quyết định quản lyacutekhaacutec nhau ở một thời điểm (tĩnh) hay tiến triển theo thời gian (động với kỹ thuậthoạt higravenh)bull Mocirc phỏng tương taacutec trực quan (visual interactive simulation - VIS) cho pheacutepngười dugraveng theo dotildei tiến trigravenh xacircy dựng vagrave sử dụng khai thaacutec mocirc higravenh mocirc phỏngdưới dạng hoạt higravenhbull Mocirc higravenh hoacutea tương taacutec trực quan coacute thể kết hợp với tiếp cận triacute tuệ nhacircn tạo đểđưa ra caacutec khả năng mới thay đổi từ xacircy dựng hệ thống dạng đồ họa đến tigravem hiểuvề động học của hệ thốngbull Cần đến caacutec hệ thống maacutey tiacutenh xử lyacute song song tốc độ cao để xacircy dựng caacutec mocircphỏng - phức tạp quy mocirc lớn dạng hoạt higravenh - mang tiacutenh khả thi ở thời gian thực

22Caacutec dạng hệ thống hỗ trợ ra quyết địnhHệ hỗ trợ quyết định nhoacutemRa quyết định nhoacutem giao tiếp vagrave cộng taacutec- Caacutec đặc điểm của cocircng việc nhoacutem+ Một nhoacutem thực hiện một nhiệm vụ thỉnh thoảng ra quyết định thỉnh thoảngkhocircng ra quyết định+ Caacutec thagravenh viecircn trong nhoacutem coacute thể ở những nơi khaacutec nhau

+ Caacutec thagravenh viecircn trong nhoacutem coacute thể lagravem việc ở những thời gian khaacutec nhau+ Caacutec thagravenh viecircn trong nhoacutem coacute thể lagravem việc cugraveng nhau hoặc ở caacutec tổ chức khaacutecnhau+ Nhoacutem coacute thể vĩnh viễn hoặc tạm thời+ Nhoacutem coacute thể ở bất kỳ mức quản lyacute nagraveo hoặc mức thời gian nagraveo+ Coacute sự điều phối (quaacute trigravenh vagrave nhiệm vụ đạt được) hoặc macircu thuẩn trongnhoacutem+ Coacute sự đạt được hoặcvagrave mất maacutet năng suất trong tổ chức+ Nhiệm vụ phải hoagraven thagravenh rất nhanh+ Khocircng thể hoặc quaacute đắt cho tất cả caacutec thagravenh viecircn trong nhoacutem cugraveng hợp ở mộtnơi+ Một số dữ liệu thocircng tin hoặc kiến thức cần thiết nằm ở nhiều nơi một sốkhaacutec ở ngoagravei tổ chức+ Chuyecircn mocircn của caacutec thagravenh viecircn khocircng coacute trong nhoacutem lagrave cần thiết- Caacutec hoạt động vagrave caacutec quaacute trigravenh miecircu tả caacutec cuộc họp+ Cuộc họp lagrave hoạt động chung liecircn quan bởi một nhoacutem người coacute địa vị bằngnhau hoặc gần bằng nhau+ Kết quả của cuộc họp phụ thuộc một phần vagraveo kiến thức yacute kiến caacutec đaacutenh giaacutecủa caacutec thagravenh viecircn+ Kết quả của cuộc họp cũng phụ thuộc vagraveo sự kết hợp của nhoacutem vagrave phụ thuộcvagraveo quaacute trigravenh ra quyết định được sử dụng bởi nhoacutem đoacute+ Giải quyết caacutec yacute kiến khaacutec nhau bởi người coacute quyền hạn hoặc thương lượnghoặc phacircn xửHỗ trợ giao tiếp- Giao tiếp lagrave thagravenh phần quan trọng cho hỗ trợ quyết định Khocircng coacute giao tiếp thigravekhocircng coacute cộng taacutec Những người ra quyết định caacute nhacircn phải giao tiếp với caacutecđồng nghiệp chuyecircn gia cơ quan chiacutenh phủ khaacutech hagraveng đối taacutec kinh doanh hellipHọ cũng cần dữ liệu vagrave thocircng tin (vagrave kiến thức) từ nhiều nơi trecircn thế giới Caacutecnhoacutem ra quyết định phải giao tiếp cộng taacutec vagrave thương lượng trong cocircng việcHầu hết caacutec tổ chức sẽ nhanh trở thagravenh khocircng coacute chức năng nếu khocircng coacute caacutec hệthống giao tiếp Thương mại điện tử coacute thể hiệu quả chỉ qua caacutec kỹ thuật giao tiếphiện đại- Caacutec kỹ thuật thocircng tin hiện đại cung cấp caacutec phương tiện hỗ trợ giao tiếp rẻnhanh coacute khả năng coacute thể tin cậy Nền tảng hỗ trợ giao tiếp lagrave caacutec hệ thống maacuteytiacutenh mạng+ Bắt đầu bằng điện baacuteo điện thoại radio vagrave ti vi+ Trong 100 năm chuacuteng ta phaacutet triển maacutey fax thư điện tử chương trigravenh chatnhoacutem tin tức hệ thống hội nghị truyền higravenh Hầu hết caacutec kỹ thuật nagravey đềuhoạt động trecircn internet+ Sự phaacutet triển giao tiếp sau cugraveng lagrave hệ thống họp điện tử caacutec dịch vụ vagrave hệ

thống hội nghị điện tử thường sử dụng internet để kết nối caacutec người ra quyếtđịnh- Caacutec thuận lợi aacutep dụng caacutec phương phaacutep giao tiếp cải tiến trong caacutec tổ chức+ Cải tiến năng suất của nhacircn viecircn+ Liecircn quan đến nhiều người ra quyết định chiacutenh+ Khocircng quan tacircm nhiều đến đường biecircn giới địa lyacute+ Tạo nền văn hoacutea hợp taacutec nhất quaacuten+ Cải tiến chất lượng cuộc sống của nhacircn viecircnHỗ trợ cộng taacutec Maacutey tiacutenh hỗ trợ cộng taacutec- Khung thời giannơi chốn+ Sự hiệu quả của kỹ thuật tiacutenh toaacuten cộng taacutec phụ thuộc vagraveo vị triacute của caacutec thagravenhviecircn trong nhoacutem vagrave phụ thuộc vagraveo thời gian chia sẽ thocircng tin gởi vagrave nhận+ Chia sự giao tiếp thagravenh bốn ocirc vagrave tổ chức bốn ocirc dọc theo 2 chiều thời gian vagravenơi chốn1048713 Thời gian Khi gởi vagrave nhận thocircng tin hầu như đồng thời giao tiếp lagrave đồngthời Viacute dụ Điện thoại ti vi vagrave caacutec cuộc họp gặp mặt nhau Giao tiếp bấtđồng bộ xảy ra khi người nhận nhận thocircng tin ở thời điểm khaacutec thời điểmgởi thocircng tin đoacute1048713 Nơi chốn Người gởi vagrave người nhận coacute thể ở cugraveng phograveng hoặc khocircng+ Bốn ocirc lagrave1048713 Cugraveng thời giancugraveng nơi chốn Caacutec thagravenh viecircn gặp mặt nhau cugraveng một luacutecgiống như phograveng quyết định hoặc gặp mặt truyền thống1048713 Cugraveng thời giankhaacutec nơi chốn Caacutec thagravenh viecircn ở caacutec nơi khaacutec nhau nhưnggiao tiếp cugraveng nhau Viacute dụ hội nghị truyền higravenh (videoconferencing)1048713 Khaacutec thời giancugraveng nơi chốn Nhiều người lagravem việc theo ca Ca nagravey để lạithocircng tin cho ca khaacutec1048713 Khaacutec thời giankhaacutec nơi chốn Caacutec thagravenh viecircn ở caacutec nơi khaacutec nhau Caacutecthagravenh viecircn nagravey gởi vagrave nhận thocircng tin ở những lần khaacutec nhau

23Thực thi hệ DSSHệ thống hỗ trợ quản lyacute (MSS) khocircng phải luacutec nagraveo cũng luocircn thagravenh cocircng Nhiều trường hợpthất bại của ES khocircng hoagraven toagraven lagrave lyacute do kỹ thuật Thực thi hệ thống lagrave một quaacute trigravenh liecircn tụcnhằm đảm bảo cho tổ chức chuẩn bị tiếp nhận một hệ thống mới vagrave đưa hệ thống vagraveo sử dụngthagravenh cocircngThực hiện cocircng nghệ hệ thống hỗ trợ quản lyacute lagrave việc phức tạp vigrave caacutec hệ thống nagravey khocircng đơnthuần lagrave hệ thống thocircng tin chỉ thu thập thao taacutec vagrave phacircn phối thocircng tin Magrave xa hơn chuacuteng

liecircn quan tới caacutec cocircng việc coacute thể lagravem thay đổi đaacuteng kể caacutech thức hoạt động của tổ chức Tuyvậy đa số caacutec yếu tố thực thi đều liecircn quan tới hệ thống thocircng tinThực thi MSS lagrave quaacute trigravenh liecircn tục diễn ra trong suốt thời gian phaacutet triển hệ thống từ đề xuấtban đầu đến nghiecircn cứu khả thi thiết kế vagrave phacircn tiacutech hệ thống lập trigravenh huấn luyện chuyểnđổi vagrave lắp đặt Caacutec chuyecircn gia hệ thống thocircng tin thường gọi thực thi lagrave giai đoạn cuối trongvograveng đời hệ thống Định nghĩa thực thi MSS phức tạp hơn vigrave bản chất lặp của sự phaacutet triểncaacutec hệ thống

THỰC THI KHOcircNG HOAgraveN CHỈNHCaacutec quyết định về tiacutenh khả thi thường coacute giả định về lợi iacutech đạt được khi kế hoạch thực thiđược thực hiện hoagraven toagraven Trong thực tế thường chỉ thực hiện 90 thậm chiacute 70 phần trăm sovới phacircn tiacutech khả thi Lyacute do lagrave sự thay đổi tại một nơi trong hệ thống coacute thể ảnh hưởng vagrave coacutethể taacutec động tiecircu cực đến chỗ khaacutec Do vậy cấp quản lyacute coacute thể bỏ những phần trong dự aacuten coacutethể gacircy ra taacutec động xấu Do đoacute dự aacuten sẽ thực hiện iacutet hơn 100 so với dự aacuten kế hoạch Caacutec lyacutedo khaacutec coacute thể lagrave do khấu trừ ngacircn saacutech hoặc vượt chi phiacuteĐAacuteNH GIAacute SỰ THAgraveNH COcircNG CỦA THỰC THI HỆ THỐNGPhải coacute caacutec chỉ số đo lường thigrave mới coacute thể đaacutenh giaacute sự thagravenh cocircng khi thực thi một hệ thốngDickson va Powers (1973) đề ra 5 tiecircu chuẩn độc lậpbull Tỷ lệ thời gian thực hiện dự aacuten với thời gian ước lượngbull Tỷ lệ chi phiacute thực tế vagrave ngacircn saacutech thực hiệnbull Thaacutei độ của cấp quản lyacute đối với hệ thốngbull Nhu cầu thocircng tin của caacutec nhagrave quản lyacute được đaacutep ứng như thế nagraveo qua hệ thốngbull Taacutec động của dự aacuten đối với những hoạt động maacutey tiacutenh trong cocircng tyCaacutec đo lường khaacutec để đaacutenh giaacute thagravenh cocircng của hệ hỗ trợ quản lyacute (MSS)bull Sự sử dụng hệ thống (dự định dugraveng hoặc thực sự dugraveng)bull Thỏa matilden của người dugravengbull Thaacutei độ taacuten thagravenhbull Mức độ hệ thống hoagraven thagravenh caacutec mục tiecircu ban đầubull Phần thưởng đối với tổ chức (giảm chi phiacute tăng doanh thuhellip)bull Tỷ số lợi iacutech chi phiacute

bull Mức độ thể chế hoacutea của MSS trong tổ chứcDo bởi tiacutenh đa dạng của DSS necircn việc đaacutenh giaacute sự thagravenh cocircng của hệ nagravey cũng khoacute khăn tuynhiecircn cũng coacute thể coacute một số yếu tố giuacutep cho DSS thagravenh cocircng như sự tham gia người dugravenghuấn luyện người dugraveng hỗ trợ quản lyacute cấp cao nguồn thocircng tin đặc điểm của những nhiệmvụ coacute liecircn quan (cấu truacutec bất định độ khoacute phụ thuộc)

Chương5Nhoacutem hỗ trợ quyết định vagrave nhoacutemcocircng nghệ phần mềm

51Nhoacutem tạo quyết định

MDM-Holsapple đatilde gợi yacute chuacuteng ta sử dụng giới hạn người tạo quyết định

Một nhoacutem lagrave kết cấu MDM nơi magrave nhiều người ra quyết định hoagraven toagraven tương taacutec

Một đội lagrave kết cấu MDM nơi caacutec thagravenh viecircn tư vấn cho người đưa ra quyết định nhưng khocircng tương taacutec

Một Ủy ban lagrave kết cấu MDM với một người tạo quyết định duy nhất vagrave sự tương taacutec giữa caacutec thagravenh viecircn

Mạng thocircng tin

Mạng lưới baacutenh xe mỗi người tham gia coacute thể giao tiếp với người đưa ra quyết định ở trung tacircm nhưng khocircng phải với người tham gia khaacutecCấu truacutec nagravey lagrave khocircng thỏa matilden tất cả những người tham gia ngoại trừ người ra quyết định

Mạng dacircy chuyền Tham gia chuyển tiếp thocircng tin chỉ để noacute luocircn liền kề nhau trong chuỗi

Thagravenh viecircn cuối cugraveng ko được đaacutep ứng

Mạng vograveng trograven Tương tự như chuỗi nhưng kết thuacutec được kết nối

Mạng kết nối hoagraven toagraven khocircng coacute hạn chế về giao tiếp vagrave tương taacutec giữa caacutec thagravenh viecircnNoacutei chungnoacute đaacutep ứng hầu hết caacutec kết nối của người tham gia nhưng truyền đạt thocircng tin mất nhiều thời gian vagrave coacute nhiều cơ hội xảy ra lỗi

Nhoacutem hagravenh vi vagrave chuẩn mực

MDMs thiết lập caacutec chỉ tiecircu hướng dẫn quaacute trigravenh ra quyết định

Một chuẩn mực quy định cụ thể những gigrave thagravenh viecircn trong nhoacutem dự kiến sẽ lagravem trong những hoagraven cảnh nhất định

Quy tắc gửi coacute thể được thocircng qua viacute dụ đaacutenh giaacute ngang hagraveng hoặc xử phạt

Lagravem thế nagraveo để đưa ra quyết định

Việc chọn lựa magrave trong đoacute việc sử dụng cấu truacutec MDM phải được dựa trecircn một số yếu tố liecircn quan với bối cảnh quyết định

Viacute dụmột cấu truacutec riecircng lẻ sẽ lagravem việc nơi magrave quyết định được cấu truacutec cao vagrave thocircng tin lagrave coacute sẵn

Một ủy ban cơ cấu sẽ lagrave sự lựa chọn khi người ra quyết định khocircng thể đưa ra quyết định một migravenh

52Caacutec vấn đề thường gặp trong nhoacutem

Kiacutech thước Noacutei chung sự nhất triacute vagrave gắn kết giữa caacutec thagravenh viecircn tỉ lệ nghịch với phạm vi nhoacutem Trong nhoacutem lớn rất dễ higravenh thagravenh caacutec nhoacutem nhỏ vagrave hoạt động rời rạc

Tư duy tập thể Trong nhoacutem lớn mọi người coacute xu hướng suy nghĩ đểđạtđược sự nhất triacute necircn khocircng phaacutet huy được sự saacuteng tạo

Caacutec vấn đề về xatilde hội

Xung đột Trong 1 nhoacutem ai cũng muốn migravenh lagrave giỏi nhất necircn dễ dẫn đến xung đột

Ẩn danh(Giấu tecircn) Đacircy lagrave phương phaacutep được sử dụng để kiểm soaacutet xung đột Cho caacutec thagravenh viecircn tham gia ẩn danh

Vấn đề giới tiacutenh Nam vagrave nữ thường coacute những thế mạnh khaacutec nhau điều nagravey coacute thể lagrave sức mạnh trong 1 thiết lập MDM

Đagravem phaacuten vagrave quyết định

Một quyết định coacute thể liecircn quan đến nhiều quan điểm khaacutec nhau vigrave thế cần phải coacute sự đagravem phaacuten

Caacutec thiết kế của cơ chế hỗ trợ cho MDM phải phugrave hợp với caacutec hoạt độngđagravemphaacuten

Những hoạt động nagravey bao gồm việc thu nhận yacute kiến của caacutec thagravenh viecircn 1 caacutech cocircng bằng

53Cocircng nghệ hỗ trợ MDM

Organizational DSSndash 1 hệ thống cung cấp caacutec quyết định hỗ trợ

Group Support Systemndash Cocircng nghệ sử dụng sự hỗ trợ của nhiều becircn tham gia

Group DSS ndash Lagrave 1 hệ thống được thiết kế đặc biệt để hỗ trợ cho MDM

DSS ndash Lagrave 1 hệ thống dưới sự kiểm soaacutet của 1 người quyết định hệ thống nagravey cung cấp 1 bộ cocircng cụ giuacutep phacircn tiacutech hoagraven cảnh đểđưa ra quyết định vagrave nacircng cao hiệu quả của quyết địnhđoacute

53Cocircng nghệ hỗ trợ MDM

Organizational DSSndash 1 hệ thống cung cấp caacutec quyết định hỗ trợ

Group Support Systemndash Cocircng nghệ sử dụng sự hỗ trợ của nhiều becircn tham gia

Group DSS ndash Lagrave 1 hệ thống được thiết kế đặc biệt để hỗ trợ cho MDM

DSS ndash Lagrave 1 hệ thống dưới sự kiểm soaacutet của 1 người quyết định hệ thống nagravey cung cấp 1 bộ cocircng cụ giuacutep phacircn tiacutech hoagraven cảnh đểđưa ra quyết định vagrave nacircng cao hiệu quả của quyết địnhđoacute

Mục tiecircu của cocircng nghệ hỗ trợ MDM

Quy trigravenh hỗ trợ tập trung vagraveo quaacute trigravenh tạo điều kiện thuận lợi cho sự tương taacutec

Cơ chế cấu truacutec quaacute trigravenh chi phối caacutec hoạt động truyền thocircng

Nhiệm vụ hỗ trợ cocircng việc coacute thể chọn lựa tổ chức hoặc lấy thocircng tin

Nhiệm vụ cấu truacutec cocircng việc cho pheacutep truy cập đến kỹ thuật lọc kết hợp phacircn tiacutech kiến thức liecircn quan đến cocircng việc

Caacutec lớp loại cocircng nghệ hỗ trợ MDM

Phacircn loại theo đặc điểm do DeSanctis vagrave Gallupe đưa ra đề xuất một chương trigravenh ba cấp dựa trecircn caacutec tiacutenh năng được cung cấp

Hệ thống cấp 1 Mục điacutech chiacutenh lagrave tạo điều kiện thocircng tin liecircn lạc giữa caacutec thagravenh viecircn

Hệ thống cấp 2 Thiết kế để giảm thiểu rủi ro

Hệ thống cấp 3 Giuacutep điều chỉnh xử lyacute quyết định

Phacircn loại theo cocircng nghệ -Kraemer vagrave King tập trung vagraveo cocircng nghệ aacutep dụng

Cocircng nghệ bảng mạch điện tử

Hội nghị trực tuyến

Mạng lưới tập đoagraven

Trung tacircm thocircng tin

Mocirci trường cộng taacutec

Phograveng quyết định

Nhoacutem phần mềm

Phần mềm được thiết kế để hỗ trợ sự hợp taacutec bao gồm việc thu huacutet vagrave lưu trữ thocircng tin

Caacutec tổ chức dẫn đầu thị trường hiện tại lagrave Lotus Notes and Domino Microsoft Exchange Novell GroupWise and Oracle Office

Caacutec cocircng cụ trong một bộ phần mềm bao gồm người quản lyacute hội nghị (Lotus Sametime) vagrave trao đổi thocircng điệp (Lotus Notes Mail)

Xếp hạng phần mềm cho nhoacutem

Ellis vv đề xuất một hệ thống xếp hạng dựa vagraveo kiểu sự hỗ trợ noacute Cung cấp

Hệ thocircng điệp

Hệ thống hội thảo truyền higravenh

Hệ thống cộng taacutec soạn thảo

Nhoacutem phacircn phối giải phaacutep phần mền

Hệ thống phối hợp

Hệ thống thocircng minh đại diện

Lực lượng điều khiển phaacutet triển phần mềm cho nhoacutem

Một số nhacircn tố chiacutenh bao gồm

Tăng năng suất

Giảm số lượng caacutec cuộc họp

Tăng cường tự động hoacutea caacutec quy trigravenh lagravem việc thường xuyecircn

Cần phối hợp toagraven cầu tốt hơn

Tiacutenh sẵn sagraveng của những mạng lan rộng

Coleman vagrave Khanna liệt kecirc 10 nhacircn tố khaacutec

54Quản lyacute hoạt động MDM (Mobile Device Management - Quản lyacute thiết bị di động)

Một số phương phaacutep phối hợp phổ biến hơnMDM lagrave

Kỹ thuật nhoacutem định danh

Kỹ thuật Delphi

Sự phacircn xử

Hệ thocircng tin dựa trecircn vấn đề

Nemawashi

Kỹ thuật nhoacutem định danh

1-Mỗi người tham gia viết ra những yacute tưởng về những gigrave necircn quyết định

2-Lần lượt mỗi người tham gia trigravenh bagravey yacute tưởng của migravenh được ghi lại trecircn bảng Khocircng thảo luận ở đacircy

3-Sau khi tất cả caacutec yacute tưởng được trigravenh bagravey caacutec đại biểu coacute thể chất vấn những người khaacutec

4-Mỗi người tham gia bỏ phiếu cho mỗi yacute tưởng

Kỹ thuật Delphi

Về cơ bản tương tự như kỹ thuật nhoacutem định danh ngoại trừ những người khocircng bao giờ tham gia cuộc họp

Một cocircng cụ khảo saacutet được sử dụng để thu thập đầu vagraveo ban đầu từ caacutec thagravenh viecircn

Một cuộc khảo saacutet thứ hai được gửi đi với một bản toacutem tắt caacutec kết quả chung

Những bước lặp lại cho đến khi đạt được một sự đồng thuận hoặc nhigraven nhận của đa số

Sự phacircn xử(Arbitration )

Thiacutech hợp nhất khi caacutec thagravenh viecircn của MDM đại diện cho caacutec yếu tố đối lập

Những người tham gia đồng yacute rằng nếu lựa chọn thay thế hai becircn thỏa thuận khocircng được tigravem thấy thigrave một trọng tagravei viecircn becircn ngoagravei sẽ tham gia

Trọng tagravei sau đoacute lựa chọn thay thế ocircng hoặc xeacutet thấy thiacutech hợp nhất

Hệ thống thocircng tin dựa trecircn vấn đề (IBIS)

Lagrave một phương phaacutep lập luận cấu truacutec

Một đại diện cho IBIS lagrave một đồ thị với caacutec nuacutet vagrave caacutec liecircn kết

IBIS bắt đầu với lựa chọn của một nuacutet vấn đề gốc sau đoacute caacutec nuacutet vị triacute khaacutec nhau được liecircn kết với nuacutet gốc

Caacutec nuacutet vị triacute nagravey sau đoacute được đaacutenh giaacute dựa trecircn những lập luận gắn liền với chuacuteng

Nemawashi (được sử dụng rộng ratildei tại Nhật Bản)

1-Một hoặc nhiều thagravenh viecircn của MDM được chỉ định lagrave điều phối viecircnCaacutec điều phối viecircn sau đoacute chọn người tham gia cograven lại

2-Điều phối viecircn xacircy dựng một tổng hợp caacutec sự lựa chọn vagrave sau đoacute caacutec chuyecircn gia đaacutenh giaacute caacutec lựa chọn

3-Điều phối viecircn lựa chọn một sự lựa chọn dựa trecircn kết quả ở trecircn(ở 2)

4-Sự thay thế được luacircn chuyển điều phối viecircn tigravem kiếm sự đồng thuận thocircng qua sự thuyết phục vagrave đagravem phaacuten

5-Nếu đạt được sự đồng thuận điều phối viecircn cho lưu thocircng một tagravei liệu magrave mỗi thagravenh viecircn MDM để lại dấu hiệu trecircn đoacute

55Nơi lagravem việc ảo

Nhiều tổ chức trecircn toagraven thế giới kinh doanh bất động sản cho cocircng nghệ hợp taacutec

Cocircng việc được trở thagravenh một điều bạn lagravem hơn lagrave một nơi bạn đi

Những thay đổi lớn nhất mang lại bởi nơi lagravem việc ảo coacute thể lagrave về văn hoaacute hay xatilde hội hơn lagrave về cocircng nghệ

Chương 6 Hệ thống thocircng tin điều hagravenh

61 Yacute nghĩa của EIS- Hệ thống thocircng tin điều hagravenh

- EIS lagrave một dạng đặc biệt của DSS được thiết kế để hỗ trợ ra quyết định ở cấp cao nhất của một tổ chức

- Lagrave một hệ thống thocircng tin hỗ trợ nhu cầu lập kế hoạch vagrave đaacutenh giaacute của caacutec nhagrave quản lyacute điều hagravenh

- EIS coacute thể giuacutep một CEO coacute được bức tranh tổng thể chiacutenh xaacutec nhất về caacutec hoạt động vagrave một bản toacutem tắt những gigrave magrave đối thủ cạnh tranh đang lagravem

- Caacutec hệ thống nagravey noacutei chung hoạt động dễ dagraveng vagrave trigravenh bagravey thocircng tin theo những caacutech dễ hiểu để việc tiếp thu được nhanh choacuteng (biểu đồ đồ thịhellip)

(Tagravei liệu thecircm EIS lagrave những loại hệ thống lagrave rất phức tạp trong tự nhiecircn Coacute thể noacutei hệ thống nagravey cũng cung cấp cho caacutec nhagrave quản lyacute với caacutec thiết bị coacute khả năng ra quyết định bằng caacutech sử dụng của noacute Hệ thống nagravey hoạt động trong điều kiện như vậy quan trọng như trong caacutec hệ thống khaacutec khocircng hỗ trợ Khả năng lưu trữ dữ liệu nặng lagravem cho noacute lyacute tưởng để được thocircng qua khocircng chỉ bởi caacutec doanh nghiệp lớn magrave cograven bởi caacutec doanh nghiệp nhỏ hơn Nhigraven chung hệ thống nagravey lagrave dagravenh cho caacutec nhacircn viecircn cấp cao hỗ trợ thagravenh thạo trong việc đưa ra caacutec quyết định quan trọng)

Caacutec phiecircn EIS tiecircu biểu- Phiecircn lagravem việc coacute thể bắt đầu với một baacuteo caacuteo về tigravenh higravenh tagravei chiacutenh vagrave kinh

doanh của một cocircng ty caacutec chỉ số hoạt động quan trọng được hiển thị rotilde ragraveng- EIS sẽ cho pheacutep caacutec giaacutem đốc điều hagravenh coacute thể đi sacircu vagraveo dữ liệu từ những con

số bất kỳ magrave noacute hỗ trợ- Việc điều hagravenh coacute thể lựa chọn một mức độ chi tiết ( VD danh số baacuten hagraveng) nếu

như cần điều tra thecircm- Lagrave một phương phaacutep tiếp cận coacute thể giuacutep việc ra quyết định tốt hơn

Những điều magrave EIS ko coacute- EIS khocircng phải lagrave sự thay thế cho caacutec hệ thống dựa trecircn caacutec maacutey tiacutenh khaacutec EIS

thực sự chỉ cung cấp dữ liệu cho caacutec hệ thống nagravey- Noacute khocircng thể biến caacutec bộ hệ điều hagravenh của maacutey tiacutenh thagravenh những ldquochuyecircn viecircn

giỏirdquo- Coacute thể được viacute một caacutech cao hơn như lagrave một trợ lyacute đaacuteng tin cậy coacute thể được gọi

đến bất khi nagraveo vagrave mỗi khi cần thiết

Tagravei liệu thecircm Sự khaacutec nhau giữa EIS vagrave DSS+ EIS thiết kế để hỗ trợ những người điều hagravenh cấp cao giuacutep họ khaacutem phaacute caacutec vấn đề vagrave caacutec cơ hội DSS hỗ trợ những nười phacircn tiacutech cố gắng trả lời cacircu hỏi caacutei gigrave coacute thể lagravem cugraveng với một cơ hội hoặc một vấn đề

Chiều EIS DSSNhững người sử dụng thocircng thường

Duyệt dữ liệu đi xuống truy xuất trạng thaacutei

Hỗ trợ phacircn tiacutech vagrave quyết định

Sự thuacutec đẩy Tiacutenh thiacutech hợp Tiacutenh hiệu quảỨng dụng Queacutet mocirci trường đaacutenh giaacute

hiệu suất nhận dạng caacutec vấn đề vagrave caacutec cơ hội

Caacutec quyết định quản lyacute trecircn caacutec lĩnh vực đa dạng

Hỗ trợ quyết định Caacutec chiacutenh saacutech caacutec quyết định khocircng coacute cấu truacutec ở mức cao vagrave hỗ trợ giaacuten tiếp

Hỗ trợ caacutec quyết định lặp lại caacutec quyết định khocircng thể đoaacuten trước ra quyết định khocircng coacute cấu truacutec vagrave baacuten cấu truacutec

Loại thocircng tin Caacutec thocircng tin tin tức thocircng tin becircn ngoagravei về khaacutech hagraveng đối thủ cạnh tranh mocirci trường caacutec baacuteo caacuteo theo yecircu cầu vagrave định thời về caacutec hoạt động becircn trong

Caacutec thocircng tin hỗ trợ caacutec tigravenh huống đặc biệt

Sử dụng coacute nguyecircn tắc

Dograve theo vết vagrave điều khiển nhận dạng cơ hội

Hoạch định tổ chức phacircn nhoacutem vagrave điều khiển

Khả năng phugrave hợp với những người sử dụng caacute nhacircn

Thiết kế loại ra quyết định cho mỗi người điều hagravenh caacute nhacircn bằng nhiều lựa chọn đầu ra

Cho pheacutep caacutec đaacutenh giaacute caacute nhacircn caacutec khả năng what-if lựa chọn loại hộp hội thoại

Đồ họa Phải coacute Lagrave một phần quan trọng của nhiều DSS

Thacircn thiện người sử dụng

Phải coacute Phải coacute nếu khocircng coacute người sử dụng trung gian

Xử lyacute thocircng tin Lọc neacuten thocircng tin dograve theo vết dữ liệu vagrave thocircng tin quan trọng

EIS kiacutech thiacutech caacutec cacircu hỏi caacutec cacircu trả lời bằng caacutech sử dụng DSS vagrave phản hồi lại EIS

Hỗ trợ caacutec thocircng tin chi tiết

Truy xuất thường xuyecircn caacutec mức chi tiết của bất kỳ thocircng tin tổng hợp nagraveo (duyệt dữ

Coacute thể coacute trong DSS nhưng khocircng thường

liệu chi tiết)Cơ sở mocirc higravenh Caacutec chức năng coacute sẵn bị hạn

chếLagrave điểm cốt lotildei của DSS

Cấu truacutec Theo người baacuten sản phẩm hoặc theo caacutec chuyecircn gia hệ thống thocircng tin

Theo người sử dụng hoặc caacute nhacircn hoặc caacutec chuyecircn gia từ caacutec trung tacircm thocircng tin hoặc phograveng ban hệ thống thocircng tin

Phần cứng Mainframe caacutec trạm RISC mạng LANs hoặc caacutec hệ thống phacircn bố

Mainframe caacutec trạm RISC caacutec maacutey PC hoặc caacutec hệ thống phacircn bố

Bản chất caacutec goacutei phần mềm

Truy xuất tương taacutec dễ dagraveng đến nhiều cơ sở dữ liệu truy xuất trực tuyến caacutec khả năng DBMS phức tạp caacutec liecircn kết phức tạp

Caacutec khả năng tiacutenh toaacuten lớn caacutec ngocircn ngữ mocirc higravenh mocirc phỏng ứng dụng vagrave caacutec bộ tạo DSS

Bản chất caacutec thocircng tin

Trigravenh bagravey thocircng tin được phaacutet sinh trước về quaacute khứ vagrave hiện tại tạo caacutec thocircng tin mới về quaacute khứ hiện tại tương lai

Tạo thocircng tin mới về quaacute khứ hiện tại tương lai

62 Lịch sử EIS- EIS xuất hiện lần đầu tiecircn tại MIT vagraveo những năm 1970

- Những EIS đầu tiecircn được phaacutet triển bởi caacutec doanh ngiệp lớn sẵn sagraveng chấp nhận rủi ro để đạt được lợi thế cạnh tranh

- Vagraveo những năm 1980 caacutec nhagrave cung cấp đatilde phaacutet triển một số cơ sở khaacutech hagraveng rộng vagrave cocircng nghệ EIS được tiếp tục phaacutet triển cho đến ngagravey nay

(Tagravei liệu thecircm Sử dụng DSSEIS cho phaacutet triển bền vững + Một số nghiecircn cứu đatilde được tiến hagravenh để kiểm tra việc thực hiện của EIS trong khu vực cocircng cộng vagrave chiacutenh phủ caacutec nước tổ chức kể từ khi chuacuteng được phaacutet triển theo định hướng lợi nhuận cho caacutec cocircng ty tư nhacircn (Hasan vagrave Hasan năm 1997) Theo một nghiecircn cứu tiến hagravenh tại Mỹ ở hơn 300 cocircng ty kết quả cho thấy sự khaacutec biệt của EIS giữa tư nhacircn vagrave chiacutenh phủ một số kết quả thuacute vị được phaacutet hiệnViacute dụ khoacute khăn hơn để chuyển tiền từ một tagravei khoản khaacutec trong một EIS của chiacutenh phủ cũng lagrave khoacute khăn hơn để biện giải thiacutech cho những chi phiacute phaacutet triển EIS của chiacutenh phủ Một nghiecircn cứu khaacutec được tiến hagravenh ở Australia

cho thấy rằng EIS cung cấp cho quản lyacute một higravenh ảnh chiacutenh xaacutec hơn về tổ chức thực hiện vagrave cung cấp hỗ trợ cho caacutec lợi iacutech chiến lược cải thiện khocircng chỉ cho caacutec nhagrave quản lyacute nhưng cograven cho phần cograven lại của tổ chức Dựa trecircn caacutec hệ thống được thiết kế cho caacutec cocircng ty tư nhacircn với một caacutech rotilde ragravengxaacutec định mục tiecircu EIS lagrave thiacutech hợp cho caacutec tổ chức cocircng cộng hiện đại nhưng cần phải được linh hoạt hơn vagrave kết thagravenh chugravem một phạm vi rộng hơn khả năng vagrave phương tiện hơn so với khu vực tư nhacircn ban đầu theo định hướng sản phẩm (Hasan vagrave Hasan năm 1997) Điều nagravey coacute thể lagrave do thực tế rằng caacutec hoạt động khu vực cocircng lagrave bắt buộc coacute taacutec động rộng phải đaacutep ứng sự mong đợi duy nhất cocircng cộng thường coacute mục tiecircu mơ hồ vagrave macircu thuẫn iacutet quyền tự chủ vagrave kiểm soaacutet việc ra quyết định vagrave nhacircn viecircn lagrave khoacute khăn hơn (Watson vagrave Carte2000) + Toacutem lại EIS lagrave một khaacutei niệm thagravenh cocircng noacute phaacutet triển qua nhiều năm tuy nhiecircn EIS khắc phục khiếm khuyết của migravenh bằng caacutech tiến hagravenh nghiecircn cứu liecircn tục)

63 Tại sao những người điều hagravenh hagraveng đầu lại khaacutec nhau- Họ lagrave những doanh nghiệp theo định hướng coacute suy nghĩ

- Coacute một khoảng khocircng gian rộng để kiểm soaacutet

- Họ chịu traacutech nhiệm cho việc thiết lập chiacutenh saacutech

- Họ đại diện cho tổ chức mocirci trường becircn ngoagravei

- Hagravenh động của họ tạo ra những kết quả đaacuteng kể về tagravei chiacutenh vagrave con người

Tần số caacutec hoạt động điều hagravenh- Xử lyacute xaacuteo trộn 42

- Hoạt động kinh doanh 32

- Phacircn bổ nguồn lực 17

- Đagravem phaacuten 3

- Những điều khaacutec 6

Handling Disturbances 42

Entrepreneurial Activites 32

Resource Allocation 17

Negotiation 3

Other 6

Những thocircng tin điều hagravenh cần thiết- Quản lyacute xaacuteo trộn coacute thể yecircu cầu sự chuacute yacute xung quanh đồng hồ

- Hoạt động kinh doanh yecircu cầu điều hagravenh để dự đoaacuten những thay đổi trong mocirci trường

- Nhiệm vụ phacircn bổ tagravei nguyecircn yecircu cầu lựa chọn người quản lyacute vagrave caacutec nguồn lực hạn chế được triển khai

- Đagravem phaacuten yecircu cầu cập nhật thocircng tin từng phuacutet để coacute thể xacircy dựng được sự đồng thuận

Caacutec loại thocircng tin điều hagravenh- Hệ thống kế toaacuten coacute liecircn quan đến việc tiacutenh toaacuten thu nhập hoạt động cho caacutec lĩnh

vực cụ thể lagrave quan trọng hơn so với caacutec hệ thống kế toaacuten truyền thocircng- Thocircng tin về thị trường khaacutech hagraveng cung cấp giaacute trị trong việc quyết định chiến

lược- Caacutec thocircng tin cần thiết thường được truyền đi trecircn một số hệ thống maacutey tiacutenh vagrave

nằm trong toagraven tổ chức- Caacutec thocircng tin được sử dụng thường lagrave ngắn hạn vagrave dễ thay đổi

Phương thức để xaacutec định thocircng tin cần thiết

Rockart xaacutec định được năm phương thức cơ bản để xaacutec định thocircng tin cần thiết

- Phương thức dựa trecircn kết quả- Phương thức rỗng- Phương thức chỉ số khoacutea- Phương thức tổng hợp nghiecircn cứu- Phương thức dựa vagraveo nhacircn tố then chốt dẫn đến thagravenh cocircng

64 Thagravenh phần EIS

- Sản phẩm EIS đầu tiecircn được phaacutet triển để sử dụng trecircn maacutey tiacutenh cấu higravenh cao nhưng caacutec sản phẩm hiện nay nhằm mục tiecircu lagrave nền tảng ClientServer

- Những nền tảng linh hoạt hơn coacute thể thiacutech ứng với thay đổi trong tổ chức vagrave cocircng nghệ

- Sử dụng dữ liệu thời gian thực dẫn đến quyết định nhanh hơn nhiều thocircng tin hơn

Thagravenh phần phần cứng- Một EIS khocircng đogravei hỏi coacute phần cứng cụ thể hoặc duy nhất nagraveo- Chigravea khoacutea của vấn đề lagrave để đảm bảo rằng caacutec thagravenh phần của EIS tối ưu hoacutea vagrave

phugrave hợp với tagravei nguyecircn maacutey tiacutenh của tổ chức- Hệ thống nagravey phải được cấu higravenh để caacutec nguồn tagravei nguyecircn phugrave hợp với những

người điều hagravenh chuacuteng

Thagravenh phần phần mềm- Traacutei ngược với phần cứng phần mềm thường được chuyecircn mocircn hoacutea cao cho caacutec

bagravei toaacuten về miền- Sự chuyecircn mocircn hoacutea nagravey thường đạt được bằng caacutech sử dụng thagravenh phần off-the-

shelf cho toagraven bộ EIS vagrave caacutec mocirc-đun tugravey chỉnh để đaacutep ứng nhu cầu cụ thể- Lotus Notes lagrave một viacute dụ điển higravenh Noacute coacute thể được sử dụng một migravenh hoặc coacute

thể phục vụ becircn thứ ba mocirc-đun plug-in

Cocircng nghệ EIS hiện nay

Dobrzeniecki đề xuấtphacircn loạitừng cấptheo bachức năng- Loại 1 sản phẩm bao gồmmột bộ đầy đủcaacutec ứng dụngtừ mộtnhagrave cung cấp- Loại 2 sản phẩm đượcthựchiệnở phần đầu củacaacutecsản phẩmDSS đượcphaacutet triển

bởicugravengmộtnhagrave cung cấp- Loại 3 sản phẩmkết hợp với nhautheo bất kỳ số lượngthuộc sở hữu củacocircng ty

65 Xacircy dựng EIS

- Xacircy dựngmộtEISgiống nhưxacircydựngmột số hệ thống khaacutec củamocirc higravenh hệ thống thocircng tin

- Việcphaacutet triểncấu truacutecnecircn được theo dotildeitừ quaacute trigravenh thiết kế đến quaacute trigravenhthực hiện

- Tuy nhiecircn một dự aacuten phaacutet triển EIScoacute xu hướnglagrave thống nhấtvagraveyecircu cầu hỗ trợ caacutec nhagrave quản lyacute latildenh đạo

- Xacircy dựng một EIScoacute thểphaacutet hiện ra đượccaacutectigravenh huống khoacute khănmagravemột nhagrave phaacutet triển chưabao giờ gặp phải

Mocirc higravenh EIS

Khung phaacutet triển một EIS

- Watson et al đề nghị xacircy dựngkhung với ba thagravenh phần+ Caacutech tiếp cận tập trung vagraveo yếu tốcon người vagrave dữ liệu coacute liecircn quan đến EIS+ Quaacute trigravenh phaacutet triển cần sự linh hoạt vagrave tương taacutec+ Người sử dụng - hệ thống hộp thoại bao gồm một ngocircn ngữ hagravenh động để xử lyacute caacutec lệnh

Lợi iacutech của EIS- Dễ duy trigrave caacutec mục tiecircu coacute tổ chức- Dễ truy xuất thocircng tin- Cho pheacutep người sử dụng nacircng cao hiệu suất hơn

- Tăng chất lượng ra quyết định- Cung cấp sự cải tiến cạnh tranh- Tiết kiệm thời gian của người sử dụng- Tăng khả năng vagrave chất lượng giao tiếp- Cung cấp khả năng điều khiển tốt hơn trong tổ chức- Cho pheacutep tham gia caacutec vấn đề vagrave caacutec cơ hội- Cho pheacutep hoạch định- Cho pheacutep tigravem kiếm nguyecircn nhacircn của một vấn đề- Thảo matilden caacutec yecircu cầu của người điều hagravenh

Hạn chế của EIS vagrave 1 số sai lầm cần traacutenh

- Chi phiacute một cuộc khảo saacutetnăm1991 chothấychi phiacute phaacutet triểntrungbigravenh365000USDvớichi phiacute vận hagravenhhagraveng năm lagrave$200000 (EIS)

- Cocircng nghệ hạn chếEIScần phảiđượctiacutech hợp hoagraven toagravenvagraveokiếntruacuteccủadoanh nghiệphiện tại do đoacute noacutelagrave một thaacutech thứclớn đối vớithiết kế

- Hạn chế tổ chức cơ cấu tổ chứccoacute thể khocircng phugrave hợp

Sự hạn chế về tổ chức- Chương trigravenh nghị sự vagrave thời gian chệch EIS mocirc tả một phần việc thực hiện một

chương trigravenh nghị sự vagrave coacute thể dễ dagraveng đạt được sự tin cậy một caacutech chắc chắn- Đồng bộ hoacutea việc quản lyacute sự tin cậy đuacuteng luacutec đặc biệt baacuteo caacuteo EIS coacute thể phaacute

vỡ sự ổn định thiết lập caacutec chu trigravenh baacuteo caacuteo một caacutech tốt nhất- Sự bất ổn EIS phản ứng nhanh coacute thể gacircy ra việc taacutec động trở lại một caacutech

nhanh choacuteng dẫn đến sự thiếu ổn định trong tổ chức

Sự thất bại lagrave thay thế khocircng thể chấp nhận được- Một số yếu tố lagravem EIS thất bại

+ Thiếu sự hỗ trợ về mặt quản lyacute+ Vấn đề chiacutenh trị+ Thất bại của nhagrave phaacutet triển+ Lỗi về cocircng nghệ+ Giaacute cả+ Thời gian

66 Ra quyết định điều hagravenh trong tương lai vagrave EIS

- Coacute một vagravei điều kiện sẽ được hợp nhất cho việc chuyển đổi cocircng nghệ Trong đoacute một vagravei điều kiện coacute thể dễ dự đoaacuten Hai điều kiện magrave ta coacute thể thấy lagrave+ Phaacutet triển cocircng nghệ maacutey tiacutenh trong việc điều hagravenh sẽ tạo ra sự chuyển đổi được chấp nhận một caacutech dễ dagraveng hơn+ Mở rộng traacutech nhiệm điều hagravenh sẽ mở rộng nhu cầu thocircng tin

Tương lai của EIS- EIS thocircng minh Những tiến bộ trong cocircng nghệ AI sẽ được triển khai trong caacutec

EIS- EIS đa phương tiện Cơ sở dữ liệu đa phương tiện sẽ cho pheacutep tiacutech hợp văn bản

giọng noacutei vagrave higravenh ảnh trong tương lai- EIS thocircng tin Tương lai EIS sẽ mở rộng hơn trong việc sử dụng dữ liệu becircn

ngoagravei doanh nghiệp- EIS kết nối Giao tiếp với băng thocircng rộng cho pheacutep kết nối liecircn thocircng lớn hơn

Chương 7 HỆ CHUYEcircN GIA VAgrave TRIacute TUỆ NHAcircN TẠO

71 Caacutec khaacutei niệm

72 Triacute thocircng minh của triacute tuệ nhacircn tạo

73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia

74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia

75 Lợi iacutech vagrave hạn chế của hệ chuyecircn gia

71 Caacutec khaacutei niệm

Chuyecircn mocircn (Expertise) sự hiểu biết rộng trong 1 lĩnh vực hẹp

Hệ chuyecircn gia (Expert Systems)1 chương trigravenh maacutey tiacutenh sử dụng 1 tập caacutec luật dựa trecircn tri thức của con người để giải quyết caacutec vấn đề đogravei hogravei phải coacute sự chuyecircn mocircn

Một số hệ chuyecircn gia nổi tiếng

DENDRAL (Standford 1960s Edward Feigenbaum)

MYCIN (Standford1970s Edward Shortliffe)

PROSPECTOR (MIT 1979)

Triacute tuệ nhacircn tạo (Artificial Intelligence ndash AI)

Triacute tuệ nhacircn tạo một bộ phacircn của ngagravenh khoa học maacutey tiacutenh quan tacircm đến việc thiết kế caacutec hệ thống maacutey tiacutenh thocircng minh đoacute lagrave caacutec hệ thống đưa ra caacutec đặc điểm magrave từ đoacute chuacuteng ta liecircn hệ với sự thocircng minh trong hagravenh động của con người (Barr vagrave Feigenbaum 1981)

Mục điacutech của AI

Mục điacutech khoa học xaacutec định caacutec gợi yacute để giải thiacutech caacutec loại khaacutec nhau của triacute tuệ thực

Mục điacutech kỹ thuật giải quyết caacutec vấn đề trong thế giới thực

Triacute tuệ nhacircn tạo kế thừa nhiều yacute tưởng quan điểm kỹ thuật từ caacutec ngagravenh khoa học khaacutec

- Triết học

- Logic Toaacuten học

- Tiacutenh toaacuten

- Khoa học tacircm lyacute Khoa học nhận thức

- Sinh học Thần kinh học

- Tiến hoacutea

Caacutec lĩnh vực ứng dụng trong Triacute tuệ nhacircn tạo

Mạng nơ ron thần kinh (Neural Networks)

Tiacutenh toaacuten sự tiến hoacutea

(Evolutionary Computation)

Hệ chuyecircn gia (Expert Systems)

Kỹ thuật xử lyacute tiếng noacutei (Speech Processing)

Kỹ thuật xử lyacute ngocircn ngữ tự nhiecircn

(Natural Language Processing)

Lập kế hoạch (Planning)

Robot (Robotics)

Khoa học higravenh ảnh (Vision)

Caacutec kỹ thuật thocircng dụng dugraveng trong AI

Biểu diễn(Representation)

Học (Learning)

Caacutec luật (Rules)

Tigravem kiếm (Search)

72 Triacute thocircng minh của triacute tuệ nhacircn tạo

Con người suy diễn như thế nagraveo

Phacircn loại (Categorization)

Caacutec quy tắc cụ thể

Heuristics

Kinh nghiệm trước đoacute

Dự tiacutenh trước

Maacutey tiacutenh suy diễn như thế nagraveo

Lập luận dựa trecircn luật IF-THEN mocirc tả tri thức được matilde hoacutea dưới dạng caacutec luật

Caacutec khung (Frames) lagrave caacutec đại diện mocirc tả caacutec tigravenh huống giống nhau lagrave điển higravenh của một vagravei phacircn loại

Lập luận dựa trecircn caacutec trường hợp mocirc phỏng giải phaacutep trước đoacute cho một vấn đề hiện tại

Nhận dạng mẫu phaacutet hiện acircm thanh higravenh dạng hoặc caacutec chuỗi dagravei

Caacutec dạng khaacutec của Triacute tuệ nhacircn tạo

Học maacutey- mạng nơron vagrave giải thuật di truyền

Lập trigravenh tự động ndash lagrave những kỹ thuật tạo ra caacutec chương trigravenh để lagravem 1 nhiệm vụ riecircng biệt (cho pheacutep những người khocircng phải lagrave người lập trigravenh coacute thể lập trigravenh được)

Cuộc sống nhacircn tạo ndash nỗ lực để taacutei tạo caacutec hiện tượng sinh học trong caacutec hệ thống dựa trecircn maacutey tiacutenh

73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia(Expert Systems- ES)

Theo Jackson (1999) Một hệ chuyecircn gia lagrave một chương trigravenh maacutey tiacutenh mocirc tả vagrave suy diễn với tri thức của một vagravei lĩnh vực để giải quyết vấn đề hay đưa ra caacutec lời khuyecircn

Cấu truacutec cơ bản của ES được dựa theo cấu truacutec chung của DSS Sự khaacutec biệt chiacutenh giữa ES vagraveDSS lagrave hệ ES thu thập caacutec kiến thức từ những

chuyecircn gia trong lĩnh vực quan tacircmĐặc trưng của hệ chuyecircn gia Hiệu quả cao Thời gian trả lời thỏa đaacuteng Độ tin cậy cao Dễ hiểu

Giao diện người dugraveng trong ES

Thiết kế giao diện người dugraveng tập trung vagraveo caacutec yếu tố như dễ dagraveng sử dụngcoacute độ tin cậy cao giảm tải những khoacute khăn khi sử dụng

Thiết kế necircn coacute một số tương taacutec (đầu vagraveo kiểm soaacutet vagrave truy vấn)

Cấu tạo giao diện người dugraveng gồm coacute magraven higravenh cảm ứng bagraven phiacutem buacutet saacuteng lệnh thoại caacutec phiacutem chuyecircn dụng

Cơ sở tri thức (Knowledge Base)

Chứa đựng caacutec tri thức cụ thể miền thu được từ caacutec chuyecircn gia miền

Coacute thể chứa caacutec mocirc tả caacutec hagravenh vi giải quyết vấn đề caacutec ragraveng buộc caacutec heuristics

Thagravenh cocircng của một ES dựa trecircn tiacutenh đầy đủ vagrave tiacutenh chiacutenh xaacutec của cơ sở tri thức

Mocirc tơ suy diễn (Inference Engine)

Ở đacircy tri thức được đặt để sử dụng tạo ra caacutec giải phaacutep để giải quyết vấn đề

Mocirc tơ nagravey coacute khả năng thực hiện diễn dịch hoặc suy diễn dựa trecircn caacutec luật hay caacutec caacutec sự kiện

Đồng thời cũng coacute khả năng sử dụng caacutec suy diễn mờ hay khocircng chiacutenh xaacutec dựa trecircn xaacutec suất hay aacutenh xạ mẫu

Vograveng điều khiển suy diễn

1 Aacutenh xạ caacutec luật với caacutec sự kiện đatilde được cho

2 Chọn luật để thực hiện

3 Thực hiện luật bằng caacutech thecircm caacutec sự kiện được suy diễn ra vagraveo bộ nhớ lagravem việc

Chuỗi suy diễn (Chaining)

Suy diễn tiến (forward chaining) maacutey suy diễn bắt đầu từ dữ liệu ban đầu vagrave thực hiện việc suy luận để đưa ra caacutec kết luận cuối cugraveng

Suy diễn lugravei (backward chaining) maacutey suy diễn bắt đầu từ dữ liệu điacutech vagrave tigravem ra tri thức hỗ trợ cho dữ liệu điacutech đoacute

Viacute dụ suy diễn lugravei

R1 Nếu coacute A vagrave B thigrave suy ra coacute D

R2 Nếu coacute B thigrave suy ra coacute C

R3 Nếu coacute C vagrave D thigrave suy ra coacute E

Ta coacute E ta xem trong 3 luật R1 R2 R3 luật nagraveo coacute E ta thấy R3 chứa E đồng thời chứa C vagrave D Xeacutet tiếp trong 2 luật R1 R2 luật nagraveo chứa C vagrave D R2 chứa C R3 chứa D Từ đoacute ta coacute được caacutec tri thức hỗ trợ suy diễn vagrave kết luận lagrave nếu coacute A vagrave B thigrave sẽ coacute E Hay nếu A vagrave B đuacuteng thigrave sẽ coacute E

Viacute dụ suy diễn tiến

Giả sử coacute tập chứa 3 luật sau

R1 Nếu coacute A vagrave B thigrave suy ra coacute D

R2 Nếu coacute B thigrave suy ra coacute C

R3 Nếu coacute C vagrave D thigrave suy ra coacute E

Nếu ta coacute A vagrave B thigrave chuacuteng ta suy ra được D từ R1 vagrave suy ra C từ R2 Với D vagrave C đatilde được suy ra ở trecircn giờ chuacuteng ta suy ra được E từ R3

Viacute dụ thực tế

Giả sử muốn biết magraveu của một con vật nuocirci tecircn lagrave Fred biết rằng noacute kecircu ộp ộp vagrave ăn ruồi

Coacute tập 4 luật ban đầu như sau

R1 Nếu X kecircu ộp ộp vagrave ăn ruồi thigrave X lagrave con ếch

R2 Nếu X kecircu chiecircm chiếp vagrave biết hoacutet thigrave X lagrave con chim

R3 Nếu X lagrave con ếch thigrave X coacute magraveu xanh

R4 Nếu X lagrave con chim thigrave X coacute magraveu vagraveng

74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia

Expert system shells lagrave một tập caacutec goacutei phần mềm vagrave caacutec cocircng cụ dugraveng để phaacutet triển caacutec hệ chuyecircn gia

Những Expert system shells đầu tiecircn thường rất rườm ragrave Mặc dugrave vậy noacute vẫn giuacutep cho người sử dụng sẽ khocircng phải bắt đầu lại từ đầu khi xacircy dựng một hệ chuyecircn gia mới

Những shell hiện đại bao gồm hai mocirc-đun chiacutenh lagrave cocircng cụ xacircy dựng một tập quy tắc vagrave mocirc tơ suy diễn

Xacircy dựng hệ chuyecircn gia

Bước 1 xacircy dựng mocirc higravenh bagravei toaacuten xaacutec định vấn đề nhiệm vụ magrave hệ thống sẽ thực hiện Caacutec dạng bagravei toaacuten cần hệ chuyecircn gia

Bagravei toaacuten diễn giải (InterPretation)

Bagravei toaacuten dự baacuteo (Prediction)

Bagravei toaacuten chuẩn đoaacuten (Diagnose)

Bagravei toaacuten gỡ rối (Debugging)

Bagravei toaacuten thiết kế

Tương tự như một dự aacuten phần mềm để xacircy dựng một hệ chuyecircn gia cần phải coacute caacutec yếu tố về nhacircn lực tagravei nguyecircn vagrave thời gian Những yếu tố nagravey ảnh hưởng đến giaacute thah của một hệ chuyecircn giaTrong phần nagravey cacircu hỏi thường được đặt ra lagrave tại sao cần phải xacircy dựng một hệ chuyecircn giaTrước khi bắt đầu phải xaacute định rotilde bagravei toaacuten đạt ra lagrave jiAi lagrave chuyecircn giaAi lagrave người sử dụng

1 Diễn giải (InterPretation) Nghiecircn cứu 1 vấn đề -gt Dựa trecircn những biểu hiện thuộc tiacutenh đặc trưng becircn ngoagravei -gt Tư vấn

(hoặc đưa ra kết luận hay mocirc tả dễ hiểu từ tập dữ liệu thocirc)

2 Bagravei toaacuten dự baacuteo (Prediction) Coacute thể dự đoaacuten được hagravenh vi kết quả dựa trecircn caacutec hiện tượng -gt dự baacuteo

VD Dự baacuteo thời tiết động đấthellip

3 Bagravei toaacuten chẩn đoaacuten (Diagnoss) Xaacutec định caacutec lỗi caacutec bộ phận hỏng hoacutec của hệ thống dựa trecircn caacutec dữ liệu quan saacutet được

4 Bagravei toaacuten gỡ rối (Debugging) Mocirc tả caacutec phương phaacutep khắc phục hệ thống khi gặp sự cố

5 Bagravei toaacuten thiết kế Lựa chọn cấu higravenh caacutec đối tượng nhằm thoả matilden một số ragraveng buộc nagraveo đoacute

6 Giảng dạy Phần mềm dạy học coacute thể chuẩn đoaacuten vagrave sủa lỗi của học sinh trong quaacute trigravenh học tập

Để xaacutec định đuacuteng bagravei toaacuten magrave chuacuteng ta cần giải quyết thigrave phải trả lời đc một số cacircu hỏi

- cần hệ chuyecircn gia

Bước 2 thu thập tri thức lựa chọn cocircng cụ vagrave aacutep dụng

Trong bước thu thập tri thức vấn đề quan trọng lagrave lựa chọn chuyecircn gia những người magrave sẽ đoacuteng goacutep tri thức cho hệ thống Thocircng thường trong suốt quaacute trigravenh phaacutet triển thigrave chuyecircn gia được xem như một thagravenh viecircn của đội phaacutet triển

Hiện nay coacute rất nhiều cocircng cụ để xacircy dựng một hệ chuyecircn gia Phổ biến nhất lagrave JESS CLIPS vagrave OPS5

Bước 3 Thiết kế cơ sở tri thức thiết kế hệ thốngTri thức được biểu diễn trường minh trong cơ sở tri thức

Caacutec chuyecircn gia vagrave kỹ sư tri thức sẽ đối thoại với nhau bằng caacutec kỹ thuật đối thoại Suy diễn (SD) bảng Mocirc higravenh hoacutea SD quy nạp phacircn loại

Vấn đề bagraveo trigrave vagrave phaacutet triển

Caacutec hệ chuyecircn gia đogravei hỏi phải bảo trigrave vagrave phaacutet triển nhiều hơn so với caacutec hệ thống khaacutec Phải thường xuyecircn bổ sung tri thức mới vagrave thay đổi caacutec tri thức cũ để đổi mới hệ chuyecircn gia

Thu thập vagrave khắc phục lỗi do người sử dụng phaacutet hiện để kịp thời khắc phục những sai soacutet của hệ chuyecircn gia

75 Lợi iacutech vagrave hạn chế của caacutec hệ chuyecircn gia

Một số lợi iacutech chiacutenh

Thời gian trả lời hợp lyacute bằng hoặc nhanh hơn so với chuyecircn gia (người) để đi đến cugraveng một quyết định Hệ chuyecircn gia lagrave một hệ thống thời gian thực (real time system)

Khả năng trả lời với mức độ tinh thocircng bằng hoặc cao hơn so với chuyecircn gia (người) trong cugraveng lĩnh vực

Hệ chuyecircn gia giuacutep cho hiệu quả lagravem việc tăng bằng việc sử dụng tập caacutec luật một caacutech nhanh choacuteng magrave ko bị nhầm lẫn chuyecircn gia lagrave người coacute thể quecircn đi một số tri thức cơ sở lyacute luậ nhưng HCG thigrave ko

Quyết định của một người chuyecircn gia coacute thể bị thay đổi vagrave ko coacute tiacutenh thống nhất như quyết định của một hệ chuyecircn gia tạo ra

Hệ chuyecircn gia giuacutep cho người sử dụng coacute thể trau dồi sự hiểu biết trecircn lĩnh vuej cụ thể magrave noacute giải quyết hỗ trợ người ra quyết định coacute trigravenh độ như 1 chuyecircn gia trong quaacute trigravenh gia quyết định

Kiến thức của rất nhiều chuyecircn gia về một lĩnh vực nagraveo đoacute được đưa vagraveo hệ chuyecircn gia lagravem cho CSTT cuat HCG phong phuacute vagrave rộng lớn hơn rất nhiều

HCG giải thiacutech caacutec bước suy luận một caacutech dễ hiểu nhất quaacuten luacutec nagraveo cũng coacute thể sử dụng ko như chuyecircn gia con người

Hạn chế của caacutec hệ chuyecircn gia

Nhược điểm lớn nhất của hệ chuyecircn gia lagrave những yacute kiến chuyecircn mocircn thường rất khoacute matilde hoacutea vagrave giải neacuten

Hệ chuyecircn gia khocircng coacute khả năng tự học tự cập nhật kiến thức mới như caacutec chuyecircn gia magrave cần phải được matilde hoacutea lại khi noacute được cập nhật

Hệ chuyecircn gia khocircng thể nhận ra được vấn đề khocircng nằm trong miền kiến thức của hệ thống

Chương 8 Tri thức vagrave tiếp nhận

1 Bao gồm caacutec vấn đề

Dữ liệu thực tế đo lường hoặc quan saacutet coacute hoặc khocircng coacute bối cảnh

Thocircng tin dữ liệu được tổng hợp một caacutech hữu iacutech để giải quyết những khoacute khăn trong việc đưa ra quyết định

Tri thức bao gồm caacutec ứng dụng quy tắc thocircng tin hướng dẫn của người ra quyết định

2 Những caacutei nhigraven về tri thức

Đại diện lagravem thế nagraveo để diễn tả tri thức viacute dụ như một quyển saacutech khocircng phải lagrave tri thức nhưng noacute lại lagrave một đại diện của tri thức

Sản xuất tri thức lagrave một tập hơp của hagraveng tồn kho coacute thể được sản xuất cũng như mua lại

Tri thức lagrave 1 trong 6 trạng thaacutei của hệ thống

1Dữ liệu 2Thocircng tin 3Cấu truacutec thocircng tin 4Sự thấu hiểu 5Yacute kiến 6 Quyết định

3 Caacutec loại tri thức Phổ biến mocirc tả dữ liệu thocircng tin thủ tục mọi thứ lagravem như thế nagraveo lập luận chiacutenh saacutech hoặc caacutec quy tắc

4 Thu thập Tri thức hệ chuyecircn gia Hầu hết caacutec phương phaacutep đều bắt đầu với mocirc higravenh của caacutec taacutec vụ trong đoacute

hệ chuyecircn gia được xacircy dựng Trong đoacute mocirc tả về caacutec lĩnh vực được tạo ra Caacutec kỹ sư sử dụng caacutec mocirc higravenh giả thuyết vagrave nhận thức về quaacute trigravenh phacircn

tiacutech để gợi ra caacutech giải quyết vấn đề về tri thức từ caacutec chuyecircn gia

5 Caacutec chiều của thu thập tri thức KE- driven caacutec kỹ sư trao đổi trực tiếp với caacutec chuyecircn gia Expert-driven Caacutec chuyecircn gia trực tiếp đưa chuyecircn mocircn của họ vagraveo hệ

thống maacutey tiacutenh Machine-driven Sử dụng caacutec cocircng cụ suy luận để triacutech xuất tri thức từ một

tập caacutec viacute dụ

6 Kỹ thuật thu thập tri thức Trao đổi gồm 2 loại cơ bản lagrave coacute cấu truacutec(coacute kịch bản) vagrave khocircng coacute cấu

truacutec( đối thoại trực tiếp) Giao thức phacircn tiacutech bằng lời Khi caacutec chuyecircn gia thực hiện một cocircng việc

của họ thigrave một bản ghi về cocircng việc đoacute được thực hiện Caacutec kỹ sư sẽ xacircy dựng mocirc higravenh cho những gigrave được ghi lại trong bản ghi

Phương phaacutep sagraveng lọc caacutec chuyecircn gia so saacutenh caacutec nhoacutem liecircn tiếp trong ba đối tượng vagrave cho biết tại sao nhoacutem thứ hai lại khaacutec nhoacutem thứ ba

7 Thu thập tri thức từ nhiều nguồn Thu thập tri thức từ nhiều nguồn lagrave cần thiết để coacute được đầy đủ caacutec tri thức

cho một vấn đề quan điểm yacute kiến traacutei ngược nhau thường phaacutet sinh Phương phaacutep đồng thuận sẽ giuacutep giải quyết được vấn đề macircu thuẫn Kỹ thuật phacircn tiacutech Meta lagrave kỹ thuật được aacutep dụng trong caacutec trường hợp

khaacutec Caacutech tiếp cận bằng định lượng đogravei hỏi caacutec kỹ sư cần cacircn nhắc yếu tố đầu vagraveo của caacutec chuyecircn gia khaacutec nhau

8 Xaacutec nhận hợp lệ vagrave kiểm tra tri thức Một khi thu thập tri thức noacute phải được đaacutenh giaacute về khả năng sử dụng vagrave độ

chiacutenh xaacutec Hai vấn đề cụ thể lagrave hiệu lực của những kiến thức vagrave kiểm tra việc xacircy dựng cơ sở của tri thức

Cần xaacutec nhận xem liệu hệ thống coacute thể hoạt động ở mức độ tối thiểu khocircng

Xaacutec minh liecircn quan đến việc so saacutenh từng chi tiết kỹ thuật của hệ thống những gigrave đatilde được thực hiện cuối cugraveng

9 Một số caacutec biện phaacutep xaacutec nhận Độ chiacutenh xaacutec Khả năng thiacutech nghi Mức độ đầy đủ Bề rộng Độ sacircu Hiệu lực Tổng quan Chiacutenh xaacutec Hiện thực Độ tin cậy Tiacutenh hữu dụng Mức độ

Chương 9 Học maacutey

1 Logic mờ vagrave ngocircn ngữ mờ(Fuzzy Logic and Linguistic Ambiguity)

Ngocircn ngữ tự nhiecircn gồm những khaacutei niệm mơ hồ vagrave khocircng chiacutenh xaacutectruyền tải ngữ nghĩa thocircng qua tiacutenh xấp xỉkhocircng rotilde ragraveng

Những xấp xỉ nagravey giuacutep con người coacute thể truyền tải hết được yacute nghĩa nhưng maacutey thigrave khocircng hiểu

Lagravem sao biểu diễn caacutec tri thức sử dụng caacutec khaacutei niệm khocircng rotilde ragraveng(mờ) hoặc khocircng chiacutenh xaacutec

2 Khaacutei niệm cơ bản của logic mờ tập mờ lagrave những tập hợp khocircng coacute một giới hạn rotilde Mỗi phần tử của noacute chỉ

chứa một mức độ hagravem liecircn thuộc của từng phần tử Vigrave vậy tập mờ khocircng giống như tập cổ điển Tập mờ coacute thể kết hợp với nhau qua những luật mờ magrave đặc trưng cho những hagravenh động trạng thaacutei vagrave thuộc tiacutenh của logic mờ được tận dụng khi thực hiện một bộ điều khiển mờ

Logic mờ dựa trecircn yacute tưởng mỗi phần tử thuộc vagraveo một tập hợp ở một mức độ nagraveo đấy

Locircgic mờ cho pheacutep độ liecircn thuộc (microA )coacute giaacute trị trong khoảng (01) Locircgic mờ coacute thể được coi lagrave mặt ứng dụng của lyacute thuyết tập mờ để xử lyacute caacutec

giaacute trị trong thế giới thực cho caacutec bagravei toaacuten phức tạp

3 So saacutenh tiacutenh đuacuteng đắn logic mờ vagrave xaacutec suất Xaacutec suất thigrave đề cập đến khả năng xảy ra một biến cố hay một điều gigrave đoacute Logic mờ đề cập đến cấp độ magrave đặc tiacutenh ở hiện tại

o viacute dụ1 người coacute chiều cao 6 feet thigrave coacute cấp độ lagrave 05 về chiều cao

4 Ưu điểm của logic mờ Caacutech tiếp cận rất tự nhiecircnkhocircng phức tạp Coacute thể mocirc higravenh hoacutea caacutec hagravem phi tuyến tugravey yacute phức tạp

Coacute thể tận dụng được kinh nghiệm từ những chuyecircn gia hagraveng đầu trong mọi lĩnh vực

Logic mờ được xacircy dựng dựa trecircn ngocircn ngữ tự nhiecircnNền tảng của logic mờ lagrave dựa trecircn cơ sở giao tiếp của con người

5 Nhược điểm của logic mờ Trong 1 hệ thống phức tạpsử dụng logic mờ coacute thể trở thagravenh trở ngại cho

việc xaacutec thực độ tin cậy của hệ thống Cơ chế lập luận mờ khocircng thể học hỏi từ những lỗi sai

6 Mạng noron nhacircn tạo(ANN) Mạng noron nhacircn tạo lagrave một mocirc phỏng xử lyacute thocircng tinđược nghiecircn cứu ra

từ hệ thống thần kinh của sinh vậtgiống như bộ natildeo để xử lyacute thocircng tin ANNs lagrave chương trigravenh dựa trecircn maacutey tiacutenh đơn giản coacute chức năng lagrave một mocirc

higravenh bagravei toaacuten khocircng gian dựa trecircn thử nghiệm vagrave baacuteo lỗi

7 Học từ kinh nghiệm Tiến trigravenh Một mẫu dữ liệu được biểu diễn như một mạng lưới noronANN ldquodự

đoaacutenrdquo 1 đầu radự đoaacuten được so saacutenh với giaacute trị thực tế hoặc giaacute trị chiacutenh xaacutecNếu đoaacuten được chiacutenh xaacutec thigrave khocircng coacute hagravenh động nagraveo được thực hiện

Nếu dự đoaacuten sai ANN kiểm tra lại vagrave xaacutec định lại thocircng số để điều chỉnh Một mẫu dữ liệu khaacutec được biểu diễn vagrave quaacute trigravenh nagravey được lặp lại

8 Nguyecircn tắc cơ bản của cocircng nghệ nơron Caacutec yếu tố xử lyacute cơ bản trong hệ thống thần kinh của con người lagrave tế bagraveo

thần kinhMạng lưới của tế bagraveo nagravey lagrave liecircn kết với nhau nhận được thocircng tin từ caacutec cảm biến trong mắt taihellip

Thocircng tin nhận được bởi tế bagraveo thần kinh hoặc lagrave sẽ kiacutech thiacutech noacute(sẽ được chuyển qua 1 thocircng điệp dọc theo mạng lưới) hoặc lagrave sẽ ngăn cản noacute(ngăn cản dograveng thocircng tin)

Độ nhạy coacute thể thay đổi qua thời gian hoặc sau khi coacute được kinh nghiệm

9 Cấu truacutec mạng Một ANN gồm 3 lớp cơ bản

Lớp đầu vagraveo nhận dữ liệu Lớp becircn trong hoặc lagrave lớp ẩn xử lyacute dữ liệu Lớp đầu ra chuyển tiếp kết quả cuối cugraveng của mạng

10Mạng nơ ron Thường coacute nhiều đầu vagraveo mỗi đầu vagraveo với mức ảnh hưởng vagrave tầm quan

trọng riecircng của noacute Một đầu vagraveo quan trọng coacute thể được sử dụng để khuếch đại đầu ra caacutec hagravem trạng thaacutei tổng hợp caacutec trọng số của caacutec yếu tố

đầuvagraveo khaacutec nhauvagraveo một giaacute trị duy nhất Caacutec hagravem chuyển giao xử lyacute caacutec giaacute trị trạng thaacutei vagrave tạo đầu ra

11Huấn luyện mạng nơ ron Trong mocirc higravenh coacute giaacutem saacutetANN được đến so saacutenh dự đoaacuten của chiacutenh

noacute với thocircng tin phản hồi coacute chứa caacutec kết quả mong muốn ANN sẽ phải tigravem caacutech thay đổi caacutec tham số becircn trong củamigravenh (caacutec trọng số vagrave caacutec ngưỡng) để tạo necircn một aacutenh xạ coacute khả năng aacutenh xạcaacutec đầu vagraveo thagravenh caacutec đầu ra mong muốn Sự thay đổi nagravey được tiến hagravenh nhờ việc so saacutenh giữa đầu ra thực sự vagrave đầu ra mong muốn

Trong mocirc higravenh khocircng coacute giaacutem saacutetANN nhận được dữ liệu vagraveo nhưng khocircng phải coacute bất kỳ thocircng tin phản hồi về kết quả mong muốn

Phần lớn caacutec ứng dụng nằm trong vugraveng của caacutec bagravei toaacuten ước lượng như mocirc higravenh hoacuteathống kecirc neacuten lọc phacircn cụm

12Lợi iacutech Liecircn kết với mạng noron Traacutenh caacutech lập trigravenh tường minh Giảm nhu cầu của chuyecircn gia ANNs thigrave thiacutech nghi với caacutec yếu tố đầu vagraveo thay đổi Khocircng cần thiết cho cơ sở tri thức tinh chế ANNs coacute tiacutenh động vagrave cải thiện với việc sử dụng Coacute khả năng xử lyacute dữ liệu khocircng chiacutenh xaacutec hoặc khocircng đầy đủ Cho pheacutep tổng quaacutet hoacutea từ thocircng tin cụ thể Cho pheacutep thu thập cảm giaacutec thocircng thường vagraveo miền giải quyết vấn đề

13Hạn chế của việc liecircn kết với mạng noron ANNs khocircng thể giải thiacutech được suy luận Bản chất hộp đen thường khiến cho vấn đề traacutech nhiệm vagrave độ tin cậy phaacutet

sinh lagrave khoacute khăn Lặp đi lặp lại quaacute trigravenh huấn luyện rất tốn thời gian Nguồn lực caacutec nhagrave phacircn tiacutech vagrave thiết kế coacute tay nghề cao vẫn lagrave đaacuteng lo

ngại Cocircng nghệ ANN thuacutec đẩy hạn chế của phần cứng hiện tại ANN yecircu cầu phải coacute sự tin tưởng ở đầu ra

14Giới thiệu về thuật toaacuten di truyền Cũng như mạng lưới thần kinh caacutec thuật toaacuten di truyền được dựa trecircn lyacute

thuyết sinh học Thuật toaacuten di truyền tigravem thấy nguồn gốc của chuacuteng trong caacutec lyacute thuyết

tiến hoacutea của chọn lọc tự nhiecircn vagrave thiacutech ứng với biến đổi khiacute hậu Kết quả thuật toaacuten di truyền lagrave từ giao phối 2 caacute thể trong quần thế để tạo

ra con caacutei đocirci khi tốt hơn so với bậc cha mẹ của chuacuteng 15Caacutec thagravenh phần cơ bản của thuật toaacuten di truyền

Toaacuten tử chọn lọc Caacutec caacute thể tốt được chọn lọc để đưa vagraveo thế hệ sau Sự chọn lọc nagravey căn cứ vagraveo độ thiacutech nghi với mocirci trường của mỗi caacute thể

Toaacuten tử lai gheacutep (crossover) Hai caacute thể cha vagrave mẹ trao đổi caacutec gen với nhau để tạo ra caacute thể con

Toaacuten tử đột biến (mutation) Một caacute thể thay đổi một số gen để biến đổi thagravenh một caacute thể mớiTất cả caacutec toaacuten tử trecircn khi thực hiện đều mang tiacutenh ngẫu nhiecircn

16Quaacute trigravenh cơ bản của một thuật toaacuten di truyền Khởi tạo

Đaacutenh giaacute quần thể

Lựa chọn NST thiacutech hợp nhất vagrave loại bỏ NST yếu nhất

Quy trigravenh giao nhau vagrave cải thiện quần thể

đột biến tiến trigravenh để khaacutem phaacute ra NST mới

17Ưu nhược điểm của việc kết hợp với thuật toaacuten di truyền Kiacutech thước quần thể lagrave 1 yếu tố quan trọng trong tốc độ của việc tigravem

kiếmnhưng noacute tương đối dễ dagraveng để dự đoaacuten tốc độ nagravey Giao nhau hoặc đột biến lagrave khocircng necircn đc sử dụng quaacute thường xuyecircn Luocircn coacute được iacutet nhất 1 giải phaacutep hợp lyacute Necircn coacute thể aacutep dụng chuacuteng cho caacutec vấn đề magrave chuacuteng ta khocircng coacute hướng

về caacutech giải quyết Sức mạnh của thuật toaacuten xuất phaacutet từ khaacutei niệm đơn giảnkhocircng phải từ

một thủ tục thuật toaacuten phức tạp 18Tương lai của học maacutey

Mạng lưới thần kinh nhacircn tạo vượt quaacute năng lực của con người trong caacutec trường hợp bị cocirc lập

Về mặt lyacute thuyếtmột maacutey tiacutenh coacute thể xử lyacute dũ liệu nhanh hơn hagraveng triệu lần so với 1 con người

May mắn thay cho chuacuteng tacon người tốt hơn nhiều khi magrave coacute được dữ liệumaacutey tiacutenh khocircng coacute 1 số thứ như lagrave 5 giaacutec quan

CHƯƠNG 10 KHO DỮ LIỆU

1 Kho dữ liệu Kho dữ liệu lagrave tuyển tập caacutec cơ sở dữ liệu tiacutech hợp hướng chủ đề được

thiết kế để trợ giuacutep cho một hệ hỗ trợ quyết định

Theo John Ladley Cocircng nghệ kho dữ liệu lagrave tập caacutec phương phaacutep kỹ thuật vagrave caacutec cocircng cụ coacute thể kết hợp hỗ trợ nhau để cung cấp thocircng tin cho người sử dụng trecircn cơ sở tiacutech hợp từ nhiều nguồn dữ liệu nhiều mocirci trường khaacutec nhau

Kho dữ liệu thường rất lớn tới hagraveng trăm GB hay thậm chiacute hagraveng Terabyte

2 Kho dữ liệu vận hagravenh (ODS) Một kho dữ liệu vận hagravenh Aacutep dụng kỹ thuật kho dữ liệu vagraveo caacutec hệ xử

lyacute giao taacutec lưu trữ dữ liệu cho một ứng dụng đặc thugrave Noacute đưa vagraveo kho dữ liệu một dograveng caacutec dữ liệu thocirc được thiết kế

3 So saacutenh

Kho dữ liệu vận hagravenh Kho dữ liệu

Dữ liệu theo chủ đề Dữ liệu theo chủ đề

Dữ liệu tiacutech hợp Dữ liệu tiacutech hợp

Dữ liệu thay đổi Dữ liệu khocircng thay đổi

Dữ liệu được cập nhật khi thay đổi

Dữ liệu giữ nguyecircn

Chỉ coacute dữ liệu hiện tạiDữliệu hiện tại vagrave dữ liệu lịch sử

Chu kỳ lagravem tươi dữ liệu ngắn Chu kỳ lagravem tươi dữ liệu dagravei

Chỉ coacute dữ liệu chi tiết Dữ liệu chi tiết vagrave dữ liệu tổng kết

Dugraveng cho caacutec quyết định ngắn hạn

Dugraveng cho hoạch định dagravei hạn

4 Kho dữ liệu cục bộ (Data Mart - DM)

Kho dữ liệu cục bộ lagrave CSDL coacute những đặc điểm giống với kho dữ liệu nhưng với quy mocirc nhỏ hơn vagrave lưu trữ dữ liệu về một lĩnh vực một chuyecircn ngagravenh

Data mart phụ thuộc Chứa những dữ liệu được lấy từ DW vagrave những dữ liệu nagravey sẽ được triacutech lọc vagrave tinh chế tiacutech hợp lại ở mức cao hơn để phục vụ một chủ đề nhất định của Datamart

Data mart độc lập Khocircng giống như Datamart phụ thuộc Data mart độc lập được xacircy dựng trước DW vagrave dữ liệu được trực tiếp lấy từ caacutec nguồn khaacutec nhau

5 Siecircu dữ liệu Metadata lagrave dữ liệu để mocirc tả dữ liệu Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột

một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi Metadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu

6 Mocirci trường kho dữ liệu Hệ thống của tổ chức vagrave kho cung cấp dữ liệu để xacircy dựng kho dữ liệu Trong quaacute trigravenh chuyển dữ liệu từ caacutec nguồn khaacutec nhau dữ liệu coacute thể

được lagravem sạch hoặc chuyển đổi vagrave vigrave thế DW được xem như lagrave một chuẩn cho việc lưu trữ

Đồng thời siecircu dữ liệu được ghi lại Cuối cugraveng DW hoặc siecircu thị coacute thể được sử dụng để tạo ra một kho dữ

liệu ldquocaacute nhacircnrdquo 7 Caacutec đặc điểm của kho dữ liệu

Đặc điểm Mocirc tả

Hướng chủ đề - DL tổ chức theo caacutech thức người dugraveng tham chiếu

Tiacutech hợp - Dữ liệu ldquosạchrdquo loại bỏ tiacutenh thiếu nhất quaacuten

Khocircng thay đổi - DL ldquochỉ đọcrdquo người dugraveng khocircng thay đổi được

Chuỗi thời gian - DL lagrave chuỗi thời gian khocircng phải lagrave trạng thaacutei hiện tại

Được tổng kết - DL vận hagravenhthao taacutec khi cần thiết

được kết hợp lại thagravenh dạng coacute thể dugraveng được cho quyết định

Kiacutech cỡ lớn hơn - Lưu giữ theo chuỗi thời gian tức lagrave giữ lại nhiều DL

Khocircng được chuẩn hoacutea - Coacute thể dư thừa DLSiecircu dữ liệu - Dữ liệu của dữ liệu được lưu trữNguồn dữ liệu - DL vận hagravenh (caacutec hệ sẵn coacute) cugraveng

với caacutec nguồn ngoagravei 8 Kho dữ liệu hướng chủ đề

Hướng chủ để coacute nghĩa lagrave kho dữ liệu được tổ chức xung quanh caacutec chủ đề chiacutenh như khaacutech hagraveng sản phẩm sản xuất Tập trung vagraveo việc mocirc higravenh hoacutea vagrave phacircn tiacutech dữ liệu cho caacutec nhagrave ra quyết định magrave khocircng tập trung vagraveo caacutec xử lyacute thocircng thường Cung cấp cho người dugraveng một khung nhigraven toagraven vẹn đơn giản vagrave đầy đủ về caacutec sự kiện quanh caacutec chủ đề

9 Dữ liệu trong DW được tiacutech hợp Dữ liệu trong kho dữ liệu được xacircy dựng bằng caacutech tổng hợp dữ liệu từ

nhiều nguồn khaacutec nhau vagrave caacutec nguồn coacute tổ chức khaacutec nhau Cơ sở dữ liệu caacutec file excel caacutec flat file hoặc caacutec raw file Khi đưa vagraveo kho dữ liệu caacutec dữ liệu được lagravem sạch vagrave tiacutech hợp dữ liệu nhằm đảm bảo tiacutenh nhất quaacuten của dữ liệu

10Kiến truacutec kho dữ liệu Tầng cơ sở dữ liệu hoạt động Tầng truy xuất thocircng tin Tầng truy xuất dữ liệu Tầng siecircu dữ liệu Tầng quản lyacute tiến trigravenh Tầng thocircng điệp của ứng dụng Tầng vật liacute của kho dữ liệu Tầng trigravenh diễn dữ liệu

11Higravenh trạng kho dữ liệu Kho dữ liệu ảo - người dugraveng cuối coacute thể truy cập trực tiếp đến kho dữ liệu

sử dụng caacutec cocircng cụ cho pheacutep ở tầng truy xuất dữ liệu Kho dữ liệu trung tacircm-1 cơ sở dữ liệu vật lyacute chứa tất cả dữ liệu cho một

vugraveng chuyecircn dụng nagraveo đoacute

Kho dữ liệu phacircn taacuten- Thagravenh phần được phacircn taacuten qua nhiều hệ cơ sở dữ liệu vật lyacute

12METADATA- Siecircu dữ liệu Định nghĩa Siecircu dữ liệu lagrave dữ liệu về dữ liệu Lagrave 1 lưu trữ dugraveng để

Miecircu tả kho dữ liệu tổng thể Nhận dạng kiểu kho dữ liệu Quản liacute quaacute trigravenh tiacutech hợp dữ liệu Quản liacute quaacute trigravenh cập nhật kho dữ liệu Quản liacute bảo mật

Lagrave chigravea khoacutea quyết định sự thagravenh cocircng của kho dữ liệu luocircn được thay đổi vagrave cập nhật theo sự phaacutet triển của kho dữ liệu

Dugraveng để quản liacute điều khiển kho dữ liệu Sự ra đời của kho dữ liệu như 1 cấu truacutec hỗ trợ ra quyết định siecircu dữ liệu

được xem như nguồn tagravei nguyecircn dữ liệu Siecircu dữ liệu lagrave trừu tượng Chuacuteng lagrave dữ liệu bậc cao cung cấp mocirc tả ngắn

gọn caacutec dữ liệu bậc thấp hơn 13Hoạt động của Siecircu dữ liệu

Siecircu dữ liệu rất cần thiết trong việc chuyển hoacutea thocircng tin trở thagravenh tri thức Lagrave chigravea khoacutea giuacutep chuacuteng ta xử lyacute được dữ liệu thocirc Viacute dụ một dograveng dữ liệu baacuten hagraveng 1023 K596 11121 agraveNoacute sẽ khocircng coacute nghĩa gigrave cho đến khi chuacuteng ta đưa vagraveo siecircu dữ liệu (thư

mục chứa dữ liệu) agrave cửa hagraveng 1023 sản phẩm K596 vagrave số tiền baacuten được lagrave 11121 đocirc la

14Sự cần thiết phải nhất quaacuten trong kho dữ liệu Kho dữ liệu được xacircy dựng cho lợi iacutech của những nhagrave phacircn tiacutech kinh

doanh caacutec nhagrave quản trị cho tất cả caacutec khu vực chức năng Trong cơ sở dữ liệu riecircng caacutec khu vực khaacutec nhau coacute thể định nghĩa vagrave lưu

trữ dữ liệu thocircng qua phiecircn bản của chiacutenh noacute Khi dữ liệu được lấy từ những vugraveng khaacutec nhau đoacute vagrave được đặt vagraveo kho dữ

liệu Việc chuyển đổi vagrave lagravem sạch caacutec tiến trigravenh sẽ đảm bảo noacute lagrave duy nhất được tiacutech hợp tại một mức của tổ chức

15Ragrave soaacutet lại dữ liệu ndash Thực thi siecircu dữ liệu

Bất kể cấu truacutec tự nhiecircn của 1 cacircu truy vấn thế nagraveo thigrave caacutec thagravenh phần của siecircu dữ liệu rất quan trọng đối với người ra quyết định

Bảng thuộc tiacutenh khoacutea được lưu trữ bởi kho dữ liệu Tập hợp dữ liệu được lấy từ đacircu Những chuyển đổi nagraveo được thực thi với việc lagravem sạch

16Siecircu dữ liệu lagrave gigrave Metadata - lagrave thocircng tin mocirc tả nội dung của cơ sở dữ liệu (CSDL) Metadata baacuteo cho người dugraveng biết thời gian cập nhật sau cugraveng của dữ liệu

định dạng vagrave mục điacutech sử dụng của noacute Những thocircng tin nagravey coacute thể hướng dẫn người dugraveng duyệt qua CSDL vagrave

giuacutep họ hiểu được yacute nghĩa vagrave ngữ cảnh của dữ liệu Trong CSDL metadata lagrave caacutec dạng biểu diễn khaacutec nhau của caacutec đối tượng

trong CSDL Trong CSDL quan hệ metadata lagrave caacutec định nghĩa của bảng cột CSDL

view vagrave nhiều đối tượng khaacutec Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột

một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi -gtMetadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu

Bảng chuyển đổi Ghi lại những chuyển đổi đatilde được thực hiện

Lịch sử thực thi Ghi lại những dữ liệu đatilde được

phacircn tiacutech

Higravenh thaacutei kết nốiGhi lại những dữ liệu được kết nối vagrave tần suất

17Aacutenh xạ thocircng thường của siecircu dữ liệu Bản ghi aacutenh xạ chuyển đổi bao gồm

Định danh của nguồn gốc Chuyển đổi thuộc tiacutenh Chuyển đổi thuộc tiacutenh vật lyacute Matilde hoacutea tham chiếu bảng chuyển đổi Đổi tecircn Đổi khoacutea Gaacuten giaacute trị cho thuộc tiacutenh mặc định Chọn logic cho caacutec nguồn nhiều giaacute trị Đổi thuật toaacuten

18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để

phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai

lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave

tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec

Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm

Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo

19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua

caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau

SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được

Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra

một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức

Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ

Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ

Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech

CHƯƠNG 11 KHAI PHAacute DỮ LIỆU

1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn

ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993

Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng

2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd

1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều

2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP

3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn

4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng

5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server

6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo

7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động

8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời

9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều

10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện

11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech

12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP

3 Xử lyacute phacircn tiacutech trực tuyến OLAP

MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave

dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu

ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave

thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu

HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave

ROLAP4 Khai phaacute dữ liệu

Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh

khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn

Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan

5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp

6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại

Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp

Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec

Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt

Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra

Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh

vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho

Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec

Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm

Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục

Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng

gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp

Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn

Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec

Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper

Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2

Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25

Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước

Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng

Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện

trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp

Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute

độ hỗ trợ ge ngưỡng minsup

độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan

Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn

Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết

Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu

MOLAP ROLAP HOLAP

Lưu trữ dữ liệu cơ sở

Khối Bảng quan hệ Bảng quan hệ

Lưu trữ thocircng tin tổng hợp

Khối Bảng quan hệ Khối

Hiệu suất thực hiện truy vấn

Nhanh nhất Chậm nhất Nhanh

Tiecircu thụ khocircng gian lưu trữ

Nhiều Thấp Trung bigravenh

Chi phiacute bảo trigrave Cao Thấp Trung bigravenh

Page 15: De cuong(1-11)

1048713 Tiết kiệm thời gian tiacutenh toaacuten vagrave do vậy tiết kiệm thời gian thực trong ra quyết định Một số vấn đề phức tạp đến nỗi chỉ coacute thể giải được bằng heuristics 1048713 Thường sinh ra nhiều giải phaacutep chấp nhận được 1048713 Thường coacute thể phaacutet biểu lyacute thuyết hay đo lường thực nghiệm về chất lượng của giải phaacutep (tức giaacute trị mục tiecircu của giải phaacutep gần với giaacute trị tồi ưu đến mức nagraveo dugrave giaacute trị tối ưu chưa biết được) 1048713 Coacute thể kết hợp tiacutenh thocircng minh vagraveo để hướng dẫn pheacutep tigravem kiếm (tigravem kiếm tabu) Năng lực thocircng minh đoacute coacute thể lagrave đặc thugrave theo bagravei toaacuten hoặc dựa trecircn yacute kiến chuyecircn gia được cấy trong hệ chuyecircn gia hoặc cơ chế tigravem kiếm 1048713 Coacute thể dugraveng heuristic hiệu quả vagraveo caacutec mocirc higravenh coacute thể giải bằng quy hoạch toaacuten học Đocirci khi heuristic lagrave phương phaacutep được ưa thiacutech hơn khi khaacutec giải phaacutep heuristics được dugraveng như giải phaacutep ban đầu cho caacutec phương phaacutep quy hoạch toaacuten học bull Hạn chế 1048713 Khocircng đảm bảo coacute được giải phaacutep tối ưu 1048713 Caacutec quy luật coacute rất nhiều ngoại lệ 1048713 Caacutec lựa chọn quyết định tuần tự coacute thể khocircng tiecircn đoaacuten được caacutec kết cục tương lai của mỗi chọn lựa 1048713 Sự liecircn thuộc giữa caacutec phần trong hệ thống đocirci khi coacute thể gacircy ra caacutec ảnh hưởng lớn lao lecircn toagraven hệ thống bull Phacircn loại caacutec giải thuật heuristic 1048713 Heuristic xacircy dựng xacircy dựng giải phaacutep khả thi bằng caacutech cộng thecircm từng thagravenh phần một VD bagravei toaacuten người baacuten hagraveng ndash luocircn gheacute thagravenh phố chưa viếng thăm kế tiếp gần nhất

1048713 Heuristic cải tiến bắt đầu bằng một giải phaacutep khả thi vagrave cố gắng cải tiến liecircn tục trecircn đoacute VD trecircn thử hoaacuten đổi 2 thagravenh phố 1048713 Quy hoạch toaacuten aacutep dụng vagraveo caacutec mocirc higravenh chứa iacutet ragraveng buộc nhằm coacute được thocircng tin về thỏa hiệp tốt nhất với mocirc higravenh nguyecircn gốc Thường được dugraveng trong tối ưu hoacutea nguyecircn (integer optimization) 1048713 Chia giai đoạn giải quyết một vấn đề theo từng giai đoạn VD ở PampG trecircn đacircy bagravei toaacuten phacircn phối được giải quyết trước sau đoacute dugraveng giải quyết bagravei toaacuten chiến lược sản phẩm 1048713 Phacircn ratilde chia bagravei toaacuten thagravenh caacutec phần nhỏ hơn coacute thể giải quyết được sau đoacute kết hợp caacutec giải phaacutep đoacute lại VD chia latildenh thổ baacuten hagraveng thagravenh 4 vugraveng khaacutec nhau giải quyết cho từng vugraveng sau đoacute kết nối caacutec giải phaacutep

21Mocirc phỏngbull Giả định caacutec đặc điểm của thực tạibull Lagrave kỹ thuật tiến triển caacutec thực nghiệm (như phacircn tiacutech ldquowhat-ifrdquo) - bằng maacutey tiacutenh -trecircn một mocirc higravenh của hệ thocircng tin quản lyacute

bull Khocircng thực sự lagrave một mocirc higravenh vigrave khocircng biểu diễn thực tại magrave lagrave cố gắng bắtchước thực tạibull Một trong những phương phaacutep thocircng dụng nhất trong HHTQĐbull HHTQĐ lagravem việc với caacutec bagravei toaacuten phi cấu truacutec vagrave cấu truacutec yếu tigravenh huống thực tếphức tạp ndash khocircng dễ biểu diễn bằng mocirc higravenh tối ưu hay caacutec dạng mocirc higravenh khaacutecnhưng lại thường coacute thể xử lyacute được bằng mocirc phỏngbull Đặc điểm1048713 Iacutet đưa ra caacutec đơn giản hoacutea về thực tại hơn caacutec mocirc higravenh khaacutec1048713 Do triển khai caacutec thực nghiệm necircn noacute coacute thể kiểm thử caacutec giaacute trị cụ thể của caacutecbiến quyết địnhbiến khocircng kiểm soaacutet được của mocirc higravenh vagrave xem xeacutet ảnh hưởnglecircn caacutec biến kết quả1048713 Phương phaacutep coacute tiacutenh mocirc tả (như vậy khaacutec với phương phaacutep danh định)1048713 Khocircng tự động tigravem kiếm giải phaacutep tối ưu ndash noacute mocirc tảtiecircn đoaacuten caacutec đặc tiacutenh của hệthống đatilde cho dưới caacutec điều kiện khaacutec nhau từ đoacute coacute thể chọn ra phương aacuten tốtnhất1048713 Quaacute trigravenh mocirc phỏng thường lặp lại một thực nghiệm nhiều lần để coacute được ướclượng về hiệu ứng tổng quaacutet của một số hagravenh động nhất định1048713 Mocirc phỏng maacutey tiacutenh thiacutech hợp cho hầu hết caacutec tigravenh huống mặc dugrave cũng coacute một sốmocirc phỏng thủ cocircng thagravenh cocircng1048713 Thường chỉ được dugraveng khi bagravei toaacuten quaacute phức tạp khocircng thể xem xeacutet bằng caacutec kỹthuật tối ưu dạng số Tiacutenh phức tạp theo nghĩa bagravei toaacuten khocircng thể cocircng thức hoacuteacho tối ưu (do khocircng thotildea caacutec giả định) hoặc cocircng thức quaacute lớn quaacute nhiều tươngtaacutec giữa caacutec biến hoặc về bản chất bagravei toaacuten lagrave bất định hay rủi roPhương phaacutep mocirc phỏng thiết lập mocirc higravenh của hệ thống thực vagrave tiến hagravenh caacutec thựcnghiệm lặp lại trecircn mocirc higravenh

bull Thuận lợi1048713 Lyacute thuyết tương đối trực tiếp hiệu ứng dagravei hạn của nhiều chiacutenh saacutech -gt neacuten thờigian lớn1048713 Do tiacutenh chất mocirc tả (khaacutec với danh định)1048713 Coacute thể thấy được nhanh choacuteng coacute thể đặt ra caacutec cacircu hỏi ldquowhat-ifrdquo coacute thể dugravengtiếp cận thử-vagrave-sai vagraveo giải quyết vấn đề một caacutech nhanh choacuteng rẻ chiacutenh xaacutec iacutetrủi ro hơn1048713 Thử nghiệm được biến quyết định phần nagraveo của mocirci trường thực sự quan trọngvới caacutec phương aacuten khaacutec nhau1048713 Yecircu cầu kiến thức riecircng biệt về bagravei toaacuten vigrave thế buộc người xacircy dựng mocirc higravenh phảilagravem việc thường xuyecircn với nhagrave quản lyacute ndash đối tượng mong muốn của HHTQĐ để

từ đoacute bản chất bagravei toaacuten vagrave caacutec quyết định được hiểu tốt hơn1048713 Mocirc higravenh được xacircy dựng từ viễn cảnhcaacutech nhigraven của nhagrave quản lyacute1048713 Mocirc higravenh chỉ cho một bagravei toaacuten riecircng biệt thường khocircng thể dugraveng giải caacutec bagravei toaacutenkhaacutec Như vậy mỗi thagravenh phần của mocirc higravenh ứng với một phần của hệ thống thựcdo đoacute sẽ khocircng yecircu cầu nhagrave quản lyacute phải tổng quaacutet hoacutea caacutec hiểu biết của migravenh1048713 Phổ bagravei toaacuten giải được rất rộng tồn kho nhacircn sự hoạch định chiến lược 1048713 Coacute thể chứa caacutec phức tạp thực sự của bagravei toaacuten khocircng cần caacutec đơn giản hoacutea (TDdugraveng caacutec phacircn phối xaacutec suất thực thay vigrave phacircn phối lyacute thuyết xấp xỉ)1048713 Coacute thể tự động sinh ra nhiều đo lường hiệu năng quan trọng1048713 Thường lagrave phương phaacutep duy nhất của HHTQĐ coacute thể xử lyacute caacutec bagravei toaacuten tương đốiphi cấu truacutec1048713 Coacute một số caacutec goacutei phần mềm mocirc phỏng (Monte Carlo) tương đối dễ dugravengbull Điểm yếu1048713 Tuy thường tigravem được caacutec phương aacuten đủ tốt nhưng khocircng đảm bảo lời giải tối ưu1048713 Quaacute trigravenh xacircy dựng mocirc higravenh thường dagravei vagrave tốn keacutem1048713 Giải phaacutep vagrave suy diễn từ nghiecircn cứu mocirc phỏng thường khocircng thể chuyển sang bagraveitoaacuten khaacutec vigrave mocirc higravenh kết hợp caacutec yếu tố đặc thugrave1048713 Đocirci khi do mocirc higravenh quaacute dễ giải thiacutech cho nhagrave quản lyacute necircn caacutec phương phaacutep phacircntiacutech thường xem nhẹ1048713 Phần mềm mocirc phỏng đocirci khi yecircu cầu caacutec kỹ năng đặc biệt do độ phức tạp củaphương phaacutep giải higravenh thứcbull Caacutec loại mocirc phỏng1048713 Mocirc phỏng xaacutec suất một hay nhiều biến độc lập mang tiacutenh xaacutec suất với 2 loạiphacircn phối ndash thường dugraveng kỹ thuật Monte Carlo1048713 Phacircn phối rời rạc tigravenh huống coacute một số giới hạn caacutec biến cố (biến) với hữu hạncaacutec giaacute trị cho mỗi biến cố (biến)1048713 Phacircn phối liecircn tục tigravenh huống coacute số lượng khocircng giới hạn caacutec biến cố tuacircn theocaacutec hagravem mật độ xaacutec suất như phacircn phối chuẩn1048713 Mocirc phỏng độc lậpphụ thuộc theo thời gian1048713 Độc lập khocircng cần thiết phải biết chiacutenh xaacutec thời điểm xảy ra biến cố (nhu cầutiecircu thụ lượng sản phẩm trong ngagravey khocircng biết chiacutenh xaacutec thời điểm tiecircu thụ)1048713 Phụ thuộc cần biết chiacutenh xaacutec thời điểm xảy ra sự kiện (bagravei toaacuten hagraveng đợi)1048713 Mocirc phỏng tương taacutec trực quan1048713 Mocirc phỏng hướng đối tượng dugraveng tiếp cận hướng đối tượng để xacircy dựng mocirc higravenhmocirc phỏng Chuacute yacute ngocircn ngữ mocirc higravenh hoacutea nhất thể UML (unified modelinglanguage) kể cả khi mocirc phỏng caacutec hệ thời gian thựcMOcirc HIgraveNH HOacuteA ĐA CHIỀU ndash XỬ LYacute PHAcircN TIacuteCH TRỰC TUYẾNbull Người ra quyết định thường phải xem xeacutet nhiều chiều của dữ liệu (TD caacutec chiềucủa dữ liệu baacuten hagraveng lagrave sản phẩm vugraveng thời gian người baacuten ) dữ liệu cần đượcphacircn tiacutech trực tiếp bằng caacutec cocircng cụ chuẩn hay phacircn tiacutech tự động bằng caacutec

phương phaacutep khai mỏ dữ liệu (data mining)bull Hầu hết caacutec hệ thống phacircn tiacutech đa chiều được nhuacuteng trong caacutec hệ xử lyacute phacircn tiacutechtrực tuyến (HXLPTTT ndash online analytic processing - OLAP)bull Mục tiecircu của XLPTTT nắm bắt cấu truacutec của dữ liệu thực để hỗ trợ ra quyết địnhbull Trong HHTQĐ coacute sự gắn nối tự nhiecircn giữa mocirc higravenh hoacutea dữ liệu mocirc higravenh hoacutea kyacutehiệu vagrave caacutec khiacutea cạnh của phacircn tiacutech ldquowhat-ifrdquobull Caacutec baacuteo caacuteo của HXLPTTT đều coacute tiacutenh tương taacutec dễ khai thaacutec sử dụng đặc biệtphugrave hợp cho caacutec baacuteo caacuteo về chỉ số hiệu năng chủ yếu (key performance indicators- KPI) baacuteo caacuteo về đo lường hiệu năng kinh doanh bull Thế hệ hiện tại của HXLPTTT vagrave hệ khai mỏ dữ liệu (data mining) tiacutech hợp caacutecđặc tiacutenh của hệ thocircng tin latildenh đạo (executive information system ndashEIS- nhiềucaacutech nhigraven dữ liệu chi tiết hoacutea theo nhu cầu) vagrave caacutec hệ đồ họa khaacutec ndash thường coacutegiao diện người dugraveng dạng kiểu WEBbull Caacutec hệ thống như trecircn cograven được gọi lagrave caacutec cocircng cụ triacute tuệ kinh doanh (businessintelligence - BI) vigrave coacute caacutec đặc trưng về mocirc higravenh hoacutea vagrave tối ưu hoacutea nhưng lạitrong suốt đối với ngươigrave dugravengbull Hiện caacutec cocircng cụ được đưa ra bởi caacutec nhagrave cung cấp về CSDL về hoạch định tagraveinguyecircn tổ chức (ERP) về nhagrave kho dữ liệu (data warehouse) về HXLPTTT MOcirc HIgraveNH HOacuteA VAgrave MOcirc PHỎNG TƯƠNG TAacuteC TRỰC QUANbull Iacutech lợi Người ra quyết định tham gia vagraveo quaacute trigravenh phaacutet triển mocirc higravenh vagrave thựcnghiệm mocirc phỏng vigrave vậy sẽ tin tưởng khi sử dụng mocirc higravenhbull Mocirc higravenh hoacutea tương taacutec trực quan (visual interactive modeling - VIM) dugraveng caacutecbiểu diễn đồ họa maacutey tiacutenh để trigravenh bagravey caacutec ảnh hưởng của caacutec quyết định quản lyacutekhaacutec nhau ở một thời điểm (tĩnh) hay tiến triển theo thời gian (động với kỹ thuậthoạt higravenh)bull Mocirc phỏng tương taacutec trực quan (visual interactive simulation - VIS) cho pheacutepngười dugraveng theo dotildei tiến trigravenh xacircy dựng vagrave sử dụng khai thaacutec mocirc higravenh mocirc phỏngdưới dạng hoạt higravenhbull Mocirc higravenh hoacutea tương taacutec trực quan coacute thể kết hợp với tiếp cận triacute tuệ nhacircn tạo đểđưa ra caacutec khả năng mới thay đổi từ xacircy dựng hệ thống dạng đồ họa đến tigravem hiểuvề động học của hệ thốngbull Cần đến caacutec hệ thống maacutey tiacutenh xử lyacute song song tốc độ cao để xacircy dựng caacutec mocircphỏng - phức tạp quy mocirc lớn dạng hoạt higravenh - mang tiacutenh khả thi ở thời gian thực

22Caacutec dạng hệ thống hỗ trợ ra quyết địnhHệ hỗ trợ quyết định nhoacutemRa quyết định nhoacutem giao tiếp vagrave cộng taacutec- Caacutec đặc điểm của cocircng việc nhoacutem+ Một nhoacutem thực hiện một nhiệm vụ thỉnh thoảng ra quyết định thỉnh thoảngkhocircng ra quyết định+ Caacutec thagravenh viecircn trong nhoacutem coacute thể ở những nơi khaacutec nhau

+ Caacutec thagravenh viecircn trong nhoacutem coacute thể lagravem việc ở những thời gian khaacutec nhau+ Caacutec thagravenh viecircn trong nhoacutem coacute thể lagravem việc cugraveng nhau hoặc ở caacutec tổ chức khaacutecnhau+ Nhoacutem coacute thể vĩnh viễn hoặc tạm thời+ Nhoacutem coacute thể ở bất kỳ mức quản lyacute nagraveo hoặc mức thời gian nagraveo+ Coacute sự điều phối (quaacute trigravenh vagrave nhiệm vụ đạt được) hoặc macircu thuẩn trongnhoacutem+ Coacute sự đạt được hoặcvagrave mất maacutet năng suất trong tổ chức+ Nhiệm vụ phải hoagraven thagravenh rất nhanh+ Khocircng thể hoặc quaacute đắt cho tất cả caacutec thagravenh viecircn trong nhoacutem cugraveng hợp ở mộtnơi+ Một số dữ liệu thocircng tin hoặc kiến thức cần thiết nằm ở nhiều nơi một sốkhaacutec ở ngoagravei tổ chức+ Chuyecircn mocircn của caacutec thagravenh viecircn khocircng coacute trong nhoacutem lagrave cần thiết- Caacutec hoạt động vagrave caacutec quaacute trigravenh miecircu tả caacutec cuộc họp+ Cuộc họp lagrave hoạt động chung liecircn quan bởi một nhoacutem người coacute địa vị bằngnhau hoặc gần bằng nhau+ Kết quả của cuộc họp phụ thuộc một phần vagraveo kiến thức yacute kiến caacutec đaacutenh giaacutecủa caacutec thagravenh viecircn+ Kết quả của cuộc họp cũng phụ thuộc vagraveo sự kết hợp của nhoacutem vagrave phụ thuộcvagraveo quaacute trigravenh ra quyết định được sử dụng bởi nhoacutem đoacute+ Giải quyết caacutec yacute kiến khaacutec nhau bởi người coacute quyền hạn hoặc thương lượnghoặc phacircn xửHỗ trợ giao tiếp- Giao tiếp lagrave thagravenh phần quan trọng cho hỗ trợ quyết định Khocircng coacute giao tiếp thigravekhocircng coacute cộng taacutec Những người ra quyết định caacute nhacircn phải giao tiếp với caacutecđồng nghiệp chuyecircn gia cơ quan chiacutenh phủ khaacutech hagraveng đối taacutec kinh doanh hellipHọ cũng cần dữ liệu vagrave thocircng tin (vagrave kiến thức) từ nhiều nơi trecircn thế giới Caacutecnhoacutem ra quyết định phải giao tiếp cộng taacutec vagrave thương lượng trong cocircng việcHầu hết caacutec tổ chức sẽ nhanh trở thagravenh khocircng coacute chức năng nếu khocircng coacute caacutec hệthống giao tiếp Thương mại điện tử coacute thể hiệu quả chỉ qua caacutec kỹ thuật giao tiếphiện đại- Caacutec kỹ thuật thocircng tin hiện đại cung cấp caacutec phương tiện hỗ trợ giao tiếp rẻnhanh coacute khả năng coacute thể tin cậy Nền tảng hỗ trợ giao tiếp lagrave caacutec hệ thống maacuteytiacutenh mạng+ Bắt đầu bằng điện baacuteo điện thoại radio vagrave ti vi+ Trong 100 năm chuacuteng ta phaacutet triển maacutey fax thư điện tử chương trigravenh chatnhoacutem tin tức hệ thống hội nghị truyền higravenh Hầu hết caacutec kỹ thuật nagravey đềuhoạt động trecircn internet+ Sự phaacutet triển giao tiếp sau cugraveng lagrave hệ thống họp điện tử caacutec dịch vụ vagrave hệ

thống hội nghị điện tử thường sử dụng internet để kết nối caacutec người ra quyếtđịnh- Caacutec thuận lợi aacutep dụng caacutec phương phaacutep giao tiếp cải tiến trong caacutec tổ chức+ Cải tiến năng suất của nhacircn viecircn+ Liecircn quan đến nhiều người ra quyết định chiacutenh+ Khocircng quan tacircm nhiều đến đường biecircn giới địa lyacute+ Tạo nền văn hoacutea hợp taacutec nhất quaacuten+ Cải tiến chất lượng cuộc sống của nhacircn viecircnHỗ trợ cộng taacutec Maacutey tiacutenh hỗ trợ cộng taacutec- Khung thời giannơi chốn+ Sự hiệu quả của kỹ thuật tiacutenh toaacuten cộng taacutec phụ thuộc vagraveo vị triacute của caacutec thagravenhviecircn trong nhoacutem vagrave phụ thuộc vagraveo thời gian chia sẽ thocircng tin gởi vagrave nhận+ Chia sự giao tiếp thagravenh bốn ocirc vagrave tổ chức bốn ocirc dọc theo 2 chiều thời gian vagravenơi chốn1048713 Thời gian Khi gởi vagrave nhận thocircng tin hầu như đồng thời giao tiếp lagrave đồngthời Viacute dụ Điện thoại ti vi vagrave caacutec cuộc họp gặp mặt nhau Giao tiếp bấtđồng bộ xảy ra khi người nhận nhận thocircng tin ở thời điểm khaacutec thời điểmgởi thocircng tin đoacute1048713 Nơi chốn Người gởi vagrave người nhận coacute thể ở cugraveng phograveng hoặc khocircng+ Bốn ocirc lagrave1048713 Cugraveng thời giancugraveng nơi chốn Caacutec thagravenh viecircn gặp mặt nhau cugraveng một luacutecgiống như phograveng quyết định hoặc gặp mặt truyền thống1048713 Cugraveng thời giankhaacutec nơi chốn Caacutec thagravenh viecircn ở caacutec nơi khaacutec nhau nhưnggiao tiếp cugraveng nhau Viacute dụ hội nghị truyền higravenh (videoconferencing)1048713 Khaacutec thời giancugraveng nơi chốn Nhiều người lagravem việc theo ca Ca nagravey để lạithocircng tin cho ca khaacutec1048713 Khaacutec thời giankhaacutec nơi chốn Caacutec thagravenh viecircn ở caacutec nơi khaacutec nhau Caacutecthagravenh viecircn nagravey gởi vagrave nhận thocircng tin ở những lần khaacutec nhau

23Thực thi hệ DSSHệ thống hỗ trợ quản lyacute (MSS) khocircng phải luacutec nagraveo cũng luocircn thagravenh cocircng Nhiều trường hợpthất bại của ES khocircng hoagraven toagraven lagrave lyacute do kỹ thuật Thực thi hệ thống lagrave một quaacute trigravenh liecircn tụcnhằm đảm bảo cho tổ chức chuẩn bị tiếp nhận một hệ thống mới vagrave đưa hệ thống vagraveo sử dụngthagravenh cocircngThực hiện cocircng nghệ hệ thống hỗ trợ quản lyacute lagrave việc phức tạp vigrave caacutec hệ thống nagravey khocircng đơnthuần lagrave hệ thống thocircng tin chỉ thu thập thao taacutec vagrave phacircn phối thocircng tin Magrave xa hơn chuacuteng

liecircn quan tới caacutec cocircng việc coacute thể lagravem thay đổi đaacuteng kể caacutech thức hoạt động của tổ chức Tuyvậy đa số caacutec yếu tố thực thi đều liecircn quan tới hệ thống thocircng tinThực thi MSS lagrave quaacute trigravenh liecircn tục diễn ra trong suốt thời gian phaacutet triển hệ thống từ đề xuấtban đầu đến nghiecircn cứu khả thi thiết kế vagrave phacircn tiacutech hệ thống lập trigravenh huấn luyện chuyểnđổi vagrave lắp đặt Caacutec chuyecircn gia hệ thống thocircng tin thường gọi thực thi lagrave giai đoạn cuối trongvograveng đời hệ thống Định nghĩa thực thi MSS phức tạp hơn vigrave bản chất lặp của sự phaacutet triểncaacutec hệ thống

THỰC THI KHOcircNG HOAgraveN CHỈNHCaacutec quyết định về tiacutenh khả thi thường coacute giả định về lợi iacutech đạt được khi kế hoạch thực thiđược thực hiện hoagraven toagraven Trong thực tế thường chỉ thực hiện 90 thậm chiacute 70 phần trăm sovới phacircn tiacutech khả thi Lyacute do lagrave sự thay đổi tại một nơi trong hệ thống coacute thể ảnh hưởng vagrave coacutethể taacutec động tiecircu cực đến chỗ khaacutec Do vậy cấp quản lyacute coacute thể bỏ những phần trong dự aacuten coacutethể gacircy ra taacutec động xấu Do đoacute dự aacuten sẽ thực hiện iacutet hơn 100 so với dự aacuten kế hoạch Caacutec lyacutedo khaacutec coacute thể lagrave do khấu trừ ngacircn saacutech hoặc vượt chi phiacuteĐAacuteNH GIAacute SỰ THAgraveNH COcircNG CỦA THỰC THI HỆ THỐNGPhải coacute caacutec chỉ số đo lường thigrave mới coacute thể đaacutenh giaacute sự thagravenh cocircng khi thực thi một hệ thốngDickson va Powers (1973) đề ra 5 tiecircu chuẩn độc lậpbull Tỷ lệ thời gian thực hiện dự aacuten với thời gian ước lượngbull Tỷ lệ chi phiacute thực tế vagrave ngacircn saacutech thực hiệnbull Thaacutei độ của cấp quản lyacute đối với hệ thốngbull Nhu cầu thocircng tin của caacutec nhagrave quản lyacute được đaacutep ứng như thế nagraveo qua hệ thốngbull Taacutec động của dự aacuten đối với những hoạt động maacutey tiacutenh trong cocircng tyCaacutec đo lường khaacutec để đaacutenh giaacute thagravenh cocircng của hệ hỗ trợ quản lyacute (MSS)bull Sự sử dụng hệ thống (dự định dugraveng hoặc thực sự dugraveng)bull Thỏa matilden của người dugravengbull Thaacutei độ taacuten thagravenhbull Mức độ hệ thống hoagraven thagravenh caacutec mục tiecircu ban đầubull Phần thưởng đối với tổ chức (giảm chi phiacute tăng doanh thuhellip)bull Tỷ số lợi iacutech chi phiacute

bull Mức độ thể chế hoacutea của MSS trong tổ chứcDo bởi tiacutenh đa dạng của DSS necircn việc đaacutenh giaacute sự thagravenh cocircng của hệ nagravey cũng khoacute khăn tuynhiecircn cũng coacute thể coacute một số yếu tố giuacutep cho DSS thagravenh cocircng như sự tham gia người dugravenghuấn luyện người dugraveng hỗ trợ quản lyacute cấp cao nguồn thocircng tin đặc điểm của những nhiệmvụ coacute liecircn quan (cấu truacutec bất định độ khoacute phụ thuộc)

Chương5Nhoacutem hỗ trợ quyết định vagrave nhoacutemcocircng nghệ phần mềm

51Nhoacutem tạo quyết định

MDM-Holsapple đatilde gợi yacute chuacuteng ta sử dụng giới hạn người tạo quyết định

Một nhoacutem lagrave kết cấu MDM nơi magrave nhiều người ra quyết định hoagraven toagraven tương taacutec

Một đội lagrave kết cấu MDM nơi caacutec thagravenh viecircn tư vấn cho người đưa ra quyết định nhưng khocircng tương taacutec

Một Ủy ban lagrave kết cấu MDM với một người tạo quyết định duy nhất vagrave sự tương taacutec giữa caacutec thagravenh viecircn

Mạng thocircng tin

Mạng lưới baacutenh xe mỗi người tham gia coacute thể giao tiếp với người đưa ra quyết định ở trung tacircm nhưng khocircng phải với người tham gia khaacutecCấu truacutec nagravey lagrave khocircng thỏa matilden tất cả những người tham gia ngoại trừ người ra quyết định

Mạng dacircy chuyền Tham gia chuyển tiếp thocircng tin chỉ để noacute luocircn liền kề nhau trong chuỗi

Thagravenh viecircn cuối cugraveng ko được đaacutep ứng

Mạng vograveng trograven Tương tự như chuỗi nhưng kết thuacutec được kết nối

Mạng kết nối hoagraven toagraven khocircng coacute hạn chế về giao tiếp vagrave tương taacutec giữa caacutec thagravenh viecircnNoacutei chungnoacute đaacutep ứng hầu hết caacutec kết nối của người tham gia nhưng truyền đạt thocircng tin mất nhiều thời gian vagrave coacute nhiều cơ hội xảy ra lỗi

Nhoacutem hagravenh vi vagrave chuẩn mực

MDMs thiết lập caacutec chỉ tiecircu hướng dẫn quaacute trigravenh ra quyết định

Một chuẩn mực quy định cụ thể những gigrave thagravenh viecircn trong nhoacutem dự kiến sẽ lagravem trong những hoagraven cảnh nhất định

Quy tắc gửi coacute thể được thocircng qua viacute dụ đaacutenh giaacute ngang hagraveng hoặc xử phạt

Lagravem thế nagraveo để đưa ra quyết định

Việc chọn lựa magrave trong đoacute việc sử dụng cấu truacutec MDM phải được dựa trecircn một số yếu tố liecircn quan với bối cảnh quyết định

Viacute dụmột cấu truacutec riecircng lẻ sẽ lagravem việc nơi magrave quyết định được cấu truacutec cao vagrave thocircng tin lagrave coacute sẵn

Một ủy ban cơ cấu sẽ lagrave sự lựa chọn khi người ra quyết định khocircng thể đưa ra quyết định một migravenh

52Caacutec vấn đề thường gặp trong nhoacutem

Kiacutech thước Noacutei chung sự nhất triacute vagrave gắn kết giữa caacutec thagravenh viecircn tỉ lệ nghịch với phạm vi nhoacutem Trong nhoacutem lớn rất dễ higravenh thagravenh caacutec nhoacutem nhỏ vagrave hoạt động rời rạc

Tư duy tập thể Trong nhoacutem lớn mọi người coacute xu hướng suy nghĩ đểđạtđược sự nhất triacute necircn khocircng phaacutet huy được sự saacuteng tạo

Caacutec vấn đề về xatilde hội

Xung đột Trong 1 nhoacutem ai cũng muốn migravenh lagrave giỏi nhất necircn dễ dẫn đến xung đột

Ẩn danh(Giấu tecircn) Đacircy lagrave phương phaacutep được sử dụng để kiểm soaacutet xung đột Cho caacutec thagravenh viecircn tham gia ẩn danh

Vấn đề giới tiacutenh Nam vagrave nữ thường coacute những thế mạnh khaacutec nhau điều nagravey coacute thể lagrave sức mạnh trong 1 thiết lập MDM

Đagravem phaacuten vagrave quyết định

Một quyết định coacute thể liecircn quan đến nhiều quan điểm khaacutec nhau vigrave thế cần phải coacute sự đagravem phaacuten

Caacutec thiết kế của cơ chế hỗ trợ cho MDM phải phugrave hợp với caacutec hoạt độngđagravemphaacuten

Những hoạt động nagravey bao gồm việc thu nhận yacute kiến của caacutec thagravenh viecircn 1 caacutech cocircng bằng

53Cocircng nghệ hỗ trợ MDM

Organizational DSSndash 1 hệ thống cung cấp caacutec quyết định hỗ trợ

Group Support Systemndash Cocircng nghệ sử dụng sự hỗ trợ của nhiều becircn tham gia

Group DSS ndash Lagrave 1 hệ thống được thiết kế đặc biệt để hỗ trợ cho MDM

DSS ndash Lagrave 1 hệ thống dưới sự kiểm soaacutet của 1 người quyết định hệ thống nagravey cung cấp 1 bộ cocircng cụ giuacutep phacircn tiacutech hoagraven cảnh đểđưa ra quyết định vagrave nacircng cao hiệu quả của quyết địnhđoacute

53Cocircng nghệ hỗ trợ MDM

Organizational DSSndash 1 hệ thống cung cấp caacutec quyết định hỗ trợ

Group Support Systemndash Cocircng nghệ sử dụng sự hỗ trợ của nhiều becircn tham gia

Group DSS ndash Lagrave 1 hệ thống được thiết kế đặc biệt để hỗ trợ cho MDM

DSS ndash Lagrave 1 hệ thống dưới sự kiểm soaacutet của 1 người quyết định hệ thống nagravey cung cấp 1 bộ cocircng cụ giuacutep phacircn tiacutech hoagraven cảnh đểđưa ra quyết định vagrave nacircng cao hiệu quả của quyết địnhđoacute

Mục tiecircu của cocircng nghệ hỗ trợ MDM

Quy trigravenh hỗ trợ tập trung vagraveo quaacute trigravenh tạo điều kiện thuận lợi cho sự tương taacutec

Cơ chế cấu truacutec quaacute trigravenh chi phối caacutec hoạt động truyền thocircng

Nhiệm vụ hỗ trợ cocircng việc coacute thể chọn lựa tổ chức hoặc lấy thocircng tin

Nhiệm vụ cấu truacutec cocircng việc cho pheacutep truy cập đến kỹ thuật lọc kết hợp phacircn tiacutech kiến thức liecircn quan đến cocircng việc

Caacutec lớp loại cocircng nghệ hỗ trợ MDM

Phacircn loại theo đặc điểm do DeSanctis vagrave Gallupe đưa ra đề xuất một chương trigravenh ba cấp dựa trecircn caacutec tiacutenh năng được cung cấp

Hệ thống cấp 1 Mục điacutech chiacutenh lagrave tạo điều kiện thocircng tin liecircn lạc giữa caacutec thagravenh viecircn

Hệ thống cấp 2 Thiết kế để giảm thiểu rủi ro

Hệ thống cấp 3 Giuacutep điều chỉnh xử lyacute quyết định

Phacircn loại theo cocircng nghệ -Kraemer vagrave King tập trung vagraveo cocircng nghệ aacutep dụng

Cocircng nghệ bảng mạch điện tử

Hội nghị trực tuyến

Mạng lưới tập đoagraven

Trung tacircm thocircng tin

Mocirci trường cộng taacutec

Phograveng quyết định

Nhoacutem phần mềm

Phần mềm được thiết kế để hỗ trợ sự hợp taacutec bao gồm việc thu huacutet vagrave lưu trữ thocircng tin

Caacutec tổ chức dẫn đầu thị trường hiện tại lagrave Lotus Notes and Domino Microsoft Exchange Novell GroupWise and Oracle Office

Caacutec cocircng cụ trong một bộ phần mềm bao gồm người quản lyacute hội nghị (Lotus Sametime) vagrave trao đổi thocircng điệp (Lotus Notes Mail)

Xếp hạng phần mềm cho nhoacutem

Ellis vv đề xuất một hệ thống xếp hạng dựa vagraveo kiểu sự hỗ trợ noacute Cung cấp

Hệ thocircng điệp

Hệ thống hội thảo truyền higravenh

Hệ thống cộng taacutec soạn thảo

Nhoacutem phacircn phối giải phaacutep phần mền

Hệ thống phối hợp

Hệ thống thocircng minh đại diện

Lực lượng điều khiển phaacutet triển phần mềm cho nhoacutem

Một số nhacircn tố chiacutenh bao gồm

Tăng năng suất

Giảm số lượng caacutec cuộc họp

Tăng cường tự động hoacutea caacutec quy trigravenh lagravem việc thường xuyecircn

Cần phối hợp toagraven cầu tốt hơn

Tiacutenh sẵn sagraveng của những mạng lan rộng

Coleman vagrave Khanna liệt kecirc 10 nhacircn tố khaacutec

54Quản lyacute hoạt động MDM (Mobile Device Management - Quản lyacute thiết bị di động)

Một số phương phaacutep phối hợp phổ biến hơnMDM lagrave

Kỹ thuật nhoacutem định danh

Kỹ thuật Delphi

Sự phacircn xử

Hệ thocircng tin dựa trecircn vấn đề

Nemawashi

Kỹ thuật nhoacutem định danh

1-Mỗi người tham gia viết ra những yacute tưởng về những gigrave necircn quyết định

2-Lần lượt mỗi người tham gia trigravenh bagravey yacute tưởng của migravenh được ghi lại trecircn bảng Khocircng thảo luận ở đacircy

3-Sau khi tất cả caacutec yacute tưởng được trigravenh bagravey caacutec đại biểu coacute thể chất vấn những người khaacutec

4-Mỗi người tham gia bỏ phiếu cho mỗi yacute tưởng

Kỹ thuật Delphi

Về cơ bản tương tự như kỹ thuật nhoacutem định danh ngoại trừ những người khocircng bao giờ tham gia cuộc họp

Một cocircng cụ khảo saacutet được sử dụng để thu thập đầu vagraveo ban đầu từ caacutec thagravenh viecircn

Một cuộc khảo saacutet thứ hai được gửi đi với một bản toacutem tắt caacutec kết quả chung

Những bước lặp lại cho đến khi đạt được một sự đồng thuận hoặc nhigraven nhận của đa số

Sự phacircn xử(Arbitration )

Thiacutech hợp nhất khi caacutec thagravenh viecircn của MDM đại diện cho caacutec yếu tố đối lập

Những người tham gia đồng yacute rằng nếu lựa chọn thay thế hai becircn thỏa thuận khocircng được tigravem thấy thigrave một trọng tagravei viecircn becircn ngoagravei sẽ tham gia

Trọng tagravei sau đoacute lựa chọn thay thế ocircng hoặc xeacutet thấy thiacutech hợp nhất

Hệ thống thocircng tin dựa trecircn vấn đề (IBIS)

Lagrave một phương phaacutep lập luận cấu truacutec

Một đại diện cho IBIS lagrave một đồ thị với caacutec nuacutet vagrave caacutec liecircn kết

IBIS bắt đầu với lựa chọn của một nuacutet vấn đề gốc sau đoacute caacutec nuacutet vị triacute khaacutec nhau được liecircn kết với nuacutet gốc

Caacutec nuacutet vị triacute nagravey sau đoacute được đaacutenh giaacute dựa trecircn những lập luận gắn liền với chuacuteng

Nemawashi (được sử dụng rộng ratildei tại Nhật Bản)

1-Một hoặc nhiều thagravenh viecircn của MDM được chỉ định lagrave điều phối viecircnCaacutec điều phối viecircn sau đoacute chọn người tham gia cograven lại

2-Điều phối viecircn xacircy dựng một tổng hợp caacutec sự lựa chọn vagrave sau đoacute caacutec chuyecircn gia đaacutenh giaacute caacutec lựa chọn

3-Điều phối viecircn lựa chọn một sự lựa chọn dựa trecircn kết quả ở trecircn(ở 2)

4-Sự thay thế được luacircn chuyển điều phối viecircn tigravem kiếm sự đồng thuận thocircng qua sự thuyết phục vagrave đagravem phaacuten

5-Nếu đạt được sự đồng thuận điều phối viecircn cho lưu thocircng một tagravei liệu magrave mỗi thagravenh viecircn MDM để lại dấu hiệu trecircn đoacute

55Nơi lagravem việc ảo

Nhiều tổ chức trecircn toagraven thế giới kinh doanh bất động sản cho cocircng nghệ hợp taacutec

Cocircng việc được trở thagravenh một điều bạn lagravem hơn lagrave một nơi bạn đi

Những thay đổi lớn nhất mang lại bởi nơi lagravem việc ảo coacute thể lagrave về văn hoaacute hay xatilde hội hơn lagrave về cocircng nghệ

Chương 6 Hệ thống thocircng tin điều hagravenh

61 Yacute nghĩa của EIS- Hệ thống thocircng tin điều hagravenh

- EIS lagrave một dạng đặc biệt của DSS được thiết kế để hỗ trợ ra quyết định ở cấp cao nhất của một tổ chức

- Lagrave một hệ thống thocircng tin hỗ trợ nhu cầu lập kế hoạch vagrave đaacutenh giaacute của caacutec nhagrave quản lyacute điều hagravenh

- EIS coacute thể giuacutep một CEO coacute được bức tranh tổng thể chiacutenh xaacutec nhất về caacutec hoạt động vagrave một bản toacutem tắt những gigrave magrave đối thủ cạnh tranh đang lagravem

- Caacutec hệ thống nagravey noacutei chung hoạt động dễ dagraveng vagrave trigravenh bagravey thocircng tin theo những caacutech dễ hiểu để việc tiếp thu được nhanh choacuteng (biểu đồ đồ thịhellip)

(Tagravei liệu thecircm EIS lagrave những loại hệ thống lagrave rất phức tạp trong tự nhiecircn Coacute thể noacutei hệ thống nagravey cũng cung cấp cho caacutec nhagrave quản lyacute với caacutec thiết bị coacute khả năng ra quyết định bằng caacutech sử dụng của noacute Hệ thống nagravey hoạt động trong điều kiện như vậy quan trọng như trong caacutec hệ thống khaacutec khocircng hỗ trợ Khả năng lưu trữ dữ liệu nặng lagravem cho noacute lyacute tưởng để được thocircng qua khocircng chỉ bởi caacutec doanh nghiệp lớn magrave cograven bởi caacutec doanh nghiệp nhỏ hơn Nhigraven chung hệ thống nagravey lagrave dagravenh cho caacutec nhacircn viecircn cấp cao hỗ trợ thagravenh thạo trong việc đưa ra caacutec quyết định quan trọng)

Caacutec phiecircn EIS tiecircu biểu- Phiecircn lagravem việc coacute thể bắt đầu với một baacuteo caacuteo về tigravenh higravenh tagravei chiacutenh vagrave kinh

doanh của một cocircng ty caacutec chỉ số hoạt động quan trọng được hiển thị rotilde ragraveng- EIS sẽ cho pheacutep caacutec giaacutem đốc điều hagravenh coacute thể đi sacircu vagraveo dữ liệu từ những con

số bất kỳ magrave noacute hỗ trợ- Việc điều hagravenh coacute thể lựa chọn một mức độ chi tiết ( VD danh số baacuten hagraveng) nếu

như cần điều tra thecircm- Lagrave một phương phaacutep tiếp cận coacute thể giuacutep việc ra quyết định tốt hơn

Những điều magrave EIS ko coacute- EIS khocircng phải lagrave sự thay thế cho caacutec hệ thống dựa trecircn caacutec maacutey tiacutenh khaacutec EIS

thực sự chỉ cung cấp dữ liệu cho caacutec hệ thống nagravey- Noacute khocircng thể biến caacutec bộ hệ điều hagravenh của maacutey tiacutenh thagravenh những ldquochuyecircn viecircn

giỏirdquo- Coacute thể được viacute một caacutech cao hơn như lagrave một trợ lyacute đaacuteng tin cậy coacute thể được gọi

đến bất khi nagraveo vagrave mỗi khi cần thiết

Tagravei liệu thecircm Sự khaacutec nhau giữa EIS vagrave DSS+ EIS thiết kế để hỗ trợ những người điều hagravenh cấp cao giuacutep họ khaacutem phaacute caacutec vấn đề vagrave caacutec cơ hội DSS hỗ trợ những nười phacircn tiacutech cố gắng trả lời cacircu hỏi caacutei gigrave coacute thể lagravem cugraveng với một cơ hội hoặc một vấn đề

Chiều EIS DSSNhững người sử dụng thocircng thường

Duyệt dữ liệu đi xuống truy xuất trạng thaacutei

Hỗ trợ phacircn tiacutech vagrave quyết định

Sự thuacutec đẩy Tiacutenh thiacutech hợp Tiacutenh hiệu quảỨng dụng Queacutet mocirci trường đaacutenh giaacute

hiệu suất nhận dạng caacutec vấn đề vagrave caacutec cơ hội

Caacutec quyết định quản lyacute trecircn caacutec lĩnh vực đa dạng

Hỗ trợ quyết định Caacutec chiacutenh saacutech caacutec quyết định khocircng coacute cấu truacutec ở mức cao vagrave hỗ trợ giaacuten tiếp

Hỗ trợ caacutec quyết định lặp lại caacutec quyết định khocircng thể đoaacuten trước ra quyết định khocircng coacute cấu truacutec vagrave baacuten cấu truacutec

Loại thocircng tin Caacutec thocircng tin tin tức thocircng tin becircn ngoagravei về khaacutech hagraveng đối thủ cạnh tranh mocirci trường caacutec baacuteo caacuteo theo yecircu cầu vagrave định thời về caacutec hoạt động becircn trong

Caacutec thocircng tin hỗ trợ caacutec tigravenh huống đặc biệt

Sử dụng coacute nguyecircn tắc

Dograve theo vết vagrave điều khiển nhận dạng cơ hội

Hoạch định tổ chức phacircn nhoacutem vagrave điều khiển

Khả năng phugrave hợp với những người sử dụng caacute nhacircn

Thiết kế loại ra quyết định cho mỗi người điều hagravenh caacute nhacircn bằng nhiều lựa chọn đầu ra

Cho pheacutep caacutec đaacutenh giaacute caacute nhacircn caacutec khả năng what-if lựa chọn loại hộp hội thoại

Đồ họa Phải coacute Lagrave một phần quan trọng của nhiều DSS

Thacircn thiện người sử dụng

Phải coacute Phải coacute nếu khocircng coacute người sử dụng trung gian

Xử lyacute thocircng tin Lọc neacuten thocircng tin dograve theo vết dữ liệu vagrave thocircng tin quan trọng

EIS kiacutech thiacutech caacutec cacircu hỏi caacutec cacircu trả lời bằng caacutech sử dụng DSS vagrave phản hồi lại EIS

Hỗ trợ caacutec thocircng tin chi tiết

Truy xuất thường xuyecircn caacutec mức chi tiết của bất kỳ thocircng tin tổng hợp nagraveo (duyệt dữ

Coacute thể coacute trong DSS nhưng khocircng thường

liệu chi tiết)Cơ sở mocirc higravenh Caacutec chức năng coacute sẵn bị hạn

chếLagrave điểm cốt lotildei của DSS

Cấu truacutec Theo người baacuten sản phẩm hoặc theo caacutec chuyecircn gia hệ thống thocircng tin

Theo người sử dụng hoặc caacute nhacircn hoặc caacutec chuyecircn gia từ caacutec trung tacircm thocircng tin hoặc phograveng ban hệ thống thocircng tin

Phần cứng Mainframe caacutec trạm RISC mạng LANs hoặc caacutec hệ thống phacircn bố

Mainframe caacutec trạm RISC caacutec maacutey PC hoặc caacutec hệ thống phacircn bố

Bản chất caacutec goacutei phần mềm

Truy xuất tương taacutec dễ dagraveng đến nhiều cơ sở dữ liệu truy xuất trực tuyến caacutec khả năng DBMS phức tạp caacutec liecircn kết phức tạp

Caacutec khả năng tiacutenh toaacuten lớn caacutec ngocircn ngữ mocirc higravenh mocirc phỏng ứng dụng vagrave caacutec bộ tạo DSS

Bản chất caacutec thocircng tin

Trigravenh bagravey thocircng tin được phaacutet sinh trước về quaacute khứ vagrave hiện tại tạo caacutec thocircng tin mới về quaacute khứ hiện tại tương lai

Tạo thocircng tin mới về quaacute khứ hiện tại tương lai

62 Lịch sử EIS- EIS xuất hiện lần đầu tiecircn tại MIT vagraveo những năm 1970

- Những EIS đầu tiecircn được phaacutet triển bởi caacutec doanh ngiệp lớn sẵn sagraveng chấp nhận rủi ro để đạt được lợi thế cạnh tranh

- Vagraveo những năm 1980 caacutec nhagrave cung cấp đatilde phaacutet triển một số cơ sở khaacutech hagraveng rộng vagrave cocircng nghệ EIS được tiếp tục phaacutet triển cho đến ngagravey nay

(Tagravei liệu thecircm Sử dụng DSSEIS cho phaacutet triển bền vững + Một số nghiecircn cứu đatilde được tiến hagravenh để kiểm tra việc thực hiện của EIS trong khu vực cocircng cộng vagrave chiacutenh phủ caacutec nước tổ chức kể từ khi chuacuteng được phaacutet triển theo định hướng lợi nhuận cho caacutec cocircng ty tư nhacircn (Hasan vagrave Hasan năm 1997) Theo một nghiecircn cứu tiến hagravenh tại Mỹ ở hơn 300 cocircng ty kết quả cho thấy sự khaacutec biệt của EIS giữa tư nhacircn vagrave chiacutenh phủ một số kết quả thuacute vị được phaacutet hiệnViacute dụ khoacute khăn hơn để chuyển tiền từ một tagravei khoản khaacutec trong một EIS của chiacutenh phủ cũng lagrave khoacute khăn hơn để biện giải thiacutech cho những chi phiacute phaacutet triển EIS của chiacutenh phủ Một nghiecircn cứu khaacutec được tiến hagravenh ở Australia

cho thấy rằng EIS cung cấp cho quản lyacute một higravenh ảnh chiacutenh xaacutec hơn về tổ chức thực hiện vagrave cung cấp hỗ trợ cho caacutec lợi iacutech chiến lược cải thiện khocircng chỉ cho caacutec nhagrave quản lyacute nhưng cograven cho phần cograven lại của tổ chức Dựa trecircn caacutec hệ thống được thiết kế cho caacutec cocircng ty tư nhacircn với một caacutech rotilde ragravengxaacutec định mục tiecircu EIS lagrave thiacutech hợp cho caacutec tổ chức cocircng cộng hiện đại nhưng cần phải được linh hoạt hơn vagrave kết thagravenh chugravem một phạm vi rộng hơn khả năng vagrave phương tiện hơn so với khu vực tư nhacircn ban đầu theo định hướng sản phẩm (Hasan vagrave Hasan năm 1997) Điều nagravey coacute thể lagrave do thực tế rằng caacutec hoạt động khu vực cocircng lagrave bắt buộc coacute taacutec động rộng phải đaacutep ứng sự mong đợi duy nhất cocircng cộng thường coacute mục tiecircu mơ hồ vagrave macircu thuẫn iacutet quyền tự chủ vagrave kiểm soaacutet việc ra quyết định vagrave nhacircn viecircn lagrave khoacute khăn hơn (Watson vagrave Carte2000) + Toacutem lại EIS lagrave một khaacutei niệm thagravenh cocircng noacute phaacutet triển qua nhiều năm tuy nhiecircn EIS khắc phục khiếm khuyết của migravenh bằng caacutech tiến hagravenh nghiecircn cứu liecircn tục)

63 Tại sao những người điều hagravenh hagraveng đầu lại khaacutec nhau- Họ lagrave những doanh nghiệp theo định hướng coacute suy nghĩ

- Coacute một khoảng khocircng gian rộng để kiểm soaacutet

- Họ chịu traacutech nhiệm cho việc thiết lập chiacutenh saacutech

- Họ đại diện cho tổ chức mocirci trường becircn ngoagravei

- Hagravenh động của họ tạo ra những kết quả đaacuteng kể về tagravei chiacutenh vagrave con người

Tần số caacutec hoạt động điều hagravenh- Xử lyacute xaacuteo trộn 42

- Hoạt động kinh doanh 32

- Phacircn bổ nguồn lực 17

- Đagravem phaacuten 3

- Những điều khaacutec 6

Handling Disturbances 42

Entrepreneurial Activites 32

Resource Allocation 17

Negotiation 3

Other 6

Những thocircng tin điều hagravenh cần thiết- Quản lyacute xaacuteo trộn coacute thể yecircu cầu sự chuacute yacute xung quanh đồng hồ

- Hoạt động kinh doanh yecircu cầu điều hagravenh để dự đoaacuten những thay đổi trong mocirci trường

- Nhiệm vụ phacircn bổ tagravei nguyecircn yecircu cầu lựa chọn người quản lyacute vagrave caacutec nguồn lực hạn chế được triển khai

- Đagravem phaacuten yecircu cầu cập nhật thocircng tin từng phuacutet để coacute thể xacircy dựng được sự đồng thuận

Caacutec loại thocircng tin điều hagravenh- Hệ thống kế toaacuten coacute liecircn quan đến việc tiacutenh toaacuten thu nhập hoạt động cho caacutec lĩnh

vực cụ thể lagrave quan trọng hơn so với caacutec hệ thống kế toaacuten truyền thocircng- Thocircng tin về thị trường khaacutech hagraveng cung cấp giaacute trị trong việc quyết định chiến

lược- Caacutec thocircng tin cần thiết thường được truyền đi trecircn một số hệ thống maacutey tiacutenh vagrave

nằm trong toagraven tổ chức- Caacutec thocircng tin được sử dụng thường lagrave ngắn hạn vagrave dễ thay đổi

Phương thức để xaacutec định thocircng tin cần thiết

Rockart xaacutec định được năm phương thức cơ bản để xaacutec định thocircng tin cần thiết

- Phương thức dựa trecircn kết quả- Phương thức rỗng- Phương thức chỉ số khoacutea- Phương thức tổng hợp nghiecircn cứu- Phương thức dựa vagraveo nhacircn tố then chốt dẫn đến thagravenh cocircng

64 Thagravenh phần EIS

- Sản phẩm EIS đầu tiecircn được phaacutet triển để sử dụng trecircn maacutey tiacutenh cấu higravenh cao nhưng caacutec sản phẩm hiện nay nhằm mục tiecircu lagrave nền tảng ClientServer

- Những nền tảng linh hoạt hơn coacute thể thiacutech ứng với thay đổi trong tổ chức vagrave cocircng nghệ

- Sử dụng dữ liệu thời gian thực dẫn đến quyết định nhanh hơn nhiều thocircng tin hơn

Thagravenh phần phần cứng- Một EIS khocircng đogravei hỏi coacute phần cứng cụ thể hoặc duy nhất nagraveo- Chigravea khoacutea của vấn đề lagrave để đảm bảo rằng caacutec thagravenh phần của EIS tối ưu hoacutea vagrave

phugrave hợp với tagravei nguyecircn maacutey tiacutenh của tổ chức- Hệ thống nagravey phải được cấu higravenh để caacutec nguồn tagravei nguyecircn phugrave hợp với những

người điều hagravenh chuacuteng

Thagravenh phần phần mềm- Traacutei ngược với phần cứng phần mềm thường được chuyecircn mocircn hoacutea cao cho caacutec

bagravei toaacuten về miền- Sự chuyecircn mocircn hoacutea nagravey thường đạt được bằng caacutech sử dụng thagravenh phần off-the-

shelf cho toagraven bộ EIS vagrave caacutec mocirc-đun tugravey chỉnh để đaacutep ứng nhu cầu cụ thể- Lotus Notes lagrave một viacute dụ điển higravenh Noacute coacute thể được sử dụng một migravenh hoặc coacute

thể phục vụ becircn thứ ba mocirc-đun plug-in

Cocircng nghệ EIS hiện nay

Dobrzeniecki đề xuấtphacircn loạitừng cấptheo bachức năng- Loại 1 sản phẩm bao gồmmột bộ đầy đủcaacutec ứng dụngtừ mộtnhagrave cung cấp- Loại 2 sản phẩm đượcthựchiệnở phần đầu củacaacutecsản phẩmDSS đượcphaacutet triển

bởicugravengmộtnhagrave cung cấp- Loại 3 sản phẩmkết hợp với nhautheo bất kỳ số lượngthuộc sở hữu củacocircng ty

65 Xacircy dựng EIS

- Xacircy dựngmộtEISgiống nhưxacircydựngmột số hệ thống khaacutec củamocirc higravenh hệ thống thocircng tin

- Việcphaacutet triểncấu truacutecnecircn được theo dotildeitừ quaacute trigravenh thiết kế đến quaacute trigravenhthực hiện

- Tuy nhiecircn một dự aacuten phaacutet triển EIScoacute xu hướnglagrave thống nhấtvagraveyecircu cầu hỗ trợ caacutec nhagrave quản lyacute latildenh đạo

- Xacircy dựng một EIScoacute thểphaacutet hiện ra đượccaacutectigravenh huống khoacute khănmagravemột nhagrave phaacutet triển chưabao giờ gặp phải

Mocirc higravenh EIS

Khung phaacutet triển một EIS

- Watson et al đề nghị xacircy dựngkhung với ba thagravenh phần+ Caacutech tiếp cận tập trung vagraveo yếu tốcon người vagrave dữ liệu coacute liecircn quan đến EIS+ Quaacute trigravenh phaacutet triển cần sự linh hoạt vagrave tương taacutec+ Người sử dụng - hệ thống hộp thoại bao gồm một ngocircn ngữ hagravenh động để xử lyacute caacutec lệnh

Lợi iacutech của EIS- Dễ duy trigrave caacutec mục tiecircu coacute tổ chức- Dễ truy xuất thocircng tin- Cho pheacutep người sử dụng nacircng cao hiệu suất hơn

- Tăng chất lượng ra quyết định- Cung cấp sự cải tiến cạnh tranh- Tiết kiệm thời gian của người sử dụng- Tăng khả năng vagrave chất lượng giao tiếp- Cung cấp khả năng điều khiển tốt hơn trong tổ chức- Cho pheacutep tham gia caacutec vấn đề vagrave caacutec cơ hội- Cho pheacutep hoạch định- Cho pheacutep tigravem kiếm nguyecircn nhacircn của một vấn đề- Thảo matilden caacutec yecircu cầu của người điều hagravenh

Hạn chế của EIS vagrave 1 số sai lầm cần traacutenh

- Chi phiacute một cuộc khảo saacutetnăm1991 chothấychi phiacute phaacutet triểntrungbigravenh365000USDvớichi phiacute vận hagravenhhagraveng năm lagrave$200000 (EIS)

- Cocircng nghệ hạn chếEIScần phảiđượctiacutech hợp hoagraven toagravenvagraveokiếntruacuteccủadoanh nghiệphiện tại do đoacute noacutelagrave một thaacutech thứclớn đối vớithiết kế

- Hạn chế tổ chức cơ cấu tổ chứccoacute thể khocircng phugrave hợp

Sự hạn chế về tổ chức- Chương trigravenh nghị sự vagrave thời gian chệch EIS mocirc tả một phần việc thực hiện một

chương trigravenh nghị sự vagrave coacute thể dễ dagraveng đạt được sự tin cậy một caacutech chắc chắn- Đồng bộ hoacutea việc quản lyacute sự tin cậy đuacuteng luacutec đặc biệt baacuteo caacuteo EIS coacute thể phaacute

vỡ sự ổn định thiết lập caacutec chu trigravenh baacuteo caacuteo một caacutech tốt nhất- Sự bất ổn EIS phản ứng nhanh coacute thể gacircy ra việc taacutec động trở lại một caacutech

nhanh choacuteng dẫn đến sự thiếu ổn định trong tổ chức

Sự thất bại lagrave thay thế khocircng thể chấp nhận được- Một số yếu tố lagravem EIS thất bại

+ Thiếu sự hỗ trợ về mặt quản lyacute+ Vấn đề chiacutenh trị+ Thất bại của nhagrave phaacutet triển+ Lỗi về cocircng nghệ+ Giaacute cả+ Thời gian

66 Ra quyết định điều hagravenh trong tương lai vagrave EIS

- Coacute một vagravei điều kiện sẽ được hợp nhất cho việc chuyển đổi cocircng nghệ Trong đoacute một vagravei điều kiện coacute thể dễ dự đoaacuten Hai điều kiện magrave ta coacute thể thấy lagrave+ Phaacutet triển cocircng nghệ maacutey tiacutenh trong việc điều hagravenh sẽ tạo ra sự chuyển đổi được chấp nhận một caacutech dễ dagraveng hơn+ Mở rộng traacutech nhiệm điều hagravenh sẽ mở rộng nhu cầu thocircng tin

Tương lai của EIS- EIS thocircng minh Những tiến bộ trong cocircng nghệ AI sẽ được triển khai trong caacutec

EIS- EIS đa phương tiện Cơ sở dữ liệu đa phương tiện sẽ cho pheacutep tiacutech hợp văn bản

giọng noacutei vagrave higravenh ảnh trong tương lai- EIS thocircng tin Tương lai EIS sẽ mở rộng hơn trong việc sử dụng dữ liệu becircn

ngoagravei doanh nghiệp- EIS kết nối Giao tiếp với băng thocircng rộng cho pheacutep kết nối liecircn thocircng lớn hơn

Chương 7 HỆ CHUYEcircN GIA VAgrave TRIacute TUỆ NHAcircN TẠO

71 Caacutec khaacutei niệm

72 Triacute thocircng minh của triacute tuệ nhacircn tạo

73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia

74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia

75 Lợi iacutech vagrave hạn chế của hệ chuyecircn gia

71 Caacutec khaacutei niệm

Chuyecircn mocircn (Expertise) sự hiểu biết rộng trong 1 lĩnh vực hẹp

Hệ chuyecircn gia (Expert Systems)1 chương trigravenh maacutey tiacutenh sử dụng 1 tập caacutec luật dựa trecircn tri thức của con người để giải quyết caacutec vấn đề đogravei hogravei phải coacute sự chuyecircn mocircn

Một số hệ chuyecircn gia nổi tiếng

DENDRAL (Standford 1960s Edward Feigenbaum)

MYCIN (Standford1970s Edward Shortliffe)

PROSPECTOR (MIT 1979)

Triacute tuệ nhacircn tạo (Artificial Intelligence ndash AI)

Triacute tuệ nhacircn tạo một bộ phacircn của ngagravenh khoa học maacutey tiacutenh quan tacircm đến việc thiết kế caacutec hệ thống maacutey tiacutenh thocircng minh đoacute lagrave caacutec hệ thống đưa ra caacutec đặc điểm magrave từ đoacute chuacuteng ta liecircn hệ với sự thocircng minh trong hagravenh động của con người (Barr vagrave Feigenbaum 1981)

Mục điacutech của AI

Mục điacutech khoa học xaacutec định caacutec gợi yacute để giải thiacutech caacutec loại khaacutec nhau của triacute tuệ thực

Mục điacutech kỹ thuật giải quyết caacutec vấn đề trong thế giới thực

Triacute tuệ nhacircn tạo kế thừa nhiều yacute tưởng quan điểm kỹ thuật từ caacutec ngagravenh khoa học khaacutec

- Triết học

- Logic Toaacuten học

- Tiacutenh toaacuten

- Khoa học tacircm lyacute Khoa học nhận thức

- Sinh học Thần kinh học

- Tiến hoacutea

Caacutec lĩnh vực ứng dụng trong Triacute tuệ nhacircn tạo

Mạng nơ ron thần kinh (Neural Networks)

Tiacutenh toaacuten sự tiến hoacutea

(Evolutionary Computation)

Hệ chuyecircn gia (Expert Systems)

Kỹ thuật xử lyacute tiếng noacutei (Speech Processing)

Kỹ thuật xử lyacute ngocircn ngữ tự nhiecircn

(Natural Language Processing)

Lập kế hoạch (Planning)

Robot (Robotics)

Khoa học higravenh ảnh (Vision)

Caacutec kỹ thuật thocircng dụng dugraveng trong AI

Biểu diễn(Representation)

Học (Learning)

Caacutec luật (Rules)

Tigravem kiếm (Search)

72 Triacute thocircng minh của triacute tuệ nhacircn tạo

Con người suy diễn như thế nagraveo

Phacircn loại (Categorization)

Caacutec quy tắc cụ thể

Heuristics

Kinh nghiệm trước đoacute

Dự tiacutenh trước

Maacutey tiacutenh suy diễn như thế nagraveo

Lập luận dựa trecircn luật IF-THEN mocirc tả tri thức được matilde hoacutea dưới dạng caacutec luật

Caacutec khung (Frames) lagrave caacutec đại diện mocirc tả caacutec tigravenh huống giống nhau lagrave điển higravenh của một vagravei phacircn loại

Lập luận dựa trecircn caacutec trường hợp mocirc phỏng giải phaacutep trước đoacute cho một vấn đề hiện tại

Nhận dạng mẫu phaacutet hiện acircm thanh higravenh dạng hoặc caacutec chuỗi dagravei

Caacutec dạng khaacutec của Triacute tuệ nhacircn tạo

Học maacutey- mạng nơron vagrave giải thuật di truyền

Lập trigravenh tự động ndash lagrave những kỹ thuật tạo ra caacutec chương trigravenh để lagravem 1 nhiệm vụ riecircng biệt (cho pheacutep những người khocircng phải lagrave người lập trigravenh coacute thể lập trigravenh được)

Cuộc sống nhacircn tạo ndash nỗ lực để taacutei tạo caacutec hiện tượng sinh học trong caacutec hệ thống dựa trecircn maacutey tiacutenh

73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia(Expert Systems- ES)

Theo Jackson (1999) Một hệ chuyecircn gia lagrave một chương trigravenh maacutey tiacutenh mocirc tả vagrave suy diễn với tri thức của một vagravei lĩnh vực để giải quyết vấn đề hay đưa ra caacutec lời khuyecircn

Cấu truacutec cơ bản của ES được dựa theo cấu truacutec chung của DSS Sự khaacutec biệt chiacutenh giữa ES vagraveDSS lagrave hệ ES thu thập caacutec kiến thức từ những

chuyecircn gia trong lĩnh vực quan tacircmĐặc trưng của hệ chuyecircn gia Hiệu quả cao Thời gian trả lời thỏa đaacuteng Độ tin cậy cao Dễ hiểu

Giao diện người dugraveng trong ES

Thiết kế giao diện người dugraveng tập trung vagraveo caacutec yếu tố như dễ dagraveng sử dụngcoacute độ tin cậy cao giảm tải những khoacute khăn khi sử dụng

Thiết kế necircn coacute một số tương taacutec (đầu vagraveo kiểm soaacutet vagrave truy vấn)

Cấu tạo giao diện người dugraveng gồm coacute magraven higravenh cảm ứng bagraven phiacutem buacutet saacuteng lệnh thoại caacutec phiacutem chuyecircn dụng

Cơ sở tri thức (Knowledge Base)

Chứa đựng caacutec tri thức cụ thể miền thu được từ caacutec chuyecircn gia miền

Coacute thể chứa caacutec mocirc tả caacutec hagravenh vi giải quyết vấn đề caacutec ragraveng buộc caacutec heuristics

Thagravenh cocircng của một ES dựa trecircn tiacutenh đầy đủ vagrave tiacutenh chiacutenh xaacutec của cơ sở tri thức

Mocirc tơ suy diễn (Inference Engine)

Ở đacircy tri thức được đặt để sử dụng tạo ra caacutec giải phaacutep để giải quyết vấn đề

Mocirc tơ nagravey coacute khả năng thực hiện diễn dịch hoặc suy diễn dựa trecircn caacutec luật hay caacutec caacutec sự kiện

Đồng thời cũng coacute khả năng sử dụng caacutec suy diễn mờ hay khocircng chiacutenh xaacutec dựa trecircn xaacutec suất hay aacutenh xạ mẫu

Vograveng điều khiển suy diễn

1 Aacutenh xạ caacutec luật với caacutec sự kiện đatilde được cho

2 Chọn luật để thực hiện

3 Thực hiện luật bằng caacutech thecircm caacutec sự kiện được suy diễn ra vagraveo bộ nhớ lagravem việc

Chuỗi suy diễn (Chaining)

Suy diễn tiến (forward chaining) maacutey suy diễn bắt đầu từ dữ liệu ban đầu vagrave thực hiện việc suy luận để đưa ra caacutec kết luận cuối cugraveng

Suy diễn lugravei (backward chaining) maacutey suy diễn bắt đầu từ dữ liệu điacutech vagrave tigravem ra tri thức hỗ trợ cho dữ liệu điacutech đoacute

Viacute dụ suy diễn lugravei

R1 Nếu coacute A vagrave B thigrave suy ra coacute D

R2 Nếu coacute B thigrave suy ra coacute C

R3 Nếu coacute C vagrave D thigrave suy ra coacute E

Ta coacute E ta xem trong 3 luật R1 R2 R3 luật nagraveo coacute E ta thấy R3 chứa E đồng thời chứa C vagrave D Xeacutet tiếp trong 2 luật R1 R2 luật nagraveo chứa C vagrave D R2 chứa C R3 chứa D Từ đoacute ta coacute được caacutec tri thức hỗ trợ suy diễn vagrave kết luận lagrave nếu coacute A vagrave B thigrave sẽ coacute E Hay nếu A vagrave B đuacuteng thigrave sẽ coacute E

Viacute dụ suy diễn tiến

Giả sử coacute tập chứa 3 luật sau

R1 Nếu coacute A vagrave B thigrave suy ra coacute D

R2 Nếu coacute B thigrave suy ra coacute C

R3 Nếu coacute C vagrave D thigrave suy ra coacute E

Nếu ta coacute A vagrave B thigrave chuacuteng ta suy ra được D từ R1 vagrave suy ra C từ R2 Với D vagrave C đatilde được suy ra ở trecircn giờ chuacuteng ta suy ra được E từ R3

Viacute dụ thực tế

Giả sử muốn biết magraveu của một con vật nuocirci tecircn lagrave Fred biết rằng noacute kecircu ộp ộp vagrave ăn ruồi

Coacute tập 4 luật ban đầu như sau

R1 Nếu X kecircu ộp ộp vagrave ăn ruồi thigrave X lagrave con ếch

R2 Nếu X kecircu chiecircm chiếp vagrave biết hoacutet thigrave X lagrave con chim

R3 Nếu X lagrave con ếch thigrave X coacute magraveu xanh

R4 Nếu X lagrave con chim thigrave X coacute magraveu vagraveng

74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia

Expert system shells lagrave một tập caacutec goacutei phần mềm vagrave caacutec cocircng cụ dugraveng để phaacutet triển caacutec hệ chuyecircn gia

Những Expert system shells đầu tiecircn thường rất rườm ragrave Mặc dugrave vậy noacute vẫn giuacutep cho người sử dụng sẽ khocircng phải bắt đầu lại từ đầu khi xacircy dựng một hệ chuyecircn gia mới

Những shell hiện đại bao gồm hai mocirc-đun chiacutenh lagrave cocircng cụ xacircy dựng một tập quy tắc vagrave mocirc tơ suy diễn

Xacircy dựng hệ chuyecircn gia

Bước 1 xacircy dựng mocirc higravenh bagravei toaacuten xaacutec định vấn đề nhiệm vụ magrave hệ thống sẽ thực hiện Caacutec dạng bagravei toaacuten cần hệ chuyecircn gia

Bagravei toaacuten diễn giải (InterPretation)

Bagravei toaacuten dự baacuteo (Prediction)

Bagravei toaacuten chuẩn đoaacuten (Diagnose)

Bagravei toaacuten gỡ rối (Debugging)

Bagravei toaacuten thiết kế

Tương tự như một dự aacuten phần mềm để xacircy dựng một hệ chuyecircn gia cần phải coacute caacutec yếu tố về nhacircn lực tagravei nguyecircn vagrave thời gian Những yếu tố nagravey ảnh hưởng đến giaacute thah của một hệ chuyecircn giaTrong phần nagravey cacircu hỏi thường được đặt ra lagrave tại sao cần phải xacircy dựng một hệ chuyecircn giaTrước khi bắt đầu phải xaacute định rotilde bagravei toaacuten đạt ra lagrave jiAi lagrave chuyecircn giaAi lagrave người sử dụng

1 Diễn giải (InterPretation) Nghiecircn cứu 1 vấn đề -gt Dựa trecircn những biểu hiện thuộc tiacutenh đặc trưng becircn ngoagravei -gt Tư vấn

(hoặc đưa ra kết luận hay mocirc tả dễ hiểu từ tập dữ liệu thocirc)

2 Bagravei toaacuten dự baacuteo (Prediction) Coacute thể dự đoaacuten được hagravenh vi kết quả dựa trecircn caacutec hiện tượng -gt dự baacuteo

VD Dự baacuteo thời tiết động đấthellip

3 Bagravei toaacuten chẩn đoaacuten (Diagnoss) Xaacutec định caacutec lỗi caacutec bộ phận hỏng hoacutec của hệ thống dựa trecircn caacutec dữ liệu quan saacutet được

4 Bagravei toaacuten gỡ rối (Debugging) Mocirc tả caacutec phương phaacutep khắc phục hệ thống khi gặp sự cố

5 Bagravei toaacuten thiết kế Lựa chọn cấu higravenh caacutec đối tượng nhằm thoả matilden một số ragraveng buộc nagraveo đoacute

6 Giảng dạy Phần mềm dạy học coacute thể chuẩn đoaacuten vagrave sủa lỗi của học sinh trong quaacute trigravenh học tập

Để xaacutec định đuacuteng bagravei toaacuten magrave chuacuteng ta cần giải quyết thigrave phải trả lời đc một số cacircu hỏi

- cần hệ chuyecircn gia

Bước 2 thu thập tri thức lựa chọn cocircng cụ vagrave aacutep dụng

Trong bước thu thập tri thức vấn đề quan trọng lagrave lựa chọn chuyecircn gia những người magrave sẽ đoacuteng goacutep tri thức cho hệ thống Thocircng thường trong suốt quaacute trigravenh phaacutet triển thigrave chuyecircn gia được xem như một thagravenh viecircn của đội phaacutet triển

Hiện nay coacute rất nhiều cocircng cụ để xacircy dựng một hệ chuyecircn gia Phổ biến nhất lagrave JESS CLIPS vagrave OPS5

Bước 3 Thiết kế cơ sở tri thức thiết kế hệ thốngTri thức được biểu diễn trường minh trong cơ sở tri thức

Caacutec chuyecircn gia vagrave kỹ sư tri thức sẽ đối thoại với nhau bằng caacutec kỹ thuật đối thoại Suy diễn (SD) bảng Mocirc higravenh hoacutea SD quy nạp phacircn loại

Vấn đề bagraveo trigrave vagrave phaacutet triển

Caacutec hệ chuyecircn gia đogravei hỏi phải bảo trigrave vagrave phaacutet triển nhiều hơn so với caacutec hệ thống khaacutec Phải thường xuyecircn bổ sung tri thức mới vagrave thay đổi caacutec tri thức cũ để đổi mới hệ chuyecircn gia

Thu thập vagrave khắc phục lỗi do người sử dụng phaacutet hiện để kịp thời khắc phục những sai soacutet của hệ chuyecircn gia

75 Lợi iacutech vagrave hạn chế của caacutec hệ chuyecircn gia

Một số lợi iacutech chiacutenh

Thời gian trả lời hợp lyacute bằng hoặc nhanh hơn so với chuyecircn gia (người) để đi đến cugraveng một quyết định Hệ chuyecircn gia lagrave một hệ thống thời gian thực (real time system)

Khả năng trả lời với mức độ tinh thocircng bằng hoặc cao hơn so với chuyecircn gia (người) trong cugraveng lĩnh vực

Hệ chuyecircn gia giuacutep cho hiệu quả lagravem việc tăng bằng việc sử dụng tập caacutec luật một caacutech nhanh choacuteng magrave ko bị nhầm lẫn chuyecircn gia lagrave người coacute thể quecircn đi một số tri thức cơ sở lyacute luậ nhưng HCG thigrave ko

Quyết định của một người chuyecircn gia coacute thể bị thay đổi vagrave ko coacute tiacutenh thống nhất như quyết định của một hệ chuyecircn gia tạo ra

Hệ chuyecircn gia giuacutep cho người sử dụng coacute thể trau dồi sự hiểu biết trecircn lĩnh vuej cụ thể magrave noacute giải quyết hỗ trợ người ra quyết định coacute trigravenh độ như 1 chuyecircn gia trong quaacute trigravenh gia quyết định

Kiến thức của rất nhiều chuyecircn gia về một lĩnh vực nagraveo đoacute được đưa vagraveo hệ chuyecircn gia lagravem cho CSTT cuat HCG phong phuacute vagrave rộng lớn hơn rất nhiều

HCG giải thiacutech caacutec bước suy luận một caacutech dễ hiểu nhất quaacuten luacutec nagraveo cũng coacute thể sử dụng ko như chuyecircn gia con người

Hạn chế của caacutec hệ chuyecircn gia

Nhược điểm lớn nhất của hệ chuyecircn gia lagrave những yacute kiến chuyecircn mocircn thường rất khoacute matilde hoacutea vagrave giải neacuten

Hệ chuyecircn gia khocircng coacute khả năng tự học tự cập nhật kiến thức mới như caacutec chuyecircn gia magrave cần phải được matilde hoacutea lại khi noacute được cập nhật

Hệ chuyecircn gia khocircng thể nhận ra được vấn đề khocircng nằm trong miền kiến thức của hệ thống

Chương 8 Tri thức vagrave tiếp nhận

1 Bao gồm caacutec vấn đề

Dữ liệu thực tế đo lường hoặc quan saacutet coacute hoặc khocircng coacute bối cảnh

Thocircng tin dữ liệu được tổng hợp một caacutech hữu iacutech để giải quyết những khoacute khăn trong việc đưa ra quyết định

Tri thức bao gồm caacutec ứng dụng quy tắc thocircng tin hướng dẫn của người ra quyết định

2 Những caacutei nhigraven về tri thức

Đại diện lagravem thế nagraveo để diễn tả tri thức viacute dụ như một quyển saacutech khocircng phải lagrave tri thức nhưng noacute lại lagrave một đại diện của tri thức

Sản xuất tri thức lagrave một tập hơp của hagraveng tồn kho coacute thể được sản xuất cũng như mua lại

Tri thức lagrave 1 trong 6 trạng thaacutei của hệ thống

1Dữ liệu 2Thocircng tin 3Cấu truacutec thocircng tin 4Sự thấu hiểu 5Yacute kiến 6 Quyết định

3 Caacutec loại tri thức Phổ biến mocirc tả dữ liệu thocircng tin thủ tục mọi thứ lagravem như thế nagraveo lập luận chiacutenh saacutech hoặc caacutec quy tắc

4 Thu thập Tri thức hệ chuyecircn gia Hầu hết caacutec phương phaacutep đều bắt đầu với mocirc higravenh của caacutec taacutec vụ trong đoacute

hệ chuyecircn gia được xacircy dựng Trong đoacute mocirc tả về caacutec lĩnh vực được tạo ra Caacutec kỹ sư sử dụng caacutec mocirc higravenh giả thuyết vagrave nhận thức về quaacute trigravenh phacircn

tiacutech để gợi ra caacutech giải quyết vấn đề về tri thức từ caacutec chuyecircn gia

5 Caacutec chiều của thu thập tri thức KE- driven caacutec kỹ sư trao đổi trực tiếp với caacutec chuyecircn gia Expert-driven Caacutec chuyecircn gia trực tiếp đưa chuyecircn mocircn của họ vagraveo hệ

thống maacutey tiacutenh Machine-driven Sử dụng caacutec cocircng cụ suy luận để triacutech xuất tri thức từ một

tập caacutec viacute dụ

6 Kỹ thuật thu thập tri thức Trao đổi gồm 2 loại cơ bản lagrave coacute cấu truacutec(coacute kịch bản) vagrave khocircng coacute cấu

truacutec( đối thoại trực tiếp) Giao thức phacircn tiacutech bằng lời Khi caacutec chuyecircn gia thực hiện một cocircng việc

của họ thigrave một bản ghi về cocircng việc đoacute được thực hiện Caacutec kỹ sư sẽ xacircy dựng mocirc higravenh cho những gigrave được ghi lại trong bản ghi

Phương phaacutep sagraveng lọc caacutec chuyecircn gia so saacutenh caacutec nhoacutem liecircn tiếp trong ba đối tượng vagrave cho biết tại sao nhoacutem thứ hai lại khaacutec nhoacutem thứ ba

7 Thu thập tri thức từ nhiều nguồn Thu thập tri thức từ nhiều nguồn lagrave cần thiết để coacute được đầy đủ caacutec tri thức

cho một vấn đề quan điểm yacute kiến traacutei ngược nhau thường phaacutet sinh Phương phaacutep đồng thuận sẽ giuacutep giải quyết được vấn đề macircu thuẫn Kỹ thuật phacircn tiacutech Meta lagrave kỹ thuật được aacutep dụng trong caacutec trường hợp

khaacutec Caacutech tiếp cận bằng định lượng đogravei hỏi caacutec kỹ sư cần cacircn nhắc yếu tố đầu vagraveo của caacutec chuyecircn gia khaacutec nhau

8 Xaacutec nhận hợp lệ vagrave kiểm tra tri thức Một khi thu thập tri thức noacute phải được đaacutenh giaacute về khả năng sử dụng vagrave độ

chiacutenh xaacutec Hai vấn đề cụ thể lagrave hiệu lực của những kiến thức vagrave kiểm tra việc xacircy dựng cơ sở của tri thức

Cần xaacutec nhận xem liệu hệ thống coacute thể hoạt động ở mức độ tối thiểu khocircng

Xaacutec minh liecircn quan đến việc so saacutenh từng chi tiết kỹ thuật của hệ thống những gigrave đatilde được thực hiện cuối cugraveng

9 Một số caacutec biện phaacutep xaacutec nhận Độ chiacutenh xaacutec Khả năng thiacutech nghi Mức độ đầy đủ Bề rộng Độ sacircu Hiệu lực Tổng quan Chiacutenh xaacutec Hiện thực Độ tin cậy Tiacutenh hữu dụng Mức độ

Chương 9 Học maacutey

1 Logic mờ vagrave ngocircn ngữ mờ(Fuzzy Logic and Linguistic Ambiguity)

Ngocircn ngữ tự nhiecircn gồm những khaacutei niệm mơ hồ vagrave khocircng chiacutenh xaacutectruyền tải ngữ nghĩa thocircng qua tiacutenh xấp xỉkhocircng rotilde ragraveng

Những xấp xỉ nagravey giuacutep con người coacute thể truyền tải hết được yacute nghĩa nhưng maacutey thigrave khocircng hiểu

Lagravem sao biểu diễn caacutec tri thức sử dụng caacutec khaacutei niệm khocircng rotilde ragraveng(mờ) hoặc khocircng chiacutenh xaacutec

2 Khaacutei niệm cơ bản của logic mờ tập mờ lagrave những tập hợp khocircng coacute một giới hạn rotilde Mỗi phần tử của noacute chỉ

chứa một mức độ hagravem liecircn thuộc của từng phần tử Vigrave vậy tập mờ khocircng giống như tập cổ điển Tập mờ coacute thể kết hợp với nhau qua những luật mờ magrave đặc trưng cho những hagravenh động trạng thaacutei vagrave thuộc tiacutenh của logic mờ được tận dụng khi thực hiện một bộ điều khiển mờ

Logic mờ dựa trecircn yacute tưởng mỗi phần tử thuộc vagraveo một tập hợp ở một mức độ nagraveo đấy

Locircgic mờ cho pheacutep độ liecircn thuộc (microA )coacute giaacute trị trong khoảng (01) Locircgic mờ coacute thể được coi lagrave mặt ứng dụng của lyacute thuyết tập mờ để xử lyacute caacutec

giaacute trị trong thế giới thực cho caacutec bagravei toaacuten phức tạp

3 So saacutenh tiacutenh đuacuteng đắn logic mờ vagrave xaacutec suất Xaacutec suất thigrave đề cập đến khả năng xảy ra một biến cố hay một điều gigrave đoacute Logic mờ đề cập đến cấp độ magrave đặc tiacutenh ở hiện tại

o viacute dụ1 người coacute chiều cao 6 feet thigrave coacute cấp độ lagrave 05 về chiều cao

4 Ưu điểm của logic mờ Caacutech tiếp cận rất tự nhiecircnkhocircng phức tạp Coacute thể mocirc higravenh hoacutea caacutec hagravem phi tuyến tugravey yacute phức tạp

Coacute thể tận dụng được kinh nghiệm từ những chuyecircn gia hagraveng đầu trong mọi lĩnh vực

Logic mờ được xacircy dựng dựa trecircn ngocircn ngữ tự nhiecircnNền tảng của logic mờ lagrave dựa trecircn cơ sở giao tiếp của con người

5 Nhược điểm của logic mờ Trong 1 hệ thống phức tạpsử dụng logic mờ coacute thể trở thagravenh trở ngại cho

việc xaacutec thực độ tin cậy của hệ thống Cơ chế lập luận mờ khocircng thể học hỏi từ những lỗi sai

6 Mạng noron nhacircn tạo(ANN) Mạng noron nhacircn tạo lagrave một mocirc phỏng xử lyacute thocircng tinđược nghiecircn cứu ra

từ hệ thống thần kinh của sinh vậtgiống như bộ natildeo để xử lyacute thocircng tin ANNs lagrave chương trigravenh dựa trecircn maacutey tiacutenh đơn giản coacute chức năng lagrave một mocirc

higravenh bagravei toaacuten khocircng gian dựa trecircn thử nghiệm vagrave baacuteo lỗi

7 Học từ kinh nghiệm Tiến trigravenh Một mẫu dữ liệu được biểu diễn như một mạng lưới noronANN ldquodự

đoaacutenrdquo 1 đầu radự đoaacuten được so saacutenh với giaacute trị thực tế hoặc giaacute trị chiacutenh xaacutecNếu đoaacuten được chiacutenh xaacutec thigrave khocircng coacute hagravenh động nagraveo được thực hiện

Nếu dự đoaacuten sai ANN kiểm tra lại vagrave xaacutec định lại thocircng số để điều chỉnh Một mẫu dữ liệu khaacutec được biểu diễn vagrave quaacute trigravenh nagravey được lặp lại

8 Nguyecircn tắc cơ bản của cocircng nghệ nơron Caacutec yếu tố xử lyacute cơ bản trong hệ thống thần kinh của con người lagrave tế bagraveo

thần kinhMạng lưới của tế bagraveo nagravey lagrave liecircn kết với nhau nhận được thocircng tin từ caacutec cảm biến trong mắt taihellip

Thocircng tin nhận được bởi tế bagraveo thần kinh hoặc lagrave sẽ kiacutech thiacutech noacute(sẽ được chuyển qua 1 thocircng điệp dọc theo mạng lưới) hoặc lagrave sẽ ngăn cản noacute(ngăn cản dograveng thocircng tin)

Độ nhạy coacute thể thay đổi qua thời gian hoặc sau khi coacute được kinh nghiệm

9 Cấu truacutec mạng Một ANN gồm 3 lớp cơ bản

Lớp đầu vagraveo nhận dữ liệu Lớp becircn trong hoặc lagrave lớp ẩn xử lyacute dữ liệu Lớp đầu ra chuyển tiếp kết quả cuối cugraveng của mạng

10Mạng nơ ron Thường coacute nhiều đầu vagraveo mỗi đầu vagraveo với mức ảnh hưởng vagrave tầm quan

trọng riecircng của noacute Một đầu vagraveo quan trọng coacute thể được sử dụng để khuếch đại đầu ra caacutec hagravem trạng thaacutei tổng hợp caacutec trọng số của caacutec yếu tố

đầuvagraveo khaacutec nhauvagraveo một giaacute trị duy nhất Caacutec hagravem chuyển giao xử lyacute caacutec giaacute trị trạng thaacutei vagrave tạo đầu ra

11Huấn luyện mạng nơ ron Trong mocirc higravenh coacute giaacutem saacutetANN được đến so saacutenh dự đoaacuten của chiacutenh

noacute với thocircng tin phản hồi coacute chứa caacutec kết quả mong muốn ANN sẽ phải tigravem caacutech thay đổi caacutec tham số becircn trong củamigravenh (caacutec trọng số vagrave caacutec ngưỡng) để tạo necircn một aacutenh xạ coacute khả năng aacutenh xạcaacutec đầu vagraveo thagravenh caacutec đầu ra mong muốn Sự thay đổi nagravey được tiến hagravenh nhờ việc so saacutenh giữa đầu ra thực sự vagrave đầu ra mong muốn

Trong mocirc higravenh khocircng coacute giaacutem saacutetANN nhận được dữ liệu vagraveo nhưng khocircng phải coacute bất kỳ thocircng tin phản hồi về kết quả mong muốn

Phần lớn caacutec ứng dụng nằm trong vugraveng của caacutec bagravei toaacuten ước lượng như mocirc higravenh hoacuteathống kecirc neacuten lọc phacircn cụm

12Lợi iacutech Liecircn kết với mạng noron Traacutenh caacutech lập trigravenh tường minh Giảm nhu cầu của chuyecircn gia ANNs thigrave thiacutech nghi với caacutec yếu tố đầu vagraveo thay đổi Khocircng cần thiết cho cơ sở tri thức tinh chế ANNs coacute tiacutenh động vagrave cải thiện với việc sử dụng Coacute khả năng xử lyacute dữ liệu khocircng chiacutenh xaacutec hoặc khocircng đầy đủ Cho pheacutep tổng quaacutet hoacutea từ thocircng tin cụ thể Cho pheacutep thu thập cảm giaacutec thocircng thường vagraveo miền giải quyết vấn đề

13Hạn chế của việc liecircn kết với mạng noron ANNs khocircng thể giải thiacutech được suy luận Bản chất hộp đen thường khiến cho vấn đề traacutech nhiệm vagrave độ tin cậy phaacutet

sinh lagrave khoacute khăn Lặp đi lặp lại quaacute trigravenh huấn luyện rất tốn thời gian Nguồn lực caacutec nhagrave phacircn tiacutech vagrave thiết kế coacute tay nghề cao vẫn lagrave đaacuteng lo

ngại Cocircng nghệ ANN thuacutec đẩy hạn chế của phần cứng hiện tại ANN yecircu cầu phải coacute sự tin tưởng ở đầu ra

14Giới thiệu về thuật toaacuten di truyền Cũng như mạng lưới thần kinh caacutec thuật toaacuten di truyền được dựa trecircn lyacute

thuyết sinh học Thuật toaacuten di truyền tigravem thấy nguồn gốc của chuacuteng trong caacutec lyacute thuyết

tiến hoacutea của chọn lọc tự nhiecircn vagrave thiacutech ứng với biến đổi khiacute hậu Kết quả thuật toaacuten di truyền lagrave từ giao phối 2 caacute thể trong quần thế để tạo

ra con caacutei đocirci khi tốt hơn so với bậc cha mẹ của chuacuteng 15Caacutec thagravenh phần cơ bản của thuật toaacuten di truyền

Toaacuten tử chọn lọc Caacutec caacute thể tốt được chọn lọc để đưa vagraveo thế hệ sau Sự chọn lọc nagravey căn cứ vagraveo độ thiacutech nghi với mocirci trường của mỗi caacute thể

Toaacuten tử lai gheacutep (crossover) Hai caacute thể cha vagrave mẹ trao đổi caacutec gen với nhau để tạo ra caacute thể con

Toaacuten tử đột biến (mutation) Một caacute thể thay đổi một số gen để biến đổi thagravenh một caacute thể mớiTất cả caacutec toaacuten tử trecircn khi thực hiện đều mang tiacutenh ngẫu nhiecircn

16Quaacute trigravenh cơ bản của một thuật toaacuten di truyền Khởi tạo

Đaacutenh giaacute quần thể

Lựa chọn NST thiacutech hợp nhất vagrave loại bỏ NST yếu nhất

Quy trigravenh giao nhau vagrave cải thiện quần thể

đột biến tiến trigravenh để khaacutem phaacute ra NST mới

17Ưu nhược điểm của việc kết hợp với thuật toaacuten di truyền Kiacutech thước quần thể lagrave 1 yếu tố quan trọng trong tốc độ của việc tigravem

kiếmnhưng noacute tương đối dễ dagraveng để dự đoaacuten tốc độ nagravey Giao nhau hoặc đột biến lagrave khocircng necircn đc sử dụng quaacute thường xuyecircn Luocircn coacute được iacutet nhất 1 giải phaacutep hợp lyacute Necircn coacute thể aacutep dụng chuacuteng cho caacutec vấn đề magrave chuacuteng ta khocircng coacute hướng

về caacutech giải quyết Sức mạnh của thuật toaacuten xuất phaacutet từ khaacutei niệm đơn giảnkhocircng phải từ

một thủ tục thuật toaacuten phức tạp 18Tương lai của học maacutey

Mạng lưới thần kinh nhacircn tạo vượt quaacute năng lực của con người trong caacutec trường hợp bị cocirc lập

Về mặt lyacute thuyếtmột maacutey tiacutenh coacute thể xử lyacute dũ liệu nhanh hơn hagraveng triệu lần so với 1 con người

May mắn thay cho chuacuteng tacon người tốt hơn nhiều khi magrave coacute được dữ liệumaacutey tiacutenh khocircng coacute 1 số thứ như lagrave 5 giaacutec quan

CHƯƠNG 10 KHO DỮ LIỆU

1 Kho dữ liệu Kho dữ liệu lagrave tuyển tập caacutec cơ sở dữ liệu tiacutech hợp hướng chủ đề được

thiết kế để trợ giuacutep cho một hệ hỗ trợ quyết định

Theo John Ladley Cocircng nghệ kho dữ liệu lagrave tập caacutec phương phaacutep kỹ thuật vagrave caacutec cocircng cụ coacute thể kết hợp hỗ trợ nhau để cung cấp thocircng tin cho người sử dụng trecircn cơ sở tiacutech hợp từ nhiều nguồn dữ liệu nhiều mocirci trường khaacutec nhau

Kho dữ liệu thường rất lớn tới hagraveng trăm GB hay thậm chiacute hagraveng Terabyte

2 Kho dữ liệu vận hagravenh (ODS) Một kho dữ liệu vận hagravenh Aacutep dụng kỹ thuật kho dữ liệu vagraveo caacutec hệ xử

lyacute giao taacutec lưu trữ dữ liệu cho một ứng dụng đặc thugrave Noacute đưa vagraveo kho dữ liệu một dograveng caacutec dữ liệu thocirc được thiết kế

3 So saacutenh

Kho dữ liệu vận hagravenh Kho dữ liệu

Dữ liệu theo chủ đề Dữ liệu theo chủ đề

Dữ liệu tiacutech hợp Dữ liệu tiacutech hợp

Dữ liệu thay đổi Dữ liệu khocircng thay đổi

Dữ liệu được cập nhật khi thay đổi

Dữ liệu giữ nguyecircn

Chỉ coacute dữ liệu hiện tạiDữliệu hiện tại vagrave dữ liệu lịch sử

Chu kỳ lagravem tươi dữ liệu ngắn Chu kỳ lagravem tươi dữ liệu dagravei

Chỉ coacute dữ liệu chi tiết Dữ liệu chi tiết vagrave dữ liệu tổng kết

Dugraveng cho caacutec quyết định ngắn hạn

Dugraveng cho hoạch định dagravei hạn

4 Kho dữ liệu cục bộ (Data Mart - DM)

Kho dữ liệu cục bộ lagrave CSDL coacute những đặc điểm giống với kho dữ liệu nhưng với quy mocirc nhỏ hơn vagrave lưu trữ dữ liệu về một lĩnh vực một chuyecircn ngagravenh

Data mart phụ thuộc Chứa những dữ liệu được lấy từ DW vagrave những dữ liệu nagravey sẽ được triacutech lọc vagrave tinh chế tiacutech hợp lại ở mức cao hơn để phục vụ một chủ đề nhất định của Datamart

Data mart độc lập Khocircng giống như Datamart phụ thuộc Data mart độc lập được xacircy dựng trước DW vagrave dữ liệu được trực tiếp lấy từ caacutec nguồn khaacutec nhau

5 Siecircu dữ liệu Metadata lagrave dữ liệu để mocirc tả dữ liệu Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột

một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi Metadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu

6 Mocirci trường kho dữ liệu Hệ thống của tổ chức vagrave kho cung cấp dữ liệu để xacircy dựng kho dữ liệu Trong quaacute trigravenh chuyển dữ liệu từ caacutec nguồn khaacutec nhau dữ liệu coacute thể

được lagravem sạch hoặc chuyển đổi vagrave vigrave thế DW được xem như lagrave một chuẩn cho việc lưu trữ

Đồng thời siecircu dữ liệu được ghi lại Cuối cugraveng DW hoặc siecircu thị coacute thể được sử dụng để tạo ra một kho dữ

liệu ldquocaacute nhacircnrdquo 7 Caacutec đặc điểm của kho dữ liệu

Đặc điểm Mocirc tả

Hướng chủ đề - DL tổ chức theo caacutech thức người dugraveng tham chiếu

Tiacutech hợp - Dữ liệu ldquosạchrdquo loại bỏ tiacutenh thiếu nhất quaacuten

Khocircng thay đổi - DL ldquochỉ đọcrdquo người dugraveng khocircng thay đổi được

Chuỗi thời gian - DL lagrave chuỗi thời gian khocircng phải lagrave trạng thaacutei hiện tại

Được tổng kết - DL vận hagravenhthao taacutec khi cần thiết

được kết hợp lại thagravenh dạng coacute thể dugraveng được cho quyết định

Kiacutech cỡ lớn hơn - Lưu giữ theo chuỗi thời gian tức lagrave giữ lại nhiều DL

Khocircng được chuẩn hoacutea - Coacute thể dư thừa DLSiecircu dữ liệu - Dữ liệu của dữ liệu được lưu trữNguồn dữ liệu - DL vận hagravenh (caacutec hệ sẵn coacute) cugraveng

với caacutec nguồn ngoagravei 8 Kho dữ liệu hướng chủ đề

Hướng chủ để coacute nghĩa lagrave kho dữ liệu được tổ chức xung quanh caacutec chủ đề chiacutenh như khaacutech hagraveng sản phẩm sản xuất Tập trung vagraveo việc mocirc higravenh hoacutea vagrave phacircn tiacutech dữ liệu cho caacutec nhagrave ra quyết định magrave khocircng tập trung vagraveo caacutec xử lyacute thocircng thường Cung cấp cho người dugraveng một khung nhigraven toagraven vẹn đơn giản vagrave đầy đủ về caacutec sự kiện quanh caacutec chủ đề

9 Dữ liệu trong DW được tiacutech hợp Dữ liệu trong kho dữ liệu được xacircy dựng bằng caacutech tổng hợp dữ liệu từ

nhiều nguồn khaacutec nhau vagrave caacutec nguồn coacute tổ chức khaacutec nhau Cơ sở dữ liệu caacutec file excel caacutec flat file hoặc caacutec raw file Khi đưa vagraveo kho dữ liệu caacutec dữ liệu được lagravem sạch vagrave tiacutech hợp dữ liệu nhằm đảm bảo tiacutenh nhất quaacuten của dữ liệu

10Kiến truacutec kho dữ liệu Tầng cơ sở dữ liệu hoạt động Tầng truy xuất thocircng tin Tầng truy xuất dữ liệu Tầng siecircu dữ liệu Tầng quản lyacute tiến trigravenh Tầng thocircng điệp của ứng dụng Tầng vật liacute của kho dữ liệu Tầng trigravenh diễn dữ liệu

11Higravenh trạng kho dữ liệu Kho dữ liệu ảo - người dugraveng cuối coacute thể truy cập trực tiếp đến kho dữ liệu

sử dụng caacutec cocircng cụ cho pheacutep ở tầng truy xuất dữ liệu Kho dữ liệu trung tacircm-1 cơ sở dữ liệu vật lyacute chứa tất cả dữ liệu cho một

vugraveng chuyecircn dụng nagraveo đoacute

Kho dữ liệu phacircn taacuten- Thagravenh phần được phacircn taacuten qua nhiều hệ cơ sở dữ liệu vật lyacute

12METADATA- Siecircu dữ liệu Định nghĩa Siecircu dữ liệu lagrave dữ liệu về dữ liệu Lagrave 1 lưu trữ dugraveng để

Miecircu tả kho dữ liệu tổng thể Nhận dạng kiểu kho dữ liệu Quản liacute quaacute trigravenh tiacutech hợp dữ liệu Quản liacute quaacute trigravenh cập nhật kho dữ liệu Quản liacute bảo mật

Lagrave chigravea khoacutea quyết định sự thagravenh cocircng của kho dữ liệu luocircn được thay đổi vagrave cập nhật theo sự phaacutet triển của kho dữ liệu

Dugraveng để quản liacute điều khiển kho dữ liệu Sự ra đời của kho dữ liệu như 1 cấu truacutec hỗ trợ ra quyết định siecircu dữ liệu

được xem như nguồn tagravei nguyecircn dữ liệu Siecircu dữ liệu lagrave trừu tượng Chuacuteng lagrave dữ liệu bậc cao cung cấp mocirc tả ngắn

gọn caacutec dữ liệu bậc thấp hơn 13Hoạt động của Siecircu dữ liệu

Siecircu dữ liệu rất cần thiết trong việc chuyển hoacutea thocircng tin trở thagravenh tri thức Lagrave chigravea khoacutea giuacutep chuacuteng ta xử lyacute được dữ liệu thocirc Viacute dụ một dograveng dữ liệu baacuten hagraveng 1023 K596 11121 agraveNoacute sẽ khocircng coacute nghĩa gigrave cho đến khi chuacuteng ta đưa vagraveo siecircu dữ liệu (thư

mục chứa dữ liệu) agrave cửa hagraveng 1023 sản phẩm K596 vagrave số tiền baacuten được lagrave 11121 đocirc la

14Sự cần thiết phải nhất quaacuten trong kho dữ liệu Kho dữ liệu được xacircy dựng cho lợi iacutech của những nhagrave phacircn tiacutech kinh

doanh caacutec nhagrave quản trị cho tất cả caacutec khu vực chức năng Trong cơ sở dữ liệu riecircng caacutec khu vực khaacutec nhau coacute thể định nghĩa vagrave lưu

trữ dữ liệu thocircng qua phiecircn bản của chiacutenh noacute Khi dữ liệu được lấy từ những vugraveng khaacutec nhau đoacute vagrave được đặt vagraveo kho dữ

liệu Việc chuyển đổi vagrave lagravem sạch caacutec tiến trigravenh sẽ đảm bảo noacute lagrave duy nhất được tiacutech hợp tại một mức của tổ chức

15Ragrave soaacutet lại dữ liệu ndash Thực thi siecircu dữ liệu

Bất kể cấu truacutec tự nhiecircn của 1 cacircu truy vấn thế nagraveo thigrave caacutec thagravenh phần của siecircu dữ liệu rất quan trọng đối với người ra quyết định

Bảng thuộc tiacutenh khoacutea được lưu trữ bởi kho dữ liệu Tập hợp dữ liệu được lấy từ đacircu Những chuyển đổi nagraveo được thực thi với việc lagravem sạch

16Siecircu dữ liệu lagrave gigrave Metadata - lagrave thocircng tin mocirc tả nội dung của cơ sở dữ liệu (CSDL) Metadata baacuteo cho người dugraveng biết thời gian cập nhật sau cugraveng của dữ liệu

định dạng vagrave mục điacutech sử dụng của noacute Những thocircng tin nagravey coacute thể hướng dẫn người dugraveng duyệt qua CSDL vagrave

giuacutep họ hiểu được yacute nghĩa vagrave ngữ cảnh của dữ liệu Trong CSDL metadata lagrave caacutec dạng biểu diễn khaacutec nhau của caacutec đối tượng

trong CSDL Trong CSDL quan hệ metadata lagrave caacutec định nghĩa của bảng cột CSDL

view vagrave nhiều đối tượng khaacutec Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột

một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi -gtMetadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu

Bảng chuyển đổi Ghi lại những chuyển đổi đatilde được thực hiện

Lịch sử thực thi Ghi lại những dữ liệu đatilde được

phacircn tiacutech

Higravenh thaacutei kết nốiGhi lại những dữ liệu được kết nối vagrave tần suất

17Aacutenh xạ thocircng thường của siecircu dữ liệu Bản ghi aacutenh xạ chuyển đổi bao gồm

Định danh của nguồn gốc Chuyển đổi thuộc tiacutenh Chuyển đổi thuộc tiacutenh vật lyacute Matilde hoacutea tham chiếu bảng chuyển đổi Đổi tecircn Đổi khoacutea Gaacuten giaacute trị cho thuộc tiacutenh mặc định Chọn logic cho caacutec nguồn nhiều giaacute trị Đổi thuật toaacuten

18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để

phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai

lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave

tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec

Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm

Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo

19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua

caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau

SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được

Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra

một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức

Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ

Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ

Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech

CHƯƠNG 11 KHAI PHAacute DỮ LIỆU

1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn

ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993

Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng

2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd

1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều

2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP

3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn

4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng

5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server

6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo

7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động

8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời

9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều

10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện

11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech

12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP

3 Xử lyacute phacircn tiacutech trực tuyến OLAP

MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave

dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu

ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave

thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu

HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave

ROLAP4 Khai phaacute dữ liệu

Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh

khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn

Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan

5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp

6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại

Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp

Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec

Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt

Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra

Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh

vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho

Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec

Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm

Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục

Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng

gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp

Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn

Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec

Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper

Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2

Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25

Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước

Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng

Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện

trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp

Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute

độ hỗ trợ ge ngưỡng minsup

độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan

Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn

Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết

Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu

MOLAP ROLAP HOLAP

Lưu trữ dữ liệu cơ sở

Khối Bảng quan hệ Bảng quan hệ

Lưu trữ thocircng tin tổng hợp

Khối Bảng quan hệ Khối

Hiệu suất thực hiện truy vấn

Nhanh nhất Chậm nhất Nhanh

Tiecircu thụ khocircng gian lưu trữ

Nhiều Thấp Trung bigravenh

Chi phiacute bảo trigrave Cao Thấp Trung bigravenh

Page 16: De cuong(1-11)

bull Khocircng thực sự lagrave một mocirc higravenh vigrave khocircng biểu diễn thực tại magrave lagrave cố gắng bắtchước thực tạibull Một trong những phương phaacutep thocircng dụng nhất trong HHTQĐbull HHTQĐ lagravem việc với caacutec bagravei toaacuten phi cấu truacutec vagrave cấu truacutec yếu tigravenh huống thực tếphức tạp ndash khocircng dễ biểu diễn bằng mocirc higravenh tối ưu hay caacutec dạng mocirc higravenh khaacutecnhưng lại thường coacute thể xử lyacute được bằng mocirc phỏngbull Đặc điểm1048713 Iacutet đưa ra caacutec đơn giản hoacutea về thực tại hơn caacutec mocirc higravenh khaacutec1048713 Do triển khai caacutec thực nghiệm necircn noacute coacute thể kiểm thử caacutec giaacute trị cụ thể của caacutecbiến quyết địnhbiến khocircng kiểm soaacutet được của mocirc higravenh vagrave xem xeacutet ảnh hưởnglecircn caacutec biến kết quả1048713 Phương phaacutep coacute tiacutenh mocirc tả (như vậy khaacutec với phương phaacutep danh định)1048713 Khocircng tự động tigravem kiếm giải phaacutep tối ưu ndash noacute mocirc tảtiecircn đoaacuten caacutec đặc tiacutenh của hệthống đatilde cho dưới caacutec điều kiện khaacutec nhau từ đoacute coacute thể chọn ra phương aacuten tốtnhất1048713 Quaacute trigravenh mocirc phỏng thường lặp lại một thực nghiệm nhiều lần để coacute được ướclượng về hiệu ứng tổng quaacutet của một số hagravenh động nhất định1048713 Mocirc phỏng maacutey tiacutenh thiacutech hợp cho hầu hết caacutec tigravenh huống mặc dugrave cũng coacute một sốmocirc phỏng thủ cocircng thagravenh cocircng1048713 Thường chỉ được dugraveng khi bagravei toaacuten quaacute phức tạp khocircng thể xem xeacutet bằng caacutec kỹthuật tối ưu dạng số Tiacutenh phức tạp theo nghĩa bagravei toaacuten khocircng thể cocircng thức hoacuteacho tối ưu (do khocircng thotildea caacutec giả định) hoặc cocircng thức quaacute lớn quaacute nhiều tươngtaacutec giữa caacutec biến hoặc về bản chất bagravei toaacuten lagrave bất định hay rủi roPhương phaacutep mocirc phỏng thiết lập mocirc higravenh của hệ thống thực vagrave tiến hagravenh caacutec thựcnghiệm lặp lại trecircn mocirc higravenh

bull Thuận lợi1048713 Lyacute thuyết tương đối trực tiếp hiệu ứng dagravei hạn của nhiều chiacutenh saacutech -gt neacuten thờigian lớn1048713 Do tiacutenh chất mocirc tả (khaacutec với danh định)1048713 Coacute thể thấy được nhanh choacuteng coacute thể đặt ra caacutec cacircu hỏi ldquowhat-ifrdquo coacute thể dugravengtiếp cận thử-vagrave-sai vagraveo giải quyết vấn đề một caacutech nhanh choacuteng rẻ chiacutenh xaacutec iacutetrủi ro hơn1048713 Thử nghiệm được biến quyết định phần nagraveo của mocirci trường thực sự quan trọngvới caacutec phương aacuten khaacutec nhau1048713 Yecircu cầu kiến thức riecircng biệt về bagravei toaacuten vigrave thế buộc người xacircy dựng mocirc higravenh phảilagravem việc thường xuyecircn với nhagrave quản lyacute ndash đối tượng mong muốn của HHTQĐ để

từ đoacute bản chất bagravei toaacuten vagrave caacutec quyết định được hiểu tốt hơn1048713 Mocirc higravenh được xacircy dựng từ viễn cảnhcaacutech nhigraven của nhagrave quản lyacute1048713 Mocirc higravenh chỉ cho một bagravei toaacuten riecircng biệt thường khocircng thể dugraveng giải caacutec bagravei toaacutenkhaacutec Như vậy mỗi thagravenh phần của mocirc higravenh ứng với một phần của hệ thống thựcdo đoacute sẽ khocircng yecircu cầu nhagrave quản lyacute phải tổng quaacutet hoacutea caacutec hiểu biết của migravenh1048713 Phổ bagravei toaacuten giải được rất rộng tồn kho nhacircn sự hoạch định chiến lược 1048713 Coacute thể chứa caacutec phức tạp thực sự của bagravei toaacuten khocircng cần caacutec đơn giản hoacutea (TDdugraveng caacutec phacircn phối xaacutec suất thực thay vigrave phacircn phối lyacute thuyết xấp xỉ)1048713 Coacute thể tự động sinh ra nhiều đo lường hiệu năng quan trọng1048713 Thường lagrave phương phaacutep duy nhất của HHTQĐ coacute thể xử lyacute caacutec bagravei toaacuten tương đốiphi cấu truacutec1048713 Coacute một số caacutec goacutei phần mềm mocirc phỏng (Monte Carlo) tương đối dễ dugravengbull Điểm yếu1048713 Tuy thường tigravem được caacutec phương aacuten đủ tốt nhưng khocircng đảm bảo lời giải tối ưu1048713 Quaacute trigravenh xacircy dựng mocirc higravenh thường dagravei vagrave tốn keacutem1048713 Giải phaacutep vagrave suy diễn từ nghiecircn cứu mocirc phỏng thường khocircng thể chuyển sang bagraveitoaacuten khaacutec vigrave mocirc higravenh kết hợp caacutec yếu tố đặc thugrave1048713 Đocirci khi do mocirc higravenh quaacute dễ giải thiacutech cho nhagrave quản lyacute necircn caacutec phương phaacutep phacircntiacutech thường xem nhẹ1048713 Phần mềm mocirc phỏng đocirci khi yecircu cầu caacutec kỹ năng đặc biệt do độ phức tạp củaphương phaacutep giải higravenh thứcbull Caacutec loại mocirc phỏng1048713 Mocirc phỏng xaacutec suất một hay nhiều biến độc lập mang tiacutenh xaacutec suất với 2 loạiphacircn phối ndash thường dugraveng kỹ thuật Monte Carlo1048713 Phacircn phối rời rạc tigravenh huống coacute một số giới hạn caacutec biến cố (biến) với hữu hạncaacutec giaacute trị cho mỗi biến cố (biến)1048713 Phacircn phối liecircn tục tigravenh huống coacute số lượng khocircng giới hạn caacutec biến cố tuacircn theocaacutec hagravem mật độ xaacutec suất như phacircn phối chuẩn1048713 Mocirc phỏng độc lậpphụ thuộc theo thời gian1048713 Độc lập khocircng cần thiết phải biết chiacutenh xaacutec thời điểm xảy ra biến cố (nhu cầutiecircu thụ lượng sản phẩm trong ngagravey khocircng biết chiacutenh xaacutec thời điểm tiecircu thụ)1048713 Phụ thuộc cần biết chiacutenh xaacutec thời điểm xảy ra sự kiện (bagravei toaacuten hagraveng đợi)1048713 Mocirc phỏng tương taacutec trực quan1048713 Mocirc phỏng hướng đối tượng dugraveng tiếp cận hướng đối tượng để xacircy dựng mocirc higravenhmocirc phỏng Chuacute yacute ngocircn ngữ mocirc higravenh hoacutea nhất thể UML (unified modelinglanguage) kể cả khi mocirc phỏng caacutec hệ thời gian thựcMOcirc HIgraveNH HOacuteA ĐA CHIỀU ndash XỬ LYacute PHAcircN TIacuteCH TRỰC TUYẾNbull Người ra quyết định thường phải xem xeacutet nhiều chiều của dữ liệu (TD caacutec chiềucủa dữ liệu baacuten hagraveng lagrave sản phẩm vugraveng thời gian người baacuten ) dữ liệu cần đượcphacircn tiacutech trực tiếp bằng caacutec cocircng cụ chuẩn hay phacircn tiacutech tự động bằng caacutec

phương phaacutep khai mỏ dữ liệu (data mining)bull Hầu hết caacutec hệ thống phacircn tiacutech đa chiều được nhuacuteng trong caacutec hệ xử lyacute phacircn tiacutechtrực tuyến (HXLPTTT ndash online analytic processing - OLAP)bull Mục tiecircu của XLPTTT nắm bắt cấu truacutec của dữ liệu thực để hỗ trợ ra quyết địnhbull Trong HHTQĐ coacute sự gắn nối tự nhiecircn giữa mocirc higravenh hoacutea dữ liệu mocirc higravenh hoacutea kyacutehiệu vagrave caacutec khiacutea cạnh của phacircn tiacutech ldquowhat-ifrdquobull Caacutec baacuteo caacuteo của HXLPTTT đều coacute tiacutenh tương taacutec dễ khai thaacutec sử dụng đặc biệtphugrave hợp cho caacutec baacuteo caacuteo về chỉ số hiệu năng chủ yếu (key performance indicators- KPI) baacuteo caacuteo về đo lường hiệu năng kinh doanh bull Thế hệ hiện tại của HXLPTTT vagrave hệ khai mỏ dữ liệu (data mining) tiacutech hợp caacutecđặc tiacutenh của hệ thocircng tin latildenh đạo (executive information system ndashEIS- nhiềucaacutech nhigraven dữ liệu chi tiết hoacutea theo nhu cầu) vagrave caacutec hệ đồ họa khaacutec ndash thường coacutegiao diện người dugraveng dạng kiểu WEBbull Caacutec hệ thống như trecircn cograven được gọi lagrave caacutec cocircng cụ triacute tuệ kinh doanh (businessintelligence - BI) vigrave coacute caacutec đặc trưng về mocirc higravenh hoacutea vagrave tối ưu hoacutea nhưng lạitrong suốt đối với ngươigrave dugravengbull Hiện caacutec cocircng cụ được đưa ra bởi caacutec nhagrave cung cấp về CSDL về hoạch định tagraveinguyecircn tổ chức (ERP) về nhagrave kho dữ liệu (data warehouse) về HXLPTTT MOcirc HIgraveNH HOacuteA VAgrave MOcirc PHỎNG TƯƠNG TAacuteC TRỰC QUANbull Iacutech lợi Người ra quyết định tham gia vagraveo quaacute trigravenh phaacutet triển mocirc higravenh vagrave thựcnghiệm mocirc phỏng vigrave vậy sẽ tin tưởng khi sử dụng mocirc higravenhbull Mocirc higravenh hoacutea tương taacutec trực quan (visual interactive modeling - VIM) dugraveng caacutecbiểu diễn đồ họa maacutey tiacutenh để trigravenh bagravey caacutec ảnh hưởng của caacutec quyết định quản lyacutekhaacutec nhau ở một thời điểm (tĩnh) hay tiến triển theo thời gian (động với kỹ thuậthoạt higravenh)bull Mocirc phỏng tương taacutec trực quan (visual interactive simulation - VIS) cho pheacutepngười dugraveng theo dotildei tiến trigravenh xacircy dựng vagrave sử dụng khai thaacutec mocirc higravenh mocirc phỏngdưới dạng hoạt higravenhbull Mocirc higravenh hoacutea tương taacutec trực quan coacute thể kết hợp với tiếp cận triacute tuệ nhacircn tạo đểđưa ra caacutec khả năng mới thay đổi từ xacircy dựng hệ thống dạng đồ họa đến tigravem hiểuvề động học của hệ thốngbull Cần đến caacutec hệ thống maacutey tiacutenh xử lyacute song song tốc độ cao để xacircy dựng caacutec mocircphỏng - phức tạp quy mocirc lớn dạng hoạt higravenh - mang tiacutenh khả thi ở thời gian thực

22Caacutec dạng hệ thống hỗ trợ ra quyết địnhHệ hỗ trợ quyết định nhoacutemRa quyết định nhoacutem giao tiếp vagrave cộng taacutec- Caacutec đặc điểm của cocircng việc nhoacutem+ Một nhoacutem thực hiện một nhiệm vụ thỉnh thoảng ra quyết định thỉnh thoảngkhocircng ra quyết định+ Caacutec thagravenh viecircn trong nhoacutem coacute thể ở những nơi khaacutec nhau

+ Caacutec thagravenh viecircn trong nhoacutem coacute thể lagravem việc ở những thời gian khaacutec nhau+ Caacutec thagravenh viecircn trong nhoacutem coacute thể lagravem việc cugraveng nhau hoặc ở caacutec tổ chức khaacutecnhau+ Nhoacutem coacute thể vĩnh viễn hoặc tạm thời+ Nhoacutem coacute thể ở bất kỳ mức quản lyacute nagraveo hoặc mức thời gian nagraveo+ Coacute sự điều phối (quaacute trigravenh vagrave nhiệm vụ đạt được) hoặc macircu thuẩn trongnhoacutem+ Coacute sự đạt được hoặcvagrave mất maacutet năng suất trong tổ chức+ Nhiệm vụ phải hoagraven thagravenh rất nhanh+ Khocircng thể hoặc quaacute đắt cho tất cả caacutec thagravenh viecircn trong nhoacutem cugraveng hợp ở mộtnơi+ Một số dữ liệu thocircng tin hoặc kiến thức cần thiết nằm ở nhiều nơi một sốkhaacutec ở ngoagravei tổ chức+ Chuyecircn mocircn của caacutec thagravenh viecircn khocircng coacute trong nhoacutem lagrave cần thiết- Caacutec hoạt động vagrave caacutec quaacute trigravenh miecircu tả caacutec cuộc họp+ Cuộc họp lagrave hoạt động chung liecircn quan bởi một nhoacutem người coacute địa vị bằngnhau hoặc gần bằng nhau+ Kết quả của cuộc họp phụ thuộc một phần vagraveo kiến thức yacute kiến caacutec đaacutenh giaacutecủa caacutec thagravenh viecircn+ Kết quả của cuộc họp cũng phụ thuộc vagraveo sự kết hợp của nhoacutem vagrave phụ thuộcvagraveo quaacute trigravenh ra quyết định được sử dụng bởi nhoacutem đoacute+ Giải quyết caacutec yacute kiến khaacutec nhau bởi người coacute quyền hạn hoặc thương lượnghoặc phacircn xửHỗ trợ giao tiếp- Giao tiếp lagrave thagravenh phần quan trọng cho hỗ trợ quyết định Khocircng coacute giao tiếp thigravekhocircng coacute cộng taacutec Những người ra quyết định caacute nhacircn phải giao tiếp với caacutecđồng nghiệp chuyecircn gia cơ quan chiacutenh phủ khaacutech hagraveng đối taacutec kinh doanh hellipHọ cũng cần dữ liệu vagrave thocircng tin (vagrave kiến thức) từ nhiều nơi trecircn thế giới Caacutecnhoacutem ra quyết định phải giao tiếp cộng taacutec vagrave thương lượng trong cocircng việcHầu hết caacutec tổ chức sẽ nhanh trở thagravenh khocircng coacute chức năng nếu khocircng coacute caacutec hệthống giao tiếp Thương mại điện tử coacute thể hiệu quả chỉ qua caacutec kỹ thuật giao tiếphiện đại- Caacutec kỹ thuật thocircng tin hiện đại cung cấp caacutec phương tiện hỗ trợ giao tiếp rẻnhanh coacute khả năng coacute thể tin cậy Nền tảng hỗ trợ giao tiếp lagrave caacutec hệ thống maacuteytiacutenh mạng+ Bắt đầu bằng điện baacuteo điện thoại radio vagrave ti vi+ Trong 100 năm chuacuteng ta phaacutet triển maacutey fax thư điện tử chương trigravenh chatnhoacutem tin tức hệ thống hội nghị truyền higravenh Hầu hết caacutec kỹ thuật nagravey đềuhoạt động trecircn internet+ Sự phaacutet triển giao tiếp sau cugraveng lagrave hệ thống họp điện tử caacutec dịch vụ vagrave hệ

thống hội nghị điện tử thường sử dụng internet để kết nối caacutec người ra quyếtđịnh- Caacutec thuận lợi aacutep dụng caacutec phương phaacutep giao tiếp cải tiến trong caacutec tổ chức+ Cải tiến năng suất của nhacircn viecircn+ Liecircn quan đến nhiều người ra quyết định chiacutenh+ Khocircng quan tacircm nhiều đến đường biecircn giới địa lyacute+ Tạo nền văn hoacutea hợp taacutec nhất quaacuten+ Cải tiến chất lượng cuộc sống của nhacircn viecircnHỗ trợ cộng taacutec Maacutey tiacutenh hỗ trợ cộng taacutec- Khung thời giannơi chốn+ Sự hiệu quả của kỹ thuật tiacutenh toaacuten cộng taacutec phụ thuộc vagraveo vị triacute của caacutec thagravenhviecircn trong nhoacutem vagrave phụ thuộc vagraveo thời gian chia sẽ thocircng tin gởi vagrave nhận+ Chia sự giao tiếp thagravenh bốn ocirc vagrave tổ chức bốn ocirc dọc theo 2 chiều thời gian vagravenơi chốn1048713 Thời gian Khi gởi vagrave nhận thocircng tin hầu như đồng thời giao tiếp lagrave đồngthời Viacute dụ Điện thoại ti vi vagrave caacutec cuộc họp gặp mặt nhau Giao tiếp bấtđồng bộ xảy ra khi người nhận nhận thocircng tin ở thời điểm khaacutec thời điểmgởi thocircng tin đoacute1048713 Nơi chốn Người gởi vagrave người nhận coacute thể ở cugraveng phograveng hoặc khocircng+ Bốn ocirc lagrave1048713 Cugraveng thời giancugraveng nơi chốn Caacutec thagravenh viecircn gặp mặt nhau cugraveng một luacutecgiống như phograveng quyết định hoặc gặp mặt truyền thống1048713 Cugraveng thời giankhaacutec nơi chốn Caacutec thagravenh viecircn ở caacutec nơi khaacutec nhau nhưnggiao tiếp cugraveng nhau Viacute dụ hội nghị truyền higravenh (videoconferencing)1048713 Khaacutec thời giancugraveng nơi chốn Nhiều người lagravem việc theo ca Ca nagravey để lạithocircng tin cho ca khaacutec1048713 Khaacutec thời giankhaacutec nơi chốn Caacutec thagravenh viecircn ở caacutec nơi khaacutec nhau Caacutecthagravenh viecircn nagravey gởi vagrave nhận thocircng tin ở những lần khaacutec nhau

23Thực thi hệ DSSHệ thống hỗ trợ quản lyacute (MSS) khocircng phải luacutec nagraveo cũng luocircn thagravenh cocircng Nhiều trường hợpthất bại của ES khocircng hoagraven toagraven lagrave lyacute do kỹ thuật Thực thi hệ thống lagrave một quaacute trigravenh liecircn tụcnhằm đảm bảo cho tổ chức chuẩn bị tiếp nhận một hệ thống mới vagrave đưa hệ thống vagraveo sử dụngthagravenh cocircngThực hiện cocircng nghệ hệ thống hỗ trợ quản lyacute lagrave việc phức tạp vigrave caacutec hệ thống nagravey khocircng đơnthuần lagrave hệ thống thocircng tin chỉ thu thập thao taacutec vagrave phacircn phối thocircng tin Magrave xa hơn chuacuteng

liecircn quan tới caacutec cocircng việc coacute thể lagravem thay đổi đaacuteng kể caacutech thức hoạt động của tổ chức Tuyvậy đa số caacutec yếu tố thực thi đều liecircn quan tới hệ thống thocircng tinThực thi MSS lagrave quaacute trigravenh liecircn tục diễn ra trong suốt thời gian phaacutet triển hệ thống từ đề xuấtban đầu đến nghiecircn cứu khả thi thiết kế vagrave phacircn tiacutech hệ thống lập trigravenh huấn luyện chuyểnđổi vagrave lắp đặt Caacutec chuyecircn gia hệ thống thocircng tin thường gọi thực thi lagrave giai đoạn cuối trongvograveng đời hệ thống Định nghĩa thực thi MSS phức tạp hơn vigrave bản chất lặp của sự phaacutet triểncaacutec hệ thống

THỰC THI KHOcircNG HOAgraveN CHỈNHCaacutec quyết định về tiacutenh khả thi thường coacute giả định về lợi iacutech đạt được khi kế hoạch thực thiđược thực hiện hoagraven toagraven Trong thực tế thường chỉ thực hiện 90 thậm chiacute 70 phần trăm sovới phacircn tiacutech khả thi Lyacute do lagrave sự thay đổi tại một nơi trong hệ thống coacute thể ảnh hưởng vagrave coacutethể taacutec động tiecircu cực đến chỗ khaacutec Do vậy cấp quản lyacute coacute thể bỏ những phần trong dự aacuten coacutethể gacircy ra taacutec động xấu Do đoacute dự aacuten sẽ thực hiện iacutet hơn 100 so với dự aacuten kế hoạch Caacutec lyacutedo khaacutec coacute thể lagrave do khấu trừ ngacircn saacutech hoặc vượt chi phiacuteĐAacuteNH GIAacute SỰ THAgraveNH COcircNG CỦA THỰC THI HỆ THỐNGPhải coacute caacutec chỉ số đo lường thigrave mới coacute thể đaacutenh giaacute sự thagravenh cocircng khi thực thi một hệ thốngDickson va Powers (1973) đề ra 5 tiecircu chuẩn độc lậpbull Tỷ lệ thời gian thực hiện dự aacuten với thời gian ước lượngbull Tỷ lệ chi phiacute thực tế vagrave ngacircn saacutech thực hiệnbull Thaacutei độ của cấp quản lyacute đối với hệ thốngbull Nhu cầu thocircng tin của caacutec nhagrave quản lyacute được đaacutep ứng như thế nagraveo qua hệ thốngbull Taacutec động của dự aacuten đối với những hoạt động maacutey tiacutenh trong cocircng tyCaacutec đo lường khaacutec để đaacutenh giaacute thagravenh cocircng của hệ hỗ trợ quản lyacute (MSS)bull Sự sử dụng hệ thống (dự định dugraveng hoặc thực sự dugraveng)bull Thỏa matilden của người dugravengbull Thaacutei độ taacuten thagravenhbull Mức độ hệ thống hoagraven thagravenh caacutec mục tiecircu ban đầubull Phần thưởng đối với tổ chức (giảm chi phiacute tăng doanh thuhellip)bull Tỷ số lợi iacutech chi phiacute

bull Mức độ thể chế hoacutea của MSS trong tổ chứcDo bởi tiacutenh đa dạng của DSS necircn việc đaacutenh giaacute sự thagravenh cocircng của hệ nagravey cũng khoacute khăn tuynhiecircn cũng coacute thể coacute một số yếu tố giuacutep cho DSS thagravenh cocircng như sự tham gia người dugravenghuấn luyện người dugraveng hỗ trợ quản lyacute cấp cao nguồn thocircng tin đặc điểm của những nhiệmvụ coacute liecircn quan (cấu truacutec bất định độ khoacute phụ thuộc)

Chương5Nhoacutem hỗ trợ quyết định vagrave nhoacutemcocircng nghệ phần mềm

51Nhoacutem tạo quyết định

MDM-Holsapple đatilde gợi yacute chuacuteng ta sử dụng giới hạn người tạo quyết định

Một nhoacutem lagrave kết cấu MDM nơi magrave nhiều người ra quyết định hoagraven toagraven tương taacutec

Một đội lagrave kết cấu MDM nơi caacutec thagravenh viecircn tư vấn cho người đưa ra quyết định nhưng khocircng tương taacutec

Một Ủy ban lagrave kết cấu MDM với một người tạo quyết định duy nhất vagrave sự tương taacutec giữa caacutec thagravenh viecircn

Mạng thocircng tin

Mạng lưới baacutenh xe mỗi người tham gia coacute thể giao tiếp với người đưa ra quyết định ở trung tacircm nhưng khocircng phải với người tham gia khaacutecCấu truacutec nagravey lagrave khocircng thỏa matilden tất cả những người tham gia ngoại trừ người ra quyết định

Mạng dacircy chuyền Tham gia chuyển tiếp thocircng tin chỉ để noacute luocircn liền kề nhau trong chuỗi

Thagravenh viecircn cuối cugraveng ko được đaacutep ứng

Mạng vograveng trograven Tương tự như chuỗi nhưng kết thuacutec được kết nối

Mạng kết nối hoagraven toagraven khocircng coacute hạn chế về giao tiếp vagrave tương taacutec giữa caacutec thagravenh viecircnNoacutei chungnoacute đaacutep ứng hầu hết caacutec kết nối của người tham gia nhưng truyền đạt thocircng tin mất nhiều thời gian vagrave coacute nhiều cơ hội xảy ra lỗi

Nhoacutem hagravenh vi vagrave chuẩn mực

MDMs thiết lập caacutec chỉ tiecircu hướng dẫn quaacute trigravenh ra quyết định

Một chuẩn mực quy định cụ thể những gigrave thagravenh viecircn trong nhoacutem dự kiến sẽ lagravem trong những hoagraven cảnh nhất định

Quy tắc gửi coacute thể được thocircng qua viacute dụ đaacutenh giaacute ngang hagraveng hoặc xử phạt

Lagravem thế nagraveo để đưa ra quyết định

Việc chọn lựa magrave trong đoacute việc sử dụng cấu truacutec MDM phải được dựa trecircn một số yếu tố liecircn quan với bối cảnh quyết định

Viacute dụmột cấu truacutec riecircng lẻ sẽ lagravem việc nơi magrave quyết định được cấu truacutec cao vagrave thocircng tin lagrave coacute sẵn

Một ủy ban cơ cấu sẽ lagrave sự lựa chọn khi người ra quyết định khocircng thể đưa ra quyết định một migravenh

52Caacutec vấn đề thường gặp trong nhoacutem

Kiacutech thước Noacutei chung sự nhất triacute vagrave gắn kết giữa caacutec thagravenh viecircn tỉ lệ nghịch với phạm vi nhoacutem Trong nhoacutem lớn rất dễ higravenh thagravenh caacutec nhoacutem nhỏ vagrave hoạt động rời rạc

Tư duy tập thể Trong nhoacutem lớn mọi người coacute xu hướng suy nghĩ đểđạtđược sự nhất triacute necircn khocircng phaacutet huy được sự saacuteng tạo

Caacutec vấn đề về xatilde hội

Xung đột Trong 1 nhoacutem ai cũng muốn migravenh lagrave giỏi nhất necircn dễ dẫn đến xung đột

Ẩn danh(Giấu tecircn) Đacircy lagrave phương phaacutep được sử dụng để kiểm soaacutet xung đột Cho caacutec thagravenh viecircn tham gia ẩn danh

Vấn đề giới tiacutenh Nam vagrave nữ thường coacute những thế mạnh khaacutec nhau điều nagravey coacute thể lagrave sức mạnh trong 1 thiết lập MDM

Đagravem phaacuten vagrave quyết định

Một quyết định coacute thể liecircn quan đến nhiều quan điểm khaacutec nhau vigrave thế cần phải coacute sự đagravem phaacuten

Caacutec thiết kế của cơ chế hỗ trợ cho MDM phải phugrave hợp với caacutec hoạt độngđagravemphaacuten

Những hoạt động nagravey bao gồm việc thu nhận yacute kiến của caacutec thagravenh viecircn 1 caacutech cocircng bằng

53Cocircng nghệ hỗ trợ MDM

Organizational DSSndash 1 hệ thống cung cấp caacutec quyết định hỗ trợ

Group Support Systemndash Cocircng nghệ sử dụng sự hỗ trợ của nhiều becircn tham gia

Group DSS ndash Lagrave 1 hệ thống được thiết kế đặc biệt để hỗ trợ cho MDM

DSS ndash Lagrave 1 hệ thống dưới sự kiểm soaacutet của 1 người quyết định hệ thống nagravey cung cấp 1 bộ cocircng cụ giuacutep phacircn tiacutech hoagraven cảnh đểđưa ra quyết định vagrave nacircng cao hiệu quả của quyết địnhđoacute

53Cocircng nghệ hỗ trợ MDM

Organizational DSSndash 1 hệ thống cung cấp caacutec quyết định hỗ trợ

Group Support Systemndash Cocircng nghệ sử dụng sự hỗ trợ của nhiều becircn tham gia

Group DSS ndash Lagrave 1 hệ thống được thiết kế đặc biệt để hỗ trợ cho MDM

DSS ndash Lagrave 1 hệ thống dưới sự kiểm soaacutet của 1 người quyết định hệ thống nagravey cung cấp 1 bộ cocircng cụ giuacutep phacircn tiacutech hoagraven cảnh đểđưa ra quyết định vagrave nacircng cao hiệu quả của quyết địnhđoacute

Mục tiecircu của cocircng nghệ hỗ trợ MDM

Quy trigravenh hỗ trợ tập trung vagraveo quaacute trigravenh tạo điều kiện thuận lợi cho sự tương taacutec

Cơ chế cấu truacutec quaacute trigravenh chi phối caacutec hoạt động truyền thocircng

Nhiệm vụ hỗ trợ cocircng việc coacute thể chọn lựa tổ chức hoặc lấy thocircng tin

Nhiệm vụ cấu truacutec cocircng việc cho pheacutep truy cập đến kỹ thuật lọc kết hợp phacircn tiacutech kiến thức liecircn quan đến cocircng việc

Caacutec lớp loại cocircng nghệ hỗ trợ MDM

Phacircn loại theo đặc điểm do DeSanctis vagrave Gallupe đưa ra đề xuất một chương trigravenh ba cấp dựa trecircn caacutec tiacutenh năng được cung cấp

Hệ thống cấp 1 Mục điacutech chiacutenh lagrave tạo điều kiện thocircng tin liecircn lạc giữa caacutec thagravenh viecircn

Hệ thống cấp 2 Thiết kế để giảm thiểu rủi ro

Hệ thống cấp 3 Giuacutep điều chỉnh xử lyacute quyết định

Phacircn loại theo cocircng nghệ -Kraemer vagrave King tập trung vagraveo cocircng nghệ aacutep dụng

Cocircng nghệ bảng mạch điện tử

Hội nghị trực tuyến

Mạng lưới tập đoagraven

Trung tacircm thocircng tin

Mocirci trường cộng taacutec

Phograveng quyết định

Nhoacutem phần mềm

Phần mềm được thiết kế để hỗ trợ sự hợp taacutec bao gồm việc thu huacutet vagrave lưu trữ thocircng tin

Caacutec tổ chức dẫn đầu thị trường hiện tại lagrave Lotus Notes and Domino Microsoft Exchange Novell GroupWise and Oracle Office

Caacutec cocircng cụ trong một bộ phần mềm bao gồm người quản lyacute hội nghị (Lotus Sametime) vagrave trao đổi thocircng điệp (Lotus Notes Mail)

Xếp hạng phần mềm cho nhoacutem

Ellis vv đề xuất một hệ thống xếp hạng dựa vagraveo kiểu sự hỗ trợ noacute Cung cấp

Hệ thocircng điệp

Hệ thống hội thảo truyền higravenh

Hệ thống cộng taacutec soạn thảo

Nhoacutem phacircn phối giải phaacutep phần mền

Hệ thống phối hợp

Hệ thống thocircng minh đại diện

Lực lượng điều khiển phaacutet triển phần mềm cho nhoacutem

Một số nhacircn tố chiacutenh bao gồm

Tăng năng suất

Giảm số lượng caacutec cuộc họp

Tăng cường tự động hoacutea caacutec quy trigravenh lagravem việc thường xuyecircn

Cần phối hợp toagraven cầu tốt hơn

Tiacutenh sẵn sagraveng của những mạng lan rộng

Coleman vagrave Khanna liệt kecirc 10 nhacircn tố khaacutec

54Quản lyacute hoạt động MDM (Mobile Device Management - Quản lyacute thiết bị di động)

Một số phương phaacutep phối hợp phổ biến hơnMDM lagrave

Kỹ thuật nhoacutem định danh

Kỹ thuật Delphi

Sự phacircn xử

Hệ thocircng tin dựa trecircn vấn đề

Nemawashi

Kỹ thuật nhoacutem định danh

1-Mỗi người tham gia viết ra những yacute tưởng về những gigrave necircn quyết định

2-Lần lượt mỗi người tham gia trigravenh bagravey yacute tưởng của migravenh được ghi lại trecircn bảng Khocircng thảo luận ở đacircy

3-Sau khi tất cả caacutec yacute tưởng được trigravenh bagravey caacutec đại biểu coacute thể chất vấn những người khaacutec

4-Mỗi người tham gia bỏ phiếu cho mỗi yacute tưởng

Kỹ thuật Delphi

Về cơ bản tương tự như kỹ thuật nhoacutem định danh ngoại trừ những người khocircng bao giờ tham gia cuộc họp

Một cocircng cụ khảo saacutet được sử dụng để thu thập đầu vagraveo ban đầu từ caacutec thagravenh viecircn

Một cuộc khảo saacutet thứ hai được gửi đi với một bản toacutem tắt caacutec kết quả chung

Những bước lặp lại cho đến khi đạt được một sự đồng thuận hoặc nhigraven nhận của đa số

Sự phacircn xử(Arbitration )

Thiacutech hợp nhất khi caacutec thagravenh viecircn của MDM đại diện cho caacutec yếu tố đối lập

Những người tham gia đồng yacute rằng nếu lựa chọn thay thế hai becircn thỏa thuận khocircng được tigravem thấy thigrave một trọng tagravei viecircn becircn ngoagravei sẽ tham gia

Trọng tagravei sau đoacute lựa chọn thay thế ocircng hoặc xeacutet thấy thiacutech hợp nhất

Hệ thống thocircng tin dựa trecircn vấn đề (IBIS)

Lagrave một phương phaacutep lập luận cấu truacutec

Một đại diện cho IBIS lagrave một đồ thị với caacutec nuacutet vagrave caacutec liecircn kết

IBIS bắt đầu với lựa chọn của một nuacutet vấn đề gốc sau đoacute caacutec nuacutet vị triacute khaacutec nhau được liecircn kết với nuacutet gốc

Caacutec nuacutet vị triacute nagravey sau đoacute được đaacutenh giaacute dựa trecircn những lập luận gắn liền với chuacuteng

Nemawashi (được sử dụng rộng ratildei tại Nhật Bản)

1-Một hoặc nhiều thagravenh viecircn của MDM được chỉ định lagrave điều phối viecircnCaacutec điều phối viecircn sau đoacute chọn người tham gia cograven lại

2-Điều phối viecircn xacircy dựng một tổng hợp caacutec sự lựa chọn vagrave sau đoacute caacutec chuyecircn gia đaacutenh giaacute caacutec lựa chọn

3-Điều phối viecircn lựa chọn một sự lựa chọn dựa trecircn kết quả ở trecircn(ở 2)

4-Sự thay thế được luacircn chuyển điều phối viecircn tigravem kiếm sự đồng thuận thocircng qua sự thuyết phục vagrave đagravem phaacuten

5-Nếu đạt được sự đồng thuận điều phối viecircn cho lưu thocircng một tagravei liệu magrave mỗi thagravenh viecircn MDM để lại dấu hiệu trecircn đoacute

55Nơi lagravem việc ảo

Nhiều tổ chức trecircn toagraven thế giới kinh doanh bất động sản cho cocircng nghệ hợp taacutec

Cocircng việc được trở thagravenh một điều bạn lagravem hơn lagrave một nơi bạn đi

Những thay đổi lớn nhất mang lại bởi nơi lagravem việc ảo coacute thể lagrave về văn hoaacute hay xatilde hội hơn lagrave về cocircng nghệ

Chương 6 Hệ thống thocircng tin điều hagravenh

61 Yacute nghĩa của EIS- Hệ thống thocircng tin điều hagravenh

- EIS lagrave một dạng đặc biệt của DSS được thiết kế để hỗ trợ ra quyết định ở cấp cao nhất của một tổ chức

- Lagrave một hệ thống thocircng tin hỗ trợ nhu cầu lập kế hoạch vagrave đaacutenh giaacute của caacutec nhagrave quản lyacute điều hagravenh

- EIS coacute thể giuacutep một CEO coacute được bức tranh tổng thể chiacutenh xaacutec nhất về caacutec hoạt động vagrave một bản toacutem tắt những gigrave magrave đối thủ cạnh tranh đang lagravem

- Caacutec hệ thống nagravey noacutei chung hoạt động dễ dagraveng vagrave trigravenh bagravey thocircng tin theo những caacutech dễ hiểu để việc tiếp thu được nhanh choacuteng (biểu đồ đồ thịhellip)

(Tagravei liệu thecircm EIS lagrave những loại hệ thống lagrave rất phức tạp trong tự nhiecircn Coacute thể noacutei hệ thống nagravey cũng cung cấp cho caacutec nhagrave quản lyacute với caacutec thiết bị coacute khả năng ra quyết định bằng caacutech sử dụng của noacute Hệ thống nagravey hoạt động trong điều kiện như vậy quan trọng như trong caacutec hệ thống khaacutec khocircng hỗ trợ Khả năng lưu trữ dữ liệu nặng lagravem cho noacute lyacute tưởng để được thocircng qua khocircng chỉ bởi caacutec doanh nghiệp lớn magrave cograven bởi caacutec doanh nghiệp nhỏ hơn Nhigraven chung hệ thống nagravey lagrave dagravenh cho caacutec nhacircn viecircn cấp cao hỗ trợ thagravenh thạo trong việc đưa ra caacutec quyết định quan trọng)

Caacutec phiecircn EIS tiecircu biểu- Phiecircn lagravem việc coacute thể bắt đầu với một baacuteo caacuteo về tigravenh higravenh tagravei chiacutenh vagrave kinh

doanh của một cocircng ty caacutec chỉ số hoạt động quan trọng được hiển thị rotilde ragraveng- EIS sẽ cho pheacutep caacutec giaacutem đốc điều hagravenh coacute thể đi sacircu vagraveo dữ liệu từ những con

số bất kỳ magrave noacute hỗ trợ- Việc điều hagravenh coacute thể lựa chọn một mức độ chi tiết ( VD danh số baacuten hagraveng) nếu

như cần điều tra thecircm- Lagrave một phương phaacutep tiếp cận coacute thể giuacutep việc ra quyết định tốt hơn

Những điều magrave EIS ko coacute- EIS khocircng phải lagrave sự thay thế cho caacutec hệ thống dựa trecircn caacutec maacutey tiacutenh khaacutec EIS

thực sự chỉ cung cấp dữ liệu cho caacutec hệ thống nagravey- Noacute khocircng thể biến caacutec bộ hệ điều hagravenh của maacutey tiacutenh thagravenh những ldquochuyecircn viecircn

giỏirdquo- Coacute thể được viacute một caacutech cao hơn như lagrave một trợ lyacute đaacuteng tin cậy coacute thể được gọi

đến bất khi nagraveo vagrave mỗi khi cần thiết

Tagravei liệu thecircm Sự khaacutec nhau giữa EIS vagrave DSS+ EIS thiết kế để hỗ trợ những người điều hagravenh cấp cao giuacutep họ khaacutem phaacute caacutec vấn đề vagrave caacutec cơ hội DSS hỗ trợ những nười phacircn tiacutech cố gắng trả lời cacircu hỏi caacutei gigrave coacute thể lagravem cugraveng với một cơ hội hoặc một vấn đề

Chiều EIS DSSNhững người sử dụng thocircng thường

Duyệt dữ liệu đi xuống truy xuất trạng thaacutei

Hỗ trợ phacircn tiacutech vagrave quyết định

Sự thuacutec đẩy Tiacutenh thiacutech hợp Tiacutenh hiệu quảỨng dụng Queacutet mocirci trường đaacutenh giaacute

hiệu suất nhận dạng caacutec vấn đề vagrave caacutec cơ hội

Caacutec quyết định quản lyacute trecircn caacutec lĩnh vực đa dạng

Hỗ trợ quyết định Caacutec chiacutenh saacutech caacutec quyết định khocircng coacute cấu truacutec ở mức cao vagrave hỗ trợ giaacuten tiếp

Hỗ trợ caacutec quyết định lặp lại caacutec quyết định khocircng thể đoaacuten trước ra quyết định khocircng coacute cấu truacutec vagrave baacuten cấu truacutec

Loại thocircng tin Caacutec thocircng tin tin tức thocircng tin becircn ngoagravei về khaacutech hagraveng đối thủ cạnh tranh mocirci trường caacutec baacuteo caacuteo theo yecircu cầu vagrave định thời về caacutec hoạt động becircn trong

Caacutec thocircng tin hỗ trợ caacutec tigravenh huống đặc biệt

Sử dụng coacute nguyecircn tắc

Dograve theo vết vagrave điều khiển nhận dạng cơ hội

Hoạch định tổ chức phacircn nhoacutem vagrave điều khiển

Khả năng phugrave hợp với những người sử dụng caacute nhacircn

Thiết kế loại ra quyết định cho mỗi người điều hagravenh caacute nhacircn bằng nhiều lựa chọn đầu ra

Cho pheacutep caacutec đaacutenh giaacute caacute nhacircn caacutec khả năng what-if lựa chọn loại hộp hội thoại

Đồ họa Phải coacute Lagrave một phần quan trọng của nhiều DSS

Thacircn thiện người sử dụng

Phải coacute Phải coacute nếu khocircng coacute người sử dụng trung gian

Xử lyacute thocircng tin Lọc neacuten thocircng tin dograve theo vết dữ liệu vagrave thocircng tin quan trọng

EIS kiacutech thiacutech caacutec cacircu hỏi caacutec cacircu trả lời bằng caacutech sử dụng DSS vagrave phản hồi lại EIS

Hỗ trợ caacutec thocircng tin chi tiết

Truy xuất thường xuyecircn caacutec mức chi tiết của bất kỳ thocircng tin tổng hợp nagraveo (duyệt dữ

Coacute thể coacute trong DSS nhưng khocircng thường

liệu chi tiết)Cơ sở mocirc higravenh Caacutec chức năng coacute sẵn bị hạn

chếLagrave điểm cốt lotildei của DSS

Cấu truacutec Theo người baacuten sản phẩm hoặc theo caacutec chuyecircn gia hệ thống thocircng tin

Theo người sử dụng hoặc caacute nhacircn hoặc caacutec chuyecircn gia từ caacutec trung tacircm thocircng tin hoặc phograveng ban hệ thống thocircng tin

Phần cứng Mainframe caacutec trạm RISC mạng LANs hoặc caacutec hệ thống phacircn bố

Mainframe caacutec trạm RISC caacutec maacutey PC hoặc caacutec hệ thống phacircn bố

Bản chất caacutec goacutei phần mềm

Truy xuất tương taacutec dễ dagraveng đến nhiều cơ sở dữ liệu truy xuất trực tuyến caacutec khả năng DBMS phức tạp caacutec liecircn kết phức tạp

Caacutec khả năng tiacutenh toaacuten lớn caacutec ngocircn ngữ mocirc higravenh mocirc phỏng ứng dụng vagrave caacutec bộ tạo DSS

Bản chất caacutec thocircng tin

Trigravenh bagravey thocircng tin được phaacutet sinh trước về quaacute khứ vagrave hiện tại tạo caacutec thocircng tin mới về quaacute khứ hiện tại tương lai

Tạo thocircng tin mới về quaacute khứ hiện tại tương lai

62 Lịch sử EIS- EIS xuất hiện lần đầu tiecircn tại MIT vagraveo những năm 1970

- Những EIS đầu tiecircn được phaacutet triển bởi caacutec doanh ngiệp lớn sẵn sagraveng chấp nhận rủi ro để đạt được lợi thế cạnh tranh

- Vagraveo những năm 1980 caacutec nhagrave cung cấp đatilde phaacutet triển một số cơ sở khaacutech hagraveng rộng vagrave cocircng nghệ EIS được tiếp tục phaacutet triển cho đến ngagravey nay

(Tagravei liệu thecircm Sử dụng DSSEIS cho phaacutet triển bền vững + Một số nghiecircn cứu đatilde được tiến hagravenh để kiểm tra việc thực hiện của EIS trong khu vực cocircng cộng vagrave chiacutenh phủ caacutec nước tổ chức kể từ khi chuacuteng được phaacutet triển theo định hướng lợi nhuận cho caacutec cocircng ty tư nhacircn (Hasan vagrave Hasan năm 1997) Theo một nghiecircn cứu tiến hagravenh tại Mỹ ở hơn 300 cocircng ty kết quả cho thấy sự khaacutec biệt của EIS giữa tư nhacircn vagrave chiacutenh phủ một số kết quả thuacute vị được phaacutet hiệnViacute dụ khoacute khăn hơn để chuyển tiền từ một tagravei khoản khaacutec trong một EIS của chiacutenh phủ cũng lagrave khoacute khăn hơn để biện giải thiacutech cho những chi phiacute phaacutet triển EIS của chiacutenh phủ Một nghiecircn cứu khaacutec được tiến hagravenh ở Australia

cho thấy rằng EIS cung cấp cho quản lyacute một higravenh ảnh chiacutenh xaacutec hơn về tổ chức thực hiện vagrave cung cấp hỗ trợ cho caacutec lợi iacutech chiến lược cải thiện khocircng chỉ cho caacutec nhagrave quản lyacute nhưng cograven cho phần cograven lại của tổ chức Dựa trecircn caacutec hệ thống được thiết kế cho caacutec cocircng ty tư nhacircn với một caacutech rotilde ragravengxaacutec định mục tiecircu EIS lagrave thiacutech hợp cho caacutec tổ chức cocircng cộng hiện đại nhưng cần phải được linh hoạt hơn vagrave kết thagravenh chugravem một phạm vi rộng hơn khả năng vagrave phương tiện hơn so với khu vực tư nhacircn ban đầu theo định hướng sản phẩm (Hasan vagrave Hasan năm 1997) Điều nagravey coacute thể lagrave do thực tế rằng caacutec hoạt động khu vực cocircng lagrave bắt buộc coacute taacutec động rộng phải đaacutep ứng sự mong đợi duy nhất cocircng cộng thường coacute mục tiecircu mơ hồ vagrave macircu thuẫn iacutet quyền tự chủ vagrave kiểm soaacutet việc ra quyết định vagrave nhacircn viecircn lagrave khoacute khăn hơn (Watson vagrave Carte2000) + Toacutem lại EIS lagrave một khaacutei niệm thagravenh cocircng noacute phaacutet triển qua nhiều năm tuy nhiecircn EIS khắc phục khiếm khuyết của migravenh bằng caacutech tiến hagravenh nghiecircn cứu liecircn tục)

63 Tại sao những người điều hagravenh hagraveng đầu lại khaacutec nhau- Họ lagrave những doanh nghiệp theo định hướng coacute suy nghĩ

- Coacute một khoảng khocircng gian rộng để kiểm soaacutet

- Họ chịu traacutech nhiệm cho việc thiết lập chiacutenh saacutech

- Họ đại diện cho tổ chức mocirci trường becircn ngoagravei

- Hagravenh động của họ tạo ra những kết quả đaacuteng kể về tagravei chiacutenh vagrave con người

Tần số caacutec hoạt động điều hagravenh- Xử lyacute xaacuteo trộn 42

- Hoạt động kinh doanh 32

- Phacircn bổ nguồn lực 17

- Đagravem phaacuten 3

- Những điều khaacutec 6

Handling Disturbances 42

Entrepreneurial Activites 32

Resource Allocation 17

Negotiation 3

Other 6

Những thocircng tin điều hagravenh cần thiết- Quản lyacute xaacuteo trộn coacute thể yecircu cầu sự chuacute yacute xung quanh đồng hồ

- Hoạt động kinh doanh yecircu cầu điều hagravenh để dự đoaacuten những thay đổi trong mocirci trường

- Nhiệm vụ phacircn bổ tagravei nguyecircn yecircu cầu lựa chọn người quản lyacute vagrave caacutec nguồn lực hạn chế được triển khai

- Đagravem phaacuten yecircu cầu cập nhật thocircng tin từng phuacutet để coacute thể xacircy dựng được sự đồng thuận

Caacutec loại thocircng tin điều hagravenh- Hệ thống kế toaacuten coacute liecircn quan đến việc tiacutenh toaacuten thu nhập hoạt động cho caacutec lĩnh

vực cụ thể lagrave quan trọng hơn so với caacutec hệ thống kế toaacuten truyền thocircng- Thocircng tin về thị trường khaacutech hagraveng cung cấp giaacute trị trong việc quyết định chiến

lược- Caacutec thocircng tin cần thiết thường được truyền đi trecircn một số hệ thống maacutey tiacutenh vagrave

nằm trong toagraven tổ chức- Caacutec thocircng tin được sử dụng thường lagrave ngắn hạn vagrave dễ thay đổi

Phương thức để xaacutec định thocircng tin cần thiết

Rockart xaacutec định được năm phương thức cơ bản để xaacutec định thocircng tin cần thiết

- Phương thức dựa trecircn kết quả- Phương thức rỗng- Phương thức chỉ số khoacutea- Phương thức tổng hợp nghiecircn cứu- Phương thức dựa vagraveo nhacircn tố then chốt dẫn đến thagravenh cocircng

64 Thagravenh phần EIS

- Sản phẩm EIS đầu tiecircn được phaacutet triển để sử dụng trecircn maacutey tiacutenh cấu higravenh cao nhưng caacutec sản phẩm hiện nay nhằm mục tiecircu lagrave nền tảng ClientServer

- Những nền tảng linh hoạt hơn coacute thể thiacutech ứng với thay đổi trong tổ chức vagrave cocircng nghệ

- Sử dụng dữ liệu thời gian thực dẫn đến quyết định nhanh hơn nhiều thocircng tin hơn

Thagravenh phần phần cứng- Một EIS khocircng đogravei hỏi coacute phần cứng cụ thể hoặc duy nhất nagraveo- Chigravea khoacutea của vấn đề lagrave để đảm bảo rằng caacutec thagravenh phần của EIS tối ưu hoacutea vagrave

phugrave hợp với tagravei nguyecircn maacutey tiacutenh của tổ chức- Hệ thống nagravey phải được cấu higravenh để caacutec nguồn tagravei nguyecircn phugrave hợp với những

người điều hagravenh chuacuteng

Thagravenh phần phần mềm- Traacutei ngược với phần cứng phần mềm thường được chuyecircn mocircn hoacutea cao cho caacutec

bagravei toaacuten về miền- Sự chuyecircn mocircn hoacutea nagravey thường đạt được bằng caacutech sử dụng thagravenh phần off-the-

shelf cho toagraven bộ EIS vagrave caacutec mocirc-đun tugravey chỉnh để đaacutep ứng nhu cầu cụ thể- Lotus Notes lagrave một viacute dụ điển higravenh Noacute coacute thể được sử dụng một migravenh hoặc coacute

thể phục vụ becircn thứ ba mocirc-đun plug-in

Cocircng nghệ EIS hiện nay

Dobrzeniecki đề xuấtphacircn loạitừng cấptheo bachức năng- Loại 1 sản phẩm bao gồmmột bộ đầy đủcaacutec ứng dụngtừ mộtnhagrave cung cấp- Loại 2 sản phẩm đượcthựchiệnở phần đầu củacaacutecsản phẩmDSS đượcphaacutet triển

bởicugravengmộtnhagrave cung cấp- Loại 3 sản phẩmkết hợp với nhautheo bất kỳ số lượngthuộc sở hữu củacocircng ty

65 Xacircy dựng EIS

- Xacircy dựngmộtEISgiống nhưxacircydựngmột số hệ thống khaacutec củamocirc higravenh hệ thống thocircng tin

- Việcphaacutet triểncấu truacutecnecircn được theo dotildeitừ quaacute trigravenh thiết kế đến quaacute trigravenhthực hiện

- Tuy nhiecircn một dự aacuten phaacutet triển EIScoacute xu hướnglagrave thống nhấtvagraveyecircu cầu hỗ trợ caacutec nhagrave quản lyacute latildenh đạo

- Xacircy dựng một EIScoacute thểphaacutet hiện ra đượccaacutectigravenh huống khoacute khănmagravemột nhagrave phaacutet triển chưabao giờ gặp phải

Mocirc higravenh EIS

Khung phaacutet triển một EIS

- Watson et al đề nghị xacircy dựngkhung với ba thagravenh phần+ Caacutech tiếp cận tập trung vagraveo yếu tốcon người vagrave dữ liệu coacute liecircn quan đến EIS+ Quaacute trigravenh phaacutet triển cần sự linh hoạt vagrave tương taacutec+ Người sử dụng - hệ thống hộp thoại bao gồm một ngocircn ngữ hagravenh động để xử lyacute caacutec lệnh

Lợi iacutech của EIS- Dễ duy trigrave caacutec mục tiecircu coacute tổ chức- Dễ truy xuất thocircng tin- Cho pheacutep người sử dụng nacircng cao hiệu suất hơn

- Tăng chất lượng ra quyết định- Cung cấp sự cải tiến cạnh tranh- Tiết kiệm thời gian của người sử dụng- Tăng khả năng vagrave chất lượng giao tiếp- Cung cấp khả năng điều khiển tốt hơn trong tổ chức- Cho pheacutep tham gia caacutec vấn đề vagrave caacutec cơ hội- Cho pheacutep hoạch định- Cho pheacutep tigravem kiếm nguyecircn nhacircn của một vấn đề- Thảo matilden caacutec yecircu cầu của người điều hagravenh

Hạn chế của EIS vagrave 1 số sai lầm cần traacutenh

- Chi phiacute một cuộc khảo saacutetnăm1991 chothấychi phiacute phaacutet triểntrungbigravenh365000USDvớichi phiacute vận hagravenhhagraveng năm lagrave$200000 (EIS)

- Cocircng nghệ hạn chếEIScần phảiđượctiacutech hợp hoagraven toagravenvagraveokiếntruacuteccủadoanh nghiệphiện tại do đoacute noacutelagrave một thaacutech thứclớn đối vớithiết kế

- Hạn chế tổ chức cơ cấu tổ chứccoacute thể khocircng phugrave hợp

Sự hạn chế về tổ chức- Chương trigravenh nghị sự vagrave thời gian chệch EIS mocirc tả một phần việc thực hiện một

chương trigravenh nghị sự vagrave coacute thể dễ dagraveng đạt được sự tin cậy một caacutech chắc chắn- Đồng bộ hoacutea việc quản lyacute sự tin cậy đuacuteng luacutec đặc biệt baacuteo caacuteo EIS coacute thể phaacute

vỡ sự ổn định thiết lập caacutec chu trigravenh baacuteo caacuteo một caacutech tốt nhất- Sự bất ổn EIS phản ứng nhanh coacute thể gacircy ra việc taacutec động trở lại một caacutech

nhanh choacuteng dẫn đến sự thiếu ổn định trong tổ chức

Sự thất bại lagrave thay thế khocircng thể chấp nhận được- Một số yếu tố lagravem EIS thất bại

+ Thiếu sự hỗ trợ về mặt quản lyacute+ Vấn đề chiacutenh trị+ Thất bại của nhagrave phaacutet triển+ Lỗi về cocircng nghệ+ Giaacute cả+ Thời gian

66 Ra quyết định điều hagravenh trong tương lai vagrave EIS

- Coacute một vagravei điều kiện sẽ được hợp nhất cho việc chuyển đổi cocircng nghệ Trong đoacute một vagravei điều kiện coacute thể dễ dự đoaacuten Hai điều kiện magrave ta coacute thể thấy lagrave+ Phaacutet triển cocircng nghệ maacutey tiacutenh trong việc điều hagravenh sẽ tạo ra sự chuyển đổi được chấp nhận một caacutech dễ dagraveng hơn+ Mở rộng traacutech nhiệm điều hagravenh sẽ mở rộng nhu cầu thocircng tin

Tương lai của EIS- EIS thocircng minh Những tiến bộ trong cocircng nghệ AI sẽ được triển khai trong caacutec

EIS- EIS đa phương tiện Cơ sở dữ liệu đa phương tiện sẽ cho pheacutep tiacutech hợp văn bản

giọng noacutei vagrave higravenh ảnh trong tương lai- EIS thocircng tin Tương lai EIS sẽ mở rộng hơn trong việc sử dụng dữ liệu becircn

ngoagravei doanh nghiệp- EIS kết nối Giao tiếp với băng thocircng rộng cho pheacutep kết nối liecircn thocircng lớn hơn

Chương 7 HỆ CHUYEcircN GIA VAgrave TRIacute TUỆ NHAcircN TẠO

71 Caacutec khaacutei niệm

72 Triacute thocircng minh của triacute tuệ nhacircn tạo

73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia

74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia

75 Lợi iacutech vagrave hạn chế của hệ chuyecircn gia

71 Caacutec khaacutei niệm

Chuyecircn mocircn (Expertise) sự hiểu biết rộng trong 1 lĩnh vực hẹp

Hệ chuyecircn gia (Expert Systems)1 chương trigravenh maacutey tiacutenh sử dụng 1 tập caacutec luật dựa trecircn tri thức của con người để giải quyết caacutec vấn đề đogravei hogravei phải coacute sự chuyecircn mocircn

Một số hệ chuyecircn gia nổi tiếng

DENDRAL (Standford 1960s Edward Feigenbaum)

MYCIN (Standford1970s Edward Shortliffe)

PROSPECTOR (MIT 1979)

Triacute tuệ nhacircn tạo (Artificial Intelligence ndash AI)

Triacute tuệ nhacircn tạo một bộ phacircn của ngagravenh khoa học maacutey tiacutenh quan tacircm đến việc thiết kế caacutec hệ thống maacutey tiacutenh thocircng minh đoacute lagrave caacutec hệ thống đưa ra caacutec đặc điểm magrave từ đoacute chuacuteng ta liecircn hệ với sự thocircng minh trong hagravenh động của con người (Barr vagrave Feigenbaum 1981)

Mục điacutech của AI

Mục điacutech khoa học xaacutec định caacutec gợi yacute để giải thiacutech caacutec loại khaacutec nhau của triacute tuệ thực

Mục điacutech kỹ thuật giải quyết caacutec vấn đề trong thế giới thực

Triacute tuệ nhacircn tạo kế thừa nhiều yacute tưởng quan điểm kỹ thuật từ caacutec ngagravenh khoa học khaacutec

- Triết học

- Logic Toaacuten học

- Tiacutenh toaacuten

- Khoa học tacircm lyacute Khoa học nhận thức

- Sinh học Thần kinh học

- Tiến hoacutea

Caacutec lĩnh vực ứng dụng trong Triacute tuệ nhacircn tạo

Mạng nơ ron thần kinh (Neural Networks)

Tiacutenh toaacuten sự tiến hoacutea

(Evolutionary Computation)

Hệ chuyecircn gia (Expert Systems)

Kỹ thuật xử lyacute tiếng noacutei (Speech Processing)

Kỹ thuật xử lyacute ngocircn ngữ tự nhiecircn

(Natural Language Processing)

Lập kế hoạch (Planning)

Robot (Robotics)

Khoa học higravenh ảnh (Vision)

Caacutec kỹ thuật thocircng dụng dugraveng trong AI

Biểu diễn(Representation)

Học (Learning)

Caacutec luật (Rules)

Tigravem kiếm (Search)

72 Triacute thocircng minh của triacute tuệ nhacircn tạo

Con người suy diễn như thế nagraveo

Phacircn loại (Categorization)

Caacutec quy tắc cụ thể

Heuristics

Kinh nghiệm trước đoacute

Dự tiacutenh trước

Maacutey tiacutenh suy diễn như thế nagraveo

Lập luận dựa trecircn luật IF-THEN mocirc tả tri thức được matilde hoacutea dưới dạng caacutec luật

Caacutec khung (Frames) lagrave caacutec đại diện mocirc tả caacutec tigravenh huống giống nhau lagrave điển higravenh của một vagravei phacircn loại

Lập luận dựa trecircn caacutec trường hợp mocirc phỏng giải phaacutep trước đoacute cho một vấn đề hiện tại

Nhận dạng mẫu phaacutet hiện acircm thanh higravenh dạng hoặc caacutec chuỗi dagravei

Caacutec dạng khaacutec của Triacute tuệ nhacircn tạo

Học maacutey- mạng nơron vagrave giải thuật di truyền

Lập trigravenh tự động ndash lagrave những kỹ thuật tạo ra caacutec chương trigravenh để lagravem 1 nhiệm vụ riecircng biệt (cho pheacutep những người khocircng phải lagrave người lập trigravenh coacute thể lập trigravenh được)

Cuộc sống nhacircn tạo ndash nỗ lực để taacutei tạo caacutec hiện tượng sinh học trong caacutec hệ thống dựa trecircn maacutey tiacutenh

73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia(Expert Systems- ES)

Theo Jackson (1999) Một hệ chuyecircn gia lagrave một chương trigravenh maacutey tiacutenh mocirc tả vagrave suy diễn với tri thức của một vagravei lĩnh vực để giải quyết vấn đề hay đưa ra caacutec lời khuyecircn

Cấu truacutec cơ bản của ES được dựa theo cấu truacutec chung của DSS Sự khaacutec biệt chiacutenh giữa ES vagraveDSS lagrave hệ ES thu thập caacutec kiến thức từ những

chuyecircn gia trong lĩnh vực quan tacircmĐặc trưng của hệ chuyecircn gia Hiệu quả cao Thời gian trả lời thỏa đaacuteng Độ tin cậy cao Dễ hiểu

Giao diện người dugraveng trong ES

Thiết kế giao diện người dugraveng tập trung vagraveo caacutec yếu tố như dễ dagraveng sử dụngcoacute độ tin cậy cao giảm tải những khoacute khăn khi sử dụng

Thiết kế necircn coacute một số tương taacutec (đầu vagraveo kiểm soaacutet vagrave truy vấn)

Cấu tạo giao diện người dugraveng gồm coacute magraven higravenh cảm ứng bagraven phiacutem buacutet saacuteng lệnh thoại caacutec phiacutem chuyecircn dụng

Cơ sở tri thức (Knowledge Base)

Chứa đựng caacutec tri thức cụ thể miền thu được từ caacutec chuyecircn gia miền

Coacute thể chứa caacutec mocirc tả caacutec hagravenh vi giải quyết vấn đề caacutec ragraveng buộc caacutec heuristics

Thagravenh cocircng của một ES dựa trecircn tiacutenh đầy đủ vagrave tiacutenh chiacutenh xaacutec của cơ sở tri thức

Mocirc tơ suy diễn (Inference Engine)

Ở đacircy tri thức được đặt để sử dụng tạo ra caacutec giải phaacutep để giải quyết vấn đề

Mocirc tơ nagravey coacute khả năng thực hiện diễn dịch hoặc suy diễn dựa trecircn caacutec luật hay caacutec caacutec sự kiện

Đồng thời cũng coacute khả năng sử dụng caacutec suy diễn mờ hay khocircng chiacutenh xaacutec dựa trecircn xaacutec suất hay aacutenh xạ mẫu

Vograveng điều khiển suy diễn

1 Aacutenh xạ caacutec luật với caacutec sự kiện đatilde được cho

2 Chọn luật để thực hiện

3 Thực hiện luật bằng caacutech thecircm caacutec sự kiện được suy diễn ra vagraveo bộ nhớ lagravem việc

Chuỗi suy diễn (Chaining)

Suy diễn tiến (forward chaining) maacutey suy diễn bắt đầu từ dữ liệu ban đầu vagrave thực hiện việc suy luận để đưa ra caacutec kết luận cuối cugraveng

Suy diễn lugravei (backward chaining) maacutey suy diễn bắt đầu từ dữ liệu điacutech vagrave tigravem ra tri thức hỗ trợ cho dữ liệu điacutech đoacute

Viacute dụ suy diễn lugravei

R1 Nếu coacute A vagrave B thigrave suy ra coacute D

R2 Nếu coacute B thigrave suy ra coacute C

R3 Nếu coacute C vagrave D thigrave suy ra coacute E

Ta coacute E ta xem trong 3 luật R1 R2 R3 luật nagraveo coacute E ta thấy R3 chứa E đồng thời chứa C vagrave D Xeacutet tiếp trong 2 luật R1 R2 luật nagraveo chứa C vagrave D R2 chứa C R3 chứa D Từ đoacute ta coacute được caacutec tri thức hỗ trợ suy diễn vagrave kết luận lagrave nếu coacute A vagrave B thigrave sẽ coacute E Hay nếu A vagrave B đuacuteng thigrave sẽ coacute E

Viacute dụ suy diễn tiến

Giả sử coacute tập chứa 3 luật sau

R1 Nếu coacute A vagrave B thigrave suy ra coacute D

R2 Nếu coacute B thigrave suy ra coacute C

R3 Nếu coacute C vagrave D thigrave suy ra coacute E

Nếu ta coacute A vagrave B thigrave chuacuteng ta suy ra được D từ R1 vagrave suy ra C từ R2 Với D vagrave C đatilde được suy ra ở trecircn giờ chuacuteng ta suy ra được E từ R3

Viacute dụ thực tế

Giả sử muốn biết magraveu của một con vật nuocirci tecircn lagrave Fred biết rằng noacute kecircu ộp ộp vagrave ăn ruồi

Coacute tập 4 luật ban đầu như sau

R1 Nếu X kecircu ộp ộp vagrave ăn ruồi thigrave X lagrave con ếch

R2 Nếu X kecircu chiecircm chiếp vagrave biết hoacutet thigrave X lagrave con chim

R3 Nếu X lagrave con ếch thigrave X coacute magraveu xanh

R4 Nếu X lagrave con chim thigrave X coacute magraveu vagraveng

74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia

Expert system shells lagrave một tập caacutec goacutei phần mềm vagrave caacutec cocircng cụ dugraveng để phaacutet triển caacutec hệ chuyecircn gia

Những Expert system shells đầu tiecircn thường rất rườm ragrave Mặc dugrave vậy noacute vẫn giuacutep cho người sử dụng sẽ khocircng phải bắt đầu lại từ đầu khi xacircy dựng một hệ chuyecircn gia mới

Những shell hiện đại bao gồm hai mocirc-đun chiacutenh lagrave cocircng cụ xacircy dựng một tập quy tắc vagrave mocirc tơ suy diễn

Xacircy dựng hệ chuyecircn gia

Bước 1 xacircy dựng mocirc higravenh bagravei toaacuten xaacutec định vấn đề nhiệm vụ magrave hệ thống sẽ thực hiện Caacutec dạng bagravei toaacuten cần hệ chuyecircn gia

Bagravei toaacuten diễn giải (InterPretation)

Bagravei toaacuten dự baacuteo (Prediction)

Bagravei toaacuten chuẩn đoaacuten (Diagnose)

Bagravei toaacuten gỡ rối (Debugging)

Bagravei toaacuten thiết kế

Tương tự như một dự aacuten phần mềm để xacircy dựng một hệ chuyecircn gia cần phải coacute caacutec yếu tố về nhacircn lực tagravei nguyecircn vagrave thời gian Những yếu tố nagravey ảnh hưởng đến giaacute thah của một hệ chuyecircn giaTrong phần nagravey cacircu hỏi thường được đặt ra lagrave tại sao cần phải xacircy dựng một hệ chuyecircn giaTrước khi bắt đầu phải xaacute định rotilde bagravei toaacuten đạt ra lagrave jiAi lagrave chuyecircn giaAi lagrave người sử dụng

1 Diễn giải (InterPretation) Nghiecircn cứu 1 vấn đề -gt Dựa trecircn những biểu hiện thuộc tiacutenh đặc trưng becircn ngoagravei -gt Tư vấn

(hoặc đưa ra kết luận hay mocirc tả dễ hiểu từ tập dữ liệu thocirc)

2 Bagravei toaacuten dự baacuteo (Prediction) Coacute thể dự đoaacuten được hagravenh vi kết quả dựa trecircn caacutec hiện tượng -gt dự baacuteo

VD Dự baacuteo thời tiết động đấthellip

3 Bagravei toaacuten chẩn đoaacuten (Diagnoss) Xaacutec định caacutec lỗi caacutec bộ phận hỏng hoacutec của hệ thống dựa trecircn caacutec dữ liệu quan saacutet được

4 Bagravei toaacuten gỡ rối (Debugging) Mocirc tả caacutec phương phaacutep khắc phục hệ thống khi gặp sự cố

5 Bagravei toaacuten thiết kế Lựa chọn cấu higravenh caacutec đối tượng nhằm thoả matilden một số ragraveng buộc nagraveo đoacute

6 Giảng dạy Phần mềm dạy học coacute thể chuẩn đoaacuten vagrave sủa lỗi của học sinh trong quaacute trigravenh học tập

Để xaacutec định đuacuteng bagravei toaacuten magrave chuacuteng ta cần giải quyết thigrave phải trả lời đc một số cacircu hỏi

- cần hệ chuyecircn gia

Bước 2 thu thập tri thức lựa chọn cocircng cụ vagrave aacutep dụng

Trong bước thu thập tri thức vấn đề quan trọng lagrave lựa chọn chuyecircn gia những người magrave sẽ đoacuteng goacutep tri thức cho hệ thống Thocircng thường trong suốt quaacute trigravenh phaacutet triển thigrave chuyecircn gia được xem như một thagravenh viecircn của đội phaacutet triển

Hiện nay coacute rất nhiều cocircng cụ để xacircy dựng một hệ chuyecircn gia Phổ biến nhất lagrave JESS CLIPS vagrave OPS5

Bước 3 Thiết kế cơ sở tri thức thiết kế hệ thốngTri thức được biểu diễn trường minh trong cơ sở tri thức

Caacutec chuyecircn gia vagrave kỹ sư tri thức sẽ đối thoại với nhau bằng caacutec kỹ thuật đối thoại Suy diễn (SD) bảng Mocirc higravenh hoacutea SD quy nạp phacircn loại

Vấn đề bagraveo trigrave vagrave phaacutet triển

Caacutec hệ chuyecircn gia đogravei hỏi phải bảo trigrave vagrave phaacutet triển nhiều hơn so với caacutec hệ thống khaacutec Phải thường xuyecircn bổ sung tri thức mới vagrave thay đổi caacutec tri thức cũ để đổi mới hệ chuyecircn gia

Thu thập vagrave khắc phục lỗi do người sử dụng phaacutet hiện để kịp thời khắc phục những sai soacutet của hệ chuyecircn gia

75 Lợi iacutech vagrave hạn chế của caacutec hệ chuyecircn gia

Một số lợi iacutech chiacutenh

Thời gian trả lời hợp lyacute bằng hoặc nhanh hơn so với chuyecircn gia (người) để đi đến cugraveng một quyết định Hệ chuyecircn gia lagrave một hệ thống thời gian thực (real time system)

Khả năng trả lời với mức độ tinh thocircng bằng hoặc cao hơn so với chuyecircn gia (người) trong cugraveng lĩnh vực

Hệ chuyecircn gia giuacutep cho hiệu quả lagravem việc tăng bằng việc sử dụng tập caacutec luật một caacutech nhanh choacuteng magrave ko bị nhầm lẫn chuyecircn gia lagrave người coacute thể quecircn đi một số tri thức cơ sở lyacute luậ nhưng HCG thigrave ko

Quyết định của một người chuyecircn gia coacute thể bị thay đổi vagrave ko coacute tiacutenh thống nhất như quyết định của một hệ chuyecircn gia tạo ra

Hệ chuyecircn gia giuacutep cho người sử dụng coacute thể trau dồi sự hiểu biết trecircn lĩnh vuej cụ thể magrave noacute giải quyết hỗ trợ người ra quyết định coacute trigravenh độ như 1 chuyecircn gia trong quaacute trigravenh gia quyết định

Kiến thức của rất nhiều chuyecircn gia về một lĩnh vực nagraveo đoacute được đưa vagraveo hệ chuyecircn gia lagravem cho CSTT cuat HCG phong phuacute vagrave rộng lớn hơn rất nhiều

HCG giải thiacutech caacutec bước suy luận một caacutech dễ hiểu nhất quaacuten luacutec nagraveo cũng coacute thể sử dụng ko như chuyecircn gia con người

Hạn chế của caacutec hệ chuyecircn gia

Nhược điểm lớn nhất của hệ chuyecircn gia lagrave những yacute kiến chuyecircn mocircn thường rất khoacute matilde hoacutea vagrave giải neacuten

Hệ chuyecircn gia khocircng coacute khả năng tự học tự cập nhật kiến thức mới như caacutec chuyecircn gia magrave cần phải được matilde hoacutea lại khi noacute được cập nhật

Hệ chuyecircn gia khocircng thể nhận ra được vấn đề khocircng nằm trong miền kiến thức của hệ thống

Chương 8 Tri thức vagrave tiếp nhận

1 Bao gồm caacutec vấn đề

Dữ liệu thực tế đo lường hoặc quan saacutet coacute hoặc khocircng coacute bối cảnh

Thocircng tin dữ liệu được tổng hợp một caacutech hữu iacutech để giải quyết những khoacute khăn trong việc đưa ra quyết định

Tri thức bao gồm caacutec ứng dụng quy tắc thocircng tin hướng dẫn của người ra quyết định

2 Những caacutei nhigraven về tri thức

Đại diện lagravem thế nagraveo để diễn tả tri thức viacute dụ như một quyển saacutech khocircng phải lagrave tri thức nhưng noacute lại lagrave một đại diện của tri thức

Sản xuất tri thức lagrave một tập hơp của hagraveng tồn kho coacute thể được sản xuất cũng như mua lại

Tri thức lagrave 1 trong 6 trạng thaacutei của hệ thống

1Dữ liệu 2Thocircng tin 3Cấu truacutec thocircng tin 4Sự thấu hiểu 5Yacute kiến 6 Quyết định

3 Caacutec loại tri thức Phổ biến mocirc tả dữ liệu thocircng tin thủ tục mọi thứ lagravem như thế nagraveo lập luận chiacutenh saacutech hoặc caacutec quy tắc

4 Thu thập Tri thức hệ chuyecircn gia Hầu hết caacutec phương phaacutep đều bắt đầu với mocirc higravenh của caacutec taacutec vụ trong đoacute

hệ chuyecircn gia được xacircy dựng Trong đoacute mocirc tả về caacutec lĩnh vực được tạo ra Caacutec kỹ sư sử dụng caacutec mocirc higravenh giả thuyết vagrave nhận thức về quaacute trigravenh phacircn

tiacutech để gợi ra caacutech giải quyết vấn đề về tri thức từ caacutec chuyecircn gia

5 Caacutec chiều của thu thập tri thức KE- driven caacutec kỹ sư trao đổi trực tiếp với caacutec chuyecircn gia Expert-driven Caacutec chuyecircn gia trực tiếp đưa chuyecircn mocircn của họ vagraveo hệ

thống maacutey tiacutenh Machine-driven Sử dụng caacutec cocircng cụ suy luận để triacutech xuất tri thức từ một

tập caacutec viacute dụ

6 Kỹ thuật thu thập tri thức Trao đổi gồm 2 loại cơ bản lagrave coacute cấu truacutec(coacute kịch bản) vagrave khocircng coacute cấu

truacutec( đối thoại trực tiếp) Giao thức phacircn tiacutech bằng lời Khi caacutec chuyecircn gia thực hiện một cocircng việc

của họ thigrave một bản ghi về cocircng việc đoacute được thực hiện Caacutec kỹ sư sẽ xacircy dựng mocirc higravenh cho những gigrave được ghi lại trong bản ghi

Phương phaacutep sagraveng lọc caacutec chuyecircn gia so saacutenh caacutec nhoacutem liecircn tiếp trong ba đối tượng vagrave cho biết tại sao nhoacutem thứ hai lại khaacutec nhoacutem thứ ba

7 Thu thập tri thức từ nhiều nguồn Thu thập tri thức từ nhiều nguồn lagrave cần thiết để coacute được đầy đủ caacutec tri thức

cho một vấn đề quan điểm yacute kiến traacutei ngược nhau thường phaacutet sinh Phương phaacutep đồng thuận sẽ giuacutep giải quyết được vấn đề macircu thuẫn Kỹ thuật phacircn tiacutech Meta lagrave kỹ thuật được aacutep dụng trong caacutec trường hợp

khaacutec Caacutech tiếp cận bằng định lượng đogravei hỏi caacutec kỹ sư cần cacircn nhắc yếu tố đầu vagraveo của caacutec chuyecircn gia khaacutec nhau

8 Xaacutec nhận hợp lệ vagrave kiểm tra tri thức Một khi thu thập tri thức noacute phải được đaacutenh giaacute về khả năng sử dụng vagrave độ

chiacutenh xaacutec Hai vấn đề cụ thể lagrave hiệu lực của những kiến thức vagrave kiểm tra việc xacircy dựng cơ sở của tri thức

Cần xaacutec nhận xem liệu hệ thống coacute thể hoạt động ở mức độ tối thiểu khocircng

Xaacutec minh liecircn quan đến việc so saacutenh từng chi tiết kỹ thuật của hệ thống những gigrave đatilde được thực hiện cuối cugraveng

9 Một số caacutec biện phaacutep xaacutec nhận Độ chiacutenh xaacutec Khả năng thiacutech nghi Mức độ đầy đủ Bề rộng Độ sacircu Hiệu lực Tổng quan Chiacutenh xaacutec Hiện thực Độ tin cậy Tiacutenh hữu dụng Mức độ

Chương 9 Học maacutey

1 Logic mờ vagrave ngocircn ngữ mờ(Fuzzy Logic and Linguistic Ambiguity)

Ngocircn ngữ tự nhiecircn gồm những khaacutei niệm mơ hồ vagrave khocircng chiacutenh xaacutectruyền tải ngữ nghĩa thocircng qua tiacutenh xấp xỉkhocircng rotilde ragraveng

Những xấp xỉ nagravey giuacutep con người coacute thể truyền tải hết được yacute nghĩa nhưng maacutey thigrave khocircng hiểu

Lagravem sao biểu diễn caacutec tri thức sử dụng caacutec khaacutei niệm khocircng rotilde ragraveng(mờ) hoặc khocircng chiacutenh xaacutec

2 Khaacutei niệm cơ bản của logic mờ tập mờ lagrave những tập hợp khocircng coacute một giới hạn rotilde Mỗi phần tử của noacute chỉ

chứa một mức độ hagravem liecircn thuộc của từng phần tử Vigrave vậy tập mờ khocircng giống như tập cổ điển Tập mờ coacute thể kết hợp với nhau qua những luật mờ magrave đặc trưng cho những hagravenh động trạng thaacutei vagrave thuộc tiacutenh của logic mờ được tận dụng khi thực hiện một bộ điều khiển mờ

Logic mờ dựa trecircn yacute tưởng mỗi phần tử thuộc vagraveo một tập hợp ở một mức độ nagraveo đấy

Locircgic mờ cho pheacutep độ liecircn thuộc (microA )coacute giaacute trị trong khoảng (01) Locircgic mờ coacute thể được coi lagrave mặt ứng dụng của lyacute thuyết tập mờ để xử lyacute caacutec

giaacute trị trong thế giới thực cho caacutec bagravei toaacuten phức tạp

3 So saacutenh tiacutenh đuacuteng đắn logic mờ vagrave xaacutec suất Xaacutec suất thigrave đề cập đến khả năng xảy ra một biến cố hay một điều gigrave đoacute Logic mờ đề cập đến cấp độ magrave đặc tiacutenh ở hiện tại

o viacute dụ1 người coacute chiều cao 6 feet thigrave coacute cấp độ lagrave 05 về chiều cao

4 Ưu điểm của logic mờ Caacutech tiếp cận rất tự nhiecircnkhocircng phức tạp Coacute thể mocirc higravenh hoacutea caacutec hagravem phi tuyến tugravey yacute phức tạp

Coacute thể tận dụng được kinh nghiệm từ những chuyecircn gia hagraveng đầu trong mọi lĩnh vực

Logic mờ được xacircy dựng dựa trecircn ngocircn ngữ tự nhiecircnNền tảng của logic mờ lagrave dựa trecircn cơ sở giao tiếp của con người

5 Nhược điểm của logic mờ Trong 1 hệ thống phức tạpsử dụng logic mờ coacute thể trở thagravenh trở ngại cho

việc xaacutec thực độ tin cậy của hệ thống Cơ chế lập luận mờ khocircng thể học hỏi từ những lỗi sai

6 Mạng noron nhacircn tạo(ANN) Mạng noron nhacircn tạo lagrave một mocirc phỏng xử lyacute thocircng tinđược nghiecircn cứu ra

từ hệ thống thần kinh của sinh vậtgiống như bộ natildeo để xử lyacute thocircng tin ANNs lagrave chương trigravenh dựa trecircn maacutey tiacutenh đơn giản coacute chức năng lagrave một mocirc

higravenh bagravei toaacuten khocircng gian dựa trecircn thử nghiệm vagrave baacuteo lỗi

7 Học từ kinh nghiệm Tiến trigravenh Một mẫu dữ liệu được biểu diễn như một mạng lưới noronANN ldquodự

đoaacutenrdquo 1 đầu radự đoaacuten được so saacutenh với giaacute trị thực tế hoặc giaacute trị chiacutenh xaacutecNếu đoaacuten được chiacutenh xaacutec thigrave khocircng coacute hagravenh động nagraveo được thực hiện

Nếu dự đoaacuten sai ANN kiểm tra lại vagrave xaacutec định lại thocircng số để điều chỉnh Một mẫu dữ liệu khaacutec được biểu diễn vagrave quaacute trigravenh nagravey được lặp lại

8 Nguyecircn tắc cơ bản của cocircng nghệ nơron Caacutec yếu tố xử lyacute cơ bản trong hệ thống thần kinh của con người lagrave tế bagraveo

thần kinhMạng lưới của tế bagraveo nagravey lagrave liecircn kết với nhau nhận được thocircng tin từ caacutec cảm biến trong mắt taihellip

Thocircng tin nhận được bởi tế bagraveo thần kinh hoặc lagrave sẽ kiacutech thiacutech noacute(sẽ được chuyển qua 1 thocircng điệp dọc theo mạng lưới) hoặc lagrave sẽ ngăn cản noacute(ngăn cản dograveng thocircng tin)

Độ nhạy coacute thể thay đổi qua thời gian hoặc sau khi coacute được kinh nghiệm

9 Cấu truacutec mạng Một ANN gồm 3 lớp cơ bản

Lớp đầu vagraveo nhận dữ liệu Lớp becircn trong hoặc lagrave lớp ẩn xử lyacute dữ liệu Lớp đầu ra chuyển tiếp kết quả cuối cugraveng của mạng

10Mạng nơ ron Thường coacute nhiều đầu vagraveo mỗi đầu vagraveo với mức ảnh hưởng vagrave tầm quan

trọng riecircng của noacute Một đầu vagraveo quan trọng coacute thể được sử dụng để khuếch đại đầu ra caacutec hagravem trạng thaacutei tổng hợp caacutec trọng số của caacutec yếu tố

đầuvagraveo khaacutec nhauvagraveo một giaacute trị duy nhất Caacutec hagravem chuyển giao xử lyacute caacutec giaacute trị trạng thaacutei vagrave tạo đầu ra

11Huấn luyện mạng nơ ron Trong mocirc higravenh coacute giaacutem saacutetANN được đến so saacutenh dự đoaacuten của chiacutenh

noacute với thocircng tin phản hồi coacute chứa caacutec kết quả mong muốn ANN sẽ phải tigravem caacutech thay đổi caacutec tham số becircn trong củamigravenh (caacutec trọng số vagrave caacutec ngưỡng) để tạo necircn một aacutenh xạ coacute khả năng aacutenh xạcaacutec đầu vagraveo thagravenh caacutec đầu ra mong muốn Sự thay đổi nagravey được tiến hagravenh nhờ việc so saacutenh giữa đầu ra thực sự vagrave đầu ra mong muốn

Trong mocirc higravenh khocircng coacute giaacutem saacutetANN nhận được dữ liệu vagraveo nhưng khocircng phải coacute bất kỳ thocircng tin phản hồi về kết quả mong muốn

Phần lớn caacutec ứng dụng nằm trong vugraveng của caacutec bagravei toaacuten ước lượng như mocirc higravenh hoacuteathống kecirc neacuten lọc phacircn cụm

12Lợi iacutech Liecircn kết với mạng noron Traacutenh caacutech lập trigravenh tường minh Giảm nhu cầu của chuyecircn gia ANNs thigrave thiacutech nghi với caacutec yếu tố đầu vagraveo thay đổi Khocircng cần thiết cho cơ sở tri thức tinh chế ANNs coacute tiacutenh động vagrave cải thiện với việc sử dụng Coacute khả năng xử lyacute dữ liệu khocircng chiacutenh xaacutec hoặc khocircng đầy đủ Cho pheacutep tổng quaacutet hoacutea từ thocircng tin cụ thể Cho pheacutep thu thập cảm giaacutec thocircng thường vagraveo miền giải quyết vấn đề

13Hạn chế của việc liecircn kết với mạng noron ANNs khocircng thể giải thiacutech được suy luận Bản chất hộp đen thường khiến cho vấn đề traacutech nhiệm vagrave độ tin cậy phaacutet

sinh lagrave khoacute khăn Lặp đi lặp lại quaacute trigravenh huấn luyện rất tốn thời gian Nguồn lực caacutec nhagrave phacircn tiacutech vagrave thiết kế coacute tay nghề cao vẫn lagrave đaacuteng lo

ngại Cocircng nghệ ANN thuacutec đẩy hạn chế của phần cứng hiện tại ANN yecircu cầu phải coacute sự tin tưởng ở đầu ra

14Giới thiệu về thuật toaacuten di truyền Cũng như mạng lưới thần kinh caacutec thuật toaacuten di truyền được dựa trecircn lyacute

thuyết sinh học Thuật toaacuten di truyền tigravem thấy nguồn gốc của chuacuteng trong caacutec lyacute thuyết

tiến hoacutea của chọn lọc tự nhiecircn vagrave thiacutech ứng với biến đổi khiacute hậu Kết quả thuật toaacuten di truyền lagrave từ giao phối 2 caacute thể trong quần thế để tạo

ra con caacutei đocirci khi tốt hơn so với bậc cha mẹ của chuacuteng 15Caacutec thagravenh phần cơ bản của thuật toaacuten di truyền

Toaacuten tử chọn lọc Caacutec caacute thể tốt được chọn lọc để đưa vagraveo thế hệ sau Sự chọn lọc nagravey căn cứ vagraveo độ thiacutech nghi với mocirci trường của mỗi caacute thể

Toaacuten tử lai gheacutep (crossover) Hai caacute thể cha vagrave mẹ trao đổi caacutec gen với nhau để tạo ra caacute thể con

Toaacuten tử đột biến (mutation) Một caacute thể thay đổi một số gen để biến đổi thagravenh một caacute thể mớiTất cả caacutec toaacuten tử trecircn khi thực hiện đều mang tiacutenh ngẫu nhiecircn

16Quaacute trigravenh cơ bản của một thuật toaacuten di truyền Khởi tạo

Đaacutenh giaacute quần thể

Lựa chọn NST thiacutech hợp nhất vagrave loại bỏ NST yếu nhất

Quy trigravenh giao nhau vagrave cải thiện quần thể

đột biến tiến trigravenh để khaacutem phaacute ra NST mới

17Ưu nhược điểm của việc kết hợp với thuật toaacuten di truyền Kiacutech thước quần thể lagrave 1 yếu tố quan trọng trong tốc độ của việc tigravem

kiếmnhưng noacute tương đối dễ dagraveng để dự đoaacuten tốc độ nagravey Giao nhau hoặc đột biến lagrave khocircng necircn đc sử dụng quaacute thường xuyecircn Luocircn coacute được iacutet nhất 1 giải phaacutep hợp lyacute Necircn coacute thể aacutep dụng chuacuteng cho caacutec vấn đề magrave chuacuteng ta khocircng coacute hướng

về caacutech giải quyết Sức mạnh của thuật toaacuten xuất phaacutet từ khaacutei niệm đơn giảnkhocircng phải từ

một thủ tục thuật toaacuten phức tạp 18Tương lai của học maacutey

Mạng lưới thần kinh nhacircn tạo vượt quaacute năng lực của con người trong caacutec trường hợp bị cocirc lập

Về mặt lyacute thuyếtmột maacutey tiacutenh coacute thể xử lyacute dũ liệu nhanh hơn hagraveng triệu lần so với 1 con người

May mắn thay cho chuacuteng tacon người tốt hơn nhiều khi magrave coacute được dữ liệumaacutey tiacutenh khocircng coacute 1 số thứ như lagrave 5 giaacutec quan

CHƯƠNG 10 KHO DỮ LIỆU

1 Kho dữ liệu Kho dữ liệu lagrave tuyển tập caacutec cơ sở dữ liệu tiacutech hợp hướng chủ đề được

thiết kế để trợ giuacutep cho một hệ hỗ trợ quyết định

Theo John Ladley Cocircng nghệ kho dữ liệu lagrave tập caacutec phương phaacutep kỹ thuật vagrave caacutec cocircng cụ coacute thể kết hợp hỗ trợ nhau để cung cấp thocircng tin cho người sử dụng trecircn cơ sở tiacutech hợp từ nhiều nguồn dữ liệu nhiều mocirci trường khaacutec nhau

Kho dữ liệu thường rất lớn tới hagraveng trăm GB hay thậm chiacute hagraveng Terabyte

2 Kho dữ liệu vận hagravenh (ODS) Một kho dữ liệu vận hagravenh Aacutep dụng kỹ thuật kho dữ liệu vagraveo caacutec hệ xử

lyacute giao taacutec lưu trữ dữ liệu cho một ứng dụng đặc thugrave Noacute đưa vagraveo kho dữ liệu một dograveng caacutec dữ liệu thocirc được thiết kế

3 So saacutenh

Kho dữ liệu vận hagravenh Kho dữ liệu

Dữ liệu theo chủ đề Dữ liệu theo chủ đề

Dữ liệu tiacutech hợp Dữ liệu tiacutech hợp

Dữ liệu thay đổi Dữ liệu khocircng thay đổi

Dữ liệu được cập nhật khi thay đổi

Dữ liệu giữ nguyecircn

Chỉ coacute dữ liệu hiện tạiDữliệu hiện tại vagrave dữ liệu lịch sử

Chu kỳ lagravem tươi dữ liệu ngắn Chu kỳ lagravem tươi dữ liệu dagravei

Chỉ coacute dữ liệu chi tiết Dữ liệu chi tiết vagrave dữ liệu tổng kết

Dugraveng cho caacutec quyết định ngắn hạn

Dugraveng cho hoạch định dagravei hạn

4 Kho dữ liệu cục bộ (Data Mart - DM)

Kho dữ liệu cục bộ lagrave CSDL coacute những đặc điểm giống với kho dữ liệu nhưng với quy mocirc nhỏ hơn vagrave lưu trữ dữ liệu về một lĩnh vực một chuyecircn ngagravenh

Data mart phụ thuộc Chứa những dữ liệu được lấy từ DW vagrave những dữ liệu nagravey sẽ được triacutech lọc vagrave tinh chế tiacutech hợp lại ở mức cao hơn để phục vụ một chủ đề nhất định của Datamart

Data mart độc lập Khocircng giống như Datamart phụ thuộc Data mart độc lập được xacircy dựng trước DW vagrave dữ liệu được trực tiếp lấy từ caacutec nguồn khaacutec nhau

5 Siecircu dữ liệu Metadata lagrave dữ liệu để mocirc tả dữ liệu Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột

một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi Metadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu

6 Mocirci trường kho dữ liệu Hệ thống của tổ chức vagrave kho cung cấp dữ liệu để xacircy dựng kho dữ liệu Trong quaacute trigravenh chuyển dữ liệu từ caacutec nguồn khaacutec nhau dữ liệu coacute thể

được lagravem sạch hoặc chuyển đổi vagrave vigrave thế DW được xem như lagrave một chuẩn cho việc lưu trữ

Đồng thời siecircu dữ liệu được ghi lại Cuối cugraveng DW hoặc siecircu thị coacute thể được sử dụng để tạo ra một kho dữ

liệu ldquocaacute nhacircnrdquo 7 Caacutec đặc điểm của kho dữ liệu

Đặc điểm Mocirc tả

Hướng chủ đề - DL tổ chức theo caacutech thức người dugraveng tham chiếu

Tiacutech hợp - Dữ liệu ldquosạchrdquo loại bỏ tiacutenh thiếu nhất quaacuten

Khocircng thay đổi - DL ldquochỉ đọcrdquo người dugraveng khocircng thay đổi được

Chuỗi thời gian - DL lagrave chuỗi thời gian khocircng phải lagrave trạng thaacutei hiện tại

Được tổng kết - DL vận hagravenhthao taacutec khi cần thiết

được kết hợp lại thagravenh dạng coacute thể dugraveng được cho quyết định

Kiacutech cỡ lớn hơn - Lưu giữ theo chuỗi thời gian tức lagrave giữ lại nhiều DL

Khocircng được chuẩn hoacutea - Coacute thể dư thừa DLSiecircu dữ liệu - Dữ liệu của dữ liệu được lưu trữNguồn dữ liệu - DL vận hagravenh (caacutec hệ sẵn coacute) cugraveng

với caacutec nguồn ngoagravei 8 Kho dữ liệu hướng chủ đề

Hướng chủ để coacute nghĩa lagrave kho dữ liệu được tổ chức xung quanh caacutec chủ đề chiacutenh như khaacutech hagraveng sản phẩm sản xuất Tập trung vagraveo việc mocirc higravenh hoacutea vagrave phacircn tiacutech dữ liệu cho caacutec nhagrave ra quyết định magrave khocircng tập trung vagraveo caacutec xử lyacute thocircng thường Cung cấp cho người dugraveng một khung nhigraven toagraven vẹn đơn giản vagrave đầy đủ về caacutec sự kiện quanh caacutec chủ đề

9 Dữ liệu trong DW được tiacutech hợp Dữ liệu trong kho dữ liệu được xacircy dựng bằng caacutech tổng hợp dữ liệu từ

nhiều nguồn khaacutec nhau vagrave caacutec nguồn coacute tổ chức khaacutec nhau Cơ sở dữ liệu caacutec file excel caacutec flat file hoặc caacutec raw file Khi đưa vagraveo kho dữ liệu caacutec dữ liệu được lagravem sạch vagrave tiacutech hợp dữ liệu nhằm đảm bảo tiacutenh nhất quaacuten của dữ liệu

10Kiến truacutec kho dữ liệu Tầng cơ sở dữ liệu hoạt động Tầng truy xuất thocircng tin Tầng truy xuất dữ liệu Tầng siecircu dữ liệu Tầng quản lyacute tiến trigravenh Tầng thocircng điệp của ứng dụng Tầng vật liacute của kho dữ liệu Tầng trigravenh diễn dữ liệu

11Higravenh trạng kho dữ liệu Kho dữ liệu ảo - người dugraveng cuối coacute thể truy cập trực tiếp đến kho dữ liệu

sử dụng caacutec cocircng cụ cho pheacutep ở tầng truy xuất dữ liệu Kho dữ liệu trung tacircm-1 cơ sở dữ liệu vật lyacute chứa tất cả dữ liệu cho một

vugraveng chuyecircn dụng nagraveo đoacute

Kho dữ liệu phacircn taacuten- Thagravenh phần được phacircn taacuten qua nhiều hệ cơ sở dữ liệu vật lyacute

12METADATA- Siecircu dữ liệu Định nghĩa Siecircu dữ liệu lagrave dữ liệu về dữ liệu Lagrave 1 lưu trữ dugraveng để

Miecircu tả kho dữ liệu tổng thể Nhận dạng kiểu kho dữ liệu Quản liacute quaacute trigravenh tiacutech hợp dữ liệu Quản liacute quaacute trigravenh cập nhật kho dữ liệu Quản liacute bảo mật

Lagrave chigravea khoacutea quyết định sự thagravenh cocircng của kho dữ liệu luocircn được thay đổi vagrave cập nhật theo sự phaacutet triển của kho dữ liệu

Dugraveng để quản liacute điều khiển kho dữ liệu Sự ra đời của kho dữ liệu như 1 cấu truacutec hỗ trợ ra quyết định siecircu dữ liệu

được xem như nguồn tagravei nguyecircn dữ liệu Siecircu dữ liệu lagrave trừu tượng Chuacuteng lagrave dữ liệu bậc cao cung cấp mocirc tả ngắn

gọn caacutec dữ liệu bậc thấp hơn 13Hoạt động của Siecircu dữ liệu

Siecircu dữ liệu rất cần thiết trong việc chuyển hoacutea thocircng tin trở thagravenh tri thức Lagrave chigravea khoacutea giuacutep chuacuteng ta xử lyacute được dữ liệu thocirc Viacute dụ một dograveng dữ liệu baacuten hagraveng 1023 K596 11121 agraveNoacute sẽ khocircng coacute nghĩa gigrave cho đến khi chuacuteng ta đưa vagraveo siecircu dữ liệu (thư

mục chứa dữ liệu) agrave cửa hagraveng 1023 sản phẩm K596 vagrave số tiền baacuten được lagrave 11121 đocirc la

14Sự cần thiết phải nhất quaacuten trong kho dữ liệu Kho dữ liệu được xacircy dựng cho lợi iacutech của những nhagrave phacircn tiacutech kinh

doanh caacutec nhagrave quản trị cho tất cả caacutec khu vực chức năng Trong cơ sở dữ liệu riecircng caacutec khu vực khaacutec nhau coacute thể định nghĩa vagrave lưu

trữ dữ liệu thocircng qua phiecircn bản của chiacutenh noacute Khi dữ liệu được lấy từ những vugraveng khaacutec nhau đoacute vagrave được đặt vagraveo kho dữ

liệu Việc chuyển đổi vagrave lagravem sạch caacutec tiến trigravenh sẽ đảm bảo noacute lagrave duy nhất được tiacutech hợp tại một mức của tổ chức

15Ragrave soaacutet lại dữ liệu ndash Thực thi siecircu dữ liệu

Bất kể cấu truacutec tự nhiecircn của 1 cacircu truy vấn thế nagraveo thigrave caacutec thagravenh phần của siecircu dữ liệu rất quan trọng đối với người ra quyết định

Bảng thuộc tiacutenh khoacutea được lưu trữ bởi kho dữ liệu Tập hợp dữ liệu được lấy từ đacircu Những chuyển đổi nagraveo được thực thi với việc lagravem sạch

16Siecircu dữ liệu lagrave gigrave Metadata - lagrave thocircng tin mocirc tả nội dung của cơ sở dữ liệu (CSDL) Metadata baacuteo cho người dugraveng biết thời gian cập nhật sau cugraveng của dữ liệu

định dạng vagrave mục điacutech sử dụng của noacute Những thocircng tin nagravey coacute thể hướng dẫn người dugraveng duyệt qua CSDL vagrave

giuacutep họ hiểu được yacute nghĩa vagrave ngữ cảnh của dữ liệu Trong CSDL metadata lagrave caacutec dạng biểu diễn khaacutec nhau của caacutec đối tượng

trong CSDL Trong CSDL quan hệ metadata lagrave caacutec định nghĩa của bảng cột CSDL

view vagrave nhiều đối tượng khaacutec Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột

một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi -gtMetadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu

Bảng chuyển đổi Ghi lại những chuyển đổi đatilde được thực hiện

Lịch sử thực thi Ghi lại những dữ liệu đatilde được

phacircn tiacutech

Higravenh thaacutei kết nốiGhi lại những dữ liệu được kết nối vagrave tần suất

17Aacutenh xạ thocircng thường của siecircu dữ liệu Bản ghi aacutenh xạ chuyển đổi bao gồm

Định danh của nguồn gốc Chuyển đổi thuộc tiacutenh Chuyển đổi thuộc tiacutenh vật lyacute Matilde hoacutea tham chiếu bảng chuyển đổi Đổi tecircn Đổi khoacutea Gaacuten giaacute trị cho thuộc tiacutenh mặc định Chọn logic cho caacutec nguồn nhiều giaacute trị Đổi thuật toaacuten

18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để

phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai

lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave

tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec

Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm

Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo

19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua

caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau

SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được

Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra

một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức

Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ

Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ

Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech

CHƯƠNG 11 KHAI PHAacute DỮ LIỆU

1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn

ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993

Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng

2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd

1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều

2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP

3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn

4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng

5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server

6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo

7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động

8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời

9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều

10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện

11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech

12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP

3 Xử lyacute phacircn tiacutech trực tuyến OLAP

MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave

dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu

ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave

thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu

HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave

ROLAP4 Khai phaacute dữ liệu

Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh

khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn

Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan

5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp

6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại

Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp

Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec

Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt

Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra

Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh

vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho

Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec

Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm

Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục

Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng

gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp

Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn

Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec

Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper

Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2

Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25

Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước

Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng

Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện

trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp

Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute

độ hỗ trợ ge ngưỡng minsup

độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan

Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn

Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết

Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu

MOLAP ROLAP HOLAP

Lưu trữ dữ liệu cơ sở

Khối Bảng quan hệ Bảng quan hệ

Lưu trữ thocircng tin tổng hợp

Khối Bảng quan hệ Khối

Hiệu suất thực hiện truy vấn

Nhanh nhất Chậm nhất Nhanh

Tiecircu thụ khocircng gian lưu trữ

Nhiều Thấp Trung bigravenh

Chi phiacute bảo trigrave Cao Thấp Trung bigravenh

Page 17: De cuong(1-11)

từ đoacute bản chất bagravei toaacuten vagrave caacutec quyết định được hiểu tốt hơn1048713 Mocirc higravenh được xacircy dựng từ viễn cảnhcaacutech nhigraven của nhagrave quản lyacute1048713 Mocirc higravenh chỉ cho một bagravei toaacuten riecircng biệt thường khocircng thể dugraveng giải caacutec bagravei toaacutenkhaacutec Như vậy mỗi thagravenh phần của mocirc higravenh ứng với một phần của hệ thống thựcdo đoacute sẽ khocircng yecircu cầu nhagrave quản lyacute phải tổng quaacutet hoacutea caacutec hiểu biết của migravenh1048713 Phổ bagravei toaacuten giải được rất rộng tồn kho nhacircn sự hoạch định chiến lược 1048713 Coacute thể chứa caacutec phức tạp thực sự của bagravei toaacuten khocircng cần caacutec đơn giản hoacutea (TDdugraveng caacutec phacircn phối xaacutec suất thực thay vigrave phacircn phối lyacute thuyết xấp xỉ)1048713 Coacute thể tự động sinh ra nhiều đo lường hiệu năng quan trọng1048713 Thường lagrave phương phaacutep duy nhất của HHTQĐ coacute thể xử lyacute caacutec bagravei toaacuten tương đốiphi cấu truacutec1048713 Coacute một số caacutec goacutei phần mềm mocirc phỏng (Monte Carlo) tương đối dễ dugravengbull Điểm yếu1048713 Tuy thường tigravem được caacutec phương aacuten đủ tốt nhưng khocircng đảm bảo lời giải tối ưu1048713 Quaacute trigravenh xacircy dựng mocirc higravenh thường dagravei vagrave tốn keacutem1048713 Giải phaacutep vagrave suy diễn từ nghiecircn cứu mocirc phỏng thường khocircng thể chuyển sang bagraveitoaacuten khaacutec vigrave mocirc higravenh kết hợp caacutec yếu tố đặc thugrave1048713 Đocirci khi do mocirc higravenh quaacute dễ giải thiacutech cho nhagrave quản lyacute necircn caacutec phương phaacutep phacircntiacutech thường xem nhẹ1048713 Phần mềm mocirc phỏng đocirci khi yecircu cầu caacutec kỹ năng đặc biệt do độ phức tạp củaphương phaacutep giải higravenh thứcbull Caacutec loại mocirc phỏng1048713 Mocirc phỏng xaacutec suất một hay nhiều biến độc lập mang tiacutenh xaacutec suất với 2 loạiphacircn phối ndash thường dugraveng kỹ thuật Monte Carlo1048713 Phacircn phối rời rạc tigravenh huống coacute một số giới hạn caacutec biến cố (biến) với hữu hạncaacutec giaacute trị cho mỗi biến cố (biến)1048713 Phacircn phối liecircn tục tigravenh huống coacute số lượng khocircng giới hạn caacutec biến cố tuacircn theocaacutec hagravem mật độ xaacutec suất như phacircn phối chuẩn1048713 Mocirc phỏng độc lậpphụ thuộc theo thời gian1048713 Độc lập khocircng cần thiết phải biết chiacutenh xaacutec thời điểm xảy ra biến cố (nhu cầutiecircu thụ lượng sản phẩm trong ngagravey khocircng biết chiacutenh xaacutec thời điểm tiecircu thụ)1048713 Phụ thuộc cần biết chiacutenh xaacutec thời điểm xảy ra sự kiện (bagravei toaacuten hagraveng đợi)1048713 Mocirc phỏng tương taacutec trực quan1048713 Mocirc phỏng hướng đối tượng dugraveng tiếp cận hướng đối tượng để xacircy dựng mocirc higravenhmocirc phỏng Chuacute yacute ngocircn ngữ mocirc higravenh hoacutea nhất thể UML (unified modelinglanguage) kể cả khi mocirc phỏng caacutec hệ thời gian thựcMOcirc HIgraveNH HOacuteA ĐA CHIỀU ndash XỬ LYacute PHAcircN TIacuteCH TRỰC TUYẾNbull Người ra quyết định thường phải xem xeacutet nhiều chiều của dữ liệu (TD caacutec chiềucủa dữ liệu baacuten hagraveng lagrave sản phẩm vugraveng thời gian người baacuten ) dữ liệu cần đượcphacircn tiacutech trực tiếp bằng caacutec cocircng cụ chuẩn hay phacircn tiacutech tự động bằng caacutec

phương phaacutep khai mỏ dữ liệu (data mining)bull Hầu hết caacutec hệ thống phacircn tiacutech đa chiều được nhuacuteng trong caacutec hệ xử lyacute phacircn tiacutechtrực tuyến (HXLPTTT ndash online analytic processing - OLAP)bull Mục tiecircu của XLPTTT nắm bắt cấu truacutec của dữ liệu thực để hỗ trợ ra quyết địnhbull Trong HHTQĐ coacute sự gắn nối tự nhiecircn giữa mocirc higravenh hoacutea dữ liệu mocirc higravenh hoacutea kyacutehiệu vagrave caacutec khiacutea cạnh của phacircn tiacutech ldquowhat-ifrdquobull Caacutec baacuteo caacuteo của HXLPTTT đều coacute tiacutenh tương taacutec dễ khai thaacutec sử dụng đặc biệtphugrave hợp cho caacutec baacuteo caacuteo về chỉ số hiệu năng chủ yếu (key performance indicators- KPI) baacuteo caacuteo về đo lường hiệu năng kinh doanh bull Thế hệ hiện tại của HXLPTTT vagrave hệ khai mỏ dữ liệu (data mining) tiacutech hợp caacutecđặc tiacutenh của hệ thocircng tin latildenh đạo (executive information system ndashEIS- nhiềucaacutech nhigraven dữ liệu chi tiết hoacutea theo nhu cầu) vagrave caacutec hệ đồ họa khaacutec ndash thường coacutegiao diện người dugraveng dạng kiểu WEBbull Caacutec hệ thống như trecircn cograven được gọi lagrave caacutec cocircng cụ triacute tuệ kinh doanh (businessintelligence - BI) vigrave coacute caacutec đặc trưng về mocirc higravenh hoacutea vagrave tối ưu hoacutea nhưng lạitrong suốt đối với ngươigrave dugravengbull Hiện caacutec cocircng cụ được đưa ra bởi caacutec nhagrave cung cấp về CSDL về hoạch định tagraveinguyecircn tổ chức (ERP) về nhagrave kho dữ liệu (data warehouse) về HXLPTTT MOcirc HIgraveNH HOacuteA VAgrave MOcirc PHỎNG TƯƠNG TAacuteC TRỰC QUANbull Iacutech lợi Người ra quyết định tham gia vagraveo quaacute trigravenh phaacutet triển mocirc higravenh vagrave thựcnghiệm mocirc phỏng vigrave vậy sẽ tin tưởng khi sử dụng mocirc higravenhbull Mocirc higravenh hoacutea tương taacutec trực quan (visual interactive modeling - VIM) dugraveng caacutecbiểu diễn đồ họa maacutey tiacutenh để trigravenh bagravey caacutec ảnh hưởng của caacutec quyết định quản lyacutekhaacutec nhau ở một thời điểm (tĩnh) hay tiến triển theo thời gian (động với kỹ thuậthoạt higravenh)bull Mocirc phỏng tương taacutec trực quan (visual interactive simulation - VIS) cho pheacutepngười dugraveng theo dotildei tiến trigravenh xacircy dựng vagrave sử dụng khai thaacutec mocirc higravenh mocirc phỏngdưới dạng hoạt higravenhbull Mocirc higravenh hoacutea tương taacutec trực quan coacute thể kết hợp với tiếp cận triacute tuệ nhacircn tạo đểđưa ra caacutec khả năng mới thay đổi từ xacircy dựng hệ thống dạng đồ họa đến tigravem hiểuvề động học của hệ thốngbull Cần đến caacutec hệ thống maacutey tiacutenh xử lyacute song song tốc độ cao để xacircy dựng caacutec mocircphỏng - phức tạp quy mocirc lớn dạng hoạt higravenh - mang tiacutenh khả thi ở thời gian thực

22Caacutec dạng hệ thống hỗ trợ ra quyết địnhHệ hỗ trợ quyết định nhoacutemRa quyết định nhoacutem giao tiếp vagrave cộng taacutec- Caacutec đặc điểm của cocircng việc nhoacutem+ Một nhoacutem thực hiện một nhiệm vụ thỉnh thoảng ra quyết định thỉnh thoảngkhocircng ra quyết định+ Caacutec thagravenh viecircn trong nhoacutem coacute thể ở những nơi khaacutec nhau

+ Caacutec thagravenh viecircn trong nhoacutem coacute thể lagravem việc ở những thời gian khaacutec nhau+ Caacutec thagravenh viecircn trong nhoacutem coacute thể lagravem việc cugraveng nhau hoặc ở caacutec tổ chức khaacutecnhau+ Nhoacutem coacute thể vĩnh viễn hoặc tạm thời+ Nhoacutem coacute thể ở bất kỳ mức quản lyacute nagraveo hoặc mức thời gian nagraveo+ Coacute sự điều phối (quaacute trigravenh vagrave nhiệm vụ đạt được) hoặc macircu thuẩn trongnhoacutem+ Coacute sự đạt được hoặcvagrave mất maacutet năng suất trong tổ chức+ Nhiệm vụ phải hoagraven thagravenh rất nhanh+ Khocircng thể hoặc quaacute đắt cho tất cả caacutec thagravenh viecircn trong nhoacutem cugraveng hợp ở mộtnơi+ Một số dữ liệu thocircng tin hoặc kiến thức cần thiết nằm ở nhiều nơi một sốkhaacutec ở ngoagravei tổ chức+ Chuyecircn mocircn của caacutec thagravenh viecircn khocircng coacute trong nhoacutem lagrave cần thiết- Caacutec hoạt động vagrave caacutec quaacute trigravenh miecircu tả caacutec cuộc họp+ Cuộc họp lagrave hoạt động chung liecircn quan bởi một nhoacutem người coacute địa vị bằngnhau hoặc gần bằng nhau+ Kết quả của cuộc họp phụ thuộc một phần vagraveo kiến thức yacute kiến caacutec đaacutenh giaacutecủa caacutec thagravenh viecircn+ Kết quả của cuộc họp cũng phụ thuộc vagraveo sự kết hợp của nhoacutem vagrave phụ thuộcvagraveo quaacute trigravenh ra quyết định được sử dụng bởi nhoacutem đoacute+ Giải quyết caacutec yacute kiến khaacutec nhau bởi người coacute quyền hạn hoặc thương lượnghoặc phacircn xửHỗ trợ giao tiếp- Giao tiếp lagrave thagravenh phần quan trọng cho hỗ trợ quyết định Khocircng coacute giao tiếp thigravekhocircng coacute cộng taacutec Những người ra quyết định caacute nhacircn phải giao tiếp với caacutecđồng nghiệp chuyecircn gia cơ quan chiacutenh phủ khaacutech hagraveng đối taacutec kinh doanh hellipHọ cũng cần dữ liệu vagrave thocircng tin (vagrave kiến thức) từ nhiều nơi trecircn thế giới Caacutecnhoacutem ra quyết định phải giao tiếp cộng taacutec vagrave thương lượng trong cocircng việcHầu hết caacutec tổ chức sẽ nhanh trở thagravenh khocircng coacute chức năng nếu khocircng coacute caacutec hệthống giao tiếp Thương mại điện tử coacute thể hiệu quả chỉ qua caacutec kỹ thuật giao tiếphiện đại- Caacutec kỹ thuật thocircng tin hiện đại cung cấp caacutec phương tiện hỗ trợ giao tiếp rẻnhanh coacute khả năng coacute thể tin cậy Nền tảng hỗ trợ giao tiếp lagrave caacutec hệ thống maacuteytiacutenh mạng+ Bắt đầu bằng điện baacuteo điện thoại radio vagrave ti vi+ Trong 100 năm chuacuteng ta phaacutet triển maacutey fax thư điện tử chương trigravenh chatnhoacutem tin tức hệ thống hội nghị truyền higravenh Hầu hết caacutec kỹ thuật nagravey đềuhoạt động trecircn internet+ Sự phaacutet triển giao tiếp sau cugraveng lagrave hệ thống họp điện tử caacutec dịch vụ vagrave hệ

thống hội nghị điện tử thường sử dụng internet để kết nối caacutec người ra quyếtđịnh- Caacutec thuận lợi aacutep dụng caacutec phương phaacutep giao tiếp cải tiến trong caacutec tổ chức+ Cải tiến năng suất của nhacircn viecircn+ Liecircn quan đến nhiều người ra quyết định chiacutenh+ Khocircng quan tacircm nhiều đến đường biecircn giới địa lyacute+ Tạo nền văn hoacutea hợp taacutec nhất quaacuten+ Cải tiến chất lượng cuộc sống của nhacircn viecircnHỗ trợ cộng taacutec Maacutey tiacutenh hỗ trợ cộng taacutec- Khung thời giannơi chốn+ Sự hiệu quả của kỹ thuật tiacutenh toaacuten cộng taacutec phụ thuộc vagraveo vị triacute của caacutec thagravenhviecircn trong nhoacutem vagrave phụ thuộc vagraveo thời gian chia sẽ thocircng tin gởi vagrave nhận+ Chia sự giao tiếp thagravenh bốn ocirc vagrave tổ chức bốn ocirc dọc theo 2 chiều thời gian vagravenơi chốn1048713 Thời gian Khi gởi vagrave nhận thocircng tin hầu như đồng thời giao tiếp lagrave đồngthời Viacute dụ Điện thoại ti vi vagrave caacutec cuộc họp gặp mặt nhau Giao tiếp bấtđồng bộ xảy ra khi người nhận nhận thocircng tin ở thời điểm khaacutec thời điểmgởi thocircng tin đoacute1048713 Nơi chốn Người gởi vagrave người nhận coacute thể ở cugraveng phograveng hoặc khocircng+ Bốn ocirc lagrave1048713 Cugraveng thời giancugraveng nơi chốn Caacutec thagravenh viecircn gặp mặt nhau cugraveng một luacutecgiống như phograveng quyết định hoặc gặp mặt truyền thống1048713 Cugraveng thời giankhaacutec nơi chốn Caacutec thagravenh viecircn ở caacutec nơi khaacutec nhau nhưnggiao tiếp cugraveng nhau Viacute dụ hội nghị truyền higravenh (videoconferencing)1048713 Khaacutec thời giancugraveng nơi chốn Nhiều người lagravem việc theo ca Ca nagravey để lạithocircng tin cho ca khaacutec1048713 Khaacutec thời giankhaacutec nơi chốn Caacutec thagravenh viecircn ở caacutec nơi khaacutec nhau Caacutecthagravenh viecircn nagravey gởi vagrave nhận thocircng tin ở những lần khaacutec nhau

23Thực thi hệ DSSHệ thống hỗ trợ quản lyacute (MSS) khocircng phải luacutec nagraveo cũng luocircn thagravenh cocircng Nhiều trường hợpthất bại của ES khocircng hoagraven toagraven lagrave lyacute do kỹ thuật Thực thi hệ thống lagrave một quaacute trigravenh liecircn tụcnhằm đảm bảo cho tổ chức chuẩn bị tiếp nhận một hệ thống mới vagrave đưa hệ thống vagraveo sử dụngthagravenh cocircngThực hiện cocircng nghệ hệ thống hỗ trợ quản lyacute lagrave việc phức tạp vigrave caacutec hệ thống nagravey khocircng đơnthuần lagrave hệ thống thocircng tin chỉ thu thập thao taacutec vagrave phacircn phối thocircng tin Magrave xa hơn chuacuteng

liecircn quan tới caacutec cocircng việc coacute thể lagravem thay đổi đaacuteng kể caacutech thức hoạt động của tổ chức Tuyvậy đa số caacutec yếu tố thực thi đều liecircn quan tới hệ thống thocircng tinThực thi MSS lagrave quaacute trigravenh liecircn tục diễn ra trong suốt thời gian phaacutet triển hệ thống từ đề xuấtban đầu đến nghiecircn cứu khả thi thiết kế vagrave phacircn tiacutech hệ thống lập trigravenh huấn luyện chuyểnđổi vagrave lắp đặt Caacutec chuyecircn gia hệ thống thocircng tin thường gọi thực thi lagrave giai đoạn cuối trongvograveng đời hệ thống Định nghĩa thực thi MSS phức tạp hơn vigrave bản chất lặp của sự phaacutet triểncaacutec hệ thống

THỰC THI KHOcircNG HOAgraveN CHỈNHCaacutec quyết định về tiacutenh khả thi thường coacute giả định về lợi iacutech đạt được khi kế hoạch thực thiđược thực hiện hoagraven toagraven Trong thực tế thường chỉ thực hiện 90 thậm chiacute 70 phần trăm sovới phacircn tiacutech khả thi Lyacute do lagrave sự thay đổi tại một nơi trong hệ thống coacute thể ảnh hưởng vagrave coacutethể taacutec động tiecircu cực đến chỗ khaacutec Do vậy cấp quản lyacute coacute thể bỏ những phần trong dự aacuten coacutethể gacircy ra taacutec động xấu Do đoacute dự aacuten sẽ thực hiện iacutet hơn 100 so với dự aacuten kế hoạch Caacutec lyacutedo khaacutec coacute thể lagrave do khấu trừ ngacircn saacutech hoặc vượt chi phiacuteĐAacuteNH GIAacute SỰ THAgraveNH COcircNG CỦA THỰC THI HỆ THỐNGPhải coacute caacutec chỉ số đo lường thigrave mới coacute thể đaacutenh giaacute sự thagravenh cocircng khi thực thi một hệ thốngDickson va Powers (1973) đề ra 5 tiecircu chuẩn độc lậpbull Tỷ lệ thời gian thực hiện dự aacuten với thời gian ước lượngbull Tỷ lệ chi phiacute thực tế vagrave ngacircn saacutech thực hiệnbull Thaacutei độ của cấp quản lyacute đối với hệ thốngbull Nhu cầu thocircng tin của caacutec nhagrave quản lyacute được đaacutep ứng như thế nagraveo qua hệ thốngbull Taacutec động của dự aacuten đối với những hoạt động maacutey tiacutenh trong cocircng tyCaacutec đo lường khaacutec để đaacutenh giaacute thagravenh cocircng của hệ hỗ trợ quản lyacute (MSS)bull Sự sử dụng hệ thống (dự định dugraveng hoặc thực sự dugraveng)bull Thỏa matilden của người dugravengbull Thaacutei độ taacuten thagravenhbull Mức độ hệ thống hoagraven thagravenh caacutec mục tiecircu ban đầubull Phần thưởng đối với tổ chức (giảm chi phiacute tăng doanh thuhellip)bull Tỷ số lợi iacutech chi phiacute

bull Mức độ thể chế hoacutea của MSS trong tổ chứcDo bởi tiacutenh đa dạng của DSS necircn việc đaacutenh giaacute sự thagravenh cocircng của hệ nagravey cũng khoacute khăn tuynhiecircn cũng coacute thể coacute một số yếu tố giuacutep cho DSS thagravenh cocircng như sự tham gia người dugravenghuấn luyện người dugraveng hỗ trợ quản lyacute cấp cao nguồn thocircng tin đặc điểm của những nhiệmvụ coacute liecircn quan (cấu truacutec bất định độ khoacute phụ thuộc)

Chương5Nhoacutem hỗ trợ quyết định vagrave nhoacutemcocircng nghệ phần mềm

51Nhoacutem tạo quyết định

MDM-Holsapple đatilde gợi yacute chuacuteng ta sử dụng giới hạn người tạo quyết định

Một nhoacutem lagrave kết cấu MDM nơi magrave nhiều người ra quyết định hoagraven toagraven tương taacutec

Một đội lagrave kết cấu MDM nơi caacutec thagravenh viecircn tư vấn cho người đưa ra quyết định nhưng khocircng tương taacutec

Một Ủy ban lagrave kết cấu MDM với một người tạo quyết định duy nhất vagrave sự tương taacutec giữa caacutec thagravenh viecircn

Mạng thocircng tin

Mạng lưới baacutenh xe mỗi người tham gia coacute thể giao tiếp với người đưa ra quyết định ở trung tacircm nhưng khocircng phải với người tham gia khaacutecCấu truacutec nagravey lagrave khocircng thỏa matilden tất cả những người tham gia ngoại trừ người ra quyết định

Mạng dacircy chuyền Tham gia chuyển tiếp thocircng tin chỉ để noacute luocircn liền kề nhau trong chuỗi

Thagravenh viecircn cuối cugraveng ko được đaacutep ứng

Mạng vograveng trograven Tương tự như chuỗi nhưng kết thuacutec được kết nối

Mạng kết nối hoagraven toagraven khocircng coacute hạn chế về giao tiếp vagrave tương taacutec giữa caacutec thagravenh viecircnNoacutei chungnoacute đaacutep ứng hầu hết caacutec kết nối của người tham gia nhưng truyền đạt thocircng tin mất nhiều thời gian vagrave coacute nhiều cơ hội xảy ra lỗi

Nhoacutem hagravenh vi vagrave chuẩn mực

MDMs thiết lập caacutec chỉ tiecircu hướng dẫn quaacute trigravenh ra quyết định

Một chuẩn mực quy định cụ thể những gigrave thagravenh viecircn trong nhoacutem dự kiến sẽ lagravem trong những hoagraven cảnh nhất định

Quy tắc gửi coacute thể được thocircng qua viacute dụ đaacutenh giaacute ngang hagraveng hoặc xử phạt

Lagravem thế nagraveo để đưa ra quyết định

Việc chọn lựa magrave trong đoacute việc sử dụng cấu truacutec MDM phải được dựa trecircn một số yếu tố liecircn quan với bối cảnh quyết định

Viacute dụmột cấu truacutec riecircng lẻ sẽ lagravem việc nơi magrave quyết định được cấu truacutec cao vagrave thocircng tin lagrave coacute sẵn

Một ủy ban cơ cấu sẽ lagrave sự lựa chọn khi người ra quyết định khocircng thể đưa ra quyết định một migravenh

52Caacutec vấn đề thường gặp trong nhoacutem

Kiacutech thước Noacutei chung sự nhất triacute vagrave gắn kết giữa caacutec thagravenh viecircn tỉ lệ nghịch với phạm vi nhoacutem Trong nhoacutem lớn rất dễ higravenh thagravenh caacutec nhoacutem nhỏ vagrave hoạt động rời rạc

Tư duy tập thể Trong nhoacutem lớn mọi người coacute xu hướng suy nghĩ đểđạtđược sự nhất triacute necircn khocircng phaacutet huy được sự saacuteng tạo

Caacutec vấn đề về xatilde hội

Xung đột Trong 1 nhoacutem ai cũng muốn migravenh lagrave giỏi nhất necircn dễ dẫn đến xung đột

Ẩn danh(Giấu tecircn) Đacircy lagrave phương phaacutep được sử dụng để kiểm soaacutet xung đột Cho caacutec thagravenh viecircn tham gia ẩn danh

Vấn đề giới tiacutenh Nam vagrave nữ thường coacute những thế mạnh khaacutec nhau điều nagravey coacute thể lagrave sức mạnh trong 1 thiết lập MDM

Đagravem phaacuten vagrave quyết định

Một quyết định coacute thể liecircn quan đến nhiều quan điểm khaacutec nhau vigrave thế cần phải coacute sự đagravem phaacuten

Caacutec thiết kế của cơ chế hỗ trợ cho MDM phải phugrave hợp với caacutec hoạt độngđagravemphaacuten

Những hoạt động nagravey bao gồm việc thu nhận yacute kiến của caacutec thagravenh viecircn 1 caacutech cocircng bằng

53Cocircng nghệ hỗ trợ MDM

Organizational DSSndash 1 hệ thống cung cấp caacutec quyết định hỗ trợ

Group Support Systemndash Cocircng nghệ sử dụng sự hỗ trợ của nhiều becircn tham gia

Group DSS ndash Lagrave 1 hệ thống được thiết kế đặc biệt để hỗ trợ cho MDM

DSS ndash Lagrave 1 hệ thống dưới sự kiểm soaacutet của 1 người quyết định hệ thống nagravey cung cấp 1 bộ cocircng cụ giuacutep phacircn tiacutech hoagraven cảnh đểđưa ra quyết định vagrave nacircng cao hiệu quả của quyết địnhđoacute

53Cocircng nghệ hỗ trợ MDM

Organizational DSSndash 1 hệ thống cung cấp caacutec quyết định hỗ trợ

Group Support Systemndash Cocircng nghệ sử dụng sự hỗ trợ của nhiều becircn tham gia

Group DSS ndash Lagrave 1 hệ thống được thiết kế đặc biệt để hỗ trợ cho MDM

DSS ndash Lagrave 1 hệ thống dưới sự kiểm soaacutet của 1 người quyết định hệ thống nagravey cung cấp 1 bộ cocircng cụ giuacutep phacircn tiacutech hoagraven cảnh đểđưa ra quyết định vagrave nacircng cao hiệu quả của quyết địnhđoacute

Mục tiecircu của cocircng nghệ hỗ trợ MDM

Quy trigravenh hỗ trợ tập trung vagraveo quaacute trigravenh tạo điều kiện thuận lợi cho sự tương taacutec

Cơ chế cấu truacutec quaacute trigravenh chi phối caacutec hoạt động truyền thocircng

Nhiệm vụ hỗ trợ cocircng việc coacute thể chọn lựa tổ chức hoặc lấy thocircng tin

Nhiệm vụ cấu truacutec cocircng việc cho pheacutep truy cập đến kỹ thuật lọc kết hợp phacircn tiacutech kiến thức liecircn quan đến cocircng việc

Caacutec lớp loại cocircng nghệ hỗ trợ MDM

Phacircn loại theo đặc điểm do DeSanctis vagrave Gallupe đưa ra đề xuất một chương trigravenh ba cấp dựa trecircn caacutec tiacutenh năng được cung cấp

Hệ thống cấp 1 Mục điacutech chiacutenh lagrave tạo điều kiện thocircng tin liecircn lạc giữa caacutec thagravenh viecircn

Hệ thống cấp 2 Thiết kế để giảm thiểu rủi ro

Hệ thống cấp 3 Giuacutep điều chỉnh xử lyacute quyết định

Phacircn loại theo cocircng nghệ -Kraemer vagrave King tập trung vagraveo cocircng nghệ aacutep dụng

Cocircng nghệ bảng mạch điện tử

Hội nghị trực tuyến

Mạng lưới tập đoagraven

Trung tacircm thocircng tin

Mocirci trường cộng taacutec

Phograveng quyết định

Nhoacutem phần mềm

Phần mềm được thiết kế để hỗ trợ sự hợp taacutec bao gồm việc thu huacutet vagrave lưu trữ thocircng tin

Caacutec tổ chức dẫn đầu thị trường hiện tại lagrave Lotus Notes and Domino Microsoft Exchange Novell GroupWise and Oracle Office

Caacutec cocircng cụ trong một bộ phần mềm bao gồm người quản lyacute hội nghị (Lotus Sametime) vagrave trao đổi thocircng điệp (Lotus Notes Mail)

Xếp hạng phần mềm cho nhoacutem

Ellis vv đề xuất một hệ thống xếp hạng dựa vagraveo kiểu sự hỗ trợ noacute Cung cấp

Hệ thocircng điệp

Hệ thống hội thảo truyền higravenh

Hệ thống cộng taacutec soạn thảo

Nhoacutem phacircn phối giải phaacutep phần mền

Hệ thống phối hợp

Hệ thống thocircng minh đại diện

Lực lượng điều khiển phaacutet triển phần mềm cho nhoacutem

Một số nhacircn tố chiacutenh bao gồm

Tăng năng suất

Giảm số lượng caacutec cuộc họp

Tăng cường tự động hoacutea caacutec quy trigravenh lagravem việc thường xuyecircn

Cần phối hợp toagraven cầu tốt hơn

Tiacutenh sẵn sagraveng của những mạng lan rộng

Coleman vagrave Khanna liệt kecirc 10 nhacircn tố khaacutec

54Quản lyacute hoạt động MDM (Mobile Device Management - Quản lyacute thiết bị di động)

Một số phương phaacutep phối hợp phổ biến hơnMDM lagrave

Kỹ thuật nhoacutem định danh

Kỹ thuật Delphi

Sự phacircn xử

Hệ thocircng tin dựa trecircn vấn đề

Nemawashi

Kỹ thuật nhoacutem định danh

1-Mỗi người tham gia viết ra những yacute tưởng về những gigrave necircn quyết định

2-Lần lượt mỗi người tham gia trigravenh bagravey yacute tưởng của migravenh được ghi lại trecircn bảng Khocircng thảo luận ở đacircy

3-Sau khi tất cả caacutec yacute tưởng được trigravenh bagravey caacutec đại biểu coacute thể chất vấn những người khaacutec

4-Mỗi người tham gia bỏ phiếu cho mỗi yacute tưởng

Kỹ thuật Delphi

Về cơ bản tương tự như kỹ thuật nhoacutem định danh ngoại trừ những người khocircng bao giờ tham gia cuộc họp

Một cocircng cụ khảo saacutet được sử dụng để thu thập đầu vagraveo ban đầu từ caacutec thagravenh viecircn

Một cuộc khảo saacutet thứ hai được gửi đi với một bản toacutem tắt caacutec kết quả chung

Những bước lặp lại cho đến khi đạt được một sự đồng thuận hoặc nhigraven nhận của đa số

Sự phacircn xử(Arbitration )

Thiacutech hợp nhất khi caacutec thagravenh viecircn của MDM đại diện cho caacutec yếu tố đối lập

Những người tham gia đồng yacute rằng nếu lựa chọn thay thế hai becircn thỏa thuận khocircng được tigravem thấy thigrave một trọng tagravei viecircn becircn ngoagravei sẽ tham gia

Trọng tagravei sau đoacute lựa chọn thay thế ocircng hoặc xeacutet thấy thiacutech hợp nhất

Hệ thống thocircng tin dựa trecircn vấn đề (IBIS)

Lagrave một phương phaacutep lập luận cấu truacutec

Một đại diện cho IBIS lagrave một đồ thị với caacutec nuacutet vagrave caacutec liecircn kết

IBIS bắt đầu với lựa chọn của một nuacutet vấn đề gốc sau đoacute caacutec nuacutet vị triacute khaacutec nhau được liecircn kết với nuacutet gốc

Caacutec nuacutet vị triacute nagravey sau đoacute được đaacutenh giaacute dựa trecircn những lập luận gắn liền với chuacuteng

Nemawashi (được sử dụng rộng ratildei tại Nhật Bản)

1-Một hoặc nhiều thagravenh viecircn của MDM được chỉ định lagrave điều phối viecircnCaacutec điều phối viecircn sau đoacute chọn người tham gia cograven lại

2-Điều phối viecircn xacircy dựng một tổng hợp caacutec sự lựa chọn vagrave sau đoacute caacutec chuyecircn gia đaacutenh giaacute caacutec lựa chọn

3-Điều phối viecircn lựa chọn một sự lựa chọn dựa trecircn kết quả ở trecircn(ở 2)

4-Sự thay thế được luacircn chuyển điều phối viecircn tigravem kiếm sự đồng thuận thocircng qua sự thuyết phục vagrave đagravem phaacuten

5-Nếu đạt được sự đồng thuận điều phối viecircn cho lưu thocircng một tagravei liệu magrave mỗi thagravenh viecircn MDM để lại dấu hiệu trecircn đoacute

55Nơi lagravem việc ảo

Nhiều tổ chức trecircn toagraven thế giới kinh doanh bất động sản cho cocircng nghệ hợp taacutec

Cocircng việc được trở thagravenh một điều bạn lagravem hơn lagrave một nơi bạn đi

Những thay đổi lớn nhất mang lại bởi nơi lagravem việc ảo coacute thể lagrave về văn hoaacute hay xatilde hội hơn lagrave về cocircng nghệ

Chương 6 Hệ thống thocircng tin điều hagravenh

61 Yacute nghĩa của EIS- Hệ thống thocircng tin điều hagravenh

- EIS lagrave một dạng đặc biệt của DSS được thiết kế để hỗ trợ ra quyết định ở cấp cao nhất của một tổ chức

- Lagrave một hệ thống thocircng tin hỗ trợ nhu cầu lập kế hoạch vagrave đaacutenh giaacute của caacutec nhagrave quản lyacute điều hagravenh

- EIS coacute thể giuacutep một CEO coacute được bức tranh tổng thể chiacutenh xaacutec nhất về caacutec hoạt động vagrave một bản toacutem tắt những gigrave magrave đối thủ cạnh tranh đang lagravem

- Caacutec hệ thống nagravey noacutei chung hoạt động dễ dagraveng vagrave trigravenh bagravey thocircng tin theo những caacutech dễ hiểu để việc tiếp thu được nhanh choacuteng (biểu đồ đồ thịhellip)

(Tagravei liệu thecircm EIS lagrave những loại hệ thống lagrave rất phức tạp trong tự nhiecircn Coacute thể noacutei hệ thống nagravey cũng cung cấp cho caacutec nhagrave quản lyacute với caacutec thiết bị coacute khả năng ra quyết định bằng caacutech sử dụng của noacute Hệ thống nagravey hoạt động trong điều kiện như vậy quan trọng như trong caacutec hệ thống khaacutec khocircng hỗ trợ Khả năng lưu trữ dữ liệu nặng lagravem cho noacute lyacute tưởng để được thocircng qua khocircng chỉ bởi caacutec doanh nghiệp lớn magrave cograven bởi caacutec doanh nghiệp nhỏ hơn Nhigraven chung hệ thống nagravey lagrave dagravenh cho caacutec nhacircn viecircn cấp cao hỗ trợ thagravenh thạo trong việc đưa ra caacutec quyết định quan trọng)

Caacutec phiecircn EIS tiecircu biểu- Phiecircn lagravem việc coacute thể bắt đầu với một baacuteo caacuteo về tigravenh higravenh tagravei chiacutenh vagrave kinh

doanh của một cocircng ty caacutec chỉ số hoạt động quan trọng được hiển thị rotilde ragraveng- EIS sẽ cho pheacutep caacutec giaacutem đốc điều hagravenh coacute thể đi sacircu vagraveo dữ liệu từ những con

số bất kỳ magrave noacute hỗ trợ- Việc điều hagravenh coacute thể lựa chọn một mức độ chi tiết ( VD danh số baacuten hagraveng) nếu

như cần điều tra thecircm- Lagrave một phương phaacutep tiếp cận coacute thể giuacutep việc ra quyết định tốt hơn

Những điều magrave EIS ko coacute- EIS khocircng phải lagrave sự thay thế cho caacutec hệ thống dựa trecircn caacutec maacutey tiacutenh khaacutec EIS

thực sự chỉ cung cấp dữ liệu cho caacutec hệ thống nagravey- Noacute khocircng thể biến caacutec bộ hệ điều hagravenh của maacutey tiacutenh thagravenh những ldquochuyecircn viecircn

giỏirdquo- Coacute thể được viacute một caacutech cao hơn như lagrave một trợ lyacute đaacuteng tin cậy coacute thể được gọi

đến bất khi nagraveo vagrave mỗi khi cần thiết

Tagravei liệu thecircm Sự khaacutec nhau giữa EIS vagrave DSS+ EIS thiết kế để hỗ trợ những người điều hagravenh cấp cao giuacutep họ khaacutem phaacute caacutec vấn đề vagrave caacutec cơ hội DSS hỗ trợ những nười phacircn tiacutech cố gắng trả lời cacircu hỏi caacutei gigrave coacute thể lagravem cugraveng với một cơ hội hoặc một vấn đề

Chiều EIS DSSNhững người sử dụng thocircng thường

Duyệt dữ liệu đi xuống truy xuất trạng thaacutei

Hỗ trợ phacircn tiacutech vagrave quyết định

Sự thuacutec đẩy Tiacutenh thiacutech hợp Tiacutenh hiệu quảỨng dụng Queacutet mocirci trường đaacutenh giaacute

hiệu suất nhận dạng caacutec vấn đề vagrave caacutec cơ hội

Caacutec quyết định quản lyacute trecircn caacutec lĩnh vực đa dạng

Hỗ trợ quyết định Caacutec chiacutenh saacutech caacutec quyết định khocircng coacute cấu truacutec ở mức cao vagrave hỗ trợ giaacuten tiếp

Hỗ trợ caacutec quyết định lặp lại caacutec quyết định khocircng thể đoaacuten trước ra quyết định khocircng coacute cấu truacutec vagrave baacuten cấu truacutec

Loại thocircng tin Caacutec thocircng tin tin tức thocircng tin becircn ngoagravei về khaacutech hagraveng đối thủ cạnh tranh mocirci trường caacutec baacuteo caacuteo theo yecircu cầu vagrave định thời về caacutec hoạt động becircn trong

Caacutec thocircng tin hỗ trợ caacutec tigravenh huống đặc biệt

Sử dụng coacute nguyecircn tắc

Dograve theo vết vagrave điều khiển nhận dạng cơ hội

Hoạch định tổ chức phacircn nhoacutem vagrave điều khiển

Khả năng phugrave hợp với những người sử dụng caacute nhacircn

Thiết kế loại ra quyết định cho mỗi người điều hagravenh caacute nhacircn bằng nhiều lựa chọn đầu ra

Cho pheacutep caacutec đaacutenh giaacute caacute nhacircn caacutec khả năng what-if lựa chọn loại hộp hội thoại

Đồ họa Phải coacute Lagrave một phần quan trọng của nhiều DSS

Thacircn thiện người sử dụng

Phải coacute Phải coacute nếu khocircng coacute người sử dụng trung gian

Xử lyacute thocircng tin Lọc neacuten thocircng tin dograve theo vết dữ liệu vagrave thocircng tin quan trọng

EIS kiacutech thiacutech caacutec cacircu hỏi caacutec cacircu trả lời bằng caacutech sử dụng DSS vagrave phản hồi lại EIS

Hỗ trợ caacutec thocircng tin chi tiết

Truy xuất thường xuyecircn caacutec mức chi tiết của bất kỳ thocircng tin tổng hợp nagraveo (duyệt dữ

Coacute thể coacute trong DSS nhưng khocircng thường

liệu chi tiết)Cơ sở mocirc higravenh Caacutec chức năng coacute sẵn bị hạn

chếLagrave điểm cốt lotildei của DSS

Cấu truacutec Theo người baacuten sản phẩm hoặc theo caacutec chuyecircn gia hệ thống thocircng tin

Theo người sử dụng hoặc caacute nhacircn hoặc caacutec chuyecircn gia từ caacutec trung tacircm thocircng tin hoặc phograveng ban hệ thống thocircng tin

Phần cứng Mainframe caacutec trạm RISC mạng LANs hoặc caacutec hệ thống phacircn bố

Mainframe caacutec trạm RISC caacutec maacutey PC hoặc caacutec hệ thống phacircn bố

Bản chất caacutec goacutei phần mềm

Truy xuất tương taacutec dễ dagraveng đến nhiều cơ sở dữ liệu truy xuất trực tuyến caacutec khả năng DBMS phức tạp caacutec liecircn kết phức tạp

Caacutec khả năng tiacutenh toaacuten lớn caacutec ngocircn ngữ mocirc higravenh mocirc phỏng ứng dụng vagrave caacutec bộ tạo DSS

Bản chất caacutec thocircng tin

Trigravenh bagravey thocircng tin được phaacutet sinh trước về quaacute khứ vagrave hiện tại tạo caacutec thocircng tin mới về quaacute khứ hiện tại tương lai

Tạo thocircng tin mới về quaacute khứ hiện tại tương lai

62 Lịch sử EIS- EIS xuất hiện lần đầu tiecircn tại MIT vagraveo những năm 1970

- Những EIS đầu tiecircn được phaacutet triển bởi caacutec doanh ngiệp lớn sẵn sagraveng chấp nhận rủi ro để đạt được lợi thế cạnh tranh

- Vagraveo những năm 1980 caacutec nhagrave cung cấp đatilde phaacutet triển một số cơ sở khaacutech hagraveng rộng vagrave cocircng nghệ EIS được tiếp tục phaacutet triển cho đến ngagravey nay

(Tagravei liệu thecircm Sử dụng DSSEIS cho phaacutet triển bền vững + Một số nghiecircn cứu đatilde được tiến hagravenh để kiểm tra việc thực hiện của EIS trong khu vực cocircng cộng vagrave chiacutenh phủ caacutec nước tổ chức kể từ khi chuacuteng được phaacutet triển theo định hướng lợi nhuận cho caacutec cocircng ty tư nhacircn (Hasan vagrave Hasan năm 1997) Theo một nghiecircn cứu tiến hagravenh tại Mỹ ở hơn 300 cocircng ty kết quả cho thấy sự khaacutec biệt của EIS giữa tư nhacircn vagrave chiacutenh phủ một số kết quả thuacute vị được phaacutet hiệnViacute dụ khoacute khăn hơn để chuyển tiền từ một tagravei khoản khaacutec trong một EIS của chiacutenh phủ cũng lagrave khoacute khăn hơn để biện giải thiacutech cho những chi phiacute phaacutet triển EIS của chiacutenh phủ Một nghiecircn cứu khaacutec được tiến hagravenh ở Australia

cho thấy rằng EIS cung cấp cho quản lyacute một higravenh ảnh chiacutenh xaacutec hơn về tổ chức thực hiện vagrave cung cấp hỗ trợ cho caacutec lợi iacutech chiến lược cải thiện khocircng chỉ cho caacutec nhagrave quản lyacute nhưng cograven cho phần cograven lại của tổ chức Dựa trecircn caacutec hệ thống được thiết kế cho caacutec cocircng ty tư nhacircn với một caacutech rotilde ragravengxaacutec định mục tiecircu EIS lagrave thiacutech hợp cho caacutec tổ chức cocircng cộng hiện đại nhưng cần phải được linh hoạt hơn vagrave kết thagravenh chugravem một phạm vi rộng hơn khả năng vagrave phương tiện hơn so với khu vực tư nhacircn ban đầu theo định hướng sản phẩm (Hasan vagrave Hasan năm 1997) Điều nagravey coacute thể lagrave do thực tế rằng caacutec hoạt động khu vực cocircng lagrave bắt buộc coacute taacutec động rộng phải đaacutep ứng sự mong đợi duy nhất cocircng cộng thường coacute mục tiecircu mơ hồ vagrave macircu thuẫn iacutet quyền tự chủ vagrave kiểm soaacutet việc ra quyết định vagrave nhacircn viecircn lagrave khoacute khăn hơn (Watson vagrave Carte2000) + Toacutem lại EIS lagrave một khaacutei niệm thagravenh cocircng noacute phaacutet triển qua nhiều năm tuy nhiecircn EIS khắc phục khiếm khuyết của migravenh bằng caacutech tiến hagravenh nghiecircn cứu liecircn tục)

63 Tại sao những người điều hagravenh hagraveng đầu lại khaacutec nhau- Họ lagrave những doanh nghiệp theo định hướng coacute suy nghĩ

- Coacute một khoảng khocircng gian rộng để kiểm soaacutet

- Họ chịu traacutech nhiệm cho việc thiết lập chiacutenh saacutech

- Họ đại diện cho tổ chức mocirci trường becircn ngoagravei

- Hagravenh động của họ tạo ra những kết quả đaacuteng kể về tagravei chiacutenh vagrave con người

Tần số caacutec hoạt động điều hagravenh- Xử lyacute xaacuteo trộn 42

- Hoạt động kinh doanh 32

- Phacircn bổ nguồn lực 17

- Đagravem phaacuten 3

- Những điều khaacutec 6

Handling Disturbances 42

Entrepreneurial Activites 32

Resource Allocation 17

Negotiation 3

Other 6

Những thocircng tin điều hagravenh cần thiết- Quản lyacute xaacuteo trộn coacute thể yecircu cầu sự chuacute yacute xung quanh đồng hồ

- Hoạt động kinh doanh yecircu cầu điều hagravenh để dự đoaacuten những thay đổi trong mocirci trường

- Nhiệm vụ phacircn bổ tagravei nguyecircn yecircu cầu lựa chọn người quản lyacute vagrave caacutec nguồn lực hạn chế được triển khai

- Đagravem phaacuten yecircu cầu cập nhật thocircng tin từng phuacutet để coacute thể xacircy dựng được sự đồng thuận

Caacutec loại thocircng tin điều hagravenh- Hệ thống kế toaacuten coacute liecircn quan đến việc tiacutenh toaacuten thu nhập hoạt động cho caacutec lĩnh

vực cụ thể lagrave quan trọng hơn so với caacutec hệ thống kế toaacuten truyền thocircng- Thocircng tin về thị trường khaacutech hagraveng cung cấp giaacute trị trong việc quyết định chiến

lược- Caacutec thocircng tin cần thiết thường được truyền đi trecircn một số hệ thống maacutey tiacutenh vagrave

nằm trong toagraven tổ chức- Caacutec thocircng tin được sử dụng thường lagrave ngắn hạn vagrave dễ thay đổi

Phương thức để xaacutec định thocircng tin cần thiết

Rockart xaacutec định được năm phương thức cơ bản để xaacutec định thocircng tin cần thiết

- Phương thức dựa trecircn kết quả- Phương thức rỗng- Phương thức chỉ số khoacutea- Phương thức tổng hợp nghiecircn cứu- Phương thức dựa vagraveo nhacircn tố then chốt dẫn đến thagravenh cocircng

64 Thagravenh phần EIS

- Sản phẩm EIS đầu tiecircn được phaacutet triển để sử dụng trecircn maacutey tiacutenh cấu higravenh cao nhưng caacutec sản phẩm hiện nay nhằm mục tiecircu lagrave nền tảng ClientServer

- Những nền tảng linh hoạt hơn coacute thể thiacutech ứng với thay đổi trong tổ chức vagrave cocircng nghệ

- Sử dụng dữ liệu thời gian thực dẫn đến quyết định nhanh hơn nhiều thocircng tin hơn

Thagravenh phần phần cứng- Một EIS khocircng đogravei hỏi coacute phần cứng cụ thể hoặc duy nhất nagraveo- Chigravea khoacutea của vấn đề lagrave để đảm bảo rằng caacutec thagravenh phần của EIS tối ưu hoacutea vagrave

phugrave hợp với tagravei nguyecircn maacutey tiacutenh của tổ chức- Hệ thống nagravey phải được cấu higravenh để caacutec nguồn tagravei nguyecircn phugrave hợp với những

người điều hagravenh chuacuteng

Thagravenh phần phần mềm- Traacutei ngược với phần cứng phần mềm thường được chuyecircn mocircn hoacutea cao cho caacutec

bagravei toaacuten về miền- Sự chuyecircn mocircn hoacutea nagravey thường đạt được bằng caacutech sử dụng thagravenh phần off-the-

shelf cho toagraven bộ EIS vagrave caacutec mocirc-đun tugravey chỉnh để đaacutep ứng nhu cầu cụ thể- Lotus Notes lagrave một viacute dụ điển higravenh Noacute coacute thể được sử dụng một migravenh hoặc coacute

thể phục vụ becircn thứ ba mocirc-đun plug-in

Cocircng nghệ EIS hiện nay

Dobrzeniecki đề xuấtphacircn loạitừng cấptheo bachức năng- Loại 1 sản phẩm bao gồmmột bộ đầy đủcaacutec ứng dụngtừ mộtnhagrave cung cấp- Loại 2 sản phẩm đượcthựchiệnở phần đầu củacaacutecsản phẩmDSS đượcphaacutet triển

bởicugravengmộtnhagrave cung cấp- Loại 3 sản phẩmkết hợp với nhautheo bất kỳ số lượngthuộc sở hữu củacocircng ty

65 Xacircy dựng EIS

- Xacircy dựngmộtEISgiống nhưxacircydựngmột số hệ thống khaacutec củamocirc higravenh hệ thống thocircng tin

- Việcphaacutet triểncấu truacutecnecircn được theo dotildeitừ quaacute trigravenh thiết kế đến quaacute trigravenhthực hiện

- Tuy nhiecircn một dự aacuten phaacutet triển EIScoacute xu hướnglagrave thống nhấtvagraveyecircu cầu hỗ trợ caacutec nhagrave quản lyacute latildenh đạo

- Xacircy dựng một EIScoacute thểphaacutet hiện ra đượccaacutectigravenh huống khoacute khănmagravemột nhagrave phaacutet triển chưabao giờ gặp phải

Mocirc higravenh EIS

Khung phaacutet triển một EIS

- Watson et al đề nghị xacircy dựngkhung với ba thagravenh phần+ Caacutech tiếp cận tập trung vagraveo yếu tốcon người vagrave dữ liệu coacute liecircn quan đến EIS+ Quaacute trigravenh phaacutet triển cần sự linh hoạt vagrave tương taacutec+ Người sử dụng - hệ thống hộp thoại bao gồm một ngocircn ngữ hagravenh động để xử lyacute caacutec lệnh

Lợi iacutech của EIS- Dễ duy trigrave caacutec mục tiecircu coacute tổ chức- Dễ truy xuất thocircng tin- Cho pheacutep người sử dụng nacircng cao hiệu suất hơn

- Tăng chất lượng ra quyết định- Cung cấp sự cải tiến cạnh tranh- Tiết kiệm thời gian của người sử dụng- Tăng khả năng vagrave chất lượng giao tiếp- Cung cấp khả năng điều khiển tốt hơn trong tổ chức- Cho pheacutep tham gia caacutec vấn đề vagrave caacutec cơ hội- Cho pheacutep hoạch định- Cho pheacutep tigravem kiếm nguyecircn nhacircn của một vấn đề- Thảo matilden caacutec yecircu cầu của người điều hagravenh

Hạn chế của EIS vagrave 1 số sai lầm cần traacutenh

- Chi phiacute một cuộc khảo saacutetnăm1991 chothấychi phiacute phaacutet triểntrungbigravenh365000USDvớichi phiacute vận hagravenhhagraveng năm lagrave$200000 (EIS)

- Cocircng nghệ hạn chếEIScần phảiđượctiacutech hợp hoagraven toagravenvagraveokiếntruacuteccủadoanh nghiệphiện tại do đoacute noacutelagrave một thaacutech thứclớn đối vớithiết kế

- Hạn chế tổ chức cơ cấu tổ chứccoacute thể khocircng phugrave hợp

Sự hạn chế về tổ chức- Chương trigravenh nghị sự vagrave thời gian chệch EIS mocirc tả một phần việc thực hiện một

chương trigravenh nghị sự vagrave coacute thể dễ dagraveng đạt được sự tin cậy một caacutech chắc chắn- Đồng bộ hoacutea việc quản lyacute sự tin cậy đuacuteng luacutec đặc biệt baacuteo caacuteo EIS coacute thể phaacute

vỡ sự ổn định thiết lập caacutec chu trigravenh baacuteo caacuteo một caacutech tốt nhất- Sự bất ổn EIS phản ứng nhanh coacute thể gacircy ra việc taacutec động trở lại một caacutech

nhanh choacuteng dẫn đến sự thiếu ổn định trong tổ chức

Sự thất bại lagrave thay thế khocircng thể chấp nhận được- Một số yếu tố lagravem EIS thất bại

+ Thiếu sự hỗ trợ về mặt quản lyacute+ Vấn đề chiacutenh trị+ Thất bại của nhagrave phaacutet triển+ Lỗi về cocircng nghệ+ Giaacute cả+ Thời gian

66 Ra quyết định điều hagravenh trong tương lai vagrave EIS

- Coacute một vagravei điều kiện sẽ được hợp nhất cho việc chuyển đổi cocircng nghệ Trong đoacute một vagravei điều kiện coacute thể dễ dự đoaacuten Hai điều kiện magrave ta coacute thể thấy lagrave+ Phaacutet triển cocircng nghệ maacutey tiacutenh trong việc điều hagravenh sẽ tạo ra sự chuyển đổi được chấp nhận một caacutech dễ dagraveng hơn+ Mở rộng traacutech nhiệm điều hagravenh sẽ mở rộng nhu cầu thocircng tin

Tương lai của EIS- EIS thocircng minh Những tiến bộ trong cocircng nghệ AI sẽ được triển khai trong caacutec

EIS- EIS đa phương tiện Cơ sở dữ liệu đa phương tiện sẽ cho pheacutep tiacutech hợp văn bản

giọng noacutei vagrave higravenh ảnh trong tương lai- EIS thocircng tin Tương lai EIS sẽ mở rộng hơn trong việc sử dụng dữ liệu becircn

ngoagravei doanh nghiệp- EIS kết nối Giao tiếp với băng thocircng rộng cho pheacutep kết nối liecircn thocircng lớn hơn

Chương 7 HỆ CHUYEcircN GIA VAgrave TRIacute TUỆ NHAcircN TẠO

71 Caacutec khaacutei niệm

72 Triacute thocircng minh của triacute tuệ nhacircn tạo

73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia

74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia

75 Lợi iacutech vagrave hạn chế của hệ chuyecircn gia

71 Caacutec khaacutei niệm

Chuyecircn mocircn (Expertise) sự hiểu biết rộng trong 1 lĩnh vực hẹp

Hệ chuyecircn gia (Expert Systems)1 chương trigravenh maacutey tiacutenh sử dụng 1 tập caacutec luật dựa trecircn tri thức của con người để giải quyết caacutec vấn đề đogravei hogravei phải coacute sự chuyecircn mocircn

Một số hệ chuyecircn gia nổi tiếng

DENDRAL (Standford 1960s Edward Feigenbaum)

MYCIN (Standford1970s Edward Shortliffe)

PROSPECTOR (MIT 1979)

Triacute tuệ nhacircn tạo (Artificial Intelligence ndash AI)

Triacute tuệ nhacircn tạo một bộ phacircn của ngagravenh khoa học maacutey tiacutenh quan tacircm đến việc thiết kế caacutec hệ thống maacutey tiacutenh thocircng minh đoacute lagrave caacutec hệ thống đưa ra caacutec đặc điểm magrave từ đoacute chuacuteng ta liecircn hệ với sự thocircng minh trong hagravenh động của con người (Barr vagrave Feigenbaum 1981)

Mục điacutech của AI

Mục điacutech khoa học xaacutec định caacutec gợi yacute để giải thiacutech caacutec loại khaacutec nhau của triacute tuệ thực

Mục điacutech kỹ thuật giải quyết caacutec vấn đề trong thế giới thực

Triacute tuệ nhacircn tạo kế thừa nhiều yacute tưởng quan điểm kỹ thuật từ caacutec ngagravenh khoa học khaacutec

- Triết học

- Logic Toaacuten học

- Tiacutenh toaacuten

- Khoa học tacircm lyacute Khoa học nhận thức

- Sinh học Thần kinh học

- Tiến hoacutea

Caacutec lĩnh vực ứng dụng trong Triacute tuệ nhacircn tạo

Mạng nơ ron thần kinh (Neural Networks)

Tiacutenh toaacuten sự tiến hoacutea

(Evolutionary Computation)

Hệ chuyecircn gia (Expert Systems)

Kỹ thuật xử lyacute tiếng noacutei (Speech Processing)

Kỹ thuật xử lyacute ngocircn ngữ tự nhiecircn

(Natural Language Processing)

Lập kế hoạch (Planning)

Robot (Robotics)

Khoa học higravenh ảnh (Vision)

Caacutec kỹ thuật thocircng dụng dugraveng trong AI

Biểu diễn(Representation)

Học (Learning)

Caacutec luật (Rules)

Tigravem kiếm (Search)

72 Triacute thocircng minh của triacute tuệ nhacircn tạo

Con người suy diễn như thế nagraveo

Phacircn loại (Categorization)

Caacutec quy tắc cụ thể

Heuristics

Kinh nghiệm trước đoacute

Dự tiacutenh trước

Maacutey tiacutenh suy diễn như thế nagraveo

Lập luận dựa trecircn luật IF-THEN mocirc tả tri thức được matilde hoacutea dưới dạng caacutec luật

Caacutec khung (Frames) lagrave caacutec đại diện mocirc tả caacutec tigravenh huống giống nhau lagrave điển higravenh của một vagravei phacircn loại

Lập luận dựa trecircn caacutec trường hợp mocirc phỏng giải phaacutep trước đoacute cho một vấn đề hiện tại

Nhận dạng mẫu phaacutet hiện acircm thanh higravenh dạng hoặc caacutec chuỗi dagravei

Caacutec dạng khaacutec của Triacute tuệ nhacircn tạo

Học maacutey- mạng nơron vagrave giải thuật di truyền

Lập trigravenh tự động ndash lagrave những kỹ thuật tạo ra caacutec chương trigravenh để lagravem 1 nhiệm vụ riecircng biệt (cho pheacutep những người khocircng phải lagrave người lập trigravenh coacute thể lập trigravenh được)

Cuộc sống nhacircn tạo ndash nỗ lực để taacutei tạo caacutec hiện tượng sinh học trong caacutec hệ thống dựa trecircn maacutey tiacutenh

73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia(Expert Systems- ES)

Theo Jackson (1999) Một hệ chuyecircn gia lagrave một chương trigravenh maacutey tiacutenh mocirc tả vagrave suy diễn với tri thức của một vagravei lĩnh vực để giải quyết vấn đề hay đưa ra caacutec lời khuyecircn

Cấu truacutec cơ bản của ES được dựa theo cấu truacutec chung của DSS Sự khaacutec biệt chiacutenh giữa ES vagraveDSS lagrave hệ ES thu thập caacutec kiến thức từ những

chuyecircn gia trong lĩnh vực quan tacircmĐặc trưng của hệ chuyecircn gia Hiệu quả cao Thời gian trả lời thỏa đaacuteng Độ tin cậy cao Dễ hiểu

Giao diện người dugraveng trong ES

Thiết kế giao diện người dugraveng tập trung vagraveo caacutec yếu tố như dễ dagraveng sử dụngcoacute độ tin cậy cao giảm tải những khoacute khăn khi sử dụng

Thiết kế necircn coacute một số tương taacutec (đầu vagraveo kiểm soaacutet vagrave truy vấn)

Cấu tạo giao diện người dugraveng gồm coacute magraven higravenh cảm ứng bagraven phiacutem buacutet saacuteng lệnh thoại caacutec phiacutem chuyecircn dụng

Cơ sở tri thức (Knowledge Base)

Chứa đựng caacutec tri thức cụ thể miền thu được từ caacutec chuyecircn gia miền

Coacute thể chứa caacutec mocirc tả caacutec hagravenh vi giải quyết vấn đề caacutec ragraveng buộc caacutec heuristics

Thagravenh cocircng của một ES dựa trecircn tiacutenh đầy đủ vagrave tiacutenh chiacutenh xaacutec của cơ sở tri thức

Mocirc tơ suy diễn (Inference Engine)

Ở đacircy tri thức được đặt để sử dụng tạo ra caacutec giải phaacutep để giải quyết vấn đề

Mocirc tơ nagravey coacute khả năng thực hiện diễn dịch hoặc suy diễn dựa trecircn caacutec luật hay caacutec caacutec sự kiện

Đồng thời cũng coacute khả năng sử dụng caacutec suy diễn mờ hay khocircng chiacutenh xaacutec dựa trecircn xaacutec suất hay aacutenh xạ mẫu

Vograveng điều khiển suy diễn

1 Aacutenh xạ caacutec luật với caacutec sự kiện đatilde được cho

2 Chọn luật để thực hiện

3 Thực hiện luật bằng caacutech thecircm caacutec sự kiện được suy diễn ra vagraveo bộ nhớ lagravem việc

Chuỗi suy diễn (Chaining)

Suy diễn tiến (forward chaining) maacutey suy diễn bắt đầu từ dữ liệu ban đầu vagrave thực hiện việc suy luận để đưa ra caacutec kết luận cuối cugraveng

Suy diễn lugravei (backward chaining) maacutey suy diễn bắt đầu từ dữ liệu điacutech vagrave tigravem ra tri thức hỗ trợ cho dữ liệu điacutech đoacute

Viacute dụ suy diễn lugravei

R1 Nếu coacute A vagrave B thigrave suy ra coacute D

R2 Nếu coacute B thigrave suy ra coacute C

R3 Nếu coacute C vagrave D thigrave suy ra coacute E

Ta coacute E ta xem trong 3 luật R1 R2 R3 luật nagraveo coacute E ta thấy R3 chứa E đồng thời chứa C vagrave D Xeacutet tiếp trong 2 luật R1 R2 luật nagraveo chứa C vagrave D R2 chứa C R3 chứa D Từ đoacute ta coacute được caacutec tri thức hỗ trợ suy diễn vagrave kết luận lagrave nếu coacute A vagrave B thigrave sẽ coacute E Hay nếu A vagrave B đuacuteng thigrave sẽ coacute E

Viacute dụ suy diễn tiến

Giả sử coacute tập chứa 3 luật sau

R1 Nếu coacute A vagrave B thigrave suy ra coacute D

R2 Nếu coacute B thigrave suy ra coacute C

R3 Nếu coacute C vagrave D thigrave suy ra coacute E

Nếu ta coacute A vagrave B thigrave chuacuteng ta suy ra được D từ R1 vagrave suy ra C từ R2 Với D vagrave C đatilde được suy ra ở trecircn giờ chuacuteng ta suy ra được E từ R3

Viacute dụ thực tế

Giả sử muốn biết magraveu của một con vật nuocirci tecircn lagrave Fred biết rằng noacute kecircu ộp ộp vagrave ăn ruồi

Coacute tập 4 luật ban đầu như sau

R1 Nếu X kecircu ộp ộp vagrave ăn ruồi thigrave X lagrave con ếch

R2 Nếu X kecircu chiecircm chiếp vagrave biết hoacutet thigrave X lagrave con chim

R3 Nếu X lagrave con ếch thigrave X coacute magraveu xanh

R4 Nếu X lagrave con chim thigrave X coacute magraveu vagraveng

74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia

Expert system shells lagrave một tập caacutec goacutei phần mềm vagrave caacutec cocircng cụ dugraveng để phaacutet triển caacutec hệ chuyecircn gia

Những Expert system shells đầu tiecircn thường rất rườm ragrave Mặc dugrave vậy noacute vẫn giuacutep cho người sử dụng sẽ khocircng phải bắt đầu lại từ đầu khi xacircy dựng một hệ chuyecircn gia mới

Những shell hiện đại bao gồm hai mocirc-đun chiacutenh lagrave cocircng cụ xacircy dựng một tập quy tắc vagrave mocirc tơ suy diễn

Xacircy dựng hệ chuyecircn gia

Bước 1 xacircy dựng mocirc higravenh bagravei toaacuten xaacutec định vấn đề nhiệm vụ magrave hệ thống sẽ thực hiện Caacutec dạng bagravei toaacuten cần hệ chuyecircn gia

Bagravei toaacuten diễn giải (InterPretation)

Bagravei toaacuten dự baacuteo (Prediction)

Bagravei toaacuten chuẩn đoaacuten (Diagnose)

Bagravei toaacuten gỡ rối (Debugging)

Bagravei toaacuten thiết kế

Tương tự như một dự aacuten phần mềm để xacircy dựng một hệ chuyecircn gia cần phải coacute caacutec yếu tố về nhacircn lực tagravei nguyecircn vagrave thời gian Những yếu tố nagravey ảnh hưởng đến giaacute thah của một hệ chuyecircn giaTrong phần nagravey cacircu hỏi thường được đặt ra lagrave tại sao cần phải xacircy dựng một hệ chuyecircn giaTrước khi bắt đầu phải xaacute định rotilde bagravei toaacuten đạt ra lagrave jiAi lagrave chuyecircn giaAi lagrave người sử dụng

1 Diễn giải (InterPretation) Nghiecircn cứu 1 vấn đề -gt Dựa trecircn những biểu hiện thuộc tiacutenh đặc trưng becircn ngoagravei -gt Tư vấn

(hoặc đưa ra kết luận hay mocirc tả dễ hiểu từ tập dữ liệu thocirc)

2 Bagravei toaacuten dự baacuteo (Prediction) Coacute thể dự đoaacuten được hagravenh vi kết quả dựa trecircn caacutec hiện tượng -gt dự baacuteo

VD Dự baacuteo thời tiết động đấthellip

3 Bagravei toaacuten chẩn đoaacuten (Diagnoss) Xaacutec định caacutec lỗi caacutec bộ phận hỏng hoacutec của hệ thống dựa trecircn caacutec dữ liệu quan saacutet được

4 Bagravei toaacuten gỡ rối (Debugging) Mocirc tả caacutec phương phaacutep khắc phục hệ thống khi gặp sự cố

5 Bagravei toaacuten thiết kế Lựa chọn cấu higravenh caacutec đối tượng nhằm thoả matilden một số ragraveng buộc nagraveo đoacute

6 Giảng dạy Phần mềm dạy học coacute thể chuẩn đoaacuten vagrave sủa lỗi của học sinh trong quaacute trigravenh học tập

Để xaacutec định đuacuteng bagravei toaacuten magrave chuacuteng ta cần giải quyết thigrave phải trả lời đc một số cacircu hỏi

- cần hệ chuyecircn gia

Bước 2 thu thập tri thức lựa chọn cocircng cụ vagrave aacutep dụng

Trong bước thu thập tri thức vấn đề quan trọng lagrave lựa chọn chuyecircn gia những người magrave sẽ đoacuteng goacutep tri thức cho hệ thống Thocircng thường trong suốt quaacute trigravenh phaacutet triển thigrave chuyecircn gia được xem như một thagravenh viecircn của đội phaacutet triển

Hiện nay coacute rất nhiều cocircng cụ để xacircy dựng một hệ chuyecircn gia Phổ biến nhất lagrave JESS CLIPS vagrave OPS5

Bước 3 Thiết kế cơ sở tri thức thiết kế hệ thốngTri thức được biểu diễn trường minh trong cơ sở tri thức

Caacutec chuyecircn gia vagrave kỹ sư tri thức sẽ đối thoại với nhau bằng caacutec kỹ thuật đối thoại Suy diễn (SD) bảng Mocirc higravenh hoacutea SD quy nạp phacircn loại

Vấn đề bagraveo trigrave vagrave phaacutet triển

Caacutec hệ chuyecircn gia đogravei hỏi phải bảo trigrave vagrave phaacutet triển nhiều hơn so với caacutec hệ thống khaacutec Phải thường xuyecircn bổ sung tri thức mới vagrave thay đổi caacutec tri thức cũ để đổi mới hệ chuyecircn gia

Thu thập vagrave khắc phục lỗi do người sử dụng phaacutet hiện để kịp thời khắc phục những sai soacutet của hệ chuyecircn gia

75 Lợi iacutech vagrave hạn chế của caacutec hệ chuyecircn gia

Một số lợi iacutech chiacutenh

Thời gian trả lời hợp lyacute bằng hoặc nhanh hơn so với chuyecircn gia (người) để đi đến cugraveng một quyết định Hệ chuyecircn gia lagrave một hệ thống thời gian thực (real time system)

Khả năng trả lời với mức độ tinh thocircng bằng hoặc cao hơn so với chuyecircn gia (người) trong cugraveng lĩnh vực

Hệ chuyecircn gia giuacutep cho hiệu quả lagravem việc tăng bằng việc sử dụng tập caacutec luật một caacutech nhanh choacuteng magrave ko bị nhầm lẫn chuyecircn gia lagrave người coacute thể quecircn đi một số tri thức cơ sở lyacute luậ nhưng HCG thigrave ko

Quyết định của một người chuyecircn gia coacute thể bị thay đổi vagrave ko coacute tiacutenh thống nhất như quyết định của một hệ chuyecircn gia tạo ra

Hệ chuyecircn gia giuacutep cho người sử dụng coacute thể trau dồi sự hiểu biết trecircn lĩnh vuej cụ thể magrave noacute giải quyết hỗ trợ người ra quyết định coacute trigravenh độ như 1 chuyecircn gia trong quaacute trigravenh gia quyết định

Kiến thức của rất nhiều chuyecircn gia về một lĩnh vực nagraveo đoacute được đưa vagraveo hệ chuyecircn gia lagravem cho CSTT cuat HCG phong phuacute vagrave rộng lớn hơn rất nhiều

HCG giải thiacutech caacutec bước suy luận một caacutech dễ hiểu nhất quaacuten luacutec nagraveo cũng coacute thể sử dụng ko như chuyecircn gia con người

Hạn chế của caacutec hệ chuyecircn gia

Nhược điểm lớn nhất của hệ chuyecircn gia lagrave những yacute kiến chuyecircn mocircn thường rất khoacute matilde hoacutea vagrave giải neacuten

Hệ chuyecircn gia khocircng coacute khả năng tự học tự cập nhật kiến thức mới như caacutec chuyecircn gia magrave cần phải được matilde hoacutea lại khi noacute được cập nhật

Hệ chuyecircn gia khocircng thể nhận ra được vấn đề khocircng nằm trong miền kiến thức của hệ thống

Chương 8 Tri thức vagrave tiếp nhận

1 Bao gồm caacutec vấn đề

Dữ liệu thực tế đo lường hoặc quan saacutet coacute hoặc khocircng coacute bối cảnh

Thocircng tin dữ liệu được tổng hợp một caacutech hữu iacutech để giải quyết những khoacute khăn trong việc đưa ra quyết định

Tri thức bao gồm caacutec ứng dụng quy tắc thocircng tin hướng dẫn của người ra quyết định

2 Những caacutei nhigraven về tri thức

Đại diện lagravem thế nagraveo để diễn tả tri thức viacute dụ như một quyển saacutech khocircng phải lagrave tri thức nhưng noacute lại lagrave một đại diện của tri thức

Sản xuất tri thức lagrave một tập hơp của hagraveng tồn kho coacute thể được sản xuất cũng như mua lại

Tri thức lagrave 1 trong 6 trạng thaacutei của hệ thống

1Dữ liệu 2Thocircng tin 3Cấu truacutec thocircng tin 4Sự thấu hiểu 5Yacute kiến 6 Quyết định

3 Caacutec loại tri thức Phổ biến mocirc tả dữ liệu thocircng tin thủ tục mọi thứ lagravem như thế nagraveo lập luận chiacutenh saacutech hoặc caacutec quy tắc

4 Thu thập Tri thức hệ chuyecircn gia Hầu hết caacutec phương phaacutep đều bắt đầu với mocirc higravenh của caacutec taacutec vụ trong đoacute

hệ chuyecircn gia được xacircy dựng Trong đoacute mocirc tả về caacutec lĩnh vực được tạo ra Caacutec kỹ sư sử dụng caacutec mocirc higravenh giả thuyết vagrave nhận thức về quaacute trigravenh phacircn

tiacutech để gợi ra caacutech giải quyết vấn đề về tri thức từ caacutec chuyecircn gia

5 Caacutec chiều của thu thập tri thức KE- driven caacutec kỹ sư trao đổi trực tiếp với caacutec chuyecircn gia Expert-driven Caacutec chuyecircn gia trực tiếp đưa chuyecircn mocircn của họ vagraveo hệ

thống maacutey tiacutenh Machine-driven Sử dụng caacutec cocircng cụ suy luận để triacutech xuất tri thức từ một

tập caacutec viacute dụ

6 Kỹ thuật thu thập tri thức Trao đổi gồm 2 loại cơ bản lagrave coacute cấu truacutec(coacute kịch bản) vagrave khocircng coacute cấu

truacutec( đối thoại trực tiếp) Giao thức phacircn tiacutech bằng lời Khi caacutec chuyecircn gia thực hiện một cocircng việc

của họ thigrave một bản ghi về cocircng việc đoacute được thực hiện Caacutec kỹ sư sẽ xacircy dựng mocirc higravenh cho những gigrave được ghi lại trong bản ghi

Phương phaacutep sagraveng lọc caacutec chuyecircn gia so saacutenh caacutec nhoacutem liecircn tiếp trong ba đối tượng vagrave cho biết tại sao nhoacutem thứ hai lại khaacutec nhoacutem thứ ba

7 Thu thập tri thức từ nhiều nguồn Thu thập tri thức từ nhiều nguồn lagrave cần thiết để coacute được đầy đủ caacutec tri thức

cho một vấn đề quan điểm yacute kiến traacutei ngược nhau thường phaacutet sinh Phương phaacutep đồng thuận sẽ giuacutep giải quyết được vấn đề macircu thuẫn Kỹ thuật phacircn tiacutech Meta lagrave kỹ thuật được aacutep dụng trong caacutec trường hợp

khaacutec Caacutech tiếp cận bằng định lượng đogravei hỏi caacutec kỹ sư cần cacircn nhắc yếu tố đầu vagraveo của caacutec chuyecircn gia khaacutec nhau

8 Xaacutec nhận hợp lệ vagrave kiểm tra tri thức Một khi thu thập tri thức noacute phải được đaacutenh giaacute về khả năng sử dụng vagrave độ

chiacutenh xaacutec Hai vấn đề cụ thể lagrave hiệu lực của những kiến thức vagrave kiểm tra việc xacircy dựng cơ sở của tri thức

Cần xaacutec nhận xem liệu hệ thống coacute thể hoạt động ở mức độ tối thiểu khocircng

Xaacutec minh liecircn quan đến việc so saacutenh từng chi tiết kỹ thuật của hệ thống những gigrave đatilde được thực hiện cuối cugraveng

9 Một số caacutec biện phaacutep xaacutec nhận Độ chiacutenh xaacutec Khả năng thiacutech nghi Mức độ đầy đủ Bề rộng Độ sacircu Hiệu lực Tổng quan Chiacutenh xaacutec Hiện thực Độ tin cậy Tiacutenh hữu dụng Mức độ

Chương 9 Học maacutey

1 Logic mờ vagrave ngocircn ngữ mờ(Fuzzy Logic and Linguistic Ambiguity)

Ngocircn ngữ tự nhiecircn gồm những khaacutei niệm mơ hồ vagrave khocircng chiacutenh xaacutectruyền tải ngữ nghĩa thocircng qua tiacutenh xấp xỉkhocircng rotilde ragraveng

Những xấp xỉ nagravey giuacutep con người coacute thể truyền tải hết được yacute nghĩa nhưng maacutey thigrave khocircng hiểu

Lagravem sao biểu diễn caacutec tri thức sử dụng caacutec khaacutei niệm khocircng rotilde ragraveng(mờ) hoặc khocircng chiacutenh xaacutec

2 Khaacutei niệm cơ bản của logic mờ tập mờ lagrave những tập hợp khocircng coacute một giới hạn rotilde Mỗi phần tử của noacute chỉ

chứa một mức độ hagravem liecircn thuộc của từng phần tử Vigrave vậy tập mờ khocircng giống như tập cổ điển Tập mờ coacute thể kết hợp với nhau qua những luật mờ magrave đặc trưng cho những hagravenh động trạng thaacutei vagrave thuộc tiacutenh của logic mờ được tận dụng khi thực hiện một bộ điều khiển mờ

Logic mờ dựa trecircn yacute tưởng mỗi phần tử thuộc vagraveo một tập hợp ở một mức độ nagraveo đấy

Locircgic mờ cho pheacutep độ liecircn thuộc (microA )coacute giaacute trị trong khoảng (01) Locircgic mờ coacute thể được coi lagrave mặt ứng dụng của lyacute thuyết tập mờ để xử lyacute caacutec

giaacute trị trong thế giới thực cho caacutec bagravei toaacuten phức tạp

3 So saacutenh tiacutenh đuacuteng đắn logic mờ vagrave xaacutec suất Xaacutec suất thigrave đề cập đến khả năng xảy ra một biến cố hay một điều gigrave đoacute Logic mờ đề cập đến cấp độ magrave đặc tiacutenh ở hiện tại

o viacute dụ1 người coacute chiều cao 6 feet thigrave coacute cấp độ lagrave 05 về chiều cao

4 Ưu điểm của logic mờ Caacutech tiếp cận rất tự nhiecircnkhocircng phức tạp Coacute thể mocirc higravenh hoacutea caacutec hagravem phi tuyến tugravey yacute phức tạp

Coacute thể tận dụng được kinh nghiệm từ những chuyecircn gia hagraveng đầu trong mọi lĩnh vực

Logic mờ được xacircy dựng dựa trecircn ngocircn ngữ tự nhiecircnNền tảng của logic mờ lagrave dựa trecircn cơ sở giao tiếp của con người

5 Nhược điểm của logic mờ Trong 1 hệ thống phức tạpsử dụng logic mờ coacute thể trở thagravenh trở ngại cho

việc xaacutec thực độ tin cậy của hệ thống Cơ chế lập luận mờ khocircng thể học hỏi từ những lỗi sai

6 Mạng noron nhacircn tạo(ANN) Mạng noron nhacircn tạo lagrave một mocirc phỏng xử lyacute thocircng tinđược nghiecircn cứu ra

từ hệ thống thần kinh của sinh vậtgiống như bộ natildeo để xử lyacute thocircng tin ANNs lagrave chương trigravenh dựa trecircn maacutey tiacutenh đơn giản coacute chức năng lagrave một mocirc

higravenh bagravei toaacuten khocircng gian dựa trecircn thử nghiệm vagrave baacuteo lỗi

7 Học từ kinh nghiệm Tiến trigravenh Một mẫu dữ liệu được biểu diễn như một mạng lưới noronANN ldquodự

đoaacutenrdquo 1 đầu radự đoaacuten được so saacutenh với giaacute trị thực tế hoặc giaacute trị chiacutenh xaacutecNếu đoaacuten được chiacutenh xaacutec thigrave khocircng coacute hagravenh động nagraveo được thực hiện

Nếu dự đoaacuten sai ANN kiểm tra lại vagrave xaacutec định lại thocircng số để điều chỉnh Một mẫu dữ liệu khaacutec được biểu diễn vagrave quaacute trigravenh nagravey được lặp lại

8 Nguyecircn tắc cơ bản của cocircng nghệ nơron Caacutec yếu tố xử lyacute cơ bản trong hệ thống thần kinh của con người lagrave tế bagraveo

thần kinhMạng lưới của tế bagraveo nagravey lagrave liecircn kết với nhau nhận được thocircng tin từ caacutec cảm biến trong mắt taihellip

Thocircng tin nhận được bởi tế bagraveo thần kinh hoặc lagrave sẽ kiacutech thiacutech noacute(sẽ được chuyển qua 1 thocircng điệp dọc theo mạng lưới) hoặc lagrave sẽ ngăn cản noacute(ngăn cản dograveng thocircng tin)

Độ nhạy coacute thể thay đổi qua thời gian hoặc sau khi coacute được kinh nghiệm

9 Cấu truacutec mạng Một ANN gồm 3 lớp cơ bản

Lớp đầu vagraveo nhận dữ liệu Lớp becircn trong hoặc lagrave lớp ẩn xử lyacute dữ liệu Lớp đầu ra chuyển tiếp kết quả cuối cugraveng của mạng

10Mạng nơ ron Thường coacute nhiều đầu vagraveo mỗi đầu vagraveo với mức ảnh hưởng vagrave tầm quan

trọng riecircng của noacute Một đầu vagraveo quan trọng coacute thể được sử dụng để khuếch đại đầu ra caacutec hagravem trạng thaacutei tổng hợp caacutec trọng số của caacutec yếu tố

đầuvagraveo khaacutec nhauvagraveo một giaacute trị duy nhất Caacutec hagravem chuyển giao xử lyacute caacutec giaacute trị trạng thaacutei vagrave tạo đầu ra

11Huấn luyện mạng nơ ron Trong mocirc higravenh coacute giaacutem saacutetANN được đến so saacutenh dự đoaacuten của chiacutenh

noacute với thocircng tin phản hồi coacute chứa caacutec kết quả mong muốn ANN sẽ phải tigravem caacutech thay đổi caacutec tham số becircn trong củamigravenh (caacutec trọng số vagrave caacutec ngưỡng) để tạo necircn một aacutenh xạ coacute khả năng aacutenh xạcaacutec đầu vagraveo thagravenh caacutec đầu ra mong muốn Sự thay đổi nagravey được tiến hagravenh nhờ việc so saacutenh giữa đầu ra thực sự vagrave đầu ra mong muốn

Trong mocirc higravenh khocircng coacute giaacutem saacutetANN nhận được dữ liệu vagraveo nhưng khocircng phải coacute bất kỳ thocircng tin phản hồi về kết quả mong muốn

Phần lớn caacutec ứng dụng nằm trong vugraveng của caacutec bagravei toaacuten ước lượng như mocirc higravenh hoacuteathống kecirc neacuten lọc phacircn cụm

12Lợi iacutech Liecircn kết với mạng noron Traacutenh caacutech lập trigravenh tường minh Giảm nhu cầu của chuyecircn gia ANNs thigrave thiacutech nghi với caacutec yếu tố đầu vagraveo thay đổi Khocircng cần thiết cho cơ sở tri thức tinh chế ANNs coacute tiacutenh động vagrave cải thiện với việc sử dụng Coacute khả năng xử lyacute dữ liệu khocircng chiacutenh xaacutec hoặc khocircng đầy đủ Cho pheacutep tổng quaacutet hoacutea từ thocircng tin cụ thể Cho pheacutep thu thập cảm giaacutec thocircng thường vagraveo miền giải quyết vấn đề

13Hạn chế của việc liecircn kết với mạng noron ANNs khocircng thể giải thiacutech được suy luận Bản chất hộp đen thường khiến cho vấn đề traacutech nhiệm vagrave độ tin cậy phaacutet

sinh lagrave khoacute khăn Lặp đi lặp lại quaacute trigravenh huấn luyện rất tốn thời gian Nguồn lực caacutec nhagrave phacircn tiacutech vagrave thiết kế coacute tay nghề cao vẫn lagrave đaacuteng lo

ngại Cocircng nghệ ANN thuacutec đẩy hạn chế của phần cứng hiện tại ANN yecircu cầu phải coacute sự tin tưởng ở đầu ra

14Giới thiệu về thuật toaacuten di truyền Cũng như mạng lưới thần kinh caacutec thuật toaacuten di truyền được dựa trecircn lyacute

thuyết sinh học Thuật toaacuten di truyền tigravem thấy nguồn gốc của chuacuteng trong caacutec lyacute thuyết

tiến hoacutea của chọn lọc tự nhiecircn vagrave thiacutech ứng với biến đổi khiacute hậu Kết quả thuật toaacuten di truyền lagrave từ giao phối 2 caacute thể trong quần thế để tạo

ra con caacutei đocirci khi tốt hơn so với bậc cha mẹ của chuacuteng 15Caacutec thagravenh phần cơ bản của thuật toaacuten di truyền

Toaacuten tử chọn lọc Caacutec caacute thể tốt được chọn lọc để đưa vagraveo thế hệ sau Sự chọn lọc nagravey căn cứ vagraveo độ thiacutech nghi với mocirci trường của mỗi caacute thể

Toaacuten tử lai gheacutep (crossover) Hai caacute thể cha vagrave mẹ trao đổi caacutec gen với nhau để tạo ra caacute thể con

Toaacuten tử đột biến (mutation) Một caacute thể thay đổi một số gen để biến đổi thagravenh một caacute thể mớiTất cả caacutec toaacuten tử trecircn khi thực hiện đều mang tiacutenh ngẫu nhiecircn

16Quaacute trigravenh cơ bản của một thuật toaacuten di truyền Khởi tạo

Đaacutenh giaacute quần thể

Lựa chọn NST thiacutech hợp nhất vagrave loại bỏ NST yếu nhất

Quy trigravenh giao nhau vagrave cải thiện quần thể

đột biến tiến trigravenh để khaacutem phaacute ra NST mới

17Ưu nhược điểm của việc kết hợp với thuật toaacuten di truyền Kiacutech thước quần thể lagrave 1 yếu tố quan trọng trong tốc độ của việc tigravem

kiếmnhưng noacute tương đối dễ dagraveng để dự đoaacuten tốc độ nagravey Giao nhau hoặc đột biến lagrave khocircng necircn đc sử dụng quaacute thường xuyecircn Luocircn coacute được iacutet nhất 1 giải phaacutep hợp lyacute Necircn coacute thể aacutep dụng chuacuteng cho caacutec vấn đề magrave chuacuteng ta khocircng coacute hướng

về caacutech giải quyết Sức mạnh của thuật toaacuten xuất phaacutet từ khaacutei niệm đơn giảnkhocircng phải từ

một thủ tục thuật toaacuten phức tạp 18Tương lai của học maacutey

Mạng lưới thần kinh nhacircn tạo vượt quaacute năng lực của con người trong caacutec trường hợp bị cocirc lập

Về mặt lyacute thuyếtmột maacutey tiacutenh coacute thể xử lyacute dũ liệu nhanh hơn hagraveng triệu lần so với 1 con người

May mắn thay cho chuacuteng tacon người tốt hơn nhiều khi magrave coacute được dữ liệumaacutey tiacutenh khocircng coacute 1 số thứ như lagrave 5 giaacutec quan

CHƯƠNG 10 KHO DỮ LIỆU

1 Kho dữ liệu Kho dữ liệu lagrave tuyển tập caacutec cơ sở dữ liệu tiacutech hợp hướng chủ đề được

thiết kế để trợ giuacutep cho một hệ hỗ trợ quyết định

Theo John Ladley Cocircng nghệ kho dữ liệu lagrave tập caacutec phương phaacutep kỹ thuật vagrave caacutec cocircng cụ coacute thể kết hợp hỗ trợ nhau để cung cấp thocircng tin cho người sử dụng trecircn cơ sở tiacutech hợp từ nhiều nguồn dữ liệu nhiều mocirci trường khaacutec nhau

Kho dữ liệu thường rất lớn tới hagraveng trăm GB hay thậm chiacute hagraveng Terabyte

2 Kho dữ liệu vận hagravenh (ODS) Một kho dữ liệu vận hagravenh Aacutep dụng kỹ thuật kho dữ liệu vagraveo caacutec hệ xử

lyacute giao taacutec lưu trữ dữ liệu cho một ứng dụng đặc thugrave Noacute đưa vagraveo kho dữ liệu một dograveng caacutec dữ liệu thocirc được thiết kế

3 So saacutenh

Kho dữ liệu vận hagravenh Kho dữ liệu

Dữ liệu theo chủ đề Dữ liệu theo chủ đề

Dữ liệu tiacutech hợp Dữ liệu tiacutech hợp

Dữ liệu thay đổi Dữ liệu khocircng thay đổi

Dữ liệu được cập nhật khi thay đổi

Dữ liệu giữ nguyecircn

Chỉ coacute dữ liệu hiện tạiDữliệu hiện tại vagrave dữ liệu lịch sử

Chu kỳ lagravem tươi dữ liệu ngắn Chu kỳ lagravem tươi dữ liệu dagravei

Chỉ coacute dữ liệu chi tiết Dữ liệu chi tiết vagrave dữ liệu tổng kết

Dugraveng cho caacutec quyết định ngắn hạn

Dugraveng cho hoạch định dagravei hạn

4 Kho dữ liệu cục bộ (Data Mart - DM)

Kho dữ liệu cục bộ lagrave CSDL coacute những đặc điểm giống với kho dữ liệu nhưng với quy mocirc nhỏ hơn vagrave lưu trữ dữ liệu về một lĩnh vực một chuyecircn ngagravenh

Data mart phụ thuộc Chứa những dữ liệu được lấy từ DW vagrave những dữ liệu nagravey sẽ được triacutech lọc vagrave tinh chế tiacutech hợp lại ở mức cao hơn để phục vụ một chủ đề nhất định của Datamart

Data mart độc lập Khocircng giống như Datamart phụ thuộc Data mart độc lập được xacircy dựng trước DW vagrave dữ liệu được trực tiếp lấy từ caacutec nguồn khaacutec nhau

5 Siecircu dữ liệu Metadata lagrave dữ liệu để mocirc tả dữ liệu Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột

một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi Metadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu

6 Mocirci trường kho dữ liệu Hệ thống của tổ chức vagrave kho cung cấp dữ liệu để xacircy dựng kho dữ liệu Trong quaacute trigravenh chuyển dữ liệu từ caacutec nguồn khaacutec nhau dữ liệu coacute thể

được lagravem sạch hoặc chuyển đổi vagrave vigrave thế DW được xem như lagrave một chuẩn cho việc lưu trữ

Đồng thời siecircu dữ liệu được ghi lại Cuối cugraveng DW hoặc siecircu thị coacute thể được sử dụng để tạo ra một kho dữ

liệu ldquocaacute nhacircnrdquo 7 Caacutec đặc điểm của kho dữ liệu

Đặc điểm Mocirc tả

Hướng chủ đề - DL tổ chức theo caacutech thức người dugraveng tham chiếu

Tiacutech hợp - Dữ liệu ldquosạchrdquo loại bỏ tiacutenh thiếu nhất quaacuten

Khocircng thay đổi - DL ldquochỉ đọcrdquo người dugraveng khocircng thay đổi được

Chuỗi thời gian - DL lagrave chuỗi thời gian khocircng phải lagrave trạng thaacutei hiện tại

Được tổng kết - DL vận hagravenhthao taacutec khi cần thiết

được kết hợp lại thagravenh dạng coacute thể dugraveng được cho quyết định

Kiacutech cỡ lớn hơn - Lưu giữ theo chuỗi thời gian tức lagrave giữ lại nhiều DL

Khocircng được chuẩn hoacutea - Coacute thể dư thừa DLSiecircu dữ liệu - Dữ liệu của dữ liệu được lưu trữNguồn dữ liệu - DL vận hagravenh (caacutec hệ sẵn coacute) cugraveng

với caacutec nguồn ngoagravei 8 Kho dữ liệu hướng chủ đề

Hướng chủ để coacute nghĩa lagrave kho dữ liệu được tổ chức xung quanh caacutec chủ đề chiacutenh như khaacutech hagraveng sản phẩm sản xuất Tập trung vagraveo việc mocirc higravenh hoacutea vagrave phacircn tiacutech dữ liệu cho caacutec nhagrave ra quyết định magrave khocircng tập trung vagraveo caacutec xử lyacute thocircng thường Cung cấp cho người dugraveng một khung nhigraven toagraven vẹn đơn giản vagrave đầy đủ về caacutec sự kiện quanh caacutec chủ đề

9 Dữ liệu trong DW được tiacutech hợp Dữ liệu trong kho dữ liệu được xacircy dựng bằng caacutech tổng hợp dữ liệu từ

nhiều nguồn khaacutec nhau vagrave caacutec nguồn coacute tổ chức khaacutec nhau Cơ sở dữ liệu caacutec file excel caacutec flat file hoặc caacutec raw file Khi đưa vagraveo kho dữ liệu caacutec dữ liệu được lagravem sạch vagrave tiacutech hợp dữ liệu nhằm đảm bảo tiacutenh nhất quaacuten của dữ liệu

10Kiến truacutec kho dữ liệu Tầng cơ sở dữ liệu hoạt động Tầng truy xuất thocircng tin Tầng truy xuất dữ liệu Tầng siecircu dữ liệu Tầng quản lyacute tiến trigravenh Tầng thocircng điệp của ứng dụng Tầng vật liacute của kho dữ liệu Tầng trigravenh diễn dữ liệu

11Higravenh trạng kho dữ liệu Kho dữ liệu ảo - người dugraveng cuối coacute thể truy cập trực tiếp đến kho dữ liệu

sử dụng caacutec cocircng cụ cho pheacutep ở tầng truy xuất dữ liệu Kho dữ liệu trung tacircm-1 cơ sở dữ liệu vật lyacute chứa tất cả dữ liệu cho một

vugraveng chuyecircn dụng nagraveo đoacute

Kho dữ liệu phacircn taacuten- Thagravenh phần được phacircn taacuten qua nhiều hệ cơ sở dữ liệu vật lyacute

12METADATA- Siecircu dữ liệu Định nghĩa Siecircu dữ liệu lagrave dữ liệu về dữ liệu Lagrave 1 lưu trữ dugraveng để

Miecircu tả kho dữ liệu tổng thể Nhận dạng kiểu kho dữ liệu Quản liacute quaacute trigravenh tiacutech hợp dữ liệu Quản liacute quaacute trigravenh cập nhật kho dữ liệu Quản liacute bảo mật

Lagrave chigravea khoacutea quyết định sự thagravenh cocircng của kho dữ liệu luocircn được thay đổi vagrave cập nhật theo sự phaacutet triển của kho dữ liệu

Dugraveng để quản liacute điều khiển kho dữ liệu Sự ra đời của kho dữ liệu như 1 cấu truacutec hỗ trợ ra quyết định siecircu dữ liệu

được xem như nguồn tagravei nguyecircn dữ liệu Siecircu dữ liệu lagrave trừu tượng Chuacuteng lagrave dữ liệu bậc cao cung cấp mocirc tả ngắn

gọn caacutec dữ liệu bậc thấp hơn 13Hoạt động của Siecircu dữ liệu

Siecircu dữ liệu rất cần thiết trong việc chuyển hoacutea thocircng tin trở thagravenh tri thức Lagrave chigravea khoacutea giuacutep chuacuteng ta xử lyacute được dữ liệu thocirc Viacute dụ một dograveng dữ liệu baacuten hagraveng 1023 K596 11121 agraveNoacute sẽ khocircng coacute nghĩa gigrave cho đến khi chuacuteng ta đưa vagraveo siecircu dữ liệu (thư

mục chứa dữ liệu) agrave cửa hagraveng 1023 sản phẩm K596 vagrave số tiền baacuten được lagrave 11121 đocirc la

14Sự cần thiết phải nhất quaacuten trong kho dữ liệu Kho dữ liệu được xacircy dựng cho lợi iacutech của những nhagrave phacircn tiacutech kinh

doanh caacutec nhagrave quản trị cho tất cả caacutec khu vực chức năng Trong cơ sở dữ liệu riecircng caacutec khu vực khaacutec nhau coacute thể định nghĩa vagrave lưu

trữ dữ liệu thocircng qua phiecircn bản của chiacutenh noacute Khi dữ liệu được lấy từ những vugraveng khaacutec nhau đoacute vagrave được đặt vagraveo kho dữ

liệu Việc chuyển đổi vagrave lagravem sạch caacutec tiến trigravenh sẽ đảm bảo noacute lagrave duy nhất được tiacutech hợp tại một mức của tổ chức

15Ragrave soaacutet lại dữ liệu ndash Thực thi siecircu dữ liệu

Bất kể cấu truacutec tự nhiecircn của 1 cacircu truy vấn thế nagraveo thigrave caacutec thagravenh phần của siecircu dữ liệu rất quan trọng đối với người ra quyết định

Bảng thuộc tiacutenh khoacutea được lưu trữ bởi kho dữ liệu Tập hợp dữ liệu được lấy từ đacircu Những chuyển đổi nagraveo được thực thi với việc lagravem sạch

16Siecircu dữ liệu lagrave gigrave Metadata - lagrave thocircng tin mocirc tả nội dung của cơ sở dữ liệu (CSDL) Metadata baacuteo cho người dugraveng biết thời gian cập nhật sau cugraveng của dữ liệu

định dạng vagrave mục điacutech sử dụng của noacute Những thocircng tin nagravey coacute thể hướng dẫn người dugraveng duyệt qua CSDL vagrave

giuacutep họ hiểu được yacute nghĩa vagrave ngữ cảnh của dữ liệu Trong CSDL metadata lagrave caacutec dạng biểu diễn khaacutec nhau của caacutec đối tượng

trong CSDL Trong CSDL quan hệ metadata lagrave caacutec định nghĩa của bảng cột CSDL

view vagrave nhiều đối tượng khaacutec Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột

một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi -gtMetadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu

Bảng chuyển đổi Ghi lại những chuyển đổi đatilde được thực hiện

Lịch sử thực thi Ghi lại những dữ liệu đatilde được

phacircn tiacutech

Higravenh thaacutei kết nốiGhi lại những dữ liệu được kết nối vagrave tần suất

17Aacutenh xạ thocircng thường của siecircu dữ liệu Bản ghi aacutenh xạ chuyển đổi bao gồm

Định danh của nguồn gốc Chuyển đổi thuộc tiacutenh Chuyển đổi thuộc tiacutenh vật lyacute Matilde hoacutea tham chiếu bảng chuyển đổi Đổi tecircn Đổi khoacutea Gaacuten giaacute trị cho thuộc tiacutenh mặc định Chọn logic cho caacutec nguồn nhiều giaacute trị Đổi thuật toaacuten

18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để

phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai

lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave

tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec

Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm

Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo

19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua

caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau

SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được

Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra

một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức

Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ

Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ

Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech

CHƯƠNG 11 KHAI PHAacute DỮ LIỆU

1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn

ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993

Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng

2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd

1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều

2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP

3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn

4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng

5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server

6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo

7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động

8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời

9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều

10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện

11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech

12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP

3 Xử lyacute phacircn tiacutech trực tuyến OLAP

MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave

dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu

ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave

thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu

HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave

ROLAP4 Khai phaacute dữ liệu

Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh

khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn

Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan

5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp

6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại

Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp

Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec

Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt

Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra

Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh

vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho

Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec

Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm

Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục

Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng

gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp

Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn

Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec

Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper

Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2

Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25

Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước

Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng

Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện

trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp

Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute

độ hỗ trợ ge ngưỡng minsup

độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan

Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn

Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết

Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu

MOLAP ROLAP HOLAP

Lưu trữ dữ liệu cơ sở

Khối Bảng quan hệ Bảng quan hệ

Lưu trữ thocircng tin tổng hợp

Khối Bảng quan hệ Khối

Hiệu suất thực hiện truy vấn

Nhanh nhất Chậm nhất Nhanh

Tiecircu thụ khocircng gian lưu trữ

Nhiều Thấp Trung bigravenh

Chi phiacute bảo trigrave Cao Thấp Trung bigravenh

Page 18: De cuong(1-11)

phương phaacutep khai mỏ dữ liệu (data mining)bull Hầu hết caacutec hệ thống phacircn tiacutech đa chiều được nhuacuteng trong caacutec hệ xử lyacute phacircn tiacutechtrực tuyến (HXLPTTT ndash online analytic processing - OLAP)bull Mục tiecircu của XLPTTT nắm bắt cấu truacutec của dữ liệu thực để hỗ trợ ra quyết địnhbull Trong HHTQĐ coacute sự gắn nối tự nhiecircn giữa mocirc higravenh hoacutea dữ liệu mocirc higravenh hoacutea kyacutehiệu vagrave caacutec khiacutea cạnh của phacircn tiacutech ldquowhat-ifrdquobull Caacutec baacuteo caacuteo của HXLPTTT đều coacute tiacutenh tương taacutec dễ khai thaacutec sử dụng đặc biệtphugrave hợp cho caacutec baacuteo caacuteo về chỉ số hiệu năng chủ yếu (key performance indicators- KPI) baacuteo caacuteo về đo lường hiệu năng kinh doanh bull Thế hệ hiện tại của HXLPTTT vagrave hệ khai mỏ dữ liệu (data mining) tiacutech hợp caacutecđặc tiacutenh của hệ thocircng tin latildenh đạo (executive information system ndashEIS- nhiềucaacutech nhigraven dữ liệu chi tiết hoacutea theo nhu cầu) vagrave caacutec hệ đồ họa khaacutec ndash thường coacutegiao diện người dugraveng dạng kiểu WEBbull Caacutec hệ thống như trecircn cograven được gọi lagrave caacutec cocircng cụ triacute tuệ kinh doanh (businessintelligence - BI) vigrave coacute caacutec đặc trưng về mocirc higravenh hoacutea vagrave tối ưu hoacutea nhưng lạitrong suốt đối với ngươigrave dugravengbull Hiện caacutec cocircng cụ được đưa ra bởi caacutec nhagrave cung cấp về CSDL về hoạch định tagraveinguyecircn tổ chức (ERP) về nhagrave kho dữ liệu (data warehouse) về HXLPTTT MOcirc HIgraveNH HOacuteA VAgrave MOcirc PHỎNG TƯƠNG TAacuteC TRỰC QUANbull Iacutech lợi Người ra quyết định tham gia vagraveo quaacute trigravenh phaacutet triển mocirc higravenh vagrave thựcnghiệm mocirc phỏng vigrave vậy sẽ tin tưởng khi sử dụng mocirc higravenhbull Mocirc higravenh hoacutea tương taacutec trực quan (visual interactive modeling - VIM) dugraveng caacutecbiểu diễn đồ họa maacutey tiacutenh để trigravenh bagravey caacutec ảnh hưởng của caacutec quyết định quản lyacutekhaacutec nhau ở một thời điểm (tĩnh) hay tiến triển theo thời gian (động với kỹ thuậthoạt higravenh)bull Mocirc phỏng tương taacutec trực quan (visual interactive simulation - VIS) cho pheacutepngười dugraveng theo dotildei tiến trigravenh xacircy dựng vagrave sử dụng khai thaacutec mocirc higravenh mocirc phỏngdưới dạng hoạt higravenhbull Mocirc higravenh hoacutea tương taacutec trực quan coacute thể kết hợp với tiếp cận triacute tuệ nhacircn tạo đểđưa ra caacutec khả năng mới thay đổi từ xacircy dựng hệ thống dạng đồ họa đến tigravem hiểuvề động học của hệ thốngbull Cần đến caacutec hệ thống maacutey tiacutenh xử lyacute song song tốc độ cao để xacircy dựng caacutec mocircphỏng - phức tạp quy mocirc lớn dạng hoạt higravenh - mang tiacutenh khả thi ở thời gian thực

22Caacutec dạng hệ thống hỗ trợ ra quyết địnhHệ hỗ trợ quyết định nhoacutemRa quyết định nhoacutem giao tiếp vagrave cộng taacutec- Caacutec đặc điểm của cocircng việc nhoacutem+ Một nhoacutem thực hiện một nhiệm vụ thỉnh thoảng ra quyết định thỉnh thoảngkhocircng ra quyết định+ Caacutec thagravenh viecircn trong nhoacutem coacute thể ở những nơi khaacutec nhau

+ Caacutec thagravenh viecircn trong nhoacutem coacute thể lagravem việc ở những thời gian khaacutec nhau+ Caacutec thagravenh viecircn trong nhoacutem coacute thể lagravem việc cugraveng nhau hoặc ở caacutec tổ chức khaacutecnhau+ Nhoacutem coacute thể vĩnh viễn hoặc tạm thời+ Nhoacutem coacute thể ở bất kỳ mức quản lyacute nagraveo hoặc mức thời gian nagraveo+ Coacute sự điều phối (quaacute trigravenh vagrave nhiệm vụ đạt được) hoặc macircu thuẩn trongnhoacutem+ Coacute sự đạt được hoặcvagrave mất maacutet năng suất trong tổ chức+ Nhiệm vụ phải hoagraven thagravenh rất nhanh+ Khocircng thể hoặc quaacute đắt cho tất cả caacutec thagravenh viecircn trong nhoacutem cugraveng hợp ở mộtnơi+ Một số dữ liệu thocircng tin hoặc kiến thức cần thiết nằm ở nhiều nơi một sốkhaacutec ở ngoagravei tổ chức+ Chuyecircn mocircn của caacutec thagravenh viecircn khocircng coacute trong nhoacutem lagrave cần thiết- Caacutec hoạt động vagrave caacutec quaacute trigravenh miecircu tả caacutec cuộc họp+ Cuộc họp lagrave hoạt động chung liecircn quan bởi một nhoacutem người coacute địa vị bằngnhau hoặc gần bằng nhau+ Kết quả của cuộc họp phụ thuộc một phần vagraveo kiến thức yacute kiến caacutec đaacutenh giaacutecủa caacutec thagravenh viecircn+ Kết quả của cuộc họp cũng phụ thuộc vagraveo sự kết hợp của nhoacutem vagrave phụ thuộcvagraveo quaacute trigravenh ra quyết định được sử dụng bởi nhoacutem đoacute+ Giải quyết caacutec yacute kiến khaacutec nhau bởi người coacute quyền hạn hoặc thương lượnghoặc phacircn xửHỗ trợ giao tiếp- Giao tiếp lagrave thagravenh phần quan trọng cho hỗ trợ quyết định Khocircng coacute giao tiếp thigravekhocircng coacute cộng taacutec Những người ra quyết định caacute nhacircn phải giao tiếp với caacutecđồng nghiệp chuyecircn gia cơ quan chiacutenh phủ khaacutech hagraveng đối taacutec kinh doanh hellipHọ cũng cần dữ liệu vagrave thocircng tin (vagrave kiến thức) từ nhiều nơi trecircn thế giới Caacutecnhoacutem ra quyết định phải giao tiếp cộng taacutec vagrave thương lượng trong cocircng việcHầu hết caacutec tổ chức sẽ nhanh trở thagravenh khocircng coacute chức năng nếu khocircng coacute caacutec hệthống giao tiếp Thương mại điện tử coacute thể hiệu quả chỉ qua caacutec kỹ thuật giao tiếphiện đại- Caacutec kỹ thuật thocircng tin hiện đại cung cấp caacutec phương tiện hỗ trợ giao tiếp rẻnhanh coacute khả năng coacute thể tin cậy Nền tảng hỗ trợ giao tiếp lagrave caacutec hệ thống maacuteytiacutenh mạng+ Bắt đầu bằng điện baacuteo điện thoại radio vagrave ti vi+ Trong 100 năm chuacuteng ta phaacutet triển maacutey fax thư điện tử chương trigravenh chatnhoacutem tin tức hệ thống hội nghị truyền higravenh Hầu hết caacutec kỹ thuật nagravey đềuhoạt động trecircn internet+ Sự phaacutet triển giao tiếp sau cugraveng lagrave hệ thống họp điện tử caacutec dịch vụ vagrave hệ

thống hội nghị điện tử thường sử dụng internet để kết nối caacutec người ra quyếtđịnh- Caacutec thuận lợi aacutep dụng caacutec phương phaacutep giao tiếp cải tiến trong caacutec tổ chức+ Cải tiến năng suất của nhacircn viecircn+ Liecircn quan đến nhiều người ra quyết định chiacutenh+ Khocircng quan tacircm nhiều đến đường biecircn giới địa lyacute+ Tạo nền văn hoacutea hợp taacutec nhất quaacuten+ Cải tiến chất lượng cuộc sống của nhacircn viecircnHỗ trợ cộng taacutec Maacutey tiacutenh hỗ trợ cộng taacutec- Khung thời giannơi chốn+ Sự hiệu quả của kỹ thuật tiacutenh toaacuten cộng taacutec phụ thuộc vagraveo vị triacute của caacutec thagravenhviecircn trong nhoacutem vagrave phụ thuộc vagraveo thời gian chia sẽ thocircng tin gởi vagrave nhận+ Chia sự giao tiếp thagravenh bốn ocirc vagrave tổ chức bốn ocirc dọc theo 2 chiều thời gian vagravenơi chốn1048713 Thời gian Khi gởi vagrave nhận thocircng tin hầu như đồng thời giao tiếp lagrave đồngthời Viacute dụ Điện thoại ti vi vagrave caacutec cuộc họp gặp mặt nhau Giao tiếp bấtđồng bộ xảy ra khi người nhận nhận thocircng tin ở thời điểm khaacutec thời điểmgởi thocircng tin đoacute1048713 Nơi chốn Người gởi vagrave người nhận coacute thể ở cugraveng phograveng hoặc khocircng+ Bốn ocirc lagrave1048713 Cugraveng thời giancugraveng nơi chốn Caacutec thagravenh viecircn gặp mặt nhau cugraveng một luacutecgiống như phograveng quyết định hoặc gặp mặt truyền thống1048713 Cugraveng thời giankhaacutec nơi chốn Caacutec thagravenh viecircn ở caacutec nơi khaacutec nhau nhưnggiao tiếp cugraveng nhau Viacute dụ hội nghị truyền higravenh (videoconferencing)1048713 Khaacutec thời giancugraveng nơi chốn Nhiều người lagravem việc theo ca Ca nagravey để lạithocircng tin cho ca khaacutec1048713 Khaacutec thời giankhaacutec nơi chốn Caacutec thagravenh viecircn ở caacutec nơi khaacutec nhau Caacutecthagravenh viecircn nagravey gởi vagrave nhận thocircng tin ở những lần khaacutec nhau

23Thực thi hệ DSSHệ thống hỗ trợ quản lyacute (MSS) khocircng phải luacutec nagraveo cũng luocircn thagravenh cocircng Nhiều trường hợpthất bại của ES khocircng hoagraven toagraven lagrave lyacute do kỹ thuật Thực thi hệ thống lagrave một quaacute trigravenh liecircn tụcnhằm đảm bảo cho tổ chức chuẩn bị tiếp nhận một hệ thống mới vagrave đưa hệ thống vagraveo sử dụngthagravenh cocircngThực hiện cocircng nghệ hệ thống hỗ trợ quản lyacute lagrave việc phức tạp vigrave caacutec hệ thống nagravey khocircng đơnthuần lagrave hệ thống thocircng tin chỉ thu thập thao taacutec vagrave phacircn phối thocircng tin Magrave xa hơn chuacuteng

liecircn quan tới caacutec cocircng việc coacute thể lagravem thay đổi đaacuteng kể caacutech thức hoạt động của tổ chức Tuyvậy đa số caacutec yếu tố thực thi đều liecircn quan tới hệ thống thocircng tinThực thi MSS lagrave quaacute trigravenh liecircn tục diễn ra trong suốt thời gian phaacutet triển hệ thống từ đề xuấtban đầu đến nghiecircn cứu khả thi thiết kế vagrave phacircn tiacutech hệ thống lập trigravenh huấn luyện chuyểnđổi vagrave lắp đặt Caacutec chuyecircn gia hệ thống thocircng tin thường gọi thực thi lagrave giai đoạn cuối trongvograveng đời hệ thống Định nghĩa thực thi MSS phức tạp hơn vigrave bản chất lặp của sự phaacutet triểncaacutec hệ thống

THỰC THI KHOcircNG HOAgraveN CHỈNHCaacutec quyết định về tiacutenh khả thi thường coacute giả định về lợi iacutech đạt được khi kế hoạch thực thiđược thực hiện hoagraven toagraven Trong thực tế thường chỉ thực hiện 90 thậm chiacute 70 phần trăm sovới phacircn tiacutech khả thi Lyacute do lagrave sự thay đổi tại một nơi trong hệ thống coacute thể ảnh hưởng vagrave coacutethể taacutec động tiecircu cực đến chỗ khaacutec Do vậy cấp quản lyacute coacute thể bỏ những phần trong dự aacuten coacutethể gacircy ra taacutec động xấu Do đoacute dự aacuten sẽ thực hiện iacutet hơn 100 so với dự aacuten kế hoạch Caacutec lyacutedo khaacutec coacute thể lagrave do khấu trừ ngacircn saacutech hoặc vượt chi phiacuteĐAacuteNH GIAacute SỰ THAgraveNH COcircNG CỦA THỰC THI HỆ THỐNGPhải coacute caacutec chỉ số đo lường thigrave mới coacute thể đaacutenh giaacute sự thagravenh cocircng khi thực thi một hệ thốngDickson va Powers (1973) đề ra 5 tiecircu chuẩn độc lậpbull Tỷ lệ thời gian thực hiện dự aacuten với thời gian ước lượngbull Tỷ lệ chi phiacute thực tế vagrave ngacircn saacutech thực hiệnbull Thaacutei độ của cấp quản lyacute đối với hệ thốngbull Nhu cầu thocircng tin của caacutec nhagrave quản lyacute được đaacutep ứng như thế nagraveo qua hệ thốngbull Taacutec động của dự aacuten đối với những hoạt động maacutey tiacutenh trong cocircng tyCaacutec đo lường khaacutec để đaacutenh giaacute thagravenh cocircng của hệ hỗ trợ quản lyacute (MSS)bull Sự sử dụng hệ thống (dự định dugraveng hoặc thực sự dugraveng)bull Thỏa matilden của người dugravengbull Thaacutei độ taacuten thagravenhbull Mức độ hệ thống hoagraven thagravenh caacutec mục tiecircu ban đầubull Phần thưởng đối với tổ chức (giảm chi phiacute tăng doanh thuhellip)bull Tỷ số lợi iacutech chi phiacute

bull Mức độ thể chế hoacutea của MSS trong tổ chứcDo bởi tiacutenh đa dạng của DSS necircn việc đaacutenh giaacute sự thagravenh cocircng của hệ nagravey cũng khoacute khăn tuynhiecircn cũng coacute thể coacute một số yếu tố giuacutep cho DSS thagravenh cocircng như sự tham gia người dugravenghuấn luyện người dugraveng hỗ trợ quản lyacute cấp cao nguồn thocircng tin đặc điểm của những nhiệmvụ coacute liecircn quan (cấu truacutec bất định độ khoacute phụ thuộc)

Chương5Nhoacutem hỗ trợ quyết định vagrave nhoacutemcocircng nghệ phần mềm

51Nhoacutem tạo quyết định

MDM-Holsapple đatilde gợi yacute chuacuteng ta sử dụng giới hạn người tạo quyết định

Một nhoacutem lagrave kết cấu MDM nơi magrave nhiều người ra quyết định hoagraven toagraven tương taacutec

Một đội lagrave kết cấu MDM nơi caacutec thagravenh viecircn tư vấn cho người đưa ra quyết định nhưng khocircng tương taacutec

Một Ủy ban lagrave kết cấu MDM với một người tạo quyết định duy nhất vagrave sự tương taacutec giữa caacutec thagravenh viecircn

Mạng thocircng tin

Mạng lưới baacutenh xe mỗi người tham gia coacute thể giao tiếp với người đưa ra quyết định ở trung tacircm nhưng khocircng phải với người tham gia khaacutecCấu truacutec nagravey lagrave khocircng thỏa matilden tất cả những người tham gia ngoại trừ người ra quyết định

Mạng dacircy chuyền Tham gia chuyển tiếp thocircng tin chỉ để noacute luocircn liền kề nhau trong chuỗi

Thagravenh viecircn cuối cugraveng ko được đaacutep ứng

Mạng vograveng trograven Tương tự như chuỗi nhưng kết thuacutec được kết nối

Mạng kết nối hoagraven toagraven khocircng coacute hạn chế về giao tiếp vagrave tương taacutec giữa caacutec thagravenh viecircnNoacutei chungnoacute đaacutep ứng hầu hết caacutec kết nối của người tham gia nhưng truyền đạt thocircng tin mất nhiều thời gian vagrave coacute nhiều cơ hội xảy ra lỗi

Nhoacutem hagravenh vi vagrave chuẩn mực

MDMs thiết lập caacutec chỉ tiecircu hướng dẫn quaacute trigravenh ra quyết định

Một chuẩn mực quy định cụ thể những gigrave thagravenh viecircn trong nhoacutem dự kiến sẽ lagravem trong những hoagraven cảnh nhất định

Quy tắc gửi coacute thể được thocircng qua viacute dụ đaacutenh giaacute ngang hagraveng hoặc xử phạt

Lagravem thế nagraveo để đưa ra quyết định

Việc chọn lựa magrave trong đoacute việc sử dụng cấu truacutec MDM phải được dựa trecircn một số yếu tố liecircn quan với bối cảnh quyết định

Viacute dụmột cấu truacutec riecircng lẻ sẽ lagravem việc nơi magrave quyết định được cấu truacutec cao vagrave thocircng tin lagrave coacute sẵn

Một ủy ban cơ cấu sẽ lagrave sự lựa chọn khi người ra quyết định khocircng thể đưa ra quyết định một migravenh

52Caacutec vấn đề thường gặp trong nhoacutem

Kiacutech thước Noacutei chung sự nhất triacute vagrave gắn kết giữa caacutec thagravenh viecircn tỉ lệ nghịch với phạm vi nhoacutem Trong nhoacutem lớn rất dễ higravenh thagravenh caacutec nhoacutem nhỏ vagrave hoạt động rời rạc

Tư duy tập thể Trong nhoacutem lớn mọi người coacute xu hướng suy nghĩ đểđạtđược sự nhất triacute necircn khocircng phaacutet huy được sự saacuteng tạo

Caacutec vấn đề về xatilde hội

Xung đột Trong 1 nhoacutem ai cũng muốn migravenh lagrave giỏi nhất necircn dễ dẫn đến xung đột

Ẩn danh(Giấu tecircn) Đacircy lagrave phương phaacutep được sử dụng để kiểm soaacutet xung đột Cho caacutec thagravenh viecircn tham gia ẩn danh

Vấn đề giới tiacutenh Nam vagrave nữ thường coacute những thế mạnh khaacutec nhau điều nagravey coacute thể lagrave sức mạnh trong 1 thiết lập MDM

Đagravem phaacuten vagrave quyết định

Một quyết định coacute thể liecircn quan đến nhiều quan điểm khaacutec nhau vigrave thế cần phải coacute sự đagravem phaacuten

Caacutec thiết kế của cơ chế hỗ trợ cho MDM phải phugrave hợp với caacutec hoạt độngđagravemphaacuten

Những hoạt động nagravey bao gồm việc thu nhận yacute kiến của caacutec thagravenh viecircn 1 caacutech cocircng bằng

53Cocircng nghệ hỗ trợ MDM

Organizational DSSndash 1 hệ thống cung cấp caacutec quyết định hỗ trợ

Group Support Systemndash Cocircng nghệ sử dụng sự hỗ trợ của nhiều becircn tham gia

Group DSS ndash Lagrave 1 hệ thống được thiết kế đặc biệt để hỗ trợ cho MDM

DSS ndash Lagrave 1 hệ thống dưới sự kiểm soaacutet của 1 người quyết định hệ thống nagravey cung cấp 1 bộ cocircng cụ giuacutep phacircn tiacutech hoagraven cảnh đểđưa ra quyết định vagrave nacircng cao hiệu quả của quyết địnhđoacute

53Cocircng nghệ hỗ trợ MDM

Organizational DSSndash 1 hệ thống cung cấp caacutec quyết định hỗ trợ

Group Support Systemndash Cocircng nghệ sử dụng sự hỗ trợ của nhiều becircn tham gia

Group DSS ndash Lagrave 1 hệ thống được thiết kế đặc biệt để hỗ trợ cho MDM

DSS ndash Lagrave 1 hệ thống dưới sự kiểm soaacutet của 1 người quyết định hệ thống nagravey cung cấp 1 bộ cocircng cụ giuacutep phacircn tiacutech hoagraven cảnh đểđưa ra quyết định vagrave nacircng cao hiệu quả của quyết địnhđoacute

Mục tiecircu của cocircng nghệ hỗ trợ MDM

Quy trigravenh hỗ trợ tập trung vagraveo quaacute trigravenh tạo điều kiện thuận lợi cho sự tương taacutec

Cơ chế cấu truacutec quaacute trigravenh chi phối caacutec hoạt động truyền thocircng

Nhiệm vụ hỗ trợ cocircng việc coacute thể chọn lựa tổ chức hoặc lấy thocircng tin

Nhiệm vụ cấu truacutec cocircng việc cho pheacutep truy cập đến kỹ thuật lọc kết hợp phacircn tiacutech kiến thức liecircn quan đến cocircng việc

Caacutec lớp loại cocircng nghệ hỗ trợ MDM

Phacircn loại theo đặc điểm do DeSanctis vagrave Gallupe đưa ra đề xuất một chương trigravenh ba cấp dựa trecircn caacutec tiacutenh năng được cung cấp

Hệ thống cấp 1 Mục điacutech chiacutenh lagrave tạo điều kiện thocircng tin liecircn lạc giữa caacutec thagravenh viecircn

Hệ thống cấp 2 Thiết kế để giảm thiểu rủi ro

Hệ thống cấp 3 Giuacutep điều chỉnh xử lyacute quyết định

Phacircn loại theo cocircng nghệ -Kraemer vagrave King tập trung vagraveo cocircng nghệ aacutep dụng

Cocircng nghệ bảng mạch điện tử

Hội nghị trực tuyến

Mạng lưới tập đoagraven

Trung tacircm thocircng tin

Mocirci trường cộng taacutec

Phograveng quyết định

Nhoacutem phần mềm

Phần mềm được thiết kế để hỗ trợ sự hợp taacutec bao gồm việc thu huacutet vagrave lưu trữ thocircng tin

Caacutec tổ chức dẫn đầu thị trường hiện tại lagrave Lotus Notes and Domino Microsoft Exchange Novell GroupWise and Oracle Office

Caacutec cocircng cụ trong một bộ phần mềm bao gồm người quản lyacute hội nghị (Lotus Sametime) vagrave trao đổi thocircng điệp (Lotus Notes Mail)

Xếp hạng phần mềm cho nhoacutem

Ellis vv đề xuất một hệ thống xếp hạng dựa vagraveo kiểu sự hỗ trợ noacute Cung cấp

Hệ thocircng điệp

Hệ thống hội thảo truyền higravenh

Hệ thống cộng taacutec soạn thảo

Nhoacutem phacircn phối giải phaacutep phần mền

Hệ thống phối hợp

Hệ thống thocircng minh đại diện

Lực lượng điều khiển phaacutet triển phần mềm cho nhoacutem

Một số nhacircn tố chiacutenh bao gồm

Tăng năng suất

Giảm số lượng caacutec cuộc họp

Tăng cường tự động hoacutea caacutec quy trigravenh lagravem việc thường xuyecircn

Cần phối hợp toagraven cầu tốt hơn

Tiacutenh sẵn sagraveng của những mạng lan rộng

Coleman vagrave Khanna liệt kecirc 10 nhacircn tố khaacutec

54Quản lyacute hoạt động MDM (Mobile Device Management - Quản lyacute thiết bị di động)

Một số phương phaacutep phối hợp phổ biến hơnMDM lagrave

Kỹ thuật nhoacutem định danh

Kỹ thuật Delphi

Sự phacircn xử

Hệ thocircng tin dựa trecircn vấn đề

Nemawashi

Kỹ thuật nhoacutem định danh

1-Mỗi người tham gia viết ra những yacute tưởng về những gigrave necircn quyết định

2-Lần lượt mỗi người tham gia trigravenh bagravey yacute tưởng của migravenh được ghi lại trecircn bảng Khocircng thảo luận ở đacircy

3-Sau khi tất cả caacutec yacute tưởng được trigravenh bagravey caacutec đại biểu coacute thể chất vấn những người khaacutec

4-Mỗi người tham gia bỏ phiếu cho mỗi yacute tưởng

Kỹ thuật Delphi

Về cơ bản tương tự như kỹ thuật nhoacutem định danh ngoại trừ những người khocircng bao giờ tham gia cuộc họp

Một cocircng cụ khảo saacutet được sử dụng để thu thập đầu vagraveo ban đầu từ caacutec thagravenh viecircn

Một cuộc khảo saacutet thứ hai được gửi đi với một bản toacutem tắt caacutec kết quả chung

Những bước lặp lại cho đến khi đạt được một sự đồng thuận hoặc nhigraven nhận của đa số

Sự phacircn xử(Arbitration )

Thiacutech hợp nhất khi caacutec thagravenh viecircn của MDM đại diện cho caacutec yếu tố đối lập

Những người tham gia đồng yacute rằng nếu lựa chọn thay thế hai becircn thỏa thuận khocircng được tigravem thấy thigrave một trọng tagravei viecircn becircn ngoagravei sẽ tham gia

Trọng tagravei sau đoacute lựa chọn thay thế ocircng hoặc xeacutet thấy thiacutech hợp nhất

Hệ thống thocircng tin dựa trecircn vấn đề (IBIS)

Lagrave một phương phaacutep lập luận cấu truacutec

Một đại diện cho IBIS lagrave một đồ thị với caacutec nuacutet vagrave caacutec liecircn kết

IBIS bắt đầu với lựa chọn của một nuacutet vấn đề gốc sau đoacute caacutec nuacutet vị triacute khaacutec nhau được liecircn kết với nuacutet gốc

Caacutec nuacutet vị triacute nagravey sau đoacute được đaacutenh giaacute dựa trecircn những lập luận gắn liền với chuacuteng

Nemawashi (được sử dụng rộng ratildei tại Nhật Bản)

1-Một hoặc nhiều thagravenh viecircn của MDM được chỉ định lagrave điều phối viecircnCaacutec điều phối viecircn sau đoacute chọn người tham gia cograven lại

2-Điều phối viecircn xacircy dựng một tổng hợp caacutec sự lựa chọn vagrave sau đoacute caacutec chuyecircn gia đaacutenh giaacute caacutec lựa chọn

3-Điều phối viecircn lựa chọn một sự lựa chọn dựa trecircn kết quả ở trecircn(ở 2)

4-Sự thay thế được luacircn chuyển điều phối viecircn tigravem kiếm sự đồng thuận thocircng qua sự thuyết phục vagrave đagravem phaacuten

5-Nếu đạt được sự đồng thuận điều phối viecircn cho lưu thocircng một tagravei liệu magrave mỗi thagravenh viecircn MDM để lại dấu hiệu trecircn đoacute

55Nơi lagravem việc ảo

Nhiều tổ chức trecircn toagraven thế giới kinh doanh bất động sản cho cocircng nghệ hợp taacutec

Cocircng việc được trở thagravenh một điều bạn lagravem hơn lagrave một nơi bạn đi

Những thay đổi lớn nhất mang lại bởi nơi lagravem việc ảo coacute thể lagrave về văn hoaacute hay xatilde hội hơn lagrave về cocircng nghệ

Chương 6 Hệ thống thocircng tin điều hagravenh

61 Yacute nghĩa của EIS- Hệ thống thocircng tin điều hagravenh

- EIS lagrave một dạng đặc biệt của DSS được thiết kế để hỗ trợ ra quyết định ở cấp cao nhất của một tổ chức

- Lagrave một hệ thống thocircng tin hỗ trợ nhu cầu lập kế hoạch vagrave đaacutenh giaacute của caacutec nhagrave quản lyacute điều hagravenh

- EIS coacute thể giuacutep một CEO coacute được bức tranh tổng thể chiacutenh xaacutec nhất về caacutec hoạt động vagrave một bản toacutem tắt những gigrave magrave đối thủ cạnh tranh đang lagravem

- Caacutec hệ thống nagravey noacutei chung hoạt động dễ dagraveng vagrave trigravenh bagravey thocircng tin theo những caacutech dễ hiểu để việc tiếp thu được nhanh choacuteng (biểu đồ đồ thịhellip)

(Tagravei liệu thecircm EIS lagrave những loại hệ thống lagrave rất phức tạp trong tự nhiecircn Coacute thể noacutei hệ thống nagravey cũng cung cấp cho caacutec nhagrave quản lyacute với caacutec thiết bị coacute khả năng ra quyết định bằng caacutech sử dụng của noacute Hệ thống nagravey hoạt động trong điều kiện như vậy quan trọng như trong caacutec hệ thống khaacutec khocircng hỗ trợ Khả năng lưu trữ dữ liệu nặng lagravem cho noacute lyacute tưởng để được thocircng qua khocircng chỉ bởi caacutec doanh nghiệp lớn magrave cograven bởi caacutec doanh nghiệp nhỏ hơn Nhigraven chung hệ thống nagravey lagrave dagravenh cho caacutec nhacircn viecircn cấp cao hỗ trợ thagravenh thạo trong việc đưa ra caacutec quyết định quan trọng)

Caacutec phiecircn EIS tiecircu biểu- Phiecircn lagravem việc coacute thể bắt đầu với một baacuteo caacuteo về tigravenh higravenh tagravei chiacutenh vagrave kinh

doanh của một cocircng ty caacutec chỉ số hoạt động quan trọng được hiển thị rotilde ragraveng- EIS sẽ cho pheacutep caacutec giaacutem đốc điều hagravenh coacute thể đi sacircu vagraveo dữ liệu từ những con

số bất kỳ magrave noacute hỗ trợ- Việc điều hagravenh coacute thể lựa chọn một mức độ chi tiết ( VD danh số baacuten hagraveng) nếu

như cần điều tra thecircm- Lagrave một phương phaacutep tiếp cận coacute thể giuacutep việc ra quyết định tốt hơn

Những điều magrave EIS ko coacute- EIS khocircng phải lagrave sự thay thế cho caacutec hệ thống dựa trecircn caacutec maacutey tiacutenh khaacutec EIS

thực sự chỉ cung cấp dữ liệu cho caacutec hệ thống nagravey- Noacute khocircng thể biến caacutec bộ hệ điều hagravenh của maacutey tiacutenh thagravenh những ldquochuyecircn viecircn

giỏirdquo- Coacute thể được viacute một caacutech cao hơn như lagrave một trợ lyacute đaacuteng tin cậy coacute thể được gọi

đến bất khi nagraveo vagrave mỗi khi cần thiết

Tagravei liệu thecircm Sự khaacutec nhau giữa EIS vagrave DSS+ EIS thiết kế để hỗ trợ những người điều hagravenh cấp cao giuacutep họ khaacutem phaacute caacutec vấn đề vagrave caacutec cơ hội DSS hỗ trợ những nười phacircn tiacutech cố gắng trả lời cacircu hỏi caacutei gigrave coacute thể lagravem cugraveng với một cơ hội hoặc một vấn đề

Chiều EIS DSSNhững người sử dụng thocircng thường

Duyệt dữ liệu đi xuống truy xuất trạng thaacutei

Hỗ trợ phacircn tiacutech vagrave quyết định

Sự thuacutec đẩy Tiacutenh thiacutech hợp Tiacutenh hiệu quảỨng dụng Queacutet mocirci trường đaacutenh giaacute

hiệu suất nhận dạng caacutec vấn đề vagrave caacutec cơ hội

Caacutec quyết định quản lyacute trecircn caacutec lĩnh vực đa dạng

Hỗ trợ quyết định Caacutec chiacutenh saacutech caacutec quyết định khocircng coacute cấu truacutec ở mức cao vagrave hỗ trợ giaacuten tiếp

Hỗ trợ caacutec quyết định lặp lại caacutec quyết định khocircng thể đoaacuten trước ra quyết định khocircng coacute cấu truacutec vagrave baacuten cấu truacutec

Loại thocircng tin Caacutec thocircng tin tin tức thocircng tin becircn ngoagravei về khaacutech hagraveng đối thủ cạnh tranh mocirci trường caacutec baacuteo caacuteo theo yecircu cầu vagrave định thời về caacutec hoạt động becircn trong

Caacutec thocircng tin hỗ trợ caacutec tigravenh huống đặc biệt

Sử dụng coacute nguyecircn tắc

Dograve theo vết vagrave điều khiển nhận dạng cơ hội

Hoạch định tổ chức phacircn nhoacutem vagrave điều khiển

Khả năng phugrave hợp với những người sử dụng caacute nhacircn

Thiết kế loại ra quyết định cho mỗi người điều hagravenh caacute nhacircn bằng nhiều lựa chọn đầu ra

Cho pheacutep caacutec đaacutenh giaacute caacute nhacircn caacutec khả năng what-if lựa chọn loại hộp hội thoại

Đồ họa Phải coacute Lagrave một phần quan trọng của nhiều DSS

Thacircn thiện người sử dụng

Phải coacute Phải coacute nếu khocircng coacute người sử dụng trung gian

Xử lyacute thocircng tin Lọc neacuten thocircng tin dograve theo vết dữ liệu vagrave thocircng tin quan trọng

EIS kiacutech thiacutech caacutec cacircu hỏi caacutec cacircu trả lời bằng caacutech sử dụng DSS vagrave phản hồi lại EIS

Hỗ trợ caacutec thocircng tin chi tiết

Truy xuất thường xuyecircn caacutec mức chi tiết của bất kỳ thocircng tin tổng hợp nagraveo (duyệt dữ

Coacute thể coacute trong DSS nhưng khocircng thường

liệu chi tiết)Cơ sở mocirc higravenh Caacutec chức năng coacute sẵn bị hạn

chếLagrave điểm cốt lotildei của DSS

Cấu truacutec Theo người baacuten sản phẩm hoặc theo caacutec chuyecircn gia hệ thống thocircng tin

Theo người sử dụng hoặc caacute nhacircn hoặc caacutec chuyecircn gia từ caacutec trung tacircm thocircng tin hoặc phograveng ban hệ thống thocircng tin

Phần cứng Mainframe caacutec trạm RISC mạng LANs hoặc caacutec hệ thống phacircn bố

Mainframe caacutec trạm RISC caacutec maacutey PC hoặc caacutec hệ thống phacircn bố

Bản chất caacutec goacutei phần mềm

Truy xuất tương taacutec dễ dagraveng đến nhiều cơ sở dữ liệu truy xuất trực tuyến caacutec khả năng DBMS phức tạp caacutec liecircn kết phức tạp

Caacutec khả năng tiacutenh toaacuten lớn caacutec ngocircn ngữ mocirc higravenh mocirc phỏng ứng dụng vagrave caacutec bộ tạo DSS

Bản chất caacutec thocircng tin

Trigravenh bagravey thocircng tin được phaacutet sinh trước về quaacute khứ vagrave hiện tại tạo caacutec thocircng tin mới về quaacute khứ hiện tại tương lai

Tạo thocircng tin mới về quaacute khứ hiện tại tương lai

62 Lịch sử EIS- EIS xuất hiện lần đầu tiecircn tại MIT vagraveo những năm 1970

- Những EIS đầu tiecircn được phaacutet triển bởi caacutec doanh ngiệp lớn sẵn sagraveng chấp nhận rủi ro để đạt được lợi thế cạnh tranh

- Vagraveo những năm 1980 caacutec nhagrave cung cấp đatilde phaacutet triển một số cơ sở khaacutech hagraveng rộng vagrave cocircng nghệ EIS được tiếp tục phaacutet triển cho đến ngagravey nay

(Tagravei liệu thecircm Sử dụng DSSEIS cho phaacutet triển bền vững + Một số nghiecircn cứu đatilde được tiến hagravenh để kiểm tra việc thực hiện của EIS trong khu vực cocircng cộng vagrave chiacutenh phủ caacutec nước tổ chức kể từ khi chuacuteng được phaacutet triển theo định hướng lợi nhuận cho caacutec cocircng ty tư nhacircn (Hasan vagrave Hasan năm 1997) Theo một nghiecircn cứu tiến hagravenh tại Mỹ ở hơn 300 cocircng ty kết quả cho thấy sự khaacutec biệt của EIS giữa tư nhacircn vagrave chiacutenh phủ một số kết quả thuacute vị được phaacutet hiệnViacute dụ khoacute khăn hơn để chuyển tiền từ một tagravei khoản khaacutec trong một EIS của chiacutenh phủ cũng lagrave khoacute khăn hơn để biện giải thiacutech cho những chi phiacute phaacutet triển EIS của chiacutenh phủ Một nghiecircn cứu khaacutec được tiến hagravenh ở Australia

cho thấy rằng EIS cung cấp cho quản lyacute một higravenh ảnh chiacutenh xaacutec hơn về tổ chức thực hiện vagrave cung cấp hỗ trợ cho caacutec lợi iacutech chiến lược cải thiện khocircng chỉ cho caacutec nhagrave quản lyacute nhưng cograven cho phần cograven lại của tổ chức Dựa trecircn caacutec hệ thống được thiết kế cho caacutec cocircng ty tư nhacircn với một caacutech rotilde ragravengxaacutec định mục tiecircu EIS lagrave thiacutech hợp cho caacutec tổ chức cocircng cộng hiện đại nhưng cần phải được linh hoạt hơn vagrave kết thagravenh chugravem một phạm vi rộng hơn khả năng vagrave phương tiện hơn so với khu vực tư nhacircn ban đầu theo định hướng sản phẩm (Hasan vagrave Hasan năm 1997) Điều nagravey coacute thể lagrave do thực tế rằng caacutec hoạt động khu vực cocircng lagrave bắt buộc coacute taacutec động rộng phải đaacutep ứng sự mong đợi duy nhất cocircng cộng thường coacute mục tiecircu mơ hồ vagrave macircu thuẫn iacutet quyền tự chủ vagrave kiểm soaacutet việc ra quyết định vagrave nhacircn viecircn lagrave khoacute khăn hơn (Watson vagrave Carte2000) + Toacutem lại EIS lagrave một khaacutei niệm thagravenh cocircng noacute phaacutet triển qua nhiều năm tuy nhiecircn EIS khắc phục khiếm khuyết của migravenh bằng caacutech tiến hagravenh nghiecircn cứu liecircn tục)

63 Tại sao những người điều hagravenh hagraveng đầu lại khaacutec nhau- Họ lagrave những doanh nghiệp theo định hướng coacute suy nghĩ

- Coacute một khoảng khocircng gian rộng để kiểm soaacutet

- Họ chịu traacutech nhiệm cho việc thiết lập chiacutenh saacutech

- Họ đại diện cho tổ chức mocirci trường becircn ngoagravei

- Hagravenh động của họ tạo ra những kết quả đaacuteng kể về tagravei chiacutenh vagrave con người

Tần số caacutec hoạt động điều hagravenh- Xử lyacute xaacuteo trộn 42

- Hoạt động kinh doanh 32

- Phacircn bổ nguồn lực 17

- Đagravem phaacuten 3

- Những điều khaacutec 6

Handling Disturbances 42

Entrepreneurial Activites 32

Resource Allocation 17

Negotiation 3

Other 6

Những thocircng tin điều hagravenh cần thiết- Quản lyacute xaacuteo trộn coacute thể yecircu cầu sự chuacute yacute xung quanh đồng hồ

- Hoạt động kinh doanh yecircu cầu điều hagravenh để dự đoaacuten những thay đổi trong mocirci trường

- Nhiệm vụ phacircn bổ tagravei nguyecircn yecircu cầu lựa chọn người quản lyacute vagrave caacutec nguồn lực hạn chế được triển khai

- Đagravem phaacuten yecircu cầu cập nhật thocircng tin từng phuacutet để coacute thể xacircy dựng được sự đồng thuận

Caacutec loại thocircng tin điều hagravenh- Hệ thống kế toaacuten coacute liecircn quan đến việc tiacutenh toaacuten thu nhập hoạt động cho caacutec lĩnh

vực cụ thể lagrave quan trọng hơn so với caacutec hệ thống kế toaacuten truyền thocircng- Thocircng tin về thị trường khaacutech hagraveng cung cấp giaacute trị trong việc quyết định chiến

lược- Caacutec thocircng tin cần thiết thường được truyền đi trecircn một số hệ thống maacutey tiacutenh vagrave

nằm trong toagraven tổ chức- Caacutec thocircng tin được sử dụng thường lagrave ngắn hạn vagrave dễ thay đổi

Phương thức để xaacutec định thocircng tin cần thiết

Rockart xaacutec định được năm phương thức cơ bản để xaacutec định thocircng tin cần thiết

- Phương thức dựa trecircn kết quả- Phương thức rỗng- Phương thức chỉ số khoacutea- Phương thức tổng hợp nghiecircn cứu- Phương thức dựa vagraveo nhacircn tố then chốt dẫn đến thagravenh cocircng

64 Thagravenh phần EIS

- Sản phẩm EIS đầu tiecircn được phaacutet triển để sử dụng trecircn maacutey tiacutenh cấu higravenh cao nhưng caacutec sản phẩm hiện nay nhằm mục tiecircu lagrave nền tảng ClientServer

- Những nền tảng linh hoạt hơn coacute thể thiacutech ứng với thay đổi trong tổ chức vagrave cocircng nghệ

- Sử dụng dữ liệu thời gian thực dẫn đến quyết định nhanh hơn nhiều thocircng tin hơn

Thagravenh phần phần cứng- Một EIS khocircng đogravei hỏi coacute phần cứng cụ thể hoặc duy nhất nagraveo- Chigravea khoacutea của vấn đề lagrave để đảm bảo rằng caacutec thagravenh phần của EIS tối ưu hoacutea vagrave

phugrave hợp với tagravei nguyecircn maacutey tiacutenh của tổ chức- Hệ thống nagravey phải được cấu higravenh để caacutec nguồn tagravei nguyecircn phugrave hợp với những

người điều hagravenh chuacuteng

Thagravenh phần phần mềm- Traacutei ngược với phần cứng phần mềm thường được chuyecircn mocircn hoacutea cao cho caacutec

bagravei toaacuten về miền- Sự chuyecircn mocircn hoacutea nagravey thường đạt được bằng caacutech sử dụng thagravenh phần off-the-

shelf cho toagraven bộ EIS vagrave caacutec mocirc-đun tugravey chỉnh để đaacutep ứng nhu cầu cụ thể- Lotus Notes lagrave một viacute dụ điển higravenh Noacute coacute thể được sử dụng một migravenh hoặc coacute

thể phục vụ becircn thứ ba mocirc-đun plug-in

Cocircng nghệ EIS hiện nay

Dobrzeniecki đề xuấtphacircn loạitừng cấptheo bachức năng- Loại 1 sản phẩm bao gồmmột bộ đầy đủcaacutec ứng dụngtừ mộtnhagrave cung cấp- Loại 2 sản phẩm đượcthựchiệnở phần đầu củacaacutecsản phẩmDSS đượcphaacutet triển

bởicugravengmộtnhagrave cung cấp- Loại 3 sản phẩmkết hợp với nhautheo bất kỳ số lượngthuộc sở hữu củacocircng ty

65 Xacircy dựng EIS

- Xacircy dựngmộtEISgiống nhưxacircydựngmột số hệ thống khaacutec củamocirc higravenh hệ thống thocircng tin

- Việcphaacutet triểncấu truacutecnecircn được theo dotildeitừ quaacute trigravenh thiết kế đến quaacute trigravenhthực hiện

- Tuy nhiecircn một dự aacuten phaacutet triển EIScoacute xu hướnglagrave thống nhấtvagraveyecircu cầu hỗ trợ caacutec nhagrave quản lyacute latildenh đạo

- Xacircy dựng một EIScoacute thểphaacutet hiện ra đượccaacutectigravenh huống khoacute khănmagravemột nhagrave phaacutet triển chưabao giờ gặp phải

Mocirc higravenh EIS

Khung phaacutet triển một EIS

- Watson et al đề nghị xacircy dựngkhung với ba thagravenh phần+ Caacutech tiếp cận tập trung vagraveo yếu tốcon người vagrave dữ liệu coacute liecircn quan đến EIS+ Quaacute trigravenh phaacutet triển cần sự linh hoạt vagrave tương taacutec+ Người sử dụng - hệ thống hộp thoại bao gồm một ngocircn ngữ hagravenh động để xử lyacute caacutec lệnh

Lợi iacutech của EIS- Dễ duy trigrave caacutec mục tiecircu coacute tổ chức- Dễ truy xuất thocircng tin- Cho pheacutep người sử dụng nacircng cao hiệu suất hơn

- Tăng chất lượng ra quyết định- Cung cấp sự cải tiến cạnh tranh- Tiết kiệm thời gian của người sử dụng- Tăng khả năng vagrave chất lượng giao tiếp- Cung cấp khả năng điều khiển tốt hơn trong tổ chức- Cho pheacutep tham gia caacutec vấn đề vagrave caacutec cơ hội- Cho pheacutep hoạch định- Cho pheacutep tigravem kiếm nguyecircn nhacircn của một vấn đề- Thảo matilden caacutec yecircu cầu của người điều hagravenh

Hạn chế của EIS vagrave 1 số sai lầm cần traacutenh

- Chi phiacute một cuộc khảo saacutetnăm1991 chothấychi phiacute phaacutet triểntrungbigravenh365000USDvớichi phiacute vận hagravenhhagraveng năm lagrave$200000 (EIS)

- Cocircng nghệ hạn chếEIScần phảiđượctiacutech hợp hoagraven toagravenvagraveokiếntruacuteccủadoanh nghiệphiện tại do đoacute noacutelagrave một thaacutech thứclớn đối vớithiết kế

- Hạn chế tổ chức cơ cấu tổ chứccoacute thể khocircng phugrave hợp

Sự hạn chế về tổ chức- Chương trigravenh nghị sự vagrave thời gian chệch EIS mocirc tả một phần việc thực hiện một

chương trigravenh nghị sự vagrave coacute thể dễ dagraveng đạt được sự tin cậy một caacutech chắc chắn- Đồng bộ hoacutea việc quản lyacute sự tin cậy đuacuteng luacutec đặc biệt baacuteo caacuteo EIS coacute thể phaacute

vỡ sự ổn định thiết lập caacutec chu trigravenh baacuteo caacuteo một caacutech tốt nhất- Sự bất ổn EIS phản ứng nhanh coacute thể gacircy ra việc taacutec động trở lại một caacutech

nhanh choacuteng dẫn đến sự thiếu ổn định trong tổ chức

Sự thất bại lagrave thay thế khocircng thể chấp nhận được- Một số yếu tố lagravem EIS thất bại

+ Thiếu sự hỗ trợ về mặt quản lyacute+ Vấn đề chiacutenh trị+ Thất bại của nhagrave phaacutet triển+ Lỗi về cocircng nghệ+ Giaacute cả+ Thời gian

66 Ra quyết định điều hagravenh trong tương lai vagrave EIS

- Coacute một vagravei điều kiện sẽ được hợp nhất cho việc chuyển đổi cocircng nghệ Trong đoacute một vagravei điều kiện coacute thể dễ dự đoaacuten Hai điều kiện magrave ta coacute thể thấy lagrave+ Phaacutet triển cocircng nghệ maacutey tiacutenh trong việc điều hagravenh sẽ tạo ra sự chuyển đổi được chấp nhận một caacutech dễ dagraveng hơn+ Mở rộng traacutech nhiệm điều hagravenh sẽ mở rộng nhu cầu thocircng tin

Tương lai của EIS- EIS thocircng minh Những tiến bộ trong cocircng nghệ AI sẽ được triển khai trong caacutec

EIS- EIS đa phương tiện Cơ sở dữ liệu đa phương tiện sẽ cho pheacutep tiacutech hợp văn bản

giọng noacutei vagrave higravenh ảnh trong tương lai- EIS thocircng tin Tương lai EIS sẽ mở rộng hơn trong việc sử dụng dữ liệu becircn

ngoagravei doanh nghiệp- EIS kết nối Giao tiếp với băng thocircng rộng cho pheacutep kết nối liecircn thocircng lớn hơn

Chương 7 HỆ CHUYEcircN GIA VAgrave TRIacute TUỆ NHAcircN TẠO

71 Caacutec khaacutei niệm

72 Triacute thocircng minh của triacute tuệ nhacircn tạo

73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia

74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia

75 Lợi iacutech vagrave hạn chế của hệ chuyecircn gia

71 Caacutec khaacutei niệm

Chuyecircn mocircn (Expertise) sự hiểu biết rộng trong 1 lĩnh vực hẹp

Hệ chuyecircn gia (Expert Systems)1 chương trigravenh maacutey tiacutenh sử dụng 1 tập caacutec luật dựa trecircn tri thức của con người để giải quyết caacutec vấn đề đogravei hogravei phải coacute sự chuyecircn mocircn

Một số hệ chuyecircn gia nổi tiếng

DENDRAL (Standford 1960s Edward Feigenbaum)

MYCIN (Standford1970s Edward Shortliffe)

PROSPECTOR (MIT 1979)

Triacute tuệ nhacircn tạo (Artificial Intelligence ndash AI)

Triacute tuệ nhacircn tạo một bộ phacircn của ngagravenh khoa học maacutey tiacutenh quan tacircm đến việc thiết kế caacutec hệ thống maacutey tiacutenh thocircng minh đoacute lagrave caacutec hệ thống đưa ra caacutec đặc điểm magrave từ đoacute chuacuteng ta liecircn hệ với sự thocircng minh trong hagravenh động của con người (Barr vagrave Feigenbaum 1981)

Mục điacutech của AI

Mục điacutech khoa học xaacutec định caacutec gợi yacute để giải thiacutech caacutec loại khaacutec nhau của triacute tuệ thực

Mục điacutech kỹ thuật giải quyết caacutec vấn đề trong thế giới thực

Triacute tuệ nhacircn tạo kế thừa nhiều yacute tưởng quan điểm kỹ thuật từ caacutec ngagravenh khoa học khaacutec

- Triết học

- Logic Toaacuten học

- Tiacutenh toaacuten

- Khoa học tacircm lyacute Khoa học nhận thức

- Sinh học Thần kinh học

- Tiến hoacutea

Caacutec lĩnh vực ứng dụng trong Triacute tuệ nhacircn tạo

Mạng nơ ron thần kinh (Neural Networks)

Tiacutenh toaacuten sự tiến hoacutea

(Evolutionary Computation)

Hệ chuyecircn gia (Expert Systems)

Kỹ thuật xử lyacute tiếng noacutei (Speech Processing)

Kỹ thuật xử lyacute ngocircn ngữ tự nhiecircn

(Natural Language Processing)

Lập kế hoạch (Planning)

Robot (Robotics)

Khoa học higravenh ảnh (Vision)

Caacutec kỹ thuật thocircng dụng dugraveng trong AI

Biểu diễn(Representation)

Học (Learning)

Caacutec luật (Rules)

Tigravem kiếm (Search)

72 Triacute thocircng minh của triacute tuệ nhacircn tạo

Con người suy diễn như thế nagraveo

Phacircn loại (Categorization)

Caacutec quy tắc cụ thể

Heuristics

Kinh nghiệm trước đoacute

Dự tiacutenh trước

Maacutey tiacutenh suy diễn như thế nagraveo

Lập luận dựa trecircn luật IF-THEN mocirc tả tri thức được matilde hoacutea dưới dạng caacutec luật

Caacutec khung (Frames) lagrave caacutec đại diện mocirc tả caacutec tigravenh huống giống nhau lagrave điển higravenh của một vagravei phacircn loại

Lập luận dựa trecircn caacutec trường hợp mocirc phỏng giải phaacutep trước đoacute cho một vấn đề hiện tại

Nhận dạng mẫu phaacutet hiện acircm thanh higravenh dạng hoặc caacutec chuỗi dagravei

Caacutec dạng khaacutec của Triacute tuệ nhacircn tạo

Học maacutey- mạng nơron vagrave giải thuật di truyền

Lập trigravenh tự động ndash lagrave những kỹ thuật tạo ra caacutec chương trigravenh để lagravem 1 nhiệm vụ riecircng biệt (cho pheacutep những người khocircng phải lagrave người lập trigravenh coacute thể lập trigravenh được)

Cuộc sống nhacircn tạo ndash nỗ lực để taacutei tạo caacutec hiện tượng sinh học trong caacutec hệ thống dựa trecircn maacutey tiacutenh

73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia(Expert Systems- ES)

Theo Jackson (1999) Một hệ chuyecircn gia lagrave một chương trigravenh maacutey tiacutenh mocirc tả vagrave suy diễn với tri thức của một vagravei lĩnh vực để giải quyết vấn đề hay đưa ra caacutec lời khuyecircn

Cấu truacutec cơ bản của ES được dựa theo cấu truacutec chung của DSS Sự khaacutec biệt chiacutenh giữa ES vagraveDSS lagrave hệ ES thu thập caacutec kiến thức từ những

chuyecircn gia trong lĩnh vực quan tacircmĐặc trưng của hệ chuyecircn gia Hiệu quả cao Thời gian trả lời thỏa đaacuteng Độ tin cậy cao Dễ hiểu

Giao diện người dugraveng trong ES

Thiết kế giao diện người dugraveng tập trung vagraveo caacutec yếu tố như dễ dagraveng sử dụngcoacute độ tin cậy cao giảm tải những khoacute khăn khi sử dụng

Thiết kế necircn coacute một số tương taacutec (đầu vagraveo kiểm soaacutet vagrave truy vấn)

Cấu tạo giao diện người dugraveng gồm coacute magraven higravenh cảm ứng bagraven phiacutem buacutet saacuteng lệnh thoại caacutec phiacutem chuyecircn dụng

Cơ sở tri thức (Knowledge Base)

Chứa đựng caacutec tri thức cụ thể miền thu được từ caacutec chuyecircn gia miền

Coacute thể chứa caacutec mocirc tả caacutec hagravenh vi giải quyết vấn đề caacutec ragraveng buộc caacutec heuristics

Thagravenh cocircng của một ES dựa trecircn tiacutenh đầy đủ vagrave tiacutenh chiacutenh xaacutec của cơ sở tri thức

Mocirc tơ suy diễn (Inference Engine)

Ở đacircy tri thức được đặt để sử dụng tạo ra caacutec giải phaacutep để giải quyết vấn đề

Mocirc tơ nagravey coacute khả năng thực hiện diễn dịch hoặc suy diễn dựa trecircn caacutec luật hay caacutec caacutec sự kiện

Đồng thời cũng coacute khả năng sử dụng caacutec suy diễn mờ hay khocircng chiacutenh xaacutec dựa trecircn xaacutec suất hay aacutenh xạ mẫu

Vograveng điều khiển suy diễn

1 Aacutenh xạ caacutec luật với caacutec sự kiện đatilde được cho

2 Chọn luật để thực hiện

3 Thực hiện luật bằng caacutech thecircm caacutec sự kiện được suy diễn ra vagraveo bộ nhớ lagravem việc

Chuỗi suy diễn (Chaining)

Suy diễn tiến (forward chaining) maacutey suy diễn bắt đầu từ dữ liệu ban đầu vagrave thực hiện việc suy luận để đưa ra caacutec kết luận cuối cugraveng

Suy diễn lugravei (backward chaining) maacutey suy diễn bắt đầu từ dữ liệu điacutech vagrave tigravem ra tri thức hỗ trợ cho dữ liệu điacutech đoacute

Viacute dụ suy diễn lugravei

R1 Nếu coacute A vagrave B thigrave suy ra coacute D

R2 Nếu coacute B thigrave suy ra coacute C

R3 Nếu coacute C vagrave D thigrave suy ra coacute E

Ta coacute E ta xem trong 3 luật R1 R2 R3 luật nagraveo coacute E ta thấy R3 chứa E đồng thời chứa C vagrave D Xeacutet tiếp trong 2 luật R1 R2 luật nagraveo chứa C vagrave D R2 chứa C R3 chứa D Từ đoacute ta coacute được caacutec tri thức hỗ trợ suy diễn vagrave kết luận lagrave nếu coacute A vagrave B thigrave sẽ coacute E Hay nếu A vagrave B đuacuteng thigrave sẽ coacute E

Viacute dụ suy diễn tiến

Giả sử coacute tập chứa 3 luật sau

R1 Nếu coacute A vagrave B thigrave suy ra coacute D

R2 Nếu coacute B thigrave suy ra coacute C

R3 Nếu coacute C vagrave D thigrave suy ra coacute E

Nếu ta coacute A vagrave B thigrave chuacuteng ta suy ra được D từ R1 vagrave suy ra C từ R2 Với D vagrave C đatilde được suy ra ở trecircn giờ chuacuteng ta suy ra được E từ R3

Viacute dụ thực tế

Giả sử muốn biết magraveu của một con vật nuocirci tecircn lagrave Fred biết rằng noacute kecircu ộp ộp vagrave ăn ruồi

Coacute tập 4 luật ban đầu như sau

R1 Nếu X kecircu ộp ộp vagrave ăn ruồi thigrave X lagrave con ếch

R2 Nếu X kecircu chiecircm chiếp vagrave biết hoacutet thigrave X lagrave con chim

R3 Nếu X lagrave con ếch thigrave X coacute magraveu xanh

R4 Nếu X lagrave con chim thigrave X coacute magraveu vagraveng

74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia

Expert system shells lagrave một tập caacutec goacutei phần mềm vagrave caacutec cocircng cụ dugraveng để phaacutet triển caacutec hệ chuyecircn gia

Những Expert system shells đầu tiecircn thường rất rườm ragrave Mặc dugrave vậy noacute vẫn giuacutep cho người sử dụng sẽ khocircng phải bắt đầu lại từ đầu khi xacircy dựng một hệ chuyecircn gia mới

Những shell hiện đại bao gồm hai mocirc-đun chiacutenh lagrave cocircng cụ xacircy dựng một tập quy tắc vagrave mocirc tơ suy diễn

Xacircy dựng hệ chuyecircn gia

Bước 1 xacircy dựng mocirc higravenh bagravei toaacuten xaacutec định vấn đề nhiệm vụ magrave hệ thống sẽ thực hiện Caacutec dạng bagravei toaacuten cần hệ chuyecircn gia

Bagravei toaacuten diễn giải (InterPretation)

Bagravei toaacuten dự baacuteo (Prediction)

Bagravei toaacuten chuẩn đoaacuten (Diagnose)

Bagravei toaacuten gỡ rối (Debugging)

Bagravei toaacuten thiết kế

Tương tự như một dự aacuten phần mềm để xacircy dựng một hệ chuyecircn gia cần phải coacute caacutec yếu tố về nhacircn lực tagravei nguyecircn vagrave thời gian Những yếu tố nagravey ảnh hưởng đến giaacute thah của một hệ chuyecircn giaTrong phần nagravey cacircu hỏi thường được đặt ra lagrave tại sao cần phải xacircy dựng một hệ chuyecircn giaTrước khi bắt đầu phải xaacute định rotilde bagravei toaacuten đạt ra lagrave jiAi lagrave chuyecircn giaAi lagrave người sử dụng

1 Diễn giải (InterPretation) Nghiecircn cứu 1 vấn đề -gt Dựa trecircn những biểu hiện thuộc tiacutenh đặc trưng becircn ngoagravei -gt Tư vấn

(hoặc đưa ra kết luận hay mocirc tả dễ hiểu từ tập dữ liệu thocirc)

2 Bagravei toaacuten dự baacuteo (Prediction) Coacute thể dự đoaacuten được hagravenh vi kết quả dựa trecircn caacutec hiện tượng -gt dự baacuteo

VD Dự baacuteo thời tiết động đấthellip

3 Bagravei toaacuten chẩn đoaacuten (Diagnoss) Xaacutec định caacutec lỗi caacutec bộ phận hỏng hoacutec của hệ thống dựa trecircn caacutec dữ liệu quan saacutet được

4 Bagravei toaacuten gỡ rối (Debugging) Mocirc tả caacutec phương phaacutep khắc phục hệ thống khi gặp sự cố

5 Bagravei toaacuten thiết kế Lựa chọn cấu higravenh caacutec đối tượng nhằm thoả matilden một số ragraveng buộc nagraveo đoacute

6 Giảng dạy Phần mềm dạy học coacute thể chuẩn đoaacuten vagrave sủa lỗi của học sinh trong quaacute trigravenh học tập

Để xaacutec định đuacuteng bagravei toaacuten magrave chuacuteng ta cần giải quyết thigrave phải trả lời đc một số cacircu hỏi

- cần hệ chuyecircn gia

Bước 2 thu thập tri thức lựa chọn cocircng cụ vagrave aacutep dụng

Trong bước thu thập tri thức vấn đề quan trọng lagrave lựa chọn chuyecircn gia những người magrave sẽ đoacuteng goacutep tri thức cho hệ thống Thocircng thường trong suốt quaacute trigravenh phaacutet triển thigrave chuyecircn gia được xem như một thagravenh viecircn của đội phaacutet triển

Hiện nay coacute rất nhiều cocircng cụ để xacircy dựng một hệ chuyecircn gia Phổ biến nhất lagrave JESS CLIPS vagrave OPS5

Bước 3 Thiết kế cơ sở tri thức thiết kế hệ thốngTri thức được biểu diễn trường minh trong cơ sở tri thức

Caacutec chuyecircn gia vagrave kỹ sư tri thức sẽ đối thoại với nhau bằng caacutec kỹ thuật đối thoại Suy diễn (SD) bảng Mocirc higravenh hoacutea SD quy nạp phacircn loại

Vấn đề bagraveo trigrave vagrave phaacutet triển

Caacutec hệ chuyecircn gia đogravei hỏi phải bảo trigrave vagrave phaacutet triển nhiều hơn so với caacutec hệ thống khaacutec Phải thường xuyecircn bổ sung tri thức mới vagrave thay đổi caacutec tri thức cũ để đổi mới hệ chuyecircn gia

Thu thập vagrave khắc phục lỗi do người sử dụng phaacutet hiện để kịp thời khắc phục những sai soacutet của hệ chuyecircn gia

75 Lợi iacutech vagrave hạn chế của caacutec hệ chuyecircn gia

Một số lợi iacutech chiacutenh

Thời gian trả lời hợp lyacute bằng hoặc nhanh hơn so với chuyecircn gia (người) để đi đến cugraveng một quyết định Hệ chuyecircn gia lagrave một hệ thống thời gian thực (real time system)

Khả năng trả lời với mức độ tinh thocircng bằng hoặc cao hơn so với chuyecircn gia (người) trong cugraveng lĩnh vực

Hệ chuyecircn gia giuacutep cho hiệu quả lagravem việc tăng bằng việc sử dụng tập caacutec luật một caacutech nhanh choacuteng magrave ko bị nhầm lẫn chuyecircn gia lagrave người coacute thể quecircn đi một số tri thức cơ sở lyacute luậ nhưng HCG thigrave ko

Quyết định của một người chuyecircn gia coacute thể bị thay đổi vagrave ko coacute tiacutenh thống nhất như quyết định của một hệ chuyecircn gia tạo ra

Hệ chuyecircn gia giuacutep cho người sử dụng coacute thể trau dồi sự hiểu biết trecircn lĩnh vuej cụ thể magrave noacute giải quyết hỗ trợ người ra quyết định coacute trigravenh độ như 1 chuyecircn gia trong quaacute trigravenh gia quyết định

Kiến thức của rất nhiều chuyecircn gia về một lĩnh vực nagraveo đoacute được đưa vagraveo hệ chuyecircn gia lagravem cho CSTT cuat HCG phong phuacute vagrave rộng lớn hơn rất nhiều

HCG giải thiacutech caacutec bước suy luận một caacutech dễ hiểu nhất quaacuten luacutec nagraveo cũng coacute thể sử dụng ko như chuyecircn gia con người

Hạn chế của caacutec hệ chuyecircn gia

Nhược điểm lớn nhất của hệ chuyecircn gia lagrave những yacute kiến chuyecircn mocircn thường rất khoacute matilde hoacutea vagrave giải neacuten

Hệ chuyecircn gia khocircng coacute khả năng tự học tự cập nhật kiến thức mới như caacutec chuyecircn gia magrave cần phải được matilde hoacutea lại khi noacute được cập nhật

Hệ chuyecircn gia khocircng thể nhận ra được vấn đề khocircng nằm trong miền kiến thức của hệ thống

Chương 8 Tri thức vagrave tiếp nhận

1 Bao gồm caacutec vấn đề

Dữ liệu thực tế đo lường hoặc quan saacutet coacute hoặc khocircng coacute bối cảnh

Thocircng tin dữ liệu được tổng hợp một caacutech hữu iacutech để giải quyết những khoacute khăn trong việc đưa ra quyết định

Tri thức bao gồm caacutec ứng dụng quy tắc thocircng tin hướng dẫn của người ra quyết định

2 Những caacutei nhigraven về tri thức

Đại diện lagravem thế nagraveo để diễn tả tri thức viacute dụ như một quyển saacutech khocircng phải lagrave tri thức nhưng noacute lại lagrave một đại diện của tri thức

Sản xuất tri thức lagrave một tập hơp của hagraveng tồn kho coacute thể được sản xuất cũng như mua lại

Tri thức lagrave 1 trong 6 trạng thaacutei của hệ thống

1Dữ liệu 2Thocircng tin 3Cấu truacutec thocircng tin 4Sự thấu hiểu 5Yacute kiến 6 Quyết định

3 Caacutec loại tri thức Phổ biến mocirc tả dữ liệu thocircng tin thủ tục mọi thứ lagravem như thế nagraveo lập luận chiacutenh saacutech hoặc caacutec quy tắc

4 Thu thập Tri thức hệ chuyecircn gia Hầu hết caacutec phương phaacutep đều bắt đầu với mocirc higravenh của caacutec taacutec vụ trong đoacute

hệ chuyecircn gia được xacircy dựng Trong đoacute mocirc tả về caacutec lĩnh vực được tạo ra Caacutec kỹ sư sử dụng caacutec mocirc higravenh giả thuyết vagrave nhận thức về quaacute trigravenh phacircn

tiacutech để gợi ra caacutech giải quyết vấn đề về tri thức từ caacutec chuyecircn gia

5 Caacutec chiều của thu thập tri thức KE- driven caacutec kỹ sư trao đổi trực tiếp với caacutec chuyecircn gia Expert-driven Caacutec chuyecircn gia trực tiếp đưa chuyecircn mocircn của họ vagraveo hệ

thống maacutey tiacutenh Machine-driven Sử dụng caacutec cocircng cụ suy luận để triacutech xuất tri thức từ một

tập caacutec viacute dụ

6 Kỹ thuật thu thập tri thức Trao đổi gồm 2 loại cơ bản lagrave coacute cấu truacutec(coacute kịch bản) vagrave khocircng coacute cấu

truacutec( đối thoại trực tiếp) Giao thức phacircn tiacutech bằng lời Khi caacutec chuyecircn gia thực hiện một cocircng việc

của họ thigrave một bản ghi về cocircng việc đoacute được thực hiện Caacutec kỹ sư sẽ xacircy dựng mocirc higravenh cho những gigrave được ghi lại trong bản ghi

Phương phaacutep sagraveng lọc caacutec chuyecircn gia so saacutenh caacutec nhoacutem liecircn tiếp trong ba đối tượng vagrave cho biết tại sao nhoacutem thứ hai lại khaacutec nhoacutem thứ ba

7 Thu thập tri thức từ nhiều nguồn Thu thập tri thức từ nhiều nguồn lagrave cần thiết để coacute được đầy đủ caacutec tri thức

cho một vấn đề quan điểm yacute kiến traacutei ngược nhau thường phaacutet sinh Phương phaacutep đồng thuận sẽ giuacutep giải quyết được vấn đề macircu thuẫn Kỹ thuật phacircn tiacutech Meta lagrave kỹ thuật được aacutep dụng trong caacutec trường hợp

khaacutec Caacutech tiếp cận bằng định lượng đogravei hỏi caacutec kỹ sư cần cacircn nhắc yếu tố đầu vagraveo của caacutec chuyecircn gia khaacutec nhau

8 Xaacutec nhận hợp lệ vagrave kiểm tra tri thức Một khi thu thập tri thức noacute phải được đaacutenh giaacute về khả năng sử dụng vagrave độ

chiacutenh xaacutec Hai vấn đề cụ thể lagrave hiệu lực của những kiến thức vagrave kiểm tra việc xacircy dựng cơ sở của tri thức

Cần xaacutec nhận xem liệu hệ thống coacute thể hoạt động ở mức độ tối thiểu khocircng

Xaacutec minh liecircn quan đến việc so saacutenh từng chi tiết kỹ thuật của hệ thống những gigrave đatilde được thực hiện cuối cugraveng

9 Một số caacutec biện phaacutep xaacutec nhận Độ chiacutenh xaacutec Khả năng thiacutech nghi Mức độ đầy đủ Bề rộng Độ sacircu Hiệu lực Tổng quan Chiacutenh xaacutec Hiện thực Độ tin cậy Tiacutenh hữu dụng Mức độ

Chương 9 Học maacutey

1 Logic mờ vagrave ngocircn ngữ mờ(Fuzzy Logic and Linguistic Ambiguity)

Ngocircn ngữ tự nhiecircn gồm những khaacutei niệm mơ hồ vagrave khocircng chiacutenh xaacutectruyền tải ngữ nghĩa thocircng qua tiacutenh xấp xỉkhocircng rotilde ragraveng

Những xấp xỉ nagravey giuacutep con người coacute thể truyền tải hết được yacute nghĩa nhưng maacutey thigrave khocircng hiểu

Lagravem sao biểu diễn caacutec tri thức sử dụng caacutec khaacutei niệm khocircng rotilde ragraveng(mờ) hoặc khocircng chiacutenh xaacutec

2 Khaacutei niệm cơ bản của logic mờ tập mờ lagrave những tập hợp khocircng coacute một giới hạn rotilde Mỗi phần tử của noacute chỉ

chứa một mức độ hagravem liecircn thuộc của từng phần tử Vigrave vậy tập mờ khocircng giống như tập cổ điển Tập mờ coacute thể kết hợp với nhau qua những luật mờ magrave đặc trưng cho những hagravenh động trạng thaacutei vagrave thuộc tiacutenh của logic mờ được tận dụng khi thực hiện một bộ điều khiển mờ

Logic mờ dựa trecircn yacute tưởng mỗi phần tử thuộc vagraveo một tập hợp ở một mức độ nagraveo đấy

Locircgic mờ cho pheacutep độ liecircn thuộc (microA )coacute giaacute trị trong khoảng (01) Locircgic mờ coacute thể được coi lagrave mặt ứng dụng của lyacute thuyết tập mờ để xử lyacute caacutec

giaacute trị trong thế giới thực cho caacutec bagravei toaacuten phức tạp

3 So saacutenh tiacutenh đuacuteng đắn logic mờ vagrave xaacutec suất Xaacutec suất thigrave đề cập đến khả năng xảy ra một biến cố hay một điều gigrave đoacute Logic mờ đề cập đến cấp độ magrave đặc tiacutenh ở hiện tại

o viacute dụ1 người coacute chiều cao 6 feet thigrave coacute cấp độ lagrave 05 về chiều cao

4 Ưu điểm của logic mờ Caacutech tiếp cận rất tự nhiecircnkhocircng phức tạp Coacute thể mocirc higravenh hoacutea caacutec hagravem phi tuyến tugravey yacute phức tạp

Coacute thể tận dụng được kinh nghiệm từ những chuyecircn gia hagraveng đầu trong mọi lĩnh vực

Logic mờ được xacircy dựng dựa trecircn ngocircn ngữ tự nhiecircnNền tảng của logic mờ lagrave dựa trecircn cơ sở giao tiếp của con người

5 Nhược điểm của logic mờ Trong 1 hệ thống phức tạpsử dụng logic mờ coacute thể trở thagravenh trở ngại cho

việc xaacutec thực độ tin cậy của hệ thống Cơ chế lập luận mờ khocircng thể học hỏi từ những lỗi sai

6 Mạng noron nhacircn tạo(ANN) Mạng noron nhacircn tạo lagrave một mocirc phỏng xử lyacute thocircng tinđược nghiecircn cứu ra

từ hệ thống thần kinh của sinh vậtgiống như bộ natildeo để xử lyacute thocircng tin ANNs lagrave chương trigravenh dựa trecircn maacutey tiacutenh đơn giản coacute chức năng lagrave một mocirc

higravenh bagravei toaacuten khocircng gian dựa trecircn thử nghiệm vagrave baacuteo lỗi

7 Học từ kinh nghiệm Tiến trigravenh Một mẫu dữ liệu được biểu diễn như một mạng lưới noronANN ldquodự

đoaacutenrdquo 1 đầu radự đoaacuten được so saacutenh với giaacute trị thực tế hoặc giaacute trị chiacutenh xaacutecNếu đoaacuten được chiacutenh xaacutec thigrave khocircng coacute hagravenh động nagraveo được thực hiện

Nếu dự đoaacuten sai ANN kiểm tra lại vagrave xaacutec định lại thocircng số để điều chỉnh Một mẫu dữ liệu khaacutec được biểu diễn vagrave quaacute trigravenh nagravey được lặp lại

8 Nguyecircn tắc cơ bản của cocircng nghệ nơron Caacutec yếu tố xử lyacute cơ bản trong hệ thống thần kinh của con người lagrave tế bagraveo

thần kinhMạng lưới của tế bagraveo nagravey lagrave liecircn kết với nhau nhận được thocircng tin từ caacutec cảm biến trong mắt taihellip

Thocircng tin nhận được bởi tế bagraveo thần kinh hoặc lagrave sẽ kiacutech thiacutech noacute(sẽ được chuyển qua 1 thocircng điệp dọc theo mạng lưới) hoặc lagrave sẽ ngăn cản noacute(ngăn cản dograveng thocircng tin)

Độ nhạy coacute thể thay đổi qua thời gian hoặc sau khi coacute được kinh nghiệm

9 Cấu truacutec mạng Một ANN gồm 3 lớp cơ bản

Lớp đầu vagraveo nhận dữ liệu Lớp becircn trong hoặc lagrave lớp ẩn xử lyacute dữ liệu Lớp đầu ra chuyển tiếp kết quả cuối cugraveng của mạng

10Mạng nơ ron Thường coacute nhiều đầu vagraveo mỗi đầu vagraveo với mức ảnh hưởng vagrave tầm quan

trọng riecircng của noacute Một đầu vagraveo quan trọng coacute thể được sử dụng để khuếch đại đầu ra caacutec hagravem trạng thaacutei tổng hợp caacutec trọng số của caacutec yếu tố

đầuvagraveo khaacutec nhauvagraveo một giaacute trị duy nhất Caacutec hagravem chuyển giao xử lyacute caacutec giaacute trị trạng thaacutei vagrave tạo đầu ra

11Huấn luyện mạng nơ ron Trong mocirc higravenh coacute giaacutem saacutetANN được đến so saacutenh dự đoaacuten của chiacutenh

noacute với thocircng tin phản hồi coacute chứa caacutec kết quả mong muốn ANN sẽ phải tigravem caacutech thay đổi caacutec tham số becircn trong củamigravenh (caacutec trọng số vagrave caacutec ngưỡng) để tạo necircn một aacutenh xạ coacute khả năng aacutenh xạcaacutec đầu vagraveo thagravenh caacutec đầu ra mong muốn Sự thay đổi nagravey được tiến hagravenh nhờ việc so saacutenh giữa đầu ra thực sự vagrave đầu ra mong muốn

Trong mocirc higravenh khocircng coacute giaacutem saacutetANN nhận được dữ liệu vagraveo nhưng khocircng phải coacute bất kỳ thocircng tin phản hồi về kết quả mong muốn

Phần lớn caacutec ứng dụng nằm trong vugraveng của caacutec bagravei toaacuten ước lượng như mocirc higravenh hoacuteathống kecirc neacuten lọc phacircn cụm

12Lợi iacutech Liecircn kết với mạng noron Traacutenh caacutech lập trigravenh tường minh Giảm nhu cầu của chuyecircn gia ANNs thigrave thiacutech nghi với caacutec yếu tố đầu vagraveo thay đổi Khocircng cần thiết cho cơ sở tri thức tinh chế ANNs coacute tiacutenh động vagrave cải thiện với việc sử dụng Coacute khả năng xử lyacute dữ liệu khocircng chiacutenh xaacutec hoặc khocircng đầy đủ Cho pheacutep tổng quaacutet hoacutea từ thocircng tin cụ thể Cho pheacutep thu thập cảm giaacutec thocircng thường vagraveo miền giải quyết vấn đề

13Hạn chế của việc liecircn kết với mạng noron ANNs khocircng thể giải thiacutech được suy luận Bản chất hộp đen thường khiến cho vấn đề traacutech nhiệm vagrave độ tin cậy phaacutet

sinh lagrave khoacute khăn Lặp đi lặp lại quaacute trigravenh huấn luyện rất tốn thời gian Nguồn lực caacutec nhagrave phacircn tiacutech vagrave thiết kế coacute tay nghề cao vẫn lagrave đaacuteng lo

ngại Cocircng nghệ ANN thuacutec đẩy hạn chế của phần cứng hiện tại ANN yecircu cầu phải coacute sự tin tưởng ở đầu ra

14Giới thiệu về thuật toaacuten di truyền Cũng như mạng lưới thần kinh caacutec thuật toaacuten di truyền được dựa trecircn lyacute

thuyết sinh học Thuật toaacuten di truyền tigravem thấy nguồn gốc của chuacuteng trong caacutec lyacute thuyết

tiến hoacutea của chọn lọc tự nhiecircn vagrave thiacutech ứng với biến đổi khiacute hậu Kết quả thuật toaacuten di truyền lagrave từ giao phối 2 caacute thể trong quần thế để tạo

ra con caacutei đocirci khi tốt hơn so với bậc cha mẹ của chuacuteng 15Caacutec thagravenh phần cơ bản của thuật toaacuten di truyền

Toaacuten tử chọn lọc Caacutec caacute thể tốt được chọn lọc để đưa vagraveo thế hệ sau Sự chọn lọc nagravey căn cứ vagraveo độ thiacutech nghi với mocirci trường của mỗi caacute thể

Toaacuten tử lai gheacutep (crossover) Hai caacute thể cha vagrave mẹ trao đổi caacutec gen với nhau để tạo ra caacute thể con

Toaacuten tử đột biến (mutation) Một caacute thể thay đổi một số gen để biến đổi thagravenh một caacute thể mớiTất cả caacutec toaacuten tử trecircn khi thực hiện đều mang tiacutenh ngẫu nhiecircn

16Quaacute trigravenh cơ bản của một thuật toaacuten di truyền Khởi tạo

Đaacutenh giaacute quần thể

Lựa chọn NST thiacutech hợp nhất vagrave loại bỏ NST yếu nhất

Quy trigravenh giao nhau vagrave cải thiện quần thể

đột biến tiến trigravenh để khaacutem phaacute ra NST mới

17Ưu nhược điểm của việc kết hợp với thuật toaacuten di truyền Kiacutech thước quần thể lagrave 1 yếu tố quan trọng trong tốc độ của việc tigravem

kiếmnhưng noacute tương đối dễ dagraveng để dự đoaacuten tốc độ nagravey Giao nhau hoặc đột biến lagrave khocircng necircn đc sử dụng quaacute thường xuyecircn Luocircn coacute được iacutet nhất 1 giải phaacutep hợp lyacute Necircn coacute thể aacutep dụng chuacuteng cho caacutec vấn đề magrave chuacuteng ta khocircng coacute hướng

về caacutech giải quyết Sức mạnh của thuật toaacuten xuất phaacutet từ khaacutei niệm đơn giảnkhocircng phải từ

một thủ tục thuật toaacuten phức tạp 18Tương lai của học maacutey

Mạng lưới thần kinh nhacircn tạo vượt quaacute năng lực của con người trong caacutec trường hợp bị cocirc lập

Về mặt lyacute thuyếtmột maacutey tiacutenh coacute thể xử lyacute dũ liệu nhanh hơn hagraveng triệu lần so với 1 con người

May mắn thay cho chuacuteng tacon người tốt hơn nhiều khi magrave coacute được dữ liệumaacutey tiacutenh khocircng coacute 1 số thứ như lagrave 5 giaacutec quan

CHƯƠNG 10 KHO DỮ LIỆU

1 Kho dữ liệu Kho dữ liệu lagrave tuyển tập caacutec cơ sở dữ liệu tiacutech hợp hướng chủ đề được

thiết kế để trợ giuacutep cho một hệ hỗ trợ quyết định

Theo John Ladley Cocircng nghệ kho dữ liệu lagrave tập caacutec phương phaacutep kỹ thuật vagrave caacutec cocircng cụ coacute thể kết hợp hỗ trợ nhau để cung cấp thocircng tin cho người sử dụng trecircn cơ sở tiacutech hợp từ nhiều nguồn dữ liệu nhiều mocirci trường khaacutec nhau

Kho dữ liệu thường rất lớn tới hagraveng trăm GB hay thậm chiacute hagraveng Terabyte

2 Kho dữ liệu vận hagravenh (ODS) Một kho dữ liệu vận hagravenh Aacutep dụng kỹ thuật kho dữ liệu vagraveo caacutec hệ xử

lyacute giao taacutec lưu trữ dữ liệu cho một ứng dụng đặc thugrave Noacute đưa vagraveo kho dữ liệu một dograveng caacutec dữ liệu thocirc được thiết kế

3 So saacutenh

Kho dữ liệu vận hagravenh Kho dữ liệu

Dữ liệu theo chủ đề Dữ liệu theo chủ đề

Dữ liệu tiacutech hợp Dữ liệu tiacutech hợp

Dữ liệu thay đổi Dữ liệu khocircng thay đổi

Dữ liệu được cập nhật khi thay đổi

Dữ liệu giữ nguyecircn

Chỉ coacute dữ liệu hiện tạiDữliệu hiện tại vagrave dữ liệu lịch sử

Chu kỳ lagravem tươi dữ liệu ngắn Chu kỳ lagravem tươi dữ liệu dagravei

Chỉ coacute dữ liệu chi tiết Dữ liệu chi tiết vagrave dữ liệu tổng kết

Dugraveng cho caacutec quyết định ngắn hạn

Dugraveng cho hoạch định dagravei hạn

4 Kho dữ liệu cục bộ (Data Mart - DM)

Kho dữ liệu cục bộ lagrave CSDL coacute những đặc điểm giống với kho dữ liệu nhưng với quy mocirc nhỏ hơn vagrave lưu trữ dữ liệu về một lĩnh vực một chuyecircn ngagravenh

Data mart phụ thuộc Chứa những dữ liệu được lấy từ DW vagrave những dữ liệu nagravey sẽ được triacutech lọc vagrave tinh chế tiacutech hợp lại ở mức cao hơn để phục vụ một chủ đề nhất định của Datamart

Data mart độc lập Khocircng giống như Datamart phụ thuộc Data mart độc lập được xacircy dựng trước DW vagrave dữ liệu được trực tiếp lấy từ caacutec nguồn khaacutec nhau

5 Siecircu dữ liệu Metadata lagrave dữ liệu để mocirc tả dữ liệu Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột

một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi Metadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu

6 Mocirci trường kho dữ liệu Hệ thống của tổ chức vagrave kho cung cấp dữ liệu để xacircy dựng kho dữ liệu Trong quaacute trigravenh chuyển dữ liệu từ caacutec nguồn khaacutec nhau dữ liệu coacute thể

được lagravem sạch hoặc chuyển đổi vagrave vigrave thế DW được xem như lagrave một chuẩn cho việc lưu trữ

Đồng thời siecircu dữ liệu được ghi lại Cuối cugraveng DW hoặc siecircu thị coacute thể được sử dụng để tạo ra một kho dữ

liệu ldquocaacute nhacircnrdquo 7 Caacutec đặc điểm của kho dữ liệu

Đặc điểm Mocirc tả

Hướng chủ đề - DL tổ chức theo caacutech thức người dugraveng tham chiếu

Tiacutech hợp - Dữ liệu ldquosạchrdquo loại bỏ tiacutenh thiếu nhất quaacuten

Khocircng thay đổi - DL ldquochỉ đọcrdquo người dugraveng khocircng thay đổi được

Chuỗi thời gian - DL lagrave chuỗi thời gian khocircng phải lagrave trạng thaacutei hiện tại

Được tổng kết - DL vận hagravenhthao taacutec khi cần thiết

được kết hợp lại thagravenh dạng coacute thể dugraveng được cho quyết định

Kiacutech cỡ lớn hơn - Lưu giữ theo chuỗi thời gian tức lagrave giữ lại nhiều DL

Khocircng được chuẩn hoacutea - Coacute thể dư thừa DLSiecircu dữ liệu - Dữ liệu của dữ liệu được lưu trữNguồn dữ liệu - DL vận hagravenh (caacutec hệ sẵn coacute) cugraveng

với caacutec nguồn ngoagravei 8 Kho dữ liệu hướng chủ đề

Hướng chủ để coacute nghĩa lagrave kho dữ liệu được tổ chức xung quanh caacutec chủ đề chiacutenh như khaacutech hagraveng sản phẩm sản xuất Tập trung vagraveo việc mocirc higravenh hoacutea vagrave phacircn tiacutech dữ liệu cho caacutec nhagrave ra quyết định magrave khocircng tập trung vagraveo caacutec xử lyacute thocircng thường Cung cấp cho người dugraveng một khung nhigraven toagraven vẹn đơn giản vagrave đầy đủ về caacutec sự kiện quanh caacutec chủ đề

9 Dữ liệu trong DW được tiacutech hợp Dữ liệu trong kho dữ liệu được xacircy dựng bằng caacutech tổng hợp dữ liệu từ

nhiều nguồn khaacutec nhau vagrave caacutec nguồn coacute tổ chức khaacutec nhau Cơ sở dữ liệu caacutec file excel caacutec flat file hoặc caacutec raw file Khi đưa vagraveo kho dữ liệu caacutec dữ liệu được lagravem sạch vagrave tiacutech hợp dữ liệu nhằm đảm bảo tiacutenh nhất quaacuten của dữ liệu

10Kiến truacutec kho dữ liệu Tầng cơ sở dữ liệu hoạt động Tầng truy xuất thocircng tin Tầng truy xuất dữ liệu Tầng siecircu dữ liệu Tầng quản lyacute tiến trigravenh Tầng thocircng điệp của ứng dụng Tầng vật liacute của kho dữ liệu Tầng trigravenh diễn dữ liệu

11Higravenh trạng kho dữ liệu Kho dữ liệu ảo - người dugraveng cuối coacute thể truy cập trực tiếp đến kho dữ liệu

sử dụng caacutec cocircng cụ cho pheacutep ở tầng truy xuất dữ liệu Kho dữ liệu trung tacircm-1 cơ sở dữ liệu vật lyacute chứa tất cả dữ liệu cho một

vugraveng chuyecircn dụng nagraveo đoacute

Kho dữ liệu phacircn taacuten- Thagravenh phần được phacircn taacuten qua nhiều hệ cơ sở dữ liệu vật lyacute

12METADATA- Siecircu dữ liệu Định nghĩa Siecircu dữ liệu lagrave dữ liệu về dữ liệu Lagrave 1 lưu trữ dugraveng để

Miecircu tả kho dữ liệu tổng thể Nhận dạng kiểu kho dữ liệu Quản liacute quaacute trigravenh tiacutech hợp dữ liệu Quản liacute quaacute trigravenh cập nhật kho dữ liệu Quản liacute bảo mật

Lagrave chigravea khoacutea quyết định sự thagravenh cocircng của kho dữ liệu luocircn được thay đổi vagrave cập nhật theo sự phaacutet triển của kho dữ liệu

Dugraveng để quản liacute điều khiển kho dữ liệu Sự ra đời của kho dữ liệu như 1 cấu truacutec hỗ trợ ra quyết định siecircu dữ liệu

được xem như nguồn tagravei nguyecircn dữ liệu Siecircu dữ liệu lagrave trừu tượng Chuacuteng lagrave dữ liệu bậc cao cung cấp mocirc tả ngắn

gọn caacutec dữ liệu bậc thấp hơn 13Hoạt động của Siecircu dữ liệu

Siecircu dữ liệu rất cần thiết trong việc chuyển hoacutea thocircng tin trở thagravenh tri thức Lagrave chigravea khoacutea giuacutep chuacuteng ta xử lyacute được dữ liệu thocirc Viacute dụ một dograveng dữ liệu baacuten hagraveng 1023 K596 11121 agraveNoacute sẽ khocircng coacute nghĩa gigrave cho đến khi chuacuteng ta đưa vagraveo siecircu dữ liệu (thư

mục chứa dữ liệu) agrave cửa hagraveng 1023 sản phẩm K596 vagrave số tiền baacuten được lagrave 11121 đocirc la

14Sự cần thiết phải nhất quaacuten trong kho dữ liệu Kho dữ liệu được xacircy dựng cho lợi iacutech của những nhagrave phacircn tiacutech kinh

doanh caacutec nhagrave quản trị cho tất cả caacutec khu vực chức năng Trong cơ sở dữ liệu riecircng caacutec khu vực khaacutec nhau coacute thể định nghĩa vagrave lưu

trữ dữ liệu thocircng qua phiecircn bản của chiacutenh noacute Khi dữ liệu được lấy từ những vugraveng khaacutec nhau đoacute vagrave được đặt vagraveo kho dữ

liệu Việc chuyển đổi vagrave lagravem sạch caacutec tiến trigravenh sẽ đảm bảo noacute lagrave duy nhất được tiacutech hợp tại một mức của tổ chức

15Ragrave soaacutet lại dữ liệu ndash Thực thi siecircu dữ liệu

Bất kể cấu truacutec tự nhiecircn của 1 cacircu truy vấn thế nagraveo thigrave caacutec thagravenh phần của siecircu dữ liệu rất quan trọng đối với người ra quyết định

Bảng thuộc tiacutenh khoacutea được lưu trữ bởi kho dữ liệu Tập hợp dữ liệu được lấy từ đacircu Những chuyển đổi nagraveo được thực thi với việc lagravem sạch

16Siecircu dữ liệu lagrave gigrave Metadata - lagrave thocircng tin mocirc tả nội dung của cơ sở dữ liệu (CSDL) Metadata baacuteo cho người dugraveng biết thời gian cập nhật sau cugraveng của dữ liệu

định dạng vagrave mục điacutech sử dụng của noacute Những thocircng tin nagravey coacute thể hướng dẫn người dugraveng duyệt qua CSDL vagrave

giuacutep họ hiểu được yacute nghĩa vagrave ngữ cảnh của dữ liệu Trong CSDL metadata lagrave caacutec dạng biểu diễn khaacutec nhau của caacutec đối tượng

trong CSDL Trong CSDL quan hệ metadata lagrave caacutec định nghĩa của bảng cột CSDL

view vagrave nhiều đối tượng khaacutec Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột

một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi -gtMetadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu

Bảng chuyển đổi Ghi lại những chuyển đổi đatilde được thực hiện

Lịch sử thực thi Ghi lại những dữ liệu đatilde được

phacircn tiacutech

Higravenh thaacutei kết nốiGhi lại những dữ liệu được kết nối vagrave tần suất

17Aacutenh xạ thocircng thường của siecircu dữ liệu Bản ghi aacutenh xạ chuyển đổi bao gồm

Định danh của nguồn gốc Chuyển đổi thuộc tiacutenh Chuyển đổi thuộc tiacutenh vật lyacute Matilde hoacutea tham chiếu bảng chuyển đổi Đổi tecircn Đổi khoacutea Gaacuten giaacute trị cho thuộc tiacutenh mặc định Chọn logic cho caacutec nguồn nhiều giaacute trị Đổi thuật toaacuten

18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để

phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai

lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave

tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec

Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm

Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo

19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua

caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau

SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được

Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra

một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức

Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ

Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ

Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech

CHƯƠNG 11 KHAI PHAacute DỮ LIỆU

1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn

ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993

Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng

2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd

1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều

2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP

3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn

4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng

5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server

6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo

7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động

8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời

9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều

10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện

11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech

12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP

3 Xử lyacute phacircn tiacutech trực tuyến OLAP

MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave

dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu

ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave

thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu

HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave

ROLAP4 Khai phaacute dữ liệu

Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh

khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn

Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan

5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp

6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại

Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp

Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec

Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt

Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra

Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh

vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho

Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec

Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm

Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục

Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng

gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp

Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn

Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec

Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper

Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2

Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25

Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước

Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng

Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện

trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp

Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute

độ hỗ trợ ge ngưỡng minsup

độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan

Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn

Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết

Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu

MOLAP ROLAP HOLAP

Lưu trữ dữ liệu cơ sở

Khối Bảng quan hệ Bảng quan hệ

Lưu trữ thocircng tin tổng hợp

Khối Bảng quan hệ Khối

Hiệu suất thực hiện truy vấn

Nhanh nhất Chậm nhất Nhanh

Tiecircu thụ khocircng gian lưu trữ

Nhiều Thấp Trung bigravenh

Chi phiacute bảo trigrave Cao Thấp Trung bigravenh

Page 19: De cuong(1-11)

+ Caacutec thagravenh viecircn trong nhoacutem coacute thể lagravem việc ở những thời gian khaacutec nhau+ Caacutec thagravenh viecircn trong nhoacutem coacute thể lagravem việc cugraveng nhau hoặc ở caacutec tổ chức khaacutecnhau+ Nhoacutem coacute thể vĩnh viễn hoặc tạm thời+ Nhoacutem coacute thể ở bất kỳ mức quản lyacute nagraveo hoặc mức thời gian nagraveo+ Coacute sự điều phối (quaacute trigravenh vagrave nhiệm vụ đạt được) hoặc macircu thuẩn trongnhoacutem+ Coacute sự đạt được hoặcvagrave mất maacutet năng suất trong tổ chức+ Nhiệm vụ phải hoagraven thagravenh rất nhanh+ Khocircng thể hoặc quaacute đắt cho tất cả caacutec thagravenh viecircn trong nhoacutem cugraveng hợp ở mộtnơi+ Một số dữ liệu thocircng tin hoặc kiến thức cần thiết nằm ở nhiều nơi một sốkhaacutec ở ngoagravei tổ chức+ Chuyecircn mocircn của caacutec thagravenh viecircn khocircng coacute trong nhoacutem lagrave cần thiết- Caacutec hoạt động vagrave caacutec quaacute trigravenh miecircu tả caacutec cuộc họp+ Cuộc họp lagrave hoạt động chung liecircn quan bởi một nhoacutem người coacute địa vị bằngnhau hoặc gần bằng nhau+ Kết quả của cuộc họp phụ thuộc một phần vagraveo kiến thức yacute kiến caacutec đaacutenh giaacutecủa caacutec thagravenh viecircn+ Kết quả của cuộc họp cũng phụ thuộc vagraveo sự kết hợp của nhoacutem vagrave phụ thuộcvagraveo quaacute trigravenh ra quyết định được sử dụng bởi nhoacutem đoacute+ Giải quyết caacutec yacute kiến khaacutec nhau bởi người coacute quyền hạn hoặc thương lượnghoặc phacircn xửHỗ trợ giao tiếp- Giao tiếp lagrave thagravenh phần quan trọng cho hỗ trợ quyết định Khocircng coacute giao tiếp thigravekhocircng coacute cộng taacutec Những người ra quyết định caacute nhacircn phải giao tiếp với caacutecđồng nghiệp chuyecircn gia cơ quan chiacutenh phủ khaacutech hagraveng đối taacutec kinh doanh hellipHọ cũng cần dữ liệu vagrave thocircng tin (vagrave kiến thức) từ nhiều nơi trecircn thế giới Caacutecnhoacutem ra quyết định phải giao tiếp cộng taacutec vagrave thương lượng trong cocircng việcHầu hết caacutec tổ chức sẽ nhanh trở thagravenh khocircng coacute chức năng nếu khocircng coacute caacutec hệthống giao tiếp Thương mại điện tử coacute thể hiệu quả chỉ qua caacutec kỹ thuật giao tiếphiện đại- Caacutec kỹ thuật thocircng tin hiện đại cung cấp caacutec phương tiện hỗ trợ giao tiếp rẻnhanh coacute khả năng coacute thể tin cậy Nền tảng hỗ trợ giao tiếp lagrave caacutec hệ thống maacuteytiacutenh mạng+ Bắt đầu bằng điện baacuteo điện thoại radio vagrave ti vi+ Trong 100 năm chuacuteng ta phaacutet triển maacutey fax thư điện tử chương trigravenh chatnhoacutem tin tức hệ thống hội nghị truyền higravenh Hầu hết caacutec kỹ thuật nagravey đềuhoạt động trecircn internet+ Sự phaacutet triển giao tiếp sau cugraveng lagrave hệ thống họp điện tử caacutec dịch vụ vagrave hệ

thống hội nghị điện tử thường sử dụng internet để kết nối caacutec người ra quyếtđịnh- Caacutec thuận lợi aacutep dụng caacutec phương phaacutep giao tiếp cải tiến trong caacutec tổ chức+ Cải tiến năng suất của nhacircn viecircn+ Liecircn quan đến nhiều người ra quyết định chiacutenh+ Khocircng quan tacircm nhiều đến đường biecircn giới địa lyacute+ Tạo nền văn hoacutea hợp taacutec nhất quaacuten+ Cải tiến chất lượng cuộc sống của nhacircn viecircnHỗ trợ cộng taacutec Maacutey tiacutenh hỗ trợ cộng taacutec- Khung thời giannơi chốn+ Sự hiệu quả của kỹ thuật tiacutenh toaacuten cộng taacutec phụ thuộc vagraveo vị triacute của caacutec thagravenhviecircn trong nhoacutem vagrave phụ thuộc vagraveo thời gian chia sẽ thocircng tin gởi vagrave nhận+ Chia sự giao tiếp thagravenh bốn ocirc vagrave tổ chức bốn ocirc dọc theo 2 chiều thời gian vagravenơi chốn1048713 Thời gian Khi gởi vagrave nhận thocircng tin hầu như đồng thời giao tiếp lagrave đồngthời Viacute dụ Điện thoại ti vi vagrave caacutec cuộc họp gặp mặt nhau Giao tiếp bấtđồng bộ xảy ra khi người nhận nhận thocircng tin ở thời điểm khaacutec thời điểmgởi thocircng tin đoacute1048713 Nơi chốn Người gởi vagrave người nhận coacute thể ở cugraveng phograveng hoặc khocircng+ Bốn ocirc lagrave1048713 Cugraveng thời giancugraveng nơi chốn Caacutec thagravenh viecircn gặp mặt nhau cugraveng một luacutecgiống như phograveng quyết định hoặc gặp mặt truyền thống1048713 Cugraveng thời giankhaacutec nơi chốn Caacutec thagravenh viecircn ở caacutec nơi khaacutec nhau nhưnggiao tiếp cugraveng nhau Viacute dụ hội nghị truyền higravenh (videoconferencing)1048713 Khaacutec thời giancugraveng nơi chốn Nhiều người lagravem việc theo ca Ca nagravey để lạithocircng tin cho ca khaacutec1048713 Khaacutec thời giankhaacutec nơi chốn Caacutec thagravenh viecircn ở caacutec nơi khaacutec nhau Caacutecthagravenh viecircn nagravey gởi vagrave nhận thocircng tin ở những lần khaacutec nhau

23Thực thi hệ DSSHệ thống hỗ trợ quản lyacute (MSS) khocircng phải luacutec nagraveo cũng luocircn thagravenh cocircng Nhiều trường hợpthất bại của ES khocircng hoagraven toagraven lagrave lyacute do kỹ thuật Thực thi hệ thống lagrave một quaacute trigravenh liecircn tụcnhằm đảm bảo cho tổ chức chuẩn bị tiếp nhận một hệ thống mới vagrave đưa hệ thống vagraveo sử dụngthagravenh cocircngThực hiện cocircng nghệ hệ thống hỗ trợ quản lyacute lagrave việc phức tạp vigrave caacutec hệ thống nagravey khocircng đơnthuần lagrave hệ thống thocircng tin chỉ thu thập thao taacutec vagrave phacircn phối thocircng tin Magrave xa hơn chuacuteng

liecircn quan tới caacutec cocircng việc coacute thể lagravem thay đổi đaacuteng kể caacutech thức hoạt động của tổ chức Tuyvậy đa số caacutec yếu tố thực thi đều liecircn quan tới hệ thống thocircng tinThực thi MSS lagrave quaacute trigravenh liecircn tục diễn ra trong suốt thời gian phaacutet triển hệ thống từ đề xuấtban đầu đến nghiecircn cứu khả thi thiết kế vagrave phacircn tiacutech hệ thống lập trigravenh huấn luyện chuyểnđổi vagrave lắp đặt Caacutec chuyecircn gia hệ thống thocircng tin thường gọi thực thi lagrave giai đoạn cuối trongvograveng đời hệ thống Định nghĩa thực thi MSS phức tạp hơn vigrave bản chất lặp của sự phaacutet triểncaacutec hệ thống

THỰC THI KHOcircNG HOAgraveN CHỈNHCaacutec quyết định về tiacutenh khả thi thường coacute giả định về lợi iacutech đạt được khi kế hoạch thực thiđược thực hiện hoagraven toagraven Trong thực tế thường chỉ thực hiện 90 thậm chiacute 70 phần trăm sovới phacircn tiacutech khả thi Lyacute do lagrave sự thay đổi tại một nơi trong hệ thống coacute thể ảnh hưởng vagrave coacutethể taacutec động tiecircu cực đến chỗ khaacutec Do vậy cấp quản lyacute coacute thể bỏ những phần trong dự aacuten coacutethể gacircy ra taacutec động xấu Do đoacute dự aacuten sẽ thực hiện iacutet hơn 100 so với dự aacuten kế hoạch Caacutec lyacutedo khaacutec coacute thể lagrave do khấu trừ ngacircn saacutech hoặc vượt chi phiacuteĐAacuteNH GIAacute SỰ THAgraveNH COcircNG CỦA THỰC THI HỆ THỐNGPhải coacute caacutec chỉ số đo lường thigrave mới coacute thể đaacutenh giaacute sự thagravenh cocircng khi thực thi một hệ thốngDickson va Powers (1973) đề ra 5 tiecircu chuẩn độc lậpbull Tỷ lệ thời gian thực hiện dự aacuten với thời gian ước lượngbull Tỷ lệ chi phiacute thực tế vagrave ngacircn saacutech thực hiệnbull Thaacutei độ của cấp quản lyacute đối với hệ thốngbull Nhu cầu thocircng tin của caacutec nhagrave quản lyacute được đaacutep ứng như thế nagraveo qua hệ thốngbull Taacutec động của dự aacuten đối với những hoạt động maacutey tiacutenh trong cocircng tyCaacutec đo lường khaacutec để đaacutenh giaacute thagravenh cocircng của hệ hỗ trợ quản lyacute (MSS)bull Sự sử dụng hệ thống (dự định dugraveng hoặc thực sự dugraveng)bull Thỏa matilden của người dugravengbull Thaacutei độ taacuten thagravenhbull Mức độ hệ thống hoagraven thagravenh caacutec mục tiecircu ban đầubull Phần thưởng đối với tổ chức (giảm chi phiacute tăng doanh thuhellip)bull Tỷ số lợi iacutech chi phiacute

bull Mức độ thể chế hoacutea của MSS trong tổ chứcDo bởi tiacutenh đa dạng của DSS necircn việc đaacutenh giaacute sự thagravenh cocircng của hệ nagravey cũng khoacute khăn tuynhiecircn cũng coacute thể coacute một số yếu tố giuacutep cho DSS thagravenh cocircng như sự tham gia người dugravenghuấn luyện người dugraveng hỗ trợ quản lyacute cấp cao nguồn thocircng tin đặc điểm của những nhiệmvụ coacute liecircn quan (cấu truacutec bất định độ khoacute phụ thuộc)

Chương5Nhoacutem hỗ trợ quyết định vagrave nhoacutemcocircng nghệ phần mềm

51Nhoacutem tạo quyết định

MDM-Holsapple đatilde gợi yacute chuacuteng ta sử dụng giới hạn người tạo quyết định

Một nhoacutem lagrave kết cấu MDM nơi magrave nhiều người ra quyết định hoagraven toagraven tương taacutec

Một đội lagrave kết cấu MDM nơi caacutec thagravenh viecircn tư vấn cho người đưa ra quyết định nhưng khocircng tương taacutec

Một Ủy ban lagrave kết cấu MDM với một người tạo quyết định duy nhất vagrave sự tương taacutec giữa caacutec thagravenh viecircn

Mạng thocircng tin

Mạng lưới baacutenh xe mỗi người tham gia coacute thể giao tiếp với người đưa ra quyết định ở trung tacircm nhưng khocircng phải với người tham gia khaacutecCấu truacutec nagravey lagrave khocircng thỏa matilden tất cả những người tham gia ngoại trừ người ra quyết định

Mạng dacircy chuyền Tham gia chuyển tiếp thocircng tin chỉ để noacute luocircn liền kề nhau trong chuỗi

Thagravenh viecircn cuối cugraveng ko được đaacutep ứng

Mạng vograveng trograven Tương tự như chuỗi nhưng kết thuacutec được kết nối

Mạng kết nối hoagraven toagraven khocircng coacute hạn chế về giao tiếp vagrave tương taacutec giữa caacutec thagravenh viecircnNoacutei chungnoacute đaacutep ứng hầu hết caacutec kết nối của người tham gia nhưng truyền đạt thocircng tin mất nhiều thời gian vagrave coacute nhiều cơ hội xảy ra lỗi

Nhoacutem hagravenh vi vagrave chuẩn mực

MDMs thiết lập caacutec chỉ tiecircu hướng dẫn quaacute trigravenh ra quyết định

Một chuẩn mực quy định cụ thể những gigrave thagravenh viecircn trong nhoacutem dự kiến sẽ lagravem trong những hoagraven cảnh nhất định

Quy tắc gửi coacute thể được thocircng qua viacute dụ đaacutenh giaacute ngang hagraveng hoặc xử phạt

Lagravem thế nagraveo để đưa ra quyết định

Việc chọn lựa magrave trong đoacute việc sử dụng cấu truacutec MDM phải được dựa trecircn một số yếu tố liecircn quan với bối cảnh quyết định

Viacute dụmột cấu truacutec riecircng lẻ sẽ lagravem việc nơi magrave quyết định được cấu truacutec cao vagrave thocircng tin lagrave coacute sẵn

Một ủy ban cơ cấu sẽ lagrave sự lựa chọn khi người ra quyết định khocircng thể đưa ra quyết định một migravenh

52Caacutec vấn đề thường gặp trong nhoacutem

Kiacutech thước Noacutei chung sự nhất triacute vagrave gắn kết giữa caacutec thagravenh viecircn tỉ lệ nghịch với phạm vi nhoacutem Trong nhoacutem lớn rất dễ higravenh thagravenh caacutec nhoacutem nhỏ vagrave hoạt động rời rạc

Tư duy tập thể Trong nhoacutem lớn mọi người coacute xu hướng suy nghĩ đểđạtđược sự nhất triacute necircn khocircng phaacutet huy được sự saacuteng tạo

Caacutec vấn đề về xatilde hội

Xung đột Trong 1 nhoacutem ai cũng muốn migravenh lagrave giỏi nhất necircn dễ dẫn đến xung đột

Ẩn danh(Giấu tecircn) Đacircy lagrave phương phaacutep được sử dụng để kiểm soaacutet xung đột Cho caacutec thagravenh viecircn tham gia ẩn danh

Vấn đề giới tiacutenh Nam vagrave nữ thường coacute những thế mạnh khaacutec nhau điều nagravey coacute thể lagrave sức mạnh trong 1 thiết lập MDM

Đagravem phaacuten vagrave quyết định

Một quyết định coacute thể liecircn quan đến nhiều quan điểm khaacutec nhau vigrave thế cần phải coacute sự đagravem phaacuten

Caacutec thiết kế của cơ chế hỗ trợ cho MDM phải phugrave hợp với caacutec hoạt độngđagravemphaacuten

Những hoạt động nagravey bao gồm việc thu nhận yacute kiến của caacutec thagravenh viecircn 1 caacutech cocircng bằng

53Cocircng nghệ hỗ trợ MDM

Organizational DSSndash 1 hệ thống cung cấp caacutec quyết định hỗ trợ

Group Support Systemndash Cocircng nghệ sử dụng sự hỗ trợ của nhiều becircn tham gia

Group DSS ndash Lagrave 1 hệ thống được thiết kế đặc biệt để hỗ trợ cho MDM

DSS ndash Lagrave 1 hệ thống dưới sự kiểm soaacutet của 1 người quyết định hệ thống nagravey cung cấp 1 bộ cocircng cụ giuacutep phacircn tiacutech hoagraven cảnh đểđưa ra quyết định vagrave nacircng cao hiệu quả của quyết địnhđoacute

53Cocircng nghệ hỗ trợ MDM

Organizational DSSndash 1 hệ thống cung cấp caacutec quyết định hỗ trợ

Group Support Systemndash Cocircng nghệ sử dụng sự hỗ trợ của nhiều becircn tham gia

Group DSS ndash Lagrave 1 hệ thống được thiết kế đặc biệt để hỗ trợ cho MDM

DSS ndash Lagrave 1 hệ thống dưới sự kiểm soaacutet của 1 người quyết định hệ thống nagravey cung cấp 1 bộ cocircng cụ giuacutep phacircn tiacutech hoagraven cảnh đểđưa ra quyết định vagrave nacircng cao hiệu quả của quyết địnhđoacute

Mục tiecircu của cocircng nghệ hỗ trợ MDM

Quy trigravenh hỗ trợ tập trung vagraveo quaacute trigravenh tạo điều kiện thuận lợi cho sự tương taacutec

Cơ chế cấu truacutec quaacute trigravenh chi phối caacutec hoạt động truyền thocircng

Nhiệm vụ hỗ trợ cocircng việc coacute thể chọn lựa tổ chức hoặc lấy thocircng tin

Nhiệm vụ cấu truacutec cocircng việc cho pheacutep truy cập đến kỹ thuật lọc kết hợp phacircn tiacutech kiến thức liecircn quan đến cocircng việc

Caacutec lớp loại cocircng nghệ hỗ trợ MDM

Phacircn loại theo đặc điểm do DeSanctis vagrave Gallupe đưa ra đề xuất một chương trigravenh ba cấp dựa trecircn caacutec tiacutenh năng được cung cấp

Hệ thống cấp 1 Mục điacutech chiacutenh lagrave tạo điều kiện thocircng tin liecircn lạc giữa caacutec thagravenh viecircn

Hệ thống cấp 2 Thiết kế để giảm thiểu rủi ro

Hệ thống cấp 3 Giuacutep điều chỉnh xử lyacute quyết định

Phacircn loại theo cocircng nghệ -Kraemer vagrave King tập trung vagraveo cocircng nghệ aacutep dụng

Cocircng nghệ bảng mạch điện tử

Hội nghị trực tuyến

Mạng lưới tập đoagraven

Trung tacircm thocircng tin

Mocirci trường cộng taacutec

Phograveng quyết định

Nhoacutem phần mềm

Phần mềm được thiết kế để hỗ trợ sự hợp taacutec bao gồm việc thu huacutet vagrave lưu trữ thocircng tin

Caacutec tổ chức dẫn đầu thị trường hiện tại lagrave Lotus Notes and Domino Microsoft Exchange Novell GroupWise and Oracle Office

Caacutec cocircng cụ trong một bộ phần mềm bao gồm người quản lyacute hội nghị (Lotus Sametime) vagrave trao đổi thocircng điệp (Lotus Notes Mail)

Xếp hạng phần mềm cho nhoacutem

Ellis vv đề xuất một hệ thống xếp hạng dựa vagraveo kiểu sự hỗ trợ noacute Cung cấp

Hệ thocircng điệp

Hệ thống hội thảo truyền higravenh

Hệ thống cộng taacutec soạn thảo

Nhoacutem phacircn phối giải phaacutep phần mền

Hệ thống phối hợp

Hệ thống thocircng minh đại diện

Lực lượng điều khiển phaacutet triển phần mềm cho nhoacutem

Một số nhacircn tố chiacutenh bao gồm

Tăng năng suất

Giảm số lượng caacutec cuộc họp

Tăng cường tự động hoacutea caacutec quy trigravenh lagravem việc thường xuyecircn

Cần phối hợp toagraven cầu tốt hơn

Tiacutenh sẵn sagraveng của những mạng lan rộng

Coleman vagrave Khanna liệt kecirc 10 nhacircn tố khaacutec

54Quản lyacute hoạt động MDM (Mobile Device Management - Quản lyacute thiết bị di động)

Một số phương phaacutep phối hợp phổ biến hơnMDM lagrave

Kỹ thuật nhoacutem định danh

Kỹ thuật Delphi

Sự phacircn xử

Hệ thocircng tin dựa trecircn vấn đề

Nemawashi

Kỹ thuật nhoacutem định danh

1-Mỗi người tham gia viết ra những yacute tưởng về những gigrave necircn quyết định

2-Lần lượt mỗi người tham gia trigravenh bagravey yacute tưởng của migravenh được ghi lại trecircn bảng Khocircng thảo luận ở đacircy

3-Sau khi tất cả caacutec yacute tưởng được trigravenh bagravey caacutec đại biểu coacute thể chất vấn những người khaacutec

4-Mỗi người tham gia bỏ phiếu cho mỗi yacute tưởng

Kỹ thuật Delphi

Về cơ bản tương tự như kỹ thuật nhoacutem định danh ngoại trừ những người khocircng bao giờ tham gia cuộc họp

Một cocircng cụ khảo saacutet được sử dụng để thu thập đầu vagraveo ban đầu từ caacutec thagravenh viecircn

Một cuộc khảo saacutet thứ hai được gửi đi với một bản toacutem tắt caacutec kết quả chung

Những bước lặp lại cho đến khi đạt được một sự đồng thuận hoặc nhigraven nhận của đa số

Sự phacircn xử(Arbitration )

Thiacutech hợp nhất khi caacutec thagravenh viecircn của MDM đại diện cho caacutec yếu tố đối lập

Những người tham gia đồng yacute rằng nếu lựa chọn thay thế hai becircn thỏa thuận khocircng được tigravem thấy thigrave một trọng tagravei viecircn becircn ngoagravei sẽ tham gia

Trọng tagravei sau đoacute lựa chọn thay thế ocircng hoặc xeacutet thấy thiacutech hợp nhất

Hệ thống thocircng tin dựa trecircn vấn đề (IBIS)

Lagrave một phương phaacutep lập luận cấu truacutec

Một đại diện cho IBIS lagrave một đồ thị với caacutec nuacutet vagrave caacutec liecircn kết

IBIS bắt đầu với lựa chọn của một nuacutet vấn đề gốc sau đoacute caacutec nuacutet vị triacute khaacutec nhau được liecircn kết với nuacutet gốc

Caacutec nuacutet vị triacute nagravey sau đoacute được đaacutenh giaacute dựa trecircn những lập luận gắn liền với chuacuteng

Nemawashi (được sử dụng rộng ratildei tại Nhật Bản)

1-Một hoặc nhiều thagravenh viecircn của MDM được chỉ định lagrave điều phối viecircnCaacutec điều phối viecircn sau đoacute chọn người tham gia cograven lại

2-Điều phối viecircn xacircy dựng một tổng hợp caacutec sự lựa chọn vagrave sau đoacute caacutec chuyecircn gia đaacutenh giaacute caacutec lựa chọn

3-Điều phối viecircn lựa chọn một sự lựa chọn dựa trecircn kết quả ở trecircn(ở 2)

4-Sự thay thế được luacircn chuyển điều phối viecircn tigravem kiếm sự đồng thuận thocircng qua sự thuyết phục vagrave đagravem phaacuten

5-Nếu đạt được sự đồng thuận điều phối viecircn cho lưu thocircng một tagravei liệu magrave mỗi thagravenh viecircn MDM để lại dấu hiệu trecircn đoacute

55Nơi lagravem việc ảo

Nhiều tổ chức trecircn toagraven thế giới kinh doanh bất động sản cho cocircng nghệ hợp taacutec

Cocircng việc được trở thagravenh một điều bạn lagravem hơn lagrave một nơi bạn đi

Những thay đổi lớn nhất mang lại bởi nơi lagravem việc ảo coacute thể lagrave về văn hoaacute hay xatilde hội hơn lagrave về cocircng nghệ

Chương 6 Hệ thống thocircng tin điều hagravenh

61 Yacute nghĩa của EIS- Hệ thống thocircng tin điều hagravenh

- EIS lagrave một dạng đặc biệt của DSS được thiết kế để hỗ trợ ra quyết định ở cấp cao nhất của một tổ chức

- Lagrave một hệ thống thocircng tin hỗ trợ nhu cầu lập kế hoạch vagrave đaacutenh giaacute của caacutec nhagrave quản lyacute điều hagravenh

- EIS coacute thể giuacutep một CEO coacute được bức tranh tổng thể chiacutenh xaacutec nhất về caacutec hoạt động vagrave một bản toacutem tắt những gigrave magrave đối thủ cạnh tranh đang lagravem

- Caacutec hệ thống nagravey noacutei chung hoạt động dễ dagraveng vagrave trigravenh bagravey thocircng tin theo những caacutech dễ hiểu để việc tiếp thu được nhanh choacuteng (biểu đồ đồ thịhellip)

(Tagravei liệu thecircm EIS lagrave những loại hệ thống lagrave rất phức tạp trong tự nhiecircn Coacute thể noacutei hệ thống nagravey cũng cung cấp cho caacutec nhagrave quản lyacute với caacutec thiết bị coacute khả năng ra quyết định bằng caacutech sử dụng của noacute Hệ thống nagravey hoạt động trong điều kiện như vậy quan trọng như trong caacutec hệ thống khaacutec khocircng hỗ trợ Khả năng lưu trữ dữ liệu nặng lagravem cho noacute lyacute tưởng để được thocircng qua khocircng chỉ bởi caacutec doanh nghiệp lớn magrave cograven bởi caacutec doanh nghiệp nhỏ hơn Nhigraven chung hệ thống nagravey lagrave dagravenh cho caacutec nhacircn viecircn cấp cao hỗ trợ thagravenh thạo trong việc đưa ra caacutec quyết định quan trọng)

Caacutec phiecircn EIS tiecircu biểu- Phiecircn lagravem việc coacute thể bắt đầu với một baacuteo caacuteo về tigravenh higravenh tagravei chiacutenh vagrave kinh

doanh của một cocircng ty caacutec chỉ số hoạt động quan trọng được hiển thị rotilde ragraveng- EIS sẽ cho pheacutep caacutec giaacutem đốc điều hagravenh coacute thể đi sacircu vagraveo dữ liệu từ những con

số bất kỳ magrave noacute hỗ trợ- Việc điều hagravenh coacute thể lựa chọn một mức độ chi tiết ( VD danh số baacuten hagraveng) nếu

như cần điều tra thecircm- Lagrave một phương phaacutep tiếp cận coacute thể giuacutep việc ra quyết định tốt hơn

Những điều magrave EIS ko coacute- EIS khocircng phải lagrave sự thay thế cho caacutec hệ thống dựa trecircn caacutec maacutey tiacutenh khaacutec EIS

thực sự chỉ cung cấp dữ liệu cho caacutec hệ thống nagravey- Noacute khocircng thể biến caacutec bộ hệ điều hagravenh của maacutey tiacutenh thagravenh những ldquochuyecircn viecircn

giỏirdquo- Coacute thể được viacute một caacutech cao hơn như lagrave một trợ lyacute đaacuteng tin cậy coacute thể được gọi

đến bất khi nagraveo vagrave mỗi khi cần thiết

Tagravei liệu thecircm Sự khaacutec nhau giữa EIS vagrave DSS+ EIS thiết kế để hỗ trợ những người điều hagravenh cấp cao giuacutep họ khaacutem phaacute caacutec vấn đề vagrave caacutec cơ hội DSS hỗ trợ những nười phacircn tiacutech cố gắng trả lời cacircu hỏi caacutei gigrave coacute thể lagravem cugraveng với một cơ hội hoặc một vấn đề

Chiều EIS DSSNhững người sử dụng thocircng thường

Duyệt dữ liệu đi xuống truy xuất trạng thaacutei

Hỗ trợ phacircn tiacutech vagrave quyết định

Sự thuacutec đẩy Tiacutenh thiacutech hợp Tiacutenh hiệu quảỨng dụng Queacutet mocirci trường đaacutenh giaacute

hiệu suất nhận dạng caacutec vấn đề vagrave caacutec cơ hội

Caacutec quyết định quản lyacute trecircn caacutec lĩnh vực đa dạng

Hỗ trợ quyết định Caacutec chiacutenh saacutech caacutec quyết định khocircng coacute cấu truacutec ở mức cao vagrave hỗ trợ giaacuten tiếp

Hỗ trợ caacutec quyết định lặp lại caacutec quyết định khocircng thể đoaacuten trước ra quyết định khocircng coacute cấu truacutec vagrave baacuten cấu truacutec

Loại thocircng tin Caacutec thocircng tin tin tức thocircng tin becircn ngoagravei về khaacutech hagraveng đối thủ cạnh tranh mocirci trường caacutec baacuteo caacuteo theo yecircu cầu vagrave định thời về caacutec hoạt động becircn trong

Caacutec thocircng tin hỗ trợ caacutec tigravenh huống đặc biệt

Sử dụng coacute nguyecircn tắc

Dograve theo vết vagrave điều khiển nhận dạng cơ hội

Hoạch định tổ chức phacircn nhoacutem vagrave điều khiển

Khả năng phugrave hợp với những người sử dụng caacute nhacircn

Thiết kế loại ra quyết định cho mỗi người điều hagravenh caacute nhacircn bằng nhiều lựa chọn đầu ra

Cho pheacutep caacutec đaacutenh giaacute caacute nhacircn caacutec khả năng what-if lựa chọn loại hộp hội thoại

Đồ họa Phải coacute Lagrave một phần quan trọng của nhiều DSS

Thacircn thiện người sử dụng

Phải coacute Phải coacute nếu khocircng coacute người sử dụng trung gian

Xử lyacute thocircng tin Lọc neacuten thocircng tin dograve theo vết dữ liệu vagrave thocircng tin quan trọng

EIS kiacutech thiacutech caacutec cacircu hỏi caacutec cacircu trả lời bằng caacutech sử dụng DSS vagrave phản hồi lại EIS

Hỗ trợ caacutec thocircng tin chi tiết

Truy xuất thường xuyecircn caacutec mức chi tiết của bất kỳ thocircng tin tổng hợp nagraveo (duyệt dữ

Coacute thể coacute trong DSS nhưng khocircng thường

liệu chi tiết)Cơ sở mocirc higravenh Caacutec chức năng coacute sẵn bị hạn

chếLagrave điểm cốt lotildei của DSS

Cấu truacutec Theo người baacuten sản phẩm hoặc theo caacutec chuyecircn gia hệ thống thocircng tin

Theo người sử dụng hoặc caacute nhacircn hoặc caacutec chuyecircn gia từ caacutec trung tacircm thocircng tin hoặc phograveng ban hệ thống thocircng tin

Phần cứng Mainframe caacutec trạm RISC mạng LANs hoặc caacutec hệ thống phacircn bố

Mainframe caacutec trạm RISC caacutec maacutey PC hoặc caacutec hệ thống phacircn bố

Bản chất caacutec goacutei phần mềm

Truy xuất tương taacutec dễ dagraveng đến nhiều cơ sở dữ liệu truy xuất trực tuyến caacutec khả năng DBMS phức tạp caacutec liecircn kết phức tạp

Caacutec khả năng tiacutenh toaacuten lớn caacutec ngocircn ngữ mocirc higravenh mocirc phỏng ứng dụng vagrave caacutec bộ tạo DSS

Bản chất caacutec thocircng tin

Trigravenh bagravey thocircng tin được phaacutet sinh trước về quaacute khứ vagrave hiện tại tạo caacutec thocircng tin mới về quaacute khứ hiện tại tương lai

Tạo thocircng tin mới về quaacute khứ hiện tại tương lai

62 Lịch sử EIS- EIS xuất hiện lần đầu tiecircn tại MIT vagraveo những năm 1970

- Những EIS đầu tiecircn được phaacutet triển bởi caacutec doanh ngiệp lớn sẵn sagraveng chấp nhận rủi ro để đạt được lợi thế cạnh tranh

- Vagraveo những năm 1980 caacutec nhagrave cung cấp đatilde phaacutet triển một số cơ sở khaacutech hagraveng rộng vagrave cocircng nghệ EIS được tiếp tục phaacutet triển cho đến ngagravey nay

(Tagravei liệu thecircm Sử dụng DSSEIS cho phaacutet triển bền vững + Một số nghiecircn cứu đatilde được tiến hagravenh để kiểm tra việc thực hiện của EIS trong khu vực cocircng cộng vagrave chiacutenh phủ caacutec nước tổ chức kể từ khi chuacuteng được phaacutet triển theo định hướng lợi nhuận cho caacutec cocircng ty tư nhacircn (Hasan vagrave Hasan năm 1997) Theo một nghiecircn cứu tiến hagravenh tại Mỹ ở hơn 300 cocircng ty kết quả cho thấy sự khaacutec biệt của EIS giữa tư nhacircn vagrave chiacutenh phủ một số kết quả thuacute vị được phaacutet hiệnViacute dụ khoacute khăn hơn để chuyển tiền từ một tagravei khoản khaacutec trong một EIS của chiacutenh phủ cũng lagrave khoacute khăn hơn để biện giải thiacutech cho những chi phiacute phaacutet triển EIS của chiacutenh phủ Một nghiecircn cứu khaacutec được tiến hagravenh ở Australia

cho thấy rằng EIS cung cấp cho quản lyacute một higravenh ảnh chiacutenh xaacutec hơn về tổ chức thực hiện vagrave cung cấp hỗ trợ cho caacutec lợi iacutech chiến lược cải thiện khocircng chỉ cho caacutec nhagrave quản lyacute nhưng cograven cho phần cograven lại của tổ chức Dựa trecircn caacutec hệ thống được thiết kế cho caacutec cocircng ty tư nhacircn với một caacutech rotilde ragravengxaacutec định mục tiecircu EIS lagrave thiacutech hợp cho caacutec tổ chức cocircng cộng hiện đại nhưng cần phải được linh hoạt hơn vagrave kết thagravenh chugravem một phạm vi rộng hơn khả năng vagrave phương tiện hơn so với khu vực tư nhacircn ban đầu theo định hướng sản phẩm (Hasan vagrave Hasan năm 1997) Điều nagravey coacute thể lagrave do thực tế rằng caacutec hoạt động khu vực cocircng lagrave bắt buộc coacute taacutec động rộng phải đaacutep ứng sự mong đợi duy nhất cocircng cộng thường coacute mục tiecircu mơ hồ vagrave macircu thuẫn iacutet quyền tự chủ vagrave kiểm soaacutet việc ra quyết định vagrave nhacircn viecircn lagrave khoacute khăn hơn (Watson vagrave Carte2000) + Toacutem lại EIS lagrave một khaacutei niệm thagravenh cocircng noacute phaacutet triển qua nhiều năm tuy nhiecircn EIS khắc phục khiếm khuyết của migravenh bằng caacutech tiến hagravenh nghiecircn cứu liecircn tục)

63 Tại sao những người điều hagravenh hagraveng đầu lại khaacutec nhau- Họ lagrave những doanh nghiệp theo định hướng coacute suy nghĩ

- Coacute một khoảng khocircng gian rộng để kiểm soaacutet

- Họ chịu traacutech nhiệm cho việc thiết lập chiacutenh saacutech

- Họ đại diện cho tổ chức mocirci trường becircn ngoagravei

- Hagravenh động của họ tạo ra những kết quả đaacuteng kể về tagravei chiacutenh vagrave con người

Tần số caacutec hoạt động điều hagravenh- Xử lyacute xaacuteo trộn 42

- Hoạt động kinh doanh 32

- Phacircn bổ nguồn lực 17

- Đagravem phaacuten 3

- Những điều khaacutec 6

Handling Disturbances 42

Entrepreneurial Activites 32

Resource Allocation 17

Negotiation 3

Other 6

Những thocircng tin điều hagravenh cần thiết- Quản lyacute xaacuteo trộn coacute thể yecircu cầu sự chuacute yacute xung quanh đồng hồ

- Hoạt động kinh doanh yecircu cầu điều hagravenh để dự đoaacuten những thay đổi trong mocirci trường

- Nhiệm vụ phacircn bổ tagravei nguyecircn yecircu cầu lựa chọn người quản lyacute vagrave caacutec nguồn lực hạn chế được triển khai

- Đagravem phaacuten yecircu cầu cập nhật thocircng tin từng phuacutet để coacute thể xacircy dựng được sự đồng thuận

Caacutec loại thocircng tin điều hagravenh- Hệ thống kế toaacuten coacute liecircn quan đến việc tiacutenh toaacuten thu nhập hoạt động cho caacutec lĩnh

vực cụ thể lagrave quan trọng hơn so với caacutec hệ thống kế toaacuten truyền thocircng- Thocircng tin về thị trường khaacutech hagraveng cung cấp giaacute trị trong việc quyết định chiến

lược- Caacutec thocircng tin cần thiết thường được truyền đi trecircn một số hệ thống maacutey tiacutenh vagrave

nằm trong toagraven tổ chức- Caacutec thocircng tin được sử dụng thường lagrave ngắn hạn vagrave dễ thay đổi

Phương thức để xaacutec định thocircng tin cần thiết

Rockart xaacutec định được năm phương thức cơ bản để xaacutec định thocircng tin cần thiết

- Phương thức dựa trecircn kết quả- Phương thức rỗng- Phương thức chỉ số khoacutea- Phương thức tổng hợp nghiecircn cứu- Phương thức dựa vagraveo nhacircn tố then chốt dẫn đến thagravenh cocircng

64 Thagravenh phần EIS

- Sản phẩm EIS đầu tiecircn được phaacutet triển để sử dụng trecircn maacutey tiacutenh cấu higravenh cao nhưng caacutec sản phẩm hiện nay nhằm mục tiecircu lagrave nền tảng ClientServer

- Những nền tảng linh hoạt hơn coacute thể thiacutech ứng với thay đổi trong tổ chức vagrave cocircng nghệ

- Sử dụng dữ liệu thời gian thực dẫn đến quyết định nhanh hơn nhiều thocircng tin hơn

Thagravenh phần phần cứng- Một EIS khocircng đogravei hỏi coacute phần cứng cụ thể hoặc duy nhất nagraveo- Chigravea khoacutea của vấn đề lagrave để đảm bảo rằng caacutec thagravenh phần của EIS tối ưu hoacutea vagrave

phugrave hợp với tagravei nguyecircn maacutey tiacutenh của tổ chức- Hệ thống nagravey phải được cấu higravenh để caacutec nguồn tagravei nguyecircn phugrave hợp với những

người điều hagravenh chuacuteng

Thagravenh phần phần mềm- Traacutei ngược với phần cứng phần mềm thường được chuyecircn mocircn hoacutea cao cho caacutec

bagravei toaacuten về miền- Sự chuyecircn mocircn hoacutea nagravey thường đạt được bằng caacutech sử dụng thagravenh phần off-the-

shelf cho toagraven bộ EIS vagrave caacutec mocirc-đun tugravey chỉnh để đaacutep ứng nhu cầu cụ thể- Lotus Notes lagrave một viacute dụ điển higravenh Noacute coacute thể được sử dụng một migravenh hoặc coacute

thể phục vụ becircn thứ ba mocirc-đun plug-in

Cocircng nghệ EIS hiện nay

Dobrzeniecki đề xuấtphacircn loạitừng cấptheo bachức năng- Loại 1 sản phẩm bao gồmmột bộ đầy đủcaacutec ứng dụngtừ mộtnhagrave cung cấp- Loại 2 sản phẩm đượcthựchiệnở phần đầu củacaacutecsản phẩmDSS đượcphaacutet triển

bởicugravengmộtnhagrave cung cấp- Loại 3 sản phẩmkết hợp với nhautheo bất kỳ số lượngthuộc sở hữu củacocircng ty

65 Xacircy dựng EIS

- Xacircy dựngmộtEISgiống nhưxacircydựngmột số hệ thống khaacutec củamocirc higravenh hệ thống thocircng tin

- Việcphaacutet triểncấu truacutecnecircn được theo dotildeitừ quaacute trigravenh thiết kế đến quaacute trigravenhthực hiện

- Tuy nhiecircn một dự aacuten phaacutet triển EIScoacute xu hướnglagrave thống nhấtvagraveyecircu cầu hỗ trợ caacutec nhagrave quản lyacute latildenh đạo

- Xacircy dựng một EIScoacute thểphaacutet hiện ra đượccaacutectigravenh huống khoacute khănmagravemột nhagrave phaacutet triển chưabao giờ gặp phải

Mocirc higravenh EIS

Khung phaacutet triển một EIS

- Watson et al đề nghị xacircy dựngkhung với ba thagravenh phần+ Caacutech tiếp cận tập trung vagraveo yếu tốcon người vagrave dữ liệu coacute liecircn quan đến EIS+ Quaacute trigravenh phaacutet triển cần sự linh hoạt vagrave tương taacutec+ Người sử dụng - hệ thống hộp thoại bao gồm một ngocircn ngữ hagravenh động để xử lyacute caacutec lệnh

Lợi iacutech của EIS- Dễ duy trigrave caacutec mục tiecircu coacute tổ chức- Dễ truy xuất thocircng tin- Cho pheacutep người sử dụng nacircng cao hiệu suất hơn

- Tăng chất lượng ra quyết định- Cung cấp sự cải tiến cạnh tranh- Tiết kiệm thời gian của người sử dụng- Tăng khả năng vagrave chất lượng giao tiếp- Cung cấp khả năng điều khiển tốt hơn trong tổ chức- Cho pheacutep tham gia caacutec vấn đề vagrave caacutec cơ hội- Cho pheacutep hoạch định- Cho pheacutep tigravem kiếm nguyecircn nhacircn của một vấn đề- Thảo matilden caacutec yecircu cầu của người điều hagravenh

Hạn chế của EIS vagrave 1 số sai lầm cần traacutenh

- Chi phiacute một cuộc khảo saacutetnăm1991 chothấychi phiacute phaacutet triểntrungbigravenh365000USDvớichi phiacute vận hagravenhhagraveng năm lagrave$200000 (EIS)

- Cocircng nghệ hạn chếEIScần phảiđượctiacutech hợp hoagraven toagravenvagraveokiếntruacuteccủadoanh nghiệphiện tại do đoacute noacutelagrave một thaacutech thứclớn đối vớithiết kế

- Hạn chế tổ chức cơ cấu tổ chứccoacute thể khocircng phugrave hợp

Sự hạn chế về tổ chức- Chương trigravenh nghị sự vagrave thời gian chệch EIS mocirc tả một phần việc thực hiện một

chương trigravenh nghị sự vagrave coacute thể dễ dagraveng đạt được sự tin cậy một caacutech chắc chắn- Đồng bộ hoacutea việc quản lyacute sự tin cậy đuacuteng luacutec đặc biệt baacuteo caacuteo EIS coacute thể phaacute

vỡ sự ổn định thiết lập caacutec chu trigravenh baacuteo caacuteo một caacutech tốt nhất- Sự bất ổn EIS phản ứng nhanh coacute thể gacircy ra việc taacutec động trở lại một caacutech

nhanh choacuteng dẫn đến sự thiếu ổn định trong tổ chức

Sự thất bại lagrave thay thế khocircng thể chấp nhận được- Một số yếu tố lagravem EIS thất bại

+ Thiếu sự hỗ trợ về mặt quản lyacute+ Vấn đề chiacutenh trị+ Thất bại của nhagrave phaacutet triển+ Lỗi về cocircng nghệ+ Giaacute cả+ Thời gian

66 Ra quyết định điều hagravenh trong tương lai vagrave EIS

- Coacute một vagravei điều kiện sẽ được hợp nhất cho việc chuyển đổi cocircng nghệ Trong đoacute một vagravei điều kiện coacute thể dễ dự đoaacuten Hai điều kiện magrave ta coacute thể thấy lagrave+ Phaacutet triển cocircng nghệ maacutey tiacutenh trong việc điều hagravenh sẽ tạo ra sự chuyển đổi được chấp nhận một caacutech dễ dagraveng hơn+ Mở rộng traacutech nhiệm điều hagravenh sẽ mở rộng nhu cầu thocircng tin

Tương lai của EIS- EIS thocircng minh Những tiến bộ trong cocircng nghệ AI sẽ được triển khai trong caacutec

EIS- EIS đa phương tiện Cơ sở dữ liệu đa phương tiện sẽ cho pheacutep tiacutech hợp văn bản

giọng noacutei vagrave higravenh ảnh trong tương lai- EIS thocircng tin Tương lai EIS sẽ mở rộng hơn trong việc sử dụng dữ liệu becircn

ngoagravei doanh nghiệp- EIS kết nối Giao tiếp với băng thocircng rộng cho pheacutep kết nối liecircn thocircng lớn hơn

Chương 7 HỆ CHUYEcircN GIA VAgrave TRIacute TUỆ NHAcircN TẠO

71 Caacutec khaacutei niệm

72 Triacute thocircng minh của triacute tuệ nhacircn tạo

73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia

74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia

75 Lợi iacutech vagrave hạn chế của hệ chuyecircn gia

71 Caacutec khaacutei niệm

Chuyecircn mocircn (Expertise) sự hiểu biết rộng trong 1 lĩnh vực hẹp

Hệ chuyecircn gia (Expert Systems)1 chương trigravenh maacutey tiacutenh sử dụng 1 tập caacutec luật dựa trecircn tri thức của con người để giải quyết caacutec vấn đề đogravei hogravei phải coacute sự chuyecircn mocircn

Một số hệ chuyecircn gia nổi tiếng

DENDRAL (Standford 1960s Edward Feigenbaum)

MYCIN (Standford1970s Edward Shortliffe)

PROSPECTOR (MIT 1979)

Triacute tuệ nhacircn tạo (Artificial Intelligence ndash AI)

Triacute tuệ nhacircn tạo một bộ phacircn của ngagravenh khoa học maacutey tiacutenh quan tacircm đến việc thiết kế caacutec hệ thống maacutey tiacutenh thocircng minh đoacute lagrave caacutec hệ thống đưa ra caacutec đặc điểm magrave từ đoacute chuacuteng ta liecircn hệ với sự thocircng minh trong hagravenh động của con người (Barr vagrave Feigenbaum 1981)

Mục điacutech của AI

Mục điacutech khoa học xaacutec định caacutec gợi yacute để giải thiacutech caacutec loại khaacutec nhau của triacute tuệ thực

Mục điacutech kỹ thuật giải quyết caacutec vấn đề trong thế giới thực

Triacute tuệ nhacircn tạo kế thừa nhiều yacute tưởng quan điểm kỹ thuật từ caacutec ngagravenh khoa học khaacutec

- Triết học

- Logic Toaacuten học

- Tiacutenh toaacuten

- Khoa học tacircm lyacute Khoa học nhận thức

- Sinh học Thần kinh học

- Tiến hoacutea

Caacutec lĩnh vực ứng dụng trong Triacute tuệ nhacircn tạo

Mạng nơ ron thần kinh (Neural Networks)

Tiacutenh toaacuten sự tiến hoacutea

(Evolutionary Computation)

Hệ chuyecircn gia (Expert Systems)

Kỹ thuật xử lyacute tiếng noacutei (Speech Processing)

Kỹ thuật xử lyacute ngocircn ngữ tự nhiecircn

(Natural Language Processing)

Lập kế hoạch (Planning)

Robot (Robotics)

Khoa học higravenh ảnh (Vision)

Caacutec kỹ thuật thocircng dụng dugraveng trong AI

Biểu diễn(Representation)

Học (Learning)

Caacutec luật (Rules)

Tigravem kiếm (Search)

72 Triacute thocircng minh của triacute tuệ nhacircn tạo

Con người suy diễn như thế nagraveo

Phacircn loại (Categorization)

Caacutec quy tắc cụ thể

Heuristics

Kinh nghiệm trước đoacute

Dự tiacutenh trước

Maacutey tiacutenh suy diễn như thế nagraveo

Lập luận dựa trecircn luật IF-THEN mocirc tả tri thức được matilde hoacutea dưới dạng caacutec luật

Caacutec khung (Frames) lagrave caacutec đại diện mocirc tả caacutec tigravenh huống giống nhau lagrave điển higravenh của một vagravei phacircn loại

Lập luận dựa trecircn caacutec trường hợp mocirc phỏng giải phaacutep trước đoacute cho một vấn đề hiện tại

Nhận dạng mẫu phaacutet hiện acircm thanh higravenh dạng hoặc caacutec chuỗi dagravei

Caacutec dạng khaacutec của Triacute tuệ nhacircn tạo

Học maacutey- mạng nơron vagrave giải thuật di truyền

Lập trigravenh tự động ndash lagrave những kỹ thuật tạo ra caacutec chương trigravenh để lagravem 1 nhiệm vụ riecircng biệt (cho pheacutep những người khocircng phải lagrave người lập trigravenh coacute thể lập trigravenh được)

Cuộc sống nhacircn tạo ndash nỗ lực để taacutei tạo caacutec hiện tượng sinh học trong caacutec hệ thống dựa trecircn maacutey tiacutenh

73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia(Expert Systems- ES)

Theo Jackson (1999) Một hệ chuyecircn gia lagrave một chương trigravenh maacutey tiacutenh mocirc tả vagrave suy diễn với tri thức của một vagravei lĩnh vực để giải quyết vấn đề hay đưa ra caacutec lời khuyecircn

Cấu truacutec cơ bản của ES được dựa theo cấu truacutec chung của DSS Sự khaacutec biệt chiacutenh giữa ES vagraveDSS lagrave hệ ES thu thập caacutec kiến thức từ những

chuyecircn gia trong lĩnh vực quan tacircmĐặc trưng của hệ chuyecircn gia Hiệu quả cao Thời gian trả lời thỏa đaacuteng Độ tin cậy cao Dễ hiểu

Giao diện người dugraveng trong ES

Thiết kế giao diện người dugraveng tập trung vagraveo caacutec yếu tố như dễ dagraveng sử dụngcoacute độ tin cậy cao giảm tải những khoacute khăn khi sử dụng

Thiết kế necircn coacute một số tương taacutec (đầu vagraveo kiểm soaacutet vagrave truy vấn)

Cấu tạo giao diện người dugraveng gồm coacute magraven higravenh cảm ứng bagraven phiacutem buacutet saacuteng lệnh thoại caacutec phiacutem chuyecircn dụng

Cơ sở tri thức (Knowledge Base)

Chứa đựng caacutec tri thức cụ thể miền thu được từ caacutec chuyecircn gia miền

Coacute thể chứa caacutec mocirc tả caacutec hagravenh vi giải quyết vấn đề caacutec ragraveng buộc caacutec heuristics

Thagravenh cocircng của một ES dựa trecircn tiacutenh đầy đủ vagrave tiacutenh chiacutenh xaacutec của cơ sở tri thức

Mocirc tơ suy diễn (Inference Engine)

Ở đacircy tri thức được đặt để sử dụng tạo ra caacutec giải phaacutep để giải quyết vấn đề

Mocirc tơ nagravey coacute khả năng thực hiện diễn dịch hoặc suy diễn dựa trecircn caacutec luật hay caacutec caacutec sự kiện

Đồng thời cũng coacute khả năng sử dụng caacutec suy diễn mờ hay khocircng chiacutenh xaacutec dựa trecircn xaacutec suất hay aacutenh xạ mẫu

Vograveng điều khiển suy diễn

1 Aacutenh xạ caacutec luật với caacutec sự kiện đatilde được cho

2 Chọn luật để thực hiện

3 Thực hiện luật bằng caacutech thecircm caacutec sự kiện được suy diễn ra vagraveo bộ nhớ lagravem việc

Chuỗi suy diễn (Chaining)

Suy diễn tiến (forward chaining) maacutey suy diễn bắt đầu từ dữ liệu ban đầu vagrave thực hiện việc suy luận để đưa ra caacutec kết luận cuối cugraveng

Suy diễn lugravei (backward chaining) maacutey suy diễn bắt đầu từ dữ liệu điacutech vagrave tigravem ra tri thức hỗ trợ cho dữ liệu điacutech đoacute

Viacute dụ suy diễn lugravei

R1 Nếu coacute A vagrave B thigrave suy ra coacute D

R2 Nếu coacute B thigrave suy ra coacute C

R3 Nếu coacute C vagrave D thigrave suy ra coacute E

Ta coacute E ta xem trong 3 luật R1 R2 R3 luật nagraveo coacute E ta thấy R3 chứa E đồng thời chứa C vagrave D Xeacutet tiếp trong 2 luật R1 R2 luật nagraveo chứa C vagrave D R2 chứa C R3 chứa D Từ đoacute ta coacute được caacutec tri thức hỗ trợ suy diễn vagrave kết luận lagrave nếu coacute A vagrave B thigrave sẽ coacute E Hay nếu A vagrave B đuacuteng thigrave sẽ coacute E

Viacute dụ suy diễn tiến

Giả sử coacute tập chứa 3 luật sau

R1 Nếu coacute A vagrave B thigrave suy ra coacute D

R2 Nếu coacute B thigrave suy ra coacute C

R3 Nếu coacute C vagrave D thigrave suy ra coacute E

Nếu ta coacute A vagrave B thigrave chuacuteng ta suy ra được D từ R1 vagrave suy ra C từ R2 Với D vagrave C đatilde được suy ra ở trecircn giờ chuacuteng ta suy ra được E từ R3

Viacute dụ thực tế

Giả sử muốn biết magraveu của một con vật nuocirci tecircn lagrave Fred biết rằng noacute kecircu ộp ộp vagrave ăn ruồi

Coacute tập 4 luật ban đầu như sau

R1 Nếu X kecircu ộp ộp vagrave ăn ruồi thigrave X lagrave con ếch

R2 Nếu X kecircu chiecircm chiếp vagrave biết hoacutet thigrave X lagrave con chim

R3 Nếu X lagrave con ếch thigrave X coacute magraveu xanh

R4 Nếu X lagrave con chim thigrave X coacute magraveu vagraveng

74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia

Expert system shells lagrave một tập caacutec goacutei phần mềm vagrave caacutec cocircng cụ dugraveng để phaacutet triển caacutec hệ chuyecircn gia

Những Expert system shells đầu tiecircn thường rất rườm ragrave Mặc dugrave vậy noacute vẫn giuacutep cho người sử dụng sẽ khocircng phải bắt đầu lại từ đầu khi xacircy dựng một hệ chuyecircn gia mới

Những shell hiện đại bao gồm hai mocirc-đun chiacutenh lagrave cocircng cụ xacircy dựng một tập quy tắc vagrave mocirc tơ suy diễn

Xacircy dựng hệ chuyecircn gia

Bước 1 xacircy dựng mocirc higravenh bagravei toaacuten xaacutec định vấn đề nhiệm vụ magrave hệ thống sẽ thực hiện Caacutec dạng bagravei toaacuten cần hệ chuyecircn gia

Bagravei toaacuten diễn giải (InterPretation)

Bagravei toaacuten dự baacuteo (Prediction)

Bagravei toaacuten chuẩn đoaacuten (Diagnose)

Bagravei toaacuten gỡ rối (Debugging)

Bagravei toaacuten thiết kế

Tương tự như một dự aacuten phần mềm để xacircy dựng một hệ chuyecircn gia cần phải coacute caacutec yếu tố về nhacircn lực tagravei nguyecircn vagrave thời gian Những yếu tố nagravey ảnh hưởng đến giaacute thah của một hệ chuyecircn giaTrong phần nagravey cacircu hỏi thường được đặt ra lagrave tại sao cần phải xacircy dựng một hệ chuyecircn giaTrước khi bắt đầu phải xaacute định rotilde bagravei toaacuten đạt ra lagrave jiAi lagrave chuyecircn giaAi lagrave người sử dụng

1 Diễn giải (InterPretation) Nghiecircn cứu 1 vấn đề -gt Dựa trecircn những biểu hiện thuộc tiacutenh đặc trưng becircn ngoagravei -gt Tư vấn

(hoặc đưa ra kết luận hay mocirc tả dễ hiểu từ tập dữ liệu thocirc)

2 Bagravei toaacuten dự baacuteo (Prediction) Coacute thể dự đoaacuten được hagravenh vi kết quả dựa trecircn caacutec hiện tượng -gt dự baacuteo

VD Dự baacuteo thời tiết động đấthellip

3 Bagravei toaacuten chẩn đoaacuten (Diagnoss) Xaacutec định caacutec lỗi caacutec bộ phận hỏng hoacutec của hệ thống dựa trecircn caacutec dữ liệu quan saacutet được

4 Bagravei toaacuten gỡ rối (Debugging) Mocirc tả caacutec phương phaacutep khắc phục hệ thống khi gặp sự cố

5 Bagravei toaacuten thiết kế Lựa chọn cấu higravenh caacutec đối tượng nhằm thoả matilden một số ragraveng buộc nagraveo đoacute

6 Giảng dạy Phần mềm dạy học coacute thể chuẩn đoaacuten vagrave sủa lỗi của học sinh trong quaacute trigravenh học tập

Để xaacutec định đuacuteng bagravei toaacuten magrave chuacuteng ta cần giải quyết thigrave phải trả lời đc một số cacircu hỏi

- cần hệ chuyecircn gia

Bước 2 thu thập tri thức lựa chọn cocircng cụ vagrave aacutep dụng

Trong bước thu thập tri thức vấn đề quan trọng lagrave lựa chọn chuyecircn gia những người magrave sẽ đoacuteng goacutep tri thức cho hệ thống Thocircng thường trong suốt quaacute trigravenh phaacutet triển thigrave chuyecircn gia được xem như một thagravenh viecircn của đội phaacutet triển

Hiện nay coacute rất nhiều cocircng cụ để xacircy dựng một hệ chuyecircn gia Phổ biến nhất lagrave JESS CLIPS vagrave OPS5

Bước 3 Thiết kế cơ sở tri thức thiết kế hệ thốngTri thức được biểu diễn trường minh trong cơ sở tri thức

Caacutec chuyecircn gia vagrave kỹ sư tri thức sẽ đối thoại với nhau bằng caacutec kỹ thuật đối thoại Suy diễn (SD) bảng Mocirc higravenh hoacutea SD quy nạp phacircn loại

Vấn đề bagraveo trigrave vagrave phaacutet triển

Caacutec hệ chuyecircn gia đogravei hỏi phải bảo trigrave vagrave phaacutet triển nhiều hơn so với caacutec hệ thống khaacutec Phải thường xuyecircn bổ sung tri thức mới vagrave thay đổi caacutec tri thức cũ để đổi mới hệ chuyecircn gia

Thu thập vagrave khắc phục lỗi do người sử dụng phaacutet hiện để kịp thời khắc phục những sai soacutet của hệ chuyecircn gia

75 Lợi iacutech vagrave hạn chế của caacutec hệ chuyecircn gia

Một số lợi iacutech chiacutenh

Thời gian trả lời hợp lyacute bằng hoặc nhanh hơn so với chuyecircn gia (người) để đi đến cugraveng một quyết định Hệ chuyecircn gia lagrave một hệ thống thời gian thực (real time system)

Khả năng trả lời với mức độ tinh thocircng bằng hoặc cao hơn so với chuyecircn gia (người) trong cugraveng lĩnh vực

Hệ chuyecircn gia giuacutep cho hiệu quả lagravem việc tăng bằng việc sử dụng tập caacutec luật một caacutech nhanh choacuteng magrave ko bị nhầm lẫn chuyecircn gia lagrave người coacute thể quecircn đi một số tri thức cơ sở lyacute luậ nhưng HCG thigrave ko

Quyết định của một người chuyecircn gia coacute thể bị thay đổi vagrave ko coacute tiacutenh thống nhất như quyết định của một hệ chuyecircn gia tạo ra

Hệ chuyecircn gia giuacutep cho người sử dụng coacute thể trau dồi sự hiểu biết trecircn lĩnh vuej cụ thể magrave noacute giải quyết hỗ trợ người ra quyết định coacute trigravenh độ như 1 chuyecircn gia trong quaacute trigravenh gia quyết định

Kiến thức của rất nhiều chuyecircn gia về một lĩnh vực nagraveo đoacute được đưa vagraveo hệ chuyecircn gia lagravem cho CSTT cuat HCG phong phuacute vagrave rộng lớn hơn rất nhiều

HCG giải thiacutech caacutec bước suy luận một caacutech dễ hiểu nhất quaacuten luacutec nagraveo cũng coacute thể sử dụng ko như chuyecircn gia con người

Hạn chế của caacutec hệ chuyecircn gia

Nhược điểm lớn nhất của hệ chuyecircn gia lagrave những yacute kiến chuyecircn mocircn thường rất khoacute matilde hoacutea vagrave giải neacuten

Hệ chuyecircn gia khocircng coacute khả năng tự học tự cập nhật kiến thức mới như caacutec chuyecircn gia magrave cần phải được matilde hoacutea lại khi noacute được cập nhật

Hệ chuyecircn gia khocircng thể nhận ra được vấn đề khocircng nằm trong miền kiến thức của hệ thống

Chương 8 Tri thức vagrave tiếp nhận

1 Bao gồm caacutec vấn đề

Dữ liệu thực tế đo lường hoặc quan saacutet coacute hoặc khocircng coacute bối cảnh

Thocircng tin dữ liệu được tổng hợp một caacutech hữu iacutech để giải quyết những khoacute khăn trong việc đưa ra quyết định

Tri thức bao gồm caacutec ứng dụng quy tắc thocircng tin hướng dẫn của người ra quyết định

2 Những caacutei nhigraven về tri thức

Đại diện lagravem thế nagraveo để diễn tả tri thức viacute dụ như một quyển saacutech khocircng phải lagrave tri thức nhưng noacute lại lagrave một đại diện của tri thức

Sản xuất tri thức lagrave một tập hơp của hagraveng tồn kho coacute thể được sản xuất cũng như mua lại

Tri thức lagrave 1 trong 6 trạng thaacutei của hệ thống

1Dữ liệu 2Thocircng tin 3Cấu truacutec thocircng tin 4Sự thấu hiểu 5Yacute kiến 6 Quyết định

3 Caacutec loại tri thức Phổ biến mocirc tả dữ liệu thocircng tin thủ tục mọi thứ lagravem như thế nagraveo lập luận chiacutenh saacutech hoặc caacutec quy tắc

4 Thu thập Tri thức hệ chuyecircn gia Hầu hết caacutec phương phaacutep đều bắt đầu với mocirc higravenh của caacutec taacutec vụ trong đoacute

hệ chuyecircn gia được xacircy dựng Trong đoacute mocirc tả về caacutec lĩnh vực được tạo ra Caacutec kỹ sư sử dụng caacutec mocirc higravenh giả thuyết vagrave nhận thức về quaacute trigravenh phacircn

tiacutech để gợi ra caacutech giải quyết vấn đề về tri thức từ caacutec chuyecircn gia

5 Caacutec chiều của thu thập tri thức KE- driven caacutec kỹ sư trao đổi trực tiếp với caacutec chuyecircn gia Expert-driven Caacutec chuyecircn gia trực tiếp đưa chuyecircn mocircn của họ vagraveo hệ

thống maacutey tiacutenh Machine-driven Sử dụng caacutec cocircng cụ suy luận để triacutech xuất tri thức từ một

tập caacutec viacute dụ

6 Kỹ thuật thu thập tri thức Trao đổi gồm 2 loại cơ bản lagrave coacute cấu truacutec(coacute kịch bản) vagrave khocircng coacute cấu

truacutec( đối thoại trực tiếp) Giao thức phacircn tiacutech bằng lời Khi caacutec chuyecircn gia thực hiện một cocircng việc

của họ thigrave một bản ghi về cocircng việc đoacute được thực hiện Caacutec kỹ sư sẽ xacircy dựng mocirc higravenh cho những gigrave được ghi lại trong bản ghi

Phương phaacutep sagraveng lọc caacutec chuyecircn gia so saacutenh caacutec nhoacutem liecircn tiếp trong ba đối tượng vagrave cho biết tại sao nhoacutem thứ hai lại khaacutec nhoacutem thứ ba

7 Thu thập tri thức từ nhiều nguồn Thu thập tri thức từ nhiều nguồn lagrave cần thiết để coacute được đầy đủ caacutec tri thức

cho một vấn đề quan điểm yacute kiến traacutei ngược nhau thường phaacutet sinh Phương phaacutep đồng thuận sẽ giuacutep giải quyết được vấn đề macircu thuẫn Kỹ thuật phacircn tiacutech Meta lagrave kỹ thuật được aacutep dụng trong caacutec trường hợp

khaacutec Caacutech tiếp cận bằng định lượng đogravei hỏi caacutec kỹ sư cần cacircn nhắc yếu tố đầu vagraveo của caacutec chuyecircn gia khaacutec nhau

8 Xaacutec nhận hợp lệ vagrave kiểm tra tri thức Một khi thu thập tri thức noacute phải được đaacutenh giaacute về khả năng sử dụng vagrave độ

chiacutenh xaacutec Hai vấn đề cụ thể lagrave hiệu lực của những kiến thức vagrave kiểm tra việc xacircy dựng cơ sở của tri thức

Cần xaacutec nhận xem liệu hệ thống coacute thể hoạt động ở mức độ tối thiểu khocircng

Xaacutec minh liecircn quan đến việc so saacutenh từng chi tiết kỹ thuật của hệ thống những gigrave đatilde được thực hiện cuối cugraveng

9 Một số caacutec biện phaacutep xaacutec nhận Độ chiacutenh xaacutec Khả năng thiacutech nghi Mức độ đầy đủ Bề rộng Độ sacircu Hiệu lực Tổng quan Chiacutenh xaacutec Hiện thực Độ tin cậy Tiacutenh hữu dụng Mức độ

Chương 9 Học maacutey

1 Logic mờ vagrave ngocircn ngữ mờ(Fuzzy Logic and Linguistic Ambiguity)

Ngocircn ngữ tự nhiecircn gồm những khaacutei niệm mơ hồ vagrave khocircng chiacutenh xaacutectruyền tải ngữ nghĩa thocircng qua tiacutenh xấp xỉkhocircng rotilde ragraveng

Những xấp xỉ nagravey giuacutep con người coacute thể truyền tải hết được yacute nghĩa nhưng maacutey thigrave khocircng hiểu

Lagravem sao biểu diễn caacutec tri thức sử dụng caacutec khaacutei niệm khocircng rotilde ragraveng(mờ) hoặc khocircng chiacutenh xaacutec

2 Khaacutei niệm cơ bản của logic mờ tập mờ lagrave những tập hợp khocircng coacute một giới hạn rotilde Mỗi phần tử của noacute chỉ

chứa một mức độ hagravem liecircn thuộc của từng phần tử Vigrave vậy tập mờ khocircng giống như tập cổ điển Tập mờ coacute thể kết hợp với nhau qua những luật mờ magrave đặc trưng cho những hagravenh động trạng thaacutei vagrave thuộc tiacutenh của logic mờ được tận dụng khi thực hiện một bộ điều khiển mờ

Logic mờ dựa trecircn yacute tưởng mỗi phần tử thuộc vagraveo một tập hợp ở một mức độ nagraveo đấy

Locircgic mờ cho pheacutep độ liecircn thuộc (microA )coacute giaacute trị trong khoảng (01) Locircgic mờ coacute thể được coi lagrave mặt ứng dụng của lyacute thuyết tập mờ để xử lyacute caacutec

giaacute trị trong thế giới thực cho caacutec bagravei toaacuten phức tạp

3 So saacutenh tiacutenh đuacuteng đắn logic mờ vagrave xaacutec suất Xaacutec suất thigrave đề cập đến khả năng xảy ra một biến cố hay một điều gigrave đoacute Logic mờ đề cập đến cấp độ magrave đặc tiacutenh ở hiện tại

o viacute dụ1 người coacute chiều cao 6 feet thigrave coacute cấp độ lagrave 05 về chiều cao

4 Ưu điểm của logic mờ Caacutech tiếp cận rất tự nhiecircnkhocircng phức tạp Coacute thể mocirc higravenh hoacutea caacutec hagravem phi tuyến tugravey yacute phức tạp

Coacute thể tận dụng được kinh nghiệm từ những chuyecircn gia hagraveng đầu trong mọi lĩnh vực

Logic mờ được xacircy dựng dựa trecircn ngocircn ngữ tự nhiecircnNền tảng của logic mờ lagrave dựa trecircn cơ sở giao tiếp của con người

5 Nhược điểm của logic mờ Trong 1 hệ thống phức tạpsử dụng logic mờ coacute thể trở thagravenh trở ngại cho

việc xaacutec thực độ tin cậy của hệ thống Cơ chế lập luận mờ khocircng thể học hỏi từ những lỗi sai

6 Mạng noron nhacircn tạo(ANN) Mạng noron nhacircn tạo lagrave một mocirc phỏng xử lyacute thocircng tinđược nghiecircn cứu ra

từ hệ thống thần kinh của sinh vậtgiống như bộ natildeo để xử lyacute thocircng tin ANNs lagrave chương trigravenh dựa trecircn maacutey tiacutenh đơn giản coacute chức năng lagrave một mocirc

higravenh bagravei toaacuten khocircng gian dựa trecircn thử nghiệm vagrave baacuteo lỗi

7 Học từ kinh nghiệm Tiến trigravenh Một mẫu dữ liệu được biểu diễn như một mạng lưới noronANN ldquodự

đoaacutenrdquo 1 đầu radự đoaacuten được so saacutenh với giaacute trị thực tế hoặc giaacute trị chiacutenh xaacutecNếu đoaacuten được chiacutenh xaacutec thigrave khocircng coacute hagravenh động nagraveo được thực hiện

Nếu dự đoaacuten sai ANN kiểm tra lại vagrave xaacutec định lại thocircng số để điều chỉnh Một mẫu dữ liệu khaacutec được biểu diễn vagrave quaacute trigravenh nagravey được lặp lại

8 Nguyecircn tắc cơ bản của cocircng nghệ nơron Caacutec yếu tố xử lyacute cơ bản trong hệ thống thần kinh của con người lagrave tế bagraveo

thần kinhMạng lưới của tế bagraveo nagravey lagrave liecircn kết với nhau nhận được thocircng tin từ caacutec cảm biến trong mắt taihellip

Thocircng tin nhận được bởi tế bagraveo thần kinh hoặc lagrave sẽ kiacutech thiacutech noacute(sẽ được chuyển qua 1 thocircng điệp dọc theo mạng lưới) hoặc lagrave sẽ ngăn cản noacute(ngăn cản dograveng thocircng tin)

Độ nhạy coacute thể thay đổi qua thời gian hoặc sau khi coacute được kinh nghiệm

9 Cấu truacutec mạng Một ANN gồm 3 lớp cơ bản

Lớp đầu vagraveo nhận dữ liệu Lớp becircn trong hoặc lagrave lớp ẩn xử lyacute dữ liệu Lớp đầu ra chuyển tiếp kết quả cuối cugraveng của mạng

10Mạng nơ ron Thường coacute nhiều đầu vagraveo mỗi đầu vagraveo với mức ảnh hưởng vagrave tầm quan

trọng riecircng của noacute Một đầu vagraveo quan trọng coacute thể được sử dụng để khuếch đại đầu ra caacutec hagravem trạng thaacutei tổng hợp caacutec trọng số của caacutec yếu tố

đầuvagraveo khaacutec nhauvagraveo một giaacute trị duy nhất Caacutec hagravem chuyển giao xử lyacute caacutec giaacute trị trạng thaacutei vagrave tạo đầu ra

11Huấn luyện mạng nơ ron Trong mocirc higravenh coacute giaacutem saacutetANN được đến so saacutenh dự đoaacuten của chiacutenh

noacute với thocircng tin phản hồi coacute chứa caacutec kết quả mong muốn ANN sẽ phải tigravem caacutech thay đổi caacutec tham số becircn trong củamigravenh (caacutec trọng số vagrave caacutec ngưỡng) để tạo necircn một aacutenh xạ coacute khả năng aacutenh xạcaacutec đầu vagraveo thagravenh caacutec đầu ra mong muốn Sự thay đổi nagravey được tiến hagravenh nhờ việc so saacutenh giữa đầu ra thực sự vagrave đầu ra mong muốn

Trong mocirc higravenh khocircng coacute giaacutem saacutetANN nhận được dữ liệu vagraveo nhưng khocircng phải coacute bất kỳ thocircng tin phản hồi về kết quả mong muốn

Phần lớn caacutec ứng dụng nằm trong vugraveng của caacutec bagravei toaacuten ước lượng như mocirc higravenh hoacuteathống kecirc neacuten lọc phacircn cụm

12Lợi iacutech Liecircn kết với mạng noron Traacutenh caacutech lập trigravenh tường minh Giảm nhu cầu của chuyecircn gia ANNs thigrave thiacutech nghi với caacutec yếu tố đầu vagraveo thay đổi Khocircng cần thiết cho cơ sở tri thức tinh chế ANNs coacute tiacutenh động vagrave cải thiện với việc sử dụng Coacute khả năng xử lyacute dữ liệu khocircng chiacutenh xaacutec hoặc khocircng đầy đủ Cho pheacutep tổng quaacutet hoacutea từ thocircng tin cụ thể Cho pheacutep thu thập cảm giaacutec thocircng thường vagraveo miền giải quyết vấn đề

13Hạn chế của việc liecircn kết với mạng noron ANNs khocircng thể giải thiacutech được suy luận Bản chất hộp đen thường khiến cho vấn đề traacutech nhiệm vagrave độ tin cậy phaacutet

sinh lagrave khoacute khăn Lặp đi lặp lại quaacute trigravenh huấn luyện rất tốn thời gian Nguồn lực caacutec nhagrave phacircn tiacutech vagrave thiết kế coacute tay nghề cao vẫn lagrave đaacuteng lo

ngại Cocircng nghệ ANN thuacutec đẩy hạn chế của phần cứng hiện tại ANN yecircu cầu phải coacute sự tin tưởng ở đầu ra

14Giới thiệu về thuật toaacuten di truyền Cũng như mạng lưới thần kinh caacutec thuật toaacuten di truyền được dựa trecircn lyacute

thuyết sinh học Thuật toaacuten di truyền tigravem thấy nguồn gốc của chuacuteng trong caacutec lyacute thuyết

tiến hoacutea của chọn lọc tự nhiecircn vagrave thiacutech ứng với biến đổi khiacute hậu Kết quả thuật toaacuten di truyền lagrave từ giao phối 2 caacute thể trong quần thế để tạo

ra con caacutei đocirci khi tốt hơn so với bậc cha mẹ của chuacuteng 15Caacutec thagravenh phần cơ bản của thuật toaacuten di truyền

Toaacuten tử chọn lọc Caacutec caacute thể tốt được chọn lọc để đưa vagraveo thế hệ sau Sự chọn lọc nagravey căn cứ vagraveo độ thiacutech nghi với mocirci trường của mỗi caacute thể

Toaacuten tử lai gheacutep (crossover) Hai caacute thể cha vagrave mẹ trao đổi caacutec gen với nhau để tạo ra caacute thể con

Toaacuten tử đột biến (mutation) Một caacute thể thay đổi một số gen để biến đổi thagravenh một caacute thể mớiTất cả caacutec toaacuten tử trecircn khi thực hiện đều mang tiacutenh ngẫu nhiecircn

16Quaacute trigravenh cơ bản của một thuật toaacuten di truyền Khởi tạo

Đaacutenh giaacute quần thể

Lựa chọn NST thiacutech hợp nhất vagrave loại bỏ NST yếu nhất

Quy trigravenh giao nhau vagrave cải thiện quần thể

đột biến tiến trigravenh để khaacutem phaacute ra NST mới

17Ưu nhược điểm của việc kết hợp với thuật toaacuten di truyền Kiacutech thước quần thể lagrave 1 yếu tố quan trọng trong tốc độ của việc tigravem

kiếmnhưng noacute tương đối dễ dagraveng để dự đoaacuten tốc độ nagravey Giao nhau hoặc đột biến lagrave khocircng necircn đc sử dụng quaacute thường xuyecircn Luocircn coacute được iacutet nhất 1 giải phaacutep hợp lyacute Necircn coacute thể aacutep dụng chuacuteng cho caacutec vấn đề magrave chuacuteng ta khocircng coacute hướng

về caacutech giải quyết Sức mạnh của thuật toaacuten xuất phaacutet từ khaacutei niệm đơn giảnkhocircng phải từ

một thủ tục thuật toaacuten phức tạp 18Tương lai của học maacutey

Mạng lưới thần kinh nhacircn tạo vượt quaacute năng lực của con người trong caacutec trường hợp bị cocirc lập

Về mặt lyacute thuyếtmột maacutey tiacutenh coacute thể xử lyacute dũ liệu nhanh hơn hagraveng triệu lần so với 1 con người

May mắn thay cho chuacuteng tacon người tốt hơn nhiều khi magrave coacute được dữ liệumaacutey tiacutenh khocircng coacute 1 số thứ như lagrave 5 giaacutec quan

CHƯƠNG 10 KHO DỮ LIỆU

1 Kho dữ liệu Kho dữ liệu lagrave tuyển tập caacutec cơ sở dữ liệu tiacutech hợp hướng chủ đề được

thiết kế để trợ giuacutep cho một hệ hỗ trợ quyết định

Theo John Ladley Cocircng nghệ kho dữ liệu lagrave tập caacutec phương phaacutep kỹ thuật vagrave caacutec cocircng cụ coacute thể kết hợp hỗ trợ nhau để cung cấp thocircng tin cho người sử dụng trecircn cơ sở tiacutech hợp từ nhiều nguồn dữ liệu nhiều mocirci trường khaacutec nhau

Kho dữ liệu thường rất lớn tới hagraveng trăm GB hay thậm chiacute hagraveng Terabyte

2 Kho dữ liệu vận hagravenh (ODS) Một kho dữ liệu vận hagravenh Aacutep dụng kỹ thuật kho dữ liệu vagraveo caacutec hệ xử

lyacute giao taacutec lưu trữ dữ liệu cho một ứng dụng đặc thugrave Noacute đưa vagraveo kho dữ liệu một dograveng caacutec dữ liệu thocirc được thiết kế

3 So saacutenh

Kho dữ liệu vận hagravenh Kho dữ liệu

Dữ liệu theo chủ đề Dữ liệu theo chủ đề

Dữ liệu tiacutech hợp Dữ liệu tiacutech hợp

Dữ liệu thay đổi Dữ liệu khocircng thay đổi

Dữ liệu được cập nhật khi thay đổi

Dữ liệu giữ nguyecircn

Chỉ coacute dữ liệu hiện tạiDữliệu hiện tại vagrave dữ liệu lịch sử

Chu kỳ lagravem tươi dữ liệu ngắn Chu kỳ lagravem tươi dữ liệu dagravei

Chỉ coacute dữ liệu chi tiết Dữ liệu chi tiết vagrave dữ liệu tổng kết

Dugraveng cho caacutec quyết định ngắn hạn

Dugraveng cho hoạch định dagravei hạn

4 Kho dữ liệu cục bộ (Data Mart - DM)

Kho dữ liệu cục bộ lagrave CSDL coacute những đặc điểm giống với kho dữ liệu nhưng với quy mocirc nhỏ hơn vagrave lưu trữ dữ liệu về một lĩnh vực một chuyecircn ngagravenh

Data mart phụ thuộc Chứa những dữ liệu được lấy từ DW vagrave những dữ liệu nagravey sẽ được triacutech lọc vagrave tinh chế tiacutech hợp lại ở mức cao hơn để phục vụ một chủ đề nhất định của Datamart

Data mart độc lập Khocircng giống như Datamart phụ thuộc Data mart độc lập được xacircy dựng trước DW vagrave dữ liệu được trực tiếp lấy từ caacutec nguồn khaacutec nhau

5 Siecircu dữ liệu Metadata lagrave dữ liệu để mocirc tả dữ liệu Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột

một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi Metadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu

6 Mocirci trường kho dữ liệu Hệ thống của tổ chức vagrave kho cung cấp dữ liệu để xacircy dựng kho dữ liệu Trong quaacute trigravenh chuyển dữ liệu từ caacutec nguồn khaacutec nhau dữ liệu coacute thể

được lagravem sạch hoặc chuyển đổi vagrave vigrave thế DW được xem như lagrave một chuẩn cho việc lưu trữ

Đồng thời siecircu dữ liệu được ghi lại Cuối cugraveng DW hoặc siecircu thị coacute thể được sử dụng để tạo ra một kho dữ

liệu ldquocaacute nhacircnrdquo 7 Caacutec đặc điểm của kho dữ liệu

Đặc điểm Mocirc tả

Hướng chủ đề - DL tổ chức theo caacutech thức người dugraveng tham chiếu

Tiacutech hợp - Dữ liệu ldquosạchrdquo loại bỏ tiacutenh thiếu nhất quaacuten

Khocircng thay đổi - DL ldquochỉ đọcrdquo người dugraveng khocircng thay đổi được

Chuỗi thời gian - DL lagrave chuỗi thời gian khocircng phải lagrave trạng thaacutei hiện tại

Được tổng kết - DL vận hagravenhthao taacutec khi cần thiết

được kết hợp lại thagravenh dạng coacute thể dugraveng được cho quyết định

Kiacutech cỡ lớn hơn - Lưu giữ theo chuỗi thời gian tức lagrave giữ lại nhiều DL

Khocircng được chuẩn hoacutea - Coacute thể dư thừa DLSiecircu dữ liệu - Dữ liệu của dữ liệu được lưu trữNguồn dữ liệu - DL vận hagravenh (caacutec hệ sẵn coacute) cugraveng

với caacutec nguồn ngoagravei 8 Kho dữ liệu hướng chủ đề

Hướng chủ để coacute nghĩa lagrave kho dữ liệu được tổ chức xung quanh caacutec chủ đề chiacutenh như khaacutech hagraveng sản phẩm sản xuất Tập trung vagraveo việc mocirc higravenh hoacutea vagrave phacircn tiacutech dữ liệu cho caacutec nhagrave ra quyết định magrave khocircng tập trung vagraveo caacutec xử lyacute thocircng thường Cung cấp cho người dugraveng một khung nhigraven toagraven vẹn đơn giản vagrave đầy đủ về caacutec sự kiện quanh caacutec chủ đề

9 Dữ liệu trong DW được tiacutech hợp Dữ liệu trong kho dữ liệu được xacircy dựng bằng caacutech tổng hợp dữ liệu từ

nhiều nguồn khaacutec nhau vagrave caacutec nguồn coacute tổ chức khaacutec nhau Cơ sở dữ liệu caacutec file excel caacutec flat file hoặc caacutec raw file Khi đưa vagraveo kho dữ liệu caacutec dữ liệu được lagravem sạch vagrave tiacutech hợp dữ liệu nhằm đảm bảo tiacutenh nhất quaacuten của dữ liệu

10Kiến truacutec kho dữ liệu Tầng cơ sở dữ liệu hoạt động Tầng truy xuất thocircng tin Tầng truy xuất dữ liệu Tầng siecircu dữ liệu Tầng quản lyacute tiến trigravenh Tầng thocircng điệp của ứng dụng Tầng vật liacute của kho dữ liệu Tầng trigravenh diễn dữ liệu

11Higravenh trạng kho dữ liệu Kho dữ liệu ảo - người dugraveng cuối coacute thể truy cập trực tiếp đến kho dữ liệu

sử dụng caacutec cocircng cụ cho pheacutep ở tầng truy xuất dữ liệu Kho dữ liệu trung tacircm-1 cơ sở dữ liệu vật lyacute chứa tất cả dữ liệu cho một

vugraveng chuyecircn dụng nagraveo đoacute

Kho dữ liệu phacircn taacuten- Thagravenh phần được phacircn taacuten qua nhiều hệ cơ sở dữ liệu vật lyacute

12METADATA- Siecircu dữ liệu Định nghĩa Siecircu dữ liệu lagrave dữ liệu về dữ liệu Lagrave 1 lưu trữ dugraveng để

Miecircu tả kho dữ liệu tổng thể Nhận dạng kiểu kho dữ liệu Quản liacute quaacute trigravenh tiacutech hợp dữ liệu Quản liacute quaacute trigravenh cập nhật kho dữ liệu Quản liacute bảo mật

Lagrave chigravea khoacutea quyết định sự thagravenh cocircng của kho dữ liệu luocircn được thay đổi vagrave cập nhật theo sự phaacutet triển của kho dữ liệu

Dugraveng để quản liacute điều khiển kho dữ liệu Sự ra đời của kho dữ liệu như 1 cấu truacutec hỗ trợ ra quyết định siecircu dữ liệu

được xem như nguồn tagravei nguyecircn dữ liệu Siecircu dữ liệu lagrave trừu tượng Chuacuteng lagrave dữ liệu bậc cao cung cấp mocirc tả ngắn

gọn caacutec dữ liệu bậc thấp hơn 13Hoạt động của Siecircu dữ liệu

Siecircu dữ liệu rất cần thiết trong việc chuyển hoacutea thocircng tin trở thagravenh tri thức Lagrave chigravea khoacutea giuacutep chuacuteng ta xử lyacute được dữ liệu thocirc Viacute dụ một dograveng dữ liệu baacuten hagraveng 1023 K596 11121 agraveNoacute sẽ khocircng coacute nghĩa gigrave cho đến khi chuacuteng ta đưa vagraveo siecircu dữ liệu (thư

mục chứa dữ liệu) agrave cửa hagraveng 1023 sản phẩm K596 vagrave số tiền baacuten được lagrave 11121 đocirc la

14Sự cần thiết phải nhất quaacuten trong kho dữ liệu Kho dữ liệu được xacircy dựng cho lợi iacutech của những nhagrave phacircn tiacutech kinh

doanh caacutec nhagrave quản trị cho tất cả caacutec khu vực chức năng Trong cơ sở dữ liệu riecircng caacutec khu vực khaacutec nhau coacute thể định nghĩa vagrave lưu

trữ dữ liệu thocircng qua phiecircn bản của chiacutenh noacute Khi dữ liệu được lấy từ những vugraveng khaacutec nhau đoacute vagrave được đặt vagraveo kho dữ

liệu Việc chuyển đổi vagrave lagravem sạch caacutec tiến trigravenh sẽ đảm bảo noacute lagrave duy nhất được tiacutech hợp tại một mức của tổ chức

15Ragrave soaacutet lại dữ liệu ndash Thực thi siecircu dữ liệu

Bất kể cấu truacutec tự nhiecircn của 1 cacircu truy vấn thế nagraveo thigrave caacutec thagravenh phần của siecircu dữ liệu rất quan trọng đối với người ra quyết định

Bảng thuộc tiacutenh khoacutea được lưu trữ bởi kho dữ liệu Tập hợp dữ liệu được lấy từ đacircu Những chuyển đổi nagraveo được thực thi với việc lagravem sạch

16Siecircu dữ liệu lagrave gigrave Metadata - lagrave thocircng tin mocirc tả nội dung của cơ sở dữ liệu (CSDL) Metadata baacuteo cho người dugraveng biết thời gian cập nhật sau cugraveng của dữ liệu

định dạng vagrave mục điacutech sử dụng của noacute Những thocircng tin nagravey coacute thể hướng dẫn người dugraveng duyệt qua CSDL vagrave

giuacutep họ hiểu được yacute nghĩa vagrave ngữ cảnh của dữ liệu Trong CSDL metadata lagrave caacutec dạng biểu diễn khaacutec nhau của caacutec đối tượng

trong CSDL Trong CSDL quan hệ metadata lagrave caacutec định nghĩa của bảng cột CSDL

view vagrave nhiều đối tượng khaacutec Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột

một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi -gtMetadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu

Bảng chuyển đổi Ghi lại những chuyển đổi đatilde được thực hiện

Lịch sử thực thi Ghi lại những dữ liệu đatilde được

phacircn tiacutech

Higravenh thaacutei kết nốiGhi lại những dữ liệu được kết nối vagrave tần suất

17Aacutenh xạ thocircng thường của siecircu dữ liệu Bản ghi aacutenh xạ chuyển đổi bao gồm

Định danh của nguồn gốc Chuyển đổi thuộc tiacutenh Chuyển đổi thuộc tiacutenh vật lyacute Matilde hoacutea tham chiếu bảng chuyển đổi Đổi tecircn Đổi khoacutea Gaacuten giaacute trị cho thuộc tiacutenh mặc định Chọn logic cho caacutec nguồn nhiều giaacute trị Đổi thuật toaacuten

18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để

phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai

lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave

tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec

Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm

Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo

19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua

caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau

SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được

Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra

một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức

Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ

Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ

Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech

CHƯƠNG 11 KHAI PHAacute DỮ LIỆU

1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn

ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993

Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng

2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd

1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều

2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP

3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn

4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng

5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server

6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo

7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động

8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời

9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều

10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện

11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech

12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP

3 Xử lyacute phacircn tiacutech trực tuyến OLAP

MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave

dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu

ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave

thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu

HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave

ROLAP4 Khai phaacute dữ liệu

Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh

khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn

Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan

5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp

6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại

Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp

Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec

Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt

Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra

Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh

vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho

Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec

Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm

Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục

Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng

gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp

Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn

Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec

Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper

Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2

Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25

Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước

Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng

Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện

trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp

Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute

độ hỗ trợ ge ngưỡng minsup

độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan

Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn

Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết

Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu

MOLAP ROLAP HOLAP

Lưu trữ dữ liệu cơ sở

Khối Bảng quan hệ Bảng quan hệ

Lưu trữ thocircng tin tổng hợp

Khối Bảng quan hệ Khối

Hiệu suất thực hiện truy vấn

Nhanh nhất Chậm nhất Nhanh

Tiecircu thụ khocircng gian lưu trữ

Nhiều Thấp Trung bigravenh

Chi phiacute bảo trigrave Cao Thấp Trung bigravenh

Page 20: De cuong(1-11)

thống hội nghị điện tử thường sử dụng internet để kết nối caacutec người ra quyếtđịnh- Caacutec thuận lợi aacutep dụng caacutec phương phaacutep giao tiếp cải tiến trong caacutec tổ chức+ Cải tiến năng suất của nhacircn viecircn+ Liecircn quan đến nhiều người ra quyết định chiacutenh+ Khocircng quan tacircm nhiều đến đường biecircn giới địa lyacute+ Tạo nền văn hoacutea hợp taacutec nhất quaacuten+ Cải tiến chất lượng cuộc sống của nhacircn viecircnHỗ trợ cộng taacutec Maacutey tiacutenh hỗ trợ cộng taacutec- Khung thời giannơi chốn+ Sự hiệu quả của kỹ thuật tiacutenh toaacuten cộng taacutec phụ thuộc vagraveo vị triacute của caacutec thagravenhviecircn trong nhoacutem vagrave phụ thuộc vagraveo thời gian chia sẽ thocircng tin gởi vagrave nhận+ Chia sự giao tiếp thagravenh bốn ocirc vagrave tổ chức bốn ocirc dọc theo 2 chiều thời gian vagravenơi chốn1048713 Thời gian Khi gởi vagrave nhận thocircng tin hầu như đồng thời giao tiếp lagrave đồngthời Viacute dụ Điện thoại ti vi vagrave caacutec cuộc họp gặp mặt nhau Giao tiếp bấtđồng bộ xảy ra khi người nhận nhận thocircng tin ở thời điểm khaacutec thời điểmgởi thocircng tin đoacute1048713 Nơi chốn Người gởi vagrave người nhận coacute thể ở cugraveng phograveng hoặc khocircng+ Bốn ocirc lagrave1048713 Cugraveng thời giancugraveng nơi chốn Caacutec thagravenh viecircn gặp mặt nhau cugraveng một luacutecgiống như phograveng quyết định hoặc gặp mặt truyền thống1048713 Cugraveng thời giankhaacutec nơi chốn Caacutec thagravenh viecircn ở caacutec nơi khaacutec nhau nhưnggiao tiếp cugraveng nhau Viacute dụ hội nghị truyền higravenh (videoconferencing)1048713 Khaacutec thời giancugraveng nơi chốn Nhiều người lagravem việc theo ca Ca nagravey để lạithocircng tin cho ca khaacutec1048713 Khaacutec thời giankhaacutec nơi chốn Caacutec thagravenh viecircn ở caacutec nơi khaacutec nhau Caacutecthagravenh viecircn nagravey gởi vagrave nhận thocircng tin ở những lần khaacutec nhau

23Thực thi hệ DSSHệ thống hỗ trợ quản lyacute (MSS) khocircng phải luacutec nagraveo cũng luocircn thagravenh cocircng Nhiều trường hợpthất bại của ES khocircng hoagraven toagraven lagrave lyacute do kỹ thuật Thực thi hệ thống lagrave một quaacute trigravenh liecircn tụcnhằm đảm bảo cho tổ chức chuẩn bị tiếp nhận một hệ thống mới vagrave đưa hệ thống vagraveo sử dụngthagravenh cocircngThực hiện cocircng nghệ hệ thống hỗ trợ quản lyacute lagrave việc phức tạp vigrave caacutec hệ thống nagravey khocircng đơnthuần lagrave hệ thống thocircng tin chỉ thu thập thao taacutec vagrave phacircn phối thocircng tin Magrave xa hơn chuacuteng

liecircn quan tới caacutec cocircng việc coacute thể lagravem thay đổi đaacuteng kể caacutech thức hoạt động của tổ chức Tuyvậy đa số caacutec yếu tố thực thi đều liecircn quan tới hệ thống thocircng tinThực thi MSS lagrave quaacute trigravenh liecircn tục diễn ra trong suốt thời gian phaacutet triển hệ thống từ đề xuấtban đầu đến nghiecircn cứu khả thi thiết kế vagrave phacircn tiacutech hệ thống lập trigravenh huấn luyện chuyểnđổi vagrave lắp đặt Caacutec chuyecircn gia hệ thống thocircng tin thường gọi thực thi lagrave giai đoạn cuối trongvograveng đời hệ thống Định nghĩa thực thi MSS phức tạp hơn vigrave bản chất lặp của sự phaacutet triểncaacutec hệ thống

THỰC THI KHOcircNG HOAgraveN CHỈNHCaacutec quyết định về tiacutenh khả thi thường coacute giả định về lợi iacutech đạt được khi kế hoạch thực thiđược thực hiện hoagraven toagraven Trong thực tế thường chỉ thực hiện 90 thậm chiacute 70 phần trăm sovới phacircn tiacutech khả thi Lyacute do lagrave sự thay đổi tại một nơi trong hệ thống coacute thể ảnh hưởng vagrave coacutethể taacutec động tiecircu cực đến chỗ khaacutec Do vậy cấp quản lyacute coacute thể bỏ những phần trong dự aacuten coacutethể gacircy ra taacutec động xấu Do đoacute dự aacuten sẽ thực hiện iacutet hơn 100 so với dự aacuten kế hoạch Caacutec lyacutedo khaacutec coacute thể lagrave do khấu trừ ngacircn saacutech hoặc vượt chi phiacuteĐAacuteNH GIAacute SỰ THAgraveNH COcircNG CỦA THỰC THI HỆ THỐNGPhải coacute caacutec chỉ số đo lường thigrave mới coacute thể đaacutenh giaacute sự thagravenh cocircng khi thực thi một hệ thốngDickson va Powers (1973) đề ra 5 tiecircu chuẩn độc lậpbull Tỷ lệ thời gian thực hiện dự aacuten với thời gian ước lượngbull Tỷ lệ chi phiacute thực tế vagrave ngacircn saacutech thực hiệnbull Thaacutei độ của cấp quản lyacute đối với hệ thốngbull Nhu cầu thocircng tin của caacutec nhagrave quản lyacute được đaacutep ứng như thế nagraveo qua hệ thốngbull Taacutec động của dự aacuten đối với những hoạt động maacutey tiacutenh trong cocircng tyCaacutec đo lường khaacutec để đaacutenh giaacute thagravenh cocircng của hệ hỗ trợ quản lyacute (MSS)bull Sự sử dụng hệ thống (dự định dugraveng hoặc thực sự dugraveng)bull Thỏa matilden của người dugravengbull Thaacutei độ taacuten thagravenhbull Mức độ hệ thống hoagraven thagravenh caacutec mục tiecircu ban đầubull Phần thưởng đối với tổ chức (giảm chi phiacute tăng doanh thuhellip)bull Tỷ số lợi iacutech chi phiacute

bull Mức độ thể chế hoacutea của MSS trong tổ chứcDo bởi tiacutenh đa dạng của DSS necircn việc đaacutenh giaacute sự thagravenh cocircng của hệ nagravey cũng khoacute khăn tuynhiecircn cũng coacute thể coacute một số yếu tố giuacutep cho DSS thagravenh cocircng như sự tham gia người dugravenghuấn luyện người dugraveng hỗ trợ quản lyacute cấp cao nguồn thocircng tin đặc điểm của những nhiệmvụ coacute liecircn quan (cấu truacutec bất định độ khoacute phụ thuộc)

Chương5Nhoacutem hỗ trợ quyết định vagrave nhoacutemcocircng nghệ phần mềm

51Nhoacutem tạo quyết định

MDM-Holsapple đatilde gợi yacute chuacuteng ta sử dụng giới hạn người tạo quyết định

Một nhoacutem lagrave kết cấu MDM nơi magrave nhiều người ra quyết định hoagraven toagraven tương taacutec

Một đội lagrave kết cấu MDM nơi caacutec thagravenh viecircn tư vấn cho người đưa ra quyết định nhưng khocircng tương taacutec

Một Ủy ban lagrave kết cấu MDM với một người tạo quyết định duy nhất vagrave sự tương taacutec giữa caacutec thagravenh viecircn

Mạng thocircng tin

Mạng lưới baacutenh xe mỗi người tham gia coacute thể giao tiếp với người đưa ra quyết định ở trung tacircm nhưng khocircng phải với người tham gia khaacutecCấu truacutec nagravey lagrave khocircng thỏa matilden tất cả những người tham gia ngoại trừ người ra quyết định

Mạng dacircy chuyền Tham gia chuyển tiếp thocircng tin chỉ để noacute luocircn liền kề nhau trong chuỗi

Thagravenh viecircn cuối cugraveng ko được đaacutep ứng

Mạng vograveng trograven Tương tự như chuỗi nhưng kết thuacutec được kết nối

Mạng kết nối hoagraven toagraven khocircng coacute hạn chế về giao tiếp vagrave tương taacutec giữa caacutec thagravenh viecircnNoacutei chungnoacute đaacutep ứng hầu hết caacutec kết nối của người tham gia nhưng truyền đạt thocircng tin mất nhiều thời gian vagrave coacute nhiều cơ hội xảy ra lỗi

Nhoacutem hagravenh vi vagrave chuẩn mực

MDMs thiết lập caacutec chỉ tiecircu hướng dẫn quaacute trigravenh ra quyết định

Một chuẩn mực quy định cụ thể những gigrave thagravenh viecircn trong nhoacutem dự kiến sẽ lagravem trong những hoagraven cảnh nhất định

Quy tắc gửi coacute thể được thocircng qua viacute dụ đaacutenh giaacute ngang hagraveng hoặc xử phạt

Lagravem thế nagraveo để đưa ra quyết định

Việc chọn lựa magrave trong đoacute việc sử dụng cấu truacutec MDM phải được dựa trecircn một số yếu tố liecircn quan với bối cảnh quyết định

Viacute dụmột cấu truacutec riecircng lẻ sẽ lagravem việc nơi magrave quyết định được cấu truacutec cao vagrave thocircng tin lagrave coacute sẵn

Một ủy ban cơ cấu sẽ lagrave sự lựa chọn khi người ra quyết định khocircng thể đưa ra quyết định một migravenh

52Caacutec vấn đề thường gặp trong nhoacutem

Kiacutech thước Noacutei chung sự nhất triacute vagrave gắn kết giữa caacutec thagravenh viecircn tỉ lệ nghịch với phạm vi nhoacutem Trong nhoacutem lớn rất dễ higravenh thagravenh caacutec nhoacutem nhỏ vagrave hoạt động rời rạc

Tư duy tập thể Trong nhoacutem lớn mọi người coacute xu hướng suy nghĩ đểđạtđược sự nhất triacute necircn khocircng phaacutet huy được sự saacuteng tạo

Caacutec vấn đề về xatilde hội

Xung đột Trong 1 nhoacutem ai cũng muốn migravenh lagrave giỏi nhất necircn dễ dẫn đến xung đột

Ẩn danh(Giấu tecircn) Đacircy lagrave phương phaacutep được sử dụng để kiểm soaacutet xung đột Cho caacutec thagravenh viecircn tham gia ẩn danh

Vấn đề giới tiacutenh Nam vagrave nữ thường coacute những thế mạnh khaacutec nhau điều nagravey coacute thể lagrave sức mạnh trong 1 thiết lập MDM

Đagravem phaacuten vagrave quyết định

Một quyết định coacute thể liecircn quan đến nhiều quan điểm khaacutec nhau vigrave thế cần phải coacute sự đagravem phaacuten

Caacutec thiết kế của cơ chế hỗ trợ cho MDM phải phugrave hợp với caacutec hoạt độngđagravemphaacuten

Những hoạt động nagravey bao gồm việc thu nhận yacute kiến của caacutec thagravenh viecircn 1 caacutech cocircng bằng

53Cocircng nghệ hỗ trợ MDM

Organizational DSSndash 1 hệ thống cung cấp caacutec quyết định hỗ trợ

Group Support Systemndash Cocircng nghệ sử dụng sự hỗ trợ của nhiều becircn tham gia

Group DSS ndash Lagrave 1 hệ thống được thiết kế đặc biệt để hỗ trợ cho MDM

DSS ndash Lagrave 1 hệ thống dưới sự kiểm soaacutet của 1 người quyết định hệ thống nagravey cung cấp 1 bộ cocircng cụ giuacutep phacircn tiacutech hoagraven cảnh đểđưa ra quyết định vagrave nacircng cao hiệu quả của quyết địnhđoacute

53Cocircng nghệ hỗ trợ MDM

Organizational DSSndash 1 hệ thống cung cấp caacutec quyết định hỗ trợ

Group Support Systemndash Cocircng nghệ sử dụng sự hỗ trợ của nhiều becircn tham gia

Group DSS ndash Lagrave 1 hệ thống được thiết kế đặc biệt để hỗ trợ cho MDM

DSS ndash Lagrave 1 hệ thống dưới sự kiểm soaacutet của 1 người quyết định hệ thống nagravey cung cấp 1 bộ cocircng cụ giuacutep phacircn tiacutech hoagraven cảnh đểđưa ra quyết định vagrave nacircng cao hiệu quả của quyết địnhđoacute

Mục tiecircu của cocircng nghệ hỗ trợ MDM

Quy trigravenh hỗ trợ tập trung vagraveo quaacute trigravenh tạo điều kiện thuận lợi cho sự tương taacutec

Cơ chế cấu truacutec quaacute trigravenh chi phối caacutec hoạt động truyền thocircng

Nhiệm vụ hỗ trợ cocircng việc coacute thể chọn lựa tổ chức hoặc lấy thocircng tin

Nhiệm vụ cấu truacutec cocircng việc cho pheacutep truy cập đến kỹ thuật lọc kết hợp phacircn tiacutech kiến thức liecircn quan đến cocircng việc

Caacutec lớp loại cocircng nghệ hỗ trợ MDM

Phacircn loại theo đặc điểm do DeSanctis vagrave Gallupe đưa ra đề xuất một chương trigravenh ba cấp dựa trecircn caacutec tiacutenh năng được cung cấp

Hệ thống cấp 1 Mục điacutech chiacutenh lagrave tạo điều kiện thocircng tin liecircn lạc giữa caacutec thagravenh viecircn

Hệ thống cấp 2 Thiết kế để giảm thiểu rủi ro

Hệ thống cấp 3 Giuacutep điều chỉnh xử lyacute quyết định

Phacircn loại theo cocircng nghệ -Kraemer vagrave King tập trung vagraveo cocircng nghệ aacutep dụng

Cocircng nghệ bảng mạch điện tử

Hội nghị trực tuyến

Mạng lưới tập đoagraven

Trung tacircm thocircng tin

Mocirci trường cộng taacutec

Phograveng quyết định

Nhoacutem phần mềm

Phần mềm được thiết kế để hỗ trợ sự hợp taacutec bao gồm việc thu huacutet vagrave lưu trữ thocircng tin

Caacutec tổ chức dẫn đầu thị trường hiện tại lagrave Lotus Notes and Domino Microsoft Exchange Novell GroupWise and Oracle Office

Caacutec cocircng cụ trong một bộ phần mềm bao gồm người quản lyacute hội nghị (Lotus Sametime) vagrave trao đổi thocircng điệp (Lotus Notes Mail)

Xếp hạng phần mềm cho nhoacutem

Ellis vv đề xuất một hệ thống xếp hạng dựa vagraveo kiểu sự hỗ trợ noacute Cung cấp

Hệ thocircng điệp

Hệ thống hội thảo truyền higravenh

Hệ thống cộng taacutec soạn thảo

Nhoacutem phacircn phối giải phaacutep phần mền

Hệ thống phối hợp

Hệ thống thocircng minh đại diện

Lực lượng điều khiển phaacutet triển phần mềm cho nhoacutem

Một số nhacircn tố chiacutenh bao gồm

Tăng năng suất

Giảm số lượng caacutec cuộc họp

Tăng cường tự động hoacutea caacutec quy trigravenh lagravem việc thường xuyecircn

Cần phối hợp toagraven cầu tốt hơn

Tiacutenh sẵn sagraveng của những mạng lan rộng

Coleman vagrave Khanna liệt kecirc 10 nhacircn tố khaacutec

54Quản lyacute hoạt động MDM (Mobile Device Management - Quản lyacute thiết bị di động)

Một số phương phaacutep phối hợp phổ biến hơnMDM lagrave

Kỹ thuật nhoacutem định danh

Kỹ thuật Delphi

Sự phacircn xử

Hệ thocircng tin dựa trecircn vấn đề

Nemawashi

Kỹ thuật nhoacutem định danh

1-Mỗi người tham gia viết ra những yacute tưởng về những gigrave necircn quyết định

2-Lần lượt mỗi người tham gia trigravenh bagravey yacute tưởng của migravenh được ghi lại trecircn bảng Khocircng thảo luận ở đacircy

3-Sau khi tất cả caacutec yacute tưởng được trigravenh bagravey caacutec đại biểu coacute thể chất vấn những người khaacutec

4-Mỗi người tham gia bỏ phiếu cho mỗi yacute tưởng

Kỹ thuật Delphi

Về cơ bản tương tự như kỹ thuật nhoacutem định danh ngoại trừ những người khocircng bao giờ tham gia cuộc họp

Một cocircng cụ khảo saacutet được sử dụng để thu thập đầu vagraveo ban đầu từ caacutec thagravenh viecircn

Một cuộc khảo saacutet thứ hai được gửi đi với một bản toacutem tắt caacutec kết quả chung

Những bước lặp lại cho đến khi đạt được một sự đồng thuận hoặc nhigraven nhận của đa số

Sự phacircn xử(Arbitration )

Thiacutech hợp nhất khi caacutec thagravenh viecircn của MDM đại diện cho caacutec yếu tố đối lập

Những người tham gia đồng yacute rằng nếu lựa chọn thay thế hai becircn thỏa thuận khocircng được tigravem thấy thigrave một trọng tagravei viecircn becircn ngoagravei sẽ tham gia

Trọng tagravei sau đoacute lựa chọn thay thế ocircng hoặc xeacutet thấy thiacutech hợp nhất

Hệ thống thocircng tin dựa trecircn vấn đề (IBIS)

Lagrave một phương phaacutep lập luận cấu truacutec

Một đại diện cho IBIS lagrave một đồ thị với caacutec nuacutet vagrave caacutec liecircn kết

IBIS bắt đầu với lựa chọn của một nuacutet vấn đề gốc sau đoacute caacutec nuacutet vị triacute khaacutec nhau được liecircn kết với nuacutet gốc

Caacutec nuacutet vị triacute nagravey sau đoacute được đaacutenh giaacute dựa trecircn những lập luận gắn liền với chuacuteng

Nemawashi (được sử dụng rộng ratildei tại Nhật Bản)

1-Một hoặc nhiều thagravenh viecircn của MDM được chỉ định lagrave điều phối viecircnCaacutec điều phối viecircn sau đoacute chọn người tham gia cograven lại

2-Điều phối viecircn xacircy dựng một tổng hợp caacutec sự lựa chọn vagrave sau đoacute caacutec chuyecircn gia đaacutenh giaacute caacutec lựa chọn

3-Điều phối viecircn lựa chọn một sự lựa chọn dựa trecircn kết quả ở trecircn(ở 2)

4-Sự thay thế được luacircn chuyển điều phối viecircn tigravem kiếm sự đồng thuận thocircng qua sự thuyết phục vagrave đagravem phaacuten

5-Nếu đạt được sự đồng thuận điều phối viecircn cho lưu thocircng một tagravei liệu magrave mỗi thagravenh viecircn MDM để lại dấu hiệu trecircn đoacute

55Nơi lagravem việc ảo

Nhiều tổ chức trecircn toagraven thế giới kinh doanh bất động sản cho cocircng nghệ hợp taacutec

Cocircng việc được trở thagravenh một điều bạn lagravem hơn lagrave một nơi bạn đi

Những thay đổi lớn nhất mang lại bởi nơi lagravem việc ảo coacute thể lagrave về văn hoaacute hay xatilde hội hơn lagrave về cocircng nghệ

Chương 6 Hệ thống thocircng tin điều hagravenh

61 Yacute nghĩa của EIS- Hệ thống thocircng tin điều hagravenh

- EIS lagrave một dạng đặc biệt của DSS được thiết kế để hỗ trợ ra quyết định ở cấp cao nhất của một tổ chức

- Lagrave một hệ thống thocircng tin hỗ trợ nhu cầu lập kế hoạch vagrave đaacutenh giaacute của caacutec nhagrave quản lyacute điều hagravenh

- EIS coacute thể giuacutep một CEO coacute được bức tranh tổng thể chiacutenh xaacutec nhất về caacutec hoạt động vagrave một bản toacutem tắt những gigrave magrave đối thủ cạnh tranh đang lagravem

- Caacutec hệ thống nagravey noacutei chung hoạt động dễ dagraveng vagrave trigravenh bagravey thocircng tin theo những caacutech dễ hiểu để việc tiếp thu được nhanh choacuteng (biểu đồ đồ thịhellip)

(Tagravei liệu thecircm EIS lagrave những loại hệ thống lagrave rất phức tạp trong tự nhiecircn Coacute thể noacutei hệ thống nagravey cũng cung cấp cho caacutec nhagrave quản lyacute với caacutec thiết bị coacute khả năng ra quyết định bằng caacutech sử dụng của noacute Hệ thống nagravey hoạt động trong điều kiện như vậy quan trọng như trong caacutec hệ thống khaacutec khocircng hỗ trợ Khả năng lưu trữ dữ liệu nặng lagravem cho noacute lyacute tưởng để được thocircng qua khocircng chỉ bởi caacutec doanh nghiệp lớn magrave cograven bởi caacutec doanh nghiệp nhỏ hơn Nhigraven chung hệ thống nagravey lagrave dagravenh cho caacutec nhacircn viecircn cấp cao hỗ trợ thagravenh thạo trong việc đưa ra caacutec quyết định quan trọng)

Caacutec phiecircn EIS tiecircu biểu- Phiecircn lagravem việc coacute thể bắt đầu với một baacuteo caacuteo về tigravenh higravenh tagravei chiacutenh vagrave kinh

doanh của một cocircng ty caacutec chỉ số hoạt động quan trọng được hiển thị rotilde ragraveng- EIS sẽ cho pheacutep caacutec giaacutem đốc điều hagravenh coacute thể đi sacircu vagraveo dữ liệu từ những con

số bất kỳ magrave noacute hỗ trợ- Việc điều hagravenh coacute thể lựa chọn một mức độ chi tiết ( VD danh số baacuten hagraveng) nếu

như cần điều tra thecircm- Lagrave một phương phaacutep tiếp cận coacute thể giuacutep việc ra quyết định tốt hơn

Những điều magrave EIS ko coacute- EIS khocircng phải lagrave sự thay thế cho caacutec hệ thống dựa trecircn caacutec maacutey tiacutenh khaacutec EIS

thực sự chỉ cung cấp dữ liệu cho caacutec hệ thống nagravey- Noacute khocircng thể biến caacutec bộ hệ điều hagravenh của maacutey tiacutenh thagravenh những ldquochuyecircn viecircn

giỏirdquo- Coacute thể được viacute một caacutech cao hơn như lagrave một trợ lyacute đaacuteng tin cậy coacute thể được gọi

đến bất khi nagraveo vagrave mỗi khi cần thiết

Tagravei liệu thecircm Sự khaacutec nhau giữa EIS vagrave DSS+ EIS thiết kế để hỗ trợ những người điều hagravenh cấp cao giuacutep họ khaacutem phaacute caacutec vấn đề vagrave caacutec cơ hội DSS hỗ trợ những nười phacircn tiacutech cố gắng trả lời cacircu hỏi caacutei gigrave coacute thể lagravem cugraveng với một cơ hội hoặc một vấn đề

Chiều EIS DSSNhững người sử dụng thocircng thường

Duyệt dữ liệu đi xuống truy xuất trạng thaacutei

Hỗ trợ phacircn tiacutech vagrave quyết định

Sự thuacutec đẩy Tiacutenh thiacutech hợp Tiacutenh hiệu quảỨng dụng Queacutet mocirci trường đaacutenh giaacute

hiệu suất nhận dạng caacutec vấn đề vagrave caacutec cơ hội

Caacutec quyết định quản lyacute trecircn caacutec lĩnh vực đa dạng

Hỗ trợ quyết định Caacutec chiacutenh saacutech caacutec quyết định khocircng coacute cấu truacutec ở mức cao vagrave hỗ trợ giaacuten tiếp

Hỗ trợ caacutec quyết định lặp lại caacutec quyết định khocircng thể đoaacuten trước ra quyết định khocircng coacute cấu truacutec vagrave baacuten cấu truacutec

Loại thocircng tin Caacutec thocircng tin tin tức thocircng tin becircn ngoagravei về khaacutech hagraveng đối thủ cạnh tranh mocirci trường caacutec baacuteo caacuteo theo yecircu cầu vagrave định thời về caacutec hoạt động becircn trong

Caacutec thocircng tin hỗ trợ caacutec tigravenh huống đặc biệt

Sử dụng coacute nguyecircn tắc

Dograve theo vết vagrave điều khiển nhận dạng cơ hội

Hoạch định tổ chức phacircn nhoacutem vagrave điều khiển

Khả năng phugrave hợp với những người sử dụng caacute nhacircn

Thiết kế loại ra quyết định cho mỗi người điều hagravenh caacute nhacircn bằng nhiều lựa chọn đầu ra

Cho pheacutep caacutec đaacutenh giaacute caacute nhacircn caacutec khả năng what-if lựa chọn loại hộp hội thoại

Đồ họa Phải coacute Lagrave một phần quan trọng của nhiều DSS

Thacircn thiện người sử dụng

Phải coacute Phải coacute nếu khocircng coacute người sử dụng trung gian

Xử lyacute thocircng tin Lọc neacuten thocircng tin dograve theo vết dữ liệu vagrave thocircng tin quan trọng

EIS kiacutech thiacutech caacutec cacircu hỏi caacutec cacircu trả lời bằng caacutech sử dụng DSS vagrave phản hồi lại EIS

Hỗ trợ caacutec thocircng tin chi tiết

Truy xuất thường xuyecircn caacutec mức chi tiết của bất kỳ thocircng tin tổng hợp nagraveo (duyệt dữ

Coacute thể coacute trong DSS nhưng khocircng thường

liệu chi tiết)Cơ sở mocirc higravenh Caacutec chức năng coacute sẵn bị hạn

chếLagrave điểm cốt lotildei của DSS

Cấu truacutec Theo người baacuten sản phẩm hoặc theo caacutec chuyecircn gia hệ thống thocircng tin

Theo người sử dụng hoặc caacute nhacircn hoặc caacutec chuyecircn gia từ caacutec trung tacircm thocircng tin hoặc phograveng ban hệ thống thocircng tin

Phần cứng Mainframe caacutec trạm RISC mạng LANs hoặc caacutec hệ thống phacircn bố

Mainframe caacutec trạm RISC caacutec maacutey PC hoặc caacutec hệ thống phacircn bố

Bản chất caacutec goacutei phần mềm

Truy xuất tương taacutec dễ dagraveng đến nhiều cơ sở dữ liệu truy xuất trực tuyến caacutec khả năng DBMS phức tạp caacutec liecircn kết phức tạp

Caacutec khả năng tiacutenh toaacuten lớn caacutec ngocircn ngữ mocirc higravenh mocirc phỏng ứng dụng vagrave caacutec bộ tạo DSS

Bản chất caacutec thocircng tin

Trigravenh bagravey thocircng tin được phaacutet sinh trước về quaacute khứ vagrave hiện tại tạo caacutec thocircng tin mới về quaacute khứ hiện tại tương lai

Tạo thocircng tin mới về quaacute khứ hiện tại tương lai

62 Lịch sử EIS- EIS xuất hiện lần đầu tiecircn tại MIT vagraveo những năm 1970

- Những EIS đầu tiecircn được phaacutet triển bởi caacutec doanh ngiệp lớn sẵn sagraveng chấp nhận rủi ro để đạt được lợi thế cạnh tranh

- Vagraveo những năm 1980 caacutec nhagrave cung cấp đatilde phaacutet triển một số cơ sở khaacutech hagraveng rộng vagrave cocircng nghệ EIS được tiếp tục phaacutet triển cho đến ngagravey nay

(Tagravei liệu thecircm Sử dụng DSSEIS cho phaacutet triển bền vững + Một số nghiecircn cứu đatilde được tiến hagravenh để kiểm tra việc thực hiện của EIS trong khu vực cocircng cộng vagrave chiacutenh phủ caacutec nước tổ chức kể từ khi chuacuteng được phaacutet triển theo định hướng lợi nhuận cho caacutec cocircng ty tư nhacircn (Hasan vagrave Hasan năm 1997) Theo một nghiecircn cứu tiến hagravenh tại Mỹ ở hơn 300 cocircng ty kết quả cho thấy sự khaacutec biệt của EIS giữa tư nhacircn vagrave chiacutenh phủ một số kết quả thuacute vị được phaacutet hiệnViacute dụ khoacute khăn hơn để chuyển tiền từ một tagravei khoản khaacutec trong một EIS của chiacutenh phủ cũng lagrave khoacute khăn hơn để biện giải thiacutech cho những chi phiacute phaacutet triển EIS của chiacutenh phủ Một nghiecircn cứu khaacutec được tiến hagravenh ở Australia

cho thấy rằng EIS cung cấp cho quản lyacute một higravenh ảnh chiacutenh xaacutec hơn về tổ chức thực hiện vagrave cung cấp hỗ trợ cho caacutec lợi iacutech chiến lược cải thiện khocircng chỉ cho caacutec nhagrave quản lyacute nhưng cograven cho phần cograven lại của tổ chức Dựa trecircn caacutec hệ thống được thiết kế cho caacutec cocircng ty tư nhacircn với một caacutech rotilde ragravengxaacutec định mục tiecircu EIS lagrave thiacutech hợp cho caacutec tổ chức cocircng cộng hiện đại nhưng cần phải được linh hoạt hơn vagrave kết thagravenh chugravem một phạm vi rộng hơn khả năng vagrave phương tiện hơn so với khu vực tư nhacircn ban đầu theo định hướng sản phẩm (Hasan vagrave Hasan năm 1997) Điều nagravey coacute thể lagrave do thực tế rằng caacutec hoạt động khu vực cocircng lagrave bắt buộc coacute taacutec động rộng phải đaacutep ứng sự mong đợi duy nhất cocircng cộng thường coacute mục tiecircu mơ hồ vagrave macircu thuẫn iacutet quyền tự chủ vagrave kiểm soaacutet việc ra quyết định vagrave nhacircn viecircn lagrave khoacute khăn hơn (Watson vagrave Carte2000) + Toacutem lại EIS lagrave một khaacutei niệm thagravenh cocircng noacute phaacutet triển qua nhiều năm tuy nhiecircn EIS khắc phục khiếm khuyết của migravenh bằng caacutech tiến hagravenh nghiecircn cứu liecircn tục)

63 Tại sao những người điều hagravenh hagraveng đầu lại khaacutec nhau- Họ lagrave những doanh nghiệp theo định hướng coacute suy nghĩ

- Coacute một khoảng khocircng gian rộng để kiểm soaacutet

- Họ chịu traacutech nhiệm cho việc thiết lập chiacutenh saacutech

- Họ đại diện cho tổ chức mocirci trường becircn ngoagravei

- Hagravenh động của họ tạo ra những kết quả đaacuteng kể về tagravei chiacutenh vagrave con người

Tần số caacutec hoạt động điều hagravenh- Xử lyacute xaacuteo trộn 42

- Hoạt động kinh doanh 32

- Phacircn bổ nguồn lực 17

- Đagravem phaacuten 3

- Những điều khaacutec 6

Handling Disturbances 42

Entrepreneurial Activites 32

Resource Allocation 17

Negotiation 3

Other 6

Những thocircng tin điều hagravenh cần thiết- Quản lyacute xaacuteo trộn coacute thể yecircu cầu sự chuacute yacute xung quanh đồng hồ

- Hoạt động kinh doanh yecircu cầu điều hagravenh để dự đoaacuten những thay đổi trong mocirci trường

- Nhiệm vụ phacircn bổ tagravei nguyecircn yecircu cầu lựa chọn người quản lyacute vagrave caacutec nguồn lực hạn chế được triển khai

- Đagravem phaacuten yecircu cầu cập nhật thocircng tin từng phuacutet để coacute thể xacircy dựng được sự đồng thuận

Caacutec loại thocircng tin điều hagravenh- Hệ thống kế toaacuten coacute liecircn quan đến việc tiacutenh toaacuten thu nhập hoạt động cho caacutec lĩnh

vực cụ thể lagrave quan trọng hơn so với caacutec hệ thống kế toaacuten truyền thocircng- Thocircng tin về thị trường khaacutech hagraveng cung cấp giaacute trị trong việc quyết định chiến

lược- Caacutec thocircng tin cần thiết thường được truyền đi trecircn một số hệ thống maacutey tiacutenh vagrave

nằm trong toagraven tổ chức- Caacutec thocircng tin được sử dụng thường lagrave ngắn hạn vagrave dễ thay đổi

Phương thức để xaacutec định thocircng tin cần thiết

Rockart xaacutec định được năm phương thức cơ bản để xaacutec định thocircng tin cần thiết

- Phương thức dựa trecircn kết quả- Phương thức rỗng- Phương thức chỉ số khoacutea- Phương thức tổng hợp nghiecircn cứu- Phương thức dựa vagraveo nhacircn tố then chốt dẫn đến thagravenh cocircng

64 Thagravenh phần EIS

- Sản phẩm EIS đầu tiecircn được phaacutet triển để sử dụng trecircn maacutey tiacutenh cấu higravenh cao nhưng caacutec sản phẩm hiện nay nhằm mục tiecircu lagrave nền tảng ClientServer

- Những nền tảng linh hoạt hơn coacute thể thiacutech ứng với thay đổi trong tổ chức vagrave cocircng nghệ

- Sử dụng dữ liệu thời gian thực dẫn đến quyết định nhanh hơn nhiều thocircng tin hơn

Thagravenh phần phần cứng- Một EIS khocircng đogravei hỏi coacute phần cứng cụ thể hoặc duy nhất nagraveo- Chigravea khoacutea của vấn đề lagrave để đảm bảo rằng caacutec thagravenh phần của EIS tối ưu hoacutea vagrave

phugrave hợp với tagravei nguyecircn maacutey tiacutenh của tổ chức- Hệ thống nagravey phải được cấu higravenh để caacutec nguồn tagravei nguyecircn phugrave hợp với những

người điều hagravenh chuacuteng

Thagravenh phần phần mềm- Traacutei ngược với phần cứng phần mềm thường được chuyecircn mocircn hoacutea cao cho caacutec

bagravei toaacuten về miền- Sự chuyecircn mocircn hoacutea nagravey thường đạt được bằng caacutech sử dụng thagravenh phần off-the-

shelf cho toagraven bộ EIS vagrave caacutec mocirc-đun tugravey chỉnh để đaacutep ứng nhu cầu cụ thể- Lotus Notes lagrave một viacute dụ điển higravenh Noacute coacute thể được sử dụng một migravenh hoặc coacute

thể phục vụ becircn thứ ba mocirc-đun plug-in

Cocircng nghệ EIS hiện nay

Dobrzeniecki đề xuấtphacircn loạitừng cấptheo bachức năng- Loại 1 sản phẩm bao gồmmột bộ đầy đủcaacutec ứng dụngtừ mộtnhagrave cung cấp- Loại 2 sản phẩm đượcthựchiệnở phần đầu củacaacutecsản phẩmDSS đượcphaacutet triển

bởicugravengmộtnhagrave cung cấp- Loại 3 sản phẩmkết hợp với nhautheo bất kỳ số lượngthuộc sở hữu củacocircng ty

65 Xacircy dựng EIS

- Xacircy dựngmộtEISgiống nhưxacircydựngmột số hệ thống khaacutec củamocirc higravenh hệ thống thocircng tin

- Việcphaacutet triểncấu truacutecnecircn được theo dotildeitừ quaacute trigravenh thiết kế đến quaacute trigravenhthực hiện

- Tuy nhiecircn một dự aacuten phaacutet triển EIScoacute xu hướnglagrave thống nhấtvagraveyecircu cầu hỗ trợ caacutec nhagrave quản lyacute latildenh đạo

- Xacircy dựng một EIScoacute thểphaacutet hiện ra đượccaacutectigravenh huống khoacute khănmagravemột nhagrave phaacutet triển chưabao giờ gặp phải

Mocirc higravenh EIS

Khung phaacutet triển một EIS

- Watson et al đề nghị xacircy dựngkhung với ba thagravenh phần+ Caacutech tiếp cận tập trung vagraveo yếu tốcon người vagrave dữ liệu coacute liecircn quan đến EIS+ Quaacute trigravenh phaacutet triển cần sự linh hoạt vagrave tương taacutec+ Người sử dụng - hệ thống hộp thoại bao gồm một ngocircn ngữ hagravenh động để xử lyacute caacutec lệnh

Lợi iacutech của EIS- Dễ duy trigrave caacutec mục tiecircu coacute tổ chức- Dễ truy xuất thocircng tin- Cho pheacutep người sử dụng nacircng cao hiệu suất hơn

- Tăng chất lượng ra quyết định- Cung cấp sự cải tiến cạnh tranh- Tiết kiệm thời gian của người sử dụng- Tăng khả năng vagrave chất lượng giao tiếp- Cung cấp khả năng điều khiển tốt hơn trong tổ chức- Cho pheacutep tham gia caacutec vấn đề vagrave caacutec cơ hội- Cho pheacutep hoạch định- Cho pheacutep tigravem kiếm nguyecircn nhacircn của một vấn đề- Thảo matilden caacutec yecircu cầu của người điều hagravenh

Hạn chế của EIS vagrave 1 số sai lầm cần traacutenh

- Chi phiacute một cuộc khảo saacutetnăm1991 chothấychi phiacute phaacutet triểntrungbigravenh365000USDvớichi phiacute vận hagravenhhagraveng năm lagrave$200000 (EIS)

- Cocircng nghệ hạn chếEIScần phảiđượctiacutech hợp hoagraven toagravenvagraveokiếntruacuteccủadoanh nghiệphiện tại do đoacute noacutelagrave một thaacutech thứclớn đối vớithiết kế

- Hạn chế tổ chức cơ cấu tổ chứccoacute thể khocircng phugrave hợp

Sự hạn chế về tổ chức- Chương trigravenh nghị sự vagrave thời gian chệch EIS mocirc tả một phần việc thực hiện một

chương trigravenh nghị sự vagrave coacute thể dễ dagraveng đạt được sự tin cậy một caacutech chắc chắn- Đồng bộ hoacutea việc quản lyacute sự tin cậy đuacuteng luacutec đặc biệt baacuteo caacuteo EIS coacute thể phaacute

vỡ sự ổn định thiết lập caacutec chu trigravenh baacuteo caacuteo một caacutech tốt nhất- Sự bất ổn EIS phản ứng nhanh coacute thể gacircy ra việc taacutec động trở lại một caacutech

nhanh choacuteng dẫn đến sự thiếu ổn định trong tổ chức

Sự thất bại lagrave thay thế khocircng thể chấp nhận được- Một số yếu tố lagravem EIS thất bại

+ Thiếu sự hỗ trợ về mặt quản lyacute+ Vấn đề chiacutenh trị+ Thất bại của nhagrave phaacutet triển+ Lỗi về cocircng nghệ+ Giaacute cả+ Thời gian

66 Ra quyết định điều hagravenh trong tương lai vagrave EIS

- Coacute một vagravei điều kiện sẽ được hợp nhất cho việc chuyển đổi cocircng nghệ Trong đoacute một vagravei điều kiện coacute thể dễ dự đoaacuten Hai điều kiện magrave ta coacute thể thấy lagrave+ Phaacutet triển cocircng nghệ maacutey tiacutenh trong việc điều hagravenh sẽ tạo ra sự chuyển đổi được chấp nhận một caacutech dễ dagraveng hơn+ Mở rộng traacutech nhiệm điều hagravenh sẽ mở rộng nhu cầu thocircng tin

Tương lai của EIS- EIS thocircng minh Những tiến bộ trong cocircng nghệ AI sẽ được triển khai trong caacutec

EIS- EIS đa phương tiện Cơ sở dữ liệu đa phương tiện sẽ cho pheacutep tiacutech hợp văn bản

giọng noacutei vagrave higravenh ảnh trong tương lai- EIS thocircng tin Tương lai EIS sẽ mở rộng hơn trong việc sử dụng dữ liệu becircn

ngoagravei doanh nghiệp- EIS kết nối Giao tiếp với băng thocircng rộng cho pheacutep kết nối liecircn thocircng lớn hơn

Chương 7 HỆ CHUYEcircN GIA VAgrave TRIacute TUỆ NHAcircN TẠO

71 Caacutec khaacutei niệm

72 Triacute thocircng minh của triacute tuệ nhacircn tạo

73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia

74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia

75 Lợi iacutech vagrave hạn chế của hệ chuyecircn gia

71 Caacutec khaacutei niệm

Chuyecircn mocircn (Expertise) sự hiểu biết rộng trong 1 lĩnh vực hẹp

Hệ chuyecircn gia (Expert Systems)1 chương trigravenh maacutey tiacutenh sử dụng 1 tập caacutec luật dựa trecircn tri thức của con người để giải quyết caacutec vấn đề đogravei hogravei phải coacute sự chuyecircn mocircn

Một số hệ chuyecircn gia nổi tiếng

DENDRAL (Standford 1960s Edward Feigenbaum)

MYCIN (Standford1970s Edward Shortliffe)

PROSPECTOR (MIT 1979)

Triacute tuệ nhacircn tạo (Artificial Intelligence ndash AI)

Triacute tuệ nhacircn tạo một bộ phacircn của ngagravenh khoa học maacutey tiacutenh quan tacircm đến việc thiết kế caacutec hệ thống maacutey tiacutenh thocircng minh đoacute lagrave caacutec hệ thống đưa ra caacutec đặc điểm magrave từ đoacute chuacuteng ta liecircn hệ với sự thocircng minh trong hagravenh động của con người (Barr vagrave Feigenbaum 1981)

Mục điacutech của AI

Mục điacutech khoa học xaacutec định caacutec gợi yacute để giải thiacutech caacutec loại khaacutec nhau của triacute tuệ thực

Mục điacutech kỹ thuật giải quyết caacutec vấn đề trong thế giới thực

Triacute tuệ nhacircn tạo kế thừa nhiều yacute tưởng quan điểm kỹ thuật từ caacutec ngagravenh khoa học khaacutec

- Triết học

- Logic Toaacuten học

- Tiacutenh toaacuten

- Khoa học tacircm lyacute Khoa học nhận thức

- Sinh học Thần kinh học

- Tiến hoacutea

Caacutec lĩnh vực ứng dụng trong Triacute tuệ nhacircn tạo

Mạng nơ ron thần kinh (Neural Networks)

Tiacutenh toaacuten sự tiến hoacutea

(Evolutionary Computation)

Hệ chuyecircn gia (Expert Systems)

Kỹ thuật xử lyacute tiếng noacutei (Speech Processing)

Kỹ thuật xử lyacute ngocircn ngữ tự nhiecircn

(Natural Language Processing)

Lập kế hoạch (Planning)

Robot (Robotics)

Khoa học higravenh ảnh (Vision)

Caacutec kỹ thuật thocircng dụng dugraveng trong AI

Biểu diễn(Representation)

Học (Learning)

Caacutec luật (Rules)

Tigravem kiếm (Search)

72 Triacute thocircng minh của triacute tuệ nhacircn tạo

Con người suy diễn như thế nagraveo

Phacircn loại (Categorization)

Caacutec quy tắc cụ thể

Heuristics

Kinh nghiệm trước đoacute

Dự tiacutenh trước

Maacutey tiacutenh suy diễn như thế nagraveo

Lập luận dựa trecircn luật IF-THEN mocirc tả tri thức được matilde hoacutea dưới dạng caacutec luật

Caacutec khung (Frames) lagrave caacutec đại diện mocirc tả caacutec tigravenh huống giống nhau lagrave điển higravenh của một vagravei phacircn loại

Lập luận dựa trecircn caacutec trường hợp mocirc phỏng giải phaacutep trước đoacute cho một vấn đề hiện tại

Nhận dạng mẫu phaacutet hiện acircm thanh higravenh dạng hoặc caacutec chuỗi dagravei

Caacutec dạng khaacutec của Triacute tuệ nhacircn tạo

Học maacutey- mạng nơron vagrave giải thuật di truyền

Lập trigravenh tự động ndash lagrave những kỹ thuật tạo ra caacutec chương trigravenh để lagravem 1 nhiệm vụ riecircng biệt (cho pheacutep những người khocircng phải lagrave người lập trigravenh coacute thể lập trigravenh được)

Cuộc sống nhacircn tạo ndash nỗ lực để taacutei tạo caacutec hiện tượng sinh học trong caacutec hệ thống dựa trecircn maacutey tiacutenh

73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia(Expert Systems- ES)

Theo Jackson (1999) Một hệ chuyecircn gia lagrave một chương trigravenh maacutey tiacutenh mocirc tả vagrave suy diễn với tri thức của một vagravei lĩnh vực để giải quyết vấn đề hay đưa ra caacutec lời khuyecircn

Cấu truacutec cơ bản của ES được dựa theo cấu truacutec chung của DSS Sự khaacutec biệt chiacutenh giữa ES vagraveDSS lagrave hệ ES thu thập caacutec kiến thức từ những

chuyecircn gia trong lĩnh vực quan tacircmĐặc trưng của hệ chuyecircn gia Hiệu quả cao Thời gian trả lời thỏa đaacuteng Độ tin cậy cao Dễ hiểu

Giao diện người dugraveng trong ES

Thiết kế giao diện người dugraveng tập trung vagraveo caacutec yếu tố như dễ dagraveng sử dụngcoacute độ tin cậy cao giảm tải những khoacute khăn khi sử dụng

Thiết kế necircn coacute một số tương taacutec (đầu vagraveo kiểm soaacutet vagrave truy vấn)

Cấu tạo giao diện người dugraveng gồm coacute magraven higravenh cảm ứng bagraven phiacutem buacutet saacuteng lệnh thoại caacutec phiacutem chuyecircn dụng

Cơ sở tri thức (Knowledge Base)

Chứa đựng caacutec tri thức cụ thể miền thu được từ caacutec chuyecircn gia miền

Coacute thể chứa caacutec mocirc tả caacutec hagravenh vi giải quyết vấn đề caacutec ragraveng buộc caacutec heuristics

Thagravenh cocircng của một ES dựa trecircn tiacutenh đầy đủ vagrave tiacutenh chiacutenh xaacutec của cơ sở tri thức

Mocirc tơ suy diễn (Inference Engine)

Ở đacircy tri thức được đặt để sử dụng tạo ra caacutec giải phaacutep để giải quyết vấn đề

Mocirc tơ nagravey coacute khả năng thực hiện diễn dịch hoặc suy diễn dựa trecircn caacutec luật hay caacutec caacutec sự kiện

Đồng thời cũng coacute khả năng sử dụng caacutec suy diễn mờ hay khocircng chiacutenh xaacutec dựa trecircn xaacutec suất hay aacutenh xạ mẫu

Vograveng điều khiển suy diễn

1 Aacutenh xạ caacutec luật với caacutec sự kiện đatilde được cho

2 Chọn luật để thực hiện

3 Thực hiện luật bằng caacutech thecircm caacutec sự kiện được suy diễn ra vagraveo bộ nhớ lagravem việc

Chuỗi suy diễn (Chaining)

Suy diễn tiến (forward chaining) maacutey suy diễn bắt đầu từ dữ liệu ban đầu vagrave thực hiện việc suy luận để đưa ra caacutec kết luận cuối cugraveng

Suy diễn lugravei (backward chaining) maacutey suy diễn bắt đầu từ dữ liệu điacutech vagrave tigravem ra tri thức hỗ trợ cho dữ liệu điacutech đoacute

Viacute dụ suy diễn lugravei

R1 Nếu coacute A vagrave B thigrave suy ra coacute D

R2 Nếu coacute B thigrave suy ra coacute C

R3 Nếu coacute C vagrave D thigrave suy ra coacute E

Ta coacute E ta xem trong 3 luật R1 R2 R3 luật nagraveo coacute E ta thấy R3 chứa E đồng thời chứa C vagrave D Xeacutet tiếp trong 2 luật R1 R2 luật nagraveo chứa C vagrave D R2 chứa C R3 chứa D Từ đoacute ta coacute được caacutec tri thức hỗ trợ suy diễn vagrave kết luận lagrave nếu coacute A vagrave B thigrave sẽ coacute E Hay nếu A vagrave B đuacuteng thigrave sẽ coacute E

Viacute dụ suy diễn tiến

Giả sử coacute tập chứa 3 luật sau

R1 Nếu coacute A vagrave B thigrave suy ra coacute D

R2 Nếu coacute B thigrave suy ra coacute C

R3 Nếu coacute C vagrave D thigrave suy ra coacute E

Nếu ta coacute A vagrave B thigrave chuacuteng ta suy ra được D từ R1 vagrave suy ra C từ R2 Với D vagrave C đatilde được suy ra ở trecircn giờ chuacuteng ta suy ra được E từ R3

Viacute dụ thực tế

Giả sử muốn biết magraveu của một con vật nuocirci tecircn lagrave Fred biết rằng noacute kecircu ộp ộp vagrave ăn ruồi

Coacute tập 4 luật ban đầu như sau

R1 Nếu X kecircu ộp ộp vagrave ăn ruồi thigrave X lagrave con ếch

R2 Nếu X kecircu chiecircm chiếp vagrave biết hoacutet thigrave X lagrave con chim

R3 Nếu X lagrave con ếch thigrave X coacute magraveu xanh

R4 Nếu X lagrave con chim thigrave X coacute magraveu vagraveng

74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia

Expert system shells lagrave một tập caacutec goacutei phần mềm vagrave caacutec cocircng cụ dugraveng để phaacutet triển caacutec hệ chuyecircn gia

Những Expert system shells đầu tiecircn thường rất rườm ragrave Mặc dugrave vậy noacute vẫn giuacutep cho người sử dụng sẽ khocircng phải bắt đầu lại từ đầu khi xacircy dựng một hệ chuyecircn gia mới

Những shell hiện đại bao gồm hai mocirc-đun chiacutenh lagrave cocircng cụ xacircy dựng một tập quy tắc vagrave mocirc tơ suy diễn

Xacircy dựng hệ chuyecircn gia

Bước 1 xacircy dựng mocirc higravenh bagravei toaacuten xaacutec định vấn đề nhiệm vụ magrave hệ thống sẽ thực hiện Caacutec dạng bagravei toaacuten cần hệ chuyecircn gia

Bagravei toaacuten diễn giải (InterPretation)

Bagravei toaacuten dự baacuteo (Prediction)

Bagravei toaacuten chuẩn đoaacuten (Diagnose)

Bagravei toaacuten gỡ rối (Debugging)

Bagravei toaacuten thiết kế

Tương tự như một dự aacuten phần mềm để xacircy dựng một hệ chuyecircn gia cần phải coacute caacutec yếu tố về nhacircn lực tagravei nguyecircn vagrave thời gian Những yếu tố nagravey ảnh hưởng đến giaacute thah của một hệ chuyecircn giaTrong phần nagravey cacircu hỏi thường được đặt ra lagrave tại sao cần phải xacircy dựng một hệ chuyecircn giaTrước khi bắt đầu phải xaacute định rotilde bagravei toaacuten đạt ra lagrave jiAi lagrave chuyecircn giaAi lagrave người sử dụng

1 Diễn giải (InterPretation) Nghiecircn cứu 1 vấn đề -gt Dựa trecircn những biểu hiện thuộc tiacutenh đặc trưng becircn ngoagravei -gt Tư vấn

(hoặc đưa ra kết luận hay mocirc tả dễ hiểu từ tập dữ liệu thocirc)

2 Bagravei toaacuten dự baacuteo (Prediction) Coacute thể dự đoaacuten được hagravenh vi kết quả dựa trecircn caacutec hiện tượng -gt dự baacuteo

VD Dự baacuteo thời tiết động đấthellip

3 Bagravei toaacuten chẩn đoaacuten (Diagnoss) Xaacutec định caacutec lỗi caacutec bộ phận hỏng hoacutec của hệ thống dựa trecircn caacutec dữ liệu quan saacutet được

4 Bagravei toaacuten gỡ rối (Debugging) Mocirc tả caacutec phương phaacutep khắc phục hệ thống khi gặp sự cố

5 Bagravei toaacuten thiết kế Lựa chọn cấu higravenh caacutec đối tượng nhằm thoả matilden một số ragraveng buộc nagraveo đoacute

6 Giảng dạy Phần mềm dạy học coacute thể chuẩn đoaacuten vagrave sủa lỗi của học sinh trong quaacute trigravenh học tập

Để xaacutec định đuacuteng bagravei toaacuten magrave chuacuteng ta cần giải quyết thigrave phải trả lời đc một số cacircu hỏi

- cần hệ chuyecircn gia

Bước 2 thu thập tri thức lựa chọn cocircng cụ vagrave aacutep dụng

Trong bước thu thập tri thức vấn đề quan trọng lagrave lựa chọn chuyecircn gia những người magrave sẽ đoacuteng goacutep tri thức cho hệ thống Thocircng thường trong suốt quaacute trigravenh phaacutet triển thigrave chuyecircn gia được xem như một thagravenh viecircn của đội phaacutet triển

Hiện nay coacute rất nhiều cocircng cụ để xacircy dựng một hệ chuyecircn gia Phổ biến nhất lagrave JESS CLIPS vagrave OPS5

Bước 3 Thiết kế cơ sở tri thức thiết kế hệ thốngTri thức được biểu diễn trường minh trong cơ sở tri thức

Caacutec chuyecircn gia vagrave kỹ sư tri thức sẽ đối thoại với nhau bằng caacutec kỹ thuật đối thoại Suy diễn (SD) bảng Mocirc higravenh hoacutea SD quy nạp phacircn loại

Vấn đề bagraveo trigrave vagrave phaacutet triển

Caacutec hệ chuyecircn gia đogravei hỏi phải bảo trigrave vagrave phaacutet triển nhiều hơn so với caacutec hệ thống khaacutec Phải thường xuyecircn bổ sung tri thức mới vagrave thay đổi caacutec tri thức cũ để đổi mới hệ chuyecircn gia

Thu thập vagrave khắc phục lỗi do người sử dụng phaacutet hiện để kịp thời khắc phục những sai soacutet của hệ chuyecircn gia

75 Lợi iacutech vagrave hạn chế của caacutec hệ chuyecircn gia

Một số lợi iacutech chiacutenh

Thời gian trả lời hợp lyacute bằng hoặc nhanh hơn so với chuyecircn gia (người) để đi đến cugraveng một quyết định Hệ chuyecircn gia lagrave một hệ thống thời gian thực (real time system)

Khả năng trả lời với mức độ tinh thocircng bằng hoặc cao hơn so với chuyecircn gia (người) trong cugraveng lĩnh vực

Hệ chuyecircn gia giuacutep cho hiệu quả lagravem việc tăng bằng việc sử dụng tập caacutec luật một caacutech nhanh choacuteng magrave ko bị nhầm lẫn chuyecircn gia lagrave người coacute thể quecircn đi một số tri thức cơ sở lyacute luậ nhưng HCG thigrave ko

Quyết định của một người chuyecircn gia coacute thể bị thay đổi vagrave ko coacute tiacutenh thống nhất như quyết định của một hệ chuyecircn gia tạo ra

Hệ chuyecircn gia giuacutep cho người sử dụng coacute thể trau dồi sự hiểu biết trecircn lĩnh vuej cụ thể magrave noacute giải quyết hỗ trợ người ra quyết định coacute trigravenh độ như 1 chuyecircn gia trong quaacute trigravenh gia quyết định

Kiến thức của rất nhiều chuyecircn gia về một lĩnh vực nagraveo đoacute được đưa vagraveo hệ chuyecircn gia lagravem cho CSTT cuat HCG phong phuacute vagrave rộng lớn hơn rất nhiều

HCG giải thiacutech caacutec bước suy luận một caacutech dễ hiểu nhất quaacuten luacutec nagraveo cũng coacute thể sử dụng ko như chuyecircn gia con người

Hạn chế của caacutec hệ chuyecircn gia

Nhược điểm lớn nhất của hệ chuyecircn gia lagrave những yacute kiến chuyecircn mocircn thường rất khoacute matilde hoacutea vagrave giải neacuten

Hệ chuyecircn gia khocircng coacute khả năng tự học tự cập nhật kiến thức mới như caacutec chuyecircn gia magrave cần phải được matilde hoacutea lại khi noacute được cập nhật

Hệ chuyecircn gia khocircng thể nhận ra được vấn đề khocircng nằm trong miền kiến thức của hệ thống

Chương 8 Tri thức vagrave tiếp nhận

1 Bao gồm caacutec vấn đề

Dữ liệu thực tế đo lường hoặc quan saacutet coacute hoặc khocircng coacute bối cảnh

Thocircng tin dữ liệu được tổng hợp một caacutech hữu iacutech để giải quyết những khoacute khăn trong việc đưa ra quyết định

Tri thức bao gồm caacutec ứng dụng quy tắc thocircng tin hướng dẫn của người ra quyết định

2 Những caacutei nhigraven về tri thức

Đại diện lagravem thế nagraveo để diễn tả tri thức viacute dụ như một quyển saacutech khocircng phải lagrave tri thức nhưng noacute lại lagrave một đại diện của tri thức

Sản xuất tri thức lagrave một tập hơp của hagraveng tồn kho coacute thể được sản xuất cũng như mua lại

Tri thức lagrave 1 trong 6 trạng thaacutei của hệ thống

1Dữ liệu 2Thocircng tin 3Cấu truacutec thocircng tin 4Sự thấu hiểu 5Yacute kiến 6 Quyết định

3 Caacutec loại tri thức Phổ biến mocirc tả dữ liệu thocircng tin thủ tục mọi thứ lagravem như thế nagraveo lập luận chiacutenh saacutech hoặc caacutec quy tắc

4 Thu thập Tri thức hệ chuyecircn gia Hầu hết caacutec phương phaacutep đều bắt đầu với mocirc higravenh của caacutec taacutec vụ trong đoacute

hệ chuyecircn gia được xacircy dựng Trong đoacute mocirc tả về caacutec lĩnh vực được tạo ra Caacutec kỹ sư sử dụng caacutec mocirc higravenh giả thuyết vagrave nhận thức về quaacute trigravenh phacircn

tiacutech để gợi ra caacutech giải quyết vấn đề về tri thức từ caacutec chuyecircn gia

5 Caacutec chiều của thu thập tri thức KE- driven caacutec kỹ sư trao đổi trực tiếp với caacutec chuyecircn gia Expert-driven Caacutec chuyecircn gia trực tiếp đưa chuyecircn mocircn của họ vagraveo hệ

thống maacutey tiacutenh Machine-driven Sử dụng caacutec cocircng cụ suy luận để triacutech xuất tri thức từ một

tập caacutec viacute dụ

6 Kỹ thuật thu thập tri thức Trao đổi gồm 2 loại cơ bản lagrave coacute cấu truacutec(coacute kịch bản) vagrave khocircng coacute cấu

truacutec( đối thoại trực tiếp) Giao thức phacircn tiacutech bằng lời Khi caacutec chuyecircn gia thực hiện một cocircng việc

của họ thigrave một bản ghi về cocircng việc đoacute được thực hiện Caacutec kỹ sư sẽ xacircy dựng mocirc higravenh cho những gigrave được ghi lại trong bản ghi

Phương phaacutep sagraveng lọc caacutec chuyecircn gia so saacutenh caacutec nhoacutem liecircn tiếp trong ba đối tượng vagrave cho biết tại sao nhoacutem thứ hai lại khaacutec nhoacutem thứ ba

7 Thu thập tri thức từ nhiều nguồn Thu thập tri thức từ nhiều nguồn lagrave cần thiết để coacute được đầy đủ caacutec tri thức

cho một vấn đề quan điểm yacute kiến traacutei ngược nhau thường phaacutet sinh Phương phaacutep đồng thuận sẽ giuacutep giải quyết được vấn đề macircu thuẫn Kỹ thuật phacircn tiacutech Meta lagrave kỹ thuật được aacutep dụng trong caacutec trường hợp

khaacutec Caacutech tiếp cận bằng định lượng đogravei hỏi caacutec kỹ sư cần cacircn nhắc yếu tố đầu vagraveo của caacutec chuyecircn gia khaacutec nhau

8 Xaacutec nhận hợp lệ vagrave kiểm tra tri thức Một khi thu thập tri thức noacute phải được đaacutenh giaacute về khả năng sử dụng vagrave độ

chiacutenh xaacutec Hai vấn đề cụ thể lagrave hiệu lực của những kiến thức vagrave kiểm tra việc xacircy dựng cơ sở của tri thức

Cần xaacutec nhận xem liệu hệ thống coacute thể hoạt động ở mức độ tối thiểu khocircng

Xaacutec minh liecircn quan đến việc so saacutenh từng chi tiết kỹ thuật của hệ thống những gigrave đatilde được thực hiện cuối cugraveng

9 Một số caacutec biện phaacutep xaacutec nhận Độ chiacutenh xaacutec Khả năng thiacutech nghi Mức độ đầy đủ Bề rộng Độ sacircu Hiệu lực Tổng quan Chiacutenh xaacutec Hiện thực Độ tin cậy Tiacutenh hữu dụng Mức độ

Chương 9 Học maacutey

1 Logic mờ vagrave ngocircn ngữ mờ(Fuzzy Logic and Linguistic Ambiguity)

Ngocircn ngữ tự nhiecircn gồm những khaacutei niệm mơ hồ vagrave khocircng chiacutenh xaacutectruyền tải ngữ nghĩa thocircng qua tiacutenh xấp xỉkhocircng rotilde ragraveng

Những xấp xỉ nagravey giuacutep con người coacute thể truyền tải hết được yacute nghĩa nhưng maacutey thigrave khocircng hiểu

Lagravem sao biểu diễn caacutec tri thức sử dụng caacutec khaacutei niệm khocircng rotilde ragraveng(mờ) hoặc khocircng chiacutenh xaacutec

2 Khaacutei niệm cơ bản của logic mờ tập mờ lagrave những tập hợp khocircng coacute một giới hạn rotilde Mỗi phần tử của noacute chỉ

chứa một mức độ hagravem liecircn thuộc của từng phần tử Vigrave vậy tập mờ khocircng giống như tập cổ điển Tập mờ coacute thể kết hợp với nhau qua những luật mờ magrave đặc trưng cho những hagravenh động trạng thaacutei vagrave thuộc tiacutenh của logic mờ được tận dụng khi thực hiện một bộ điều khiển mờ

Logic mờ dựa trecircn yacute tưởng mỗi phần tử thuộc vagraveo một tập hợp ở một mức độ nagraveo đấy

Locircgic mờ cho pheacutep độ liecircn thuộc (microA )coacute giaacute trị trong khoảng (01) Locircgic mờ coacute thể được coi lagrave mặt ứng dụng của lyacute thuyết tập mờ để xử lyacute caacutec

giaacute trị trong thế giới thực cho caacutec bagravei toaacuten phức tạp

3 So saacutenh tiacutenh đuacuteng đắn logic mờ vagrave xaacutec suất Xaacutec suất thigrave đề cập đến khả năng xảy ra một biến cố hay một điều gigrave đoacute Logic mờ đề cập đến cấp độ magrave đặc tiacutenh ở hiện tại

o viacute dụ1 người coacute chiều cao 6 feet thigrave coacute cấp độ lagrave 05 về chiều cao

4 Ưu điểm của logic mờ Caacutech tiếp cận rất tự nhiecircnkhocircng phức tạp Coacute thể mocirc higravenh hoacutea caacutec hagravem phi tuyến tugravey yacute phức tạp

Coacute thể tận dụng được kinh nghiệm từ những chuyecircn gia hagraveng đầu trong mọi lĩnh vực

Logic mờ được xacircy dựng dựa trecircn ngocircn ngữ tự nhiecircnNền tảng của logic mờ lagrave dựa trecircn cơ sở giao tiếp của con người

5 Nhược điểm của logic mờ Trong 1 hệ thống phức tạpsử dụng logic mờ coacute thể trở thagravenh trở ngại cho

việc xaacutec thực độ tin cậy của hệ thống Cơ chế lập luận mờ khocircng thể học hỏi từ những lỗi sai

6 Mạng noron nhacircn tạo(ANN) Mạng noron nhacircn tạo lagrave một mocirc phỏng xử lyacute thocircng tinđược nghiecircn cứu ra

từ hệ thống thần kinh của sinh vậtgiống như bộ natildeo để xử lyacute thocircng tin ANNs lagrave chương trigravenh dựa trecircn maacutey tiacutenh đơn giản coacute chức năng lagrave một mocirc

higravenh bagravei toaacuten khocircng gian dựa trecircn thử nghiệm vagrave baacuteo lỗi

7 Học từ kinh nghiệm Tiến trigravenh Một mẫu dữ liệu được biểu diễn như một mạng lưới noronANN ldquodự

đoaacutenrdquo 1 đầu radự đoaacuten được so saacutenh với giaacute trị thực tế hoặc giaacute trị chiacutenh xaacutecNếu đoaacuten được chiacutenh xaacutec thigrave khocircng coacute hagravenh động nagraveo được thực hiện

Nếu dự đoaacuten sai ANN kiểm tra lại vagrave xaacutec định lại thocircng số để điều chỉnh Một mẫu dữ liệu khaacutec được biểu diễn vagrave quaacute trigravenh nagravey được lặp lại

8 Nguyecircn tắc cơ bản của cocircng nghệ nơron Caacutec yếu tố xử lyacute cơ bản trong hệ thống thần kinh của con người lagrave tế bagraveo

thần kinhMạng lưới của tế bagraveo nagravey lagrave liecircn kết với nhau nhận được thocircng tin từ caacutec cảm biến trong mắt taihellip

Thocircng tin nhận được bởi tế bagraveo thần kinh hoặc lagrave sẽ kiacutech thiacutech noacute(sẽ được chuyển qua 1 thocircng điệp dọc theo mạng lưới) hoặc lagrave sẽ ngăn cản noacute(ngăn cản dograveng thocircng tin)

Độ nhạy coacute thể thay đổi qua thời gian hoặc sau khi coacute được kinh nghiệm

9 Cấu truacutec mạng Một ANN gồm 3 lớp cơ bản

Lớp đầu vagraveo nhận dữ liệu Lớp becircn trong hoặc lagrave lớp ẩn xử lyacute dữ liệu Lớp đầu ra chuyển tiếp kết quả cuối cugraveng của mạng

10Mạng nơ ron Thường coacute nhiều đầu vagraveo mỗi đầu vagraveo với mức ảnh hưởng vagrave tầm quan

trọng riecircng của noacute Một đầu vagraveo quan trọng coacute thể được sử dụng để khuếch đại đầu ra caacutec hagravem trạng thaacutei tổng hợp caacutec trọng số của caacutec yếu tố

đầuvagraveo khaacutec nhauvagraveo một giaacute trị duy nhất Caacutec hagravem chuyển giao xử lyacute caacutec giaacute trị trạng thaacutei vagrave tạo đầu ra

11Huấn luyện mạng nơ ron Trong mocirc higravenh coacute giaacutem saacutetANN được đến so saacutenh dự đoaacuten của chiacutenh

noacute với thocircng tin phản hồi coacute chứa caacutec kết quả mong muốn ANN sẽ phải tigravem caacutech thay đổi caacutec tham số becircn trong củamigravenh (caacutec trọng số vagrave caacutec ngưỡng) để tạo necircn một aacutenh xạ coacute khả năng aacutenh xạcaacutec đầu vagraveo thagravenh caacutec đầu ra mong muốn Sự thay đổi nagravey được tiến hagravenh nhờ việc so saacutenh giữa đầu ra thực sự vagrave đầu ra mong muốn

Trong mocirc higravenh khocircng coacute giaacutem saacutetANN nhận được dữ liệu vagraveo nhưng khocircng phải coacute bất kỳ thocircng tin phản hồi về kết quả mong muốn

Phần lớn caacutec ứng dụng nằm trong vugraveng của caacutec bagravei toaacuten ước lượng như mocirc higravenh hoacuteathống kecirc neacuten lọc phacircn cụm

12Lợi iacutech Liecircn kết với mạng noron Traacutenh caacutech lập trigravenh tường minh Giảm nhu cầu của chuyecircn gia ANNs thigrave thiacutech nghi với caacutec yếu tố đầu vagraveo thay đổi Khocircng cần thiết cho cơ sở tri thức tinh chế ANNs coacute tiacutenh động vagrave cải thiện với việc sử dụng Coacute khả năng xử lyacute dữ liệu khocircng chiacutenh xaacutec hoặc khocircng đầy đủ Cho pheacutep tổng quaacutet hoacutea từ thocircng tin cụ thể Cho pheacutep thu thập cảm giaacutec thocircng thường vagraveo miền giải quyết vấn đề

13Hạn chế của việc liecircn kết với mạng noron ANNs khocircng thể giải thiacutech được suy luận Bản chất hộp đen thường khiến cho vấn đề traacutech nhiệm vagrave độ tin cậy phaacutet

sinh lagrave khoacute khăn Lặp đi lặp lại quaacute trigravenh huấn luyện rất tốn thời gian Nguồn lực caacutec nhagrave phacircn tiacutech vagrave thiết kế coacute tay nghề cao vẫn lagrave đaacuteng lo

ngại Cocircng nghệ ANN thuacutec đẩy hạn chế của phần cứng hiện tại ANN yecircu cầu phải coacute sự tin tưởng ở đầu ra

14Giới thiệu về thuật toaacuten di truyền Cũng như mạng lưới thần kinh caacutec thuật toaacuten di truyền được dựa trecircn lyacute

thuyết sinh học Thuật toaacuten di truyền tigravem thấy nguồn gốc của chuacuteng trong caacutec lyacute thuyết

tiến hoacutea của chọn lọc tự nhiecircn vagrave thiacutech ứng với biến đổi khiacute hậu Kết quả thuật toaacuten di truyền lagrave từ giao phối 2 caacute thể trong quần thế để tạo

ra con caacutei đocirci khi tốt hơn so với bậc cha mẹ của chuacuteng 15Caacutec thagravenh phần cơ bản của thuật toaacuten di truyền

Toaacuten tử chọn lọc Caacutec caacute thể tốt được chọn lọc để đưa vagraveo thế hệ sau Sự chọn lọc nagravey căn cứ vagraveo độ thiacutech nghi với mocirci trường của mỗi caacute thể

Toaacuten tử lai gheacutep (crossover) Hai caacute thể cha vagrave mẹ trao đổi caacutec gen với nhau để tạo ra caacute thể con

Toaacuten tử đột biến (mutation) Một caacute thể thay đổi một số gen để biến đổi thagravenh một caacute thể mớiTất cả caacutec toaacuten tử trecircn khi thực hiện đều mang tiacutenh ngẫu nhiecircn

16Quaacute trigravenh cơ bản của một thuật toaacuten di truyền Khởi tạo

Đaacutenh giaacute quần thể

Lựa chọn NST thiacutech hợp nhất vagrave loại bỏ NST yếu nhất

Quy trigravenh giao nhau vagrave cải thiện quần thể

đột biến tiến trigravenh để khaacutem phaacute ra NST mới

17Ưu nhược điểm của việc kết hợp với thuật toaacuten di truyền Kiacutech thước quần thể lagrave 1 yếu tố quan trọng trong tốc độ của việc tigravem

kiếmnhưng noacute tương đối dễ dagraveng để dự đoaacuten tốc độ nagravey Giao nhau hoặc đột biến lagrave khocircng necircn đc sử dụng quaacute thường xuyecircn Luocircn coacute được iacutet nhất 1 giải phaacutep hợp lyacute Necircn coacute thể aacutep dụng chuacuteng cho caacutec vấn đề magrave chuacuteng ta khocircng coacute hướng

về caacutech giải quyết Sức mạnh của thuật toaacuten xuất phaacutet từ khaacutei niệm đơn giảnkhocircng phải từ

một thủ tục thuật toaacuten phức tạp 18Tương lai của học maacutey

Mạng lưới thần kinh nhacircn tạo vượt quaacute năng lực của con người trong caacutec trường hợp bị cocirc lập

Về mặt lyacute thuyếtmột maacutey tiacutenh coacute thể xử lyacute dũ liệu nhanh hơn hagraveng triệu lần so với 1 con người

May mắn thay cho chuacuteng tacon người tốt hơn nhiều khi magrave coacute được dữ liệumaacutey tiacutenh khocircng coacute 1 số thứ như lagrave 5 giaacutec quan

CHƯƠNG 10 KHO DỮ LIỆU

1 Kho dữ liệu Kho dữ liệu lagrave tuyển tập caacutec cơ sở dữ liệu tiacutech hợp hướng chủ đề được

thiết kế để trợ giuacutep cho một hệ hỗ trợ quyết định

Theo John Ladley Cocircng nghệ kho dữ liệu lagrave tập caacutec phương phaacutep kỹ thuật vagrave caacutec cocircng cụ coacute thể kết hợp hỗ trợ nhau để cung cấp thocircng tin cho người sử dụng trecircn cơ sở tiacutech hợp từ nhiều nguồn dữ liệu nhiều mocirci trường khaacutec nhau

Kho dữ liệu thường rất lớn tới hagraveng trăm GB hay thậm chiacute hagraveng Terabyte

2 Kho dữ liệu vận hagravenh (ODS) Một kho dữ liệu vận hagravenh Aacutep dụng kỹ thuật kho dữ liệu vagraveo caacutec hệ xử

lyacute giao taacutec lưu trữ dữ liệu cho một ứng dụng đặc thugrave Noacute đưa vagraveo kho dữ liệu một dograveng caacutec dữ liệu thocirc được thiết kế

3 So saacutenh

Kho dữ liệu vận hagravenh Kho dữ liệu

Dữ liệu theo chủ đề Dữ liệu theo chủ đề

Dữ liệu tiacutech hợp Dữ liệu tiacutech hợp

Dữ liệu thay đổi Dữ liệu khocircng thay đổi

Dữ liệu được cập nhật khi thay đổi

Dữ liệu giữ nguyecircn

Chỉ coacute dữ liệu hiện tạiDữliệu hiện tại vagrave dữ liệu lịch sử

Chu kỳ lagravem tươi dữ liệu ngắn Chu kỳ lagravem tươi dữ liệu dagravei

Chỉ coacute dữ liệu chi tiết Dữ liệu chi tiết vagrave dữ liệu tổng kết

Dugraveng cho caacutec quyết định ngắn hạn

Dugraveng cho hoạch định dagravei hạn

4 Kho dữ liệu cục bộ (Data Mart - DM)

Kho dữ liệu cục bộ lagrave CSDL coacute những đặc điểm giống với kho dữ liệu nhưng với quy mocirc nhỏ hơn vagrave lưu trữ dữ liệu về một lĩnh vực một chuyecircn ngagravenh

Data mart phụ thuộc Chứa những dữ liệu được lấy từ DW vagrave những dữ liệu nagravey sẽ được triacutech lọc vagrave tinh chế tiacutech hợp lại ở mức cao hơn để phục vụ một chủ đề nhất định của Datamart

Data mart độc lập Khocircng giống như Datamart phụ thuộc Data mart độc lập được xacircy dựng trước DW vagrave dữ liệu được trực tiếp lấy từ caacutec nguồn khaacutec nhau

5 Siecircu dữ liệu Metadata lagrave dữ liệu để mocirc tả dữ liệu Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột

một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi Metadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu

6 Mocirci trường kho dữ liệu Hệ thống của tổ chức vagrave kho cung cấp dữ liệu để xacircy dựng kho dữ liệu Trong quaacute trigravenh chuyển dữ liệu từ caacutec nguồn khaacutec nhau dữ liệu coacute thể

được lagravem sạch hoặc chuyển đổi vagrave vigrave thế DW được xem như lagrave một chuẩn cho việc lưu trữ

Đồng thời siecircu dữ liệu được ghi lại Cuối cugraveng DW hoặc siecircu thị coacute thể được sử dụng để tạo ra một kho dữ

liệu ldquocaacute nhacircnrdquo 7 Caacutec đặc điểm của kho dữ liệu

Đặc điểm Mocirc tả

Hướng chủ đề - DL tổ chức theo caacutech thức người dugraveng tham chiếu

Tiacutech hợp - Dữ liệu ldquosạchrdquo loại bỏ tiacutenh thiếu nhất quaacuten

Khocircng thay đổi - DL ldquochỉ đọcrdquo người dugraveng khocircng thay đổi được

Chuỗi thời gian - DL lagrave chuỗi thời gian khocircng phải lagrave trạng thaacutei hiện tại

Được tổng kết - DL vận hagravenhthao taacutec khi cần thiết

được kết hợp lại thagravenh dạng coacute thể dugraveng được cho quyết định

Kiacutech cỡ lớn hơn - Lưu giữ theo chuỗi thời gian tức lagrave giữ lại nhiều DL

Khocircng được chuẩn hoacutea - Coacute thể dư thừa DLSiecircu dữ liệu - Dữ liệu của dữ liệu được lưu trữNguồn dữ liệu - DL vận hagravenh (caacutec hệ sẵn coacute) cugraveng

với caacutec nguồn ngoagravei 8 Kho dữ liệu hướng chủ đề

Hướng chủ để coacute nghĩa lagrave kho dữ liệu được tổ chức xung quanh caacutec chủ đề chiacutenh như khaacutech hagraveng sản phẩm sản xuất Tập trung vagraveo việc mocirc higravenh hoacutea vagrave phacircn tiacutech dữ liệu cho caacutec nhagrave ra quyết định magrave khocircng tập trung vagraveo caacutec xử lyacute thocircng thường Cung cấp cho người dugraveng một khung nhigraven toagraven vẹn đơn giản vagrave đầy đủ về caacutec sự kiện quanh caacutec chủ đề

9 Dữ liệu trong DW được tiacutech hợp Dữ liệu trong kho dữ liệu được xacircy dựng bằng caacutech tổng hợp dữ liệu từ

nhiều nguồn khaacutec nhau vagrave caacutec nguồn coacute tổ chức khaacutec nhau Cơ sở dữ liệu caacutec file excel caacutec flat file hoặc caacutec raw file Khi đưa vagraveo kho dữ liệu caacutec dữ liệu được lagravem sạch vagrave tiacutech hợp dữ liệu nhằm đảm bảo tiacutenh nhất quaacuten của dữ liệu

10Kiến truacutec kho dữ liệu Tầng cơ sở dữ liệu hoạt động Tầng truy xuất thocircng tin Tầng truy xuất dữ liệu Tầng siecircu dữ liệu Tầng quản lyacute tiến trigravenh Tầng thocircng điệp của ứng dụng Tầng vật liacute của kho dữ liệu Tầng trigravenh diễn dữ liệu

11Higravenh trạng kho dữ liệu Kho dữ liệu ảo - người dugraveng cuối coacute thể truy cập trực tiếp đến kho dữ liệu

sử dụng caacutec cocircng cụ cho pheacutep ở tầng truy xuất dữ liệu Kho dữ liệu trung tacircm-1 cơ sở dữ liệu vật lyacute chứa tất cả dữ liệu cho một

vugraveng chuyecircn dụng nagraveo đoacute

Kho dữ liệu phacircn taacuten- Thagravenh phần được phacircn taacuten qua nhiều hệ cơ sở dữ liệu vật lyacute

12METADATA- Siecircu dữ liệu Định nghĩa Siecircu dữ liệu lagrave dữ liệu về dữ liệu Lagrave 1 lưu trữ dugraveng để

Miecircu tả kho dữ liệu tổng thể Nhận dạng kiểu kho dữ liệu Quản liacute quaacute trigravenh tiacutech hợp dữ liệu Quản liacute quaacute trigravenh cập nhật kho dữ liệu Quản liacute bảo mật

Lagrave chigravea khoacutea quyết định sự thagravenh cocircng của kho dữ liệu luocircn được thay đổi vagrave cập nhật theo sự phaacutet triển của kho dữ liệu

Dugraveng để quản liacute điều khiển kho dữ liệu Sự ra đời của kho dữ liệu như 1 cấu truacutec hỗ trợ ra quyết định siecircu dữ liệu

được xem như nguồn tagravei nguyecircn dữ liệu Siecircu dữ liệu lagrave trừu tượng Chuacuteng lagrave dữ liệu bậc cao cung cấp mocirc tả ngắn

gọn caacutec dữ liệu bậc thấp hơn 13Hoạt động của Siecircu dữ liệu

Siecircu dữ liệu rất cần thiết trong việc chuyển hoacutea thocircng tin trở thagravenh tri thức Lagrave chigravea khoacutea giuacutep chuacuteng ta xử lyacute được dữ liệu thocirc Viacute dụ một dograveng dữ liệu baacuten hagraveng 1023 K596 11121 agraveNoacute sẽ khocircng coacute nghĩa gigrave cho đến khi chuacuteng ta đưa vagraveo siecircu dữ liệu (thư

mục chứa dữ liệu) agrave cửa hagraveng 1023 sản phẩm K596 vagrave số tiền baacuten được lagrave 11121 đocirc la

14Sự cần thiết phải nhất quaacuten trong kho dữ liệu Kho dữ liệu được xacircy dựng cho lợi iacutech của những nhagrave phacircn tiacutech kinh

doanh caacutec nhagrave quản trị cho tất cả caacutec khu vực chức năng Trong cơ sở dữ liệu riecircng caacutec khu vực khaacutec nhau coacute thể định nghĩa vagrave lưu

trữ dữ liệu thocircng qua phiecircn bản của chiacutenh noacute Khi dữ liệu được lấy từ những vugraveng khaacutec nhau đoacute vagrave được đặt vagraveo kho dữ

liệu Việc chuyển đổi vagrave lagravem sạch caacutec tiến trigravenh sẽ đảm bảo noacute lagrave duy nhất được tiacutech hợp tại một mức của tổ chức

15Ragrave soaacutet lại dữ liệu ndash Thực thi siecircu dữ liệu

Bất kể cấu truacutec tự nhiecircn của 1 cacircu truy vấn thế nagraveo thigrave caacutec thagravenh phần của siecircu dữ liệu rất quan trọng đối với người ra quyết định

Bảng thuộc tiacutenh khoacutea được lưu trữ bởi kho dữ liệu Tập hợp dữ liệu được lấy từ đacircu Những chuyển đổi nagraveo được thực thi với việc lagravem sạch

16Siecircu dữ liệu lagrave gigrave Metadata - lagrave thocircng tin mocirc tả nội dung của cơ sở dữ liệu (CSDL) Metadata baacuteo cho người dugraveng biết thời gian cập nhật sau cugraveng của dữ liệu

định dạng vagrave mục điacutech sử dụng của noacute Những thocircng tin nagravey coacute thể hướng dẫn người dugraveng duyệt qua CSDL vagrave

giuacutep họ hiểu được yacute nghĩa vagrave ngữ cảnh của dữ liệu Trong CSDL metadata lagrave caacutec dạng biểu diễn khaacutec nhau của caacutec đối tượng

trong CSDL Trong CSDL quan hệ metadata lagrave caacutec định nghĩa của bảng cột CSDL

view vagrave nhiều đối tượng khaacutec Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột

một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi -gtMetadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu

Bảng chuyển đổi Ghi lại những chuyển đổi đatilde được thực hiện

Lịch sử thực thi Ghi lại những dữ liệu đatilde được

phacircn tiacutech

Higravenh thaacutei kết nốiGhi lại những dữ liệu được kết nối vagrave tần suất

17Aacutenh xạ thocircng thường của siecircu dữ liệu Bản ghi aacutenh xạ chuyển đổi bao gồm

Định danh của nguồn gốc Chuyển đổi thuộc tiacutenh Chuyển đổi thuộc tiacutenh vật lyacute Matilde hoacutea tham chiếu bảng chuyển đổi Đổi tecircn Đổi khoacutea Gaacuten giaacute trị cho thuộc tiacutenh mặc định Chọn logic cho caacutec nguồn nhiều giaacute trị Đổi thuật toaacuten

18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để

phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai

lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave

tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec

Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm

Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo

19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua

caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau

SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được

Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra

một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức

Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ

Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ

Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech

CHƯƠNG 11 KHAI PHAacute DỮ LIỆU

1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn

ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993

Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng

2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd

1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều

2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP

3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn

4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng

5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server

6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo

7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động

8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời

9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều

10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện

11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech

12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP

3 Xử lyacute phacircn tiacutech trực tuyến OLAP

MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave

dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu

ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave

thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu

HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave

ROLAP4 Khai phaacute dữ liệu

Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh

khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn

Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan

5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp

6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại

Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp

Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec

Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt

Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra

Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh

vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho

Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec

Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm

Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục

Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng

gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp

Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn

Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec

Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper

Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2

Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25

Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước

Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng

Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện

trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp

Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute

độ hỗ trợ ge ngưỡng minsup

độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan

Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn

Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết

Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu

MOLAP ROLAP HOLAP

Lưu trữ dữ liệu cơ sở

Khối Bảng quan hệ Bảng quan hệ

Lưu trữ thocircng tin tổng hợp

Khối Bảng quan hệ Khối

Hiệu suất thực hiện truy vấn

Nhanh nhất Chậm nhất Nhanh

Tiecircu thụ khocircng gian lưu trữ

Nhiều Thấp Trung bigravenh

Chi phiacute bảo trigrave Cao Thấp Trung bigravenh

Page 21: De cuong(1-11)

liecircn quan tới caacutec cocircng việc coacute thể lagravem thay đổi đaacuteng kể caacutech thức hoạt động của tổ chức Tuyvậy đa số caacutec yếu tố thực thi đều liecircn quan tới hệ thống thocircng tinThực thi MSS lagrave quaacute trigravenh liecircn tục diễn ra trong suốt thời gian phaacutet triển hệ thống từ đề xuấtban đầu đến nghiecircn cứu khả thi thiết kế vagrave phacircn tiacutech hệ thống lập trigravenh huấn luyện chuyểnđổi vagrave lắp đặt Caacutec chuyecircn gia hệ thống thocircng tin thường gọi thực thi lagrave giai đoạn cuối trongvograveng đời hệ thống Định nghĩa thực thi MSS phức tạp hơn vigrave bản chất lặp của sự phaacutet triểncaacutec hệ thống

THỰC THI KHOcircNG HOAgraveN CHỈNHCaacutec quyết định về tiacutenh khả thi thường coacute giả định về lợi iacutech đạt được khi kế hoạch thực thiđược thực hiện hoagraven toagraven Trong thực tế thường chỉ thực hiện 90 thậm chiacute 70 phần trăm sovới phacircn tiacutech khả thi Lyacute do lagrave sự thay đổi tại một nơi trong hệ thống coacute thể ảnh hưởng vagrave coacutethể taacutec động tiecircu cực đến chỗ khaacutec Do vậy cấp quản lyacute coacute thể bỏ những phần trong dự aacuten coacutethể gacircy ra taacutec động xấu Do đoacute dự aacuten sẽ thực hiện iacutet hơn 100 so với dự aacuten kế hoạch Caacutec lyacutedo khaacutec coacute thể lagrave do khấu trừ ngacircn saacutech hoặc vượt chi phiacuteĐAacuteNH GIAacute SỰ THAgraveNH COcircNG CỦA THỰC THI HỆ THỐNGPhải coacute caacutec chỉ số đo lường thigrave mới coacute thể đaacutenh giaacute sự thagravenh cocircng khi thực thi một hệ thốngDickson va Powers (1973) đề ra 5 tiecircu chuẩn độc lậpbull Tỷ lệ thời gian thực hiện dự aacuten với thời gian ước lượngbull Tỷ lệ chi phiacute thực tế vagrave ngacircn saacutech thực hiệnbull Thaacutei độ của cấp quản lyacute đối với hệ thốngbull Nhu cầu thocircng tin của caacutec nhagrave quản lyacute được đaacutep ứng như thế nagraveo qua hệ thốngbull Taacutec động của dự aacuten đối với những hoạt động maacutey tiacutenh trong cocircng tyCaacutec đo lường khaacutec để đaacutenh giaacute thagravenh cocircng của hệ hỗ trợ quản lyacute (MSS)bull Sự sử dụng hệ thống (dự định dugraveng hoặc thực sự dugraveng)bull Thỏa matilden của người dugravengbull Thaacutei độ taacuten thagravenhbull Mức độ hệ thống hoagraven thagravenh caacutec mục tiecircu ban đầubull Phần thưởng đối với tổ chức (giảm chi phiacute tăng doanh thuhellip)bull Tỷ số lợi iacutech chi phiacute

bull Mức độ thể chế hoacutea của MSS trong tổ chứcDo bởi tiacutenh đa dạng của DSS necircn việc đaacutenh giaacute sự thagravenh cocircng của hệ nagravey cũng khoacute khăn tuynhiecircn cũng coacute thể coacute một số yếu tố giuacutep cho DSS thagravenh cocircng như sự tham gia người dugravenghuấn luyện người dugraveng hỗ trợ quản lyacute cấp cao nguồn thocircng tin đặc điểm của những nhiệmvụ coacute liecircn quan (cấu truacutec bất định độ khoacute phụ thuộc)

Chương5Nhoacutem hỗ trợ quyết định vagrave nhoacutemcocircng nghệ phần mềm

51Nhoacutem tạo quyết định

MDM-Holsapple đatilde gợi yacute chuacuteng ta sử dụng giới hạn người tạo quyết định

Một nhoacutem lagrave kết cấu MDM nơi magrave nhiều người ra quyết định hoagraven toagraven tương taacutec

Một đội lagrave kết cấu MDM nơi caacutec thagravenh viecircn tư vấn cho người đưa ra quyết định nhưng khocircng tương taacutec

Một Ủy ban lagrave kết cấu MDM với một người tạo quyết định duy nhất vagrave sự tương taacutec giữa caacutec thagravenh viecircn

Mạng thocircng tin

Mạng lưới baacutenh xe mỗi người tham gia coacute thể giao tiếp với người đưa ra quyết định ở trung tacircm nhưng khocircng phải với người tham gia khaacutecCấu truacutec nagravey lagrave khocircng thỏa matilden tất cả những người tham gia ngoại trừ người ra quyết định

Mạng dacircy chuyền Tham gia chuyển tiếp thocircng tin chỉ để noacute luocircn liền kề nhau trong chuỗi

Thagravenh viecircn cuối cugraveng ko được đaacutep ứng

Mạng vograveng trograven Tương tự như chuỗi nhưng kết thuacutec được kết nối

Mạng kết nối hoagraven toagraven khocircng coacute hạn chế về giao tiếp vagrave tương taacutec giữa caacutec thagravenh viecircnNoacutei chungnoacute đaacutep ứng hầu hết caacutec kết nối của người tham gia nhưng truyền đạt thocircng tin mất nhiều thời gian vagrave coacute nhiều cơ hội xảy ra lỗi

Nhoacutem hagravenh vi vagrave chuẩn mực

MDMs thiết lập caacutec chỉ tiecircu hướng dẫn quaacute trigravenh ra quyết định

Một chuẩn mực quy định cụ thể những gigrave thagravenh viecircn trong nhoacutem dự kiến sẽ lagravem trong những hoagraven cảnh nhất định

Quy tắc gửi coacute thể được thocircng qua viacute dụ đaacutenh giaacute ngang hagraveng hoặc xử phạt

Lagravem thế nagraveo để đưa ra quyết định

Việc chọn lựa magrave trong đoacute việc sử dụng cấu truacutec MDM phải được dựa trecircn một số yếu tố liecircn quan với bối cảnh quyết định

Viacute dụmột cấu truacutec riecircng lẻ sẽ lagravem việc nơi magrave quyết định được cấu truacutec cao vagrave thocircng tin lagrave coacute sẵn

Một ủy ban cơ cấu sẽ lagrave sự lựa chọn khi người ra quyết định khocircng thể đưa ra quyết định một migravenh

52Caacutec vấn đề thường gặp trong nhoacutem

Kiacutech thước Noacutei chung sự nhất triacute vagrave gắn kết giữa caacutec thagravenh viecircn tỉ lệ nghịch với phạm vi nhoacutem Trong nhoacutem lớn rất dễ higravenh thagravenh caacutec nhoacutem nhỏ vagrave hoạt động rời rạc

Tư duy tập thể Trong nhoacutem lớn mọi người coacute xu hướng suy nghĩ đểđạtđược sự nhất triacute necircn khocircng phaacutet huy được sự saacuteng tạo

Caacutec vấn đề về xatilde hội

Xung đột Trong 1 nhoacutem ai cũng muốn migravenh lagrave giỏi nhất necircn dễ dẫn đến xung đột

Ẩn danh(Giấu tecircn) Đacircy lagrave phương phaacutep được sử dụng để kiểm soaacutet xung đột Cho caacutec thagravenh viecircn tham gia ẩn danh

Vấn đề giới tiacutenh Nam vagrave nữ thường coacute những thế mạnh khaacutec nhau điều nagravey coacute thể lagrave sức mạnh trong 1 thiết lập MDM

Đagravem phaacuten vagrave quyết định

Một quyết định coacute thể liecircn quan đến nhiều quan điểm khaacutec nhau vigrave thế cần phải coacute sự đagravem phaacuten

Caacutec thiết kế của cơ chế hỗ trợ cho MDM phải phugrave hợp với caacutec hoạt độngđagravemphaacuten

Những hoạt động nagravey bao gồm việc thu nhận yacute kiến của caacutec thagravenh viecircn 1 caacutech cocircng bằng

53Cocircng nghệ hỗ trợ MDM

Organizational DSSndash 1 hệ thống cung cấp caacutec quyết định hỗ trợ

Group Support Systemndash Cocircng nghệ sử dụng sự hỗ trợ của nhiều becircn tham gia

Group DSS ndash Lagrave 1 hệ thống được thiết kế đặc biệt để hỗ trợ cho MDM

DSS ndash Lagrave 1 hệ thống dưới sự kiểm soaacutet của 1 người quyết định hệ thống nagravey cung cấp 1 bộ cocircng cụ giuacutep phacircn tiacutech hoagraven cảnh đểđưa ra quyết định vagrave nacircng cao hiệu quả của quyết địnhđoacute

53Cocircng nghệ hỗ trợ MDM

Organizational DSSndash 1 hệ thống cung cấp caacutec quyết định hỗ trợ

Group Support Systemndash Cocircng nghệ sử dụng sự hỗ trợ của nhiều becircn tham gia

Group DSS ndash Lagrave 1 hệ thống được thiết kế đặc biệt để hỗ trợ cho MDM

DSS ndash Lagrave 1 hệ thống dưới sự kiểm soaacutet của 1 người quyết định hệ thống nagravey cung cấp 1 bộ cocircng cụ giuacutep phacircn tiacutech hoagraven cảnh đểđưa ra quyết định vagrave nacircng cao hiệu quả của quyết địnhđoacute

Mục tiecircu của cocircng nghệ hỗ trợ MDM

Quy trigravenh hỗ trợ tập trung vagraveo quaacute trigravenh tạo điều kiện thuận lợi cho sự tương taacutec

Cơ chế cấu truacutec quaacute trigravenh chi phối caacutec hoạt động truyền thocircng

Nhiệm vụ hỗ trợ cocircng việc coacute thể chọn lựa tổ chức hoặc lấy thocircng tin

Nhiệm vụ cấu truacutec cocircng việc cho pheacutep truy cập đến kỹ thuật lọc kết hợp phacircn tiacutech kiến thức liecircn quan đến cocircng việc

Caacutec lớp loại cocircng nghệ hỗ trợ MDM

Phacircn loại theo đặc điểm do DeSanctis vagrave Gallupe đưa ra đề xuất một chương trigravenh ba cấp dựa trecircn caacutec tiacutenh năng được cung cấp

Hệ thống cấp 1 Mục điacutech chiacutenh lagrave tạo điều kiện thocircng tin liecircn lạc giữa caacutec thagravenh viecircn

Hệ thống cấp 2 Thiết kế để giảm thiểu rủi ro

Hệ thống cấp 3 Giuacutep điều chỉnh xử lyacute quyết định

Phacircn loại theo cocircng nghệ -Kraemer vagrave King tập trung vagraveo cocircng nghệ aacutep dụng

Cocircng nghệ bảng mạch điện tử

Hội nghị trực tuyến

Mạng lưới tập đoagraven

Trung tacircm thocircng tin

Mocirci trường cộng taacutec

Phograveng quyết định

Nhoacutem phần mềm

Phần mềm được thiết kế để hỗ trợ sự hợp taacutec bao gồm việc thu huacutet vagrave lưu trữ thocircng tin

Caacutec tổ chức dẫn đầu thị trường hiện tại lagrave Lotus Notes and Domino Microsoft Exchange Novell GroupWise and Oracle Office

Caacutec cocircng cụ trong một bộ phần mềm bao gồm người quản lyacute hội nghị (Lotus Sametime) vagrave trao đổi thocircng điệp (Lotus Notes Mail)

Xếp hạng phần mềm cho nhoacutem

Ellis vv đề xuất một hệ thống xếp hạng dựa vagraveo kiểu sự hỗ trợ noacute Cung cấp

Hệ thocircng điệp

Hệ thống hội thảo truyền higravenh

Hệ thống cộng taacutec soạn thảo

Nhoacutem phacircn phối giải phaacutep phần mền

Hệ thống phối hợp

Hệ thống thocircng minh đại diện

Lực lượng điều khiển phaacutet triển phần mềm cho nhoacutem

Một số nhacircn tố chiacutenh bao gồm

Tăng năng suất

Giảm số lượng caacutec cuộc họp

Tăng cường tự động hoacutea caacutec quy trigravenh lagravem việc thường xuyecircn

Cần phối hợp toagraven cầu tốt hơn

Tiacutenh sẵn sagraveng của những mạng lan rộng

Coleman vagrave Khanna liệt kecirc 10 nhacircn tố khaacutec

54Quản lyacute hoạt động MDM (Mobile Device Management - Quản lyacute thiết bị di động)

Một số phương phaacutep phối hợp phổ biến hơnMDM lagrave

Kỹ thuật nhoacutem định danh

Kỹ thuật Delphi

Sự phacircn xử

Hệ thocircng tin dựa trecircn vấn đề

Nemawashi

Kỹ thuật nhoacutem định danh

1-Mỗi người tham gia viết ra những yacute tưởng về những gigrave necircn quyết định

2-Lần lượt mỗi người tham gia trigravenh bagravey yacute tưởng của migravenh được ghi lại trecircn bảng Khocircng thảo luận ở đacircy

3-Sau khi tất cả caacutec yacute tưởng được trigravenh bagravey caacutec đại biểu coacute thể chất vấn những người khaacutec

4-Mỗi người tham gia bỏ phiếu cho mỗi yacute tưởng

Kỹ thuật Delphi

Về cơ bản tương tự như kỹ thuật nhoacutem định danh ngoại trừ những người khocircng bao giờ tham gia cuộc họp

Một cocircng cụ khảo saacutet được sử dụng để thu thập đầu vagraveo ban đầu từ caacutec thagravenh viecircn

Một cuộc khảo saacutet thứ hai được gửi đi với một bản toacutem tắt caacutec kết quả chung

Những bước lặp lại cho đến khi đạt được một sự đồng thuận hoặc nhigraven nhận của đa số

Sự phacircn xử(Arbitration )

Thiacutech hợp nhất khi caacutec thagravenh viecircn của MDM đại diện cho caacutec yếu tố đối lập

Những người tham gia đồng yacute rằng nếu lựa chọn thay thế hai becircn thỏa thuận khocircng được tigravem thấy thigrave một trọng tagravei viecircn becircn ngoagravei sẽ tham gia

Trọng tagravei sau đoacute lựa chọn thay thế ocircng hoặc xeacutet thấy thiacutech hợp nhất

Hệ thống thocircng tin dựa trecircn vấn đề (IBIS)

Lagrave một phương phaacutep lập luận cấu truacutec

Một đại diện cho IBIS lagrave một đồ thị với caacutec nuacutet vagrave caacutec liecircn kết

IBIS bắt đầu với lựa chọn của một nuacutet vấn đề gốc sau đoacute caacutec nuacutet vị triacute khaacutec nhau được liecircn kết với nuacutet gốc

Caacutec nuacutet vị triacute nagravey sau đoacute được đaacutenh giaacute dựa trecircn những lập luận gắn liền với chuacuteng

Nemawashi (được sử dụng rộng ratildei tại Nhật Bản)

1-Một hoặc nhiều thagravenh viecircn của MDM được chỉ định lagrave điều phối viecircnCaacutec điều phối viecircn sau đoacute chọn người tham gia cograven lại

2-Điều phối viecircn xacircy dựng một tổng hợp caacutec sự lựa chọn vagrave sau đoacute caacutec chuyecircn gia đaacutenh giaacute caacutec lựa chọn

3-Điều phối viecircn lựa chọn một sự lựa chọn dựa trecircn kết quả ở trecircn(ở 2)

4-Sự thay thế được luacircn chuyển điều phối viecircn tigravem kiếm sự đồng thuận thocircng qua sự thuyết phục vagrave đagravem phaacuten

5-Nếu đạt được sự đồng thuận điều phối viecircn cho lưu thocircng một tagravei liệu magrave mỗi thagravenh viecircn MDM để lại dấu hiệu trecircn đoacute

55Nơi lagravem việc ảo

Nhiều tổ chức trecircn toagraven thế giới kinh doanh bất động sản cho cocircng nghệ hợp taacutec

Cocircng việc được trở thagravenh một điều bạn lagravem hơn lagrave một nơi bạn đi

Những thay đổi lớn nhất mang lại bởi nơi lagravem việc ảo coacute thể lagrave về văn hoaacute hay xatilde hội hơn lagrave về cocircng nghệ

Chương 6 Hệ thống thocircng tin điều hagravenh

61 Yacute nghĩa của EIS- Hệ thống thocircng tin điều hagravenh

- EIS lagrave một dạng đặc biệt của DSS được thiết kế để hỗ trợ ra quyết định ở cấp cao nhất của một tổ chức

- Lagrave một hệ thống thocircng tin hỗ trợ nhu cầu lập kế hoạch vagrave đaacutenh giaacute của caacutec nhagrave quản lyacute điều hagravenh

- EIS coacute thể giuacutep một CEO coacute được bức tranh tổng thể chiacutenh xaacutec nhất về caacutec hoạt động vagrave một bản toacutem tắt những gigrave magrave đối thủ cạnh tranh đang lagravem

- Caacutec hệ thống nagravey noacutei chung hoạt động dễ dagraveng vagrave trigravenh bagravey thocircng tin theo những caacutech dễ hiểu để việc tiếp thu được nhanh choacuteng (biểu đồ đồ thịhellip)

(Tagravei liệu thecircm EIS lagrave những loại hệ thống lagrave rất phức tạp trong tự nhiecircn Coacute thể noacutei hệ thống nagravey cũng cung cấp cho caacutec nhagrave quản lyacute với caacutec thiết bị coacute khả năng ra quyết định bằng caacutech sử dụng của noacute Hệ thống nagravey hoạt động trong điều kiện như vậy quan trọng như trong caacutec hệ thống khaacutec khocircng hỗ trợ Khả năng lưu trữ dữ liệu nặng lagravem cho noacute lyacute tưởng để được thocircng qua khocircng chỉ bởi caacutec doanh nghiệp lớn magrave cograven bởi caacutec doanh nghiệp nhỏ hơn Nhigraven chung hệ thống nagravey lagrave dagravenh cho caacutec nhacircn viecircn cấp cao hỗ trợ thagravenh thạo trong việc đưa ra caacutec quyết định quan trọng)

Caacutec phiecircn EIS tiecircu biểu- Phiecircn lagravem việc coacute thể bắt đầu với một baacuteo caacuteo về tigravenh higravenh tagravei chiacutenh vagrave kinh

doanh của một cocircng ty caacutec chỉ số hoạt động quan trọng được hiển thị rotilde ragraveng- EIS sẽ cho pheacutep caacutec giaacutem đốc điều hagravenh coacute thể đi sacircu vagraveo dữ liệu từ những con

số bất kỳ magrave noacute hỗ trợ- Việc điều hagravenh coacute thể lựa chọn một mức độ chi tiết ( VD danh số baacuten hagraveng) nếu

như cần điều tra thecircm- Lagrave một phương phaacutep tiếp cận coacute thể giuacutep việc ra quyết định tốt hơn

Những điều magrave EIS ko coacute- EIS khocircng phải lagrave sự thay thế cho caacutec hệ thống dựa trecircn caacutec maacutey tiacutenh khaacutec EIS

thực sự chỉ cung cấp dữ liệu cho caacutec hệ thống nagravey- Noacute khocircng thể biến caacutec bộ hệ điều hagravenh của maacutey tiacutenh thagravenh những ldquochuyecircn viecircn

giỏirdquo- Coacute thể được viacute một caacutech cao hơn như lagrave một trợ lyacute đaacuteng tin cậy coacute thể được gọi

đến bất khi nagraveo vagrave mỗi khi cần thiết

Tagravei liệu thecircm Sự khaacutec nhau giữa EIS vagrave DSS+ EIS thiết kế để hỗ trợ những người điều hagravenh cấp cao giuacutep họ khaacutem phaacute caacutec vấn đề vagrave caacutec cơ hội DSS hỗ trợ những nười phacircn tiacutech cố gắng trả lời cacircu hỏi caacutei gigrave coacute thể lagravem cugraveng với một cơ hội hoặc một vấn đề

Chiều EIS DSSNhững người sử dụng thocircng thường

Duyệt dữ liệu đi xuống truy xuất trạng thaacutei

Hỗ trợ phacircn tiacutech vagrave quyết định

Sự thuacutec đẩy Tiacutenh thiacutech hợp Tiacutenh hiệu quảỨng dụng Queacutet mocirci trường đaacutenh giaacute

hiệu suất nhận dạng caacutec vấn đề vagrave caacutec cơ hội

Caacutec quyết định quản lyacute trecircn caacutec lĩnh vực đa dạng

Hỗ trợ quyết định Caacutec chiacutenh saacutech caacutec quyết định khocircng coacute cấu truacutec ở mức cao vagrave hỗ trợ giaacuten tiếp

Hỗ trợ caacutec quyết định lặp lại caacutec quyết định khocircng thể đoaacuten trước ra quyết định khocircng coacute cấu truacutec vagrave baacuten cấu truacutec

Loại thocircng tin Caacutec thocircng tin tin tức thocircng tin becircn ngoagravei về khaacutech hagraveng đối thủ cạnh tranh mocirci trường caacutec baacuteo caacuteo theo yecircu cầu vagrave định thời về caacutec hoạt động becircn trong

Caacutec thocircng tin hỗ trợ caacutec tigravenh huống đặc biệt

Sử dụng coacute nguyecircn tắc

Dograve theo vết vagrave điều khiển nhận dạng cơ hội

Hoạch định tổ chức phacircn nhoacutem vagrave điều khiển

Khả năng phugrave hợp với những người sử dụng caacute nhacircn

Thiết kế loại ra quyết định cho mỗi người điều hagravenh caacute nhacircn bằng nhiều lựa chọn đầu ra

Cho pheacutep caacutec đaacutenh giaacute caacute nhacircn caacutec khả năng what-if lựa chọn loại hộp hội thoại

Đồ họa Phải coacute Lagrave một phần quan trọng của nhiều DSS

Thacircn thiện người sử dụng

Phải coacute Phải coacute nếu khocircng coacute người sử dụng trung gian

Xử lyacute thocircng tin Lọc neacuten thocircng tin dograve theo vết dữ liệu vagrave thocircng tin quan trọng

EIS kiacutech thiacutech caacutec cacircu hỏi caacutec cacircu trả lời bằng caacutech sử dụng DSS vagrave phản hồi lại EIS

Hỗ trợ caacutec thocircng tin chi tiết

Truy xuất thường xuyecircn caacutec mức chi tiết của bất kỳ thocircng tin tổng hợp nagraveo (duyệt dữ

Coacute thể coacute trong DSS nhưng khocircng thường

liệu chi tiết)Cơ sở mocirc higravenh Caacutec chức năng coacute sẵn bị hạn

chếLagrave điểm cốt lotildei của DSS

Cấu truacutec Theo người baacuten sản phẩm hoặc theo caacutec chuyecircn gia hệ thống thocircng tin

Theo người sử dụng hoặc caacute nhacircn hoặc caacutec chuyecircn gia từ caacutec trung tacircm thocircng tin hoặc phograveng ban hệ thống thocircng tin

Phần cứng Mainframe caacutec trạm RISC mạng LANs hoặc caacutec hệ thống phacircn bố

Mainframe caacutec trạm RISC caacutec maacutey PC hoặc caacutec hệ thống phacircn bố

Bản chất caacutec goacutei phần mềm

Truy xuất tương taacutec dễ dagraveng đến nhiều cơ sở dữ liệu truy xuất trực tuyến caacutec khả năng DBMS phức tạp caacutec liecircn kết phức tạp

Caacutec khả năng tiacutenh toaacuten lớn caacutec ngocircn ngữ mocirc higravenh mocirc phỏng ứng dụng vagrave caacutec bộ tạo DSS

Bản chất caacutec thocircng tin

Trigravenh bagravey thocircng tin được phaacutet sinh trước về quaacute khứ vagrave hiện tại tạo caacutec thocircng tin mới về quaacute khứ hiện tại tương lai

Tạo thocircng tin mới về quaacute khứ hiện tại tương lai

62 Lịch sử EIS- EIS xuất hiện lần đầu tiecircn tại MIT vagraveo những năm 1970

- Những EIS đầu tiecircn được phaacutet triển bởi caacutec doanh ngiệp lớn sẵn sagraveng chấp nhận rủi ro để đạt được lợi thế cạnh tranh

- Vagraveo những năm 1980 caacutec nhagrave cung cấp đatilde phaacutet triển một số cơ sở khaacutech hagraveng rộng vagrave cocircng nghệ EIS được tiếp tục phaacutet triển cho đến ngagravey nay

(Tagravei liệu thecircm Sử dụng DSSEIS cho phaacutet triển bền vững + Một số nghiecircn cứu đatilde được tiến hagravenh để kiểm tra việc thực hiện của EIS trong khu vực cocircng cộng vagrave chiacutenh phủ caacutec nước tổ chức kể từ khi chuacuteng được phaacutet triển theo định hướng lợi nhuận cho caacutec cocircng ty tư nhacircn (Hasan vagrave Hasan năm 1997) Theo một nghiecircn cứu tiến hagravenh tại Mỹ ở hơn 300 cocircng ty kết quả cho thấy sự khaacutec biệt của EIS giữa tư nhacircn vagrave chiacutenh phủ một số kết quả thuacute vị được phaacutet hiệnViacute dụ khoacute khăn hơn để chuyển tiền từ một tagravei khoản khaacutec trong một EIS của chiacutenh phủ cũng lagrave khoacute khăn hơn để biện giải thiacutech cho những chi phiacute phaacutet triển EIS của chiacutenh phủ Một nghiecircn cứu khaacutec được tiến hagravenh ở Australia

cho thấy rằng EIS cung cấp cho quản lyacute một higravenh ảnh chiacutenh xaacutec hơn về tổ chức thực hiện vagrave cung cấp hỗ trợ cho caacutec lợi iacutech chiến lược cải thiện khocircng chỉ cho caacutec nhagrave quản lyacute nhưng cograven cho phần cograven lại của tổ chức Dựa trecircn caacutec hệ thống được thiết kế cho caacutec cocircng ty tư nhacircn với một caacutech rotilde ragravengxaacutec định mục tiecircu EIS lagrave thiacutech hợp cho caacutec tổ chức cocircng cộng hiện đại nhưng cần phải được linh hoạt hơn vagrave kết thagravenh chugravem một phạm vi rộng hơn khả năng vagrave phương tiện hơn so với khu vực tư nhacircn ban đầu theo định hướng sản phẩm (Hasan vagrave Hasan năm 1997) Điều nagravey coacute thể lagrave do thực tế rằng caacutec hoạt động khu vực cocircng lagrave bắt buộc coacute taacutec động rộng phải đaacutep ứng sự mong đợi duy nhất cocircng cộng thường coacute mục tiecircu mơ hồ vagrave macircu thuẫn iacutet quyền tự chủ vagrave kiểm soaacutet việc ra quyết định vagrave nhacircn viecircn lagrave khoacute khăn hơn (Watson vagrave Carte2000) + Toacutem lại EIS lagrave một khaacutei niệm thagravenh cocircng noacute phaacutet triển qua nhiều năm tuy nhiecircn EIS khắc phục khiếm khuyết của migravenh bằng caacutech tiến hagravenh nghiecircn cứu liecircn tục)

63 Tại sao những người điều hagravenh hagraveng đầu lại khaacutec nhau- Họ lagrave những doanh nghiệp theo định hướng coacute suy nghĩ

- Coacute một khoảng khocircng gian rộng để kiểm soaacutet

- Họ chịu traacutech nhiệm cho việc thiết lập chiacutenh saacutech

- Họ đại diện cho tổ chức mocirci trường becircn ngoagravei

- Hagravenh động của họ tạo ra những kết quả đaacuteng kể về tagravei chiacutenh vagrave con người

Tần số caacutec hoạt động điều hagravenh- Xử lyacute xaacuteo trộn 42

- Hoạt động kinh doanh 32

- Phacircn bổ nguồn lực 17

- Đagravem phaacuten 3

- Những điều khaacutec 6

Handling Disturbances 42

Entrepreneurial Activites 32

Resource Allocation 17

Negotiation 3

Other 6

Những thocircng tin điều hagravenh cần thiết- Quản lyacute xaacuteo trộn coacute thể yecircu cầu sự chuacute yacute xung quanh đồng hồ

- Hoạt động kinh doanh yecircu cầu điều hagravenh để dự đoaacuten những thay đổi trong mocirci trường

- Nhiệm vụ phacircn bổ tagravei nguyecircn yecircu cầu lựa chọn người quản lyacute vagrave caacutec nguồn lực hạn chế được triển khai

- Đagravem phaacuten yecircu cầu cập nhật thocircng tin từng phuacutet để coacute thể xacircy dựng được sự đồng thuận

Caacutec loại thocircng tin điều hagravenh- Hệ thống kế toaacuten coacute liecircn quan đến việc tiacutenh toaacuten thu nhập hoạt động cho caacutec lĩnh

vực cụ thể lagrave quan trọng hơn so với caacutec hệ thống kế toaacuten truyền thocircng- Thocircng tin về thị trường khaacutech hagraveng cung cấp giaacute trị trong việc quyết định chiến

lược- Caacutec thocircng tin cần thiết thường được truyền đi trecircn một số hệ thống maacutey tiacutenh vagrave

nằm trong toagraven tổ chức- Caacutec thocircng tin được sử dụng thường lagrave ngắn hạn vagrave dễ thay đổi

Phương thức để xaacutec định thocircng tin cần thiết

Rockart xaacutec định được năm phương thức cơ bản để xaacutec định thocircng tin cần thiết

- Phương thức dựa trecircn kết quả- Phương thức rỗng- Phương thức chỉ số khoacutea- Phương thức tổng hợp nghiecircn cứu- Phương thức dựa vagraveo nhacircn tố then chốt dẫn đến thagravenh cocircng

64 Thagravenh phần EIS

- Sản phẩm EIS đầu tiecircn được phaacutet triển để sử dụng trecircn maacutey tiacutenh cấu higravenh cao nhưng caacutec sản phẩm hiện nay nhằm mục tiecircu lagrave nền tảng ClientServer

- Những nền tảng linh hoạt hơn coacute thể thiacutech ứng với thay đổi trong tổ chức vagrave cocircng nghệ

- Sử dụng dữ liệu thời gian thực dẫn đến quyết định nhanh hơn nhiều thocircng tin hơn

Thagravenh phần phần cứng- Một EIS khocircng đogravei hỏi coacute phần cứng cụ thể hoặc duy nhất nagraveo- Chigravea khoacutea của vấn đề lagrave để đảm bảo rằng caacutec thagravenh phần của EIS tối ưu hoacutea vagrave

phugrave hợp với tagravei nguyecircn maacutey tiacutenh của tổ chức- Hệ thống nagravey phải được cấu higravenh để caacutec nguồn tagravei nguyecircn phugrave hợp với những

người điều hagravenh chuacuteng

Thagravenh phần phần mềm- Traacutei ngược với phần cứng phần mềm thường được chuyecircn mocircn hoacutea cao cho caacutec

bagravei toaacuten về miền- Sự chuyecircn mocircn hoacutea nagravey thường đạt được bằng caacutech sử dụng thagravenh phần off-the-

shelf cho toagraven bộ EIS vagrave caacutec mocirc-đun tugravey chỉnh để đaacutep ứng nhu cầu cụ thể- Lotus Notes lagrave một viacute dụ điển higravenh Noacute coacute thể được sử dụng một migravenh hoặc coacute

thể phục vụ becircn thứ ba mocirc-đun plug-in

Cocircng nghệ EIS hiện nay

Dobrzeniecki đề xuấtphacircn loạitừng cấptheo bachức năng- Loại 1 sản phẩm bao gồmmột bộ đầy đủcaacutec ứng dụngtừ mộtnhagrave cung cấp- Loại 2 sản phẩm đượcthựchiệnở phần đầu củacaacutecsản phẩmDSS đượcphaacutet triển

bởicugravengmộtnhagrave cung cấp- Loại 3 sản phẩmkết hợp với nhautheo bất kỳ số lượngthuộc sở hữu củacocircng ty

65 Xacircy dựng EIS

- Xacircy dựngmộtEISgiống nhưxacircydựngmột số hệ thống khaacutec củamocirc higravenh hệ thống thocircng tin

- Việcphaacutet triểncấu truacutecnecircn được theo dotildeitừ quaacute trigravenh thiết kế đến quaacute trigravenhthực hiện

- Tuy nhiecircn một dự aacuten phaacutet triển EIScoacute xu hướnglagrave thống nhấtvagraveyecircu cầu hỗ trợ caacutec nhagrave quản lyacute latildenh đạo

- Xacircy dựng một EIScoacute thểphaacutet hiện ra đượccaacutectigravenh huống khoacute khănmagravemột nhagrave phaacutet triển chưabao giờ gặp phải

Mocirc higravenh EIS

Khung phaacutet triển một EIS

- Watson et al đề nghị xacircy dựngkhung với ba thagravenh phần+ Caacutech tiếp cận tập trung vagraveo yếu tốcon người vagrave dữ liệu coacute liecircn quan đến EIS+ Quaacute trigravenh phaacutet triển cần sự linh hoạt vagrave tương taacutec+ Người sử dụng - hệ thống hộp thoại bao gồm một ngocircn ngữ hagravenh động để xử lyacute caacutec lệnh

Lợi iacutech của EIS- Dễ duy trigrave caacutec mục tiecircu coacute tổ chức- Dễ truy xuất thocircng tin- Cho pheacutep người sử dụng nacircng cao hiệu suất hơn

- Tăng chất lượng ra quyết định- Cung cấp sự cải tiến cạnh tranh- Tiết kiệm thời gian của người sử dụng- Tăng khả năng vagrave chất lượng giao tiếp- Cung cấp khả năng điều khiển tốt hơn trong tổ chức- Cho pheacutep tham gia caacutec vấn đề vagrave caacutec cơ hội- Cho pheacutep hoạch định- Cho pheacutep tigravem kiếm nguyecircn nhacircn của một vấn đề- Thảo matilden caacutec yecircu cầu của người điều hagravenh

Hạn chế của EIS vagrave 1 số sai lầm cần traacutenh

- Chi phiacute một cuộc khảo saacutetnăm1991 chothấychi phiacute phaacutet triểntrungbigravenh365000USDvớichi phiacute vận hagravenhhagraveng năm lagrave$200000 (EIS)

- Cocircng nghệ hạn chếEIScần phảiđượctiacutech hợp hoagraven toagravenvagraveokiếntruacuteccủadoanh nghiệphiện tại do đoacute noacutelagrave một thaacutech thứclớn đối vớithiết kế

- Hạn chế tổ chức cơ cấu tổ chứccoacute thể khocircng phugrave hợp

Sự hạn chế về tổ chức- Chương trigravenh nghị sự vagrave thời gian chệch EIS mocirc tả một phần việc thực hiện một

chương trigravenh nghị sự vagrave coacute thể dễ dagraveng đạt được sự tin cậy một caacutech chắc chắn- Đồng bộ hoacutea việc quản lyacute sự tin cậy đuacuteng luacutec đặc biệt baacuteo caacuteo EIS coacute thể phaacute

vỡ sự ổn định thiết lập caacutec chu trigravenh baacuteo caacuteo một caacutech tốt nhất- Sự bất ổn EIS phản ứng nhanh coacute thể gacircy ra việc taacutec động trở lại một caacutech

nhanh choacuteng dẫn đến sự thiếu ổn định trong tổ chức

Sự thất bại lagrave thay thế khocircng thể chấp nhận được- Một số yếu tố lagravem EIS thất bại

+ Thiếu sự hỗ trợ về mặt quản lyacute+ Vấn đề chiacutenh trị+ Thất bại của nhagrave phaacutet triển+ Lỗi về cocircng nghệ+ Giaacute cả+ Thời gian

66 Ra quyết định điều hagravenh trong tương lai vagrave EIS

- Coacute một vagravei điều kiện sẽ được hợp nhất cho việc chuyển đổi cocircng nghệ Trong đoacute một vagravei điều kiện coacute thể dễ dự đoaacuten Hai điều kiện magrave ta coacute thể thấy lagrave+ Phaacutet triển cocircng nghệ maacutey tiacutenh trong việc điều hagravenh sẽ tạo ra sự chuyển đổi được chấp nhận một caacutech dễ dagraveng hơn+ Mở rộng traacutech nhiệm điều hagravenh sẽ mở rộng nhu cầu thocircng tin

Tương lai của EIS- EIS thocircng minh Những tiến bộ trong cocircng nghệ AI sẽ được triển khai trong caacutec

EIS- EIS đa phương tiện Cơ sở dữ liệu đa phương tiện sẽ cho pheacutep tiacutech hợp văn bản

giọng noacutei vagrave higravenh ảnh trong tương lai- EIS thocircng tin Tương lai EIS sẽ mở rộng hơn trong việc sử dụng dữ liệu becircn

ngoagravei doanh nghiệp- EIS kết nối Giao tiếp với băng thocircng rộng cho pheacutep kết nối liecircn thocircng lớn hơn

Chương 7 HỆ CHUYEcircN GIA VAgrave TRIacute TUỆ NHAcircN TẠO

71 Caacutec khaacutei niệm

72 Triacute thocircng minh của triacute tuệ nhacircn tạo

73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia

74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia

75 Lợi iacutech vagrave hạn chế của hệ chuyecircn gia

71 Caacutec khaacutei niệm

Chuyecircn mocircn (Expertise) sự hiểu biết rộng trong 1 lĩnh vực hẹp

Hệ chuyecircn gia (Expert Systems)1 chương trigravenh maacutey tiacutenh sử dụng 1 tập caacutec luật dựa trecircn tri thức của con người để giải quyết caacutec vấn đề đogravei hogravei phải coacute sự chuyecircn mocircn

Một số hệ chuyecircn gia nổi tiếng

DENDRAL (Standford 1960s Edward Feigenbaum)

MYCIN (Standford1970s Edward Shortliffe)

PROSPECTOR (MIT 1979)

Triacute tuệ nhacircn tạo (Artificial Intelligence ndash AI)

Triacute tuệ nhacircn tạo một bộ phacircn của ngagravenh khoa học maacutey tiacutenh quan tacircm đến việc thiết kế caacutec hệ thống maacutey tiacutenh thocircng minh đoacute lagrave caacutec hệ thống đưa ra caacutec đặc điểm magrave từ đoacute chuacuteng ta liecircn hệ với sự thocircng minh trong hagravenh động của con người (Barr vagrave Feigenbaum 1981)

Mục điacutech của AI

Mục điacutech khoa học xaacutec định caacutec gợi yacute để giải thiacutech caacutec loại khaacutec nhau của triacute tuệ thực

Mục điacutech kỹ thuật giải quyết caacutec vấn đề trong thế giới thực

Triacute tuệ nhacircn tạo kế thừa nhiều yacute tưởng quan điểm kỹ thuật từ caacutec ngagravenh khoa học khaacutec

- Triết học

- Logic Toaacuten học

- Tiacutenh toaacuten

- Khoa học tacircm lyacute Khoa học nhận thức

- Sinh học Thần kinh học

- Tiến hoacutea

Caacutec lĩnh vực ứng dụng trong Triacute tuệ nhacircn tạo

Mạng nơ ron thần kinh (Neural Networks)

Tiacutenh toaacuten sự tiến hoacutea

(Evolutionary Computation)

Hệ chuyecircn gia (Expert Systems)

Kỹ thuật xử lyacute tiếng noacutei (Speech Processing)

Kỹ thuật xử lyacute ngocircn ngữ tự nhiecircn

(Natural Language Processing)

Lập kế hoạch (Planning)

Robot (Robotics)

Khoa học higravenh ảnh (Vision)

Caacutec kỹ thuật thocircng dụng dugraveng trong AI

Biểu diễn(Representation)

Học (Learning)

Caacutec luật (Rules)

Tigravem kiếm (Search)

72 Triacute thocircng minh của triacute tuệ nhacircn tạo

Con người suy diễn như thế nagraveo

Phacircn loại (Categorization)

Caacutec quy tắc cụ thể

Heuristics

Kinh nghiệm trước đoacute

Dự tiacutenh trước

Maacutey tiacutenh suy diễn như thế nagraveo

Lập luận dựa trecircn luật IF-THEN mocirc tả tri thức được matilde hoacutea dưới dạng caacutec luật

Caacutec khung (Frames) lagrave caacutec đại diện mocirc tả caacutec tigravenh huống giống nhau lagrave điển higravenh của một vagravei phacircn loại

Lập luận dựa trecircn caacutec trường hợp mocirc phỏng giải phaacutep trước đoacute cho một vấn đề hiện tại

Nhận dạng mẫu phaacutet hiện acircm thanh higravenh dạng hoặc caacutec chuỗi dagravei

Caacutec dạng khaacutec của Triacute tuệ nhacircn tạo

Học maacutey- mạng nơron vagrave giải thuật di truyền

Lập trigravenh tự động ndash lagrave những kỹ thuật tạo ra caacutec chương trigravenh để lagravem 1 nhiệm vụ riecircng biệt (cho pheacutep những người khocircng phải lagrave người lập trigravenh coacute thể lập trigravenh được)

Cuộc sống nhacircn tạo ndash nỗ lực để taacutei tạo caacutec hiện tượng sinh học trong caacutec hệ thống dựa trecircn maacutey tiacutenh

73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia(Expert Systems- ES)

Theo Jackson (1999) Một hệ chuyecircn gia lagrave một chương trigravenh maacutey tiacutenh mocirc tả vagrave suy diễn với tri thức của một vagravei lĩnh vực để giải quyết vấn đề hay đưa ra caacutec lời khuyecircn

Cấu truacutec cơ bản của ES được dựa theo cấu truacutec chung của DSS Sự khaacutec biệt chiacutenh giữa ES vagraveDSS lagrave hệ ES thu thập caacutec kiến thức từ những

chuyecircn gia trong lĩnh vực quan tacircmĐặc trưng của hệ chuyecircn gia Hiệu quả cao Thời gian trả lời thỏa đaacuteng Độ tin cậy cao Dễ hiểu

Giao diện người dugraveng trong ES

Thiết kế giao diện người dugraveng tập trung vagraveo caacutec yếu tố như dễ dagraveng sử dụngcoacute độ tin cậy cao giảm tải những khoacute khăn khi sử dụng

Thiết kế necircn coacute một số tương taacutec (đầu vagraveo kiểm soaacutet vagrave truy vấn)

Cấu tạo giao diện người dugraveng gồm coacute magraven higravenh cảm ứng bagraven phiacutem buacutet saacuteng lệnh thoại caacutec phiacutem chuyecircn dụng

Cơ sở tri thức (Knowledge Base)

Chứa đựng caacutec tri thức cụ thể miền thu được từ caacutec chuyecircn gia miền

Coacute thể chứa caacutec mocirc tả caacutec hagravenh vi giải quyết vấn đề caacutec ragraveng buộc caacutec heuristics

Thagravenh cocircng của một ES dựa trecircn tiacutenh đầy đủ vagrave tiacutenh chiacutenh xaacutec của cơ sở tri thức

Mocirc tơ suy diễn (Inference Engine)

Ở đacircy tri thức được đặt để sử dụng tạo ra caacutec giải phaacutep để giải quyết vấn đề

Mocirc tơ nagravey coacute khả năng thực hiện diễn dịch hoặc suy diễn dựa trecircn caacutec luật hay caacutec caacutec sự kiện

Đồng thời cũng coacute khả năng sử dụng caacutec suy diễn mờ hay khocircng chiacutenh xaacutec dựa trecircn xaacutec suất hay aacutenh xạ mẫu

Vograveng điều khiển suy diễn

1 Aacutenh xạ caacutec luật với caacutec sự kiện đatilde được cho

2 Chọn luật để thực hiện

3 Thực hiện luật bằng caacutech thecircm caacutec sự kiện được suy diễn ra vagraveo bộ nhớ lagravem việc

Chuỗi suy diễn (Chaining)

Suy diễn tiến (forward chaining) maacutey suy diễn bắt đầu từ dữ liệu ban đầu vagrave thực hiện việc suy luận để đưa ra caacutec kết luận cuối cugraveng

Suy diễn lugravei (backward chaining) maacutey suy diễn bắt đầu từ dữ liệu điacutech vagrave tigravem ra tri thức hỗ trợ cho dữ liệu điacutech đoacute

Viacute dụ suy diễn lugravei

R1 Nếu coacute A vagrave B thigrave suy ra coacute D

R2 Nếu coacute B thigrave suy ra coacute C

R3 Nếu coacute C vagrave D thigrave suy ra coacute E

Ta coacute E ta xem trong 3 luật R1 R2 R3 luật nagraveo coacute E ta thấy R3 chứa E đồng thời chứa C vagrave D Xeacutet tiếp trong 2 luật R1 R2 luật nagraveo chứa C vagrave D R2 chứa C R3 chứa D Từ đoacute ta coacute được caacutec tri thức hỗ trợ suy diễn vagrave kết luận lagrave nếu coacute A vagrave B thigrave sẽ coacute E Hay nếu A vagrave B đuacuteng thigrave sẽ coacute E

Viacute dụ suy diễn tiến

Giả sử coacute tập chứa 3 luật sau

R1 Nếu coacute A vagrave B thigrave suy ra coacute D

R2 Nếu coacute B thigrave suy ra coacute C

R3 Nếu coacute C vagrave D thigrave suy ra coacute E

Nếu ta coacute A vagrave B thigrave chuacuteng ta suy ra được D từ R1 vagrave suy ra C từ R2 Với D vagrave C đatilde được suy ra ở trecircn giờ chuacuteng ta suy ra được E từ R3

Viacute dụ thực tế

Giả sử muốn biết magraveu của một con vật nuocirci tecircn lagrave Fred biết rằng noacute kecircu ộp ộp vagrave ăn ruồi

Coacute tập 4 luật ban đầu như sau

R1 Nếu X kecircu ộp ộp vagrave ăn ruồi thigrave X lagrave con ếch

R2 Nếu X kecircu chiecircm chiếp vagrave biết hoacutet thigrave X lagrave con chim

R3 Nếu X lagrave con ếch thigrave X coacute magraveu xanh

R4 Nếu X lagrave con chim thigrave X coacute magraveu vagraveng

74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia

Expert system shells lagrave một tập caacutec goacutei phần mềm vagrave caacutec cocircng cụ dugraveng để phaacutet triển caacutec hệ chuyecircn gia

Những Expert system shells đầu tiecircn thường rất rườm ragrave Mặc dugrave vậy noacute vẫn giuacutep cho người sử dụng sẽ khocircng phải bắt đầu lại từ đầu khi xacircy dựng một hệ chuyecircn gia mới

Những shell hiện đại bao gồm hai mocirc-đun chiacutenh lagrave cocircng cụ xacircy dựng một tập quy tắc vagrave mocirc tơ suy diễn

Xacircy dựng hệ chuyecircn gia

Bước 1 xacircy dựng mocirc higravenh bagravei toaacuten xaacutec định vấn đề nhiệm vụ magrave hệ thống sẽ thực hiện Caacutec dạng bagravei toaacuten cần hệ chuyecircn gia

Bagravei toaacuten diễn giải (InterPretation)

Bagravei toaacuten dự baacuteo (Prediction)

Bagravei toaacuten chuẩn đoaacuten (Diagnose)

Bagravei toaacuten gỡ rối (Debugging)

Bagravei toaacuten thiết kế

Tương tự như một dự aacuten phần mềm để xacircy dựng một hệ chuyecircn gia cần phải coacute caacutec yếu tố về nhacircn lực tagravei nguyecircn vagrave thời gian Những yếu tố nagravey ảnh hưởng đến giaacute thah của một hệ chuyecircn giaTrong phần nagravey cacircu hỏi thường được đặt ra lagrave tại sao cần phải xacircy dựng một hệ chuyecircn giaTrước khi bắt đầu phải xaacute định rotilde bagravei toaacuten đạt ra lagrave jiAi lagrave chuyecircn giaAi lagrave người sử dụng

1 Diễn giải (InterPretation) Nghiecircn cứu 1 vấn đề -gt Dựa trecircn những biểu hiện thuộc tiacutenh đặc trưng becircn ngoagravei -gt Tư vấn

(hoặc đưa ra kết luận hay mocirc tả dễ hiểu từ tập dữ liệu thocirc)

2 Bagravei toaacuten dự baacuteo (Prediction) Coacute thể dự đoaacuten được hagravenh vi kết quả dựa trecircn caacutec hiện tượng -gt dự baacuteo

VD Dự baacuteo thời tiết động đấthellip

3 Bagravei toaacuten chẩn đoaacuten (Diagnoss) Xaacutec định caacutec lỗi caacutec bộ phận hỏng hoacutec của hệ thống dựa trecircn caacutec dữ liệu quan saacutet được

4 Bagravei toaacuten gỡ rối (Debugging) Mocirc tả caacutec phương phaacutep khắc phục hệ thống khi gặp sự cố

5 Bagravei toaacuten thiết kế Lựa chọn cấu higravenh caacutec đối tượng nhằm thoả matilden một số ragraveng buộc nagraveo đoacute

6 Giảng dạy Phần mềm dạy học coacute thể chuẩn đoaacuten vagrave sủa lỗi của học sinh trong quaacute trigravenh học tập

Để xaacutec định đuacuteng bagravei toaacuten magrave chuacuteng ta cần giải quyết thigrave phải trả lời đc một số cacircu hỏi

- cần hệ chuyecircn gia

Bước 2 thu thập tri thức lựa chọn cocircng cụ vagrave aacutep dụng

Trong bước thu thập tri thức vấn đề quan trọng lagrave lựa chọn chuyecircn gia những người magrave sẽ đoacuteng goacutep tri thức cho hệ thống Thocircng thường trong suốt quaacute trigravenh phaacutet triển thigrave chuyecircn gia được xem như một thagravenh viecircn của đội phaacutet triển

Hiện nay coacute rất nhiều cocircng cụ để xacircy dựng một hệ chuyecircn gia Phổ biến nhất lagrave JESS CLIPS vagrave OPS5

Bước 3 Thiết kế cơ sở tri thức thiết kế hệ thốngTri thức được biểu diễn trường minh trong cơ sở tri thức

Caacutec chuyecircn gia vagrave kỹ sư tri thức sẽ đối thoại với nhau bằng caacutec kỹ thuật đối thoại Suy diễn (SD) bảng Mocirc higravenh hoacutea SD quy nạp phacircn loại

Vấn đề bagraveo trigrave vagrave phaacutet triển

Caacutec hệ chuyecircn gia đogravei hỏi phải bảo trigrave vagrave phaacutet triển nhiều hơn so với caacutec hệ thống khaacutec Phải thường xuyecircn bổ sung tri thức mới vagrave thay đổi caacutec tri thức cũ để đổi mới hệ chuyecircn gia

Thu thập vagrave khắc phục lỗi do người sử dụng phaacutet hiện để kịp thời khắc phục những sai soacutet của hệ chuyecircn gia

75 Lợi iacutech vagrave hạn chế của caacutec hệ chuyecircn gia

Một số lợi iacutech chiacutenh

Thời gian trả lời hợp lyacute bằng hoặc nhanh hơn so với chuyecircn gia (người) để đi đến cugraveng một quyết định Hệ chuyecircn gia lagrave một hệ thống thời gian thực (real time system)

Khả năng trả lời với mức độ tinh thocircng bằng hoặc cao hơn so với chuyecircn gia (người) trong cugraveng lĩnh vực

Hệ chuyecircn gia giuacutep cho hiệu quả lagravem việc tăng bằng việc sử dụng tập caacutec luật một caacutech nhanh choacuteng magrave ko bị nhầm lẫn chuyecircn gia lagrave người coacute thể quecircn đi một số tri thức cơ sở lyacute luậ nhưng HCG thigrave ko

Quyết định của một người chuyecircn gia coacute thể bị thay đổi vagrave ko coacute tiacutenh thống nhất như quyết định của một hệ chuyecircn gia tạo ra

Hệ chuyecircn gia giuacutep cho người sử dụng coacute thể trau dồi sự hiểu biết trecircn lĩnh vuej cụ thể magrave noacute giải quyết hỗ trợ người ra quyết định coacute trigravenh độ như 1 chuyecircn gia trong quaacute trigravenh gia quyết định

Kiến thức của rất nhiều chuyecircn gia về một lĩnh vực nagraveo đoacute được đưa vagraveo hệ chuyecircn gia lagravem cho CSTT cuat HCG phong phuacute vagrave rộng lớn hơn rất nhiều

HCG giải thiacutech caacutec bước suy luận một caacutech dễ hiểu nhất quaacuten luacutec nagraveo cũng coacute thể sử dụng ko như chuyecircn gia con người

Hạn chế của caacutec hệ chuyecircn gia

Nhược điểm lớn nhất của hệ chuyecircn gia lagrave những yacute kiến chuyecircn mocircn thường rất khoacute matilde hoacutea vagrave giải neacuten

Hệ chuyecircn gia khocircng coacute khả năng tự học tự cập nhật kiến thức mới như caacutec chuyecircn gia magrave cần phải được matilde hoacutea lại khi noacute được cập nhật

Hệ chuyecircn gia khocircng thể nhận ra được vấn đề khocircng nằm trong miền kiến thức của hệ thống

Chương 8 Tri thức vagrave tiếp nhận

1 Bao gồm caacutec vấn đề

Dữ liệu thực tế đo lường hoặc quan saacutet coacute hoặc khocircng coacute bối cảnh

Thocircng tin dữ liệu được tổng hợp một caacutech hữu iacutech để giải quyết những khoacute khăn trong việc đưa ra quyết định

Tri thức bao gồm caacutec ứng dụng quy tắc thocircng tin hướng dẫn của người ra quyết định

2 Những caacutei nhigraven về tri thức

Đại diện lagravem thế nagraveo để diễn tả tri thức viacute dụ như một quyển saacutech khocircng phải lagrave tri thức nhưng noacute lại lagrave một đại diện của tri thức

Sản xuất tri thức lagrave một tập hơp của hagraveng tồn kho coacute thể được sản xuất cũng như mua lại

Tri thức lagrave 1 trong 6 trạng thaacutei của hệ thống

1Dữ liệu 2Thocircng tin 3Cấu truacutec thocircng tin 4Sự thấu hiểu 5Yacute kiến 6 Quyết định

3 Caacutec loại tri thức Phổ biến mocirc tả dữ liệu thocircng tin thủ tục mọi thứ lagravem như thế nagraveo lập luận chiacutenh saacutech hoặc caacutec quy tắc

4 Thu thập Tri thức hệ chuyecircn gia Hầu hết caacutec phương phaacutep đều bắt đầu với mocirc higravenh của caacutec taacutec vụ trong đoacute

hệ chuyecircn gia được xacircy dựng Trong đoacute mocirc tả về caacutec lĩnh vực được tạo ra Caacutec kỹ sư sử dụng caacutec mocirc higravenh giả thuyết vagrave nhận thức về quaacute trigravenh phacircn

tiacutech để gợi ra caacutech giải quyết vấn đề về tri thức từ caacutec chuyecircn gia

5 Caacutec chiều của thu thập tri thức KE- driven caacutec kỹ sư trao đổi trực tiếp với caacutec chuyecircn gia Expert-driven Caacutec chuyecircn gia trực tiếp đưa chuyecircn mocircn của họ vagraveo hệ

thống maacutey tiacutenh Machine-driven Sử dụng caacutec cocircng cụ suy luận để triacutech xuất tri thức từ một

tập caacutec viacute dụ

6 Kỹ thuật thu thập tri thức Trao đổi gồm 2 loại cơ bản lagrave coacute cấu truacutec(coacute kịch bản) vagrave khocircng coacute cấu

truacutec( đối thoại trực tiếp) Giao thức phacircn tiacutech bằng lời Khi caacutec chuyecircn gia thực hiện một cocircng việc

của họ thigrave một bản ghi về cocircng việc đoacute được thực hiện Caacutec kỹ sư sẽ xacircy dựng mocirc higravenh cho những gigrave được ghi lại trong bản ghi

Phương phaacutep sagraveng lọc caacutec chuyecircn gia so saacutenh caacutec nhoacutem liecircn tiếp trong ba đối tượng vagrave cho biết tại sao nhoacutem thứ hai lại khaacutec nhoacutem thứ ba

7 Thu thập tri thức từ nhiều nguồn Thu thập tri thức từ nhiều nguồn lagrave cần thiết để coacute được đầy đủ caacutec tri thức

cho một vấn đề quan điểm yacute kiến traacutei ngược nhau thường phaacutet sinh Phương phaacutep đồng thuận sẽ giuacutep giải quyết được vấn đề macircu thuẫn Kỹ thuật phacircn tiacutech Meta lagrave kỹ thuật được aacutep dụng trong caacutec trường hợp

khaacutec Caacutech tiếp cận bằng định lượng đogravei hỏi caacutec kỹ sư cần cacircn nhắc yếu tố đầu vagraveo của caacutec chuyecircn gia khaacutec nhau

8 Xaacutec nhận hợp lệ vagrave kiểm tra tri thức Một khi thu thập tri thức noacute phải được đaacutenh giaacute về khả năng sử dụng vagrave độ

chiacutenh xaacutec Hai vấn đề cụ thể lagrave hiệu lực của những kiến thức vagrave kiểm tra việc xacircy dựng cơ sở của tri thức

Cần xaacutec nhận xem liệu hệ thống coacute thể hoạt động ở mức độ tối thiểu khocircng

Xaacutec minh liecircn quan đến việc so saacutenh từng chi tiết kỹ thuật của hệ thống những gigrave đatilde được thực hiện cuối cugraveng

9 Một số caacutec biện phaacutep xaacutec nhận Độ chiacutenh xaacutec Khả năng thiacutech nghi Mức độ đầy đủ Bề rộng Độ sacircu Hiệu lực Tổng quan Chiacutenh xaacutec Hiện thực Độ tin cậy Tiacutenh hữu dụng Mức độ

Chương 9 Học maacutey

1 Logic mờ vagrave ngocircn ngữ mờ(Fuzzy Logic and Linguistic Ambiguity)

Ngocircn ngữ tự nhiecircn gồm những khaacutei niệm mơ hồ vagrave khocircng chiacutenh xaacutectruyền tải ngữ nghĩa thocircng qua tiacutenh xấp xỉkhocircng rotilde ragraveng

Những xấp xỉ nagravey giuacutep con người coacute thể truyền tải hết được yacute nghĩa nhưng maacutey thigrave khocircng hiểu

Lagravem sao biểu diễn caacutec tri thức sử dụng caacutec khaacutei niệm khocircng rotilde ragraveng(mờ) hoặc khocircng chiacutenh xaacutec

2 Khaacutei niệm cơ bản của logic mờ tập mờ lagrave những tập hợp khocircng coacute một giới hạn rotilde Mỗi phần tử của noacute chỉ

chứa một mức độ hagravem liecircn thuộc của từng phần tử Vigrave vậy tập mờ khocircng giống như tập cổ điển Tập mờ coacute thể kết hợp với nhau qua những luật mờ magrave đặc trưng cho những hagravenh động trạng thaacutei vagrave thuộc tiacutenh của logic mờ được tận dụng khi thực hiện một bộ điều khiển mờ

Logic mờ dựa trecircn yacute tưởng mỗi phần tử thuộc vagraveo một tập hợp ở một mức độ nagraveo đấy

Locircgic mờ cho pheacutep độ liecircn thuộc (microA )coacute giaacute trị trong khoảng (01) Locircgic mờ coacute thể được coi lagrave mặt ứng dụng của lyacute thuyết tập mờ để xử lyacute caacutec

giaacute trị trong thế giới thực cho caacutec bagravei toaacuten phức tạp

3 So saacutenh tiacutenh đuacuteng đắn logic mờ vagrave xaacutec suất Xaacutec suất thigrave đề cập đến khả năng xảy ra một biến cố hay một điều gigrave đoacute Logic mờ đề cập đến cấp độ magrave đặc tiacutenh ở hiện tại

o viacute dụ1 người coacute chiều cao 6 feet thigrave coacute cấp độ lagrave 05 về chiều cao

4 Ưu điểm của logic mờ Caacutech tiếp cận rất tự nhiecircnkhocircng phức tạp Coacute thể mocirc higravenh hoacutea caacutec hagravem phi tuyến tugravey yacute phức tạp

Coacute thể tận dụng được kinh nghiệm từ những chuyecircn gia hagraveng đầu trong mọi lĩnh vực

Logic mờ được xacircy dựng dựa trecircn ngocircn ngữ tự nhiecircnNền tảng của logic mờ lagrave dựa trecircn cơ sở giao tiếp của con người

5 Nhược điểm của logic mờ Trong 1 hệ thống phức tạpsử dụng logic mờ coacute thể trở thagravenh trở ngại cho

việc xaacutec thực độ tin cậy của hệ thống Cơ chế lập luận mờ khocircng thể học hỏi từ những lỗi sai

6 Mạng noron nhacircn tạo(ANN) Mạng noron nhacircn tạo lagrave một mocirc phỏng xử lyacute thocircng tinđược nghiecircn cứu ra

từ hệ thống thần kinh của sinh vậtgiống như bộ natildeo để xử lyacute thocircng tin ANNs lagrave chương trigravenh dựa trecircn maacutey tiacutenh đơn giản coacute chức năng lagrave một mocirc

higravenh bagravei toaacuten khocircng gian dựa trecircn thử nghiệm vagrave baacuteo lỗi

7 Học từ kinh nghiệm Tiến trigravenh Một mẫu dữ liệu được biểu diễn như một mạng lưới noronANN ldquodự

đoaacutenrdquo 1 đầu radự đoaacuten được so saacutenh với giaacute trị thực tế hoặc giaacute trị chiacutenh xaacutecNếu đoaacuten được chiacutenh xaacutec thigrave khocircng coacute hagravenh động nagraveo được thực hiện

Nếu dự đoaacuten sai ANN kiểm tra lại vagrave xaacutec định lại thocircng số để điều chỉnh Một mẫu dữ liệu khaacutec được biểu diễn vagrave quaacute trigravenh nagravey được lặp lại

8 Nguyecircn tắc cơ bản của cocircng nghệ nơron Caacutec yếu tố xử lyacute cơ bản trong hệ thống thần kinh của con người lagrave tế bagraveo

thần kinhMạng lưới của tế bagraveo nagravey lagrave liecircn kết với nhau nhận được thocircng tin từ caacutec cảm biến trong mắt taihellip

Thocircng tin nhận được bởi tế bagraveo thần kinh hoặc lagrave sẽ kiacutech thiacutech noacute(sẽ được chuyển qua 1 thocircng điệp dọc theo mạng lưới) hoặc lagrave sẽ ngăn cản noacute(ngăn cản dograveng thocircng tin)

Độ nhạy coacute thể thay đổi qua thời gian hoặc sau khi coacute được kinh nghiệm

9 Cấu truacutec mạng Một ANN gồm 3 lớp cơ bản

Lớp đầu vagraveo nhận dữ liệu Lớp becircn trong hoặc lagrave lớp ẩn xử lyacute dữ liệu Lớp đầu ra chuyển tiếp kết quả cuối cugraveng của mạng

10Mạng nơ ron Thường coacute nhiều đầu vagraveo mỗi đầu vagraveo với mức ảnh hưởng vagrave tầm quan

trọng riecircng của noacute Một đầu vagraveo quan trọng coacute thể được sử dụng để khuếch đại đầu ra caacutec hagravem trạng thaacutei tổng hợp caacutec trọng số của caacutec yếu tố

đầuvagraveo khaacutec nhauvagraveo một giaacute trị duy nhất Caacutec hagravem chuyển giao xử lyacute caacutec giaacute trị trạng thaacutei vagrave tạo đầu ra

11Huấn luyện mạng nơ ron Trong mocirc higravenh coacute giaacutem saacutetANN được đến so saacutenh dự đoaacuten của chiacutenh

noacute với thocircng tin phản hồi coacute chứa caacutec kết quả mong muốn ANN sẽ phải tigravem caacutech thay đổi caacutec tham số becircn trong củamigravenh (caacutec trọng số vagrave caacutec ngưỡng) để tạo necircn một aacutenh xạ coacute khả năng aacutenh xạcaacutec đầu vagraveo thagravenh caacutec đầu ra mong muốn Sự thay đổi nagravey được tiến hagravenh nhờ việc so saacutenh giữa đầu ra thực sự vagrave đầu ra mong muốn

Trong mocirc higravenh khocircng coacute giaacutem saacutetANN nhận được dữ liệu vagraveo nhưng khocircng phải coacute bất kỳ thocircng tin phản hồi về kết quả mong muốn

Phần lớn caacutec ứng dụng nằm trong vugraveng của caacutec bagravei toaacuten ước lượng như mocirc higravenh hoacuteathống kecirc neacuten lọc phacircn cụm

12Lợi iacutech Liecircn kết với mạng noron Traacutenh caacutech lập trigravenh tường minh Giảm nhu cầu của chuyecircn gia ANNs thigrave thiacutech nghi với caacutec yếu tố đầu vagraveo thay đổi Khocircng cần thiết cho cơ sở tri thức tinh chế ANNs coacute tiacutenh động vagrave cải thiện với việc sử dụng Coacute khả năng xử lyacute dữ liệu khocircng chiacutenh xaacutec hoặc khocircng đầy đủ Cho pheacutep tổng quaacutet hoacutea từ thocircng tin cụ thể Cho pheacutep thu thập cảm giaacutec thocircng thường vagraveo miền giải quyết vấn đề

13Hạn chế của việc liecircn kết với mạng noron ANNs khocircng thể giải thiacutech được suy luận Bản chất hộp đen thường khiến cho vấn đề traacutech nhiệm vagrave độ tin cậy phaacutet

sinh lagrave khoacute khăn Lặp đi lặp lại quaacute trigravenh huấn luyện rất tốn thời gian Nguồn lực caacutec nhagrave phacircn tiacutech vagrave thiết kế coacute tay nghề cao vẫn lagrave đaacuteng lo

ngại Cocircng nghệ ANN thuacutec đẩy hạn chế của phần cứng hiện tại ANN yecircu cầu phải coacute sự tin tưởng ở đầu ra

14Giới thiệu về thuật toaacuten di truyền Cũng như mạng lưới thần kinh caacutec thuật toaacuten di truyền được dựa trecircn lyacute

thuyết sinh học Thuật toaacuten di truyền tigravem thấy nguồn gốc của chuacuteng trong caacutec lyacute thuyết

tiến hoacutea của chọn lọc tự nhiecircn vagrave thiacutech ứng với biến đổi khiacute hậu Kết quả thuật toaacuten di truyền lagrave từ giao phối 2 caacute thể trong quần thế để tạo

ra con caacutei đocirci khi tốt hơn so với bậc cha mẹ của chuacuteng 15Caacutec thagravenh phần cơ bản của thuật toaacuten di truyền

Toaacuten tử chọn lọc Caacutec caacute thể tốt được chọn lọc để đưa vagraveo thế hệ sau Sự chọn lọc nagravey căn cứ vagraveo độ thiacutech nghi với mocirci trường của mỗi caacute thể

Toaacuten tử lai gheacutep (crossover) Hai caacute thể cha vagrave mẹ trao đổi caacutec gen với nhau để tạo ra caacute thể con

Toaacuten tử đột biến (mutation) Một caacute thể thay đổi một số gen để biến đổi thagravenh một caacute thể mớiTất cả caacutec toaacuten tử trecircn khi thực hiện đều mang tiacutenh ngẫu nhiecircn

16Quaacute trigravenh cơ bản của một thuật toaacuten di truyền Khởi tạo

Đaacutenh giaacute quần thể

Lựa chọn NST thiacutech hợp nhất vagrave loại bỏ NST yếu nhất

Quy trigravenh giao nhau vagrave cải thiện quần thể

đột biến tiến trigravenh để khaacutem phaacute ra NST mới

17Ưu nhược điểm của việc kết hợp với thuật toaacuten di truyền Kiacutech thước quần thể lagrave 1 yếu tố quan trọng trong tốc độ của việc tigravem

kiếmnhưng noacute tương đối dễ dagraveng để dự đoaacuten tốc độ nagravey Giao nhau hoặc đột biến lagrave khocircng necircn đc sử dụng quaacute thường xuyecircn Luocircn coacute được iacutet nhất 1 giải phaacutep hợp lyacute Necircn coacute thể aacutep dụng chuacuteng cho caacutec vấn đề magrave chuacuteng ta khocircng coacute hướng

về caacutech giải quyết Sức mạnh của thuật toaacuten xuất phaacutet từ khaacutei niệm đơn giảnkhocircng phải từ

một thủ tục thuật toaacuten phức tạp 18Tương lai của học maacutey

Mạng lưới thần kinh nhacircn tạo vượt quaacute năng lực của con người trong caacutec trường hợp bị cocirc lập

Về mặt lyacute thuyếtmột maacutey tiacutenh coacute thể xử lyacute dũ liệu nhanh hơn hagraveng triệu lần so với 1 con người

May mắn thay cho chuacuteng tacon người tốt hơn nhiều khi magrave coacute được dữ liệumaacutey tiacutenh khocircng coacute 1 số thứ như lagrave 5 giaacutec quan

CHƯƠNG 10 KHO DỮ LIỆU

1 Kho dữ liệu Kho dữ liệu lagrave tuyển tập caacutec cơ sở dữ liệu tiacutech hợp hướng chủ đề được

thiết kế để trợ giuacutep cho một hệ hỗ trợ quyết định

Theo John Ladley Cocircng nghệ kho dữ liệu lagrave tập caacutec phương phaacutep kỹ thuật vagrave caacutec cocircng cụ coacute thể kết hợp hỗ trợ nhau để cung cấp thocircng tin cho người sử dụng trecircn cơ sở tiacutech hợp từ nhiều nguồn dữ liệu nhiều mocirci trường khaacutec nhau

Kho dữ liệu thường rất lớn tới hagraveng trăm GB hay thậm chiacute hagraveng Terabyte

2 Kho dữ liệu vận hagravenh (ODS) Một kho dữ liệu vận hagravenh Aacutep dụng kỹ thuật kho dữ liệu vagraveo caacutec hệ xử

lyacute giao taacutec lưu trữ dữ liệu cho một ứng dụng đặc thugrave Noacute đưa vagraveo kho dữ liệu một dograveng caacutec dữ liệu thocirc được thiết kế

3 So saacutenh

Kho dữ liệu vận hagravenh Kho dữ liệu

Dữ liệu theo chủ đề Dữ liệu theo chủ đề

Dữ liệu tiacutech hợp Dữ liệu tiacutech hợp

Dữ liệu thay đổi Dữ liệu khocircng thay đổi

Dữ liệu được cập nhật khi thay đổi

Dữ liệu giữ nguyecircn

Chỉ coacute dữ liệu hiện tạiDữliệu hiện tại vagrave dữ liệu lịch sử

Chu kỳ lagravem tươi dữ liệu ngắn Chu kỳ lagravem tươi dữ liệu dagravei

Chỉ coacute dữ liệu chi tiết Dữ liệu chi tiết vagrave dữ liệu tổng kết

Dugraveng cho caacutec quyết định ngắn hạn

Dugraveng cho hoạch định dagravei hạn

4 Kho dữ liệu cục bộ (Data Mart - DM)

Kho dữ liệu cục bộ lagrave CSDL coacute những đặc điểm giống với kho dữ liệu nhưng với quy mocirc nhỏ hơn vagrave lưu trữ dữ liệu về một lĩnh vực một chuyecircn ngagravenh

Data mart phụ thuộc Chứa những dữ liệu được lấy từ DW vagrave những dữ liệu nagravey sẽ được triacutech lọc vagrave tinh chế tiacutech hợp lại ở mức cao hơn để phục vụ một chủ đề nhất định của Datamart

Data mart độc lập Khocircng giống như Datamart phụ thuộc Data mart độc lập được xacircy dựng trước DW vagrave dữ liệu được trực tiếp lấy từ caacutec nguồn khaacutec nhau

5 Siecircu dữ liệu Metadata lagrave dữ liệu để mocirc tả dữ liệu Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột

một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi Metadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu

6 Mocirci trường kho dữ liệu Hệ thống của tổ chức vagrave kho cung cấp dữ liệu để xacircy dựng kho dữ liệu Trong quaacute trigravenh chuyển dữ liệu từ caacutec nguồn khaacutec nhau dữ liệu coacute thể

được lagravem sạch hoặc chuyển đổi vagrave vigrave thế DW được xem như lagrave một chuẩn cho việc lưu trữ

Đồng thời siecircu dữ liệu được ghi lại Cuối cugraveng DW hoặc siecircu thị coacute thể được sử dụng để tạo ra một kho dữ

liệu ldquocaacute nhacircnrdquo 7 Caacutec đặc điểm của kho dữ liệu

Đặc điểm Mocirc tả

Hướng chủ đề - DL tổ chức theo caacutech thức người dugraveng tham chiếu

Tiacutech hợp - Dữ liệu ldquosạchrdquo loại bỏ tiacutenh thiếu nhất quaacuten

Khocircng thay đổi - DL ldquochỉ đọcrdquo người dugraveng khocircng thay đổi được

Chuỗi thời gian - DL lagrave chuỗi thời gian khocircng phải lagrave trạng thaacutei hiện tại

Được tổng kết - DL vận hagravenhthao taacutec khi cần thiết

được kết hợp lại thagravenh dạng coacute thể dugraveng được cho quyết định

Kiacutech cỡ lớn hơn - Lưu giữ theo chuỗi thời gian tức lagrave giữ lại nhiều DL

Khocircng được chuẩn hoacutea - Coacute thể dư thừa DLSiecircu dữ liệu - Dữ liệu của dữ liệu được lưu trữNguồn dữ liệu - DL vận hagravenh (caacutec hệ sẵn coacute) cugraveng

với caacutec nguồn ngoagravei 8 Kho dữ liệu hướng chủ đề

Hướng chủ để coacute nghĩa lagrave kho dữ liệu được tổ chức xung quanh caacutec chủ đề chiacutenh như khaacutech hagraveng sản phẩm sản xuất Tập trung vagraveo việc mocirc higravenh hoacutea vagrave phacircn tiacutech dữ liệu cho caacutec nhagrave ra quyết định magrave khocircng tập trung vagraveo caacutec xử lyacute thocircng thường Cung cấp cho người dugraveng một khung nhigraven toagraven vẹn đơn giản vagrave đầy đủ về caacutec sự kiện quanh caacutec chủ đề

9 Dữ liệu trong DW được tiacutech hợp Dữ liệu trong kho dữ liệu được xacircy dựng bằng caacutech tổng hợp dữ liệu từ

nhiều nguồn khaacutec nhau vagrave caacutec nguồn coacute tổ chức khaacutec nhau Cơ sở dữ liệu caacutec file excel caacutec flat file hoặc caacutec raw file Khi đưa vagraveo kho dữ liệu caacutec dữ liệu được lagravem sạch vagrave tiacutech hợp dữ liệu nhằm đảm bảo tiacutenh nhất quaacuten của dữ liệu

10Kiến truacutec kho dữ liệu Tầng cơ sở dữ liệu hoạt động Tầng truy xuất thocircng tin Tầng truy xuất dữ liệu Tầng siecircu dữ liệu Tầng quản lyacute tiến trigravenh Tầng thocircng điệp của ứng dụng Tầng vật liacute của kho dữ liệu Tầng trigravenh diễn dữ liệu

11Higravenh trạng kho dữ liệu Kho dữ liệu ảo - người dugraveng cuối coacute thể truy cập trực tiếp đến kho dữ liệu

sử dụng caacutec cocircng cụ cho pheacutep ở tầng truy xuất dữ liệu Kho dữ liệu trung tacircm-1 cơ sở dữ liệu vật lyacute chứa tất cả dữ liệu cho một

vugraveng chuyecircn dụng nagraveo đoacute

Kho dữ liệu phacircn taacuten- Thagravenh phần được phacircn taacuten qua nhiều hệ cơ sở dữ liệu vật lyacute

12METADATA- Siecircu dữ liệu Định nghĩa Siecircu dữ liệu lagrave dữ liệu về dữ liệu Lagrave 1 lưu trữ dugraveng để

Miecircu tả kho dữ liệu tổng thể Nhận dạng kiểu kho dữ liệu Quản liacute quaacute trigravenh tiacutech hợp dữ liệu Quản liacute quaacute trigravenh cập nhật kho dữ liệu Quản liacute bảo mật

Lagrave chigravea khoacutea quyết định sự thagravenh cocircng của kho dữ liệu luocircn được thay đổi vagrave cập nhật theo sự phaacutet triển của kho dữ liệu

Dugraveng để quản liacute điều khiển kho dữ liệu Sự ra đời của kho dữ liệu như 1 cấu truacutec hỗ trợ ra quyết định siecircu dữ liệu

được xem như nguồn tagravei nguyecircn dữ liệu Siecircu dữ liệu lagrave trừu tượng Chuacuteng lagrave dữ liệu bậc cao cung cấp mocirc tả ngắn

gọn caacutec dữ liệu bậc thấp hơn 13Hoạt động của Siecircu dữ liệu

Siecircu dữ liệu rất cần thiết trong việc chuyển hoacutea thocircng tin trở thagravenh tri thức Lagrave chigravea khoacutea giuacutep chuacuteng ta xử lyacute được dữ liệu thocirc Viacute dụ một dograveng dữ liệu baacuten hagraveng 1023 K596 11121 agraveNoacute sẽ khocircng coacute nghĩa gigrave cho đến khi chuacuteng ta đưa vagraveo siecircu dữ liệu (thư

mục chứa dữ liệu) agrave cửa hagraveng 1023 sản phẩm K596 vagrave số tiền baacuten được lagrave 11121 đocirc la

14Sự cần thiết phải nhất quaacuten trong kho dữ liệu Kho dữ liệu được xacircy dựng cho lợi iacutech của những nhagrave phacircn tiacutech kinh

doanh caacutec nhagrave quản trị cho tất cả caacutec khu vực chức năng Trong cơ sở dữ liệu riecircng caacutec khu vực khaacutec nhau coacute thể định nghĩa vagrave lưu

trữ dữ liệu thocircng qua phiecircn bản của chiacutenh noacute Khi dữ liệu được lấy từ những vugraveng khaacutec nhau đoacute vagrave được đặt vagraveo kho dữ

liệu Việc chuyển đổi vagrave lagravem sạch caacutec tiến trigravenh sẽ đảm bảo noacute lagrave duy nhất được tiacutech hợp tại một mức của tổ chức

15Ragrave soaacutet lại dữ liệu ndash Thực thi siecircu dữ liệu

Bất kể cấu truacutec tự nhiecircn của 1 cacircu truy vấn thế nagraveo thigrave caacutec thagravenh phần của siecircu dữ liệu rất quan trọng đối với người ra quyết định

Bảng thuộc tiacutenh khoacutea được lưu trữ bởi kho dữ liệu Tập hợp dữ liệu được lấy từ đacircu Những chuyển đổi nagraveo được thực thi với việc lagravem sạch

16Siecircu dữ liệu lagrave gigrave Metadata - lagrave thocircng tin mocirc tả nội dung của cơ sở dữ liệu (CSDL) Metadata baacuteo cho người dugraveng biết thời gian cập nhật sau cugraveng của dữ liệu

định dạng vagrave mục điacutech sử dụng của noacute Những thocircng tin nagravey coacute thể hướng dẫn người dugraveng duyệt qua CSDL vagrave

giuacutep họ hiểu được yacute nghĩa vagrave ngữ cảnh của dữ liệu Trong CSDL metadata lagrave caacutec dạng biểu diễn khaacutec nhau của caacutec đối tượng

trong CSDL Trong CSDL quan hệ metadata lagrave caacutec định nghĩa của bảng cột CSDL

view vagrave nhiều đối tượng khaacutec Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột

một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi -gtMetadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu

Bảng chuyển đổi Ghi lại những chuyển đổi đatilde được thực hiện

Lịch sử thực thi Ghi lại những dữ liệu đatilde được

phacircn tiacutech

Higravenh thaacutei kết nốiGhi lại những dữ liệu được kết nối vagrave tần suất

17Aacutenh xạ thocircng thường của siecircu dữ liệu Bản ghi aacutenh xạ chuyển đổi bao gồm

Định danh của nguồn gốc Chuyển đổi thuộc tiacutenh Chuyển đổi thuộc tiacutenh vật lyacute Matilde hoacutea tham chiếu bảng chuyển đổi Đổi tecircn Đổi khoacutea Gaacuten giaacute trị cho thuộc tiacutenh mặc định Chọn logic cho caacutec nguồn nhiều giaacute trị Đổi thuật toaacuten

18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để

phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai

lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave

tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec

Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm

Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo

19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua

caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau

SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được

Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra

một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức

Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ

Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ

Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech

CHƯƠNG 11 KHAI PHAacute DỮ LIỆU

1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn

ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993

Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng

2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd

1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều

2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP

3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn

4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng

5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server

6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo

7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động

8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời

9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều

10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện

11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech

12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP

3 Xử lyacute phacircn tiacutech trực tuyến OLAP

MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave

dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu

ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave

thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu

HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave

ROLAP4 Khai phaacute dữ liệu

Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh

khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn

Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan

5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp

6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại

Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp

Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec

Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt

Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra

Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh

vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho

Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec

Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm

Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục

Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng

gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp

Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn

Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec

Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper

Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2

Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25

Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước

Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng

Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện

trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp

Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute

độ hỗ trợ ge ngưỡng minsup

độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan

Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn

Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết

Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu

MOLAP ROLAP HOLAP

Lưu trữ dữ liệu cơ sở

Khối Bảng quan hệ Bảng quan hệ

Lưu trữ thocircng tin tổng hợp

Khối Bảng quan hệ Khối

Hiệu suất thực hiện truy vấn

Nhanh nhất Chậm nhất Nhanh

Tiecircu thụ khocircng gian lưu trữ

Nhiều Thấp Trung bigravenh

Chi phiacute bảo trigrave Cao Thấp Trung bigravenh

Page 22: De cuong(1-11)

bull Mức độ thể chế hoacutea của MSS trong tổ chứcDo bởi tiacutenh đa dạng của DSS necircn việc đaacutenh giaacute sự thagravenh cocircng của hệ nagravey cũng khoacute khăn tuynhiecircn cũng coacute thể coacute một số yếu tố giuacutep cho DSS thagravenh cocircng như sự tham gia người dugravenghuấn luyện người dugraveng hỗ trợ quản lyacute cấp cao nguồn thocircng tin đặc điểm của những nhiệmvụ coacute liecircn quan (cấu truacutec bất định độ khoacute phụ thuộc)

Chương5Nhoacutem hỗ trợ quyết định vagrave nhoacutemcocircng nghệ phần mềm

51Nhoacutem tạo quyết định

MDM-Holsapple đatilde gợi yacute chuacuteng ta sử dụng giới hạn người tạo quyết định

Một nhoacutem lagrave kết cấu MDM nơi magrave nhiều người ra quyết định hoagraven toagraven tương taacutec

Một đội lagrave kết cấu MDM nơi caacutec thagravenh viecircn tư vấn cho người đưa ra quyết định nhưng khocircng tương taacutec

Một Ủy ban lagrave kết cấu MDM với một người tạo quyết định duy nhất vagrave sự tương taacutec giữa caacutec thagravenh viecircn

Mạng thocircng tin

Mạng lưới baacutenh xe mỗi người tham gia coacute thể giao tiếp với người đưa ra quyết định ở trung tacircm nhưng khocircng phải với người tham gia khaacutecCấu truacutec nagravey lagrave khocircng thỏa matilden tất cả những người tham gia ngoại trừ người ra quyết định

Mạng dacircy chuyền Tham gia chuyển tiếp thocircng tin chỉ để noacute luocircn liền kề nhau trong chuỗi

Thagravenh viecircn cuối cugraveng ko được đaacutep ứng

Mạng vograveng trograven Tương tự như chuỗi nhưng kết thuacutec được kết nối

Mạng kết nối hoagraven toagraven khocircng coacute hạn chế về giao tiếp vagrave tương taacutec giữa caacutec thagravenh viecircnNoacutei chungnoacute đaacutep ứng hầu hết caacutec kết nối của người tham gia nhưng truyền đạt thocircng tin mất nhiều thời gian vagrave coacute nhiều cơ hội xảy ra lỗi

Nhoacutem hagravenh vi vagrave chuẩn mực

MDMs thiết lập caacutec chỉ tiecircu hướng dẫn quaacute trigravenh ra quyết định

Một chuẩn mực quy định cụ thể những gigrave thagravenh viecircn trong nhoacutem dự kiến sẽ lagravem trong những hoagraven cảnh nhất định

Quy tắc gửi coacute thể được thocircng qua viacute dụ đaacutenh giaacute ngang hagraveng hoặc xử phạt

Lagravem thế nagraveo để đưa ra quyết định

Việc chọn lựa magrave trong đoacute việc sử dụng cấu truacutec MDM phải được dựa trecircn một số yếu tố liecircn quan với bối cảnh quyết định

Viacute dụmột cấu truacutec riecircng lẻ sẽ lagravem việc nơi magrave quyết định được cấu truacutec cao vagrave thocircng tin lagrave coacute sẵn

Một ủy ban cơ cấu sẽ lagrave sự lựa chọn khi người ra quyết định khocircng thể đưa ra quyết định một migravenh

52Caacutec vấn đề thường gặp trong nhoacutem

Kiacutech thước Noacutei chung sự nhất triacute vagrave gắn kết giữa caacutec thagravenh viecircn tỉ lệ nghịch với phạm vi nhoacutem Trong nhoacutem lớn rất dễ higravenh thagravenh caacutec nhoacutem nhỏ vagrave hoạt động rời rạc

Tư duy tập thể Trong nhoacutem lớn mọi người coacute xu hướng suy nghĩ đểđạtđược sự nhất triacute necircn khocircng phaacutet huy được sự saacuteng tạo

Caacutec vấn đề về xatilde hội

Xung đột Trong 1 nhoacutem ai cũng muốn migravenh lagrave giỏi nhất necircn dễ dẫn đến xung đột

Ẩn danh(Giấu tecircn) Đacircy lagrave phương phaacutep được sử dụng để kiểm soaacutet xung đột Cho caacutec thagravenh viecircn tham gia ẩn danh

Vấn đề giới tiacutenh Nam vagrave nữ thường coacute những thế mạnh khaacutec nhau điều nagravey coacute thể lagrave sức mạnh trong 1 thiết lập MDM

Đagravem phaacuten vagrave quyết định

Một quyết định coacute thể liecircn quan đến nhiều quan điểm khaacutec nhau vigrave thế cần phải coacute sự đagravem phaacuten

Caacutec thiết kế của cơ chế hỗ trợ cho MDM phải phugrave hợp với caacutec hoạt độngđagravemphaacuten

Những hoạt động nagravey bao gồm việc thu nhận yacute kiến của caacutec thagravenh viecircn 1 caacutech cocircng bằng

53Cocircng nghệ hỗ trợ MDM

Organizational DSSndash 1 hệ thống cung cấp caacutec quyết định hỗ trợ

Group Support Systemndash Cocircng nghệ sử dụng sự hỗ trợ của nhiều becircn tham gia

Group DSS ndash Lagrave 1 hệ thống được thiết kế đặc biệt để hỗ trợ cho MDM

DSS ndash Lagrave 1 hệ thống dưới sự kiểm soaacutet của 1 người quyết định hệ thống nagravey cung cấp 1 bộ cocircng cụ giuacutep phacircn tiacutech hoagraven cảnh đểđưa ra quyết định vagrave nacircng cao hiệu quả của quyết địnhđoacute

53Cocircng nghệ hỗ trợ MDM

Organizational DSSndash 1 hệ thống cung cấp caacutec quyết định hỗ trợ

Group Support Systemndash Cocircng nghệ sử dụng sự hỗ trợ của nhiều becircn tham gia

Group DSS ndash Lagrave 1 hệ thống được thiết kế đặc biệt để hỗ trợ cho MDM

DSS ndash Lagrave 1 hệ thống dưới sự kiểm soaacutet của 1 người quyết định hệ thống nagravey cung cấp 1 bộ cocircng cụ giuacutep phacircn tiacutech hoagraven cảnh đểđưa ra quyết định vagrave nacircng cao hiệu quả của quyết địnhđoacute

Mục tiecircu của cocircng nghệ hỗ trợ MDM

Quy trigravenh hỗ trợ tập trung vagraveo quaacute trigravenh tạo điều kiện thuận lợi cho sự tương taacutec

Cơ chế cấu truacutec quaacute trigravenh chi phối caacutec hoạt động truyền thocircng

Nhiệm vụ hỗ trợ cocircng việc coacute thể chọn lựa tổ chức hoặc lấy thocircng tin

Nhiệm vụ cấu truacutec cocircng việc cho pheacutep truy cập đến kỹ thuật lọc kết hợp phacircn tiacutech kiến thức liecircn quan đến cocircng việc

Caacutec lớp loại cocircng nghệ hỗ trợ MDM

Phacircn loại theo đặc điểm do DeSanctis vagrave Gallupe đưa ra đề xuất một chương trigravenh ba cấp dựa trecircn caacutec tiacutenh năng được cung cấp

Hệ thống cấp 1 Mục điacutech chiacutenh lagrave tạo điều kiện thocircng tin liecircn lạc giữa caacutec thagravenh viecircn

Hệ thống cấp 2 Thiết kế để giảm thiểu rủi ro

Hệ thống cấp 3 Giuacutep điều chỉnh xử lyacute quyết định

Phacircn loại theo cocircng nghệ -Kraemer vagrave King tập trung vagraveo cocircng nghệ aacutep dụng

Cocircng nghệ bảng mạch điện tử

Hội nghị trực tuyến

Mạng lưới tập đoagraven

Trung tacircm thocircng tin

Mocirci trường cộng taacutec

Phograveng quyết định

Nhoacutem phần mềm

Phần mềm được thiết kế để hỗ trợ sự hợp taacutec bao gồm việc thu huacutet vagrave lưu trữ thocircng tin

Caacutec tổ chức dẫn đầu thị trường hiện tại lagrave Lotus Notes and Domino Microsoft Exchange Novell GroupWise and Oracle Office

Caacutec cocircng cụ trong một bộ phần mềm bao gồm người quản lyacute hội nghị (Lotus Sametime) vagrave trao đổi thocircng điệp (Lotus Notes Mail)

Xếp hạng phần mềm cho nhoacutem

Ellis vv đề xuất một hệ thống xếp hạng dựa vagraveo kiểu sự hỗ trợ noacute Cung cấp

Hệ thocircng điệp

Hệ thống hội thảo truyền higravenh

Hệ thống cộng taacutec soạn thảo

Nhoacutem phacircn phối giải phaacutep phần mền

Hệ thống phối hợp

Hệ thống thocircng minh đại diện

Lực lượng điều khiển phaacutet triển phần mềm cho nhoacutem

Một số nhacircn tố chiacutenh bao gồm

Tăng năng suất

Giảm số lượng caacutec cuộc họp

Tăng cường tự động hoacutea caacutec quy trigravenh lagravem việc thường xuyecircn

Cần phối hợp toagraven cầu tốt hơn

Tiacutenh sẵn sagraveng của những mạng lan rộng

Coleman vagrave Khanna liệt kecirc 10 nhacircn tố khaacutec

54Quản lyacute hoạt động MDM (Mobile Device Management - Quản lyacute thiết bị di động)

Một số phương phaacutep phối hợp phổ biến hơnMDM lagrave

Kỹ thuật nhoacutem định danh

Kỹ thuật Delphi

Sự phacircn xử

Hệ thocircng tin dựa trecircn vấn đề

Nemawashi

Kỹ thuật nhoacutem định danh

1-Mỗi người tham gia viết ra những yacute tưởng về những gigrave necircn quyết định

2-Lần lượt mỗi người tham gia trigravenh bagravey yacute tưởng của migravenh được ghi lại trecircn bảng Khocircng thảo luận ở đacircy

3-Sau khi tất cả caacutec yacute tưởng được trigravenh bagravey caacutec đại biểu coacute thể chất vấn những người khaacutec

4-Mỗi người tham gia bỏ phiếu cho mỗi yacute tưởng

Kỹ thuật Delphi

Về cơ bản tương tự như kỹ thuật nhoacutem định danh ngoại trừ những người khocircng bao giờ tham gia cuộc họp

Một cocircng cụ khảo saacutet được sử dụng để thu thập đầu vagraveo ban đầu từ caacutec thagravenh viecircn

Một cuộc khảo saacutet thứ hai được gửi đi với một bản toacutem tắt caacutec kết quả chung

Những bước lặp lại cho đến khi đạt được một sự đồng thuận hoặc nhigraven nhận của đa số

Sự phacircn xử(Arbitration )

Thiacutech hợp nhất khi caacutec thagravenh viecircn của MDM đại diện cho caacutec yếu tố đối lập

Những người tham gia đồng yacute rằng nếu lựa chọn thay thế hai becircn thỏa thuận khocircng được tigravem thấy thigrave một trọng tagravei viecircn becircn ngoagravei sẽ tham gia

Trọng tagravei sau đoacute lựa chọn thay thế ocircng hoặc xeacutet thấy thiacutech hợp nhất

Hệ thống thocircng tin dựa trecircn vấn đề (IBIS)

Lagrave một phương phaacutep lập luận cấu truacutec

Một đại diện cho IBIS lagrave một đồ thị với caacutec nuacutet vagrave caacutec liecircn kết

IBIS bắt đầu với lựa chọn của một nuacutet vấn đề gốc sau đoacute caacutec nuacutet vị triacute khaacutec nhau được liecircn kết với nuacutet gốc

Caacutec nuacutet vị triacute nagravey sau đoacute được đaacutenh giaacute dựa trecircn những lập luận gắn liền với chuacuteng

Nemawashi (được sử dụng rộng ratildei tại Nhật Bản)

1-Một hoặc nhiều thagravenh viecircn của MDM được chỉ định lagrave điều phối viecircnCaacutec điều phối viecircn sau đoacute chọn người tham gia cograven lại

2-Điều phối viecircn xacircy dựng một tổng hợp caacutec sự lựa chọn vagrave sau đoacute caacutec chuyecircn gia đaacutenh giaacute caacutec lựa chọn

3-Điều phối viecircn lựa chọn một sự lựa chọn dựa trecircn kết quả ở trecircn(ở 2)

4-Sự thay thế được luacircn chuyển điều phối viecircn tigravem kiếm sự đồng thuận thocircng qua sự thuyết phục vagrave đagravem phaacuten

5-Nếu đạt được sự đồng thuận điều phối viecircn cho lưu thocircng một tagravei liệu magrave mỗi thagravenh viecircn MDM để lại dấu hiệu trecircn đoacute

55Nơi lagravem việc ảo

Nhiều tổ chức trecircn toagraven thế giới kinh doanh bất động sản cho cocircng nghệ hợp taacutec

Cocircng việc được trở thagravenh một điều bạn lagravem hơn lagrave một nơi bạn đi

Những thay đổi lớn nhất mang lại bởi nơi lagravem việc ảo coacute thể lagrave về văn hoaacute hay xatilde hội hơn lagrave về cocircng nghệ

Chương 6 Hệ thống thocircng tin điều hagravenh

61 Yacute nghĩa của EIS- Hệ thống thocircng tin điều hagravenh

- EIS lagrave một dạng đặc biệt của DSS được thiết kế để hỗ trợ ra quyết định ở cấp cao nhất của một tổ chức

- Lagrave một hệ thống thocircng tin hỗ trợ nhu cầu lập kế hoạch vagrave đaacutenh giaacute của caacutec nhagrave quản lyacute điều hagravenh

- EIS coacute thể giuacutep một CEO coacute được bức tranh tổng thể chiacutenh xaacutec nhất về caacutec hoạt động vagrave một bản toacutem tắt những gigrave magrave đối thủ cạnh tranh đang lagravem

- Caacutec hệ thống nagravey noacutei chung hoạt động dễ dagraveng vagrave trigravenh bagravey thocircng tin theo những caacutech dễ hiểu để việc tiếp thu được nhanh choacuteng (biểu đồ đồ thịhellip)

(Tagravei liệu thecircm EIS lagrave những loại hệ thống lagrave rất phức tạp trong tự nhiecircn Coacute thể noacutei hệ thống nagravey cũng cung cấp cho caacutec nhagrave quản lyacute với caacutec thiết bị coacute khả năng ra quyết định bằng caacutech sử dụng của noacute Hệ thống nagravey hoạt động trong điều kiện như vậy quan trọng như trong caacutec hệ thống khaacutec khocircng hỗ trợ Khả năng lưu trữ dữ liệu nặng lagravem cho noacute lyacute tưởng để được thocircng qua khocircng chỉ bởi caacutec doanh nghiệp lớn magrave cograven bởi caacutec doanh nghiệp nhỏ hơn Nhigraven chung hệ thống nagravey lagrave dagravenh cho caacutec nhacircn viecircn cấp cao hỗ trợ thagravenh thạo trong việc đưa ra caacutec quyết định quan trọng)

Caacutec phiecircn EIS tiecircu biểu- Phiecircn lagravem việc coacute thể bắt đầu với một baacuteo caacuteo về tigravenh higravenh tagravei chiacutenh vagrave kinh

doanh của một cocircng ty caacutec chỉ số hoạt động quan trọng được hiển thị rotilde ragraveng- EIS sẽ cho pheacutep caacutec giaacutem đốc điều hagravenh coacute thể đi sacircu vagraveo dữ liệu từ những con

số bất kỳ magrave noacute hỗ trợ- Việc điều hagravenh coacute thể lựa chọn một mức độ chi tiết ( VD danh số baacuten hagraveng) nếu

như cần điều tra thecircm- Lagrave một phương phaacutep tiếp cận coacute thể giuacutep việc ra quyết định tốt hơn

Những điều magrave EIS ko coacute- EIS khocircng phải lagrave sự thay thế cho caacutec hệ thống dựa trecircn caacutec maacutey tiacutenh khaacutec EIS

thực sự chỉ cung cấp dữ liệu cho caacutec hệ thống nagravey- Noacute khocircng thể biến caacutec bộ hệ điều hagravenh của maacutey tiacutenh thagravenh những ldquochuyecircn viecircn

giỏirdquo- Coacute thể được viacute một caacutech cao hơn như lagrave một trợ lyacute đaacuteng tin cậy coacute thể được gọi

đến bất khi nagraveo vagrave mỗi khi cần thiết

Tagravei liệu thecircm Sự khaacutec nhau giữa EIS vagrave DSS+ EIS thiết kế để hỗ trợ những người điều hagravenh cấp cao giuacutep họ khaacutem phaacute caacutec vấn đề vagrave caacutec cơ hội DSS hỗ trợ những nười phacircn tiacutech cố gắng trả lời cacircu hỏi caacutei gigrave coacute thể lagravem cugraveng với một cơ hội hoặc một vấn đề

Chiều EIS DSSNhững người sử dụng thocircng thường

Duyệt dữ liệu đi xuống truy xuất trạng thaacutei

Hỗ trợ phacircn tiacutech vagrave quyết định

Sự thuacutec đẩy Tiacutenh thiacutech hợp Tiacutenh hiệu quảỨng dụng Queacutet mocirci trường đaacutenh giaacute

hiệu suất nhận dạng caacutec vấn đề vagrave caacutec cơ hội

Caacutec quyết định quản lyacute trecircn caacutec lĩnh vực đa dạng

Hỗ trợ quyết định Caacutec chiacutenh saacutech caacutec quyết định khocircng coacute cấu truacutec ở mức cao vagrave hỗ trợ giaacuten tiếp

Hỗ trợ caacutec quyết định lặp lại caacutec quyết định khocircng thể đoaacuten trước ra quyết định khocircng coacute cấu truacutec vagrave baacuten cấu truacutec

Loại thocircng tin Caacutec thocircng tin tin tức thocircng tin becircn ngoagravei về khaacutech hagraveng đối thủ cạnh tranh mocirci trường caacutec baacuteo caacuteo theo yecircu cầu vagrave định thời về caacutec hoạt động becircn trong

Caacutec thocircng tin hỗ trợ caacutec tigravenh huống đặc biệt

Sử dụng coacute nguyecircn tắc

Dograve theo vết vagrave điều khiển nhận dạng cơ hội

Hoạch định tổ chức phacircn nhoacutem vagrave điều khiển

Khả năng phugrave hợp với những người sử dụng caacute nhacircn

Thiết kế loại ra quyết định cho mỗi người điều hagravenh caacute nhacircn bằng nhiều lựa chọn đầu ra

Cho pheacutep caacutec đaacutenh giaacute caacute nhacircn caacutec khả năng what-if lựa chọn loại hộp hội thoại

Đồ họa Phải coacute Lagrave một phần quan trọng của nhiều DSS

Thacircn thiện người sử dụng

Phải coacute Phải coacute nếu khocircng coacute người sử dụng trung gian

Xử lyacute thocircng tin Lọc neacuten thocircng tin dograve theo vết dữ liệu vagrave thocircng tin quan trọng

EIS kiacutech thiacutech caacutec cacircu hỏi caacutec cacircu trả lời bằng caacutech sử dụng DSS vagrave phản hồi lại EIS

Hỗ trợ caacutec thocircng tin chi tiết

Truy xuất thường xuyecircn caacutec mức chi tiết của bất kỳ thocircng tin tổng hợp nagraveo (duyệt dữ

Coacute thể coacute trong DSS nhưng khocircng thường

liệu chi tiết)Cơ sở mocirc higravenh Caacutec chức năng coacute sẵn bị hạn

chếLagrave điểm cốt lotildei của DSS

Cấu truacutec Theo người baacuten sản phẩm hoặc theo caacutec chuyecircn gia hệ thống thocircng tin

Theo người sử dụng hoặc caacute nhacircn hoặc caacutec chuyecircn gia từ caacutec trung tacircm thocircng tin hoặc phograveng ban hệ thống thocircng tin

Phần cứng Mainframe caacutec trạm RISC mạng LANs hoặc caacutec hệ thống phacircn bố

Mainframe caacutec trạm RISC caacutec maacutey PC hoặc caacutec hệ thống phacircn bố

Bản chất caacutec goacutei phần mềm

Truy xuất tương taacutec dễ dagraveng đến nhiều cơ sở dữ liệu truy xuất trực tuyến caacutec khả năng DBMS phức tạp caacutec liecircn kết phức tạp

Caacutec khả năng tiacutenh toaacuten lớn caacutec ngocircn ngữ mocirc higravenh mocirc phỏng ứng dụng vagrave caacutec bộ tạo DSS

Bản chất caacutec thocircng tin

Trigravenh bagravey thocircng tin được phaacutet sinh trước về quaacute khứ vagrave hiện tại tạo caacutec thocircng tin mới về quaacute khứ hiện tại tương lai

Tạo thocircng tin mới về quaacute khứ hiện tại tương lai

62 Lịch sử EIS- EIS xuất hiện lần đầu tiecircn tại MIT vagraveo những năm 1970

- Những EIS đầu tiecircn được phaacutet triển bởi caacutec doanh ngiệp lớn sẵn sagraveng chấp nhận rủi ro để đạt được lợi thế cạnh tranh

- Vagraveo những năm 1980 caacutec nhagrave cung cấp đatilde phaacutet triển một số cơ sở khaacutech hagraveng rộng vagrave cocircng nghệ EIS được tiếp tục phaacutet triển cho đến ngagravey nay

(Tagravei liệu thecircm Sử dụng DSSEIS cho phaacutet triển bền vững + Một số nghiecircn cứu đatilde được tiến hagravenh để kiểm tra việc thực hiện của EIS trong khu vực cocircng cộng vagrave chiacutenh phủ caacutec nước tổ chức kể từ khi chuacuteng được phaacutet triển theo định hướng lợi nhuận cho caacutec cocircng ty tư nhacircn (Hasan vagrave Hasan năm 1997) Theo một nghiecircn cứu tiến hagravenh tại Mỹ ở hơn 300 cocircng ty kết quả cho thấy sự khaacutec biệt của EIS giữa tư nhacircn vagrave chiacutenh phủ một số kết quả thuacute vị được phaacutet hiệnViacute dụ khoacute khăn hơn để chuyển tiền từ một tagravei khoản khaacutec trong một EIS của chiacutenh phủ cũng lagrave khoacute khăn hơn để biện giải thiacutech cho những chi phiacute phaacutet triển EIS của chiacutenh phủ Một nghiecircn cứu khaacutec được tiến hagravenh ở Australia

cho thấy rằng EIS cung cấp cho quản lyacute một higravenh ảnh chiacutenh xaacutec hơn về tổ chức thực hiện vagrave cung cấp hỗ trợ cho caacutec lợi iacutech chiến lược cải thiện khocircng chỉ cho caacutec nhagrave quản lyacute nhưng cograven cho phần cograven lại của tổ chức Dựa trecircn caacutec hệ thống được thiết kế cho caacutec cocircng ty tư nhacircn với một caacutech rotilde ragravengxaacutec định mục tiecircu EIS lagrave thiacutech hợp cho caacutec tổ chức cocircng cộng hiện đại nhưng cần phải được linh hoạt hơn vagrave kết thagravenh chugravem một phạm vi rộng hơn khả năng vagrave phương tiện hơn so với khu vực tư nhacircn ban đầu theo định hướng sản phẩm (Hasan vagrave Hasan năm 1997) Điều nagravey coacute thể lagrave do thực tế rằng caacutec hoạt động khu vực cocircng lagrave bắt buộc coacute taacutec động rộng phải đaacutep ứng sự mong đợi duy nhất cocircng cộng thường coacute mục tiecircu mơ hồ vagrave macircu thuẫn iacutet quyền tự chủ vagrave kiểm soaacutet việc ra quyết định vagrave nhacircn viecircn lagrave khoacute khăn hơn (Watson vagrave Carte2000) + Toacutem lại EIS lagrave một khaacutei niệm thagravenh cocircng noacute phaacutet triển qua nhiều năm tuy nhiecircn EIS khắc phục khiếm khuyết của migravenh bằng caacutech tiến hagravenh nghiecircn cứu liecircn tục)

63 Tại sao những người điều hagravenh hagraveng đầu lại khaacutec nhau- Họ lagrave những doanh nghiệp theo định hướng coacute suy nghĩ

- Coacute một khoảng khocircng gian rộng để kiểm soaacutet

- Họ chịu traacutech nhiệm cho việc thiết lập chiacutenh saacutech

- Họ đại diện cho tổ chức mocirci trường becircn ngoagravei

- Hagravenh động của họ tạo ra những kết quả đaacuteng kể về tagravei chiacutenh vagrave con người

Tần số caacutec hoạt động điều hagravenh- Xử lyacute xaacuteo trộn 42

- Hoạt động kinh doanh 32

- Phacircn bổ nguồn lực 17

- Đagravem phaacuten 3

- Những điều khaacutec 6

Handling Disturbances 42

Entrepreneurial Activites 32

Resource Allocation 17

Negotiation 3

Other 6

Những thocircng tin điều hagravenh cần thiết- Quản lyacute xaacuteo trộn coacute thể yecircu cầu sự chuacute yacute xung quanh đồng hồ

- Hoạt động kinh doanh yecircu cầu điều hagravenh để dự đoaacuten những thay đổi trong mocirci trường

- Nhiệm vụ phacircn bổ tagravei nguyecircn yecircu cầu lựa chọn người quản lyacute vagrave caacutec nguồn lực hạn chế được triển khai

- Đagravem phaacuten yecircu cầu cập nhật thocircng tin từng phuacutet để coacute thể xacircy dựng được sự đồng thuận

Caacutec loại thocircng tin điều hagravenh- Hệ thống kế toaacuten coacute liecircn quan đến việc tiacutenh toaacuten thu nhập hoạt động cho caacutec lĩnh

vực cụ thể lagrave quan trọng hơn so với caacutec hệ thống kế toaacuten truyền thocircng- Thocircng tin về thị trường khaacutech hagraveng cung cấp giaacute trị trong việc quyết định chiến

lược- Caacutec thocircng tin cần thiết thường được truyền đi trecircn một số hệ thống maacutey tiacutenh vagrave

nằm trong toagraven tổ chức- Caacutec thocircng tin được sử dụng thường lagrave ngắn hạn vagrave dễ thay đổi

Phương thức để xaacutec định thocircng tin cần thiết

Rockart xaacutec định được năm phương thức cơ bản để xaacutec định thocircng tin cần thiết

- Phương thức dựa trecircn kết quả- Phương thức rỗng- Phương thức chỉ số khoacutea- Phương thức tổng hợp nghiecircn cứu- Phương thức dựa vagraveo nhacircn tố then chốt dẫn đến thagravenh cocircng

64 Thagravenh phần EIS

- Sản phẩm EIS đầu tiecircn được phaacutet triển để sử dụng trecircn maacutey tiacutenh cấu higravenh cao nhưng caacutec sản phẩm hiện nay nhằm mục tiecircu lagrave nền tảng ClientServer

- Những nền tảng linh hoạt hơn coacute thể thiacutech ứng với thay đổi trong tổ chức vagrave cocircng nghệ

- Sử dụng dữ liệu thời gian thực dẫn đến quyết định nhanh hơn nhiều thocircng tin hơn

Thagravenh phần phần cứng- Một EIS khocircng đogravei hỏi coacute phần cứng cụ thể hoặc duy nhất nagraveo- Chigravea khoacutea của vấn đề lagrave để đảm bảo rằng caacutec thagravenh phần của EIS tối ưu hoacutea vagrave

phugrave hợp với tagravei nguyecircn maacutey tiacutenh của tổ chức- Hệ thống nagravey phải được cấu higravenh để caacutec nguồn tagravei nguyecircn phugrave hợp với những

người điều hagravenh chuacuteng

Thagravenh phần phần mềm- Traacutei ngược với phần cứng phần mềm thường được chuyecircn mocircn hoacutea cao cho caacutec

bagravei toaacuten về miền- Sự chuyecircn mocircn hoacutea nagravey thường đạt được bằng caacutech sử dụng thagravenh phần off-the-

shelf cho toagraven bộ EIS vagrave caacutec mocirc-đun tugravey chỉnh để đaacutep ứng nhu cầu cụ thể- Lotus Notes lagrave một viacute dụ điển higravenh Noacute coacute thể được sử dụng một migravenh hoặc coacute

thể phục vụ becircn thứ ba mocirc-đun plug-in

Cocircng nghệ EIS hiện nay

Dobrzeniecki đề xuấtphacircn loạitừng cấptheo bachức năng- Loại 1 sản phẩm bao gồmmột bộ đầy đủcaacutec ứng dụngtừ mộtnhagrave cung cấp- Loại 2 sản phẩm đượcthựchiệnở phần đầu củacaacutecsản phẩmDSS đượcphaacutet triển

bởicugravengmộtnhagrave cung cấp- Loại 3 sản phẩmkết hợp với nhautheo bất kỳ số lượngthuộc sở hữu củacocircng ty

65 Xacircy dựng EIS

- Xacircy dựngmộtEISgiống nhưxacircydựngmột số hệ thống khaacutec củamocirc higravenh hệ thống thocircng tin

- Việcphaacutet triểncấu truacutecnecircn được theo dotildeitừ quaacute trigravenh thiết kế đến quaacute trigravenhthực hiện

- Tuy nhiecircn một dự aacuten phaacutet triển EIScoacute xu hướnglagrave thống nhấtvagraveyecircu cầu hỗ trợ caacutec nhagrave quản lyacute latildenh đạo

- Xacircy dựng một EIScoacute thểphaacutet hiện ra đượccaacutectigravenh huống khoacute khănmagravemột nhagrave phaacutet triển chưabao giờ gặp phải

Mocirc higravenh EIS

Khung phaacutet triển một EIS

- Watson et al đề nghị xacircy dựngkhung với ba thagravenh phần+ Caacutech tiếp cận tập trung vagraveo yếu tốcon người vagrave dữ liệu coacute liecircn quan đến EIS+ Quaacute trigravenh phaacutet triển cần sự linh hoạt vagrave tương taacutec+ Người sử dụng - hệ thống hộp thoại bao gồm một ngocircn ngữ hagravenh động để xử lyacute caacutec lệnh

Lợi iacutech của EIS- Dễ duy trigrave caacutec mục tiecircu coacute tổ chức- Dễ truy xuất thocircng tin- Cho pheacutep người sử dụng nacircng cao hiệu suất hơn

- Tăng chất lượng ra quyết định- Cung cấp sự cải tiến cạnh tranh- Tiết kiệm thời gian của người sử dụng- Tăng khả năng vagrave chất lượng giao tiếp- Cung cấp khả năng điều khiển tốt hơn trong tổ chức- Cho pheacutep tham gia caacutec vấn đề vagrave caacutec cơ hội- Cho pheacutep hoạch định- Cho pheacutep tigravem kiếm nguyecircn nhacircn của một vấn đề- Thảo matilden caacutec yecircu cầu của người điều hagravenh

Hạn chế của EIS vagrave 1 số sai lầm cần traacutenh

- Chi phiacute một cuộc khảo saacutetnăm1991 chothấychi phiacute phaacutet triểntrungbigravenh365000USDvớichi phiacute vận hagravenhhagraveng năm lagrave$200000 (EIS)

- Cocircng nghệ hạn chếEIScần phảiđượctiacutech hợp hoagraven toagravenvagraveokiếntruacuteccủadoanh nghiệphiện tại do đoacute noacutelagrave một thaacutech thứclớn đối vớithiết kế

- Hạn chế tổ chức cơ cấu tổ chứccoacute thể khocircng phugrave hợp

Sự hạn chế về tổ chức- Chương trigravenh nghị sự vagrave thời gian chệch EIS mocirc tả một phần việc thực hiện một

chương trigravenh nghị sự vagrave coacute thể dễ dagraveng đạt được sự tin cậy một caacutech chắc chắn- Đồng bộ hoacutea việc quản lyacute sự tin cậy đuacuteng luacutec đặc biệt baacuteo caacuteo EIS coacute thể phaacute

vỡ sự ổn định thiết lập caacutec chu trigravenh baacuteo caacuteo một caacutech tốt nhất- Sự bất ổn EIS phản ứng nhanh coacute thể gacircy ra việc taacutec động trở lại một caacutech

nhanh choacuteng dẫn đến sự thiếu ổn định trong tổ chức

Sự thất bại lagrave thay thế khocircng thể chấp nhận được- Một số yếu tố lagravem EIS thất bại

+ Thiếu sự hỗ trợ về mặt quản lyacute+ Vấn đề chiacutenh trị+ Thất bại của nhagrave phaacutet triển+ Lỗi về cocircng nghệ+ Giaacute cả+ Thời gian

66 Ra quyết định điều hagravenh trong tương lai vagrave EIS

- Coacute một vagravei điều kiện sẽ được hợp nhất cho việc chuyển đổi cocircng nghệ Trong đoacute một vagravei điều kiện coacute thể dễ dự đoaacuten Hai điều kiện magrave ta coacute thể thấy lagrave+ Phaacutet triển cocircng nghệ maacutey tiacutenh trong việc điều hagravenh sẽ tạo ra sự chuyển đổi được chấp nhận một caacutech dễ dagraveng hơn+ Mở rộng traacutech nhiệm điều hagravenh sẽ mở rộng nhu cầu thocircng tin

Tương lai của EIS- EIS thocircng minh Những tiến bộ trong cocircng nghệ AI sẽ được triển khai trong caacutec

EIS- EIS đa phương tiện Cơ sở dữ liệu đa phương tiện sẽ cho pheacutep tiacutech hợp văn bản

giọng noacutei vagrave higravenh ảnh trong tương lai- EIS thocircng tin Tương lai EIS sẽ mở rộng hơn trong việc sử dụng dữ liệu becircn

ngoagravei doanh nghiệp- EIS kết nối Giao tiếp với băng thocircng rộng cho pheacutep kết nối liecircn thocircng lớn hơn

Chương 7 HỆ CHUYEcircN GIA VAgrave TRIacute TUỆ NHAcircN TẠO

71 Caacutec khaacutei niệm

72 Triacute thocircng minh của triacute tuệ nhacircn tạo

73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia

74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia

75 Lợi iacutech vagrave hạn chế của hệ chuyecircn gia

71 Caacutec khaacutei niệm

Chuyecircn mocircn (Expertise) sự hiểu biết rộng trong 1 lĩnh vực hẹp

Hệ chuyecircn gia (Expert Systems)1 chương trigravenh maacutey tiacutenh sử dụng 1 tập caacutec luật dựa trecircn tri thức của con người để giải quyết caacutec vấn đề đogravei hogravei phải coacute sự chuyecircn mocircn

Một số hệ chuyecircn gia nổi tiếng

DENDRAL (Standford 1960s Edward Feigenbaum)

MYCIN (Standford1970s Edward Shortliffe)

PROSPECTOR (MIT 1979)

Triacute tuệ nhacircn tạo (Artificial Intelligence ndash AI)

Triacute tuệ nhacircn tạo một bộ phacircn của ngagravenh khoa học maacutey tiacutenh quan tacircm đến việc thiết kế caacutec hệ thống maacutey tiacutenh thocircng minh đoacute lagrave caacutec hệ thống đưa ra caacutec đặc điểm magrave từ đoacute chuacuteng ta liecircn hệ với sự thocircng minh trong hagravenh động của con người (Barr vagrave Feigenbaum 1981)

Mục điacutech của AI

Mục điacutech khoa học xaacutec định caacutec gợi yacute để giải thiacutech caacutec loại khaacutec nhau của triacute tuệ thực

Mục điacutech kỹ thuật giải quyết caacutec vấn đề trong thế giới thực

Triacute tuệ nhacircn tạo kế thừa nhiều yacute tưởng quan điểm kỹ thuật từ caacutec ngagravenh khoa học khaacutec

- Triết học

- Logic Toaacuten học

- Tiacutenh toaacuten

- Khoa học tacircm lyacute Khoa học nhận thức

- Sinh học Thần kinh học

- Tiến hoacutea

Caacutec lĩnh vực ứng dụng trong Triacute tuệ nhacircn tạo

Mạng nơ ron thần kinh (Neural Networks)

Tiacutenh toaacuten sự tiến hoacutea

(Evolutionary Computation)

Hệ chuyecircn gia (Expert Systems)

Kỹ thuật xử lyacute tiếng noacutei (Speech Processing)

Kỹ thuật xử lyacute ngocircn ngữ tự nhiecircn

(Natural Language Processing)

Lập kế hoạch (Planning)

Robot (Robotics)

Khoa học higravenh ảnh (Vision)

Caacutec kỹ thuật thocircng dụng dugraveng trong AI

Biểu diễn(Representation)

Học (Learning)

Caacutec luật (Rules)

Tigravem kiếm (Search)

72 Triacute thocircng minh của triacute tuệ nhacircn tạo

Con người suy diễn như thế nagraveo

Phacircn loại (Categorization)

Caacutec quy tắc cụ thể

Heuristics

Kinh nghiệm trước đoacute

Dự tiacutenh trước

Maacutey tiacutenh suy diễn như thế nagraveo

Lập luận dựa trecircn luật IF-THEN mocirc tả tri thức được matilde hoacutea dưới dạng caacutec luật

Caacutec khung (Frames) lagrave caacutec đại diện mocirc tả caacutec tigravenh huống giống nhau lagrave điển higravenh của một vagravei phacircn loại

Lập luận dựa trecircn caacutec trường hợp mocirc phỏng giải phaacutep trước đoacute cho một vấn đề hiện tại

Nhận dạng mẫu phaacutet hiện acircm thanh higravenh dạng hoặc caacutec chuỗi dagravei

Caacutec dạng khaacutec của Triacute tuệ nhacircn tạo

Học maacutey- mạng nơron vagrave giải thuật di truyền

Lập trigravenh tự động ndash lagrave những kỹ thuật tạo ra caacutec chương trigravenh để lagravem 1 nhiệm vụ riecircng biệt (cho pheacutep những người khocircng phải lagrave người lập trigravenh coacute thể lập trigravenh được)

Cuộc sống nhacircn tạo ndash nỗ lực để taacutei tạo caacutec hiện tượng sinh học trong caacutec hệ thống dựa trecircn maacutey tiacutenh

73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia(Expert Systems- ES)

Theo Jackson (1999) Một hệ chuyecircn gia lagrave một chương trigravenh maacutey tiacutenh mocirc tả vagrave suy diễn với tri thức của một vagravei lĩnh vực để giải quyết vấn đề hay đưa ra caacutec lời khuyecircn

Cấu truacutec cơ bản của ES được dựa theo cấu truacutec chung của DSS Sự khaacutec biệt chiacutenh giữa ES vagraveDSS lagrave hệ ES thu thập caacutec kiến thức từ những

chuyecircn gia trong lĩnh vực quan tacircmĐặc trưng của hệ chuyecircn gia Hiệu quả cao Thời gian trả lời thỏa đaacuteng Độ tin cậy cao Dễ hiểu

Giao diện người dugraveng trong ES

Thiết kế giao diện người dugraveng tập trung vagraveo caacutec yếu tố như dễ dagraveng sử dụngcoacute độ tin cậy cao giảm tải những khoacute khăn khi sử dụng

Thiết kế necircn coacute một số tương taacutec (đầu vagraveo kiểm soaacutet vagrave truy vấn)

Cấu tạo giao diện người dugraveng gồm coacute magraven higravenh cảm ứng bagraven phiacutem buacutet saacuteng lệnh thoại caacutec phiacutem chuyecircn dụng

Cơ sở tri thức (Knowledge Base)

Chứa đựng caacutec tri thức cụ thể miền thu được từ caacutec chuyecircn gia miền

Coacute thể chứa caacutec mocirc tả caacutec hagravenh vi giải quyết vấn đề caacutec ragraveng buộc caacutec heuristics

Thagravenh cocircng của một ES dựa trecircn tiacutenh đầy đủ vagrave tiacutenh chiacutenh xaacutec của cơ sở tri thức

Mocirc tơ suy diễn (Inference Engine)

Ở đacircy tri thức được đặt để sử dụng tạo ra caacutec giải phaacutep để giải quyết vấn đề

Mocirc tơ nagravey coacute khả năng thực hiện diễn dịch hoặc suy diễn dựa trecircn caacutec luật hay caacutec caacutec sự kiện

Đồng thời cũng coacute khả năng sử dụng caacutec suy diễn mờ hay khocircng chiacutenh xaacutec dựa trecircn xaacutec suất hay aacutenh xạ mẫu

Vograveng điều khiển suy diễn

1 Aacutenh xạ caacutec luật với caacutec sự kiện đatilde được cho

2 Chọn luật để thực hiện

3 Thực hiện luật bằng caacutech thecircm caacutec sự kiện được suy diễn ra vagraveo bộ nhớ lagravem việc

Chuỗi suy diễn (Chaining)

Suy diễn tiến (forward chaining) maacutey suy diễn bắt đầu từ dữ liệu ban đầu vagrave thực hiện việc suy luận để đưa ra caacutec kết luận cuối cugraveng

Suy diễn lugravei (backward chaining) maacutey suy diễn bắt đầu từ dữ liệu điacutech vagrave tigravem ra tri thức hỗ trợ cho dữ liệu điacutech đoacute

Viacute dụ suy diễn lugravei

R1 Nếu coacute A vagrave B thigrave suy ra coacute D

R2 Nếu coacute B thigrave suy ra coacute C

R3 Nếu coacute C vagrave D thigrave suy ra coacute E

Ta coacute E ta xem trong 3 luật R1 R2 R3 luật nagraveo coacute E ta thấy R3 chứa E đồng thời chứa C vagrave D Xeacutet tiếp trong 2 luật R1 R2 luật nagraveo chứa C vagrave D R2 chứa C R3 chứa D Từ đoacute ta coacute được caacutec tri thức hỗ trợ suy diễn vagrave kết luận lagrave nếu coacute A vagrave B thigrave sẽ coacute E Hay nếu A vagrave B đuacuteng thigrave sẽ coacute E

Viacute dụ suy diễn tiến

Giả sử coacute tập chứa 3 luật sau

R1 Nếu coacute A vagrave B thigrave suy ra coacute D

R2 Nếu coacute B thigrave suy ra coacute C

R3 Nếu coacute C vagrave D thigrave suy ra coacute E

Nếu ta coacute A vagrave B thigrave chuacuteng ta suy ra được D từ R1 vagrave suy ra C từ R2 Với D vagrave C đatilde được suy ra ở trecircn giờ chuacuteng ta suy ra được E từ R3

Viacute dụ thực tế

Giả sử muốn biết magraveu của một con vật nuocirci tecircn lagrave Fred biết rằng noacute kecircu ộp ộp vagrave ăn ruồi

Coacute tập 4 luật ban đầu như sau

R1 Nếu X kecircu ộp ộp vagrave ăn ruồi thigrave X lagrave con ếch

R2 Nếu X kecircu chiecircm chiếp vagrave biết hoacutet thigrave X lagrave con chim

R3 Nếu X lagrave con ếch thigrave X coacute magraveu xanh

R4 Nếu X lagrave con chim thigrave X coacute magraveu vagraveng

74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia

Expert system shells lagrave một tập caacutec goacutei phần mềm vagrave caacutec cocircng cụ dugraveng để phaacutet triển caacutec hệ chuyecircn gia

Những Expert system shells đầu tiecircn thường rất rườm ragrave Mặc dugrave vậy noacute vẫn giuacutep cho người sử dụng sẽ khocircng phải bắt đầu lại từ đầu khi xacircy dựng một hệ chuyecircn gia mới

Những shell hiện đại bao gồm hai mocirc-đun chiacutenh lagrave cocircng cụ xacircy dựng một tập quy tắc vagrave mocirc tơ suy diễn

Xacircy dựng hệ chuyecircn gia

Bước 1 xacircy dựng mocirc higravenh bagravei toaacuten xaacutec định vấn đề nhiệm vụ magrave hệ thống sẽ thực hiện Caacutec dạng bagravei toaacuten cần hệ chuyecircn gia

Bagravei toaacuten diễn giải (InterPretation)

Bagravei toaacuten dự baacuteo (Prediction)

Bagravei toaacuten chuẩn đoaacuten (Diagnose)

Bagravei toaacuten gỡ rối (Debugging)

Bagravei toaacuten thiết kế

Tương tự như một dự aacuten phần mềm để xacircy dựng một hệ chuyecircn gia cần phải coacute caacutec yếu tố về nhacircn lực tagravei nguyecircn vagrave thời gian Những yếu tố nagravey ảnh hưởng đến giaacute thah của một hệ chuyecircn giaTrong phần nagravey cacircu hỏi thường được đặt ra lagrave tại sao cần phải xacircy dựng một hệ chuyecircn giaTrước khi bắt đầu phải xaacute định rotilde bagravei toaacuten đạt ra lagrave jiAi lagrave chuyecircn giaAi lagrave người sử dụng

1 Diễn giải (InterPretation) Nghiecircn cứu 1 vấn đề -gt Dựa trecircn những biểu hiện thuộc tiacutenh đặc trưng becircn ngoagravei -gt Tư vấn

(hoặc đưa ra kết luận hay mocirc tả dễ hiểu từ tập dữ liệu thocirc)

2 Bagravei toaacuten dự baacuteo (Prediction) Coacute thể dự đoaacuten được hagravenh vi kết quả dựa trecircn caacutec hiện tượng -gt dự baacuteo

VD Dự baacuteo thời tiết động đấthellip

3 Bagravei toaacuten chẩn đoaacuten (Diagnoss) Xaacutec định caacutec lỗi caacutec bộ phận hỏng hoacutec của hệ thống dựa trecircn caacutec dữ liệu quan saacutet được

4 Bagravei toaacuten gỡ rối (Debugging) Mocirc tả caacutec phương phaacutep khắc phục hệ thống khi gặp sự cố

5 Bagravei toaacuten thiết kế Lựa chọn cấu higravenh caacutec đối tượng nhằm thoả matilden một số ragraveng buộc nagraveo đoacute

6 Giảng dạy Phần mềm dạy học coacute thể chuẩn đoaacuten vagrave sủa lỗi của học sinh trong quaacute trigravenh học tập

Để xaacutec định đuacuteng bagravei toaacuten magrave chuacuteng ta cần giải quyết thigrave phải trả lời đc một số cacircu hỏi

- cần hệ chuyecircn gia

Bước 2 thu thập tri thức lựa chọn cocircng cụ vagrave aacutep dụng

Trong bước thu thập tri thức vấn đề quan trọng lagrave lựa chọn chuyecircn gia những người magrave sẽ đoacuteng goacutep tri thức cho hệ thống Thocircng thường trong suốt quaacute trigravenh phaacutet triển thigrave chuyecircn gia được xem như một thagravenh viecircn của đội phaacutet triển

Hiện nay coacute rất nhiều cocircng cụ để xacircy dựng một hệ chuyecircn gia Phổ biến nhất lagrave JESS CLIPS vagrave OPS5

Bước 3 Thiết kế cơ sở tri thức thiết kế hệ thốngTri thức được biểu diễn trường minh trong cơ sở tri thức

Caacutec chuyecircn gia vagrave kỹ sư tri thức sẽ đối thoại với nhau bằng caacutec kỹ thuật đối thoại Suy diễn (SD) bảng Mocirc higravenh hoacutea SD quy nạp phacircn loại

Vấn đề bagraveo trigrave vagrave phaacutet triển

Caacutec hệ chuyecircn gia đogravei hỏi phải bảo trigrave vagrave phaacutet triển nhiều hơn so với caacutec hệ thống khaacutec Phải thường xuyecircn bổ sung tri thức mới vagrave thay đổi caacutec tri thức cũ để đổi mới hệ chuyecircn gia

Thu thập vagrave khắc phục lỗi do người sử dụng phaacutet hiện để kịp thời khắc phục những sai soacutet của hệ chuyecircn gia

75 Lợi iacutech vagrave hạn chế của caacutec hệ chuyecircn gia

Một số lợi iacutech chiacutenh

Thời gian trả lời hợp lyacute bằng hoặc nhanh hơn so với chuyecircn gia (người) để đi đến cugraveng một quyết định Hệ chuyecircn gia lagrave một hệ thống thời gian thực (real time system)

Khả năng trả lời với mức độ tinh thocircng bằng hoặc cao hơn so với chuyecircn gia (người) trong cugraveng lĩnh vực

Hệ chuyecircn gia giuacutep cho hiệu quả lagravem việc tăng bằng việc sử dụng tập caacutec luật một caacutech nhanh choacuteng magrave ko bị nhầm lẫn chuyecircn gia lagrave người coacute thể quecircn đi một số tri thức cơ sở lyacute luậ nhưng HCG thigrave ko

Quyết định của một người chuyecircn gia coacute thể bị thay đổi vagrave ko coacute tiacutenh thống nhất như quyết định của một hệ chuyecircn gia tạo ra

Hệ chuyecircn gia giuacutep cho người sử dụng coacute thể trau dồi sự hiểu biết trecircn lĩnh vuej cụ thể magrave noacute giải quyết hỗ trợ người ra quyết định coacute trigravenh độ như 1 chuyecircn gia trong quaacute trigravenh gia quyết định

Kiến thức của rất nhiều chuyecircn gia về một lĩnh vực nagraveo đoacute được đưa vagraveo hệ chuyecircn gia lagravem cho CSTT cuat HCG phong phuacute vagrave rộng lớn hơn rất nhiều

HCG giải thiacutech caacutec bước suy luận một caacutech dễ hiểu nhất quaacuten luacutec nagraveo cũng coacute thể sử dụng ko như chuyecircn gia con người

Hạn chế của caacutec hệ chuyecircn gia

Nhược điểm lớn nhất của hệ chuyecircn gia lagrave những yacute kiến chuyecircn mocircn thường rất khoacute matilde hoacutea vagrave giải neacuten

Hệ chuyecircn gia khocircng coacute khả năng tự học tự cập nhật kiến thức mới như caacutec chuyecircn gia magrave cần phải được matilde hoacutea lại khi noacute được cập nhật

Hệ chuyecircn gia khocircng thể nhận ra được vấn đề khocircng nằm trong miền kiến thức của hệ thống

Chương 8 Tri thức vagrave tiếp nhận

1 Bao gồm caacutec vấn đề

Dữ liệu thực tế đo lường hoặc quan saacutet coacute hoặc khocircng coacute bối cảnh

Thocircng tin dữ liệu được tổng hợp một caacutech hữu iacutech để giải quyết những khoacute khăn trong việc đưa ra quyết định

Tri thức bao gồm caacutec ứng dụng quy tắc thocircng tin hướng dẫn của người ra quyết định

2 Những caacutei nhigraven về tri thức

Đại diện lagravem thế nagraveo để diễn tả tri thức viacute dụ như một quyển saacutech khocircng phải lagrave tri thức nhưng noacute lại lagrave một đại diện của tri thức

Sản xuất tri thức lagrave một tập hơp của hagraveng tồn kho coacute thể được sản xuất cũng như mua lại

Tri thức lagrave 1 trong 6 trạng thaacutei của hệ thống

1Dữ liệu 2Thocircng tin 3Cấu truacutec thocircng tin 4Sự thấu hiểu 5Yacute kiến 6 Quyết định

3 Caacutec loại tri thức Phổ biến mocirc tả dữ liệu thocircng tin thủ tục mọi thứ lagravem như thế nagraveo lập luận chiacutenh saacutech hoặc caacutec quy tắc

4 Thu thập Tri thức hệ chuyecircn gia Hầu hết caacutec phương phaacutep đều bắt đầu với mocirc higravenh của caacutec taacutec vụ trong đoacute

hệ chuyecircn gia được xacircy dựng Trong đoacute mocirc tả về caacutec lĩnh vực được tạo ra Caacutec kỹ sư sử dụng caacutec mocirc higravenh giả thuyết vagrave nhận thức về quaacute trigravenh phacircn

tiacutech để gợi ra caacutech giải quyết vấn đề về tri thức từ caacutec chuyecircn gia

5 Caacutec chiều của thu thập tri thức KE- driven caacutec kỹ sư trao đổi trực tiếp với caacutec chuyecircn gia Expert-driven Caacutec chuyecircn gia trực tiếp đưa chuyecircn mocircn của họ vagraveo hệ

thống maacutey tiacutenh Machine-driven Sử dụng caacutec cocircng cụ suy luận để triacutech xuất tri thức từ một

tập caacutec viacute dụ

6 Kỹ thuật thu thập tri thức Trao đổi gồm 2 loại cơ bản lagrave coacute cấu truacutec(coacute kịch bản) vagrave khocircng coacute cấu

truacutec( đối thoại trực tiếp) Giao thức phacircn tiacutech bằng lời Khi caacutec chuyecircn gia thực hiện một cocircng việc

của họ thigrave một bản ghi về cocircng việc đoacute được thực hiện Caacutec kỹ sư sẽ xacircy dựng mocirc higravenh cho những gigrave được ghi lại trong bản ghi

Phương phaacutep sagraveng lọc caacutec chuyecircn gia so saacutenh caacutec nhoacutem liecircn tiếp trong ba đối tượng vagrave cho biết tại sao nhoacutem thứ hai lại khaacutec nhoacutem thứ ba

7 Thu thập tri thức từ nhiều nguồn Thu thập tri thức từ nhiều nguồn lagrave cần thiết để coacute được đầy đủ caacutec tri thức

cho một vấn đề quan điểm yacute kiến traacutei ngược nhau thường phaacutet sinh Phương phaacutep đồng thuận sẽ giuacutep giải quyết được vấn đề macircu thuẫn Kỹ thuật phacircn tiacutech Meta lagrave kỹ thuật được aacutep dụng trong caacutec trường hợp

khaacutec Caacutech tiếp cận bằng định lượng đogravei hỏi caacutec kỹ sư cần cacircn nhắc yếu tố đầu vagraveo của caacutec chuyecircn gia khaacutec nhau

8 Xaacutec nhận hợp lệ vagrave kiểm tra tri thức Một khi thu thập tri thức noacute phải được đaacutenh giaacute về khả năng sử dụng vagrave độ

chiacutenh xaacutec Hai vấn đề cụ thể lagrave hiệu lực của những kiến thức vagrave kiểm tra việc xacircy dựng cơ sở của tri thức

Cần xaacutec nhận xem liệu hệ thống coacute thể hoạt động ở mức độ tối thiểu khocircng

Xaacutec minh liecircn quan đến việc so saacutenh từng chi tiết kỹ thuật của hệ thống những gigrave đatilde được thực hiện cuối cugraveng

9 Một số caacutec biện phaacutep xaacutec nhận Độ chiacutenh xaacutec Khả năng thiacutech nghi Mức độ đầy đủ Bề rộng Độ sacircu Hiệu lực Tổng quan Chiacutenh xaacutec Hiện thực Độ tin cậy Tiacutenh hữu dụng Mức độ

Chương 9 Học maacutey

1 Logic mờ vagrave ngocircn ngữ mờ(Fuzzy Logic and Linguistic Ambiguity)

Ngocircn ngữ tự nhiecircn gồm những khaacutei niệm mơ hồ vagrave khocircng chiacutenh xaacutectruyền tải ngữ nghĩa thocircng qua tiacutenh xấp xỉkhocircng rotilde ragraveng

Những xấp xỉ nagravey giuacutep con người coacute thể truyền tải hết được yacute nghĩa nhưng maacutey thigrave khocircng hiểu

Lagravem sao biểu diễn caacutec tri thức sử dụng caacutec khaacutei niệm khocircng rotilde ragraveng(mờ) hoặc khocircng chiacutenh xaacutec

2 Khaacutei niệm cơ bản của logic mờ tập mờ lagrave những tập hợp khocircng coacute một giới hạn rotilde Mỗi phần tử của noacute chỉ

chứa một mức độ hagravem liecircn thuộc của từng phần tử Vigrave vậy tập mờ khocircng giống như tập cổ điển Tập mờ coacute thể kết hợp với nhau qua những luật mờ magrave đặc trưng cho những hagravenh động trạng thaacutei vagrave thuộc tiacutenh của logic mờ được tận dụng khi thực hiện một bộ điều khiển mờ

Logic mờ dựa trecircn yacute tưởng mỗi phần tử thuộc vagraveo một tập hợp ở một mức độ nagraveo đấy

Locircgic mờ cho pheacutep độ liecircn thuộc (microA )coacute giaacute trị trong khoảng (01) Locircgic mờ coacute thể được coi lagrave mặt ứng dụng của lyacute thuyết tập mờ để xử lyacute caacutec

giaacute trị trong thế giới thực cho caacutec bagravei toaacuten phức tạp

3 So saacutenh tiacutenh đuacuteng đắn logic mờ vagrave xaacutec suất Xaacutec suất thigrave đề cập đến khả năng xảy ra một biến cố hay một điều gigrave đoacute Logic mờ đề cập đến cấp độ magrave đặc tiacutenh ở hiện tại

o viacute dụ1 người coacute chiều cao 6 feet thigrave coacute cấp độ lagrave 05 về chiều cao

4 Ưu điểm của logic mờ Caacutech tiếp cận rất tự nhiecircnkhocircng phức tạp Coacute thể mocirc higravenh hoacutea caacutec hagravem phi tuyến tugravey yacute phức tạp

Coacute thể tận dụng được kinh nghiệm từ những chuyecircn gia hagraveng đầu trong mọi lĩnh vực

Logic mờ được xacircy dựng dựa trecircn ngocircn ngữ tự nhiecircnNền tảng của logic mờ lagrave dựa trecircn cơ sở giao tiếp của con người

5 Nhược điểm của logic mờ Trong 1 hệ thống phức tạpsử dụng logic mờ coacute thể trở thagravenh trở ngại cho

việc xaacutec thực độ tin cậy của hệ thống Cơ chế lập luận mờ khocircng thể học hỏi từ những lỗi sai

6 Mạng noron nhacircn tạo(ANN) Mạng noron nhacircn tạo lagrave một mocirc phỏng xử lyacute thocircng tinđược nghiecircn cứu ra

từ hệ thống thần kinh của sinh vậtgiống như bộ natildeo để xử lyacute thocircng tin ANNs lagrave chương trigravenh dựa trecircn maacutey tiacutenh đơn giản coacute chức năng lagrave một mocirc

higravenh bagravei toaacuten khocircng gian dựa trecircn thử nghiệm vagrave baacuteo lỗi

7 Học từ kinh nghiệm Tiến trigravenh Một mẫu dữ liệu được biểu diễn như một mạng lưới noronANN ldquodự

đoaacutenrdquo 1 đầu radự đoaacuten được so saacutenh với giaacute trị thực tế hoặc giaacute trị chiacutenh xaacutecNếu đoaacuten được chiacutenh xaacutec thigrave khocircng coacute hagravenh động nagraveo được thực hiện

Nếu dự đoaacuten sai ANN kiểm tra lại vagrave xaacutec định lại thocircng số để điều chỉnh Một mẫu dữ liệu khaacutec được biểu diễn vagrave quaacute trigravenh nagravey được lặp lại

8 Nguyecircn tắc cơ bản của cocircng nghệ nơron Caacutec yếu tố xử lyacute cơ bản trong hệ thống thần kinh của con người lagrave tế bagraveo

thần kinhMạng lưới của tế bagraveo nagravey lagrave liecircn kết với nhau nhận được thocircng tin từ caacutec cảm biến trong mắt taihellip

Thocircng tin nhận được bởi tế bagraveo thần kinh hoặc lagrave sẽ kiacutech thiacutech noacute(sẽ được chuyển qua 1 thocircng điệp dọc theo mạng lưới) hoặc lagrave sẽ ngăn cản noacute(ngăn cản dograveng thocircng tin)

Độ nhạy coacute thể thay đổi qua thời gian hoặc sau khi coacute được kinh nghiệm

9 Cấu truacutec mạng Một ANN gồm 3 lớp cơ bản

Lớp đầu vagraveo nhận dữ liệu Lớp becircn trong hoặc lagrave lớp ẩn xử lyacute dữ liệu Lớp đầu ra chuyển tiếp kết quả cuối cugraveng của mạng

10Mạng nơ ron Thường coacute nhiều đầu vagraveo mỗi đầu vagraveo với mức ảnh hưởng vagrave tầm quan

trọng riecircng của noacute Một đầu vagraveo quan trọng coacute thể được sử dụng để khuếch đại đầu ra caacutec hagravem trạng thaacutei tổng hợp caacutec trọng số của caacutec yếu tố

đầuvagraveo khaacutec nhauvagraveo một giaacute trị duy nhất Caacutec hagravem chuyển giao xử lyacute caacutec giaacute trị trạng thaacutei vagrave tạo đầu ra

11Huấn luyện mạng nơ ron Trong mocirc higravenh coacute giaacutem saacutetANN được đến so saacutenh dự đoaacuten của chiacutenh

noacute với thocircng tin phản hồi coacute chứa caacutec kết quả mong muốn ANN sẽ phải tigravem caacutech thay đổi caacutec tham số becircn trong củamigravenh (caacutec trọng số vagrave caacutec ngưỡng) để tạo necircn một aacutenh xạ coacute khả năng aacutenh xạcaacutec đầu vagraveo thagravenh caacutec đầu ra mong muốn Sự thay đổi nagravey được tiến hagravenh nhờ việc so saacutenh giữa đầu ra thực sự vagrave đầu ra mong muốn

Trong mocirc higravenh khocircng coacute giaacutem saacutetANN nhận được dữ liệu vagraveo nhưng khocircng phải coacute bất kỳ thocircng tin phản hồi về kết quả mong muốn

Phần lớn caacutec ứng dụng nằm trong vugraveng của caacutec bagravei toaacuten ước lượng như mocirc higravenh hoacuteathống kecirc neacuten lọc phacircn cụm

12Lợi iacutech Liecircn kết với mạng noron Traacutenh caacutech lập trigravenh tường minh Giảm nhu cầu của chuyecircn gia ANNs thigrave thiacutech nghi với caacutec yếu tố đầu vagraveo thay đổi Khocircng cần thiết cho cơ sở tri thức tinh chế ANNs coacute tiacutenh động vagrave cải thiện với việc sử dụng Coacute khả năng xử lyacute dữ liệu khocircng chiacutenh xaacutec hoặc khocircng đầy đủ Cho pheacutep tổng quaacutet hoacutea từ thocircng tin cụ thể Cho pheacutep thu thập cảm giaacutec thocircng thường vagraveo miền giải quyết vấn đề

13Hạn chế của việc liecircn kết với mạng noron ANNs khocircng thể giải thiacutech được suy luận Bản chất hộp đen thường khiến cho vấn đề traacutech nhiệm vagrave độ tin cậy phaacutet

sinh lagrave khoacute khăn Lặp đi lặp lại quaacute trigravenh huấn luyện rất tốn thời gian Nguồn lực caacutec nhagrave phacircn tiacutech vagrave thiết kế coacute tay nghề cao vẫn lagrave đaacuteng lo

ngại Cocircng nghệ ANN thuacutec đẩy hạn chế của phần cứng hiện tại ANN yecircu cầu phải coacute sự tin tưởng ở đầu ra

14Giới thiệu về thuật toaacuten di truyền Cũng như mạng lưới thần kinh caacutec thuật toaacuten di truyền được dựa trecircn lyacute

thuyết sinh học Thuật toaacuten di truyền tigravem thấy nguồn gốc của chuacuteng trong caacutec lyacute thuyết

tiến hoacutea của chọn lọc tự nhiecircn vagrave thiacutech ứng với biến đổi khiacute hậu Kết quả thuật toaacuten di truyền lagrave từ giao phối 2 caacute thể trong quần thế để tạo

ra con caacutei đocirci khi tốt hơn so với bậc cha mẹ của chuacuteng 15Caacutec thagravenh phần cơ bản của thuật toaacuten di truyền

Toaacuten tử chọn lọc Caacutec caacute thể tốt được chọn lọc để đưa vagraveo thế hệ sau Sự chọn lọc nagravey căn cứ vagraveo độ thiacutech nghi với mocirci trường của mỗi caacute thể

Toaacuten tử lai gheacutep (crossover) Hai caacute thể cha vagrave mẹ trao đổi caacutec gen với nhau để tạo ra caacute thể con

Toaacuten tử đột biến (mutation) Một caacute thể thay đổi một số gen để biến đổi thagravenh một caacute thể mớiTất cả caacutec toaacuten tử trecircn khi thực hiện đều mang tiacutenh ngẫu nhiecircn

16Quaacute trigravenh cơ bản của một thuật toaacuten di truyền Khởi tạo

Đaacutenh giaacute quần thể

Lựa chọn NST thiacutech hợp nhất vagrave loại bỏ NST yếu nhất

Quy trigravenh giao nhau vagrave cải thiện quần thể

đột biến tiến trigravenh để khaacutem phaacute ra NST mới

17Ưu nhược điểm của việc kết hợp với thuật toaacuten di truyền Kiacutech thước quần thể lagrave 1 yếu tố quan trọng trong tốc độ của việc tigravem

kiếmnhưng noacute tương đối dễ dagraveng để dự đoaacuten tốc độ nagravey Giao nhau hoặc đột biến lagrave khocircng necircn đc sử dụng quaacute thường xuyecircn Luocircn coacute được iacutet nhất 1 giải phaacutep hợp lyacute Necircn coacute thể aacutep dụng chuacuteng cho caacutec vấn đề magrave chuacuteng ta khocircng coacute hướng

về caacutech giải quyết Sức mạnh của thuật toaacuten xuất phaacutet từ khaacutei niệm đơn giảnkhocircng phải từ

một thủ tục thuật toaacuten phức tạp 18Tương lai của học maacutey

Mạng lưới thần kinh nhacircn tạo vượt quaacute năng lực của con người trong caacutec trường hợp bị cocirc lập

Về mặt lyacute thuyếtmột maacutey tiacutenh coacute thể xử lyacute dũ liệu nhanh hơn hagraveng triệu lần so với 1 con người

May mắn thay cho chuacuteng tacon người tốt hơn nhiều khi magrave coacute được dữ liệumaacutey tiacutenh khocircng coacute 1 số thứ như lagrave 5 giaacutec quan

CHƯƠNG 10 KHO DỮ LIỆU

1 Kho dữ liệu Kho dữ liệu lagrave tuyển tập caacutec cơ sở dữ liệu tiacutech hợp hướng chủ đề được

thiết kế để trợ giuacutep cho một hệ hỗ trợ quyết định

Theo John Ladley Cocircng nghệ kho dữ liệu lagrave tập caacutec phương phaacutep kỹ thuật vagrave caacutec cocircng cụ coacute thể kết hợp hỗ trợ nhau để cung cấp thocircng tin cho người sử dụng trecircn cơ sở tiacutech hợp từ nhiều nguồn dữ liệu nhiều mocirci trường khaacutec nhau

Kho dữ liệu thường rất lớn tới hagraveng trăm GB hay thậm chiacute hagraveng Terabyte

2 Kho dữ liệu vận hagravenh (ODS) Một kho dữ liệu vận hagravenh Aacutep dụng kỹ thuật kho dữ liệu vagraveo caacutec hệ xử

lyacute giao taacutec lưu trữ dữ liệu cho một ứng dụng đặc thugrave Noacute đưa vagraveo kho dữ liệu một dograveng caacutec dữ liệu thocirc được thiết kế

3 So saacutenh

Kho dữ liệu vận hagravenh Kho dữ liệu

Dữ liệu theo chủ đề Dữ liệu theo chủ đề

Dữ liệu tiacutech hợp Dữ liệu tiacutech hợp

Dữ liệu thay đổi Dữ liệu khocircng thay đổi

Dữ liệu được cập nhật khi thay đổi

Dữ liệu giữ nguyecircn

Chỉ coacute dữ liệu hiện tạiDữliệu hiện tại vagrave dữ liệu lịch sử

Chu kỳ lagravem tươi dữ liệu ngắn Chu kỳ lagravem tươi dữ liệu dagravei

Chỉ coacute dữ liệu chi tiết Dữ liệu chi tiết vagrave dữ liệu tổng kết

Dugraveng cho caacutec quyết định ngắn hạn

Dugraveng cho hoạch định dagravei hạn

4 Kho dữ liệu cục bộ (Data Mart - DM)

Kho dữ liệu cục bộ lagrave CSDL coacute những đặc điểm giống với kho dữ liệu nhưng với quy mocirc nhỏ hơn vagrave lưu trữ dữ liệu về một lĩnh vực một chuyecircn ngagravenh

Data mart phụ thuộc Chứa những dữ liệu được lấy từ DW vagrave những dữ liệu nagravey sẽ được triacutech lọc vagrave tinh chế tiacutech hợp lại ở mức cao hơn để phục vụ một chủ đề nhất định của Datamart

Data mart độc lập Khocircng giống như Datamart phụ thuộc Data mart độc lập được xacircy dựng trước DW vagrave dữ liệu được trực tiếp lấy từ caacutec nguồn khaacutec nhau

5 Siecircu dữ liệu Metadata lagrave dữ liệu để mocirc tả dữ liệu Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột

một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi Metadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu

6 Mocirci trường kho dữ liệu Hệ thống của tổ chức vagrave kho cung cấp dữ liệu để xacircy dựng kho dữ liệu Trong quaacute trigravenh chuyển dữ liệu từ caacutec nguồn khaacutec nhau dữ liệu coacute thể

được lagravem sạch hoặc chuyển đổi vagrave vigrave thế DW được xem như lagrave một chuẩn cho việc lưu trữ

Đồng thời siecircu dữ liệu được ghi lại Cuối cugraveng DW hoặc siecircu thị coacute thể được sử dụng để tạo ra một kho dữ

liệu ldquocaacute nhacircnrdquo 7 Caacutec đặc điểm của kho dữ liệu

Đặc điểm Mocirc tả

Hướng chủ đề - DL tổ chức theo caacutech thức người dugraveng tham chiếu

Tiacutech hợp - Dữ liệu ldquosạchrdquo loại bỏ tiacutenh thiếu nhất quaacuten

Khocircng thay đổi - DL ldquochỉ đọcrdquo người dugraveng khocircng thay đổi được

Chuỗi thời gian - DL lagrave chuỗi thời gian khocircng phải lagrave trạng thaacutei hiện tại

Được tổng kết - DL vận hagravenhthao taacutec khi cần thiết

được kết hợp lại thagravenh dạng coacute thể dugraveng được cho quyết định

Kiacutech cỡ lớn hơn - Lưu giữ theo chuỗi thời gian tức lagrave giữ lại nhiều DL

Khocircng được chuẩn hoacutea - Coacute thể dư thừa DLSiecircu dữ liệu - Dữ liệu của dữ liệu được lưu trữNguồn dữ liệu - DL vận hagravenh (caacutec hệ sẵn coacute) cugraveng

với caacutec nguồn ngoagravei 8 Kho dữ liệu hướng chủ đề

Hướng chủ để coacute nghĩa lagrave kho dữ liệu được tổ chức xung quanh caacutec chủ đề chiacutenh như khaacutech hagraveng sản phẩm sản xuất Tập trung vagraveo việc mocirc higravenh hoacutea vagrave phacircn tiacutech dữ liệu cho caacutec nhagrave ra quyết định magrave khocircng tập trung vagraveo caacutec xử lyacute thocircng thường Cung cấp cho người dugraveng một khung nhigraven toagraven vẹn đơn giản vagrave đầy đủ về caacutec sự kiện quanh caacutec chủ đề

9 Dữ liệu trong DW được tiacutech hợp Dữ liệu trong kho dữ liệu được xacircy dựng bằng caacutech tổng hợp dữ liệu từ

nhiều nguồn khaacutec nhau vagrave caacutec nguồn coacute tổ chức khaacutec nhau Cơ sở dữ liệu caacutec file excel caacutec flat file hoặc caacutec raw file Khi đưa vagraveo kho dữ liệu caacutec dữ liệu được lagravem sạch vagrave tiacutech hợp dữ liệu nhằm đảm bảo tiacutenh nhất quaacuten của dữ liệu

10Kiến truacutec kho dữ liệu Tầng cơ sở dữ liệu hoạt động Tầng truy xuất thocircng tin Tầng truy xuất dữ liệu Tầng siecircu dữ liệu Tầng quản lyacute tiến trigravenh Tầng thocircng điệp của ứng dụng Tầng vật liacute của kho dữ liệu Tầng trigravenh diễn dữ liệu

11Higravenh trạng kho dữ liệu Kho dữ liệu ảo - người dugraveng cuối coacute thể truy cập trực tiếp đến kho dữ liệu

sử dụng caacutec cocircng cụ cho pheacutep ở tầng truy xuất dữ liệu Kho dữ liệu trung tacircm-1 cơ sở dữ liệu vật lyacute chứa tất cả dữ liệu cho một

vugraveng chuyecircn dụng nagraveo đoacute

Kho dữ liệu phacircn taacuten- Thagravenh phần được phacircn taacuten qua nhiều hệ cơ sở dữ liệu vật lyacute

12METADATA- Siecircu dữ liệu Định nghĩa Siecircu dữ liệu lagrave dữ liệu về dữ liệu Lagrave 1 lưu trữ dugraveng để

Miecircu tả kho dữ liệu tổng thể Nhận dạng kiểu kho dữ liệu Quản liacute quaacute trigravenh tiacutech hợp dữ liệu Quản liacute quaacute trigravenh cập nhật kho dữ liệu Quản liacute bảo mật

Lagrave chigravea khoacutea quyết định sự thagravenh cocircng của kho dữ liệu luocircn được thay đổi vagrave cập nhật theo sự phaacutet triển của kho dữ liệu

Dugraveng để quản liacute điều khiển kho dữ liệu Sự ra đời của kho dữ liệu như 1 cấu truacutec hỗ trợ ra quyết định siecircu dữ liệu

được xem như nguồn tagravei nguyecircn dữ liệu Siecircu dữ liệu lagrave trừu tượng Chuacuteng lagrave dữ liệu bậc cao cung cấp mocirc tả ngắn

gọn caacutec dữ liệu bậc thấp hơn 13Hoạt động của Siecircu dữ liệu

Siecircu dữ liệu rất cần thiết trong việc chuyển hoacutea thocircng tin trở thagravenh tri thức Lagrave chigravea khoacutea giuacutep chuacuteng ta xử lyacute được dữ liệu thocirc Viacute dụ một dograveng dữ liệu baacuten hagraveng 1023 K596 11121 agraveNoacute sẽ khocircng coacute nghĩa gigrave cho đến khi chuacuteng ta đưa vagraveo siecircu dữ liệu (thư

mục chứa dữ liệu) agrave cửa hagraveng 1023 sản phẩm K596 vagrave số tiền baacuten được lagrave 11121 đocirc la

14Sự cần thiết phải nhất quaacuten trong kho dữ liệu Kho dữ liệu được xacircy dựng cho lợi iacutech của những nhagrave phacircn tiacutech kinh

doanh caacutec nhagrave quản trị cho tất cả caacutec khu vực chức năng Trong cơ sở dữ liệu riecircng caacutec khu vực khaacutec nhau coacute thể định nghĩa vagrave lưu

trữ dữ liệu thocircng qua phiecircn bản của chiacutenh noacute Khi dữ liệu được lấy từ những vugraveng khaacutec nhau đoacute vagrave được đặt vagraveo kho dữ

liệu Việc chuyển đổi vagrave lagravem sạch caacutec tiến trigravenh sẽ đảm bảo noacute lagrave duy nhất được tiacutech hợp tại một mức của tổ chức

15Ragrave soaacutet lại dữ liệu ndash Thực thi siecircu dữ liệu

Bất kể cấu truacutec tự nhiecircn của 1 cacircu truy vấn thế nagraveo thigrave caacutec thagravenh phần của siecircu dữ liệu rất quan trọng đối với người ra quyết định

Bảng thuộc tiacutenh khoacutea được lưu trữ bởi kho dữ liệu Tập hợp dữ liệu được lấy từ đacircu Những chuyển đổi nagraveo được thực thi với việc lagravem sạch

16Siecircu dữ liệu lagrave gigrave Metadata - lagrave thocircng tin mocirc tả nội dung của cơ sở dữ liệu (CSDL) Metadata baacuteo cho người dugraveng biết thời gian cập nhật sau cugraveng của dữ liệu

định dạng vagrave mục điacutech sử dụng của noacute Những thocircng tin nagravey coacute thể hướng dẫn người dugraveng duyệt qua CSDL vagrave

giuacutep họ hiểu được yacute nghĩa vagrave ngữ cảnh của dữ liệu Trong CSDL metadata lagrave caacutec dạng biểu diễn khaacutec nhau của caacutec đối tượng

trong CSDL Trong CSDL quan hệ metadata lagrave caacutec định nghĩa của bảng cột CSDL

view vagrave nhiều đối tượng khaacutec Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột

một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi -gtMetadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu

Bảng chuyển đổi Ghi lại những chuyển đổi đatilde được thực hiện

Lịch sử thực thi Ghi lại những dữ liệu đatilde được

phacircn tiacutech

Higravenh thaacutei kết nốiGhi lại những dữ liệu được kết nối vagrave tần suất

17Aacutenh xạ thocircng thường của siecircu dữ liệu Bản ghi aacutenh xạ chuyển đổi bao gồm

Định danh của nguồn gốc Chuyển đổi thuộc tiacutenh Chuyển đổi thuộc tiacutenh vật lyacute Matilde hoacutea tham chiếu bảng chuyển đổi Đổi tecircn Đổi khoacutea Gaacuten giaacute trị cho thuộc tiacutenh mặc định Chọn logic cho caacutec nguồn nhiều giaacute trị Đổi thuật toaacuten

18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để

phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai

lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave

tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec

Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm

Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo

19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua

caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau

SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được

Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra

một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức

Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ

Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ

Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech

CHƯƠNG 11 KHAI PHAacute DỮ LIỆU

1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn

ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993

Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng

2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd

1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều

2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP

3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn

4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng

5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server

6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo

7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động

8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời

9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều

10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện

11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech

12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP

3 Xử lyacute phacircn tiacutech trực tuyến OLAP

MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave

dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu

ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave

thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu

HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave

ROLAP4 Khai phaacute dữ liệu

Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh

khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn

Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan

5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp

6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại

Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp

Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec

Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt

Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra

Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh

vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho

Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec

Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm

Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục

Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng

gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp

Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn

Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec

Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper

Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2

Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25

Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước

Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng

Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện

trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp

Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute

độ hỗ trợ ge ngưỡng minsup

độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan

Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn

Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết

Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu

MOLAP ROLAP HOLAP

Lưu trữ dữ liệu cơ sở

Khối Bảng quan hệ Bảng quan hệ

Lưu trữ thocircng tin tổng hợp

Khối Bảng quan hệ Khối

Hiệu suất thực hiện truy vấn

Nhanh nhất Chậm nhất Nhanh

Tiecircu thụ khocircng gian lưu trữ

Nhiều Thấp Trung bigravenh

Chi phiacute bảo trigrave Cao Thấp Trung bigravenh

Page 23: De cuong(1-11)

Mạng vograveng trograven Tương tự như chuỗi nhưng kết thuacutec được kết nối

Mạng kết nối hoagraven toagraven khocircng coacute hạn chế về giao tiếp vagrave tương taacutec giữa caacutec thagravenh viecircnNoacutei chungnoacute đaacutep ứng hầu hết caacutec kết nối của người tham gia nhưng truyền đạt thocircng tin mất nhiều thời gian vagrave coacute nhiều cơ hội xảy ra lỗi

Nhoacutem hagravenh vi vagrave chuẩn mực

MDMs thiết lập caacutec chỉ tiecircu hướng dẫn quaacute trigravenh ra quyết định

Một chuẩn mực quy định cụ thể những gigrave thagravenh viecircn trong nhoacutem dự kiến sẽ lagravem trong những hoagraven cảnh nhất định

Quy tắc gửi coacute thể được thocircng qua viacute dụ đaacutenh giaacute ngang hagraveng hoặc xử phạt

Lagravem thế nagraveo để đưa ra quyết định

Việc chọn lựa magrave trong đoacute việc sử dụng cấu truacutec MDM phải được dựa trecircn một số yếu tố liecircn quan với bối cảnh quyết định

Viacute dụmột cấu truacutec riecircng lẻ sẽ lagravem việc nơi magrave quyết định được cấu truacutec cao vagrave thocircng tin lagrave coacute sẵn

Một ủy ban cơ cấu sẽ lagrave sự lựa chọn khi người ra quyết định khocircng thể đưa ra quyết định một migravenh

52Caacutec vấn đề thường gặp trong nhoacutem

Kiacutech thước Noacutei chung sự nhất triacute vagrave gắn kết giữa caacutec thagravenh viecircn tỉ lệ nghịch với phạm vi nhoacutem Trong nhoacutem lớn rất dễ higravenh thagravenh caacutec nhoacutem nhỏ vagrave hoạt động rời rạc

Tư duy tập thể Trong nhoacutem lớn mọi người coacute xu hướng suy nghĩ đểđạtđược sự nhất triacute necircn khocircng phaacutet huy được sự saacuteng tạo

Caacutec vấn đề về xatilde hội

Xung đột Trong 1 nhoacutem ai cũng muốn migravenh lagrave giỏi nhất necircn dễ dẫn đến xung đột

Ẩn danh(Giấu tecircn) Đacircy lagrave phương phaacutep được sử dụng để kiểm soaacutet xung đột Cho caacutec thagravenh viecircn tham gia ẩn danh

Vấn đề giới tiacutenh Nam vagrave nữ thường coacute những thế mạnh khaacutec nhau điều nagravey coacute thể lagrave sức mạnh trong 1 thiết lập MDM

Đagravem phaacuten vagrave quyết định

Một quyết định coacute thể liecircn quan đến nhiều quan điểm khaacutec nhau vigrave thế cần phải coacute sự đagravem phaacuten

Caacutec thiết kế của cơ chế hỗ trợ cho MDM phải phugrave hợp với caacutec hoạt độngđagravemphaacuten

Những hoạt động nagravey bao gồm việc thu nhận yacute kiến của caacutec thagravenh viecircn 1 caacutech cocircng bằng

53Cocircng nghệ hỗ trợ MDM

Organizational DSSndash 1 hệ thống cung cấp caacutec quyết định hỗ trợ

Group Support Systemndash Cocircng nghệ sử dụng sự hỗ trợ của nhiều becircn tham gia

Group DSS ndash Lagrave 1 hệ thống được thiết kế đặc biệt để hỗ trợ cho MDM

DSS ndash Lagrave 1 hệ thống dưới sự kiểm soaacutet của 1 người quyết định hệ thống nagravey cung cấp 1 bộ cocircng cụ giuacutep phacircn tiacutech hoagraven cảnh đểđưa ra quyết định vagrave nacircng cao hiệu quả của quyết địnhđoacute

53Cocircng nghệ hỗ trợ MDM

Organizational DSSndash 1 hệ thống cung cấp caacutec quyết định hỗ trợ

Group Support Systemndash Cocircng nghệ sử dụng sự hỗ trợ của nhiều becircn tham gia

Group DSS ndash Lagrave 1 hệ thống được thiết kế đặc biệt để hỗ trợ cho MDM

DSS ndash Lagrave 1 hệ thống dưới sự kiểm soaacutet của 1 người quyết định hệ thống nagravey cung cấp 1 bộ cocircng cụ giuacutep phacircn tiacutech hoagraven cảnh đểđưa ra quyết định vagrave nacircng cao hiệu quả của quyết địnhđoacute

Mục tiecircu của cocircng nghệ hỗ trợ MDM

Quy trigravenh hỗ trợ tập trung vagraveo quaacute trigravenh tạo điều kiện thuận lợi cho sự tương taacutec

Cơ chế cấu truacutec quaacute trigravenh chi phối caacutec hoạt động truyền thocircng

Nhiệm vụ hỗ trợ cocircng việc coacute thể chọn lựa tổ chức hoặc lấy thocircng tin

Nhiệm vụ cấu truacutec cocircng việc cho pheacutep truy cập đến kỹ thuật lọc kết hợp phacircn tiacutech kiến thức liecircn quan đến cocircng việc

Caacutec lớp loại cocircng nghệ hỗ trợ MDM

Phacircn loại theo đặc điểm do DeSanctis vagrave Gallupe đưa ra đề xuất một chương trigravenh ba cấp dựa trecircn caacutec tiacutenh năng được cung cấp

Hệ thống cấp 1 Mục điacutech chiacutenh lagrave tạo điều kiện thocircng tin liecircn lạc giữa caacutec thagravenh viecircn

Hệ thống cấp 2 Thiết kế để giảm thiểu rủi ro

Hệ thống cấp 3 Giuacutep điều chỉnh xử lyacute quyết định

Phacircn loại theo cocircng nghệ -Kraemer vagrave King tập trung vagraveo cocircng nghệ aacutep dụng

Cocircng nghệ bảng mạch điện tử

Hội nghị trực tuyến

Mạng lưới tập đoagraven

Trung tacircm thocircng tin

Mocirci trường cộng taacutec

Phograveng quyết định

Nhoacutem phần mềm

Phần mềm được thiết kế để hỗ trợ sự hợp taacutec bao gồm việc thu huacutet vagrave lưu trữ thocircng tin

Caacutec tổ chức dẫn đầu thị trường hiện tại lagrave Lotus Notes and Domino Microsoft Exchange Novell GroupWise and Oracle Office

Caacutec cocircng cụ trong một bộ phần mềm bao gồm người quản lyacute hội nghị (Lotus Sametime) vagrave trao đổi thocircng điệp (Lotus Notes Mail)

Xếp hạng phần mềm cho nhoacutem

Ellis vv đề xuất một hệ thống xếp hạng dựa vagraveo kiểu sự hỗ trợ noacute Cung cấp

Hệ thocircng điệp

Hệ thống hội thảo truyền higravenh

Hệ thống cộng taacutec soạn thảo

Nhoacutem phacircn phối giải phaacutep phần mền

Hệ thống phối hợp

Hệ thống thocircng minh đại diện

Lực lượng điều khiển phaacutet triển phần mềm cho nhoacutem

Một số nhacircn tố chiacutenh bao gồm

Tăng năng suất

Giảm số lượng caacutec cuộc họp

Tăng cường tự động hoacutea caacutec quy trigravenh lagravem việc thường xuyecircn

Cần phối hợp toagraven cầu tốt hơn

Tiacutenh sẵn sagraveng của những mạng lan rộng

Coleman vagrave Khanna liệt kecirc 10 nhacircn tố khaacutec

54Quản lyacute hoạt động MDM (Mobile Device Management - Quản lyacute thiết bị di động)

Một số phương phaacutep phối hợp phổ biến hơnMDM lagrave

Kỹ thuật nhoacutem định danh

Kỹ thuật Delphi

Sự phacircn xử

Hệ thocircng tin dựa trecircn vấn đề

Nemawashi

Kỹ thuật nhoacutem định danh

1-Mỗi người tham gia viết ra những yacute tưởng về những gigrave necircn quyết định

2-Lần lượt mỗi người tham gia trigravenh bagravey yacute tưởng của migravenh được ghi lại trecircn bảng Khocircng thảo luận ở đacircy

3-Sau khi tất cả caacutec yacute tưởng được trigravenh bagravey caacutec đại biểu coacute thể chất vấn những người khaacutec

4-Mỗi người tham gia bỏ phiếu cho mỗi yacute tưởng

Kỹ thuật Delphi

Về cơ bản tương tự như kỹ thuật nhoacutem định danh ngoại trừ những người khocircng bao giờ tham gia cuộc họp

Một cocircng cụ khảo saacutet được sử dụng để thu thập đầu vagraveo ban đầu từ caacutec thagravenh viecircn

Một cuộc khảo saacutet thứ hai được gửi đi với một bản toacutem tắt caacutec kết quả chung

Những bước lặp lại cho đến khi đạt được một sự đồng thuận hoặc nhigraven nhận của đa số

Sự phacircn xử(Arbitration )

Thiacutech hợp nhất khi caacutec thagravenh viecircn của MDM đại diện cho caacutec yếu tố đối lập

Những người tham gia đồng yacute rằng nếu lựa chọn thay thế hai becircn thỏa thuận khocircng được tigravem thấy thigrave một trọng tagravei viecircn becircn ngoagravei sẽ tham gia

Trọng tagravei sau đoacute lựa chọn thay thế ocircng hoặc xeacutet thấy thiacutech hợp nhất

Hệ thống thocircng tin dựa trecircn vấn đề (IBIS)

Lagrave một phương phaacutep lập luận cấu truacutec

Một đại diện cho IBIS lagrave một đồ thị với caacutec nuacutet vagrave caacutec liecircn kết

IBIS bắt đầu với lựa chọn của một nuacutet vấn đề gốc sau đoacute caacutec nuacutet vị triacute khaacutec nhau được liecircn kết với nuacutet gốc

Caacutec nuacutet vị triacute nagravey sau đoacute được đaacutenh giaacute dựa trecircn những lập luận gắn liền với chuacuteng

Nemawashi (được sử dụng rộng ratildei tại Nhật Bản)

1-Một hoặc nhiều thagravenh viecircn của MDM được chỉ định lagrave điều phối viecircnCaacutec điều phối viecircn sau đoacute chọn người tham gia cograven lại

2-Điều phối viecircn xacircy dựng một tổng hợp caacutec sự lựa chọn vagrave sau đoacute caacutec chuyecircn gia đaacutenh giaacute caacutec lựa chọn

3-Điều phối viecircn lựa chọn một sự lựa chọn dựa trecircn kết quả ở trecircn(ở 2)

4-Sự thay thế được luacircn chuyển điều phối viecircn tigravem kiếm sự đồng thuận thocircng qua sự thuyết phục vagrave đagravem phaacuten

5-Nếu đạt được sự đồng thuận điều phối viecircn cho lưu thocircng một tagravei liệu magrave mỗi thagravenh viecircn MDM để lại dấu hiệu trecircn đoacute

55Nơi lagravem việc ảo

Nhiều tổ chức trecircn toagraven thế giới kinh doanh bất động sản cho cocircng nghệ hợp taacutec

Cocircng việc được trở thagravenh một điều bạn lagravem hơn lagrave một nơi bạn đi

Những thay đổi lớn nhất mang lại bởi nơi lagravem việc ảo coacute thể lagrave về văn hoaacute hay xatilde hội hơn lagrave về cocircng nghệ

Chương 6 Hệ thống thocircng tin điều hagravenh

61 Yacute nghĩa của EIS- Hệ thống thocircng tin điều hagravenh

- EIS lagrave một dạng đặc biệt của DSS được thiết kế để hỗ trợ ra quyết định ở cấp cao nhất của một tổ chức

- Lagrave một hệ thống thocircng tin hỗ trợ nhu cầu lập kế hoạch vagrave đaacutenh giaacute của caacutec nhagrave quản lyacute điều hagravenh

- EIS coacute thể giuacutep một CEO coacute được bức tranh tổng thể chiacutenh xaacutec nhất về caacutec hoạt động vagrave một bản toacutem tắt những gigrave magrave đối thủ cạnh tranh đang lagravem

- Caacutec hệ thống nagravey noacutei chung hoạt động dễ dagraveng vagrave trigravenh bagravey thocircng tin theo những caacutech dễ hiểu để việc tiếp thu được nhanh choacuteng (biểu đồ đồ thịhellip)

(Tagravei liệu thecircm EIS lagrave những loại hệ thống lagrave rất phức tạp trong tự nhiecircn Coacute thể noacutei hệ thống nagravey cũng cung cấp cho caacutec nhagrave quản lyacute với caacutec thiết bị coacute khả năng ra quyết định bằng caacutech sử dụng của noacute Hệ thống nagravey hoạt động trong điều kiện như vậy quan trọng như trong caacutec hệ thống khaacutec khocircng hỗ trợ Khả năng lưu trữ dữ liệu nặng lagravem cho noacute lyacute tưởng để được thocircng qua khocircng chỉ bởi caacutec doanh nghiệp lớn magrave cograven bởi caacutec doanh nghiệp nhỏ hơn Nhigraven chung hệ thống nagravey lagrave dagravenh cho caacutec nhacircn viecircn cấp cao hỗ trợ thagravenh thạo trong việc đưa ra caacutec quyết định quan trọng)

Caacutec phiecircn EIS tiecircu biểu- Phiecircn lagravem việc coacute thể bắt đầu với một baacuteo caacuteo về tigravenh higravenh tagravei chiacutenh vagrave kinh

doanh của một cocircng ty caacutec chỉ số hoạt động quan trọng được hiển thị rotilde ragraveng- EIS sẽ cho pheacutep caacutec giaacutem đốc điều hagravenh coacute thể đi sacircu vagraveo dữ liệu từ những con

số bất kỳ magrave noacute hỗ trợ- Việc điều hagravenh coacute thể lựa chọn một mức độ chi tiết ( VD danh số baacuten hagraveng) nếu

như cần điều tra thecircm- Lagrave một phương phaacutep tiếp cận coacute thể giuacutep việc ra quyết định tốt hơn

Những điều magrave EIS ko coacute- EIS khocircng phải lagrave sự thay thế cho caacutec hệ thống dựa trecircn caacutec maacutey tiacutenh khaacutec EIS

thực sự chỉ cung cấp dữ liệu cho caacutec hệ thống nagravey- Noacute khocircng thể biến caacutec bộ hệ điều hagravenh của maacutey tiacutenh thagravenh những ldquochuyecircn viecircn

giỏirdquo- Coacute thể được viacute một caacutech cao hơn như lagrave một trợ lyacute đaacuteng tin cậy coacute thể được gọi

đến bất khi nagraveo vagrave mỗi khi cần thiết

Tagravei liệu thecircm Sự khaacutec nhau giữa EIS vagrave DSS+ EIS thiết kế để hỗ trợ những người điều hagravenh cấp cao giuacutep họ khaacutem phaacute caacutec vấn đề vagrave caacutec cơ hội DSS hỗ trợ những nười phacircn tiacutech cố gắng trả lời cacircu hỏi caacutei gigrave coacute thể lagravem cugraveng với một cơ hội hoặc một vấn đề

Chiều EIS DSSNhững người sử dụng thocircng thường

Duyệt dữ liệu đi xuống truy xuất trạng thaacutei

Hỗ trợ phacircn tiacutech vagrave quyết định

Sự thuacutec đẩy Tiacutenh thiacutech hợp Tiacutenh hiệu quảỨng dụng Queacutet mocirci trường đaacutenh giaacute

hiệu suất nhận dạng caacutec vấn đề vagrave caacutec cơ hội

Caacutec quyết định quản lyacute trecircn caacutec lĩnh vực đa dạng

Hỗ trợ quyết định Caacutec chiacutenh saacutech caacutec quyết định khocircng coacute cấu truacutec ở mức cao vagrave hỗ trợ giaacuten tiếp

Hỗ trợ caacutec quyết định lặp lại caacutec quyết định khocircng thể đoaacuten trước ra quyết định khocircng coacute cấu truacutec vagrave baacuten cấu truacutec

Loại thocircng tin Caacutec thocircng tin tin tức thocircng tin becircn ngoagravei về khaacutech hagraveng đối thủ cạnh tranh mocirci trường caacutec baacuteo caacuteo theo yecircu cầu vagrave định thời về caacutec hoạt động becircn trong

Caacutec thocircng tin hỗ trợ caacutec tigravenh huống đặc biệt

Sử dụng coacute nguyecircn tắc

Dograve theo vết vagrave điều khiển nhận dạng cơ hội

Hoạch định tổ chức phacircn nhoacutem vagrave điều khiển

Khả năng phugrave hợp với những người sử dụng caacute nhacircn

Thiết kế loại ra quyết định cho mỗi người điều hagravenh caacute nhacircn bằng nhiều lựa chọn đầu ra

Cho pheacutep caacutec đaacutenh giaacute caacute nhacircn caacutec khả năng what-if lựa chọn loại hộp hội thoại

Đồ họa Phải coacute Lagrave một phần quan trọng của nhiều DSS

Thacircn thiện người sử dụng

Phải coacute Phải coacute nếu khocircng coacute người sử dụng trung gian

Xử lyacute thocircng tin Lọc neacuten thocircng tin dograve theo vết dữ liệu vagrave thocircng tin quan trọng

EIS kiacutech thiacutech caacutec cacircu hỏi caacutec cacircu trả lời bằng caacutech sử dụng DSS vagrave phản hồi lại EIS

Hỗ trợ caacutec thocircng tin chi tiết

Truy xuất thường xuyecircn caacutec mức chi tiết của bất kỳ thocircng tin tổng hợp nagraveo (duyệt dữ

Coacute thể coacute trong DSS nhưng khocircng thường

liệu chi tiết)Cơ sở mocirc higravenh Caacutec chức năng coacute sẵn bị hạn

chếLagrave điểm cốt lotildei của DSS

Cấu truacutec Theo người baacuten sản phẩm hoặc theo caacutec chuyecircn gia hệ thống thocircng tin

Theo người sử dụng hoặc caacute nhacircn hoặc caacutec chuyecircn gia từ caacutec trung tacircm thocircng tin hoặc phograveng ban hệ thống thocircng tin

Phần cứng Mainframe caacutec trạm RISC mạng LANs hoặc caacutec hệ thống phacircn bố

Mainframe caacutec trạm RISC caacutec maacutey PC hoặc caacutec hệ thống phacircn bố

Bản chất caacutec goacutei phần mềm

Truy xuất tương taacutec dễ dagraveng đến nhiều cơ sở dữ liệu truy xuất trực tuyến caacutec khả năng DBMS phức tạp caacutec liecircn kết phức tạp

Caacutec khả năng tiacutenh toaacuten lớn caacutec ngocircn ngữ mocirc higravenh mocirc phỏng ứng dụng vagrave caacutec bộ tạo DSS

Bản chất caacutec thocircng tin

Trigravenh bagravey thocircng tin được phaacutet sinh trước về quaacute khứ vagrave hiện tại tạo caacutec thocircng tin mới về quaacute khứ hiện tại tương lai

Tạo thocircng tin mới về quaacute khứ hiện tại tương lai

62 Lịch sử EIS- EIS xuất hiện lần đầu tiecircn tại MIT vagraveo những năm 1970

- Những EIS đầu tiecircn được phaacutet triển bởi caacutec doanh ngiệp lớn sẵn sagraveng chấp nhận rủi ro để đạt được lợi thế cạnh tranh

- Vagraveo những năm 1980 caacutec nhagrave cung cấp đatilde phaacutet triển một số cơ sở khaacutech hagraveng rộng vagrave cocircng nghệ EIS được tiếp tục phaacutet triển cho đến ngagravey nay

(Tagravei liệu thecircm Sử dụng DSSEIS cho phaacutet triển bền vững + Một số nghiecircn cứu đatilde được tiến hagravenh để kiểm tra việc thực hiện của EIS trong khu vực cocircng cộng vagrave chiacutenh phủ caacutec nước tổ chức kể từ khi chuacuteng được phaacutet triển theo định hướng lợi nhuận cho caacutec cocircng ty tư nhacircn (Hasan vagrave Hasan năm 1997) Theo một nghiecircn cứu tiến hagravenh tại Mỹ ở hơn 300 cocircng ty kết quả cho thấy sự khaacutec biệt của EIS giữa tư nhacircn vagrave chiacutenh phủ một số kết quả thuacute vị được phaacutet hiệnViacute dụ khoacute khăn hơn để chuyển tiền từ một tagravei khoản khaacutec trong một EIS của chiacutenh phủ cũng lagrave khoacute khăn hơn để biện giải thiacutech cho những chi phiacute phaacutet triển EIS của chiacutenh phủ Một nghiecircn cứu khaacutec được tiến hagravenh ở Australia

cho thấy rằng EIS cung cấp cho quản lyacute một higravenh ảnh chiacutenh xaacutec hơn về tổ chức thực hiện vagrave cung cấp hỗ trợ cho caacutec lợi iacutech chiến lược cải thiện khocircng chỉ cho caacutec nhagrave quản lyacute nhưng cograven cho phần cograven lại của tổ chức Dựa trecircn caacutec hệ thống được thiết kế cho caacutec cocircng ty tư nhacircn với một caacutech rotilde ragravengxaacutec định mục tiecircu EIS lagrave thiacutech hợp cho caacutec tổ chức cocircng cộng hiện đại nhưng cần phải được linh hoạt hơn vagrave kết thagravenh chugravem một phạm vi rộng hơn khả năng vagrave phương tiện hơn so với khu vực tư nhacircn ban đầu theo định hướng sản phẩm (Hasan vagrave Hasan năm 1997) Điều nagravey coacute thể lagrave do thực tế rằng caacutec hoạt động khu vực cocircng lagrave bắt buộc coacute taacutec động rộng phải đaacutep ứng sự mong đợi duy nhất cocircng cộng thường coacute mục tiecircu mơ hồ vagrave macircu thuẫn iacutet quyền tự chủ vagrave kiểm soaacutet việc ra quyết định vagrave nhacircn viecircn lagrave khoacute khăn hơn (Watson vagrave Carte2000) + Toacutem lại EIS lagrave một khaacutei niệm thagravenh cocircng noacute phaacutet triển qua nhiều năm tuy nhiecircn EIS khắc phục khiếm khuyết của migravenh bằng caacutech tiến hagravenh nghiecircn cứu liecircn tục)

63 Tại sao những người điều hagravenh hagraveng đầu lại khaacutec nhau- Họ lagrave những doanh nghiệp theo định hướng coacute suy nghĩ

- Coacute một khoảng khocircng gian rộng để kiểm soaacutet

- Họ chịu traacutech nhiệm cho việc thiết lập chiacutenh saacutech

- Họ đại diện cho tổ chức mocirci trường becircn ngoagravei

- Hagravenh động của họ tạo ra những kết quả đaacuteng kể về tagravei chiacutenh vagrave con người

Tần số caacutec hoạt động điều hagravenh- Xử lyacute xaacuteo trộn 42

- Hoạt động kinh doanh 32

- Phacircn bổ nguồn lực 17

- Đagravem phaacuten 3

- Những điều khaacutec 6

Handling Disturbances 42

Entrepreneurial Activites 32

Resource Allocation 17

Negotiation 3

Other 6

Những thocircng tin điều hagravenh cần thiết- Quản lyacute xaacuteo trộn coacute thể yecircu cầu sự chuacute yacute xung quanh đồng hồ

- Hoạt động kinh doanh yecircu cầu điều hagravenh để dự đoaacuten những thay đổi trong mocirci trường

- Nhiệm vụ phacircn bổ tagravei nguyecircn yecircu cầu lựa chọn người quản lyacute vagrave caacutec nguồn lực hạn chế được triển khai

- Đagravem phaacuten yecircu cầu cập nhật thocircng tin từng phuacutet để coacute thể xacircy dựng được sự đồng thuận

Caacutec loại thocircng tin điều hagravenh- Hệ thống kế toaacuten coacute liecircn quan đến việc tiacutenh toaacuten thu nhập hoạt động cho caacutec lĩnh

vực cụ thể lagrave quan trọng hơn so với caacutec hệ thống kế toaacuten truyền thocircng- Thocircng tin về thị trường khaacutech hagraveng cung cấp giaacute trị trong việc quyết định chiến

lược- Caacutec thocircng tin cần thiết thường được truyền đi trecircn một số hệ thống maacutey tiacutenh vagrave

nằm trong toagraven tổ chức- Caacutec thocircng tin được sử dụng thường lagrave ngắn hạn vagrave dễ thay đổi

Phương thức để xaacutec định thocircng tin cần thiết

Rockart xaacutec định được năm phương thức cơ bản để xaacutec định thocircng tin cần thiết

- Phương thức dựa trecircn kết quả- Phương thức rỗng- Phương thức chỉ số khoacutea- Phương thức tổng hợp nghiecircn cứu- Phương thức dựa vagraveo nhacircn tố then chốt dẫn đến thagravenh cocircng

64 Thagravenh phần EIS

- Sản phẩm EIS đầu tiecircn được phaacutet triển để sử dụng trecircn maacutey tiacutenh cấu higravenh cao nhưng caacutec sản phẩm hiện nay nhằm mục tiecircu lagrave nền tảng ClientServer

- Những nền tảng linh hoạt hơn coacute thể thiacutech ứng với thay đổi trong tổ chức vagrave cocircng nghệ

- Sử dụng dữ liệu thời gian thực dẫn đến quyết định nhanh hơn nhiều thocircng tin hơn

Thagravenh phần phần cứng- Một EIS khocircng đogravei hỏi coacute phần cứng cụ thể hoặc duy nhất nagraveo- Chigravea khoacutea của vấn đề lagrave để đảm bảo rằng caacutec thagravenh phần của EIS tối ưu hoacutea vagrave

phugrave hợp với tagravei nguyecircn maacutey tiacutenh của tổ chức- Hệ thống nagravey phải được cấu higravenh để caacutec nguồn tagravei nguyecircn phugrave hợp với những

người điều hagravenh chuacuteng

Thagravenh phần phần mềm- Traacutei ngược với phần cứng phần mềm thường được chuyecircn mocircn hoacutea cao cho caacutec

bagravei toaacuten về miền- Sự chuyecircn mocircn hoacutea nagravey thường đạt được bằng caacutech sử dụng thagravenh phần off-the-

shelf cho toagraven bộ EIS vagrave caacutec mocirc-đun tugravey chỉnh để đaacutep ứng nhu cầu cụ thể- Lotus Notes lagrave một viacute dụ điển higravenh Noacute coacute thể được sử dụng một migravenh hoặc coacute

thể phục vụ becircn thứ ba mocirc-đun plug-in

Cocircng nghệ EIS hiện nay

Dobrzeniecki đề xuấtphacircn loạitừng cấptheo bachức năng- Loại 1 sản phẩm bao gồmmột bộ đầy đủcaacutec ứng dụngtừ mộtnhagrave cung cấp- Loại 2 sản phẩm đượcthựchiệnở phần đầu củacaacutecsản phẩmDSS đượcphaacutet triển

bởicugravengmộtnhagrave cung cấp- Loại 3 sản phẩmkết hợp với nhautheo bất kỳ số lượngthuộc sở hữu củacocircng ty

65 Xacircy dựng EIS

- Xacircy dựngmộtEISgiống nhưxacircydựngmột số hệ thống khaacutec củamocirc higravenh hệ thống thocircng tin

- Việcphaacutet triểncấu truacutecnecircn được theo dotildeitừ quaacute trigravenh thiết kế đến quaacute trigravenhthực hiện

- Tuy nhiecircn một dự aacuten phaacutet triển EIScoacute xu hướnglagrave thống nhấtvagraveyecircu cầu hỗ trợ caacutec nhagrave quản lyacute latildenh đạo

- Xacircy dựng một EIScoacute thểphaacutet hiện ra đượccaacutectigravenh huống khoacute khănmagravemột nhagrave phaacutet triển chưabao giờ gặp phải

Mocirc higravenh EIS

Khung phaacutet triển một EIS

- Watson et al đề nghị xacircy dựngkhung với ba thagravenh phần+ Caacutech tiếp cận tập trung vagraveo yếu tốcon người vagrave dữ liệu coacute liecircn quan đến EIS+ Quaacute trigravenh phaacutet triển cần sự linh hoạt vagrave tương taacutec+ Người sử dụng - hệ thống hộp thoại bao gồm một ngocircn ngữ hagravenh động để xử lyacute caacutec lệnh

Lợi iacutech của EIS- Dễ duy trigrave caacutec mục tiecircu coacute tổ chức- Dễ truy xuất thocircng tin- Cho pheacutep người sử dụng nacircng cao hiệu suất hơn

- Tăng chất lượng ra quyết định- Cung cấp sự cải tiến cạnh tranh- Tiết kiệm thời gian của người sử dụng- Tăng khả năng vagrave chất lượng giao tiếp- Cung cấp khả năng điều khiển tốt hơn trong tổ chức- Cho pheacutep tham gia caacutec vấn đề vagrave caacutec cơ hội- Cho pheacutep hoạch định- Cho pheacutep tigravem kiếm nguyecircn nhacircn của một vấn đề- Thảo matilden caacutec yecircu cầu của người điều hagravenh

Hạn chế của EIS vagrave 1 số sai lầm cần traacutenh

- Chi phiacute một cuộc khảo saacutetnăm1991 chothấychi phiacute phaacutet triểntrungbigravenh365000USDvớichi phiacute vận hagravenhhagraveng năm lagrave$200000 (EIS)

- Cocircng nghệ hạn chếEIScần phảiđượctiacutech hợp hoagraven toagravenvagraveokiếntruacuteccủadoanh nghiệphiện tại do đoacute noacutelagrave một thaacutech thứclớn đối vớithiết kế

- Hạn chế tổ chức cơ cấu tổ chứccoacute thể khocircng phugrave hợp

Sự hạn chế về tổ chức- Chương trigravenh nghị sự vagrave thời gian chệch EIS mocirc tả một phần việc thực hiện một

chương trigravenh nghị sự vagrave coacute thể dễ dagraveng đạt được sự tin cậy một caacutech chắc chắn- Đồng bộ hoacutea việc quản lyacute sự tin cậy đuacuteng luacutec đặc biệt baacuteo caacuteo EIS coacute thể phaacute

vỡ sự ổn định thiết lập caacutec chu trigravenh baacuteo caacuteo một caacutech tốt nhất- Sự bất ổn EIS phản ứng nhanh coacute thể gacircy ra việc taacutec động trở lại một caacutech

nhanh choacuteng dẫn đến sự thiếu ổn định trong tổ chức

Sự thất bại lagrave thay thế khocircng thể chấp nhận được- Một số yếu tố lagravem EIS thất bại

+ Thiếu sự hỗ trợ về mặt quản lyacute+ Vấn đề chiacutenh trị+ Thất bại của nhagrave phaacutet triển+ Lỗi về cocircng nghệ+ Giaacute cả+ Thời gian

66 Ra quyết định điều hagravenh trong tương lai vagrave EIS

- Coacute một vagravei điều kiện sẽ được hợp nhất cho việc chuyển đổi cocircng nghệ Trong đoacute một vagravei điều kiện coacute thể dễ dự đoaacuten Hai điều kiện magrave ta coacute thể thấy lagrave+ Phaacutet triển cocircng nghệ maacutey tiacutenh trong việc điều hagravenh sẽ tạo ra sự chuyển đổi được chấp nhận một caacutech dễ dagraveng hơn+ Mở rộng traacutech nhiệm điều hagravenh sẽ mở rộng nhu cầu thocircng tin

Tương lai của EIS- EIS thocircng minh Những tiến bộ trong cocircng nghệ AI sẽ được triển khai trong caacutec

EIS- EIS đa phương tiện Cơ sở dữ liệu đa phương tiện sẽ cho pheacutep tiacutech hợp văn bản

giọng noacutei vagrave higravenh ảnh trong tương lai- EIS thocircng tin Tương lai EIS sẽ mở rộng hơn trong việc sử dụng dữ liệu becircn

ngoagravei doanh nghiệp- EIS kết nối Giao tiếp với băng thocircng rộng cho pheacutep kết nối liecircn thocircng lớn hơn

Chương 7 HỆ CHUYEcircN GIA VAgrave TRIacute TUỆ NHAcircN TẠO

71 Caacutec khaacutei niệm

72 Triacute thocircng minh của triacute tuệ nhacircn tạo

73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia

74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia

75 Lợi iacutech vagrave hạn chế của hệ chuyecircn gia

71 Caacutec khaacutei niệm

Chuyecircn mocircn (Expertise) sự hiểu biết rộng trong 1 lĩnh vực hẹp

Hệ chuyecircn gia (Expert Systems)1 chương trigravenh maacutey tiacutenh sử dụng 1 tập caacutec luật dựa trecircn tri thức của con người để giải quyết caacutec vấn đề đogravei hogravei phải coacute sự chuyecircn mocircn

Một số hệ chuyecircn gia nổi tiếng

DENDRAL (Standford 1960s Edward Feigenbaum)

MYCIN (Standford1970s Edward Shortliffe)

PROSPECTOR (MIT 1979)

Triacute tuệ nhacircn tạo (Artificial Intelligence ndash AI)

Triacute tuệ nhacircn tạo một bộ phacircn của ngagravenh khoa học maacutey tiacutenh quan tacircm đến việc thiết kế caacutec hệ thống maacutey tiacutenh thocircng minh đoacute lagrave caacutec hệ thống đưa ra caacutec đặc điểm magrave từ đoacute chuacuteng ta liecircn hệ với sự thocircng minh trong hagravenh động của con người (Barr vagrave Feigenbaum 1981)

Mục điacutech của AI

Mục điacutech khoa học xaacutec định caacutec gợi yacute để giải thiacutech caacutec loại khaacutec nhau của triacute tuệ thực

Mục điacutech kỹ thuật giải quyết caacutec vấn đề trong thế giới thực

Triacute tuệ nhacircn tạo kế thừa nhiều yacute tưởng quan điểm kỹ thuật từ caacutec ngagravenh khoa học khaacutec

- Triết học

- Logic Toaacuten học

- Tiacutenh toaacuten

- Khoa học tacircm lyacute Khoa học nhận thức

- Sinh học Thần kinh học

- Tiến hoacutea

Caacutec lĩnh vực ứng dụng trong Triacute tuệ nhacircn tạo

Mạng nơ ron thần kinh (Neural Networks)

Tiacutenh toaacuten sự tiến hoacutea

(Evolutionary Computation)

Hệ chuyecircn gia (Expert Systems)

Kỹ thuật xử lyacute tiếng noacutei (Speech Processing)

Kỹ thuật xử lyacute ngocircn ngữ tự nhiecircn

(Natural Language Processing)

Lập kế hoạch (Planning)

Robot (Robotics)

Khoa học higravenh ảnh (Vision)

Caacutec kỹ thuật thocircng dụng dugraveng trong AI

Biểu diễn(Representation)

Học (Learning)

Caacutec luật (Rules)

Tigravem kiếm (Search)

72 Triacute thocircng minh của triacute tuệ nhacircn tạo

Con người suy diễn như thế nagraveo

Phacircn loại (Categorization)

Caacutec quy tắc cụ thể

Heuristics

Kinh nghiệm trước đoacute

Dự tiacutenh trước

Maacutey tiacutenh suy diễn như thế nagraveo

Lập luận dựa trecircn luật IF-THEN mocirc tả tri thức được matilde hoacutea dưới dạng caacutec luật

Caacutec khung (Frames) lagrave caacutec đại diện mocirc tả caacutec tigravenh huống giống nhau lagrave điển higravenh của một vagravei phacircn loại

Lập luận dựa trecircn caacutec trường hợp mocirc phỏng giải phaacutep trước đoacute cho một vấn đề hiện tại

Nhận dạng mẫu phaacutet hiện acircm thanh higravenh dạng hoặc caacutec chuỗi dagravei

Caacutec dạng khaacutec của Triacute tuệ nhacircn tạo

Học maacutey- mạng nơron vagrave giải thuật di truyền

Lập trigravenh tự động ndash lagrave những kỹ thuật tạo ra caacutec chương trigravenh để lagravem 1 nhiệm vụ riecircng biệt (cho pheacutep những người khocircng phải lagrave người lập trigravenh coacute thể lập trigravenh được)

Cuộc sống nhacircn tạo ndash nỗ lực để taacutei tạo caacutec hiện tượng sinh học trong caacutec hệ thống dựa trecircn maacutey tiacutenh

73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia(Expert Systems- ES)

Theo Jackson (1999) Một hệ chuyecircn gia lagrave một chương trigravenh maacutey tiacutenh mocirc tả vagrave suy diễn với tri thức của một vagravei lĩnh vực để giải quyết vấn đề hay đưa ra caacutec lời khuyecircn

Cấu truacutec cơ bản của ES được dựa theo cấu truacutec chung của DSS Sự khaacutec biệt chiacutenh giữa ES vagraveDSS lagrave hệ ES thu thập caacutec kiến thức từ những

chuyecircn gia trong lĩnh vực quan tacircmĐặc trưng của hệ chuyecircn gia Hiệu quả cao Thời gian trả lời thỏa đaacuteng Độ tin cậy cao Dễ hiểu

Giao diện người dugraveng trong ES

Thiết kế giao diện người dugraveng tập trung vagraveo caacutec yếu tố như dễ dagraveng sử dụngcoacute độ tin cậy cao giảm tải những khoacute khăn khi sử dụng

Thiết kế necircn coacute một số tương taacutec (đầu vagraveo kiểm soaacutet vagrave truy vấn)

Cấu tạo giao diện người dugraveng gồm coacute magraven higravenh cảm ứng bagraven phiacutem buacutet saacuteng lệnh thoại caacutec phiacutem chuyecircn dụng

Cơ sở tri thức (Knowledge Base)

Chứa đựng caacutec tri thức cụ thể miền thu được từ caacutec chuyecircn gia miền

Coacute thể chứa caacutec mocirc tả caacutec hagravenh vi giải quyết vấn đề caacutec ragraveng buộc caacutec heuristics

Thagravenh cocircng của một ES dựa trecircn tiacutenh đầy đủ vagrave tiacutenh chiacutenh xaacutec của cơ sở tri thức

Mocirc tơ suy diễn (Inference Engine)

Ở đacircy tri thức được đặt để sử dụng tạo ra caacutec giải phaacutep để giải quyết vấn đề

Mocirc tơ nagravey coacute khả năng thực hiện diễn dịch hoặc suy diễn dựa trecircn caacutec luật hay caacutec caacutec sự kiện

Đồng thời cũng coacute khả năng sử dụng caacutec suy diễn mờ hay khocircng chiacutenh xaacutec dựa trecircn xaacutec suất hay aacutenh xạ mẫu

Vograveng điều khiển suy diễn

1 Aacutenh xạ caacutec luật với caacutec sự kiện đatilde được cho

2 Chọn luật để thực hiện

3 Thực hiện luật bằng caacutech thecircm caacutec sự kiện được suy diễn ra vagraveo bộ nhớ lagravem việc

Chuỗi suy diễn (Chaining)

Suy diễn tiến (forward chaining) maacutey suy diễn bắt đầu từ dữ liệu ban đầu vagrave thực hiện việc suy luận để đưa ra caacutec kết luận cuối cugraveng

Suy diễn lugravei (backward chaining) maacutey suy diễn bắt đầu từ dữ liệu điacutech vagrave tigravem ra tri thức hỗ trợ cho dữ liệu điacutech đoacute

Viacute dụ suy diễn lugravei

R1 Nếu coacute A vagrave B thigrave suy ra coacute D

R2 Nếu coacute B thigrave suy ra coacute C

R3 Nếu coacute C vagrave D thigrave suy ra coacute E

Ta coacute E ta xem trong 3 luật R1 R2 R3 luật nagraveo coacute E ta thấy R3 chứa E đồng thời chứa C vagrave D Xeacutet tiếp trong 2 luật R1 R2 luật nagraveo chứa C vagrave D R2 chứa C R3 chứa D Từ đoacute ta coacute được caacutec tri thức hỗ trợ suy diễn vagrave kết luận lagrave nếu coacute A vagrave B thigrave sẽ coacute E Hay nếu A vagrave B đuacuteng thigrave sẽ coacute E

Viacute dụ suy diễn tiến

Giả sử coacute tập chứa 3 luật sau

R1 Nếu coacute A vagrave B thigrave suy ra coacute D

R2 Nếu coacute B thigrave suy ra coacute C

R3 Nếu coacute C vagrave D thigrave suy ra coacute E

Nếu ta coacute A vagrave B thigrave chuacuteng ta suy ra được D từ R1 vagrave suy ra C từ R2 Với D vagrave C đatilde được suy ra ở trecircn giờ chuacuteng ta suy ra được E từ R3

Viacute dụ thực tế

Giả sử muốn biết magraveu của một con vật nuocirci tecircn lagrave Fred biết rằng noacute kecircu ộp ộp vagrave ăn ruồi

Coacute tập 4 luật ban đầu như sau

R1 Nếu X kecircu ộp ộp vagrave ăn ruồi thigrave X lagrave con ếch

R2 Nếu X kecircu chiecircm chiếp vagrave biết hoacutet thigrave X lagrave con chim

R3 Nếu X lagrave con ếch thigrave X coacute magraveu xanh

R4 Nếu X lagrave con chim thigrave X coacute magraveu vagraveng

74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia

Expert system shells lagrave một tập caacutec goacutei phần mềm vagrave caacutec cocircng cụ dugraveng để phaacutet triển caacutec hệ chuyecircn gia

Những Expert system shells đầu tiecircn thường rất rườm ragrave Mặc dugrave vậy noacute vẫn giuacutep cho người sử dụng sẽ khocircng phải bắt đầu lại từ đầu khi xacircy dựng một hệ chuyecircn gia mới

Những shell hiện đại bao gồm hai mocirc-đun chiacutenh lagrave cocircng cụ xacircy dựng một tập quy tắc vagrave mocirc tơ suy diễn

Xacircy dựng hệ chuyecircn gia

Bước 1 xacircy dựng mocirc higravenh bagravei toaacuten xaacutec định vấn đề nhiệm vụ magrave hệ thống sẽ thực hiện Caacutec dạng bagravei toaacuten cần hệ chuyecircn gia

Bagravei toaacuten diễn giải (InterPretation)

Bagravei toaacuten dự baacuteo (Prediction)

Bagravei toaacuten chuẩn đoaacuten (Diagnose)

Bagravei toaacuten gỡ rối (Debugging)

Bagravei toaacuten thiết kế

Tương tự như một dự aacuten phần mềm để xacircy dựng một hệ chuyecircn gia cần phải coacute caacutec yếu tố về nhacircn lực tagravei nguyecircn vagrave thời gian Những yếu tố nagravey ảnh hưởng đến giaacute thah của một hệ chuyecircn giaTrong phần nagravey cacircu hỏi thường được đặt ra lagrave tại sao cần phải xacircy dựng một hệ chuyecircn giaTrước khi bắt đầu phải xaacute định rotilde bagravei toaacuten đạt ra lagrave jiAi lagrave chuyecircn giaAi lagrave người sử dụng

1 Diễn giải (InterPretation) Nghiecircn cứu 1 vấn đề -gt Dựa trecircn những biểu hiện thuộc tiacutenh đặc trưng becircn ngoagravei -gt Tư vấn

(hoặc đưa ra kết luận hay mocirc tả dễ hiểu từ tập dữ liệu thocirc)

2 Bagravei toaacuten dự baacuteo (Prediction) Coacute thể dự đoaacuten được hagravenh vi kết quả dựa trecircn caacutec hiện tượng -gt dự baacuteo

VD Dự baacuteo thời tiết động đấthellip

3 Bagravei toaacuten chẩn đoaacuten (Diagnoss) Xaacutec định caacutec lỗi caacutec bộ phận hỏng hoacutec của hệ thống dựa trecircn caacutec dữ liệu quan saacutet được

4 Bagravei toaacuten gỡ rối (Debugging) Mocirc tả caacutec phương phaacutep khắc phục hệ thống khi gặp sự cố

5 Bagravei toaacuten thiết kế Lựa chọn cấu higravenh caacutec đối tượng nhằm thoả matilden một số ragraveng buộc nagraveo đoacute

6 Giảng dạy Phần mềm dạy học coacute thể chuẩn đoaacuten vagrave sủa lỗi của học sinh trong quaacute trigravenh học tập

Để xaacutec định đuacuteng bagravei toaacuten magrave chuacuteng ta cần giải quyết thigrave phải trả lời đc một số cacircu hỏi

- cần hệ chuyecircn gia

Bước 2 thu thập tri thức lựa chọn cocircng cụ vagrave aacutep dụng

Trong bước thu thập tri thức vấn đề quan trọng lagrave lựa chọn chuyecircn gia những người magrave sẽ đoacuteng goacutep tri thức cho hệ thống Thocircng thường trong suốt quaacute trigravenh phaacutet triển thigrave chuyecircn gia được xem như một thagravenh viecircn của đội phaacutet triển

Hiện nay coacute rất nhiều cocircng cụ để xacircy dựng một hệ chuyecircn gia Phổ biến nhất lagrave JESS CLIPS vagrave OPS5

Bước 3 Thiết kế cơ sở tri thức thiết kế hệ thốngTri thức được biểu diễn trường minh trong cơ sở tri thức

Caacutec chuyecircn gia vagrave kỹ sư tri thức sẽ đối thoại với nhau bằng caacutec kỹ thuật đối thoại Suy diễn (SD) bảng Mocirc higravenh hoacutea SD quy nạp phacircn loại

Vấn đề bagraveo trigrave vagrave phaacutet triển

Caacutec hệ chuyecircn gia đogravei hỏi phải bảo trigrave vagrave phaacutet triển nhiều hơn so với caacutec hệ thống khaacutec Phải thường xuyecircn bổ sung tri thức mới vagrave thay đổi caacutec tri thức cũ để đổi mới hệ chuyecircn gia

Thu thập vagrave khắc phục lỗi do người sử dụng phaacutet hiện để kịp thời khắc phục những sai soacutet của hệ chuyecircn gia

75 Lợi iacutech vagrave hạn chế của caacutec hệ chuyecircn gia

Một số lợi iacutech chiacutenh

Thời gian trả lời hợp lyacute bằng hoặc nhanh hơn so với chuyecircn gia (người) để đi đến cugraveng một quyết định Hệ chuyecircn gia lagrave một hệ thống thời gian thực (real time system)

Khả năng trả lời với mức độ tinh thocircng bằng hoặc cao hơn so với chuyecircn gia (người) trong cugraveng lĩnh vực

Hệ chuyecircn gia giuacutep cho hiệu quả lagravem việc tăng bằng việc sử dụng tập caacutec luật một caacutech nhanh choacuteng magrave ko bị nhầm lẫn chuyecircn gia lagrave người coacute thể quecircn đi một số tri thức cơ sở lyacute luậ nhưng HCG thigrave ko

Quyết định của một người chuyecircn gia coacute thể bị thay đổi vagrave ko coacute tiacutenh thống nhất như quyết định của một hệ chuyecircn gia tạo ra

Hệ chuyecircn gia giuacutep cho người sử dụng coacute thể trau dồi sự hiểu biết trecircn lĩnh vuej cụ thể magrave noacute giải quyết hỗ trợ người ra quyết định coacute trigravenh độ như 1 chuyecircn gia trong quaacute trigravenh gia quyết định

Kiến thức của rất nhiều chuyecircn gia về một lĩnh vực nagraveo đoacute được đưa vagraveo hệ chuyecircn gia lagravem cho CSTT cuat HCG phong phuacute vagrave rộng lớn hơn rất nhiều

HCG giải thiacutech caacutec bước suy luận một caacutech dễ hiểu nhất quaacuten luacutec nagraveo cũng coacute thể sử dụng ko như chuyecircn gia con người

Hạn chế của caacutec hệ chuyecircn gia

Nhược điểm lớn nhất của hệ chuyecircn gia lagrave những yacute kiến chuyecircn mocircn thường rất khoacute matilde hoacutea vagrave giải neacuten

Hệ chuyecircn gia khocircng coacute khả năng tự học tự cập nhật kiến thức mới như caacutec chuyecircn gia magrave cần phải được matilde hoacutea lại khi noacute được cập nhật

Hệ chuyecircn gia khocircng thể nhận ra được vấn đề khocircng nằm trong miền kiến thức của hệ thống

Chương 8 Tri thức vagrave tiếp nhận

1 Bao gồm caacutec vấn đề

Dữ liệu thực tế đo lường hoặc quan saacutet coacute hoặc khocircng coacute bối cảnh

Thocircng tin dữ liệu được tổng hợp một caacutech hữu iacutech để giải quyết những khoacute khăn trong việc đưa ra quyết định

Tri thức bao gồm caacutec ứng dụng quy tắc thocircng tin hướng dẫn của người ra quyết định

2 Những caacutei nhigraven về tri thức

Đại diện lagravem thế nagraveo để diễn tả tri thức viacute dụ như một quyển saacutech khocircng phải lagrave tri thức nhưng noacute lại lagrave một đại diện của tri thức

Sản xuất tri thức lagrave một tập hơp của hagraveng tồn kho coacute thể được sản xuất cũng như mua lại

Tri thức lagrave 1 trong 6 trạng thaacutei của hệ thống

1Dữ liệu 2Thocircng tin 3Cấu truacutec thocircng tin 4Sự thấu hiểu 5Yacute kiến 6 Quyết định

3 Caacutec loại tri thức Phổ biến mocirc tả dữ liệu thocircng tin thủ tục mọi thứ lagravem như thế nagraveo lập luận chiacutenh saacutech hoặc caacutec quy tắc

4 Thu thập Tri thức hệ chuyecircn gia Hầu hết caacutec phương phaacutep đều bắt đầu với mocirc higravenh của caacutec taacutec vụ trong đoacute

hệ chuyecircn gia được xacircy dựng Trong đoacute mocirc tả về caacutec lĩnh vực được tạo ra Caacutec kỹ sư sử dụng caacutec mocirc higravenh giả thuyết vagrave nhận thức về quaacute trigravenh phacircn

tiacutech để gợi ra caacutech giải quyết vấn đề về tri thức từ caacutec chuyecircn gia

5 Caacutec chiều của thu thập tri thức KE- driven caacutec kỹ sư trao đổi trực tiếp với caacutec chuyecircn gia Expert-driven Caacutec chuyecircn gia trực tiếp đưa chuyecircn mocircn của họ vagraveo hệ

thống maacutey tiacutenh Machine-driven Sử dụng caacutec cocircng cụ suy luận để triacutech xuất tri thức từ một

tập caacutec viacute dụ

6 Kỹ thuật thu thập tri thức Trao đổi gồm 2 loại cơ bản lagrave coacute cấu truacutec(coacute kịch bản) vagrave khocircng coacute cấu

truacutec( đối thoại trực tiếp) Giao thức phacircn tiacutech bằng lời Khi caacutec chuyecircn gia thực hiện một cocircng việc

của họ thigrave một bản ghi về cocircng việc đoacute được thực hiện Caacutec kỹ sư sẽ xacircy dựng mocirc higravenh cho những gigrave được ghi lại trong bản ghi

Phương phaacutep sagraveng lọc caacutec chuyecircn gia so saacutenh caacutec nhoacutem liecircn tiếp trong ba đối tượng vagrave cho biết tại sao nhoacutem thứ hai lại khaacutec nhoacutem thứ ba

7 Thu thập tri thức từ nhiều nguồn Thu thập tri thức từ nhiều nguồn lagrave cần thiết để coacute được đầy đủ caacutec tri thức

cho một vấn đề quan điểm yacute kiến traacutei ngược nhau thường phaacutet sinh Phương phaacutep đồng thuận sẽ giuacutep giải quyết được vấn đề macircu thuẫn Kỹ thuật phacircn tiacutech Meta lagrave kỹ thuật được aacutep dụng trong caacutec trường hợp

khaacutec Caacutech tiếp cận bằng định lượng đogravei hỏi caacutec kỹ sư cần cacircn nhắc yếu tố đầu vagraveo của caacutec chuyecircn gia khaacutec nhau

8 Xaacutec nhận hợp lệ vagrave kiểm tra tri thức Một khi thu thập tri thức noacute phải được đaacutenh giaacute về khả năng sử dụng vagrave độ

chiacutenh xaacutec Hai vấn đề cụ thể lagrave hiệu lực của những kiến thức vagrave kiểm tra việc xacircy dựng cơ sở của tri thức

Cần xaacutec nhận xem liệu hệ thống coacute thể hoạt động ở mức độ tối thiểu khocircng

Xaacutec minh liecircn quan đến việc so saacutenh từng chi tiết kỹ thuật của hệ thống những gigrave đatilde được thực hiện cuối cugraveng

9 Một số caacutec biện phaacutep xaacutec nhận Độ chiacutenh xaacutec Khả năng thiacutech nghi Mức độ đầy đủ Bề rộng Độ sacircu Hiệu lực Tổng quan Chiacutenh xaacutec Hiện thực Độ tin cậy Tiacutenh hữu dụng Mức độ

Chương 9 Học maacutey

1 Logic mờ vagrave ngocircn ngữ mờ(Fuzzy Logic and Linguistic Ambiguity)

Ngocircn ngữ tự nhiecircn gồm những khaacutei niệm mơ hồ vagrave khocircng chiacutenh xaacutectruyền tải ngữ nghĩa thocircng qua tiacutenh xấp xỉkhocircng rotilde ragraveng

Những xấp xỉ nagravey giuacutep con người coacute thể truyền tải hết được yacute nghĩa nhưng maacutey thigrave khocircng hiểu

Lagravem sao biểu diễn caacutec tri thức sử dụng caacutec khaacutei niệm khocircng rotilde ragraveng(mờ) hoặc khocircng chiacutenh xaacutec

2 Khaacutei niệm cơ bản của logic mờ tập mờ lagrave những tập hợp khocircng coacute một giới hạn rotilde Mỗi phần tử của noacute chỉ

chứa một mức độ hagravem liecircn thuộc của từng phần tử Vigrave vậy tập mờ khocircng giống như tập cổ điển Tập mờ coacute thể kết hợp với nhau qua những luật mờ magrave đặc trưng cho những hagravenh động trạng thaacutei vagrave thuộc tiacutenh của logic mờ được tận dụng khi thực hiện một bộ điều khiển mờ

Logic mờ dựa trecircn yacute tưởng mỗi phần tử thuộc vagraveo một tập hợp ở một mức độ nagraveo đấy

Locircgic mờ cho pheacutep độ liecircn thuộc (microA )coacute giaacute trị trong khoảng (01) Locircgic mờ coacute thể được coi lagrave mặt ứng dụng của lyacute thuyết tập mờ để xử lyacute caacutec

giaacute trị trong thế giới thực cho caacutec bagravei toaacuten phức tạp

3 So saacutenh tiacutenh đuacuteng đắn logic mờ vagrave xaacutec suất Xaacutec suất thigrave đề cập đến khả năng xảy ra một biến cố hay một điều gigrave đoacute Logic mờ đề cập đến cấp độ magrave đặc tiacutenh ở hiện tại

o viacute dụ1 người coacute chiều cao 6 feet thigrave coacute cấp độ lagrave 05 về chiều cao

4 Ưu điểm của logic mờ Caacutech tiếp cận rất tự nhiecircnkhocircng phức tạp Coacute thể mocirc higravenh hoacutea caacutec hagravem phi tuyến tugravey yacute phức tạp

Coacute thể tận dụng được kinh nghiệm từ những chuyecircn gia hagraveng đầu trong mọi lĩnh vực

Logic mờ được xacircy dựng dựa trecircn ngocircn ngữ tự nhiecircnNền tảng của logic mờ lagrave dựa trecircn cơ sở giao tiếp của con người

5 Nhược điểm của logic mờ Trong 1 hệ thống phức tạpsử dụng logic mờ coacute thể trở thagravenh trở ngại cho

việc xaacutec thực độ tin cậy của hệ thống Cơ chế lập luận mờ khocircng thể học hỏi từ những lỗi sai

6 Mạng noron nhacircn tạo(ANN) Mạng noron nhacircn tạo lagrave một mocirc phỏng xử lyacute thocircng tinđược nghiecircn cứu ra

từ hệ thống thần kinh của sinh vậtgiống như bộ natildeo để xử lyacute thocircng tin ANNs lagrave chương trigravenh dựa trecircn maacutey tiacutenh đơn giản coacute chức năng lagrave một mocirc

higravenh bagravei toaacuten khocircng gian dựa trecircn thử nghiệm vagrave baacuteo lỗi

7 Học từ kinh nghiệm Tiến trigravenh Một mẫu dữ liệu được biểu diễn như một mạng lưới noronANN ldquodự

đoaacutenrdquo 1 đầu radự đoaacuten được so saacutenh với giaacute trị thực tế hoặc giaacute trị chiacutenh xaacutecNếu đoaacuten được chiacutenh xaacutec thigrave khocircng coacute hagravenh động nagraveo được thực hiện

Nếu dự đoaacuten sai ANN kiểm tra lại vagrave xaacutec định lại thocircng số để điều chỉnh Một mẫu dữ liệu khaacutec được biểu diễn vagrave quaacute trigravenh nagravey được lặp lại

8 Nguyecircn tắc cơ bản của cocircng nghệ nơron Caacutec yếu tố xử lyacute cơ bản trong hệ thống thần kinh của con người lagrave tế bagraveo

thần kinhMạng lưới của tế bagraveo nagravey lagrave liecircn kết với nhau nhận được thocircng tin từ caacutec cảm biến trong mắt taihellip

Thocircng tin nhận được bởi tế bagraveo thần kinh hoặc lagrave sẽ kiacutech thiacutech noacute(sẽ được chuyển qua 1 thocircng điệp dọc theo mạng lưới) hoặc lagrave sẽ ngăn cản noacute(ngăn cản dograveng thocircng tin)

Độ nhạy coacute thể thay đổi qua thời gian hoặc sau khi coacute được kinh nghiệm

9 Cấu truacutec mạng Một ANN gồm 3 lớp cơ bản

Lớp đầu vagraveo nhận dữ liệu Lớp becircn trong hoặc lagrave lớp ẩn xử lyacute dữ liệu Lớp đầu ra chuyển tiếp kết quả cuối cugraveng của mạng

10Mạng nơ ron Thường coacute nhiều đầu vagraveo mỗi đầu vagraveo với mức ảnh hưởng vagrave tầm quan

trọng riecircng của noacute Một đầu vagraveo quan trọng coacute thể được sử dụng để khuếch đại đầu ra caacutec hagravem trạng thaacutei tổng hợp caacutec trọng số của caacutec yếu tố

đầuvagraveo khaacutec nhauvagraveo một giaacute trị duy nhất Caacutec hagravem chuyển giao xử lyacute caacutec giaacute trị trạng thaacutei vagrave tạo đầu ra

11Huấn luyện mạng nơ ron Trong mocirc higravenh coacute giaacutem saacutetANN được đến so saacutenh dự đoaacuten của chiacutenh

noacute với thocircng tin phản hồi coacute chứa caacutec kết quả mong muốn ANN sẽ phải tigravem caacutech thay đổi caacutec tham số becircn trong củamigravenh (caacutec trọng số vagrave caacutec ngưỡng) để tạo necircn một aacutenh xạ coacute khả năng aacutenh xạcaacutec đầu vagraveo thagravenh caacutec đầu ra mong muốn Sự thay đổi nagravey được tiến hagravenh nhờ việc so saacutenh giữa đầu ra thực sự vagrave đầu ra mong muốn

Trong mocirc higravenh khocircng coacute giaacutem saacutetANN nhận được dữ liệu vagraveo nhưng khocircng phải coacute bất kỳ thocircng tin phản hồi về kết quả mong muốn

Phần lớn caacutec ứng dụng nằm trong vugraveng của caacutec bagravei toaacuten ước lượng như mocirc higravenh hoacuteathống kecirc neacuten lọc phacircn cụm

12Lợi iacutech Liecircn kết với mạng noron Traacutenh caacutech lập trigravenh tường minh Giảm nhu cầu của chuyecircn gia ANNs thigrave thiacutech nghi với caacutec yếu tố đầu vagraveo thay đổi Khocircng cần thiết cho cơ sở tri thức tinh chế ANNs coacute tiacutenh động vagrave cải thiện với việc sử dụng Coacute khả năng xử lyacute dữ liệu khocircng chiacutenh xaacutec hoặc khocircng đầy đủ Cho pheacutep tổng quaacutet hoacutea từ thocircng tin cụ thể Cho pheacutep thu thập cảm giaacutec thocircng thường vagraveo miền giải quyết vấn đề

13Hạn chế của việc liecircn kết với mạng noron ANNs khocircng thể giải thiacutech được suy luận Bản chất hộp đen thường khiến cho vấn đề traacutech nhiệm vagrave độ tin cậy phaacutet

sinh lagrave khoacute khăn Lặp đi lặp lại quaacute trigravenh huấn luyện rất tốn thời gian Nguồn lực caacutec nhagrave phacircn tiacutech vagrave thiết kế coacute tay nghề cao vẫn lagrave đaacuteng lo

ngại Cocircng nghệ ANN thuacutec đẩy hạn chế của phần cứng hiện tại ANN yecircu cầu phải coacute sự tin tưởng ở đầu ra

14Giới thiệu về thuật toaacuten di truyền Cũng như mạng lưới thần kinh caacutec thuật toaacuten di truyền được dựa trecircn lyacute

thuyết sinh học Thuật toaacuten di truyền tigravem thấy nguồn gốc của chuacuteng trong caacutec lyacute thuyết

tiến hoacutea của chọn lọc tự nhiecircn vagrave thiacutech ứng với biến đổi khiacute hậu Kết quả thuật toaacuten di truyền lagrave từ giao phối 2 caacute thể trong quần thế để tạo

ra con caacutei đocirci khi tốt hơn so với bậc cha mẹ của chuacuteng 15Caacutec thagravenh phần cơ bản của thuật toaacuten di truyền

Toaacuten tử chọn lọc Caacutec caacute thể tốt được chọn lọc để đưa vagraveo thế hệ sau Sự chọn lọc nagravey căn cứ vagraveo độ thiacutech nghi với mocirci trường của mỗi caacute thể

Toaacuten tử lai gheacutep (crossover) Hai caacute thể cha vagrave mẹ trao đổi caacutec gen với nhau để tạo ra caacute thể con

Toaacuten tử đột biến (mutation) Một caacute thể thay đổi một số gen để biến đổi thagravenh một caacute thể mớiTất cả caacutec toaacuten tử trecircn khi thực hiện đều mang tiacutenh ngẫu nhiecircn

16Quaacute trigravenh cơ bản của một thuật toaacuten di truyền Khởi tạo

Đaacutenh giaacute quần thể

Lựa chọn NST thiacutech hợp nhất vagrave loại bỏ NST yếu nhất

Quy trigravenh giao nhau vagrave cải thiện quần thể

đột biến tiến trigravenh để khaacutem phaacute ra NST mới

17Ưu nhược điểm của việc kết hợp với thuật toaacuten di truyền Kiacutech thước quần thể lagrave 1 yếu tố quan trọng trong tốc độ của việc tigravem

kiếmnhưng noacute tương đối dễ dagraveng để dự đoaacuten tốc độ nagravey Giao nhau hoặc đột biến lagrave khocircng necircn đc sử dụng quaacute thường xuyecircn Luocircn coacute được iacutet nhất 1 giải phaacutep hợp lyacute Necircn coacute thể aacutep dụng chuacuteng cho caacutec vấn đề magrave chuacuteng ta khocircng coacute hướng

về caacutech giải quyết Sức mạnh của thuật toaacuten xuất phaacutet từ khaacutei niệm đơn giảnkhocircng phải từ

một thủ tục thuật toaacuten phức tạp 18Tương lai của học maacutey

Mạng lưới thần kinh nhacircn tạo vượt quaacute năng lực của con người trong caacutec trường hợp bị cocirc lập

Về mặt lyacute thuyếtmột maacutey tiacutenh coacute thể xử lyacute dũ liệu nhanh hơn hagraveng triệu lần so với 1 con người

May mắn thay cho chuacuteng tacon người tốt hơn nhiều khi magrave coacute được dữ liệumaacutey tiacutenh khocircng coacute 1 số thứ như lagrave 5 giaacutec quan

CHƯƠNG 10 KHO DỮ LIỆU

1 Kho dữ liệu Kho dữ liệu lagrave tuyển tập caacutec cơ sở dữ liệu tiacutech hợp hướng chủ đề được

thiết kế để trợ giuacutep cho một hệ hỗ trợ quyết định

Theo John Ladley Cocircng nghệ kho dữ liệu lagrave tập caacutec phương phaacutep kỹ thuật vagrave caacutec cocircng cụ coacute thể kết hợp hỗ trợ nhau để cung cấp thocircng tin cho người sử dụng trecircn cơ sở tiacutech hợp từ nhiều nguồn dữ liệu nhiều mocirci trường khaacutec nhau

Kho dữ liệu thường rất lớn tới hagraveng trăm GB hay thậm chiacute hagraveng Terabyte

2 Kho dữ liệu vận hagravenh (ODS) Một kho dữ liệu vận hagravenh Aacutep dụng kỹ thuật kho dữ liệu vagraveo caacutec hệ xử

lyacute giao taacutec lưu trữ dữ liệu cho một ứng dụng đặc thugrave Noacute đưa vagraveo kho dữ liệu một dograveng caacutec dữ liệu thocirc được thiết kế

3 So saacutenh

Kho dữ liệu vận hagravenh Kho dữ liệu

Dữ liệu theo chủ đề Dữ liệu theo chủ đề

Dữ liệu tiacutech hợp Dữ liệu tiacutech hợp

Dữ liệu thay đổi Dữ liệu khocircng thay đổi

Dữ liệu được cập nhật khi thay đổi

Dữ liệu giữ nguyecircn

Chỉ coacute dữ liệu hiện tạiDữliệu hiện tại vagrave dữ liệu lịch sử

Chu kỳ lagravem tươi dữ liệu ngắn Chu kỳ lagravem tươi dữ liệu dagravei

Chỉ coacute dữ liệu chi tiết Dữ liệu chi tiết vagrave dữ liệu tổng kết

Dugraveng cho caacutec quyết định ngắn hạn

Dugraveng cho hoạch định dagravei hạn

4 Kho dữ liệu cục bộ (Data Mart - DM)

Kho dữ liệu cục bộ lagrave CSDL coacute những đặc điểm giống với kho dữ liệu nhưng với quy mocirc nhỏ hơn vagrave lưu trữ dữ liệu về một lĩnh vực một chuyecircn ngagravenh

Data mart phụ thuộc Chứa những dữ liệu được lấy từ DW vagrave những dữ liệu nagravey sẽ được triacutech lọc vagrave tinh chế tiacutech hợp lại ở mức cao hơn để phục vụ một chủ đề nhất định của Datamart

Data mart độc lập Khocircng giống như Datamart phụ thuộc Data mart độc lập được xacircy dựng trước DW vagrave dữ liệu được trực tiếp lấy từ caacutec nguồn khaacutec nhau

5 Siecircu dữ liệu Metadata lagrave dữ liệu để mocirc tả dữ liệu Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột

một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi Metadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu

6 Mocirci trường kho dữ liệu Hệ thống của tổ chức vagrave kho cung cấp dữ liệu để xacircy dựng kho dữ liệu Trong quaacute trigravenh chuyển dữ liệu từ caacutec nguồn khaacutec nhau dữ liệu coacute thể

được lagravem sạch hoặc chuyển đổi vagrave vigrave thế DW được xem như lagrave một chuẩn cho việc lưu trữ

Đồng thời siecircu dữ liệu được ghi lại Cuối cugraveng DW hoặc siecircu thị coacute thể được sử dụng để tạo ra một kho dữ

liệu ldquocaacute nhacircnrdquo 7 Caacutec đặc điểm của kho dữ liệu

Đặc điểm Mocirc tả

Hướng chủ đề - DL tổ chức theo caacutech thức người dugraveng tham chiếu

Tiacutech hợp - Dữ liệu ldquosạchrdquo loại bỏ tiacutenh thiếu nhất quaacuten

Khocircng thay đổi - DL ldquochỉ đọcrdquo người dugraveng khocircng thay đổi được

Chuỗi thời gian - DL lagrave chuỗi thời gian khocircng phải lagrave trạng thaacutei hiện tại

Được tổng kết - DL vận hagravenhthao taacutec khi cần thiết

được kết hợp lại thagravenh dạng coacute thể dugraveng được cho quyết định

Kiacutech cỡ lớn hơn - Lưu giữ theo chuỗi thời gian tức lagrave giữ lại nhiều DL

Khocircng được chuẩn hoacutea - Coacute thể dư thừa DLSiecircu dữ liệu - Dữ liệu của dữ liệu được lưu trữNguồn dữ liệu - DL vận hagravenh (caacutec hệ sẵn coacute) cugraveng

với caacutec nguồn ngoagravei 8 Kho dữ liệu hướng chủ đề

Hướng chủ để coacute nghĩa lagrave kho dữ liệu được tổ chức xung quanh caacutec chủ đề chiacutenh như khaacutech hagraveng sản phẩm sản xuất Tập trung vagraveo việc mocirc higravenh hoacutea vagrave phacircn tiacutech dữ liệu cho caacutec nhagrave ra quyết định magrave khocircng tập trung vagraveo caacutec xử lyacute thocircng thường Cung cấp cho người dugraveng một khung nhigraven toagraven vẹn đơn giản vagrave đầy đủ về caacutec sự kiện quanh caacutec chủ đề

9 Dữ liệu trong DW được tiacutech hợp Dữ liệu trong kho dữ liệu được xacircy dựng bằng caacutech tổng hợp dữ liệu từ

nhiều nguồn khaacutec nhau vagrave caacutec nguồn coacute tổ chức khaacutec nhau Cơ sở dữ liệu caacutec file excel caacutec flat file hoặc caacutec raw file Khi đưa vagraveo kho dữ liệu caacutec dữ liệu được lagravem sạch vagrave tiacutech hợp dữ liệu nhằm đảm bảo tiacutenh nhất quaacuten của dữ liệu

10Kiến truacutec kho dữ liệu Tầng cơ sở dữ liệu hoạt động Tầng truy xuất thocircng tin Tầng truy xuất dữ liệu Tầng siecircu dữ liệu Tầng quản lyacute tiến trigravenh Tầng thocircng điệp của ứng dụng Tầng vật liacute của kho dữ liệu Tầng trigravenh diễn dữ liệu

11Higravenh trạng kho dữ liệu Kho dữ liệu ảo - người dugraveng cuối coacute thể truy cập trực tiếp đến kho dữ liệu

sử dụng caacutec cocircng cụ cho pheacutep ở tầng truy xuất dữ liệu Kho dữ liệu trung tacircm-1 cơ sở dữ liệu vật lyacute chứa tất cả dữ liệu cho một

vugraveng chuyecircn dụng nagraveo đoacute

Kho dữ liệu phacircn taacuten- Thagravenh phần được phacircn taacuten qua nhiều hệ cơ sở dữ liệu vật lyacute

12METADATA- Siecircu dữ liệu Định nghĩa Siecircu dữ liệu lagrave dữ liệu về dữ liệu Lagrave 1 lưu trữ dugraveng để

Miecircu tả kho dữ liệu tổng thể Nhận dạng kiểu kho dữ liệu Quản liacute quaacute trigravenh tiacutech hợp dữ liệu Quản liacute quaacute trigravenh cập nhật kho dữ liệu Quản liacute bảo mật

Lagrave chigravea khoacutea quyết định sự thagravenh cocircng của kho dữ liệu luocircn được thay đổi vagrave cập nhật theo sự phaacutet triển của kho dữ liệu

Dugraveng để quản liacute điều khiển kho dữ liệu Sự ra đời của kho dữ liệu như 1 cấu truacutec hỗ trợ ra quyết định siecircu dữ liệu

được xem như nguồn tagravei nguyecircn dữ liệu Siecircu dữ liệu lagrave trừu tượng Chuacuteng lagrave dữ liệu bậc cao cung cấp mocirc tả ngắn

gọn caacutec dữ liệu bậc thấp hơn 13Hoạt động của Siecircu dữ liệu

Siecircu dữ liệu rất cần thiết trong việc chuyển hoacutea thocircng tin trở thagravenh tri thức Lagrave chigravea khoacutea giuacutep chuacuteng ta xử lyacute được dữ liệu thocirc Viacute dụ một dograveng dữ liệu baacuten hagraveng 1023 K596 11121 agraveNoacute sẽ khocircng coacute nghĩa gigrave cho đến khi chuacuteng ta đưa vagraveo siecircu dữ liệu (thư

mục chứa dữ liệu) agrave cửa hagraveng 1023 sản phẩm K596 vagrave số tiền baacuten được lagrave 11121 đocirc la

14Sự cần thiết phải nhất quaacuten trong kho dữ liệu Kho dữ liệu được xacircy dựng cho lợi iacutech của những nhagrave phacircn tiacutech kinh

doanh caacutec nhagrave quản trị cho tất cả caacutec khu vực chức năng Trong cơ sở dữ liệu riecircng caacutec khu vực khaacutec nhau coacute thể định nghĩa vagrave lưu

trữ dữ liệu thocircng qua phiecircn bản của chiacutenh noacute Khi dữ liệu được lấy từ những vugraveng khaacutec nhau đoacute vagrave được đặt vagraveo kho dữ

liệu Việc chuyển đổi vagrave lagravem sạch caacutec tiến trigravenh sẽ đảm bảo noacute lagrave duy nhất được tiacutech hợp tại một mức của tổ chức

15Ragrave soaacutet lại dữ liệu ndash Thực thi siecircu dữ liệu

Bất kể cấu truacutec tự nhiecircn của 1 cacircu truy vấn thế nagraveo thigrave caacutec thagravenh phần của siecircu dữ liệu rất quan trọng đối với người ra quyết định

Bảng thuộc tiacutenh khoacutea được lưu trữ bởi kho dữ liệu Tập hợp dữ liệu được lấy từ đacircu Những chuyển đổi nagraveo được thực thi với việc lagravem sạch

16Siecircu dữ liệu lagrave gigrave Metadata - lagrave thocircng tin mocirc tả nội dung của cơ sở dữ liệu (CSDL) Metadata baacuteo cho người dugraveng biết thời gian cập nhật sau cugraveng của dữ liệu

định dạng vagrave mục điacutech sử dụng của noacute Những thocircng tin nagravey coacute thể hướng dẫn người dugraveng duyệt qua CSDL vagrave

giuacutep họ hiểu được yacute nghĩa vagrave ngữ cảnh của dữ liệu Trong CSDL metadata lagrave caacutec dạng biểu diễn khaacutec nhau của caacutec đối tượng

trong CSDL Trong CSDL quan hệ metadata lagrave caacutec định nghĩa của bảng cột CSDL

view vagrave nhiều đối tượng khaacutec Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột

một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi -gtMetadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu

Bảng chuyển đổi Ghi lại những chuyển đổi đatilde được thực hiện

Lịch sử thực thi Ghi lại những dữ liệu đatilde được

phacircn tiacutech

Higravenh thaacutei kết nốiGhi lại những dữ liệu được kết nối vagrave tần suất

17Aacutenh xạ thocircng thường của siecircu dữ liệu Bản ghi aacutenh xạ chuyển đổi bao gồm

Định danh của nguồn gốc Chuyển đổi thuộc tiacutenh Chuyển đổi thuộc tiacutenh vật lyacute Matilde hoacutea tham chiếu bảng chuyển đổi Đổi tecircn Đổi khoacutea Gaacuten giaacute trị cho thuộc tiacutenh mặc định Chọn logic cho caacutec nguồn nhiều giaacute trị Đổi thuật toaacuten

18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để

phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai

lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave

tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec

Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm

Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo

19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua

caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau

SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được

Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra

một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức

Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ

Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ

Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech

CHƯƠNG 11 KHAI PHAacute DỮ LIỆU

1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn

ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993

Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng

2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd

1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều

2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP

3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn

4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng

5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server

6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo

7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động

8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời

9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều

10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện

11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech

12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP

3 Xử lyacute phacircn tiacutech trực tuyến OLAP

MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave

dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu

ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave

thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu

HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave

ROLAP4 Khai phaacute dữ liệu

Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh

khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn

Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan

5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp

6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại

Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp

Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec

Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt

Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra

Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh

vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho

Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec

Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm

Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục

Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng

gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp

Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn

Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec

Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper

Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2

Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25

Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước

Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng

Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện

trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp

Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute

độ hỗ trợ ge ngưỡng minsup

độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan

Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn

Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết

Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu

MOLAP ROLAP HOLAP

Lưu trữ dữ liệu cơ sở

Khối Bảng quan hệ Bảng quan hệ

Lưu trữ thocircng tin tổng hợp

Khối Bảng quan hệ Khối

Hiệu suất thực hiện truy vấn

Nhanh nhất Chậm nhất Nhanh

Tiecircu thụ khocircng gian lưu trữ

Nhiều Thấp Trung bigravenh

Chi phiacute bảo trigrave Cao Thấp Trung bigravenh

Page 24: De cuong(1-11)

Vấn đề giới tiacutenh Nam vagrave nữ thường coacute những thế mạnh khaacutec nhau điều nagravey coacute thể lagrave sức mạnh trong 1 thiết lập MDM

Đagravem phaacuten vagrave quyết định

Một quyết định coacute thể liecircn quan đến nhiều quan điểm khaacutec nhau vigrave thế cần phải coacute sự đagravem phaacuten

Caacutec thiết kế của cơ chế hỗ trợ cho MDM phải phugrave hợp với caacutec hoạt độngđagravemphaacuten

Những hoạt động nagravey bao gồm việc thu nhận yacute kiến của caacutec thagravenh viecircn 1 caacutech cocircng bằng

53Cocircng nghệ hỗ trợ MDM

Organizational DSSndash 1 hệ thống cung cấp caacutec quyết định hỗ trợ

Group Support Systemndash Cocircng nghệ sử dụng sự hỗ trợ của nhiều becircn tham gia

Group DSS ndash Lagrave 1 hệ thống được thiết kế đặc biệt để hỗ trợ cho MDM

DSS ndash Lagrave 1 hệ thống dưới sự kiểm soaacutet của 1 người quyết định hệ thống nagravey cung cấp 1 bộ cocircng cụ giuacutep phacircn tiacutech hoagraven cảnh đểđưa ra quyết định vagrave nacircng cao hiệu quả của quyết địnhđoacute

53Cocircng nghệ hỗ trợ MDM

Organizational DSSndash 1 hệ thống cung cấp caacutec quyết định hỗ trợ

Group Support Systemndash Cocircng nghệ sử dụng sự hỗ trợ của nhiều becircn tham gia

Group DSS ndash Lagrave 1 hệ thống được thiết kế đặc biệt để hỗ trợ cho MDM

DSS ndash Lagrave 1 hệ thống dưới sự kiểm soaacutet của 1 người quyết định hệ thống nagravey cung cấp 1 bộ cocircng cụ giuacutep phacircn tiacutech hoagraven cảnh đểđưa ra quyết định vagrave nacircng cao hiệu quả của quyết địnhđoacute

Mục tiecircu của cocircng nghệ hỗ trợ MDM

Quy trigravenh hỗ trợ tập trung vagraveo quaacute trigravenh tạo điều kiện thuận lợi cho sự tương taacutec

Cơ chế cấu truacutec quaacute trigravenh chi phối caacutec hoạt động truyền thocircng

Nhiệm vụ hỗ trợ cocircng việc coacute thể chọn lựa tổ chức hoặc lấy thocircng tin

Nhiệm vụ cấu truacutec cocircng việc cho pheacutep truy cập đến kỹ thuật lọc kết hợp phacircn tiacutech kiến thức liecircn quan đến cocircng việc

Caacutec lớp loại cocircng nghệ hỗ trợ MDM

Phacircn loại theo đặc điểm do DeSanctis vagrave Gallupe đưa ra đề xuất một chương trigravenh ba cấp dựa trecircn caacutec tiacutenh năng được cung cấp

Hệ thống cấp 1 Mục điacutech chiacutenh lagrave tạo điều kiện thocircng tin liecircn lạc giữa caacutec thagravenh viecircn

Hệ thống cấp 2 Thiết kế để giảm thiểu rủi ro

Hệ thống cấp 3 Giuacutep điều chỉnh xử lyacute quyết định

Phacircn loại theo cocircng nghệ -Kraemer vagrave King tập trung vagraveo cocircng nghệ aacutep dụng

Cocircng nghệ bảng mạch điện tử

Hội nghị trực tuyến

Mạng lưới tập đoagraven

Trung tacircm thocircng tin

Mocirci trường cộng taacutec

Phograveng quyết định

Nhoacutem phần mềm

Phần mềm được thiết kế để hỗ trợ sự hợp taacutec bao gồm việc thu huacutet vagrave lưu trữ thocircng tin

Caacutec tổ chức dẫn đầu thị trường hiện tại lagrave Lotus Notes and Domino Microsoft Exchange Novell GroupWise and Oracle Office

Caacutec cocircng cụ trong một bộ phần mềm bao gồm người quản lyacute hội nghị (Lotus Sametime) vagrave trao đổi thocircng điệp (Lotus Notes Mail)

Xếp hạng phần mềm cho nhoacutem

Ellis vv đề xuất một hệ thống xếp hạng dựa vagraveo kiểu sự hỗ trợ noacute Cung cấp

Hệ thocircng điệp

Hệ thống hội thảo truyền higravenh

Hệ thống cộng taacutec soạn thảo

Nhoacutem phacircn phối giải phaacutep phần mền

Hệ thống phối hợp

Hệ thống thocircng minh đại diện

Lực lượng điều khiển phaacutet triển phần mềm cho nhoacutem

Một số nhacircn tố chiacutenh bao gồm

Tăng năng suất

Giảm số lượng caacutec cuộc họp

Tăng cường tự động hoacutea caacutec quy trigravenh lagravem việc thường xuyecircn

Cần phối hợp toagraven cầu tốt hơn

Tiacutenh sẵn sagraveng của những mạng lan rộng

Coleman vagrave Khanna liệt kecirc 10 nhacircn tố khaacutec

54Quản lyacute hoạt động MDM (Mobile Device Management - Quản lyacute thiết bị di động)

Một số phương phaacutep phối hợp phổ biến hơnMDM lagrave

Kỹ thuật nhoacutem định danh

Kỹ thuật Delphi

Sự phacircn xử

Hệ thocircng tin dựa trecircn vấn đề

Nemawashi

Kỹ thuật nhoacutem định danh

1-Mỗi người tham gia viết ra những yacute tưởng về những gigrave necircn quyết định

2-Lần lượt mỗi người tham gia trigravenh bagravey yacute tưởng của migravenh được ghi lại trecircn bảng Khocircng thảo luận ở đacircy

3-Sau khi tất cả caacutec yacute tưởng được trigravenh bagravey caacutec đại biểu coacute thể chất vấn những người khaacutec

4-Mỗi người tham gia bỏ phiếu cho mỗi yacute tưởng

Kỹ thuật Delphi

Về cơ bản tương tự như kỹ thuật nhoacutem định danh ngoại trừ những người khocircng bao giờ tham gia cuộc họp

Một cocircng cụ khảo saacutet được sử dụng để thu thập đầu vagraveo ban đầu từ caacutec thagravenh viecircn

Một cuộc khảo saacutet thứ hai được gửi đi với một bản toacutem tắt caacutec kết quả chung

Những bước lặp lại cho đến khi đạt được một sự đồng thuận hoặc nhigraven nhận của đa số

Sự phacircn xử(Arbitration )

Thiacutech hợp nhất khi caacutec thagravenh viecircn của MDM đại diện cho caacutec yếu tố đối lập

Những người tham gia đồng yacute rằng nếu lựa chọn thay thế hai becircn thỏa thuận khocircng được tigravem thấy thigrave một trọng tagravei viecircn becircn ngoagravei sẽ tham gia

Trọng tagravei sau đoacute lựa chọn thay thế ocircng hoặc xeacutet thấy thiacutech hợp nhất

Hệ thống thocircng tin dựa trecircn vấn đề (IBIS)

Lagrave một phương phaacutep lập luận cấu truacutec

Một đại diện cho IBIS lagrave một đồ thị với caacutec nuacutet vagrave caacutec liecircn kết

IBIS bắt đầu với lựa chọn của một nuacutet vấn đề gốc sau đoacute caacutec nuacutet vị triacute khaacutec nhau được liecircn kết với nuacutet gốc

Caacutec nuacutet vị triacute nagravey sau đoacute được đaacutenh giaacute dựa trecircn những lập luận gắn liền với chuacuteng

Nemawashi (được sử dụng rộng ratildei tại Nhật Bản)

1-Một hoặc nhiều thagravenh viecircn của MDM được chỉ định lagrave điều phối viecircnCaacutec điều phối viecircn sau đoacute chọn người tham gia cograven lại

2-Điều phối viecircn xacircy dựng một tổng hợp caacutec sự lựa chọn vagrave sau đoacute caacutec chuyecircn gia đaacutenh giaacute caacutec lựa chọn

3-Điều phối viecircn lựa chọn một sự lựa chọn dựa trecircn kết quả ở trecircn(ở 2)

4-Sự thay thế được luacircn chuyển điều phối viecircn tigravem kiếm sự đồng thuận thocircng qua sự thuyết phục vagrave đagravem phaacuten

5-Nếu đạt được sự đồng thuận điều phối viecircn cho lưu thocircng một tagravei liệu magrave mỗi thagravenh viecircn MDM để lại dấu hiệu trecircn đoacute

55Nơi lagravem việc ảo

Nhiều tổ chức trecircn toagraven thế giới kinh doanh bất động sản cho cocircng nghệ hợp taacutec

Cocircng việc được trở thagravenh một điều bạn lagravem hơn lagrave một nơi bạn đi

Những thay đổi lớn nhất mang lại bởi nơi lagravem việc ảo coacute thể lagrave về văn hoaacute hay xatilde hội hơn lagrave về cocircng nghệ

Chương 6 Hệ thống thocircng tin điều hagravenh

61 Yacute nghĩa của EIS- Hệ thống thocircng tin điều hagravenh

- EIS lagrave một dạng đặc biệt của DSS được thiết kế để hỗ trợ ra quyết định ở cấp cao nhất của một tổ chức

- Lagrave một hệ thống thocircng tin hỗ trợ nhu cầu lập kế hoạch vagrave đaacutenh giaacute của caacutec nhagrave quản lyacute điều hagravenh

- EIS coacute thể giuacutep một CEO coacute được bức tranh tổng thể chiacutenh xaacutec nhất về caacutec hoạt động vagrave một bản toacutem tắt những gigrave magrave đối thủ cạnh tranh đang lagravem

- Caacutec hệ thống nagravey noacutei chung hoạt động dễ dagraveng vagrave trigravenh bagravey thocircng tin theo những caacutech dễ hiểu để việc tiếp thu được nhanh choacuteng (biểu đồ đồ thịhellip)

(Tagravei liệu thecircm EIS lagrave những loại hệ thống lagrave rất phức tạp trong tự nhiecircn Coacute thể noacutei hệ thống nagravey cũng cung cấp cho caacutec nhagrave quản lyacute với caacutec thiết bị coacute khả năng ra quyết định bằng caacutech sử dụng của noacute Hệ thống nagravey hoạt động trong điều kiện như vậy quan trọng như trong caacutec hệ thống khaacutec khocircng hỗ trợ Khả năng lưu trữ dữ liệu nặng lagravem cho noacute lyacute tưởng để được thocircng qua khocircng chỉ bởi caacutec doanh nghiệp lớn magrave cograven bởi caacutec doanh nghiệp nhỏ hơn Nhigraven chung hệ thống nagravey lagrave dagravenh cho caacutec nhacircn viecircn cấp cao hỗ trợ thagravenh thạo trong việc đưa ra caacutec quyết định quan trọng)

Caacutec phiecircn EIS tiecircu biểu- Phiecircn lagravem việc coacute thể bắt đầu với một baacuteo caacuteo về tigravenh higravenh tagravei chiacutenh vagrave kinh

doanh của một cocircng ty caacutec chỉ số hoạt động quan trọng được hiển thị rotilde ragraveng- EIS sẽ cho pheacutep caacutec giaacutem đốc điều hagravenh coacute thể đi sacircu vagraveo dữ liệu từ những con

số bất kỳ magrave noacute hỗ trợ- Việc điều hagravenh coacute thể lựa chọn một mức độ chi tiết ( VD danh số baacuten hagraveng) nếu

như cần điều tra thecircm- Lagrave một phương phaacutep tiếp cận coacute thể giuacutep việc ra quyết định tốt hơn

Những điều magrave EIS ko coacute- EIS khocircng phải lagrave sự thay thế cho caacutec hệ thống dựa trecircn caacutec maacutey tiacutenh khaacutec EIS

thực sự chỉ cung cấp dữ liệu cho caacutec hệ thống nagravey- Noacute khocircng thể biến caacutec bộ hệ điều hagravenh của maacutey tiacutenh thagravenh những ldquochuyecircn viecircn

giỏirdquo- Coacute thể được viacute một caacutech cao hơn như lagrave một trợ lyacute đaacuteng tin cậy coacute thể được gọi

đến bất khi nagraveo vagrave mỗi khi cần thiết

Tagravei liệu thecircm Sự khaacutec nhau giữa EIS vagrave DSS+ EIS thiết kế để hỗ trợ những người điều hagravenh cấp cao giuacutep họ khaacutem phaacute caacutec vấn đề vagrave caacutec cơ hội DSS hỗ trợ những nười phacircn tiacutech cố gắng trả lời cacircu hỏi caacutei gigrave coacute thể lagravem cugraveng với một cơ hội hoặc một vấn đề

Chiều EIS DSSNhững người sử dụng thocircng thường

Duyệt dữ liệu đi xuống truy xuất trạng thaacutei

Hỗ trợ phacircn tiacutech vagrave quyết định

Sự thuacutec đẩy Tiacutenh thiacutech hợp Tiacutenh hiệu quảỨng dụng Queacutet mocirci trường đaacutenh giaacute

hiệu suất nhận dạng caacutec vấn đề vagrave caacutec cơ hội

Caacutec quyết định quản lyacute trecircn caacutec lĩnh vực đa dạng

Hỗ trợ quyết định Caacutec chiacutenh saacutech caacutec quyết định khocircng coacute cấu truacutec ở mức cao vagrave hỗ trợ giaacuten tiếp

Hỗ trợ caacutec quyết định lặp lại caacutec quyết định khocircng thể đoaacuten trước ra quyết định khocircng coacute cấu truacutec vagrave baacuten cấu truacutec

Loại thocircng tin Caacutec thocircng tin tin tức thocircng tin becircn ngoagravei về khaacutech hagraveng đối thủ cạnh tranh mocirci trường caacutec baacuteo caacuteo theo yecircu cầu vagrave định thời về caacutec hoạt động becircn trong

Caacutec thocircng tin hỗ trợ caacutec tigravenh huống đặc biệt

Sử dụng coacute nguyecircn tắc

Dograve theo vết vagrave điều khiển nhận dạng cơ hội

Hoạch định tổ chức phacircn nhoacutem vagrave điều khiển

Khả năng phugrave hợp với những người sử dụng caacute nhacircn

Thiết kế loại ra quyết định cho mỗi người điều hagravenh caacute nhacircn bằng nhiều lựa chọn đầu ra

Cho pheacutep caacutec đaacutenh giaacute caacute nhacircn caacutec khả năng what-if lựa chọn loại hộp hội thoại

Đồ họa Phải coacute Lagrave một phần quan trọng của nhiều DSS

Thacircn thiện người sử dụng

Phải coacute Phải coacute nếu khocircng coacute người sử dụng trung gian

Xử lyacute thocircng tin Lọc neacuten thocircng tin dograve theo vết dữ liệu vagrave thocircng tin quan trọng

EIS kiacutech thiacutech caacutec cacircu hỏi caacutec cacircu trả lời bằng caacutech sử dụng DSS vagrave phản hồi lại EIS

Hỗ trợ caacutec thocircng tin chi tiết

Truy xuất thường xuyecircn caacutec mức chi tiết của bất kỳ thocircng tin tổng hợp nagraveo (duyệt dữ

Coacute thể coacute trong DSS nhưng khocircng thường

liệu chi tiết)Cơ sở mocirc higravenh Caacutec chức năng coacute sẵn bị hạn

chếLagrave điểm cốt lotildei của DSS

Cấu truacutec Theo người baacuten sản phẩm hoặc theo caacutec chuyecircn gia hệ thống thocircng tin

Theo người sử dụng hoặc caacute nhacircn hoặc caacutec chuyecircn gia từ caacutec trung tacircm thocircng tin hoặc phograveng ban hệ thống thocircng tin

Phần cứng Mainframe caacutec trạm RISC mạng LANs hoặc caacutec hệ thống phacircn bố

Mainframe caacutec trạm RISC caacutec maacutey PC hoặc caacutec hệ thống phacircn bố

Bản chất caacutec goacutei phần mềm

Truy xuất tương taacutec dễ dagraveng đến nhiều cơ sở dữ liệu truy xuất trực tuyến caacutec khả năng DBMS phức tạp caacutec liecircn kết phức tạp

Caacutec khả năng tiacutenh toaacuten lớn caacutec ngocircn ngữ mocirc higravenh mocirc phỏng ứng dụng vagrave caacutec bộ tạo DSS

Bản chất caacutec thocircng tin

Trigravenh bagravey thocircng tin được phaacutet sinh trước về quaacute khứ vagrave hiện tại tạo caacutec thocircng tin mới về quaacute khứ hiện tại tương lai

Tạo thocircng tin mới về quaacute khứ hiện tại tương lai

62 Lịch sử EIS- EIS xuất hiện lần đầu tiecircn tại MIT vagraveo những năm 1970

- Những EIS đầu tiecircn được phaacutet triển bởi caacutec doanh ngiệp lớn sẵn sagraveng chấp nhận rủi ro để đạt được lợi thế cạnh tranh

- Vagraveo những năm 1980 caacutec nhagrave cung cấp đatilde phaacutet triển một số cơ sở khaacutech hagraveng rộng vagrave cocircng nghệ EIS được tiếp tục phaacutet triển cho đến ngagravey nay

(Tagravei liệu thecircm Sử dụng DSSEIS cho phaacutet triển bền vững + Một số nghiecircn cứu đatilde được tiến hagravenh để kiểm tra việc thực hiện của EIS trong khu vực cocircng cộng vagrave chiacutenh phủ caacutec nước tổ chức kể từ khi chuacuteng được phaacutet triển theo định hướng lợi nhuận cho caacutec cocircng ty tư nhacircn (Hasan vagrave Hasan năm 1997) Theo một nghiecircn cứu tiến hagravenh tại Mỹ ở hơn 300 cocircng ty kết quả cho thấy sự khaacutec biệt của EIS giữa tư nhacircn vagrave chiacutenh phủ một số kết quả thuacute vị được phaacutet hiệnViacute dụ khoacute khăn hơn để chuyển tiền từ một tagravei khoản khaacutec trong một EIS của chiacutenh phủ cũng lagrave khoacute khăn hơn để biện giải thiacutech cho những chi phiacute phaacutet triển EIS của chiacutenh phủ Một nghiecircn cứu khaacutec được tiến hagravenh ở Australia

cho thấy rằng EIS cung cấp cho quản lyacute một higravenh ảnh chiacutenh xaacutec hơn về tổ chức thực hiện vagrave cung cấp hỗ trợ cho caacutec lợi iacutech chiến lược cải thiện khocircng chỉ cho caacutec nhagrave quản lyacute nhưng cograven cho phần cograven lại của tổ chức Dựa trecircn caacutec hệ thống được thiết kế cho caacutec cocircng ty tư nhacircn với một caacutech rotilde ragravengxaacutec định mục tiecircu EIS lagrave thiacutech hợp cho caacutec tổ chức cocircng cộng hiện đại nhưng cần phải được linh hoạt hơn vagrave kết thagravenh chugravem một phạm vi rộng hơn khả năng vagrave phương tiện hơn so với khu vực tư nhacircn ban đầu theo định hướng sản phẩm (Hasan vagrave Hasan năm 1997) Điều nagravey coacute thể lagrave do thực tế rằng caacutec hoạt động khu vực cocircng lagrave bắt buộc coacute taacutec động rộng phải đaacutep ứng sự mong đợi duy nhất cocircng cộng thường coacute mục tiecircu mơ hồ vagrave macircu thuẫn iacutet quyền tự chủ vagrave kiểm soaacutet việc ra quyết định vagrave nhacircn viecircn lagrave khoacute khăn hơn (Watson vagrave Carte2000) + Toacutem lại EIS lagrave một khaacutei niệm thagravenh cocircng noacute phaacutet triển qua nhiều năm tuy nhiecircn EIS khắc phục khiếm khuyết của migravenh bằng caacutech tiến hagravenh nghiecircn cứu liecircn tục)

63 Tại sao những người điều hagravenh hagraveng đầu lại khaacutec nhau- Họ lagrave những doanh nghiệp theo định hướng coacute suy nghĩ

- Coacute một khoảng khocircng gian rộng để kiểm soaacutet

- Họ chịu traacutech nhiệm cho việc thiết lập chiacutenh saacutech

- Họ đại diện cho tổ chức mocirci trường becircn ngoagravei

- Hagravenh động của họ tạo ra những kết quả đaacuteng kể về tagravei chiacutenh vagrave con người

Tần số caacutec hoạt động điều hagravenh- Xử lyacute xaacuteo trộn 42

- Hoạt động kinh doanh 32

- Phacircn bổ nguồn lực 17

- Đagravem phaacuten 3

- Những điều khaacutec 6

Handling Disturbances 42

Entrepreneurial Activites 32

Resource Allocation 17

Negotiation 3

Other 6

Những thocircng tin điều hagravenh cần thiết- Quản lyacute xaacuteo trộn coacute thể yecircu cầu sự chuacute yacute xung quanh đồng hồ

- Hoạt động kinh doanh yecircu cầu điều hagravenh để dự đoaacuten những thay đổi trong mocirci trường

- Nhiệm vụ phacircn bổ tagravei nguyecircn yecircu cầu lựa chọn người quản lyacute vagrave caacutec nguồn lực hạn chế được triển khai

- Đagravem phaacuten yecircu cầu cập nhật thocircng tin từng phuacutet để coacute thể xacircy dựng được sự đồng thuận

Caacutec loại thocircng tin điều hagravenh- Hệ thống kế toaacuten coacute liecircn quan đến việc tiacutenh toaacuten thu nhập hoạt động cho caacutec lĩnh

vực cụ thể lagrave quan trọng hơn so với caacutec hệ thống kế toaacuten truyền thocircng- Thocircng tin về thị trường khaacutech hagraveng cung cấp giaacute trị trong việc quyết định chiến

lược- Caacutec thocircng tin cần thiết thường được truyền đi trecircn một số hệ thống maacutey tiacutenh vagrave

nằm trong toagraven tổ chức- Caacutec thocircng tin được sử dụng thường lagrave ngắn hạn vagrave dễ thay đổi

Phương thức để xaacutec định thocircng tin cần thiết

Rockart xaacutec định được năm phương thức cơ bản để xaacutec định thocircng tin cần thiết

- Phương thức dựa trecircn kết quả- Phương thức rỗng- Phương thức chỉ số khoacutea- Phương thức tổng hợp nghiecircn cứu- Phương thức dựa vagraveo nhacircn tố then chốt dẫn đến thagravenh cocircng

64 Thagravenh phần EIS

- Sản phẩm EIS đầu tiecircn được phaacutet triển để sử dụng trecircn maacutey tiacutenh cấu higravenh cao nhưng caacutec sản phẩm hiện nay nhằm mục tiecircu lagrave nền tảng ClientServer

- Những nền tảng linh hoạt hơn coacute thể thiacutech ứng với thay đổi trong tổ chức vagrave cocircng nghệ

- Sử dụng dữ liệu thời gian thực dẫn đến quyết định nhanh hơn nhiều thocircng tin hơn

Thagravenh phần phần cứng- Một EIS khocircng đogravei hỏi coacute phần cứng cụ thể hoặc duy nhất nagraveo- Chigravea khoacutea của vấn đề lagrave để đảm bảo rằng caacutec thagravenh phần của EIS tối ưu hoacutea vagrave

phugrave hợp với tagravei nguyecircn maacutey tiacutenh của tổ chức- Hệ thống nagravey phải được cấu higravenh để caacutec nguồn tagravei nguyecircn phugrave hợp với những

người điều hagravenh chuacuteng

Thagravenh phần phần mềm- Traacutei ngược với phần cứng phần mềm thường được chuyecircn mocircn hoacutea cao cho caacutec

bagravei toaacuten về miền- Sự chuyecircn mocircn hoacutea nagravey thường đạt được bằng caacutech sử dụng thagravenh phần off-the-

shelf cho toagraven bộ EIS vagrave caacutec mocirc-đun tugravey chỉnh để đaacutep ứng nhu cầu cụ thể- Lotus Notes lagrave một viacute dụ điển higravenh Noacute coacute thể được sử dụng một migravenh hoặc coacute

thể phục vụ becircn thứ ba mocirc-đun plug-in

Cocircng nghệ EIS hiện nay

Dobrzeniecki đề xuấtphacircn loạitừng cấptheo bachức năng- Loại 1 sản phẩm bao gồmmột bộ đầy đủcaacutec ứng dụngtừ mộtnhagrave cung cấp- Loại 2 sản phẩm đượcthựchiệnở phần đầu củacaacutecsản phẩmDSS đượcphaacutet triển

bởicugravengmộtnhagrave cung cấp- Loại 3 sản phẩmkết hợp với nhautheo bất kỳ số lượngthuộc sở hữu củacocircng ty

65 Xacircy dựng EIS

- Xacircy dựngmộtEISgiống nhưxacircydựngmột số hệ thống khaacutec củamocirc higravenh hệ thống thocircng tin

- Việcphaacutet triểncấu truacutecnecircn được theo dotildeitừ quaacute trigravenh thiết kế đến quaacute trigravenhthực hiện

- Tuy nhiecircn một dự aacuten phaacutet triển EIScoacute xu hướnglagrave thống nhấtvagraveyecircu cầu hỗ trợ caacutec nhagrave quản lyacute latildenh đạo

- Xacircy dựng một EIScoacute thểphaacutet hiện ra đượccaacutectigravenh huống khoacute khănmagravemột nhagrave phaacutet triển chưabao giờ gặp phải

Mocirc higravenh EIS

Khung phaacutet triển một EIS

- Watson et al đề nghị xacircy dựngkhung với ba thagravenh phần+ Caacutech tiếp cận tập trung vagraveo yếu tốcon người vagrave dữ liệu coacute liecircn quan đến EIS+ Quaacute trigravenh phaacutet triển cần sự linh hoạt vagrave tương taacutec+ Người sử dụng - hệ thống hộp thoại bao gồm một ngocircn ngữ hagravenh động để xử lyacute caacutec lệnh

Lợi iacutech của EIS- Dễ duy trigrave caacutec mục tiecircu coacute tổ chức- Dễ truy xuất thocircng tin- Cho pheacutep người sử dụng nacircng cao hiệu suất hơn

- Tăng chất lượng ra quyết định- Cung cấp sự cải tiến cạnh tranh- Tiết kiệm thời gian của người sử dụng- Tăng khả năng vagrave chất lượng giao tiếp- Cung cấp khả năng điều khiển tốt hơn trong tổ chức- Cho pheacutep tham gia caacutec vấn đề vagrave caacutec cơ hội- Cho pheacutep hoạch định- Cho pheacutep tigravem kiếm nguyecircn nhacircn của một vấn đề- Thảo matilden caacutec yecircu cầu của người điều hagravenh

Hạn chế của EIS vagrave 1 số sai lầm cần traacutenh

- Chi phiacute một cuộc khảo saacutetnăm1991 chothấychi phiacute phaacutet triểntrungbigravenh365000USDvớichi phiacute vận hagravenhhagraveng năm lagrave$200000 (EIS)

- Cocircng nghệ hạn chếEIScần phảiđượctiacutech hợp hoagraven toagravenvagraveokiếntruacuteccủadoanh nghiệphiện tại do đoacute noacutelagrave một thaacutech thứclớn đối vớithiết kế

- Hạn chế tổ chức cơ cấu tổ chứccoacute thể khocircng phugrave hợp

Sự hạn chế về tổ chức- Chương trigravenh nghị sự vagrave thời gian chệch EIS mocirc tả một phần việc thực hiện một

chương trigravenh nghị sự vagrave coacute thể dễ dagraveng đạt được sự tin cậy một caacutech chắc chắn- Đồng bộ hoacutea việc quản lyacute sự tin cậy đuacuteng luacutec đặc biệt baacuteo caacuteo EIS coacute thể phaacute

vỡ sự ổn định thiết lập caacutec chu trigravenh baacuteo caacuteo một caacutech tốt nhất- Sự bất ổn EIS phản ứng nhanh coacute thể gacircy ra việc taacutec động trở lại một caacutech

nhanh choacuteng dẫn đến sự thiếu ổn định trong tổ chức

Sự thất bại lagrave thay thế khocircng thể chấp nhận được- Một số yếu tố lagravem EIS thất bại

+ Thiếu sự hỗ trợ về mặt quản lyacute+ Vấn đề chiacutenh trị+ Thất bại của nhagrave phaacutet triển+ Lỗi về cocircng nghệ+ Giaacute cả+ Thời gian

66 Ra quyết định điều hagravenh trong tương lai vagrave EIS

- Coacute một vagravei điều kiện sẽ được hợp nhất cho việc chuyển đổi cocircng nghệ Trong đoacute một vagravei điều kiện coacute thể dễ dự đoaacuten Hai điều kiện magrave ta coacute thể thấy lagrave+ Phaacutet triển cocircng nghệ maacutey tiacutenh trong việc điều hagravenh sẽ tạo ra sự chuyển đổi được chấp nhận một caacutech dễ dagraveng hơn+ Mở rộng traacutech nhiệm điều hagravenh sẽ mở rộng nhu cầu thocircng tin

Tương lai của EIS- EIS thocircng minh Những tiến bộ trong cocircng nghệ AI sẽ được triển khai trong caacutec

EIS- EIS đa phương tiện Cơ sở dữ liệu đa phương tiện sẽ cho pheacutep tiacutech hợp văn bản

giọng noacutei vagrave higravenh ảnh trong tương lai- EIS thocircng tin Tương lai EIS sẽ mở rộng hơn trong việc sử dụng dữ liệu becircn

ngoagravei doanh nghiệp- EIS kết nối Giao tiếp với băng thocircng rộng cho pheacutep kết nối liecircn thocircng lớn hơn

Chương 7 HỆ CHUYEcircN GIA VAgrave TRIacute TUỆ NHAcircN TẠO

71 Caacutec khaacutei niệm

72 Triacute thocircng minh của triacute tuệ nhacircn tạo

73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia

74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia

75 Lợi iacutech vagrave hạn chế của hệ chuyecircn gia

71 Caacutec khaacutei niệm

Chuyecircn mocircn (Expertise) sự hiểu biết rộng trong 1 lĩnh vực hẹp

Hệ chuyecircn gia (Expert Systems)1 chương trigravenh maacutey tiacutenh sử dụng 1 tập caacutec luật dựa trecircn tri thức của con người để giải quyết caacutec vấn đề đogravei hogravei phải coacute sự chuyecircn mocircn

Một số hệ chuyecircn gia nổi tiếng

DENDRAL (Standford 1960s Edward Feigenbaum)

MYCIN (Standford1970s Edward Shortliffe)

PROSPECTOR (MIT 1979)

Triacute tuệ nhacircn tạo (Artificial Intelligence ndash AI)

Triacute tuệ nhacircn tạo một bộ phacircn của ngagravenh khoa học maacutey tiacutenh quan tacircm đến việc thiết kế caacutec hệ thống maacutey tiacutenh thocircng minh đoacute lagrave caacutec hệ thống đưa ra caacutec đặc điểm magrave từ đoacute chuacuteng ta liecircn hệ với sự thocircng minh trong hagravenh động của con người (Barr vagrave Feigenbaum 1981)

Mục điacutech của AI

Mục điacutech khoa học xaacutec định caacutec gợi yacute để giải thiacutech caacutec loại khaacutec nhau của triacute tuệ thực

Mục điacutech kỹ thuật giải quyết caacutec vấn đề trong thế giới thực

Triacute tuệ nhacircn tạo kế thừa nhiều yacute tưởng quan điểm kỹ thuật từ caacutec ngagravenh khoa học khaacutec

- Triết học

- Logic Toaacuten học

- Tiacutenh toaacuten

- Khoa học tacircm lyacute Khoa học nhận thức

- Sinh học Thần kinh học

- Tiến hoacutea

Caacutec lĩnh vực ứng dụng trong Triacute tuệ nhacircn tạo

Mạng nơ ron thần kinh (Neural Networks)

Tiacutenh toaacuten sự tiến hoacutea

(Evolutionary Computation)

Hệ chuyecircn gia (Expert Systems)

Kỹ thuật xử lyacute tiếng noacutei (Speech Processing)

Kỹ thuật xử lyacute ngocircn ngữ tự nhiecircn

(Natural Language Processing)

Lập kế hoạch (Planning)

Robot (Robotics)

Khoa học higravenh ảnh (Vision)

Caacutec kỹ thuật thocircng dụng dugraveng trong AI

Biểu diễn(Representation)

Học (Learning)

Caacutec luật (Rules)

Tigravem kiếm (Search)

72 Triacute thocircng minh của triacute tuệ nhacircn tạo

Con người suy diễn như thế nagraveo

Phacircn loại (Categorization)

Caacutec quy tắc cụ thể

Heuristics

Kinh nghiệm trước đoacute

Dự tiacutenh trước

Maacutey tiacutenh suy diễn như thế nagraveo

Lập luận dựa trecircn luật IF-THEN mocirc tả tri thức được matilde hoacutea dưới dạng caacutec luật

Caacutec khung (Frames) lagrave caacutec đại diện mocirc tả caacutec tigravenh huống giống nhau lagrave điển higravenh của một vagravei phacircn loại

Lập luận dựa trecircn caacutec trường hợp mocirc phỏng giải phaacutep trước đoacute cho một vấn đề hiện tại

Nhận dạng mẫu phaacutet hiện acircm thanh higravenh dạng hoặc caacutec chuỗi dagravei

Caacutec dạng khaacutec của Triacute tuệ nhacircn tạo

Học maacutey- mạng nơron vagrave giải thuật di truyền

Lập trigravenh tự động ndash lagrave những kỹ thuật tạo ra caacutec chương trigravenh để lagravem 1 nhiệm vụ riecircng biệt (cho pheacutep những người khocircng phải lagrave người lập trigravenh coacute thể lập trigravenh được)

Cuộc sống nhacircn tạo ndash nỗ lực để taacutei tạo caacutec hiện tượng sinh học trong caacutec hệ thống dựa trecircn maacutey tiacutenh

73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia(Expert Systems- ES)

Theo Jackson (1999) Một hệ chuyecircn gia lagrave một chương trigravenh maacutey tiacutenh mocirc tả vagrave suy diễn với tri thức của một vagravei lĩnh vực để giải quyết vấn đề hay đưa ra caacutec lời khuyecircn

Cấu truacutec cơ bản của ES được dựa theo cấu truacutec chung của DSS Sự khaacutec biệt chiacutenh giữa ES vagraveDSS lagrave hệ ES thu thập caacutec kiến thức từ những

chuyecircn gia trong lĩnh vực quan tacircmĐặc trưng của hệ chuyecircn gia Hiệu quả cao Thời gian trả lời thỏa đaacuteng Độ tin cậy cao Dễ hiểu

Giao diện người dugraveng trong ES

Thiết kế giao diện người dugraveng tập trung vagraveo caacutec yếu tố như dễ dagraveng sử dụngcoacute độ tin cậy cao giảm tải những khoacute khăn khi sử dụng

Thiết kế necircn coacute một số tương taacutec (đầu vagraveo kiểm soaacutet vagrave truy vấn)

Cấu tạo giao diện người dugraveng gồm coacute magraven higravenh cảm ứng bagraven phiacutem buacutet saacuteng lệnh thoại caacutec phiacutem chuyecircn dụng

Cơ sở tri thức (Knowledge Base)

Chứa đựng caacutec tri thức cụ thể miền thu được từ caacutec chuyecircn gia miền

Coacute thể chứa caacutec mocirc tả caacutec hagravenh vi giải quyết vấn đề caacutec ragraveng buộc caacutec heuristics

Thagravenh cocircng của một ES dựa trecircn tiacutenh đầy đủ vagrave tiacutenh chiacutenh xaacutec của cơ sở tri thức

Mocirc tơ suy diễn (Inference Engine)

Ở đacircy tri thức được đặt để sử dụng tạo ra caacutec giải phaacutep để giải quyết vấn đề

Mocirc tơ nagravey coacute khả năng thực hiện diễn dịch hoặc suy diễn dựa trecircn caacutec luật hay caacutec caacutec sự kiện

Đồng thời cũng coacute khả năng sử dụng caacutec suy diễn mờ hay khocircng chiacutenh xaacutec dựa trecircn xaacutec suất hay aacutenh xạ mẫu

Vograveng điều khiển suy diễn

1 Aacutenh xạ caacutec luật với caacutec sự kiện đatilde được cho

2 Chọn luật để thực hiện

3 Thực hiện luật bằng caacutech thecircm caacutec sự kiện được suy diễn ra vagraveo bộ nhớ lagravem việc

Chuỗi suy diễn (Chaining)

Suy diễn tiến (forward chaining) maacutey suy diễn bắt đầu từ dữ liệu ban đầu vagrave thực hiện việc suy luận để đưa ra caacutec kết luận cuối cugraveng

Suy diễn lugravei (backward chaining) maacutey suy diễn bắt đầu từ dữ liệu điacutech vagrave tigravem ra tri thức hỗ trợ cho dữ liệu điacutech đoacute

Viacute dụ suy diễn lugravei

R1 Nếu coacute A vagrave B thigrave suy ra coacute D

R2 Nếu coacute B thigrave suy ra coacute C

R3 Nếu coacute C vagrave D thigrave suy ra coacute E

Ta coacute E ta xem trong 3 luật R1 R2 R3 luật nagraveo coacute E ta thấy R3 chứa E đồng thời chứa C vagrave D Xeacutet tiếp trong 2 luật R1 R2 luật nagraveo chứa C vagrave D R2 chứa C R3 chứa D Từ đoacute ta coacute được caacutec tri thức hỗ trợ suy diễn vagrave kết luận lagrave nếu coacute A vagrave B thigrave sẽ coacute E Hay nếu A vagrave B đuacuteng thigrave sẽ coacute E

Viacute dụ suy diễn tiến

Giả sử coacute tập chứa 3 luật sau

R1 Nếu coacute A vagrave B thigrave suy ra coacute D

R2 Nếu coacute B thigrave suy ra coacute C

R3 Nếu coacute C vagrave D thigrave suy ra coacute E

Nếu ta coacute A vagrave B thigrave chuacuteng ta suy ra được D từ R1 vagrave suy ra C từ R2 Với D vagrave C đatilde được suy ra ở trecircn giờ chuacuteng ta suy ra được E từ R3

Viacute dụ thực tế

Giả sử muốn biết magraveu của một con vật nuocirci tecircn lagrave Fred biết rằng noacute kecircu ộp ộp vagrave ăn ruồi

Coacute tập 4 luật ban đầu như sau

R1 Nếu X kecircu ộp ộp vagrave ăn ruồi thigrave X lagrave con ếch

R2 Nếu X kecircu chiecircm chiếp vagrave biết hoacutet thigrave X lagrave con chim

R3 Nếu X lagrave con ếch thigrave X coacute magraveu xanh

R4 Nếu X lagrave con chim thigrave X coacute magraveu vagraveng

74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia

Expert system shells lagrave một tập caacutec goacutei phần mềm vagrave caacutec cocircng cụ dugraveng để phaacutet triển caacutec hệ chuyecircn gia

Những Expert system shells đầu tiecircn thường rất rườm ragrave Mặc dugrave vậy noacute vẫn giuacutep cho người sử dụng sẽ khocircng phải bắt đầu lại từ đầu khi xacircy dựng một hệ chuyecircn gia mới

Những shell hiện đại bao gồm hai mocirc-đun chiacutenh lagrave cocircng cụ xacircy dựng một tập quy tắc vagrave mocirc tơ suy diễn

Xacircy dựng hệ chuyecircn gia

Bước 1 xacircy dựng mocirc higravenh bagravei toaacuten xaacutec định vấn đề nhiệm vụ magrave hệ thống sẽ thực hiện Caacutec dạng bagravei toaacuten cần hệ chuyecircn gia

Bagravei toaacuten diễn giải (InterPretation)

Bagravei toaacuten dự baacuteo (Prediction)

Bagravei toaacuten chuẩn đoaacuten (Diagnose)

Bagravei toaacuten gỡ rối (Debugging)

Bagravei toaacuten thiết kế

Tương tự như một dự aacuten phần mềm để xacircy dựng một hệ chuyecircn gia cần phải coacute caacutec yếu tố về nhacircn lực tagravei nguyecircn vagrave thời gian Những yếu tố nagravey ảnh hưởng đến giaacute thah của một hệ chuyecircn giaTrong phần nagravey cacircu hỏi thường được đặt ra lagrave tại sao cần phải xacircy dựng một hệ chuyecircn giaTrước khi bắt đầu phải xaacute định rotilde bagravei toaacuten đạt ra lagrave jiAi lagrave chuyecircn giaAi lagrave người sử dụng

1 Diễn giải (InterPretation) Nghiecircn cứu 1 vấn đề -gt Dựa trecircn những biểu hiện thuộc tiacutenh đặc trưng becircn ngoagravei -gt Tư vấn

(hoặc đưa ra kết luận hay mocirc tả dễ hiểu từ tập dữ liệu thocirc)

2 Bagravei toaacuten dự baacuteo (Prediction) Coacute thể dự đoaacuten được hagravenh vi kết quả dựa trecircn caacutec hiện tượng -gt dự baacuteo

VD Dự baacuteo thời tiết động đấthellip

3 Bagravei toaacuten chẩn đoaacuten (Diagnoss) Xaacutec định caacutec lỗi caacutec bộ phận hỏng hoacutec của hệ thống dựa trecircn caacutec dữ liệu quan saacutet được

4 Bagravei toaacuten gỡ rối (Debugging) Mocirc tả caacutec phương phaacutep khắc phục hệ thống khi gặp sự cố

5 Bagravei toaacuten thiết kế Lựa chọn cấu higravenh caacutec đối tượng nhằm thoả matilden một số ragraveng buộc nagraveo đoacute

6 Giảng dạy Phần mềm dạy học coacute thể chuẩn đoaacuten vagrave sủa lỗi của học sinh trong quaacute trigravenh học tập

Để xaacutec định đuacuteng bagravei toaacuten magrave chuacuteng ta cần giải quyết thigrave phải trả lời đc một số cacircu hỏi

- cần hệ chuyecircn gia

Bước 2 thu thập tri thức lựa chọn cocircng cụ vagrave aacutep dụng

Trong bước thu thập tri thức vấn đề quan trọng lagrave lựa chọn chuyecircn gia những người magrave sẽ đoacuteng goacutep tri thức cho hệ thống Thocircng thường trong suốt quaacute trigravenh phaacutet triển thigrave chuyecircn gia được xem như một thagravenh viecircn của đội phaacutet triển

Hiện nay coacute rất nhiều cocircng cụ để xacircy dựng một hệ chuyecircn gia Phổ biến nhất lagrave JESS CLIPS vagrave OPS5

Bước 3 Thiết kế cơ sở tri thức thiết kế hệ thốngTri thức được biểu diễn trường minh trong cơ sở tri thức

Caacutec chuyecircn gia vagrave kỹ sư tri thức sẽ đối thoại với nhau bằng caacutec kỹ thuật đối thoại Suy diễn (SD) bảng Mocirc higravenh hoacutea SD quy nạp phacircn loại

Vấn đề bagraveo trigrave vagrave phaacutet triển

Caacutec hệ chuyecircn gia đogravei hỏi phải bảo trigrave vagrave phaacutet triển nhiều hơn so với caacutec hệ thống khaacutec Phải thường xuyecircn bổ sung tri thức mới vagrave thay đổi caacutec tri thức cũ để đổi mới hệ chuyecircn gia

Thu thập vagrave khắc phục lỗi do người sử dụng phaacutet hiện để kịp thời khắc phục những sai soacutet của hệ chuyecircn gia

75 Lợi iacutech vagrave hạn chế của caacutec hệ chuyecircn gia

Một số lợi iacutech chiacutenh

Thời gian trả lời hợp lyacute bằng hoặc nhanh hơn so với chuyecircn gia (người) để đi đến cugraveng một quyết định Hệ chuyecircn gia lagrave một hệ thống thời gian thực (real time system)

Khả năng trả lời với mức độ tinh thocircng bằng hoặc cao hơn so với chuyecircn gia (người) trong cugraveng lĩnh vực

Hệ chuyecircn gia giuacutep cho hiệu quả lagravem việc tăng bằng việc sử dụng tập caacutec luật một caacutech nhanh choacuteng magrave ko bị nhầm lẫn chuyecircn gia lagrave người coacute thể quecircn đi một số tri thức cơ sở lyacute luậ nhưng HCG thigrave ko

Quyết định của một người chuyecircn gia coacute thể bị thay đổi vagrave ko coacute tiacutenh thống nhất như quyết định của một hệ chuyecircn gia tạo ra

Hệ chuyecircn gia giuacutep cho người sử dụng coacute thể trau dồi sự hiểu biết trecircn lĩnh vuej cụ thể magrave noacute giải quyết hỗ trợ người ra quyết định coacute trigravenh độ như 1 chuyecircn gia trong quaacute trigravenh gia quyết định

Kiến thức của rất nhiều chuyecircn gia về một lĩnh vực nagraveo đoacute được đưa vagraveo hệ chuyecircn gia lagravem cho CSTT cuat HCG phong phuacute vagrave rộng lớn hơn rất nhiều

HCG giải thiacutech caacutec bước suy luận một caacutech dễ hiểu nhất quaacuten luacutec nagraveo cũng coacute thể sử dụng ko như chuyecircn gia con người

Hạn chế của caacutec hệ chuyecircn gia

Nhược điểm lớn nhất của hệ chuyecircn gia lagrave những yacute kiến chuyecircn mocircn thường rất khoacute matilde hoacutea vagrave giải neacuten

Hệ chuyecircn gia khocircng coacute khả năng tự học tự cập nhật kiến thức mới như caacutec chuyecircn gia magrave cần phải được matilde hoacutea lại khi noacute được cập nhật

Hệ chuyecircn gia khocircng thể nhận ra được vấn đề khocircng nằm trong miền kiến thức của hệ thống

Chương 8 Tri thức vagrave tiếp nhận

1 Bao gồm caacutec vấn đề

Dữ liệu thực tế đo lường hoặc quan saacutet coacute hoặc khocircng coacute bối cảnh

Thocircng tin dữ liệu được tổng hợp một caacutech hữu iacutech để giải quyết những khoacute khăn trong việc đưa ra quyết định

Tri thức bao gồm caacutec ứng dụng quy tắc thocircng tin hướng dẫn của người ra quyết định

2 Những caacutei nhigraven về tri thức

Đại diện lagravem thế nagraveo để diễn tả tri thức viacute dụ như một quyển saacutech khocircng phải lagrave tri thức nhưng noacute lại lagrave một đại diện của tri thức

Sản xuất tri thức lagrave một tập hơp của hagraveng tồn kho coacute thể được sản xuất cũng như mua lại

Tri thức lagrave 1 trong 6 trạng thaacutei của hệ thống

1Dữ liệu 2Thocircng tin 3Cấu truacutec thocircng tin 4Sự thấu hiểu 5Yacute kiến 6 Quyết định

3 Caacutec loại tri thức Phổ biến mocirc tả dữ liệu thocircng tin thủ tục mọi thứ lagravem như thế nagraveo lập luận chiacutenh saacutech hoặc caacutec quy tắc

4 Thu thập Tri thức hệ chuyecircn gia Hầu hết caacutec phương phaacutep đều bắt đầu với mocirc higravenh của caacutec taacutec vụ trong đoacute

hệ chuyecircn gia được xacircy dựng Trong đoacute mocirc tả về caacutec lĩnh vực được tạo ra Caacutec kỹ sư sử dụng caacutec mocirc higravenh giả thuyết vagrave nhận thức về quaacute trigravenh phacircn

tiacutech để gợi ra caacutech giải quyết vấn đề về tri thức từ caacutec chuyecircn gia

5 Caacutec chiều của thu thập tri thức KE- driven caacutec kỹ sư trao đổi trực tiếp với caacutec chuyecircn gia Expert-driven Caacutec chuyecircn gia trực tiếp đưa chuyecircn mocircn của họ vagraveo hệ

thống maacutey tiacutenh Machine-driven Sử dụng caacutec cocircng cụ suy luận để triacutech xuất tri thức từ một

tập caacutec viacute dụ

6 Kỹ thuật thu thập tri thức Trao đổi gồm 2 loại cơ bản lagrave coacute cấu truacutec(coacute kịch bản) vagrave khocircng coacute cấu

truacutec( đối thoại trực tiếp) Giao thức phacircn tiacutech bằng lời Khi caacutec chuyecircn gia thực hiện một cocircng việc

của họ thigrave một bản ghi về cocircng việc đoacute được thực hiện Caacutec kỹ sư sẽ xacircy dựng mocirc higravenh cho những gigrave được ghi lại trong bản ghi

Phương phaacutep sagraveng lọc caacutec chuyecircn gia so saacutenh caacutec nhoacutem liecircn tiếp trong ba đối tượng vagrave cho biết tại sao nhoacutem thứ hai lại khaacutec nhoacutem thứ ba

7 Thu thập tri thức từ nhiều nguồn Thu thập tri thức từ nhiều nguồn lagrave cần thiết để coacute được đầy đủ caacutec tri thức

cho một vấn đề quan điểm yacute kiến traacutei ngược nhau thường phaacutet sinh Phương phaacutep đồng thuận sẽ giuacutep giải quyết được vấn đề macircu thuẫn Kỹ thuật phacircn tiacutech Meta lagrave kỹ thuật được aacutep dụng trong caacutec trường hợp

khaacutec Caacutech tiếp cận bằng định lượng đogravei hỏi caacutec kỹ sư cần cacircn nhắc yếu tố đầu vagraveo của caacutec chuyecircn gia khaacutec nhau

8 Xaacutec nhận hợp lệ vagrave kiểm tra tri thức Một khi thu thập tri thức noacute phải được đaacutenh giaacute về khả năng sử dụng vagrave độ

chiacutenh xaacutec Hai vấn đề cụ thể lagrave hiệu lực của những kiến thức vagrave kiểm tra việc xacircy dựng cơ sở của tri thức

Cần xaacutec nhận xem liệu hệ thống coacute thể hoạt động ở mức độ tối thiểu khocircng

Xaacutec minh liecircn quan đến việc so saacutenh từng chi tiết kỹ thuật của hệ thống những gigrave đatilde được thực hiện cuối cugraveng

9 Một số caacutec biện phaacutep xaacutec nhận Độ chiacutenh xaacutec Khả năng thiacutech nghi Mức độ đầy đủ Bề rộng Độ sacircu Hiệu lực Tổng quan Chiacutenh xaacutec Hiện thực Độ tin cậy Tiacutenh hữu dụng Mức độ

Chương 9 Học maacutey

1 Logic mờ vagrave ngocircn ngữ mờ(Fuzzy Logic and Linguistic Ambiguity)

Ngocircn ngữ tự nhiecircn gồm những khaacutei niệm mơ hồ vagrave khocircng chiacutenh xaacutectruyền tải ngữ nghĩa thocircng qua tiacutenh xấp xỉkhocircng rotilde ragraveng

Những xấp xỉ nagravey giuacutep con người coacute thể truyền tải hết được yacute nghĩa nhưng maacutey thigrave khocircng hiểu

Lagravem sao biểu diễn caacutec tri thức sử dụng caacutec khaacutei niệm khocircng rotilde ragraveng(mờ) hoặc khocircng chiacutenh xaacutec

2 Khaacutei niệm cơ bản của logic mờ tập mờ lagrave những tập hợp khocircng coacute một giới hạn rotilde Mỗi phần tử của noacute chỉ

chứa một mức độ hagravem liecircn thuộc của từng phần tử Vigrave vậy tập mờ khocircng giống như tập cổ điển Tập mờ coacute thể kết hợp với nhau qua những luật mờ magrave đặc trưng cho những hagravenh động trạng thaacutei vagrave thuộc tiacutenh của logic mờ được tận dụng khi thực hiện một bộ điều khiển mờ

Logic mờ dựa trecircn yacute tưởng mỗi phần tử thuộc vagraveo một tập hợp ở một mức độ nagraveo đấy

Locircgic mờ cho pheacutep độ liecircn thuộc (microA )coacute giaacute trị trong khoảng (01) Locircgic mờ coacute thể được coi lagrave mặt ứng dụng của lyacute thuyết tập mờ để xử lyacute caacutec

giaacute trị trong thế giới thực cho caacutec bagravei toaacuten phức tạp

3 So saacutenh tiacutenh đuacuteng đắn logic mờ vagrave xaacutec suất Xaacutec suất thigrave đề cập đến khả năng xảy ra một biến cố hay một điều gigrave đoacute Logic mờ đề cập đến cấp độ magrave đặc tiacutenh ở hiện tại

o viacute dụ1 người coacute chiều cao 6 feet thigrave coacute cấp độ lagrave 05 về chiều cao

4 Ưu điểm của logic mờ Caacutech tiếp cận rất tự nhiecircnkhocircng phức tạp Coacute thể mocirc higravenh hoacutea caacutec hagravem phi tuyến tugravey yacute phức tạp

Coacute thể tận dụng được kinh nghiệm từ những chuyecircn gia hagraveng đầu trong mọi lĩnh vực

Logic mờ được xacircy dựng dựa trecircn ngocircn ngữ tự nhiecircnNền tảng của logic mờ lagrave dựa trecircn cơ sở giao tiếp của con người

5 Nhược điểm của logic mờ Trong 1 hệ thống phức tạpsử dụng logic mờ coacute thể trở thagravenh trở ngại cho

việc xaacutec thực độ tin cậy của hệ thống Cơ chế lập luận mờ khocircng thể học hỏi từ những lỗi sai

6 Mạng noron nhacircn tạo(ANN) Mạng noron nhacircn tạo lagrave một mocirc phỏng xử lyacute thocircng tinđược nghiecircn cứu ra

từ hệ thống thần kinh của sinh vậtgiống như bộ natildeo để xử lyacute thocircng tin ANNs lagrave chương trigravenh dựa trecircn maacutey tiacutenh đơn giản coacute chức năng lagrave một mocirc

higravenh bagravei toaacuten khocircng gian dựa trecircn thử nghiệm vagrave baacuteo lỗi

7 Học từ kinh nghiệm Tiến trigravenh Một mẫu dữ liệu được biểu diễn như một mạng lưới noronANN ldquodự

đoaacutenrdquo 1 đầu radự đoaacuten được so saacutenh với giaacute trị thực tế hoặc giaacute trị chiacutenh xaacutecNếu đoaacuten được chiacutenh xaacutec thigrave khocircng coacute hagravenh động nagraveo được thực hiện

Nếu dự đoaacuten sai ANN kiểm tra lại vagrave xaacutec định lại thocircng số để điều chỉnh Một mẫu dữ liệu khaacutec được biểu diễn vagrave quaacute trigravenh nagravey được lặp lại

8 Nguyecircn tắc cơ bản của cocircng nghệ nơron Caacutec yếu tố xử lyacute cơ bản trong hệ thống thần kinh của con người lagrave tế bagraveo

thần kinhMạng lưới của tế bagraveo nagravey lagrave liecircn kết với nhau nhận được thocircng tin từ caacutec cảm biến trong mắt taihellip

Thocircng tin nhận được bởi tế bagraveo thần kinh hoặc lagrave sẽ kiacutech thiacutech noacute(sẽ được chuyển qua 1 thocircng điệp dọc theo mạng lưới) hoặc lagrave sẽ ngăn cản noacute(ngăn cản dograveng thocircng tin)

Độ nhạy coacute thể thay đổi qua thời gian hoặc sau khi coacute được kinh nghiệm

9 Cấu truacutec mạng Một ANN gồm 3 lớp cơ bản

Lớp đầu vagraveo nhận dữ liệu Lớp becircn trong hoặc lagrave lớp ẩn xử lyacute dữ liệu Lớp đầu ra chuyển tiếp kết quả cuối cugraveng của mạng

10Mạng nơ ron Thường coacute nhiều đầu vagraveo mỗi đầu vagraveo với mức ảnh hưởng vagrave tầm quan

trọng riecircng của noacute Một đầu vagraveo quan trọng coacute thể được sử dụng để khuếch đại đầu ra caacutec hagravem trạng thaacutei tổng hợp caacutec trọng số của caacutec yếu tố

đầuvagraveo khaacutec nhauvagraveo một giaacute trị duy nhất Caacutec hagravem chuyển giao xử lyacute caacutec giaacute trị trạng thaacutei vagrave tạo đầu ra

11Huấn luyện mạng nơ ron Trong mocirc higravenh coacute giaacutem saacutetANN được đến so saacutenh dự đoaacuten của chiacutenh

noacute với thocircng tin phản hồi coacute chứa caacutec kết quả mong muốn ANN sẽ phải tigravem caacutech thay đổi caacutec tham số becircn trong củamigravenh (caacutec trọng số vagrave caacutec ngưỡng) để tạo necircn một aacutenh xạ coacute khả năng aacutenh xạcaacutec đầu vagraveo thagravenh caacutec đầu ra mong muốn Sự thay đổi nagravey được tiến hagravenh nhờ việc so saacutenh giữa đầu ra thực sự vagrave đầu ra mong muốn

Trong mocirc higravenh khocircng coacute giaacutem saacutetANN nhận được dữ liệu vagraveo nhưng khocircng phải coacute bất kỳ thocircng tin phản hồi về kết quả mong muốn

Phần lớn caacutec ứng dụng nằm trong vugraveng của caacutec bagravei toaacuten ước lượng như mocirc higravenh hoacuteathống kecirc neacuten lọc phacircn cụm

12Lợi iacutech Liecircn kết với mạng noron Traacutenh caacutech lập trigravenh tường minh Giảm nhu cầu của chuyecircn gia ANNs thigrave thiacutech nghi với caacutec yếu tố đầu vagraveo thay đổi Khocircng cần thiết cho cơ sở tri thức tinh chế ANNs coacute tiacutenh động vagrave cải thiện với việc sử dụng Coacute khả năng xử lyacute dữ liệu khocircng chiacutenh xaacutec hoặc khocircng đầy đủ Cho pheacutep tổng quaacutet hoacutea từ thocircng tin cụ thể Cho pheacutep thu thập cảm giaacutec thocircng thường vagraveo miền giải quyết vấn đề

13Hạn chế của việc liecircn kết với mạng noron ANNs khocircng thể giải thiacutech được suy luận Bản chất hộp đen thường khiến cho vấn đề traacutech nhiệm vagrave độ tin cậy phaacutet

sinh lagrave khoacute khăn Lặp đi lặp lại quaacute trigravenh huấn luyện rất tốn thời gian Nguồn lực caacutec nhagrave phacircn tiacutech vagrave thiết kế coacute tay nghề cao vẫn lagrave đaacuteng lo

ngại Cocircng nghệ ANN thuacutec đẩy hạn chế của phần cứng hiện tại ANN yecircu cầu phải coacute sự tin tưởng ở đầu ra

14Giới thiệu về thuật toaacuten di truyền Cũng như mạng lưới thần kinh caacutec thuật toaacuten di truyền được dựa trecircn lyacute

thuyết sinh học Thuật toaacuten di truyền tigravem thấy nguồn gốc của chuacuteng trong caacutec lyacute thuyết

tiến hoacutea của chọn lọc tự nhiecircn vagrave thiacutech ứng với biến đổi khiacute hậu Kết quả thuật toaacuten di truyền lagrave từ giao phối 2 caacute thể trong quần thế để tạo

ra con caacutei đocirci khi tốt hơn so với bậc cha mẹ của chuacuteng 15Caacutec thagravenh phần cơ bản của thuật toaacuten di truyền

Toaacuten tử chọn lọc Caacutec caacute thể tốt được chọn lọc để đưa vagraveo thế hệ sau Sự chọn lọc nagravey căn cứ vagraveo độ thiacutech nghi với mocirci trường của mỗi caacute thể

Toaacuten tử lai gheacutep (crossover) Hai caacute thể cha vagrave mẹ trao đổi caacutec gen với nhau để tạo ra caacute thể con

Toaacuten tử đột biến (mutation) Một caacute thể thay đổi một số gen để biến đổi thagravenh một caacute thể mớiTất cả caacutec toaacuten tử trecircn khi thực hiện đều mang tiacutenh ngẫu nhiecircn

16Quaacute trigravenh cơ bản của một thuật toaacuten di truyền Khởi tạo

Đaacutenh giaacute quần thể

Lựa chọn NST thiacutech hợp nhất vagrave loại bỏ NST yếu nhất

Quy trigravenh giao nhau vagrave cải thiện quần thể

đột biến tiến trigravenh để khaacutem phaacute ra NST mới

17Ưu nhược điểm của việc kết hợp với thuật toaacuten di truyền Kiacutech thước quần thể lagrave 1 yếu tố quan trọng trong tốc độ của việc tigravem

kiếmnhưng noacute tương đối dễ dagraveng để dự đoaacuten tốc độ nagravey Giao nhau hoặc đột biến lagrave khocircng necircn đc sử dụng quaacute thường xuyecircn Luocircn coacute được iacutet nhất 1 giải phaacutep hợp lyacute Necircn coacute thể aacutep dụng chuacuteng cho caacutec vấn đề magrave chuacuteng ta khocircng coacute hướng

về caacutech giải quyết Sức mạnh của thuật toaacuten xuất phaacutet từ khaacutei niệm đơn giảnkhocircng phải từ

một thủ tục thuật toaacuten phức tạp 18Tương lai của học maacutey

Mạng lưới thần kinh nhacircn tạo vượt quaacute năng lực của con người trong caacutec trường hợp bị cocirc lập

Về mặt lyacute thuyếtmột maacutey tiacutenh coacute thể xử lyacute dũ liệu nhanh hơn hagraveng triệu lần so với 1 con người

May mắn thay cho chuacuteng tacon người tốt hơn nhiều khi magrave coacute được dữ liệumaacutey tiacutenh khocircng coacute 1 số thứ như lagrave 5 giaacutec quan

CHƯƠNG 10 KHO DỮ LIỆU

1 Kho dữ liệu Kho dữ liệu lagrave tuyển tập caacutec cơ sở dữ liệu tiacutech hợp hướng chủ đề được

thiết kế để trợ giuacutep cho một hệ hỗ trợ quyết định

Theo John Ladley Cocircng nghệ kho dữ liệu lagrave tập caacutec phương phaacutep kỹ thuật vagrave caacutec cocircng cụ coacute thể kết hợp hỗ trợ nhau để cung cấp thocircng tin cho người sử dụng trecircn cơ sở tiacutech hợp từ nhiều nguồn dữ liệu nhiều mocirci trường khaacutec nhau

Kho dữ liệu thường rất lớn tới hagraveng trăm GB hay thậm chiacute hagraveng Terabyte

2 Kho dữ liệu vận hagravenh (ODS) Một kho dữ liệu vận hagravenh Aacutep dụng kỹ thuật kho dữ liệu vagraveo caacutec hệ xử

lyacute giao taacutec lưu trữ dữ liệu cho một ứng dụng đặc thugrave Noacute đưa vagraveo kho dữ liệu một dograveng caacutec dữ liệu thocirc được thiết kế

3 So saacutenh

Kho dữ liệu vận hagravenh Kho dữ liệu

Dữ liệu theo chủ đề Dữ liệu theo chủ đề

Dữ liệu tiacutech hợp Dữ liệu tiacutech hợp

Dữ liệu thay đổi Dữ liệu khocircng thay đổi

Dữ liệu được cập nhật khi thay đổi

Dữ liệu giữ nguyecircn

Chỉ coacute dữ liệu hiện tạiDữliệu hiện tại vagrave dữ liệu lịch sử

Chu kỳ lagravem tươi dữ liệu ngắn Chu kỳ lagravem tươi dữ liệu dagravei

Chỉ coacute dữ liệu chi tiết Dữ liệu chi tiết vagrave dữ liệu tổng kết

Dugraveng cho caacutec quyết định ngắn hạn

Dugraveng cho hoạch định dagravei hạn

4 Kho dữ liệu cục bộ (Data Mart - DM)

Kho dữ liệu cục bộ lagrave CSDL coacute những đặc điểm giống với kho dữ liệu nhưng với quy mocirc nhỏ hơn vagrave lưu trữ dữ liệu về một lĩnh vực một chuyecircn ngagravenh

Data mart phụ thuộc Chứa những dữ liệu được lấy từ DW vagrave những dữ liệu nagravey sẽ được triacutech lọc vagrave tinh chế tiacutech hợp lại ở mức cao hơn để phục vụ một chủ đề nhất định của Datamart

Data mart độc lập Khocircng giống như Datamart phụ thuộc Data mart độc lập được xacircy dựng trước DW vagrave dữ liệu được trực tiếp lấy từ caacutec nguồn khaacutec nhau

5 Siecircu dữ liệu Metadata lagrave dữ liệu để mocirc tả dữ liệu Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột

một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi Metadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu

6 Mocirci trường kho dữ liệu Hệ thống của tổ chức vagrave kho cung cấp dữ liệu để xacircy dựng kho dữ liệu Trong quaacute trigravenh chuyển dữ liệu từ caacutec nguồn khaacutec nhau dữ liệu coacute thể

được lagravem sạch hoặc chuyển đổi vagrave vigrave thế DW được xem như lagrave một chuẩn cho việc lưu trữ

Đồng thời siecircu dữ liệu được ghi lại Cuối cugraveng DW hoặc siecircu thị coacute thể được sử dụng để tạo ra một kho dữ

liệu ldquocaacute nhacircnrdquo 7 Caacutec đặc điểm của kho dữ liệu

Đặc điểm Mocirc tả

Hướng chủ đề - DL tổ chức theo caacutech thức người dugraveng tham chiếu

Tiacutech hợp - Dữ liệu ldquosạchrdquo loại bỏ tiacutenh thiếu nhất quaacuten

Khocircng thay đổi - DL ldquochỉ đọcrdquo người dugraveng khocircng thay đổi được

Chuỗi thời gian - DL lagrave chuỗi thời gian khocircng phải lagrave trạng thaacutei hiện tại

Được tổng kết - DL vận hagravenhthao taacutec khi cần thiết

được kết hợp lại thagravenh dạng coacute thể dugraveng được cho quyết định

Kiacutech cỡ lớn hơn - Lưu giữ theo chuỗi thời gian tức lagrave giữ lại nhiều DL

Khocircng được chuẩn hoacutea - Coacute thể dư thừa DLSiecircu dữ liệu - Dữ liệu của dữ liệu được lưu trữNguồn dữ liệu - DL vận hagravenh (caacutec hệ sẵn coacute) cugraveng

với caacutec nguồn ngoagravei 8 Kho dữ liệu hướng chủ đề

Hướng chủ để coacute nghĩa lagrave kho dữ liệu được tổ chức xung quanh caacutec chủ đề chiacutenh như khaacutech hagraveng sản phẩm sản xuất Tập trung vagraveo việc mocirc higravenh hoacutea vagrave phacircn tiacutech dữ liệu cho caacutec nhagrave ra quyết định magrave khocircng tập trung vagraveo caacutec xử lyacute thocircng thường Cung cấp cho người dugraveng một khung nhigraven toagraven vẹn đơn giản vagrave đầy đủ về caacutec sự kiện quanh caacutec chủ đề

9 Dữ liệu trong DW được tiacutech hợp Dữ liệu trong kho dữ liệu được xacircy dựng bằng caacutech tổng hợp dữ liệu từ

nhiều nguồn khaacutec nhau vagrave caacutec nguồn coacute tổ chức khaacutec nhau Cơ sở dữ liệu caacutec file excel caacutec flat file hoặc caacutec raw file Khi đưa vagraveo kho dữ liệu caacutec dữ liệu được lagravem sạch vagrave tiacutech hợp dữ liệu nhằm đảm bảo tiacutenh nhất quaacuten của dữ liệu

10Kiến truacutec kho dữ liệu Tầng cơ sở dữ liệu hoạt động Tầng truy xuất thocircng tin Tầng truy xuất dữ liệu Tầng siecircu dữ liệu Tầng quản lyacute tiến trigravenh Tầng thocircng điệp của ứng dụng Tầng vật liacute của kho dữ liệu Tầng trigravenh diễn dữ liệu

11Higravenh trạng kho dữ liệu Kho dữ liệu ảo - người dugraveng cuối coacute thể truy cập trực tiếp đến kho dữ liệu

sử dụng caacutec cocircng cụ cho pheacutep ở tầng truy xuất dữ liệu Kho dữ liệu trung tacircm-1 cơ sở dữ liệu vật lyacute chứa tất cả dữ liệu cho một

vugraveng chuyecircn dụng nagraveo đoacute

Kho dữ liệu phacircn taacuten- Thagravenh phần được phacircn taacuten qua nhiều hệ cơ sở dữ liệu vật lyacute

12METADATA- Siecircu dữ liệu Định nghĩa Siecircu dữ liệu lagrave dữ liệu về dữ liệu Lagrave 1 lưu trữ dugraveng để

Miecircu tả kho dữ liệu tổng thể Nhận dạng kiểu kho dữ liệu Quản liacute quaacute trigravenh tiacutech hợp dữ liệu Quản liacute quaacute trigravenh cập nhật kho dữ liệu Quản liacute bảo mật

Lagrave chigravea khoacutea quyết định sự thagravenh cocircng của kho dữ liệu luocircn được thay đổi vagrave cập nhật theo sự phaacutet triển của kho dữ liệu

Dugraveng để quản liacute điều khiển kho dữ liệu Sự ra đời của kho dữ liệu như 1 cấu truacutec hỗ trợ ra quyết định siecircu dữ liệu

được xem như nguồn tagravei nguyecircn dữ liệu Siecircu dữ liệu lagrave trừu tượng Chuacuteng lagrave dữ liệu bậc cao cung cấp mocirc tả ngắn

gọn caacutec dữ liệu bậc thấp hơn 13Hoạt động của Siecircu dữ liệu

Siecircu dữ liệu rất cần thiết trong việc chuyển hoacutea thocircng tin trở thagravenh tri thức Lagrave chigravea khoacutea giuacutep chuacuteng ta xử lyacute được dữ liệu thocirc Viacute dụ một dograveng dữ liệu baacuten hagraveng 1023 K596 11121 agraveNoacute sẽ khocircng coacute nghĩa gigrave cho đến khi chuacuteng ta đưa vagraveo siecircu dữ liệu (thư

mục chứa dữ liệu) agrave cửa hagraveng 1023 sản phẩm K596 vagrave số tiền baacuten được lagrave 11121 đocirc la

14Sự cần thiết phải nhất quaacuten trong kho dữ liệu Kho dữ liệu được xacircy dựng cho lợi iacutech của những nhagrave phacircn tiacutech kinh

doanh caacutec nhagrave quản trị cho tất cả caacutec khu vực chức năng Trong cơ sở dữ liệu riecircng caacutec khu vực khaacutec nhau coacute thể định nghĩa vagrave lưu

trữ dữ liệu thocircng qua phiecircn bản của chiacutenh noacute Khi dữ liệu được lấy từ những vugraveng khaacutec nhau đoacute vagrave được đặt vagraveo kho dữ

liệu Việc chuyển đổi vagrave lagravem sạch caacutec tiến trigravenh sẽ đảm bảo noacute lagrave duy nhất được tiacutech hợp tại một mức của tổ chức

15Ragrave soaacutet lại dữ liệu ndash Thực thi siecircu dữ liệu

Bất kể cấu truacutec tự nhiecircn của 1 cacircu truy vấn thế nagraveo thigrave caacutec thagravenh phần của siecircu dữ liệu rất quan trọng đối với người ra quyết định

Bảng thuộc tiacutenh khoacutea được lưu trữ bởi kho dữ liệu Tập hợp dữ liệu được lấy từ đacircu Những chuyển đổi nagraveo được thực thi với việc lagravem sạch

16Siecircu dữ liệu lagrave gigrave Metadata - lagrave thocircng tin mocirc tả nội dung của cơ sở dữ liệu (CSDL) Metadata baacuteo cho người dugraveng biết thời gian cập nhật sau cugraveng của dữ liệu

định dạng vagrave mục điacutech sử dụng của noacute Những thocircng tin nagravey coacute thể hướng dẫn người dugraveng duyệt qua CSDL vagrave

giuacutep họ hiểu được yacute nghĩa vagrave ngữ cảnh của dữ liệu Trong CSDL metadata lagrave caacutec dạng biểu diễn khaacutec nhau của caacutec đối tượng

trong CSDL Trong CSDL quan hệ metadata lagrave caacutec định nghĩa của bảng cột CSDL

view vagrave nhiều đối tượng khaacutec Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột

một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi -gtMetadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu

Bảng chuyển đổi Ghi lại những chuyển đổi đatilde được thực hiện

Lịch sử thực thi Ghi lại những dữ liệu đatilde được

phacircn tiacutech

Higravenh thaacutei kết nốiGhi lại những dữ liệu được kết nối vagrave tần suất

17Aacutenh xạ thocircng thường của siecircu dữ liệu Bản ghi aacutenh xạ chuyển đổi bao gồm

Định danh của nguồn gốc Chuyển đổi thuộc tiacutenh Chuyển đổi thuộc tiacutenh vật lyacute Matilde hoacutea tham chiếu bảng chuyển đổi Đổi tecircn Đổi khoacutea Gaacuten giaacute trị cho thuộc tiacutenh mặc định Chọn logic cho caacutec nguồn nhiều giaacute trị Đổi thuật toaacuten

18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để

phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai

lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave

tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec

Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm

Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo

19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua

caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau

SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được

Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra

một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức

Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ

Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ

Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech

CHƯƠNG 11 KHAI PHAacute DỮ LIỆU

1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn

ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993

Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng

2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd

1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều

2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP

3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn

4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng

5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server

6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo

7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động

8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời

9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều

10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện

11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech

12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP

3 Xử lyacute phacircn tiacutech trực tuyến OLAP

MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave

dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu

ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave

thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu

HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave

ROLAP4 Khai phaacute dữ liệu

Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh

khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn

Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan

5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp

6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại

Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp

Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec

Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt

Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra

Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh

vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho

Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec

Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm

Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục

Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng

gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp

Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn

Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec

Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper

Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2

Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25

Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước

Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng

Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện

trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp

Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute

độ hỗ trợ ge ngưỡng minsup

độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan

Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn

Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết

Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu

MOLAP ROLAP HOLAP

Lưu trữ dữ liệu cơ sở

Khối Bảng quan hệ Bảng quan hệ

Lưu trữ thocircng tin tổng hợp

Khối Bảng quan hệ Khối

Hiệu suất thực hiện truy vấn

Nhanh nhất Chậm nhất Nhanh

Tiecircu thụ khocircng gian lưu trữ

Nhiều Thấp Trung bigravenh

Chi phiacute bảo trigrave Cao Thấp Trung bigravenh

Page 25: De cuong(1-11)

Cơ chế cấu truacutec quaacute trigravenh chi phối caacutec hoạt động truyền thocircng

Nhiệm vụ hỗ trợ cocircng việc coacute thể chọn lựa tổ chức hoặc lấy thocircng tin

Nhiệm vụ cấu truacutec cocircng việc cho pheacutep truy cập đến kỹ thuật lọc kết hợp phacircn tiacutech kiến thức liecircn quan đến cocircng việc

Caacutec lớp loại cocircng nghệ hỗ trợ MDM

Phacircn loại theo đặc điểm do DeSanctis vagrave Gallupe đưa ra đề xuất một chương trigravenh ba cấp dựa trecircn caacutec tiacutenh năng được cung cấp

Hệ thống cấp 1 Mục điacutech chiacutenh lagrave tạo điều kiện thocircng tin liecircn lạc giữa caacutec thagravenh viecircn

Hệ thống cấp 2 Thiết kế để giảm thiểu rủi ro

Hệ thống cấp 3 Giuacutep điều chỉnh xử lyacute quyết định

Phacircn loại theo cocircng nghệ -Kraemer vagrave King tập trung vagraveo cocircng nghệ aacutep dụng

Cocircng nghệ bảng mạch điện tử

Hội nghị trực tuyến

Mạng lưới tập đoagraven

Trung tacircm thocircng tin

Mocirci trường cộng taacutec

Phograveng quyết định

Nhoacutem phần mềm

Phần mềm được thiết kế để hỗ trợ sự hợp taacutec bao gồm việc thu huacutet vagrave lưu trữ thocircng tin

Caacutec tổ chức dẫn đầu thị trường hiện tại lagrave Lotus Notes and Domino Microsoft Exchange Novell GroupWise and Oracle Office

Caacutec cocircng cụ trong một bộ phần mềm bao gồm người quản lyacute hội nghị (Lotus Sametime) vagrave trao đổi thocircng điệp (Lotus Notes Mail)

Xếp hạng phần mềm cho nhoacutem

Ellis vv đề xuất một hệ thống xếp hạng dựa vagraveo kiểu sự hỗ trợ noacute Cung cấp

Hệ thocircng điệp

Hệ thống hội thảo truyền higravenh

Hệ thống cộng taacutec soạn thảo

Nhoacutem phacircn phối giải phaacutep phần mền

Hệ thống phối hợp

Hệ thống thocircng minh đại diện

Lực lượng điều khiển phaacutet triển phần mềm cho nhoacutem

Một số nhacircn tố chiacutenh bao gồm

Tăng năng suất

Giảm số lượng caacutec cuộc họp

Tăng cường tự động hoacutea caacutec quy trigravenh lagravem việc thường xuyecircn

Cần phối hợp toagraven cầu tốt hơn

Tiacutenh sẵn sagraveng của những mạng lan rộng

Coleman vagrave Khanna liệt kecirc 10 nhacircn tố khaacutec

54Quản lyacute hoạt động MDM (Mobile Device Management - Quản lyacute thiết bị di động)

Một số phương phaacutep phối hợp phổ biến hơnMDM lagrave

Kỹ thuật nhoacutem định danh

Kỹ thuật Delphi

Sự phacircn xử

Hệ thocircng tin dựa trecircn vấn đề

Nemawashi

Kỹ thuật nhoacutem định danh

1-Mỗi người tham gia viết ra những yacute tưởng về những gigrave necircn quyết định

2-Lần lượt mỗi người tham gia trigravenh bagravey yacute tưởng của migravenh được ghi lại trecircn bảng Khocircng thảo luận ở đacircy

3-Sau khi tất cả caacutec yacute tưởng được trigravenh bagravey caacutec đại biểu coacute thể chất vấn những người khaacutec

4-Mỗi người tham gia bỏ phiếu cho mỗi yacute tưởng

Kỹ thuật Delphi

Về cơ bản tương tự như kỹ thuật nhoacutem định danh ngoại trừ những người khocircng bao giờ tham gia cuộc họp

Một cocircng cụ khảo saacutet được sử dụng để thu thập đầu vagraveo ban đầu từ caacutec thagravenh viecircn

Một cuộc khảo saacutet thứ hai được gửi đi với một bản toacutem tắt caacutec kết quả chung

Những bước lặp lại cho đến khi đạt được một sự đồng thuận hoặc nhigraven nhận của đa số

Sự phacircn xử(Arbitration )

Thiacutech hợp nhất khi caacutec thagravenh viecircn của MDM đại diện cho caacutec yếu tố đối lập

Những người tham gia đồng yacute rằng nếu lựa chọn thay thế hai becircn thỏa thuận khocircng được tigravem thấy thigrave một trọng tagravei viecircn becircn ngoagravei sẽ tham gia

Trọng tagravei sau đoacute lựa chọn thay thế ocircng hoặc xeacutet thấy thiacutech hợp nhất

Hệ thống thocircng tin dựa trecircn vấn đề (IBIS)

Lagrave một phương phaacutep lập luận cấu truacutec

Một đại diện cho IBIS lagrave một đồ thị với caacutec nuacutet vagrave caacutec liecircn kết

IBIS bắt đầu với lựa chọn của một nuacutet vấn đề gốc sau đoacute caacutec nuacutet vị triacute khaacutec nhau được liecircn kết với nuacutet gốc

Caacutec nuacutet vị triacute nagravey sau đoacute được đaacutenh giaacute dựa trecircn những lập luận gắn liền với chuacuteng

Nemawashi (được sử dụng rộng ratildei tại Nhật Bản)

1-Một hoặc nhiều thagravenh viecircn của MDM được chỉ định lagrave điều phối viecircnCaacutec điều phối viecircn sau đoacute chọn người tham gia cograven lại

2-Điều phối viecircn xacircy dựng một tổng hợp caacutec sự lựa chọn vagrave sau đoacute caacutec chuyecircn gia đaacutenh giaacute caacutec lựa chọn

3-Điều phối viecircn lựa chọn một sự lựa chọn dựa trecircn kết quả ở trecircn(ở 2)

4-Sự thay thế được luacircn chuyển điều phối viecircn tigravem kiếm sự đồng thuận thocircng qua sự thuyết phục vagrave đagravem phaacuten

5-Nếu đạt được sự đồng thuận điều phối viecircn cho lưu thocircng một tagravei liệu magrave mỗi thagravenh viecircn MDM để lại dấu hiệu trecircn đoacute

55Nơi lagravem việc ảo

Nhiều tổ chức trecircn toagraven thế giới kinh doanh bất động sản cho cocircng nghệ hợp taacutec

Cocircng việc được trở thagravenh một điều bạn lagravem hơn lagrave một nơi bạn đi

Những thay đổi lớn nhất mang lại bởi nơi lagravem việc ảo coacute thể lagrave về văn hoaacute hay xatilde hội hơn lagrave về cocircng nghệ

Chương 6 Hệ thống thocircng tin điều hagravenh

61 Yacute nghĩa của EIS- Hệ thống thocircng tin điều hagravenh

- EIS lagrave một dạng đặc biệt của DSS được thiết kế để hỗ trợ ra quyết định ở cấp cao nhất của một tổ chức

- Lagrave một hệ thống thocircng tin hỗ trợ nhu cầu lập kế hoạch vagrave đaacutenh giaacute của caacutec nhagrave quản lyacute điều hagravenh

- EIS coacute thể giuacutep một CEO coacute được bức tranh tổng thể chiacutenh xaacutec nhất về caacutec hoạt động vagrave một bản toacutem tắt những gigrave magrave đối thủ cạnh tranh đang lagravem

- Caacutec hệ thống nagravey noacutei chung hoạt động dễ dagraveng vagrave trigravenh bagravey thocircng tin theo những caacutech dễ hiểu để việc tiếp thu được nhanh choacuteng (biểu đồ đồ thịhellip)

(Tagravei liệu thecircm EIS lagrave những loại hệ thống lagrave rất phức tạp trong tự nhiecircn Coacute thể noacutei hệ thống nagravey cũng cung cấp cho caacutec nhagrave quản lyacute với caacutec thiết bị coacute khả năng ra quyết định bằng caacutech sử dụng của noacute Hệ thống nagravey hoạt động trong điều kiện như vậy quan trọng như trong caacutec hệ thống khaacutec khocircng hỗ trợ Khả năng lưu trữ dữ liệu nặng lagravem cho noacute lyacute tưởng để được thocircng qua khocircng chỉ bởi caacutec doanh nghiệp lớn magrave cograven bởi caacutec doanh nghiệp nhỏ hơn Nhigraven chung hệ thống nagravey lagrave dagravenh cho caacutec nhacircn viecircn cấp cao hỗ trợ thagravenh thạo trong việc đưa ra caacutec quyết định quan trọng)

Caacutec phiecircn EIS tiecircu biểu- Phiecircn lagravem việc coacute thể bắt đầu với một baacuteo caacuteo về tigravenh higravenh tagravei chiacutenh vagrave kinh

doanh của một cocircng ty caacutec chỉ số hoạt động quan trọng được hiển thị rotilde ragraveng- EIS sẽ cho pheacutep caacutec giaacutem đốc điều hagravenh coacute thể đi sacircu vagraveo dữ liệu từ những con

số bất kỳ magrave noacute hỗ trợ- Việc điều hagravenh coacute thể lựa chọn một mức độ chi tiết ( VD danh số baacuten hagraveng) nếu

như cần điều tra thecircm- Lagrave một phương phaacutep tiếp cận coacute thể giuacutep việc ra quyết định tốt hơn

Những điều magrave EIS ko coacute- EIS khocircng phải lagrave sự thay thế cho caacutec hệ thống dựa trecircn caacutec maacutey tiacutenh khaacutec EIS

thực sự chỉ cung cấp dữ liệu cho caacutec hệ thống nagravey- Noacute khocircng thể biến caacutec bộ hệ điều hagravenh của maacutey tiacutenh thagravenh những ldquochuyecircn viecircn

giỏirdquo- Coacute thể được viacute một caacutech cao hơn như lagrave một trợ lyacute đaacuteng tin cậy coacute thể được gọi

đến bất khi nagraveo vagrave mỗi khi cần thiết

Tagravei liệu thecircm Sự khaacutec nhau giữa EIS vagrave DSS+ EIS thiết kế để hỗ trợ những người điều hagravenh cấp cao giuacutep họ khaacutem phaacute caacutec vấn đề vagrave caacutec cơ hội DSS hỗ trợ những nười phacircn tiacutech cố gắng trả lời cacircu hỏi caacutei gigrave coacute thể lagravem cugraveng với một cơ hội hoặc một vấn đề

Chiều EIS DSSNhững người sử dụng thocircng thường

Duyệt dữ liệu đi xuống truy xuất trạng thaacutei

Hỗ trợ phacircn tiacutech vagrave quyết định

Sự thuacutec đẩy Tiacutenh thiacutech hợp Tiacutenh hiệu quảỨng dụng Queacutet mocirci trường đaacutenh giaacute

hiệu suất nhận dạng caacutec vấn đề vagrave caacutec cơ hội

Caacutec quyết định quản lyacute trecircn caacutec lĩnh vực đa dạng

Hỗ trợ quyết định Caacutec chiacutenh saacutech caacutec quyết định khocircng coacute cấu truacutec ở mức cao vagrave hỗ trợ giaacuten tiếp

Hỗ trợ caacutec quyết định lặp lại caacutec quyết định khocircng thể đoaacuten trước ra quyết định khocircng coacute cấu truacutec vagrave baacuten cấu truacutec

Loại thocircng tin Caacutec thocircng tin tin tức thocircng tin becircn ngoagravei về khaacutech hagraveng đối thủ cạnh tranh mocirci trường caacutec baacuteo caacuteo theo yecircu cầu vagrave định thời về caacutec hoạt động becircn trong

Caacutec thocircng tin hỗ trợ caacutec tigravenh huống đặc biệt

Sử dụng coacute nguyecircn tắc

Dograve theo vết vagrave điều khiển nhận dạng cơ hội

Hoạch định tổ chức phacircn nhoacutem vagrave điều khiển

Khả năng phugrave hợp với những người sử dụng caacute nhacircn

Thiết kế loại ra quyết định cho mỗi người điều hagravenh caacute nhacircn bằng nhiều lựa chọn đầu ra

Cho pheacutep caacutec đaacutenh giaacute caacute nhacircn caacutec khả năng what-if lựa chọn loại hộp hội thoại

Đồ họa Phải coacute Lagrave một phần quan trọng của nhiều DSS

Thacircn thiện người sử dụng

Phải coacute Phải coacute nếu khocircng coacute người sử dụng trung gian

Xử lyacute thocircng tin Lọc neacuten thocircng tin dograve theo vết dữ liệu vagrave thocircng tin quan trọng

EIS kiacutech thiacutech caacutec cacircu hỏi caacutec cacircu trả lời bằng caacutech sử dụng DSS vagrave phản hồi lại EIS

Hỗ trợ caacutec thocircng tin chi tiết

Truy xuất thường xuyecircn caacutec mức chi tiết của bất kỳ thocircng tin tổng hợp nagraveo (duyệt dữ

Coacute thể coacute trong DSS nhưng khocircng thường

liệu chi tiết)Cơ sở mocirc higravenh Caacutec chức năng coacute sẵn bị hạn

chếLagrave điểm cốt lotildei của DSS

Cấu truacutec Theo người baacuten sản phẩm hoặc theo caacutec chuyecircn gia hệ thống thocircng tin

Theo người sử dụng hoặc caacute nhacircn hoặc caacutec chuyecircn gia từ caacutec trung tacircm thocircng tin hoặc phograveng ban hệ thống thocircng tin

Phần cứng Mainframe caacutec trạm RISC mạng LANs hoặc caacutec hệ thống phacircn bố

Mainframe caacutec trạm RISC caacutec maacutey PC hoặc caacutec hệ thống phacircn bố

Bản chất caacutec goacutei phần mềm

Truy xuất tương taacutec dễ dagraveng đến nhiều cơ sở dữ liệu truy xuất trực tuyến caacutec khả năng DBMS phức tạp caacutec liecircn kết phức tạp

Caacutec khả năng tiacutenh toaacuten lớn caacutec ngocircn ngữ mocirc higravenh mocirc phỏng ứng dụng vagrave caacutec bộ tạo DSS

Bản chất caacutec thocircng tin

Trigravenh bagravey thocircng tin được phaacutet sinh trước về quaacute khứ vagrave hiện tại tạo caacutec thocircng tin mới về quaacute khứ hiện tại tương lai

Tạo thocircng tin mới về quaacute khứ hiện tại tương lai

62 Lịch sử EIS- EIS xuất hiện lần đầu tiecircn tại MIT vagraveo những năm 1970

- Những EIS đầu tiecircn được phaacutet triển bởi caacutec doanh ngiệp lớn sẵn sagraveng chấp nhận rủi ro để đạt được lợi thế cạnh tranh

- Vagraveo những năm 1980 caacutec nhagrave cung cấp đatilde phaacutet triển một số cơ sở khaacutech hagraveng rộng vagrave cocircng nghệ EIS được tiếp tục phaacutet triển cho đến ngagravey nay

(Tagravei liệu thecircm Sử dụng DSSEIS cho phaacutet triển bền vững + Một số nghiecircn cứu đatilde được tiến hagravenh để kiểm tra việc thực hiện của EIS trong khu vực cocircng cộng vagrave chiacutenh phủ caacutec nước tổ chức kể từ khi chuacuteng được phaacutet triển theo định hướng lợi nhuận cho caacutec cocircng ty tư nhacircn (Hasan vagrave Hasan năm 1997) Theo một nghiecircn cứu tiến hagravenh tại Mỹ ở hơn 300 cocircng ty kết quả cho thấy sự khaacutec biệt của EIS giữa tư nhacircn vagrave chiacutenh phủ một số kết quả thuacute vị được phaacutet hiệnViacute dụ khoacute khăn hơn để chuyển tiền từ một tagravei khoản khaacutec trong một EIS của chiacutenh phủ cũng lagrave khoacute khăn hơn để biện giải thiacutech cho những chi phiacute phaacutet triển EIS của chiacutenh phủ Một nghiecircn cứu khaacutec được tiến hagravenh ở Australia

cho thấy rằng EIS cung cấp cho quản lyacute một higravenh ảnh chiacutenh xaacutec hơn về tổ chức thực hiện vagrave cung cấp hỗ trợ cho caacutec lợi iacutech chiến lược cải thiện khocircng chỉ cho caacutec nhagrave quản lyacute nhưng cograven cho phần cograven lại của tổ chức Dựa trecircn caacutec hệ thống được thiết kế cho caacutec cocircng ty tư nhacircn với một caacutech rotilde ragravengxaacutec định mục tiecircu EIS lagrave thiacutech hợp cho caacutec tổ chức cocircng cộng hiện đại nhưng cần phải được linh hoạt hơn vagrave kết thagravenh chugravem một phạm vi rộng hơn khả năng vagrave phương tiện hơn so với khu vực tư nhacircn ban đầu theo định hướng sản phẩm (Hasan vagrave Hasan năm 1997) Điều nagravey coacute thể lagrave do thực tế rằng caacutec hoạt động khu vực cocircng lagrave bắt buộc coacute taacutec động rộng phải đaacutep ứng sự mong đợi duy nhất cocircng cộng thường coacute mục tiecircu mơ hồ vagrave macircu thuẫn iacutet quyền tự chủ vagrave kiểm soaacutet việc ra quyết định vagrave nhacircn viecircn lagrave khoacute khăn hơn (Watson vagrave Carte2000) + Toacutem lại EIS lagrave một khaacutei niệm thagravenh cocircng noacute phaacutet triển qua nhiều năm tuy nhiecircn EIS khắc phục khiếm khuyết của migravenh bằng caacutech tiến hagravenh nghiecircn cứu liecircn tục)

63 Tại sao những người điều hagravenh hagraveng đầu lại khaacutec nhau- Họ lagrave những doanh nghiệp theo định hướng coacute suy nghĩ

- Coacute một khoảng khocircng gian rộng để kiểm soaacutet

- Họ chịu traacutech nhiệm cho việc thiết lập chiacutenh saacutech

- Họ đại diện cho tổ chức mocirci trường becircn ngoagravei

- Hagravenh động của họ tạo ra những kết quả đaacuteng kể về tagravei chiacutenh vagrave con người

Tần số caacutec hoạt động điều hagravenh- Xử lyacute xaacuteo trộn 42

- Hoạt động kinh doanh 32

- Phacircn bổ nguồn lực 17

- Đagravem phaacuten 3

- Những điều khaacutec 6

Handling Disturbances 42

Entrepreneurial Activites 32

Resource Allocation 17

Negotiation 3

Other 6

Những thocircng tin điều hagravenh cần thiết- Quản lyacute xaacuteo trộn coacute thể yecircu cầu sự chuacute yacute xung quanh đồng hồ

- Hoạt động kinh doanh yecircu cầu điều hagravenh để dự đoaacuten những thay đổi trong mocirci trường

- Nhiệm vụ phacircn bổ tagravei nguyecircn yecircu cầu lựa chọn người quản lyacute vagrave caacutec nguồn lực hạn chế được triển khai

- Đagravem phaacuten yecircu cầu cập nhật thocircng tin từng phuacutet để coacute thể xacircy dựng được sự đồng thuận

Caacutec loại thocircng tin điều hagravenh- Hệ thống kế toaacuten coacute liecircn quan đến việc tiacutenh toaacuten thu nhập hoạt động cho caacutec lĩnh

vực cụ thể lagrave quan trọng hơn so với caacutec hệ thống kế toaacuten truyền thocircng- Thocircng tin về thị trường khaacutech hagraveng cung cấp giaacute trị trong việc quyết định chiến

lược- Caacutec thocircng tin cần thiết thường được truyền đi trecircn một số hệ thống maacutey tiacutenh vagrave

nằm trong toagraven tổ chức- Caacutec thocircng tin được sử dụng thường lagrave ngắn hạn vagrave dễ thay đổi

Phương thức để xaacutec định thocircng tin cần thiết

Rockart xaacutec định được năm phương thức cơ bản để xaacutec định thocircng tin cần thiết

- Phương thức dựa trecircn kết quả- Phương thức rỗng- Phương thức chỉ số khoacutea- Phương thức tổng hợp nghiecircn cứu- Phương thức dựa vagraveo nhacircn tố then chốt dẫn đến thagravenh cocircng

64 Thagravenh phần EIS

- Sản phẩm EIS đầu tiecircn được phaacutet triển để sử dụng trecircn maacutey tiacutenh cấu higravenh cao nhưng caacutec sản phẩm hiện nay nhằm mục tiecircu lagrave nền tảng ClientServer

- Những nền tảng linh hoạt hơn coacute thể thiacutech ứng với thay đổi trong tổ chức vagrave cocircng nghệ

- Sử dụng dữ liệu thời gian thực dẫn đến quyết định nhanh hơn nhiều thocircng tin hơn

Thagravenh phần phần cứng- Một EIS khocircng đogravei hỏi coacute phần cứng cụ thể hoặc duy nhất nagraveo- Chigravea khoacutea của vấn đề lagrave để đảm bảo rằng caacutec thagravenh phần của EIS tối ưu hoacutea vagrave

phugrave hợp với tagravei nguyecircn maacutey tiacutenh của tổ chức- Hệ thống nagravey phải được cấu higravenh để caacutec nguồn tagravei nguyecircn phugrave hợp với những

người điều hagravenh chuacuteng

Thagravenh phần phần mềm- Traacutei ngược với phần cứng phần mềm thường được chuyecircn mocircn hoacutea cao cho caacutec

bagravei toaacuten về miền- Sự chuyecircn mocircn hoacutea nagravey thường đạt được bằng caacutech sử dụng thagravenh phần off-the-

shelf cho toagraven bộ EIS vagrave caacutec mocirc-đun tugravey chỉnh để đaacutep ứng nhu cầu cụ thể- Lotus Notes lagrave một viacute dụ điển higravenh Noacute coacute thể được sử dụng một migravenh hoặc coacute

thể phục vụ becircn thứ ba mocirc-đun plug-in

Cocircng nghệ EIS hiện nay

Dobrzeniecki đề xuấtphacircn loạitừng cấptheo bachức năng- Loại 1 sản phẩm bao gồmmột bộ đầy đủcaacutec ứng dụngtừ mộtnhagrave cung cấp- Loại 2 sản phẩm đượcthựchiệnở phần đầu củacaacutecsản phẩmDSS đượcphaacutet triển

bởicugravengmộtnhagrave cung cấp- Loại 3 sản phẩmkết hợp với nhautheo bất kỳ số lượngthuộc sở hữu củacocircng ty

65 Xacircy dựng EIS

- Xacircy dựngmộtEISgiống nhưxacircydựngmột số hệ thống khaacutec củamocirc higravenh hệ thống thocircng tin

- Việcphaacutet triểncấu truacutecnecircn được theo dotildeitừ quaacute trigravenh thiết kế đến quaacute trigravenhthực hiện

- Tuy nhiecircn một dự aacuten phaacutet triển EIScoacute xu hướnglagrave thống nhấtvagraveyecircu cầu hỗ trợ caacutec nhagrave quản lyacute latildenh đạo

- Xacircy dựng một EIScoacute thểphaacutet hiện ra đượccaacutectigravenh huống khoacute khănmagravemột nhagrave phaacutet triển chưabao giờ gặp phải

Mocirc higravenh EIS

Khung phaacutet triển một EIS

- Watson et al đề nghị xacircy dựngkhung với ba thagravenh phần+ Caacutech tiếp cận tập trung vagraveo yếu tốcon người vagrave dữ liệu coacute liecircn quan đến EIS+ Quaacute trigravenh phaacutet triển cần sự linh hoạt vagrave tương taacutec+ Người sử dụng - hệ thống hộp thoại bao gồm một ngocircn ngữ hagravenh động để xử lyacute caacutec lệnh

Lợi iacutech của EIS- Dễ duy trigrave caacutec mục tiecircu coacute tổ chức- Dễ truy xuất thocircng tin- Cho pheacutep người sử dụng nacircng cao hiệu suất hơn

- Tăng chất lượng ra quyết định- Cung cấp sự cải tiến cạnh tranh- Tiết kiệm thời gian của người sử dụng- Tăng khả năng vagrave chất lượng giao tiếp- Cung cấp khả năng điều khiển tốt hơn trong tổ chức- Cho pheacutep tham gia caacutec vấn đề vagrave caacutec cơ hội- Cho pheacutep hoạch định- Cho pheacutep tigravem kiếm nguyecircn nhacircn của một vấn đề- Thảo matilden caacutec yecircu cầu của người điều hagravenh

Hạn chế của EIS vagrave 1 số sai lầm cần traacutenh

- Chi phiacute một cuộc khảo saacutetnăm1991 chothấychi phiacute phaacutet triểntrungbigravenh365000USDvớichi phiacute vận hagravenhhagraveng năm lagrave$200000 (EIS)

- Cocircng nghệ hạn chếEIScần phảiđượctiacutech hợp hoagraven toagravenvagraveokiếntruacuteccủadoanh nghiệphiện tại do đoacute noacutelagrave một thaacutech thứclớn đối vớithiết kế

- Hạn chế tổ chức cơ cấu tổ chứccoacute thể khocircng phugrave hợp

Sự hạn chế về tổ chức- Chương trigravenh nghị sự vagrave thời gian chệch EIS mocirc tả một phần việc thực hiện một

chương trigravenh nghị sự vagrave coacute thể dễ dagraveng đạt được sự tin cậy một caacutech chắc chắn- Đồng bộ hoacutea việc quản lyacute sự tin cậy đuacuteng luacutec đặc biệt baacuteo caacuteo EIS coacute thể phaacute

vỡ sự ổn định thiết lập caacutec chu trigravenh baacuteo caacuteo một caacutech tốt nhất- Sự bất ổn EIS phản ứng nhanh coacute thể gacircy ra việc taacutec động trở lại một caacutech

nhanh choacuteng dẫn đến sự thiếu ổn định trong tổ chức

Sự thất bại lagrave thay thế khocircng thể chấp nhận được- Một số yếu tố lagravem EIS thất bại

+ Thiếu sự hỗ trợ về mặt quản lyacute+ Vấn đề chiacutenh trị+ Thất bại của nhagrave phaacutet triển+ Lỗi về cocircng nghệ+ Giaacute cả+ Thời gian

66 Ra quyết định điều hagravenh trong tương lai vagrave EIS

- Coacute một vagravei điều kiện sẽ được hợp nhất cho việc chuyển đổi cocircng nghệ Trong đoacute một vagravei điều kiện coacute thể dễ dự đoaacuten Hai điều kiện magrave ta coacute thể thấy lagrave+ Phaacutet triển cocircng nghệ maacutey tiacutenh trong việc điều hagravenh sẽ tạo ra sự chuyển đổi được chấp nhận một caacutech dễ dagraveng hơn+ Mở rộng traacutech nhiệm điều hagravenh sẽ mở rộng nhu cầu thocircng tin

Tương lai của EIS- EIS thocircng minh Những tiến bộ trong cocircng nghệ AI sẽ được triển khai trong caacutec

EIS- EIS đa phương tiện Cơ sở dữ liệu đa phương tiện sẽ cho pheacutep tiacutech hợp văn bản

giọng noacutei vagrave higravenh ảnh trong tương lai- EIS thocircng tin Tương lai EIS sẽ mở rộng hơn trong việc sử dụng dữ liệu becircn

ngoagravei doanh nghiệp- EIS kết nối Giao tiếp với băng thocircng rộng cho pheacutep kết nối liecircn thocircng lớn hơn

Chương 7 HỆ CHUYEcircN GIA VAgrave TRIacute TUỆ NHAcircN TẠO

71 Caacutec khaacutei niệm

72 Triacute thocircng minh của triacute tuệ nhacircn tạo

73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia

74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia

75 Lợi iacutech vagrave hạn chế của hệ chuyecircn gia

71 Caacutec khaacutei niệm

Chuyecircn mocircn (Expertise) sự hiểu biết rộng trong 1 lĩnh vực hẹp

Hệ chuyecircn gia (Expert Systems)1 chương trigravenh maacutey tiacutenh sử dụng 1 tập caacutec luật dựa trecircn tri thức của con người để giải quyết caacutec vấn đề đogravei hogravei phải coacute sự chuyecircn mocircn

Một số hệ chuyecircn gia nổi tiếng

DENDRAL (Standford 1960s Edward Feigenbaum)

MYCIN (Standford1970s Edward Shortliffe)

PROSPECTOR (MIT 1979)

Triacute tuệ nhacircn tạo (Artificial Intelligence ndash AI)

Triacute tuệ nhacircn tạo một bộ phacircn của ngagravenh khoa học maacutey tiacutenh quan tacircm đến việc thiết kế caacutec hệ thống maacutey tiacutenh thocircng minh đoacute lagrave caacutec hệ thống đưa ra caacutec đặc điểm magrave từ đoacute chuacuteng ta liecircn hệ với sự thocircng minh trong hagravenh động của con người (Barr vagrave Feigenbaum 1981)

Mục điacutech của AI

Mục điacutech khoa học xaacutec định caacutec gợi yacute để giải thiacutech caacutec loại khaacutec nhau của triacute tuệ thực

Mục điacutech kỹ thuật giải quyết caacutec vấn đề trong thế giới thực

Triacute tuệ nhacircn tạo kế thừa nhiều yacute tưởng quan điểm kỹ thuật từ caacutec ngagravenh khoa học khaacutec

- Triết học

- Logic Toaacuten học

- Tiacutenh toaacuten

- Khoa học tacircm lyacute Khoa học nhận thức

- Sinh học Thần kinh học

- Tiến hoacutea

Caacutec lĩnh vực ứng dụng trong Triacute tuệ nhacircn tạo

Mạng nơ ron thần kinh (Neural Networks)

Tiacutenh toaacuten sự tiến hoacutea

(Evolutionary Computation)

Hệ chuyecircn gia (Expert Systems)

Kỹ thuật xử lyacute tiếng noacutei (Speech Processing)

Kỹ thuật xử lyacute ngocircn ngữ tự nhiecircn

(Natural Language Processing)

Lập kế hoạch (Planning)

Robot (Robotics)

Khoa học higravenh ảnh (Vision)

Caacutec kỹ thuật thocircng dụng dugraveng trong AI

Biểu diễn(Representation)

Học (Learning)

Caacutec luật (Rules)

Tigravem kiếm (Search)

72 Triacute thocircng minh của triacute tuệ nhacircn tạo

Con người suy diễn như thế nagraveo

Phacircn loại (Categorization)

Caacutec quy tắc cụ thể

Heuristics

Kinh nghiệm trước đoacute

Dự tiacutenh trước

Maacutey tiacutenh suy diễn như thế nagraveo

Lập luận dựa trecircn luật IF-THEN mocirc tả tri thức được matilde hoacutea dưới dạng caacutec luật

Caacutec khung (Frames) lagrave caacutec đại diện mocirc tả caacutec tigravenh huống giống nhau lagrave điển higravenh của một vagravei phacircn loại

Lập luận dựa trecircn caacutec trường hợp mocirc phỏng giải phaacutep trước đoacute cho một vấn đề hiện tại

Nhận dạng mẫu phaacutet hiện acircm thanh higravenh dạng hoặc caacutec chuỗi dagravei

Caacutec dạng khaacutec của Triacute tuệ nhacircn tạo

Học maacutey- mạng nơron vagrave giải thuật di truyền

Lập trigravenh tự động ndash lagrave những kỹ thuật tạo ra caacutec chương trigravenh để lagravem 1 nhiệm vụ riecircng biệt (cho pheacutep những người khocircng phải lagrave người lập trigravenh coacute thể lập trigravenh được)

Cuộc sống nhacircn tạo ndash nỗ lực để taacutei tạo caacutec hiện tượng sinh học trong caacutec hệ thống dựa trecircn maacutey tiacutenh

73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia(Expert Systems- ES)

Theo Jackson (1999) Một hệ chuyecircn gia lagrave một chương trigravenh maacutey tiacutenh mocirc tả vagrave suy diễn với tri thức của một vagravei lĩnh vực để giải quyết vấn đề hay đưa ra caacutec lời khuyecircn

Cấu truacutec cơ bản của ES được dựa theo cấu truacutec chung của DSS Sự khaacutec biệt chiacutenh giữa ES vagraveDSS lagrave hệ ES thu thập caacutec kiến thức từ những

chuyecircn gia trong lĩnh vực quan tacircmĐặc trưng của hệ chuyecircn gia Hiệu quả cao Thời gian trả lời thỏa đaacuteng Độ tin cậy cao Dễ hiểu

Giao diện người dugraveng trong ES

Thiết kế giao diện người dugraveng tập trung vagraveo caacutec yếu tố như dễ dagraveng sử dụngcoacute độ tin cậy cao giảm tải những khoacute khăn khi sử dụng

Thiết kế necircn coacute một số tương taacutec (đầu vagraveo kiểm soaacutet vagrave truy vấn)

Cấu tạo giao diện người dugraveng gồm coacute magraven higravenh cảm ứng bagraven phiacutem buacutet saacuteng lệnh thoại caacutec phiacutem chuyecircn dụng

Cơ sở tri thức (Knowledge Base)

Chứa đựng caacutec tri thức cụ thể miền thu được từ caacutec chuyecircn gia miền

Coacute thể chứa caacutec mocirc tả caacutec hagravenh vi giải quyết vấn đề caacutec ragraveng buộc caacutec heuristics

Thagravenh cocircng của một ES dựa trecircn tiacutenh đầy đủ vagrave tiacutenh chiacutenh xaacutec của cơ sở tri thức

Mocirc tơ suy diễn (Inference Engine)

Ở đacircy tri thức được đặt để sử dụng tạo ra caacutec giải phaacutep để giải quyết vấn đề

Mocirc tơ nagravey coacute khả năng thực hiện diễn dịch hoặc suy diễn dựa trecircn caacutec luật hay caacutec caacutec sự kiện

Đồng thời cũng coacute khả năng sử dụng caacutec suy diễn mờ hay khocircng chiacutenh xaacutec dựa trecircn xaacutec suất hay aacutenh xạ mẫu

Vograveng điều khiển suy diễn

1 Aacutenh xạ caacutec luật với caacutec sự kiện đatilde được cho

2 Chọn luật để thực hiện

3 Thực hiện luật bằng caacutech thecircm caacutec sự kiện được suy diễn ra vagraveo bộ nhớ lagravem việc

Chuỗi suy diễn (Chaining)

Suy diễn tiến (forward chaining) maacutey suy diễn bắt đầu từ dữ liệu ban đầu vagrave thực hiện việc suy luận để đưa ra caacutec kết luận cuối cugraveng

Suy diễn lugravei (backward chaining) maacutey suy diễn bắt đầu từ dữ liệu điacutech vagrave tigravem ra tri thức hỗ trợ cho dữ liệu điacutech đoacute

Viacute dụ suy diễn lugravei

R1 Nếu coacute A vagrave B thigrave suy ra coacute D

R2 Nếu coacute B thigrave suy ra coacute C

R3 Nếu coacute C vagrave D thigrave suy ra coacute E

Ta coacute E ta xem trong 3 luật R1 R2 R3 luật nagraveo coacute E ta thấy R3 chứa E đồng thời chứa C vagrave D Xeacutet tiếp trong 2 luật R1 R2 luật nagraveo chứa C vagrave D R2 chứa C R3 chứa D Từ đoacute ta coacute được caacutec tri thức hỗ trợ suy diễn vagrave kết luận lagrave nếu coacute A vagrave B thigrave sẽ coacute E Hay nếu A vagrave B đuacuteng thigrave sẽ coacute E

Viacute dụ suy diễn tiến

Giả sử coacute tập chứa 3 luật sau

R1 Nếu coacute A vagrave B thigrave suy ra coacute D

R2 Nếu coacute B thigrave suy ra coacute C

R3 Nếu coacute C vagrave D thigrave suy ra coacute E

Nếu ta coacute A vagrave B thigrave chuacuteng ta suy ra được D từ R1 vagrave suy ra C từ R2 Với D vagrave C đatilde được suy ra ở trecircn giờ chuacuteng ta suy ra được E từ R3

Viacute dụ thực tế

Giả sử muốn biết magraveu của một con vật nuocirci tecircn lagrave Fred biết rằng noacute kecircu ộp ộp vagrave ăn ruồi

Coacute tập 4 luật ban đầu như sau

R1 Nếu X kecircu ộp ộp vagrave ăn ruồi thigrave X lagrave con ếch

R2 Nếu X kecircu chiecircm chiếp vagrave biết hoacutet thigrave X lagrave con chim

R3 Nếu X lagrave con ếch thigrave X coacute magraveu xanh

R4 Nếu X lagrave con chim thigrave X coacute magraveu vagraveng

74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia

Expert system shells lagrave một tập caacutec goacutei phần mềm vagrave caacutec cocircng cụ dugraveng để phaacutet triển caacutec hệ chuyecircn gia

Những Expert system shells đầu tiecircn thường rất rườm ragrave Mặc dugrave vậy noacute vẫn giuacutep cho người sử dụng sẽ khocircng phải bắt đầu lại từ đầu khi xacircy dựng một hệ chuyecircn gia mới

Những shell hiện đại bao gồm hai mocirc-đun chiacutenh lagrave cocircng cụ xacircy dựng một tập quy tắc vagrave mocirc tơ suy diễn

Xacircy dựng hệ chuyecircn gia

Bước 1 xacircy dựng mocirc higravenh bagravei toaacuten xaacutec định vấn đề nhiệm vụ magrave hệ thống sẽ thực hiện Caacutec dạng bagravei toaacuten cần hệ chuyecircn gia

Bagravei toaacuten diễn giải (InterPretation)

Bagravei toaacuten dự baacuteo (Prediction)

Bagravei toaacuten chuẩn đoaacuten (Diagnose)

Bagravei toaacuten gỡ rối (Debugging)

Bagravei toaacuten thiết kế

Tương tự như một dự aacuten phần mềm để xacircy dựng một hệ chuyecircn gia cần phải coacute caacutec yếu tố về nhacircn lực tagravei nguyecircn vagrave thời gian Những yếu tố nagravey ảnh hưởng đến giaacute thah của một hệ chuyecircn giaTrong phần nagravey cacircu hỏi thường được đặt ra lagrave tại sao cần phải xacircy dựng một hệ chuyecircn giaTrước khi bắt đầu phải xaacute định rotilde bagravei toaacuten đạt ra lagrave jiAi lagrave chuyecircn giaAi lagrave người sử dụng

1 Diễn giải (InterPretation) Nghiecircn cứu 1 vấn đề -gt Dựa trecircn những biểu hiện thuộc tiacutenh đặc trưng becircn ngoagravei -gt Tư vấn

(hoặc đưa ra kết luận hay mocirc tả dễ hiểu từ tập dữ liệu thocirc)

2 Bagravei toaacuten dự baacuteo (Prediction) Coacute thể dự đoaacuten được hagravenh vi kết quả dựa trecircn caacutec hiện tượng -gt dự baacuteo

VD Dự baacuteo thời tiết động đấthellip

3 Bagravei toaacuten chẩn đoaacuten (Diagnoss) Xaacutec định caacutec lỗi caacutec bộ phận hỏng hoacutec của hệ thống dựa trecircn caacutec dữ liệu quan saacutet được

4 Bagravei toaacuten gỡ rối (Debugging) Mocirc tả caacutec phương phaacutep khắc phục hệ thống khi gặp sự cố

5 Bagravei toaacuten thiết kế Lựa chọn cấu higravenh caacutec đối tượng nhằm thoả matilden một số ragraveng buộc nagraveo đoacute

6 Giảng dạy Phần mềm dạy học coacute thể chuẩn đoaacuten vagrave sủa lỗi của học sinh trong quaacute trigravenh học tập

Để xaacutec định đuacuteng bagravei toaacuten magrave chuacuteng ta cần giải quyết thigrave phải trả lời đc một số cacircu hỏi

- cần hệ chuyecircn gia

Bước 2 thu thập tri thức lựa chọn cocircng cụ vagrave aacutep dụng

Trong bước thu thập tri thức vấn đề quan trọng lagrave lựa chọn chuyecircn gia những người magrave sẽ đoacuteng goacutep tri thức cho hệ thống Thocircng thường trong suốt quaacute trigravenh phaacutet triển thigrave chuyecircn gia được xem như một thagravenh viecircn của đội phaacutet triển

Hiện nay coacute rất nhiều cocircng cụ để xacircy dựng một hệ chuyecircn gia Phổ biến nhất lagrave JESS CLIPS vagrave OPS5

Bước 3 Thiết kế cơ sở tri thức thiết kế hệ thốngTri thức được biểu diễn trường minh trong cơ sở tri thức

Caacutec chuyecircn gia vagrave kỹ sư tri thức sẽ đối thoại với nhau bằng caacutec kỹ thuật đối thoại Suy diễn (SD) bảng Mocirc higravenh hoacutea SD quy nạp phacircn loại

Vấn đề bagraveo trigrave vagrave phaacutet triển

Caacutec hệ chuyecircn gia đogravei hỏi phải bảo trigrave vagrave phaacutet triển nhiều hơn so với caacutec hệ thống khaacutec Phải thường xuyecircn bổ sung tri thức mới vagrave thay đổi caacutec tri thức cũ để đổi mới hệ chuyecircn gia

Thu thập vagrave khắc phục lỗi do người sử dụng phaacutet hiện để kịp thời khắc phục những sai soacutet của hệ chuyecircn gia

75 Lợi iacutech vagrave hạn chế của caacutec hệ chuyecircn gia

Một số lợi iacutech chiacutenh

Thời gian trả lời hợp lyacute bằng hoặc nhanh hơn so với chuyecircn gia (người) để đi đến cugraveng một quyết định Hệ chuyecircn gia lagrave một hệ thống thời gian thực (real time system)

Khả năng trả lời với mức độ tinh thocircng bằng hoặc cao hơn so với chuyecircn gia (người) trong cugraveng lĩnh vực

Hệ chuyecircn gia giuacutep cho hiệu quả lagravem việc tăng bằng việc sử dụng tập caacutec luật một caacutech nhanh choacuteng magrave ko bị nhầm lẫn chuyecircn gia lagrave người coacute thể quecircn đi một số tri thức cơ sở lyacute luậ nhưng HCG thigrave ko

Quyết định của một người chuyecircn gia coacute thể bị thay đổi vagrave ko coacute tiacutenh thống nhất như quyết định của một hệ chuyecircn gia tạo ra

Hệ chuyecircn gia giuacutep cho người sử dụng coacute thể trau dồi sự hiểu biết trecircn lĩnh vuej cụ thể magrave noacute giải quyết hỗ trợ người ra quyết định coacute trigravenh độ như 1 chuyecircn gia trong quaacute trigravenh gia quyết định

Kiến thức của rất nhiều chuyecircn gia về một lĩnh vực nagraveo đoacute được đưa vagraveo hệ chuyecircn gia lagravem cho CSTT cuat HCG phong phuacute vagrave rộng lớn hơn rất nhiều

HCG giải thiacutech caacutec bước suy luận một caacutech dễ hiểu nhất quaacuten luacutec nagraveo cũng coacute thể sử dụng ko như chuyecircn gia con người

Hạn chế của caacutec hệ chuyecircn gia

Nhược điểm lớn nhất của hệ chuyecircn gia lagrave những yacute kiến chuyecircn mocircn thường rất khoacute matilde hoacutea vagrave giải neacuten

Hệ chuyecircn gia khocircng coacute khả năng tự học tự cập nhật kiến thức mới như caacutec chuyecircn gia magrave cần phải được matilde hoacutea lại khi noacute được cập nhật

Hệ chuyecircn gia khocircng thể nhận ra được vấn đề khocircng nằm trong miền kiến thức của hệ thống

Chương 8 Tri thức vagrave tiếp nhận

1 Bao gồm caacutec vấn đề

Dữ liệu thực tế đo lường hoặc quan saacutet coacute hoặc khocircng coacute bối cảnh

Thocircng tin dữ liệu được tổng hợp một caacutech hữu iacutech để giải quyết những khoacute khăn trong việc đưa ra quyết định

Tri thức bao gồm caacutec ứng dụng quy tắc thocircng tin hướng dẫn của người ra quyết định

2 Những caacutei nhigraven về tri thức

Đại diện lagravem thế nagraveo để diễn tả tri thức viacute dụ như một quyển saacutech khocircng phải lagrave tri thức nhưng noacute lại lagrave một đại diện của tri thức

Sản xuất tri thức lagrave một tập hơp của hagraveng tồn kho coacute thể được sản xuất cũng như mua lại

Tri thức lagrave 1 trong 6 trạng thaacutei của hệ thống

1Dữ liệu 2Thocircng tin 3Cấu truacutec thocircng tin 4Sự thấu hiểu 5Yacute kiến 6 Quyết định

3 Caacutec loại tri thức Phổ biến mocirc tả dữ liệu thocircng tin thủ tục mọi thứ lagravem như thế nagraveo lập luận chiacutenh saacutech hoặc caacutec quy tắc

4 Thu thập Tri thức hệ chuyecircn gia Hầu hết caacutec phương phaacutep đều bắt đầu với mocirc higravenh của caacutec taacutec vụ trong đoacute

hệ chuyecircn gia được xacircy dựng Trong đoacute mocirc tả về caacutec lĩnh vực được tạo ra Caacutec kỹ sư sử dụng caacutec mocirc higravenh giả thuyết vagrave nhận thức về quaacute trigravenh phacircn

tiacutech để gợi ra caacutech giải quyết vấn đề về tri thức từ caacutec chuyecircn gia

5 Caacutec chiều của thu thập tri thức KE- driven caacutec kỹ sư trao đổi trực tiếp với caacutec chuyecircn gia Expert-driven Caacutec chuyecircn gia trực tiếp đưa chuyecircn mocircn của họ vagraveo hệ

thống maacutey tiacutenh Machine-driven Sử dụng caacutec cocircng cụ suy luận để triacutech xuất tri thức từ một

tập caacutec viacute dụ

6 Kỹ thuật thu thập tri thức Trao đổi gồm 2 loại cơ bản lagrave coacute cấu truacutec(coacute kịch bản) vagrave khocircng coacute cấu

truacutec( đối thoại trực tiếp) Giao thức phacircn tiacutech bằng lời Khi caacutec chuyecircn gia thực hiện một cocircng việc

của họ thigrave một bản ghi về cocircng việc đoacute được thực hiện Caacutec kỹ sư sẽ xacircy dựng mocirc higravenh cho những gigrave được ghi lại trong bản ghi

Phương phaacutep sagraveng lọc caacutec chuyecircn gia so saacutenh caacutec nhoacutem liecircn tiếp trong ba đối tượng vagrave cho biết tại sao nhoacutem thứ hai lại khaacutec nhoacutem thứ ba

7 Thu thập tri thức từ nhiều nguồn Thu thập tri thức từ nhiều nguồn lagrave cần thiết để coacute được đầy đủ caacutec tri thức

cho một vấn đề quan điểm yacute kiến traacutei ngược nhau thường phaacutet sinh Phương phaacutep đồng thuận sẽ giuacutep giải quyết được vấn đề macircu thuẫn Kỹ thuật phacircn tiacutech Meta lagrave kỹ thuật được aacutep dụng trong caacutec trường hợp

khaacutec Caacutech tiếp cận bằng định lượng đogravei hỏi caacutec kỹ sư cần cacircn nhắc yếu tố đầu vagraveo của caacutec chuyecircn gia khaacutec nhau

8 Xaacutec nhận hợp lệ vagrave kiểm tra tri thức Một khi thu thập tri thức noacute phải được đaacutenh giaacute về khả năng sử dụng vagrave độ

chiacutenh xaacutec Hai vấn đề cụ thể lagrave hiệu lực của những kiến thức vagrave kiểm tra việc xacircy dựng cơ sở của tri thức

Cần xaacutec nhận xem liệu hệ thống coacute thể hoạt động ở mức độ tối thiểu khocircng

Xaacutec minh liecircn quan đến việc so saacutenh từng chi tiết kỹ thuật của hệ thống những gigrave đatilde được thực hiện cuối cugraveng

9 Một số caacutec biện phaacutep xaacutec nhận Độ chiacutenh xaacutec Khả năng thiacutech nghi Mức độ đầy đủ Bề rộng Độ sacircu Hiệu lực Tổng quan Chiacutenh xaacutec Hiện thực Độ tin cậy Tiacutenh hữu dụng Mức độ

Chương 9 Học maacutey

1 Logic mờ vagrave ngocircn ngữ mờ(Fuzzy Logic and Linguistic Ambiguity)

Ngocircn ngữ tự nhiecircn gồm những khaacutei niệm mơ hồ vagrave khocircng chiacutenh xaacutectruyền tải ngữ nghĩa thocircng qua tiacutenh xấp xỉkhocircng rotilde ragraveng

Những xấp xỉ nagravey giuacutep con người coacute thể truyền tải hết được yacute nghĩa nhưng maacutey thigrave khocircng hiểu

Lagravem sao biểu diễn caacutec tri thức sử dụng caacutec khaacutei niệm khocircng rotilde ragraveng(mờ) hoặc khocircng chiacutenh xaacutec

2 Khaacutei niệm cơ bản của logic mờ tập mờ lagrave những tập hợp khocircng coacute một giới hạn rotilde Mỗi phần tử của noacute chỉ

chứa một mức độ hagravem liecircn thuộc của từng phần tử Vigrave vậy tập mờ khocircng giống như tập cổ điển Tập mờ coacute thể kết hợp với nhau qua những luật mờ magrave đặc trưng cho những hagravenh động trạng thaacutei vagrave thuộc tiacutenh của logic mờ được tận dụng khi thực hiện một bộ điều khiển mờ

Logic mờ dựa trecircn yacute tưởng mỗi phần tử thuộc vagraveo một tập hợp ở một mức độ nagraveo đấy

Locircgic mờ cho pheacutep độ liecircn thuộc (microA )coacute giaacute trị trong khoảng (01) Locircgic mờ coacute thể được coi lagrave mặt ứng dụng của lyacute thuyết tập mờ để xử lyacute caacutec

giaacute trị trong thế giới thực cho caacutec bagravei toaacuten phức tạp

3 So saacutenh tiacutenh đuacuteng đắn logic mờ vagrave xaacutec suất Xaacutec suất thigrave đề cập đến khả năng xảy ra một biến cố hay một điều gigrave đoacute Logic mờ đề cập đến cấp độ magrave đặc tiacutenh ở hiện tại

o viacute dụ1 người coacute chiều cao 6 feet thigrave coacute cấp độ lagrave 05 về chiều cao

4 Ưu điểm của logic mờ Caacutech tiếp cận rất tự nhiecircnkhocircng phức tạp Coacute thể mocirc higravenh hoacutea caacutec hagravem phi tuyến tugravey yacute phức tạp

Coacute thể tận dụng được kinh nghiệm từ những chuyecircn gia hagraveng đầu trong mọi lĩnh vực

Logic mờ được xacircy dựng dựa trecircn ngocircn ngữ tự nhiecircnNền tảng của logic mờ lagrave dựa trecircn cơ sở giao tiếp của con người

5 Nhược điểm của logic mờ Trong 1 hệ thống phức tạpsử dụng logic mờ coacute thể trở thagravenh trở ngại cho

việc xaacutec thực độ tin cậy của hệ thống Cơ chế lập luận mờ khocircng thể học hỏi từ những lỗi sai

6 Mạng noron nhacircn tạo(ANN) Mạng noron nhacircn tạo lagrave một mocirc phỏng xử lyacute thocircng tinđược nghiecircn cứu ra

từ hệ thống thần kinh của sinh vậtgiống như bộ natildeo để xử lyacute thocircng tin ANNs lagrave chương trigravenh dựa trecircn maacutey tiacutenh đơn giản coacute chức năng lagrave một mocirc

higravenh bagravei toaacuten khocircng gian dựa trecircn thử nghiệm vagrave baacuteo lỗi

7 Học từ kinh nghiệm Tiến trigravenh Một mẫu dữ liệu được biểu diễn như một mạng lưới noronANN ldquodự

đoaacutenrdquo 1 đầu radự đoaacuten được so saacutenh với giaacute trị thực tế hoặc giaacute trị chiacutenh xaacutecNếu đoaacuten được chiacutenh xaacutec thigrave khocircng coacute hagravenh động nagraveo được thực hiện

Nếu dự đoaacuten sai ANN kiểm tra lại vagrave xaacutec định lại thocircng số để điều chỉnh Một mẫu dữ liệu khaacutec được biểu diễn vagrave quaacute trigravenh nagravey được lặp lại

8 Nguyecircn tắc cơ bản của cocircng nghệ nơron Caacutec yếu tố xử lyacute cơ bản trong hệ thống thần kinh của con người lagrave tế bagraveo

thần kinhMạng lưới của tế bagraveo nagravey lagrave liecircn kết với nhau nhận được thocircng tin từ caacutec cảm biến trong mắt taihellip

Thocircng tin nhận được bởi tế bagraveo thần kinh hoặc lagrave sẽ kiacutech thiacutech noacute(sẽ được chuyển qua 1 thocircng điệp dọc theo mạng lưới) hoặc lagrave sẽ ngăn cản noacute(ngăn cản dograveng thocircng tin)

Độ nhạy coacute thể thay đổi qua thời gian hoặc sau khi coacute được kinh nghiệm

9 Cấu truacutec mạng Một ANN gồm 3 lớp cơ bản

Lớp đầu vagraveo nhận dữ liệu Lớp becircn trong hoặc lagrave lớp ẩn xử lyacute dữ liệu Lớp đầu ra chuyển tiếp kết quả cuối cugraveng của mạng

10Mạng nơ ron Thường coacute nhiều đầu vagraveo mỗi đầu vagraveo với mức ảnh hưởng vagrave tầm quan

trọng riecircng của noacute Một đầu vagraveo quan trọng coacute thể được sử dụng để khuếch đại đầu ra caacutec hagravem trạng thaacutei tổng hợp caacutec trọng số của caacutec yếu tố

đầuvagraveo khaacutec nhauvagraveo một giaacute trị duy nhất Caacutec hagravem chuyển giao xử lyacute caacutec giaacute trị trạng thaacutei vagrave tạo đầu ra

11Huấn luyện mạng nơ ron Trong mocirc higravenh coacute giaacutem saacutetANN được đến so saacutenh dự đoaacuten của chiacutenh

noacute với thocircng tin phản hồi coacute chứa caacutec kết quả mong muốn ANN sẽ phải tigravem caacutech thay đổi caacutec tham số becircn trong củamigravenh (caacutec trọng số vagrave caacutec ngưỡng) để tạo necircn một aacutenh xạ coacute khả năng aacutenh xạcaacutec đầu vagraveo thagravenh caacutec đầu ra mong muốn Sự thay đổi nagravey được tiến hagravenh nhờ việc so saacutenh giữa đầu ra thực sự vagrave đầu ra mong muốn

Trong mocirc higravenh khocircng coacute giaacutem saacutetANN nhận được dữ liệu vagraveo nhưng khocircng phải coacute bất kỳ thocircng tin phản hồi về kết quả mong muốn

Phần lớn caacutec ứng dụng nằm trong vugraveng của caacutec bagravei toaacuten ước lượng như mocirc higravenh hoacuteathống kecirc neacuten lọc phacircn cụm

12Lợi iacutech Liecircn kết với mạng noron Traacutenh caacutech lập trigravenh tường minh Giảm nhu cầu của chuyecircn gia ANNs thigrave thiacutech nghi với caacutec yếu tố đầu vagraveo thay đổi Khocircng cần thiết cho cơ sở tri thức tinh chế ANNs coacute tiacutenh động vagrave cải thiện với việc sử dụng Coacute khả năng xử lyacute dữ liệu khocircng chiacutenh xaacutec hoặc khocircng đầy đủ Cho pheacutep tổng quaacutet hoacutea từ thocircng tin cụ thể Cho pheacutep thu thập cảm giaacutec thocircng thường vagraveo miền giải quyết vấn đề

13Hạn chế của việc liecircn kết với mạng noron ANNs khocircng thể giải thiacutech được suy luận Bản chất hộp đen thường khiến cho vấn đề traacutech nhiệm vagrave độ tin cậy phaacutet

sinh lagrave khoacute khăn Lặp đi lặp lại quaacute trigravenh huấn luyện rất tốn thời gian Nguồn lực caacutec nhagrave phacircn tiacutech vagrave thiết kế coacute tay nghề cao vẫn lagrave đaacuteng lo

ngại Cocircng nghệ ANN thuacutec đẩy hạn chế của phần cứng hiện tại ANN yecircu cầu phải coacute sự tin tưởng ở đầu ra

14Giới thiệu về thuật toaacuten di truyền Cũng như mạng lưới thần kinh caacutec thuật toaacuten di truyền được dựa trecircn lyacute

thuyết sinh học Thuật toaacuten di truyền tigravem thấy nguồn gốc của chuacuteng trong caacutec lyacute thuyết

tiến hoacutea của chọn lọc tự nhiecircn vagrave thiacutech ứng với biến đổi khiacute hậu Kết quả thuật toaacuten di truyền lagrave từ giao phối 2 caacute thể trong quần thế để tạo

ra con caacutei đocirci khi tốt hơn so với bậc cha mẹ của chuacuteng 15Caacutec thagravenh phần cơ bản của thuật toaacuten di truyền

Toaacuten tử chọn lọc Caacutec caacute thể tốt được chọn lọc để đưa vagraveo thế hệ sau Sự chọn lọc nagravey căn cứ vagraveo độ thiacutech nghi với mocirci trường của mỗi caacute thể

Toaacuten tử lai gheacutep (crossover) Hai caacute thể cha vagrave mẹ trao đổi caacutec gen với nhau để tạo ra caacute thể con

Toaacuten tử đột biến (mutation) Một caacute thể thay đổi một số gen để biến đổi thagravenh một caacute thể mớiTất cả caacutec toaacuten tử trecircn khi thực hiện đều mang tiacutenh ngẫu nhiecircn

16Quaacute trigravenh cơ bản của một thuật toaacuten di truyền Khởi tạo

Đaacutenh giaacute quần thể

Lựa chọn NST thiacutech hợp nhất vagrave loại bỏ NST yếu nhất

Quy trigravenh giao nhau vagrave cải thiện quần thể

đột biến tiến trigravenh để khaacutem phaacute ra NST mới

17Ưu nhược điểm của việc kết hợp với thuật toaacuten di truyền Kiacutech thước quần thể lagrave 1 yếu tố quan trọng trong tốc độ của việc tigravem

kiếmnhưng noacute tương đối dễ dagraveng để dự đoaacuten tốc độ nagravey Giao nhau hoặc đột biến lagrave khocircng necircn đc sử dụng quaacute thường xuyecircn Luocircn coacute được iacutet nhất 1 giải phaacutep hợp lyacute Necircn coacute thể aacutep dụng chuacuteng cho caacutec vấn đề magrave chuacuteng ta khocircng coacute hướng

về caacutech giải quyết Sức mạnh của thuật toaacuten xuất phaacutet từ khaacutei niệm đơn giảnkhocircng phải từ

một thủ tục thuật toaacuten phức tạp 18Tương lai của học maacutey

Mạng lưới thần kinh nhacircn tạo vượt quaacute năng lực của con người trong caacutec trường hợp bị cocirc lập

Về mặt lyacute thuyếtmột maacutey tiacutenh coacute thể xử lyacute dũ liệu nhanh hơn hagraveng triệu lần so với 1 con người

May mắn thay cho chuacuteng tacon người tốt hơn nhiều khi magrave coacute được dữ liệumaacutey tiacutenh khocircng coacute 1 số thứ như lagrave 5 giaacutec quan

CHƯƠNG 10 KHO DỮ LIỆU

1 Kho dữ liệu Kho dữ liệu lagrave tuyển tập caacutec cơ sở dữ liệu tiacutech hợp hướng chủ đề được

thiết kế để trợ giuacutep cho một hệ hỗ trợ quyết định

Theo John Ladley Cocircng nghệ kho dữ liệu lagrave tập caacutec phương phaacutep kỹ thuật vagrave caacutec cocircng cụ coacute thể kết hợp hỗ trợ nhau để cung cấp thocircng tin cho người sử dụng trecircn cơ sở tiacutech hợp từ nhiều nguồn dữ liệu nhiều mocirci trường khaacutec nhau

Kho dữ liệu thường rất lớn tới hagraveng trăm GB hay thậm chiacute hagraveng Terabyte

2 Kho dữ liệu vận hagravenh (ODS) Một kho dữ liệu vận hagravenh Aacutep dụng kỹ thuật kho dữ liệu vagraveo caacutec hệ xử

lyacute giao taacutec lưu trữ dữ liệu cho một ứng dụng đặc thugrave Noacute đưa vagraveo kho dữ liệu một dograveng caacutec dữ liệu thocirc được thiết kế

3 So saacutenh

Kho dữ liệu vận hagravenh Kho dữ liệu

Dữ liệu theo chủ đề Dữ liệu theo chủ đề

Dữ liệu tiacutech hợp Dữ liệu tiacutech hợp

Dữ liệu thay đổi Dữ liệu khocircng thay đổi

Dữ liệu được cập nhật khi thay đổi

Dữ liệu giữ nguyecircn

Chỉ coacute dữ liệu hiện tạiDữliệu hiện tại vagrave dữ liệu lịch sử

Chu kỳ lagravem tươi dữ liệu ngắn Chu kỳ lagravem tươi dữ liệu dagravei

Chỉ coacute dữ liệu chi tiết Dữ liệu chi tiết vagrave dữ liệu tổng kết

Dugraveng cho caacutec quyết định ngắn hạn

Dugraveng cho hoạch định dagravei hạn

4 Kho dữ liệu cục bộ (Data Mart - DM)

Kho dữ liệu cục bộ lagrave CSDL coacute những đặc điểm giống với kho dữ liệu nhưng với quy mocirc nhỏ hơn vagrave lưu trữ dữ liệu về một lĩnh vực một chuyecircn ngagravenh

Data mart phụ thuộc Chứa những dữ liệu được lấy từ DW vagrave những dữ liệu nagravey sẽ được triacutech lọc vagrave tinh chế tiacutech hợp lại ở mức cao hơn để phục vụ một chủ đề nhất định của Datamart

Data mart độc lập Khocircng giống như Datamart phụ thuộc Data mart độc lập được xacircy dựng trước DW vagrave dữ liệu được trực tiếp lấy từ caacutec nguồn khaacutec nhau

5 Siecircu dữ liệu Metadata lagrave dữ liệu để mocirc tả dữ liệu Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột

một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi Metadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu

6 Mocirci trường kho dữ liệu Hệ thống của tổ chức vagrave kho cung cấp dữ liệu để xacircy dựng kho dữ liệu Trong quaacute trigravenh chuyển dữ liệu từ caacutec nguồn khaacutec nhau dữ liệu coacute thể

được lagravem sạch hoặc chuyển đổi vagrave vigrave thế DW được xem như lagrave một chuẩn cho việc lưu trữ

Đồng thời siecircu dữ liệu được ghi lại Cuối cugraveng DW hoặc siecircu thị coacute thể được sử dụng để tạo ra một kho dữ

liệu ldquocaacute nhacircnrdquo 7 Caacutec đặc điểm của kho dữ liệu

Đặc điểm Mocirc tả

Hướng chủ đề - DL tổ chức theo caacutech thức người dugraveng tham chiếu

Tiacutech hợp - Dữ liệu ldquosạchrdquo loại bỏ tiacutenh thiếu nhất quaacuten

Khocircng thay đổi - DL ldquochỉ đọcrdquo người dugraveng khocircng thay đổi được

Chuỗi thời gian - DL lagrave chuỗi thời gian khocircng phải lagrave trạng thaacutei hiện tại

Được tổng kết - DL vận hagravenhthao taacutec khi cần thiết

được kết hợp lại thagravenh dạng coacute thể dugraveng được cho quyết định

Kiacutech cỡ lớn hơn - Lưu giữ theo chuỗi thời gian tức lagrave giữ lại nhiều DL

Khocircng được chuẩn hoacutea - Coacute thể dư thừa DLSiecircu dữ liệu - Dữ liệu của dữ liệu được lưu trữNguồn dữ liệu - DL vận hagravenh (caacutec hệ sẵn coacute) cugraveng

với caacutec nguồn ngoagravei 8 Kho dữ liệu hướng chủ đề

Hướng chủ để coacute nghĩa lagrave kho dữ liệu được tổ chức xung quanh caacutec chủ đề chiacutenh như khaacutech hagraveng sản phẩm sản xuất Tập trung vagraveo việc mocirc higravenh hoacutea vagrave phacircn tiacutech dữ liệu cho caacutec nhagrave ra quyết định magrave khocircng tập trung vagraveo caacutec xử lyacute thocircng thường Cung cấp cho người dugraveng một khung nhigraven toagraven vẹn đơn giản vagrave đầy đủ về caacutec sự kiện quanh caacutec chủ đề

9 Dữ liệu trong DW được tiacutech hợp Dữ liệu trong kho dữ liệu được xacircy dựng bằng caacutech tổng hợp dữ liệu từ

nhiều nguồn khaacutec nhau vagrave caacutec nguồn coacute tổ chức khaacutec nhau Cơ sở dữ liệu caacutec file excel caacutec flat file hoặc caacutec raw file Khi đưa vagraveo kho dữ liệu caacutec dữ liệu được lagravem sạch vagrave tiacutech hợp dữ liệu nhằm đảm bảo tiacutenh nhất quaacuten của dữ liệu

10Kiến truacutec kho dữ liệu Tầng cơ sở dữ liệu hoạt động Tầng truy xuất thocircng tin Tầng truy xuất dữ liệu Tầng siecircu dữ liệu Tầng quản lyacute tiến trigravenh Tầng thocircng điệp của ứng dụng Tầng vật liacute của kho dữ liệu Tầng trigravenh diễn dữ liệu

11Higravenh trạng kho dữ liệu Kho dữ liệu ảo - người dugraveng cuối coacute thể truy cập trực tiếp đến kho dữ liệu

sử dụng caacutec cocircng cụ cho pheacutep ở tầng truy xuất dữ liệu Kho dữ liệu trung tacircm-1 cơ sở dữ liệu vật lyacute chứa tất cả dữ liệu cho một

vugraveng chuyecircn dụng nagraveo đoacute

Kho dữ liệu phacircn taacuten- Thagravenh phần được phacircn taacuten qua nhiều hệ cơ sở dữ liệu vật lyacute

12METADATA- Siecircu dữ liệu Định nghĩa Siecircu dữ liệu lagrave dữ liệu về dữ liệu Lagrave 1 lưu trữ dugraveng để

Miecircu tả kho dữ liệu tổng thể Nhận dạng kiểu kho dữ liệu Quản liacute quaacute trigravenh tiacutech hợp dữ liệu Quản liacute quaacute trigravenh cập nhật kho dữ liệu Quản liacute bảo mật

Lagrave chigravea khoacutea quyết định sự thagravenh cocircng của kho dữ liệu luocircn được thay đổi vagrave cập nhật theo sự phaacutet triển của kho dữ liệu

Dugraveng để quản liacute điều khiển kho dữ liệu Sự ra đời của kho dữ liệu như 1 cấu truacutec hỗ trợ ra quyết định siecircu dữ liệu

được xem như nguồn tagravei nguyecircn dữ liệu Siecircu dữ liệu lagrave trừu tượng Chuacuteng lagrave dữ liệu bậc cao cung cấp mocirc tả ngắn

gọn caacutec dữ liệu bậc thấp hơn 13Hoạt động của Siecircu dữ liệu

Siecircu dữ liệu rất cần thiết trong việc chuyển hoacutea thocircng tin trở thagravenh tri thức Lagrave chigravea khoacutea giuacutep chuacuteng ta xử lyacute được dữ liệu thocirc Viacute dụ một dograveng dữ liệu baacuten hagraveng 1023 K596 11121 agraveNoacute sẽ khocircng coacute nghĩa gigrave cho đến khi chuacuteng ta đưa vagraveo siecircu dữ liệu (thư

mục chứa dữ liệu) agrave cửa hagraveng 1023 sản phẩm K596 vagrave số tiền baacuten được lagrave 11121 đocirc la

14Sự cần thiết phải nhất quaacuten trong kho dữ liệu Kho dữ liệu được xacircy dựng cho lợi iacutech của những nhagrave phacircn tiacutech kinh

doanh caacutec nhagrave quản trị cho tất cả caacutec khu vực chức năng Trong cơ sở dữ liệu riecircng caacutec khu vực khaacutec nhau coacute thể định nghĩa vagrave lưu

trữ dữ liệu thocircng qua phiecircn bản của chiacutenh noacute Khi dữ liệu được lấy từ những vugraveng khaacutec nhau đoacute vagrave được đặt vagraveo kho dữ

liệu Việc chuyển đổi vagrave lagravem sạch caacutec tiến trigravenh sẽ đảm bảo noacute lagrave duy nhất được tiacutech hợp tại một mức của tổ chức

15Ragrave soaacutet lại dữ liệu ndash Thực thi siecircu dữ liệu

Bất kể cấu truacutec tự nhiecircn của 1 cacircu truy vấn thế nagraveo thigrave caacutec thagravenh phần của siecircu dữ liệu rất quan trọng đối với người ra quyết định

Bảng thuộc tiacutenh khoacutea được lưu trữ bởi kho dữ liệu Tập hợp dữ liệu được lấy từ đacircu Những chuyển đổi nagraveo được thực thi với việc lagravem sạch

16Siecircu dữ liệu lagrave gigrave Metadata - lagrave thocircng tin mocirc tả nội dung của cơ sở dữ liệu (CSDL) Metadata baacuteo cho người dugraveng biết thời gian cập nhật sau cugraveng của dữ liệu

định dạng vagrave mục điacutech sử dụng của noacute Những thocircng tin nagravey coacute thể hướng dẫn người dugraveng duyệt qua CSDL vagrave

giuacutep họ hiểu được yacute nghĩa vagrave ngữ cảnh của dữ liệu Trong CSDL metadata lagrave caacutec dạng biểu diễn khaacutec nhau của caacutec đối tượng

trong CSDL Trong CSDL quan hệ metadata lagrave caacutec định nghĩa của bảng cột CSDL

view vagrave nhiều đối tượng khaacutec Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột

một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi -gtMetadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu

Bảng chuyển đổi Ghi lại những chuyển đổi đatilde được thực hiện

Lịch sử thực thi Ghi lại những dữ liệu đatilde được

phacircn tiacutech

Higravenh thaacutei kết nốiGhi lại những dữ liệu được kết nối vagrave tần suất

17Aacutenh xạ thocircng thường của siecircu dữ liệu Bản ghi aacutenh xạ chuyển đổi bao gồm

Định danh của nguồn gốc Chuyển đổi thuộc tiacutenh Chuyển đổi thuộc tiacutenh vật lyacute Matilde hoacutea tham chiếu bảng chuyển đổi Đổi tecircn Đổi khoacutea Gaacuten giaacute trị cho thuộc tiacutenh mặc định Chọn logic cho caacutec nguồn nhiều giaacute trị Đổi thuật toaacuten

18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để

phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai

lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave

tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec

Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm

Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo

19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua

caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau

SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được

Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra

một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức

Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ

Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ

Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech

CHƯƠNG 11 KHAI PHAacute DỮ LIỆU

1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn

ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993

Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng

2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd

1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều

2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP

3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn

4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng

5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server

6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo

7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động

8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời

9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều

10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện

11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech

12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP

3 Xử lyacute phacircn tiacutech trực tuyến OLAP

MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave

dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu

ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave

thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu

HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave

ROLAP4 Khai phaacute dữ liệu

Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh

khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn

Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan

5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp

6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại

Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp

Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec

Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt

Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra

Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh

vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho

Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec

Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm

Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục

Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng

gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp

Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn

Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec

Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper

Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2

Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25

Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước

Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng

Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện

trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp

Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute

độ hỗ trợ ge ngưỡng minsup

độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan

Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn

Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết

Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu

MOLAP ROLAP HOLAP

Lưu trữ dữ liệu cơ sở

Khối Bảng quan hệ Bảng quan hệ

Lưu trữ thocircng tin tổng hợp

Khối Bảng quan hệ Khối

Hiệu suất thực hiện truy vấn

Nhanh nhất Chậm nhất Nhanh

Tiecircu thụ khocircng gian lưu trữ

Nhiều Thấp Trung bigravenh

Chi phiacute bảo trigrave Cao Thấp Trung bigravenh

Page 26: De cuong(1-11)

Caacutec cocircng cụ trong một bộ phần mềm bao gồm người quản lyacute hội nghị (Lotus Sametime) vagrave trao đổi thocircng điệp (Lotus Notes Mail)

Xếp hạng phần mềm cho nhoacutem

Ellis vv đề xuất một hệ thống xếp hạng dựa vagraveo kiểu sự hỗ trợ noacute Cung cấp

Hệ thocircng điệp

Hệ thống hội thảo truyền higravenh

Hệ thống cộng taacutec soạn thảo

Nhoacutem phacircn phối giải phaacutep phần mền

Hệ thống phối hợp

Hệ thống thocircng minh đại diện

Lực lượng điều khiển phaacutet triển phần mềm cho nhoacutem

Một số nhacircn tố chiacutenh bao gồm

Tăng năng suất

Giảm số lượng caacutec cuộc họp

Tăng cường tự động hoacutea caacutec quy trigravenh lagravem việc thường xuyecircn

Cần phối hợp toagraven cầu tốt hơn

Tiacutenh sẵn sagraveng của những mạng lan rộng

Coleman vagrave Khanna liệt kecirc 10 nhacircn tố khaacutec

54Quản lyacute hoạt động MDM (Mobile Device Management - Quản lyacute thiết bị di động)

Một số phương phaacutep phối hợp phổ biến hơnMDM lagrave

Kỹ thuật nhoacutem định danh

Kỹ thuật Delphi

Sự phacircn xử

Hệ thocircng tin dựa trecircn vấn đề

Nemawashi

Kỹ thuật nhoacutem định danh

1-Mỗi người tham gia viết ra những yacute tưởng về những gigrave necircn quyết định

2-Lần lượt mỗi người tham gia trigravenh bagravey yacute tưởng của migravenh được ghi lại trecircn bảng Khocircng thảo luận ở đacircy

3-Sau khi tất cả caacutec yacute tưởng được trigravenh bagravey caacutec đại biểu coacute thể chất vấn những người khaacutec

4-Mỗi người tham gia bỏ phiếu cho mỗi yacute tưởng

Kỹ thuật Delphi

Về cơ bản tương tự như kỹ thuật nhoacutem định danh ngoại trừ những người khocircng bao giờ tham gia cuộc họp

Một cocircng cụ khảo saacutet được sử dụng để thu thập đầu vagraveo ban đầu từ caacutec thagravenh viecircn

Một cuộc khảo saacutet thứ hai được gửi đi với một bản toacutem tắt caacutec kết quả chung

Những bước lặp lại cho đến khi đạt được một sự đồng thuận hoặc nhigraven nhận của đa số

Sự phacircn xử(Arbitration )

Thiacutech hợp nhất khi caacutec thagravenh viecircn của MDM đại diện cho caacutec yếu tố đối lập

Những người tham gia đồng yacute rằng nếu lựa chọn thay thế hai becircn thỏa thuận khocircng được tigravem thấy thigrave một trọng tagravei viecircn becircn ngoagravei sẽ tham gia

Trọng tagravei sau đoacute lựa chọn thay thế ocircng hoặc xeacutet thấy thiacutech hợp nhất

Hệ thống thocircng tin dựa trecircn vấn đề (IBIS)

Lagrave một phương phaacutep lập luận cấu truacutec

Một đại diện cho IBIS lagrave một đồ thị với caacutec nuacutet vagrave caacutec liecircn kết

IBIS bắt đầu với lựa chọn của một nuacutet vấn đề gốc sau đoacute caacutec nuacutet vị triacute khaacutec nhau được liecircn kết với nuacutet gốc

Caacutec nuacutet vị triacute nagravey sau đoacute được đaacutenh giaacute dựa trecircn những lập luận gắn liền với chuacuteng

Nemawashi (được sử dụng rộng ratildei tại Nhật Bản)

1-Một hoặc nhiều thagravenh viecircn của MDM được chỉ định lagrave điều phối viecircnCaacutec điều phối viecircn sau đoacute chọn người tham gia cograven lại

2-Điều phối viecircn xacircy dựng một tổng hợp caacutec sự lựa chọn vagrave sau đoacute caacutec chuyecircn gia đaacutenh giaacute caacutec lựa chọn

3-Điều phối viecircn lựa chọn một sự lựa chọn dựa trecircn kết quả ở trecircn(ở 2)

4-Sự thay thế được luacircn chuyển điều phối viecircn tigravem kiếm sự đồng thuận thocircng qua sự thuyết phục vagrave đagravem phaacuten

5-Nếu đạt được sự đồng thuận điều phối viecircn cho lưu thocircng một tagravei liệu magrave mỗi thagravenh viecircn MDM để lại dấu hiệu trecircn đoacute

55Nơi lagravem việc ảo

Nhiều tổ chức trecircn toagraven thế giới kinh doanh bất động sản cho cocircng nghệ hợp taacutec

Cocircng việc được trở thagravenh một điều bạn lagravem hơn lagrave một nơi bạn đi

Những thay đổi lớn nhất mang lại bởi nơi lagravem việc ảo coacute thể lagrave về văn hoaacute hay xatilde hội hơn lagrave về cocircng nghệ

Chương 6 Hệ thống thocircng tin điều hagravenh

61 Yacute nghĩa của EIS- Hệ thống thocircng tin điều hagravenh

- EIS lagrave một dạng đặc biệt của DSS được thiết kế để hỗ trợ ra quyết định ở cấp cao nhất của một tổ chức

- Lagrave một hệ thống thocircng tin hỗ trợ nhu cầu lập kế hoạch vagrave đaacutenh giaacute của caacutec nhagrave quản lyacute điều hagravenh

- EIS coacute thể giuacutep một CEO coacute được bức tranh tổng thể chiacutenh xaacutec nhất về caacutec hoạt động vagrave một bản toacutem tắt những gigrave magrave đối thủ cạnh tranh đang lagravem

- Caacutec hệ thống nagravey noacutei chung hoạt động dễ dagraveng vagrave trigravenh bagravey thocircng tin theo những caacutech dễ hiểu để việc tiếp thu được nhanh choacuteng (biểu đồ đồ thịhellip)

(Tagravei liệu thecircm EIS lagrave những loại hệ thống lagrave rất phức tạp trong tự nhiecircn Coacute thể noacutei hệ thống nagravey cũng cung cấp cho caacutec nhagrave quản lyacute với caacutec thiết bị coacute khả năng ra quyết định bằng caacutech sử dụng của noacute Hệ thống nagravey hoạt động trong điều kiện như vậy quan trọng như trong caacutec hệ thống khaacutec khocircng hỗ trợ Khả năng lưu trữ dữ liệu nặng lagravem cho noacute lyacute tưởng để được thocircng qua khocircng chỉ bởi caacutec doanh nghiệp lớn magrave cograven bởi caacutec doanh nghiệp nhỏ hơn Nhigraven chung hệ thống nagravey lagrave dagravenh cho caacutec nhacircn viecircn cấp cao hỗ trợ thagravenh thạo trong việc đưa ra caacutec quyết định quan trọng)

Caacutec phiecircn EIS tiecircu biểu- Phiecircn lagravem việc coacute thể bắt đầu với một baacuteo caacuteo về tigravenh higravenh tagravei chiacutenh vagrave kinh

doanh của một cocircng ty caacutec chỉ số hoạt động quan trọng được hiển thị rotilde ragraveng- EIS sẽ cho pheacutep caacutec giaacutem đốc điều hagravenh coacute thể đi sacircu vagraveo dữ liệu từ những con

số bất kỳ magrave noacute hỗ trợ- Việc điều hagravenh coacute thể lựa chọn một mức độ chi tiết ( VD danh số baacuten hagraveng) nếu

như cần điều tra thecircm- Lagrave một phương phaacutep tiếp cận coacute thể giuacutep việc ra quyết định tốt hơn

Những điều magrave EIS ko coacute- EIS khocircng phải lagrave sự thay thế cho caacutec hệ thống dựa trecircn caacutec maacutey tiacutenh khaacutec EIS

thực sự chỉ cung cấp dữ liệu cho caacutec hệ thống nagravey- Noacute khocircng thể biến caacutec bộ hệ điều hagravenh của maacutey tiacutenh thagravenh những ldquochuyecircn viecircn

giỏirdquo- Coacute thể được viacute một caacutech cao hơn như lagrave một trợ lyacute đaacuteng tin cậy coacute thể được gọi

đến bất khi nagraveo vagrave mỗi khi cần thiết

Tagravei liệu thecircm Sự khaacutec nhau giữa EIS vagrave DSS+ EIS thiết kế để hỗ trợ những người điều hagravenh cấp cao giuacutep họ khaacutem phaacute caacutec vấn đề vagrave caacutec cơ hội DSS hỗ trợ những nười phacircn tiacutech cố gắng trả lời cacircu hỏi caacutei gigrave coacute thể lagravem cugraveng với một cơ hội hoặc một vấn đề

Chiều EIS DSSNhững người sử dụng thocircng thường

Duyệt dữ liệu đi xuống truy xuất trạng thaacutei

Hỗ trợ phacircn tiacutech vagrave quyết định

Sự thuacutec đẩy Tiacutenh thiacutech hợp Tiacutenh hiệu quảỨng dụng Queacutet mocirci trường đaacutenh giaacute

hiệu suất nhận dạng caacutec vấn đề vagrave caacutec cơ hội

Caacutec quyết định quản lyacute trecircn caacutec lĩnh vực đa dạng

Hỗ trợ quyết định Caacutec chiacutenh saacutech caacutec quyết định khocircng coacute cấu truacutec ở mức cao vagrave hỗ trợ giaacuten tiếp

Hỗ trợ caacutec quyết định lặp lại caacutec quyết định khocircng thể đoaacuten trước ra quyết định khocircng coacute cấu truacutec vagrave baacuten cấu truacutec

Loại thocircng tin Caacutec thocircng tin tin tức thocircng tin becircn ngoagravei về khaacutech hagraveng đối thủ cạnh tranh mocirci trường caacutec baacuteo caacuteo theo yecircu cầu vagrave định thời về caacutec hoạt động becircn trong

Caacutec thocircng tin hỗ trợ caacutec tigravenh huống đặc biệt

Sử dụng coacute nguyecircn tắc

Dograve theo vết vagrave điều khiển nhận dạng cơ hội

Hoạch định tổ chức phacircn nhoacutem vagrave điều khiển

Khả năng phugrave hợp với những người sử dụng caacute nhacircn

Thiết kế loại ra quyết định cho mỗi người điều hagravenh caacute nhacircn bằng nhiều lựa chọn đầu ra

Cho pheacutep caacutec đaacutenh giaacute caacute nhacircn caacutec khả năng what-if lựa chọn loại hộp hội thoại

Đồ họa Phải coacute Lagrave một phần quan trọng của nhiều DSS

Thacircn thiện người sử dụng

Phải coacute Phải coacute nếu khocircng coacute người sử dụng trung gian

Xử lyacute thocircng tin Lọc neacuten thocircng tin dograve theo vết dữ liệu vagrave thocircng tin quan trọng

EIS kiacutech thiacutech caacutec cacircu hỏi caacutec cacircu trả lời bằng caacutech sử dụng DSS vagrave phản hồi lại EIS

Hỗ trợ caacutec thocircng tin chi tiết

Truy xuất thường xuyecircn caacutec mức chi tiết của bất kỳ thocircng tin tổng hợp nagraveo (duyệt dữ

Coacute thể coacute trong DSS nhưng khocircng thường

liệu chi tiết)Cơ sở mocirc higravenh Caacutec chức năng coacute sẵn bị hạn

chếLagrave điểm cốt lotildei của DSS

Cấu truacutec Theo người baacuten sản phẩm hoặc theo caacutec chuyecircn gia hệ thống thocircng tin

Theo người sử dụng hoặc caacute nhacircn hoặc caacutec chuyecircn gia từ caacutec trung tacircm thocircng tin hoặc phograveng ban hệ thống thocircng tin

Phần cứng Mainframe caacutec trạm RISC mạng LANs hoặc caacutec hệ thống phacircn bố

Mainframe caacutec trạm RISC caacutec maacutey PC hoặc caacutec hệ thống phacircn bố

Bản chất caacutec goacutei phần mềm

Truy xuất tương taacutec dễ dagraveng đến nhiều cơ sở dữ liệu truy xuất trực tuyến caacutec khả năng DBMS phức tạp caacutec liecircn kết phức tạp

Caacutec khả năng tiacutenh toaacuten lớn caacutec ngocircn ngữ mocirc higravenh mocirc phỏng ứng dụng vagrave caacutec bộ tạo DSS

Bản chất caacutec thocircng tin

Trigravenh bagravey thocircng tin được phaacutet sinh trước về quaacute khứ vagrave hiện tại tạo caacutec thocircng tin mới về quaacute khứ hiện tại tương lai

Tạo thocircng tin mới về quaacute khứ hiện tại tương lai

62 Lịch sử EIS- EIS xuất hiện lần đầu tiecircn tại MIT vagraveo những năm 1970

- Những EIS đầu tiecircn được phaacutet triển bởi caacutec doanh ngiệp lớn sẵn sagraveng chấp nhận rủi ro để đạt được lợi thế cạnh tranh

- Vagraveo những năm 1980 caacutec nhagrave cung cấp đatilde phaacutet triển một số cơ sở khaacutech hagraveng rộng vagrave cocircng nghệ EIS được tiếp tục phaacutet triển cho đến ngagravey nay

(Tagravei liệu thecircm Sử dụng DSSEIS cho phaacutet triển bền vững + Một số nghiecircn cứu đatilde được tiến hagravenh để kiểm tra việc thực hiện của EIS trong khu vực cocircng cộng vagrave chiacutenh phủ caacutec nước tổ chức kể từ khi chuacuteng được phaacutet triển theo định hướng lợi nhuận cho caacutec cocircng ty tư nhacircn (Hasan vagrave Hasan năm 1997) Theo một nghiecircn cứu tiến hagravenh tại Mỹ ở hơn 300 cocircng ty kết quả cho thấy sự khaacutec biệt của EIS giữa tư nhacircn vagrave chiacutenh phủ một số kết quả thuacute vị được phaacutet hiệnViacute dụ khoacute khăn hơn để chuyển tiền từ một tagravei khoản khaacutec trong một EIS của chiacutenh phủ cũng lagrave khoacute khăn hơn để biện giải thiacutech cho những chi phiacute phaacutet triển EIS của chiacutenh phủ Một nghiecircn cứu khaacutec được tiến hagravenh ở Australia

cho thấy rằng EIS cung cấp cho quản lyacute một higravenh ảnh chiacutenh xaacutec hơn về tổ chức thực hiện vagrave cung cấp hỗ trợ cho caacutec lợi iacutech chiến lược cải thiện khocircng chỉ cho caacutec nhagrave quản lyacute nhưng cograven cho phần cograven lại của tổ chức Dựa trecircn caacutec hệ thống được thiết kế cho caacutec cocircng ty tư nhacircn với một caacutech rotilde ragravengxaacutec định mục tiecircu EIS lagrave thiacutech hợp cho caacutec tổ chức cocircng cộng hiện đại nhưng cần phải được linh hoạt hơn vagrave kết thagravenh chugravem một phạm vi rộng hơn khả năng vagrave phương tiện hơn so với khu vực tư nhacircn ban đầu theo định hướng sản phẩm (Hasan vagrave Hasan năm 1997) Điều nagravey coacute thể lagrave do thực tế rằng caacutec hoạt động khu vực cocircng lagrave bắt buộc coacute taacutec động rộng phải đaacutep ứng sự mong đợi duy nhất cocircng cộng thường coacute mục tiecircu mơ hồ vagrave macircu thuẫn iacutet quyền tự chủ vagrave kiểm soaacutet việc ra quyết định vagrave nhacircn viecircn lagrave khoacute khăn hơn (Watson vagrave Carte2000) + Toacutem lại EIS lagrave một khaacutei niệm thagravenh cocircng noacute phaacutet triển qua nhiều năm tuy nhiecircn EIS khắc phục khiếm khuyết của migravenh bằng caacutech tiến hagravenh nghiecircn cứu liecircn tục)

63 Tại sao những người điều hagravenh hagraveng đầu lại khaacutec nhau- Họ lagrave những doanh nghiệp theo định hướng coacute suy nghĩ

- Coacute một khoảng khocircng gian rộng để kiểm soaacutet

- Họ chịu traacutech nhiệm cho việc thiết lập chiacutenh saacutech

- Họ đại diện cho tổ chức mocirci trường becircn ngoagravei

- Hagravenh động của họ tạo ra những kết quả đaacuteng kể về tagravei chiacutenh vagrave con người

Tần số caacutec hoạt động điều hagravenh- Xử lyacute xaacuteo trộn 42

- Hoạt động kinh doanh 32

- Phacircn bổ nguồn lực 17

- Đagravem phaacuten 3

- Những điều khaacutec 6

Handling Disturbances 42

Entrepreneurial Activites 32

Resource Allocation 17

Negotiation 3

Other 6

Những thocircng tin điều hagravenh cần thiết- Quản lyacute xaacuteo trộn coacute thể yecircu cầu sự chuacute yacute xung quanh đồng hồ

- Hoạt động kinh doanh yecircu cầu điều hagravenh để dự đoaacuten những thay đổi trong mocirci trường

- Nhiệm vụ phacircn bổ tagravei nguyecircn yecircu cầu lựa chọn người quản lyacute vagrave caacutec nguồn lực hạn chế được triển khai

- Đagravem phaacuten yecircu cầu cập nhật thocircng tin từng phuacutet để coacute thể xacircy dựng được sự đồng thuận

Caacutec loại thocircng tin điều hagravenh- Hệ thống kế toaacuten coacute liecircn quan đến việc tiacutenh toaacuten thu nhập hoạt động cho caacutec lĩnh

vực cụ thể lagrave quan trọng hơn so với caacutec hệ thống kế toaacuten truyền thocircng- Thocircng tin về thị trường khaacutech hagraveng cung cấp giaacute trị trong việc quyết định chiến

lược- Caacutec thocircng tin cần thiết thường được truyền đi trecircn một số hệ thống maacutey tiacutenh vagrave

nằm trong toagraven tổ chức- Caacutec thocircng tin được sử dụng thường lagrave ngắn hạn vagrave dễ thay đổi

Phương thức để xaacutec định thocircng tin cần thiết

Rockart xaacutec định được năm phương thức cơ bản để xaacutec định thocircng tin cần thiết

- Phương thức dựa trecircn kết quả- Phương thức rỗng- Phương thức chỉ số khoacutea- Phương thức tổng hợp nghiecircn cứu- Phương thức dựa vagraveo nhacircn tố then chốt dẫn đến thagravenh cocircng

64 Thagravenh phần EIS

- Sản phẩm EIS đầu tiecircn được phaacutet triển để sử dụng trecircn maacutey tiacutenh cấu higravenh cao nhưng caacutec sản phẩm hiện nay nhằm mục tiecircu lagrave nền tảng ClientServer

- Những nền tảng linh hoạt hơn coacute thể thiacutech ứng với thay đổi trong tổ chức vagrave cocircng nghệ

- Sử dụng dữ liệu thời gian thực dẫn đến quyết định nhanh hơn nhiều thocircng tin hơn

Thagravenh phần phần cứng- Một EIS khocircng đogravei hỏi coacute phần cứng cụ thể hoặc duy nhất nagraveo- Chigravea khoacutea của vấn đề lagrave để đảm bảo rằng caacutec thagravenh phần của EIS tối ưu hoacutea vagrave

phugrave hợp với tagravei nguyecircn maacutey tiacutenh của tổ chức- Hệ thống nagravey phải được cấu higravenh để caacutec nguồn tagravei nguyecircn phugrave hợp với những

người điều hagravenh chuacuteng

Thagravenh phần phần mềm- Traacutei ngược với phần cứng phần mềm thường được chuyecircn mocircn hoacutea cao cho caacutec

bagravei toaacuten về miền- Sự chuyecircn mocircn hoacutea nagravey thường đạt được bằng caacutech sử dụng thagravenh phần off-the-

shelf cho toagraven bộ EIS vagrave caacutec mocirc-đun tugravey chỉnh để đaacutep ứng nhu cầu cụ thể- Lotus Notes lagrave một viacute dụ điển higravenh Noacute coacute thể được sử dụng một migravenh hoặc coacute

thể phục vụ becircn thứ ba mocirc-đun plug-in

Cocircng nghệ EIS hiện nay

Dobrzeniecki đề xuấtphacircn loạitừng cấptheo bachức năng- Loại 1 sản phẩm bao gồmmột bộ đầy đủcaacutec ứng dụngtừ mộtnhagrave cung cấp- Loại 2 sản phẩm đượcthựchiệnở phần đầu củacaacutecsản phẩmDSS đượcphaacutet triển

bởicugravengmộtnhagrave cung cấp- Loại 3 sản phẩmkết hợp với nhautheo bất kỳ số lượngthuộc sở hữu củacocircng ty

65 Xacircy dựng EIS

- Xacircy dựngmộtEISgiống nhưxacircydựngmột số hệ thống khaacutec củamocirc higravenh hệ thống thocircng tin

- Việcphaacutet triểncấu truacutecnecircn được theo dotildeitừ quaacute trigravenh thiết kế đến quaacute trigravenhthực hiện

- Tuy nhiecircn một dự aacuten phaacutet triển EIScoacute xu hướnglagrave thống nhấtvagraveyecircu cầu hỗ trợ caacutec nhagrave quản lyacute latildenh đạo

- Xacircy dựng một EIScoacute thểphaacutet hiện ra đượccaacutectigravenh huống khoacute khănmagravemột nhagrave phaacutet triển chưabao giờ gặp phải

Mocirc higravenh EIS

Khung phaacutet triển một EIS

- Watson et al đề nghị xacircy dựngkhung với ba thagravenh phần+ Caacutech tiếp cận tập trung vagraveo yếu tốcon người vagrave dữ liệu coacute liecircn quan đến EIS+ Quaacute trigravenh phaacutet triển cần sự linh hoạt vagrave tương taacutec+ Người sử dụng - hệ thống hộp thoại bao gồm một ngocircn ngữ hagravenh động để xử lyacute caacutec lệnh

Lợi iacutech của EIS- Dễ duy trigrave caacutec mục tiecircu coacute tổ chức- Dễ truy xuất thocircng tin- Cho pheacutep người sử dụng nacircng cao hiệu suất hơn

- Tăng chất lượng ra quyết định- Cung cấp sự cải tiến cạnh tranh- Tiết kiệm thời gian của người sử dụng- Tăng khả năng vagrave chất lượng giao tiếp- Cung cấp khả năng điều khiển tốt hơn trong tổ chức- Cho pheacutep tham gia caacutec vấn đề vagrave caacutec cơ hội- Cho pheacutep hoạch định- Cho pheacutep tigravem kiếm nguyecircn nhacircn của một vấn đề- Thảo matilden caacutec yecircu cầu của người điều hagravenh

Hạn chế của EIS vagrave 1 số sai lầm cần traacutenh

- Chi phiacute một cuộc khảo saacutetnăm1991 chothấychi phiacute phaacutet triểntrungbigravenh365000USDvớichi phiacute vận hagravenhhagraveng năm lagrave$200000 (EIS)

- Cocircng nghệ hạn chếEIScần phảiđượctiacutech hợp hoagraven toagravenvagraveokiếntruacuteccủadoanh nghiệphiện tại do đoacute noacutelagrave một thaacutech thứclớn đối vớithiết kế

- Hạn chế tổ chức cơ cấu tổ chứccoacute thể khocircng phugrave hợp

Sự hạn chế về tổ chức- Chương trigravenh nghị sự vagrave thời gian chệch EIS mocirc tả một phần việc thực hiện một

chương trigravenh nghị sự vagrave coacute thể dễ dagraveng đạt được sự tin cậy một caacutech chắc chắn- Đồng bộ hoacutea việc quản lyacute sự tin cậy đuacuteng luacutec đặc biệt baacuteo caacuteo EIS coacute thể phaacute

vỡ sự ổn định thiết lập caacutec chu trigravenh baacuteo caacuteo một caacutech tốt nhất- Sự bất ổn EIS phản ứng nhanh coacute thể gacircy ra việc taacutec động trở lại một caacutech

nhanh choacuteng dẫn đến sự thiếu ổn định trong tổ chức

Sự thất bại lagrave thay thế khocircng thể chấp nhận được- Một số yếu tố lagravem EIS thất bại

+ Thiếu sự hỗ trợ về mặt quản lyacute+ Vấn đề chiacutenh trị+ Thất bại của nhagrave phaacutet triển+ Lỗi về cocircng nghệ+ Giaacute cả+ Thời gian

66 Ra quyết định điều hagravenh trong tương lai vagrave EIS

- Coacute một vagravei điều kiện sẽ được hợp nhất cho việc chuyển đổi cocircng nghệ Trong đoacute một vagravei điều kiện coacute thể dễ dự đoaacuten Hai điều kiện magrave ta coacute thể thấy lagrave+ Phaacutet triển cocircng nghệ maacutey tiacutenh trong việc điều hagravenh sẽ tạo ra sự chuyển đổi được chấp nhận một caacutech dễ dagraveng hơn+ Mở rộng traacutech nhiệm điều hagravenh sẽ mở rộng nhu cầu thocircng tin

Tương lai của EIS- EIS thocircng minh Những tiến bộ trong cocircng nghệ AI sẽ được triển khai trong caacutec

EIS- EIS đa phương tiện Cơ sở dữ liệu đa phương tiện sẽ cho pheacutep tiacutech hợp văn bản

giọng noacutei vagrave higravenh ảnh trong tương lai- EIS thocircng tin Tương lai EIS sẽ mở rộng hơn trong việc sử dụng dữ liệu becircn

ngoagravei doanh nghiệp- EIS kết nối Giao tiếp với băng thocircng rộng cho pheacutep kết nối liecircn thocircng lớn hơn

Chương 7 HỆ CHUYEcircN GIA VAgrave TRIacute TUỆ NHAcircN TẠO

71 Caacutec khaacutei niệm

72 Triacute thocircng minh của triacute tuệ nhacircn tạo

73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia

74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia

75 Lợi iacutech vagrave hạn chế của hệ chuyecircn gia

71 Caacutec khaacutei niệm

Chuyecircn mocircn (Expertise) sự hiểu biết rộng trong 1 lĩnh vực hẹp

Hệ chuyecircn gia (Expert Systems)1 chương trigravenh maacutey tiacutenh sử dụng 1 tập caacutec luật dựa trecircn tri thức của con người để giải quyết caacutec vấn đề đogravei hogravei phải coacute sự chuyecircn mocircn

Một số hệ chuyecircn gia nổi tiếng

DENDRAL (Standford 1960s Edward Feigenbaum)

MYCIN (Standford1970s Edward Shortliffe)

PROSPECTOR (MIT 1979)

Triacute tuệ nhacircn tạo (Artificial Intelligence ndash AI)

Triacute tuệ nhacircn tạo một bộ phacircn của ngagravenh khoa học maacutey tiacutenh quan tacircm đến việc thiết kế caacutec hệ thống maacutey tiacutenh thocircng minh đoacute lagrave caacutec hệ thống đưa ra caacutec đặc điểm magrave từ đoacute chuacuteng ta liecircn hệ với sự thocircng minh trong hagravenh động của con người (Barr vagrave Feigenbaum 1981)

Mục điacutech của AI

Mục điacutech khoa học xaacutec định caacutec gợi yacute để giải thiacutech caacutec loại khaacutec nhau của triacute tuệ thực

Mục điacutech kỹ thuật giải quyết caacutec vấn đề trong thế giới thực

Triacute tuệ nhacircn tạo kế thừa nhiều yacute tưởng quan điểm kỹ thuật từ caacutec ngagravenh khoa học khaacutec

- Triết học

- Logic Toaacuten học

- Tiacutenh toaacuten

- Khoa học tacircm lyacute Khoa học nhận thức

- Sinh học Thần kinh học

- Tiến hoacutea

Caacutec lĩnh vực ứng dụng trong Triacute tuệ nhacircn tạo

Mạng nơ ron thần kinh (Neural Networks)

Tiacutenh toaacuten sự tiến hoacutea

(Evolutionary Computation)

Hệ chuyecircn gia (Expert Systems)

Kỹ thuật xử lyacute tiếng noacutei (Speech Processing)

Kỹ thuật xử lyacute ngocircn ngữ tự nhiecircn

(Natural Language Processing)

Lập kế hoạch (Planning)

Robot (Robotics)

Khoa học higravenh ảnh (Vision)

Caacutec kỹ thuật thocircng dụng dugraveng trong AI

Biểu diễn(Representation)

Học (Learning)

Caacutec luật (Rules)

Tigravem kiếm (Search)

72 Triacute thocircng minh của triacute tuệ nhacircn tạo

Con người suy diễn như thế nagraveo

Phacircn loại (Categorization)

Caacutec quy tắc cụ thể

Heuristics

Kinh nghiệm trước đoacute

Dự tiacutenh trước

Maacutey tiacutenh suy diễn như thế nagraveo

Lập luận dựa trecircn luật IF-THEN mocirc tả tri thức được matilde hoacutea dưới dạng caacutec luật

Caacutec khung (Frames) lagrave caacutec đại diện mocirc tả caacutec tigravenh huống giống nhau lagrave điển higravenh của một vagravei phacircn loại

Lập luận dựa trecircn caacutec trường hợp mocirc phỏng giải phaacutep trước đoacute cho một vấn đề hiện tại

Nhận dạng mẫu phaacutet hiện acircm thanh higravenh dạng hoặc caacutec chuỗi dagravei

Caacutec dạng khaacutec của Triacute tuệ nhacircn tạo

Học maacutey- mạng nơron vagrave giải thuật di truyền

Lập trigravenh tự động ndash lagrave những kỹ thuật tạo ra caacutec chương trigravenh để lagravem 1 nhiệm vụ riecircng biệt (cho pheacutep những người khocircng phải lagrave người lập trigravenh coacute thể lập trigravenh được)

Cuộc sống nhacircn tạo ndash nỗ lực để taacutei tạo caacutec hiện tượng sinh học trong caacutec hệ thống dựa trecircn maacutey tiacutenh

73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia(Expert Systems- ES)

Theo Jackson (1999) Một hệ chuyecircn gia lagrave một chương trigravenh maacutey tiacutenh mocirc tả vagrave suy diễn với tri thức của một vagravei lĩnh vực để giải quyết vấn đề hay đưa ra caacutec lời khuyecircn

Cấu truacutec cơ bản của ES được dựa theo cấu truacutec chung của DSS Sự khaacutec biệt chiacutenh giữa ES vagraveDSS lagrave hệ ES thu thập caacutec kiến thức từ những

chuyecircn gia trong lĩnh vực quan tacircmĐặc trưng của hệ chuyecircn gia Hiệu quả cao Thời gian trả lời thỏa đaacuteng Độ tin cậy cao Dễ hiểu

Giao diện người dugraveng trong ES

Thiết kế giao diện người dugraveng tập trung vagraveo caacutec yếu tố như dễ dagraveng sử dụngcoacute độ tin cậy cao giảm tải những khoacute khăn khi sử dụng

Thiết kế necircn coacute một số tương taacutec (đầu vagraveo kiểm soaacutet vagrave truy vấn)

Cấu tạo giao diện người dugraveng gồm coacute magraven higravenh cảm ứng bagraven phiacutem buacutet saacuteng lệnh thoại caacutec phiacutem chuyecircn dụng

Cơ sở tri thức (Knowledge Base)

Chứa đựng caacutec tri thức cụ thể miền thu được từ caacutec chuyecircn gia miền

Coacute thể chứa caacutec mocirc tả caacutec hagravenh vi giải quyết vấn đề caacutec ragraveng buộc caacutec heuristics

Thagravenh cocircng của một ES dựa trecircn tiacutenh đầy đủ vagrave tiacutenh chiacutenh xaacutec của cơ sở tri thức

Mocirc tơ suy diễn (Inference Engine)

Ở đacircy tri thức được đặt để sử dụng tạo ra caacutec giải phaacutep để giải quyết vấn đề

Mocirc tơ nagravey coacute khả năng thực hiện diễn dịch hoặc suy diễn dựa trecircn caacutec luật hay caacutec caacutec sự kiện

Đồng thời cũng coacute khả năng sử dụng caacutec suy diễn mờ hay khocircng chiacutenh xaacutec dựa trecircn xaacutec suất hay aacutenh xạ mẫu

Vograveng điều khiển suy diễn

1 Aacutenh xạ caacutec luật với caacutec sự kiện đatilde được cho

2 Chọn luật để thực hiện

3 Thực hiện luật bằng caacutech thecircm caacutec sự kiện được suy diễn ra vagraveo bộ nhớ lagravem việc

Chuỗi suy diễn (Chaining)

Suy diễn tiến (forward chaining) maacutey suy diễn bắt đầu từ dữ liệu ban đầu vagrave thực hiện việc suy luận để đưa ra caacutec kết luận cuối cugraveng

Suy diễn lugravei (backward chaining) maacutey suy diễn bắt đầu từ dữ liệu điacutech vagrave tigravem ra tri thức hỗ trợ cho dữ liệu điacutech đoacute

Viacute dụ suy diễn lugravei

R1 Nếu coacute A vagrave B thigrave suy ra coacute D

R2 Nếu coacute B thigrave suy ra coacute C

R3 Nếu coacute C vagrave D thigrave suy ra coacute E

Ta coacute E ta xem trong 3 luật R1 R2 R3 luật nagraveo coacute E ta thấy R3 chứa E đồng thời chứa C vagrave D Xeacutet tiếp trong 2 luật R1 R2 luật nagraveo chứa C vagrave D R2 chứa C R3 chứa D Từ đoacute ta coacute được caacutec tri thức hỗ trợ suy diễn vagrave kết luận lagrave nếu coacute A vagrave B thigrave sẽ coacute E Hay nếu A vagrave B đuacuteng thigrave sẽ coacute E

Viacute dụ suy diễn tiến

Giả sử coacute tập chứa 3 luật sau

R1 Nếu coacute A vagrave B thigrave suy ra coacute D

R2 Nếu coacute B thigrave suy ra coacute C

R3 Nếu coacute C vagrave D thigrave suy ra coacute E

Nếu ta coacute A vagrave B thigrave chuacuteng ta suy ra được D từ R1 vagrave suy ra C từ R2 Với D vagrave C đatilde được suy ra ở trecircn giờ chuacuteng ta suy ra được E từ R3

Viacute dụ thực tế

Giả sử muốn biết magraveu của một con vật nuocirci tecircn lagrave Fred biết rằng noacute kecircu ộp ộp vagrave ăn ruồi

Coacute tập 4 luật ban đầu như sau

R1 Nếu X kecircu ộp ộp vagrave ăn ruồi thigrave X lagrave con ếch

R2 Nếu X kecircu chiecircm chiếp vagrave biết hoacutet thigrave X lagrave con chim

R3 Nếu X lagrave con ếch thigrave X coacute magraveu xanh

R4 Nếu X lagrave con chim thigrave X coacute magraveu vagraveng

74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia

Expert system shells lagrave một tập caacutec goacutei phần mềm vagrave caacutec cocircng cụ dugraveng để phaacutet triển caacutec hệ chuyecircn gia

Những Expert system shells đầu tiecircn thường rất rườm ragrave Mặc dugrave vậy noacute vẫn giuacutep cho người sử dụng sẽ khocircng phải bắt đầu lại từ đầu khi xacircy dựng một hệ chuyecircn gia mới

Những shell hiện đại bao gồm hai mocirc-đun chiacutenh lagrave cocircng cụ xacircy dựng một tập quy tắc vagrave mocirc tơ suy diễn

Xacircy dựng hệ chuyecircn gia

Bước 1 xacircy dựng mocirc higravenh bagravei toaacuten xaacutec định vấn đề nhiệm vụ magrave hệ thống sẽ thực hiện Caacutec dạng bagravei toaacuten cần hệ chuyecircn gia

Bagravei toaacuten diễn giải (InterPretation)

Bagravei toaacuten dự baacuteo (Prediction)

Bagravei toaacuten chuẩn đoaacuten (Diagnose)

Bagravei toaacuten gỡ rối (Debugging)

Bagravei toaacuten thiết kế

Tương tự như một dự aacuten phần mềm để xacircy dựng một hệ chuyecircn gia cần phải coacute caacutec yếu tố về nhacircn lực tagravei nguyecircn vagrave thời gian Những yếu tố nagravey ảnh hưởng đến giaacute thah của một hệ chuyecircn giaTrong phần nagravey cacircu hỏi thường được đặt ra lagrave tại sao cần phải xacircy dựng một hệ chuyecircn giaTrước khi bắt đầu phải xaacute định rotilde bagravei toaacuten đạt ra lagrave jiAi lagrave chuyecircn giaAi lagrave người sử dụng

1 Diễn giải (InterPretation) Nghiecircn cứu 1 vấn đề -gt Dựa trecircn những biểu hiện thuộc tiacutenh đặc trưng becircn ngoagravei -gt Tư vấn

(hoặc đưa ra kết luận hay mocirc tả dễ hiểu từ tập dữ liệu thocirc)

2 Bagravei toaacuten dự baacuteo (Prediction) Coacute thể dự đoaacuten được hagravenh vi kết quả dựa trecircn caacutec hiện tượng -gt dự baacuteo

VD Dự baacuteo thời tiết động đấthellip

3 Bagravei toaacuten chẩn đoaacuten (Diagnoss) Xaacutec định caacutec lỗi caacutec bộ phận hỏng hoacutec của hệ thống dựa trecircn caacutec dữ liệu quan saacutet được

4 Bagravei toaacuten gỡ rối (Debugging) Mocirc tả caacutec phương phaacutep khắc phục hệ thống khi gặp sự cố

5 Bagravei toaacuten thiết kế Lựa chọn cấu higravenh caacutec đối tượng nhằm thoả matilden một số ragraveng buộc nagraveo đoacute

6 Giảng dạy Phần mềm dạy học coacute thể chuẩn đoaacuten vagrave sủa lỗi của học sinh trong quaacute trigravenh học tập

Để xaacutec định đuacuteng bagravei toaacuten magrave chuacuteng ta cần giải quyết thigrave phải trả lời đc một số cacircu hỏi

- cần hệ chuyecircn gia

Bước 2 thu thập tri thức lựa chọn cocircng cụ vagrave aacutep dụng

Trong bước thu thập tri thức vấn đề quan trọng lagrave lựa chọn chuyecircn gia những người magrave sẽ đoacuteng goacutep tri thức cho hệ thống Thocircng thường trong suốt quaacute trigravenh phaacutet triển thigrave chuyecircn gia được xem như một thagravenh viecircn của đội phaacutet triển

Hiện nay coacute rất nhiều cocircng cụ để xacircy dựng một hệ chuyecircn gia Phổ biến nhất lagrave JESS CLIPS vagrave OPS5

Bước 3 Thiết kế cơ sở tri thức thiết kế hệ thốngTri thức được biểu diễn trường minh trong cơ sở tri thức

Caacutec chuyecircn gia vagrave kỹ sư tri thức sẽ đối thoại với nhau bằng caacutec kỹ thuật đối thoại Suy diễn (SD) bảng Mocirc higravenh hoacutea SD quy nạp phacircn loại

Vấn đề bagraveo trigrave vagrave phaacutet triển

Caacutec hệ chuyecircn gia đogravei hỏi phải bảo trigrave vagrave phaacutet triển nhiều hơn so với caacutec hệ thống khaacutec Phải thường xuyecircn bổ sung tri thức mới vagrave thay đổi caacutec tri thức cũ để đổi mới hệ chuyecircn gia

Thu thập vagrave khắc phục lỗi do người sử dụng phaacutet hiện để kịp thời khắc phục những sai soacutet của hệ chuyecircn gia

75 Lợi iacutech vagrave hạn chế của caacutec hệ chuyecircn gia

Một số lợi iacutech chiacutenh

Thời gian trả lời hợp lyacute bằng hoặc nhanh hơn so với chuyecircn gia (người) để đi đến cugraveng một quyết định Hệ chuyecircn gia lagrave một hệ thống thời gian thực (real time system)

Khả năng trả lời với mức độ tinh thocircng bằng hoặc cao hơn so với chuyecircn gia (người) trong cugraveng lĩnh vực

Hệ chuyecircn gia giuacutep cho hiệu quả lagravem việc tăng bằng việc sử dụng tập caacutec luật một caacutech nhanh choacuteng magrave ko bị nhầm lẫn chuyecircn gia lagrave người coacute thể quecircn đi một số tri thức cơ sở lyacute luậ nhưng HCG thigrave ko

Quyết định của một người chuyecircn gia coacute thể bị thay đổi vagrave ko coacute tiacutenh thống nhất như quyết định của một hệ chuyecircn gia tạo ra

Hệ chuyecircn gia giuacutep cho người sử dụng coacute thể trau dồi sự hiểu biết trecircn lĩnh vuej cụ thể magrave noacute giải quyết hỗ trợ người ra quyết định coacute trigravenh độ như 1 chuyecircn gia trong quaacute trigravenh gia quyết định

Kiến thức của rất nhiều chuyecircn gia về một lĩnh vực nagraveo đoacute được đưa vagraveo hệ chuyecircn gia lagravem cho CSTT cuat HCG phong phuacute vagrave rộng lớn hơn rất nhiều

HCG giải thiacutech caacutec bước suy luận một caacutech dễ hiểu nhất quaacuten luacutec nagraveo cũng coacute thể sử dụng ko như chuyecircn gia con người

Hạn chế của caacutec hệ chuyecircn gia

Nhược điểm lớn nhất của hệ chuyecircn gia lagrave những yacute kiến chuyecircn mocircn thường rất khoacute matilde hoacutea vagrave giải neacuten

Hệ chuyecircn gia khocircng coacute khả năng tự học tự cập nhật kiến thức mới như caacutec chuyecircn gia magrave cần phải được matilde hoacutea lại khi noacute được cập nhật

Hệ chuyecircn gia khocircng thể nhận ra được vấn đề khocircng nằm trong miền kiến thức của hệ thống

Chương 8 Tri thức vagrave tiếp nhận

1 Bao gồm caacutec vấn đề

Dữ liệu thực tế đo lường hoặc quan saacutet coacute hoặc khocircng coacute bối cảnh

Thocircng tin dữ liệu được tổng hợp một caacutech hữu iacutech để giải quyết những khoacute khăn trong việc đưa ra quyết định

Tri thức bao gồm caacutec ứng dụng quy tắc thocircng tin hướng dẫn của người ra quyết định

2 Những caacutei nhigraven về tri thức

Đại diện lagravem thế nagraveo để diễn tả tri thức viacute dụ như một quyển saacutech khocircng phải lagrave tri thức nhưng noacute lại lagrave một đại diện của tri thức

Sản xuất tri thức lagrave một tập hơp của hagraveng tồn kho coacute thể được sản xuất cũng như mua lại

Tri thức lagrave 1 trong 6 trạng thaacutei của hệ thống

1Dữ liệu 2Thocircng tin 3Cấu truacutec thocircng tin 4Sự thấu hiểu 5Yacute kiến 6 Quyết định

3 Caacutec loại tri thức Phổ biến mocirc tả dữ liệu thocircng tin thủ tục mọi thứ lagravem như thế nagraveo lập luận chiacutenh saacutech hoặc caacutec quy tắc

4 Thu thập Tri thức hệ chuyecircn gia Hầu hết caacutec phương phaacutep đều bắt đầu với mocirc higravenh của caacutec taacutec vụ trong đoacute

hệ chuyecircn gia được xacircy dựng Trong đoacute mocirc tả về caacutec lĩnh vực được tạo ra Caacutec kỹ sư sử dụng caacutec mocirc higravenh giả thuyết vagrave nhận thức về quaacute trigravenh phacircn

tiacutech để gợi ra caacutech giải quyết vấn đề về tri thức từ caacutec chuyecircn gia

5 Caacutec chiều của thu thập tri thức KE- driven caacutec kỹ sư trao đổi trực tiếp với caacutec chuyecircn gia Expert-driven Caacutec chuyecircn gia trực tiếp đưa chuyecircn mocircn của họ vagraveo hệ

thống maacutey tiacutenh Machine-driven Sử dụng caacutec cocircng cụ suy luận để triacutech xuất tri thức từ một

tập caacutec viacute dụ

6 Kỹ thuật thu thập tri thức Trao đổi gồm 2 loại cơ bản lagrave coacute cấu truacutec(coacute kịch bản) vagrave khocircng coacute cấu

truacutec( đối thoại trực tiếp) Giao thức phacircn tiacutech bằng lời Khi caacutec chuyecircn gia thực hiện một cocircng việc

của họ thigrave một bản ghi về cocircng việc đoacute được thực hiện Caacutec kỹ sư sẽ xacircy dựng mocirc higravenh cho những gigrave được ghi lại trong bản ghi

Phương phaacutep sagraveng lọc caacutec chuyecircn gia so saacutenh caacutec nhoacutem liecircn tiếp trong ba đối tượng vagrave cho biết tại sao nhoacutem thứ hai lại khaacutec nhoacutem thứ ba

7 Thu thập tri thức từ nhiều nguồn Thu thập tri thức từ nhiều nguồn lagrave cần thiết để coacute được đầy đủ caacutec tri thức

cho một vấn đề quan điểm yacute kiến traacutei ngược nhau thường phaacutet sinh Phương phaacutep đồng thuận sẽ giuacutep giải quyết được vấn đề macircu thuẫn Kỹ thuật phacircn tiacutech Meta lagrave kỹ thuật được aacutep dụng trong caacutec trường hợp

khaacutec Caacutech tiếp cận bằng định lượng đogravei hỏi caacutec kỹ sư cần cacircn nhắc yếu tố đầu vagraveo của caacutec chuyecircn gia khaacutec nhau

8 Xaacutec nhận hợp lệ vagrave kiểm tra tri thức Một khi thu thập tri thức noacute phải được đaacutenh giaacute về khả năng sử dụng vagrave độ

chiacutenh xaacutec Hai vấn đề cụ thể lagrave hiệu lực của những kiến thức vagrave kiểm tra việc xacircy dựng cơ sở của tri thức

Cần xaacutec nhận xem liệu hệ thống coacute thể hoạt động ở mức độ tối thiểu khocircng

Xaacutec minh liecircn quan đến việc so saacutenh từng chi tiết kỹ thuật của hệ thống những gigrave đatilde được thực hiện cuối cugraveng

9 Một số caacutec biện phaacutep xaacutec nhận Độ chiacutenh xaacutec Khả năng thiacutech nghi Mức độ đầy đủ Bề rộng Độ sacircu Hiệu lực Tổng quan Chiacutenh xaacutec Hiện thực Độ tin cậy Tiacutenh hữu dụng Mức độ

Chương 9 Học maacutey

1 Logic mờ vagrave ngocircn ngữ mờ(Fuzzy Logic and Linguistic Ambiguity)

Ngocircn ngữ tự nhiecircn gồm những khaacutei niệm mơ hồ vagrave khocircng chiacutenh xaacutectruyền tải ngữ nghĩa thocircng qua tiacutenh xấp xỉkhocircng rotilde ragraveng

Những xấp xỉ nagravey giuacutep con người coacute thể truyền tải hết được yacute nghĩa nhưng maacutey thigrave khocircng hiểu

Lagravem sao biểu diễn caacutec tri thức sử dụng caacutec khaacutei niệm khocircng rotilde ragraveng(mờ) hoặc khocircng chiacutenh xaacutec

2 Khaacutei niệm cơ bản của logic mờ tập mờ lagrave những tập hợp khocircng coacute một giới hạn rotilde Mỗi phần tử của noacute chỉ

chứa một mức độ hagravem liecircn thuộc của từng phần tử Vigrave vậy tập mờ khocircng giống như tập cổ điển Tập mờ coacute thể kết hợp với nhau qua những luật mờ magrave đặc trưng cho những hagravenh động trạng thaacutei vagrave thuộc tiacutenh của logic mờ được tận dụng khi thực hiện một bộ điều khiển mờ

Logic mờ dựa trecircn yacute tưởng mỗi phần tử thuộc vagraveo một tập hợp ở một mức độ nagraveo đấy

Locircgic mờ cho pheacutep độ liecircn thuộc (microA )coacute giaacute trị trong khoảng (01) Locircgic mờ coacute thể được coi lagrave mặt ứng dụng của lyacute thuyết tập mờ để xử lyacute caacutec

giaacute trị trong thế giới thực cho caacutec bagravei toaacuten phức tạp

3 So saacutenh tiacutenh đuacuteng đắn logic mờ vagrave xaacutec suất Xaacutec suất thigrave đề cập đến khả năng xảy ra một biến cố hay một điều gigrave đoacute Logic mờ đề cập đến cấp độ magrave đặc tiacutenh ở hiện tại

o viacute dụ1 người coacute chiều cao 6 feet thigrave coacute cấp độ lagrave 05 về chiều cao

4 Ưu điểm của logic mờ Caacutech tiếp cận rất tự nhiecircnkhocircng phức tạp Coacute thể mocirc higravenh hoacutea caacutec hagravem phi tuyến tugravey yacute phức tạp

Coacute thể tận dụng được kinh nghiệm từ những chuyecircn gia hagraveng đầu trong mọi lĩnh vực

Logic mờ được xacircy dựng dựa trecircn ngocircn ngữ tự nhiecircnNền tảng của logic mờ lagrave dựa trecircn cơ sở giao tiếp của con người

5 Nhược điểm của logic mờ Trong 1 hệ thống phức tạpsử dụng logic mờ coacute thể trở thagravenh trở ngại cho

việc xaacutec thực độ tin cậy của hệ thống Cơ chế lập luận mờ khocircng thể học hỏi từ những lỗi sai

6 Mạng noron nhacircn tạo(ANN) Mạng noron nhacircn tạo lagrave một mocirc phỏng xử lyacute thocircng tinđược nghiecircn cứu ra

từ hệ thống thần kinh của sinh vậtgiống như bộ natildeo để xử lyacute thocircng tin ANNs lagrave chương trigravenh dựa trecircn maacutey tiacutenh đơn giản coacute chức năng lagrave một mocirc

higravenh bagravei toaacuten khocircng gian dựa trecircn thử nghiệm vagrave baacuteo lỗi

7 Học từ kinh nghiệm Tiến trigravenh Một mẫu dữ liệu được biểu diễn như một mạng lưới noronANN ldquodự

đoaacutenrdquo 1 đầu radự đoaacuten được so saacutenh với giaacute trị thực tế hoặc giaacute trị chiacutenh xaacutecNếu đoaacuten được chiacutenh xaacutec thigrave khocircng coacute hagravenh động nagraveo được thực hiện

Nếu dự đoaacuten sai ANN kiểm tra lại vagrave xaacutec định lại thocircng số để điều chỉnh Một mẫu dữ liệu khaacutec được biểu diễn vagrave quaacute trigravenh nagravey được lặp lại

8 Nguyecircn tắc cơ bản của cocircng nghệ nơron Caacutec yếu tố xử lyacute cơ bản trong hệ thống thần kinh của con người lagrave tế bagraveo

thần kinhMạng lưới của tế bagraveo nagravey lagrave liecircn kết với nhau nhận được thocircng tin từ caacutec cảm biến trong mắt taihellip

Thocircng tin nhận được bởi tế bagraveo thần kinh hoặc lagrave sẽ kiacutech thiacutech noacute(sẽ được chuyển qua 1 thocircng điệp dọc theo mạng lưới) hoặc lagrave sẽ ngăn cản noacute(ngăn cản dograveng thocircng tin)

Độ nhạy coacute thể thay đổi qua thời gian hoặc sau khi coacute được kinh nghiệm

9 Cấu truacutec mạng Một ANN gồm 3 lớp cơ bản

Lớp đầu vagraveo nhận dữ liệu Lớp becircn trong hoặc lagrave lớp ẩn xử lyacute dữ liệu Lớp đầu ra chuyển tiếp kết quả cuối cugraveng của mạng

10Mạng nơ ron Thường coacute nhiều đầu vagraveo mỗi đầu vagraveo với mức ảnh hưởng vagrave tầm quan

trọng riecircng của noacute Một đầu vagraveo quan trọng coacute thể được sử dụng để khuếch đại đầu ra caacutec hagravem trạng thaacutei tổng hợp caacutec trọng số của caacutec yếu tố

đầuvagraveo khaacutec nhauvagraveo một giaacute trị duy nhất Caacutec hagravem chuyển giao xử lyacute caacutec giaacute trị trạng thaacutei vagrave tạo đầu ra

11Huấn luyện mạng nơ ron Trong mocirc higravenh coacute giaacutem saacutetANN được đến so saacutenh dự đoaacuten của chiacutenh

noacute với thocircng tin phản hồi coacute chứa caacutec kết quả mong muốn ANN sẽ phải tigravem caacutech thay đổi caacutec tham số becircn trong củamigravenh (caacutec trọng số vagrave caacutec ngưỡng) để tạo necircn một aacutenh xạ coacute khả năng aacutenh xạcaacutec đầu vagraveo thagravenh caacutec đầu ra mong muốn Sự thay đổi nagravey được tiến hagravenh nhờ việc so saacutenh giữa đầu ra thực sự vagrave đầu ra mong muốn

Trong mocirc higravenh khocircng coacute giaacutem saacutetANN nhận được dữ liệu vagraveo nhưng khocircng phải coacute bất kỳ thocircng tin phản hồi về kết quả mong muốn

Phần lớn caacutec ứng dụng nằm trong vugraveng của caacutec bagravei toaacuten ước lượng như mocirc higravenh hoacuteathống kecirc neacuten lọc phacircn cụm

12Lợi iacutech Liecircn kết với mạng noron Traacutenh caacutech lập trigravenh tường minh Giảm nhu cầu của chuyecircn gia ANNs thigrave thiacutech nghi với caacutec yếu tố đầu vagraveo thay đổi Khocircng cần thiết cho cơ sở tri thức tinh chế ANNs coacute tiacutenh động vagrave cải thiện với việc sử dụng Coacute khả năng xử lyacute dữ liệu khocircng chiacutenh xaacutec hoặc khocircng đầy đủ Cho pheacutep tổng quaacutet hoacutea từ thocircng tin cụ thể Cho pheacutep thu thập cảm giaacutec thocircng thường vagraveo miền giải quyết vấn đề

13Hạn chế của việc liecircn kết với mạng noron ANNs khocircng thể giải thiacutech được suy luận Bản chất hộp đen thường khiến cho vấn đề traacutech nhiệm vagrave độ tin cậy phaacutet

sinh lagrave khoacute khăn Lặp đi lặp lại quaacute trigravenh huấn luyện rất tốn thời gian Nguồn lực caacutec nhagrave phacircn tiacutech vagrave thiết kế coacute tay nghề cao vẫn lagrave đaacuteng lo

ngại Cocircng nghệ ANN thuacutec đẩy hạn chế của phần cứng hiện tại ANN yecircu cầu phải coacute sự tin tưởng ở đầu ra

14Giới thiệu về thuật toaacuten di truyền Cũng như mạng lưới thần kinh caacutec thuật toaacuten di truyền được dựa trecircn lyacute

thuyết sinh học Thuật toaacuten di truyền tigravem thấy nguồn gốc của chuacuteng trong caacutec lyacute thuyết

tiến hoacutea của chọn lọc tự nhiecircn vagrave thiacutech ứng với biến đổi khiacute hậu Kết quả thuật toaacuten di truyền lagrave từ giao phối 2 caacute thể trong quần thế để tạo

ra con caacutei đocirci khi tốt hơn so với bậc cha mẹ của chuacuteng 15Caacutec thagravenh phần cơ bản của thuật toaacuten di truyền

Toaacuten tử chọn lọc Caacutec caacute thể tốt được chọn lọc để đưa vagraveo thế hệ sau Sự chọn lọc nagravey căn cứ vagraveo độ thiacutech nghi với mocirci trường của mỗi caacute thể

Toaacuten tử lai gheacutep (crossover) Hai caacute thể cha vagrave mẹ trao đổi caacutec gen với nhau để tạo ra caacute thể con

Toaacuten tử đột biến (mutation) Một caacute thể thay đổi một số gen để biến đổi thagravenh một caacute thể mớiTất cả caacutec toaacuten tử trecircn khi thực hiện đều mang tiacutenh ngẫu nhiecircn

16Quaacute trigravenh cơ bản của một thuật toaacuten di truyền Khởi tạo

Đaacutenh giaacute quần thể

Lựa chọn NST thiacutech hợp nhất vagrave loại bỏ NST yếu nhất

Quy trigravenh giao nhau vagrave cải thiện quần thể

đột biến tiến trigravenh để khaacutem phaacute ra NST mới

17Ưu nhược điểm của việc kết hợp với thuật toaacuten di truyền Kiacutech thước quần thể lagrave 1 yếu tố quan trọng trong tốc độ của việc tigravem

kiếmnhưng noacute tương đối dễ dagraveng để dự đoaacuten tốc độ nagravey Giao nhau hoặc đột biến lagrave khocircng necircn đc sử dụng quaacute thường xuyecircn Luocircn coacute được iacutet nhất 1 giải phaacutep hợp lyacute Necircn coacute thể aacutep dụng chuacuteng cho caacutec vấn đề magrave chuacuteng ta khocircng coacute hướng

về caacutech giải quyết Sức mạnh của thuật toaacuten xuất phaacutet từ khaacutei niệm đơn giảnkhocircng phải từ

một thủ tục thuật toaacuten phức tạp 18Tương lai của học maacutey

Mạng lưới thần kinh nhacircn tạo vượt quaacute năng lực của con người trong caacutec trường hợp bị cocirc lập

Về mặt lyacute thuyếtmột maacutey tiacutenh coacute thể xử lyacute dũ liệu nhanh hơn hagraveng triệu lần so với 1 con người

May mắn thay cho chuacuteng tacon người tốt hơn nhiều khi magrave coacute được dữ liệumaacutey tiacutenh khocircng coacute 1 số thứ như lagrave 5 giaacutec quan

CHƯƠNG 10 KHO DỮ LIỆU

1 Kho dữ liệu Kho dữ liệu lagrave tuyển tập caacutec cơ sở dữ liệu tiacutech hợp hướng chủ đề được

thiết kế để trợ giuacutep cho một hệ hỗ trợ quyết định

Theo John Ladley Cocircng nghệ kho dữ liệu lagrave tập caacutec phương phaacutep kỹ thuật vagrave caacutec cocircng cụ coacute thể kết hợp hỗ trợ nhau để cung cấp thocircng tin cho người sử dụng trecircn cơ sở tiacutech hợp từ nhiều nguồn dữ liệu nhiều mocirci trường khaacutec nhau

Kho dữ liệu thường rất lớn tới hagraveng trăm GB hay thậm chiacute hagraveng Terabyte

2 Kho dữ liệu vận hagravenh (ODS) Một kho dữ liệu vận hagravenh Aacutep dụng kỹ thuật kho dữ liệu vagraveo caacutec hệ xử

lyacute giao taacutec lưu trữ dữ liệu cho một ứng dụng đặc thugrave Noacute đưa vagraveo kho dữ liệu một dograveng caacutec dữ liệu thocirc được thiết kế

3 So saacutenh

Kho dữ liệu vận hagravenh Kho dữ liệu

Dữ liệu theo chủ đề Dữ liệu theo chủ đề

Dữ liệu tiacutech hợp Dữ liệu tiacutech hợp

Dữ liệu thay đổi Dữ liệu khocircng thay đổi

Dữ liệu được cập nhật khi thay đổi

Dữ liệu giữ nguyecircn

Chỉ coacute dữ liệu hiện tạiDữliệu hiện tại vagrave dữ liệu lịch sử

Chu kỳ lagravem tươi dữ liệu ngắn Chu kỳ lagravem tươi dữ liệu dagravei

Chỉ coacute dữ liệu chi tiết Dữ liệu chi tiết vagrave dữ liệu tổng kết

Dugraveng cho caacutec quyết định ngắn hạn

Dugraveng cho hoạch định dagravei hạn

4 Kho dữ liệu cục bộ (Data Mart - DM)

Kho dữ liệu cục bộ lagrave CSDL coacute những đặc điểm giống với kho dữ liệu nhưng với quy mocirc nhỏ hơn vagrave lưu trữ dữ liệu về một lĩnh vực một chuyecircn ngagravenh

Data mart phụ thuộc Chứa những dữ liệu được lấy từ DW vagrave những dữ liệu nagravey sẽ được triacutech lọc vagrave tinh chế tiacutech hợp lại ở mức cao hơn để phục vụ một chủ đề nhất định của Datamart

Data mart độc lập Khocircng giống như Datamart phụ thuộc Data mart độc lập được xacircy dựng trước DW vagrave dữ liệu được trực tiếp lấy từ caacutec nguồn khaacutec nhau

5 Siecircu dữ liệu Metadata lagrave dữ liệu để mocirc tả dữ liệu Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột

một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi Metadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu

6 Mocirci trường kho dữ liệu Hệ thống của tổ chức vagrave kho cung cấp dữ liệu để xacircy dựng kho dữ liệu Trong quaacute trigravenh chuyển dữ liệu từ caacutec nguồn khaacutec nhau dữ liệu coacute thể

được lagravem sạch hoặc chuyển đổi vagrave vigrave thế DW được xem như lagrave một chuẩn cho việc lưu trữ

Đồng thời siecircu dữ liệu được ghi lại Cuối cugraveng DW hoặc siecircu thị coacute thể được sử dụng để tạo ra một kho dữ

liệu ldquocaacute nhacircnrdquo 7 Caacutec đặc điểm của kho dữ liệu

Đặc điểm Mocirc tả

Hướng chủ đề - DL tổ chức theo caacutech thức người dugraveng tham chiếu

Tiacutech hợp - Dữ liệu ldquosạchrdquo loại bỏ tiacutenh thiếu nhất quaacuten

Khocircng thay đổi - DL ldquochỉ đọcrdquo người dugraveng khocircng thay đổi được

Chuỗi thời gian - DL lagrave chuỗi thời gian khocircng phải lagrave trạng thaacutei hiện tại

Được tổng kết - DL vận hagravenhthao taacutec khi cần thiết

được kết hợp lại thagravenh dạng coacute thể dugraveng được cho quyết định

Kiacutech cỡ lớn hơn - Lưu giữ theo chuỗi thời gian tức lagrave giữ lại nhiều DL

Khocircng được chuẩn hoacutea - Coacute thể dư thừa DLSiecircu dữ liệu - Dữ liệu của dữ liệu được lưu trữNguồn dữ liệu - DL vận hagravenh (caacutec hệ sẵn coacute) cugraveng

với caacutec nguồn ngoagravei 8 Kho dữ liệu hướng chủ đề

Hướng chủ để coacute nghĩa lagrave kho dữ liệu được tổ chức xung quanh caacutec chủ đề chiacutenh như khaacutech hagraveng sản phẩm sản xuất Tập trung vagraveo việc mocirc higravenh hoacutea vagrave phacircn tiacutech dữ liệu cho caacutec nhagrave ra quyết định magrave khocircng tập trung vagraveo caacutec xử lyacute thocircng thường Cung cấp cho người dugraveng một khung nhigraven toagraven vẹn đơn giản vagrave đầy đủ về caacutec sự kiện quanh caacutec chủ đề

9 Dữ liệu trong DW được tiacutech hợp Dữ liệu trong kho dữ liệu được xacircy dựng bằng caacutech tổng hợp dữ liệu từ

nhiều nguồn khaacutec nhau vagrave caacutec nguồn coacute tổ chức khaacutec nhau Cơ sở dữ liệu caacutec file excel caacutec flat file hoặc caacutec raw file Khi đưa vagraveo kho dữ liệu caacutec dữ liệu được lagravem sạch vagrave tiacutech hợp dữ liệu nhằm đảm bảo tiacutenh nhất quaacuten của dữ liệu

10Kiến truacutec kho dữ liệu Tầng cơ sở dữ liệu hoạt động Tầng truy xuất thocircng tin Tầng truy xuất dữ liệu Tầng siecircu dữ liệu Tầng quản lyacute tiến trigravenh Tầng thocircng điệp của ứng dụng Tầng vật liacute của kho dữ liệu Tầng trigravenh diễn dữ liệu

11Higravenh trạng kho dữ liệu Kho dữ liệu ảo - người dugraveng cuối coacute thể truy cập trực tiếp đến kho dữ liệu

sử dụng caacutec cocircng cụ cho pheacutep ở tầng truy xuất dữ liệu Kho dữ liệu trung tacircm-1 cơ sở dữ liệu vật lyacute chứa tất cả dữ liệu cho một

vugraveng chuyecircn dụng nagraveo đoacute

Kho dữ liệu phacircn taacuten- Thagravenh phần được phacircn taacuten qua nhiều hệ cơ sở dữ liệu vật lyacute

12METADATA- Siecircu dữ liệu Định nghĩa Siecircu dữ liệu lagrave dữ liệu về dữ liệu Lagrave 1 lưu trữ dugraveng để

Miecircu tả kho dữ liệu tổng thể Nhận dạng kiểu kho dữ liệu Quản liacute quaacute trigravenh tiacutech hợp dữ liệu Quản liacute quaacute trigravenh cập nhật kho dữ liệu Quản liacute bảo mật

Lagrave chigravea khoacutea quyết định sự thagravenh cocircng của kho dữ liệu luocircn được thay đổi vagrave cập nhật theo sự phaacutet triển của kho dữ liệu

Dugraveng để quản liacute điều khiển kho dữ liệu Sự ra đời của kho dữ liệu như 1 cấu truacutec hỗ trợ ra quyết định siecircu dữ liệu

được xem như nguồn tagravei nguyecircn dữ liệu Siecircu dữ liệu lagrave trừu tượng Chuacuteng lagrave dữ liệu bậc cao cung cấp mocirc tả ngắn

gọn caacutec dữ liệu bậc thấp hơn 13Hoạt động của Siecircu dữ liệu

Siecircu dữ liệu rất cần thiết trong việc chuyển hoacutea thocircng tin trở thagravenh tri thức Lagrave chigravea khoacutea giuacutep chuacuteng ta xử lyacute được dữ liệu thocirc Viacute dụ một dograveng dữ liệu baacuten hagraveng 1023 K596 11121 agraveNoacute sẽ khocircng coacute nghĩa gigrave cho đến khi chuacuteng ta đưa vagraveo siecircu dữ liệu (thư

mục chứa dữ liệu) agrave cửa hagraveng 1023 sản phẩm K596 vagrave số tiền baacuten được lagrave 11121 đocirc la

14Sự cần thiết phải nhất quaacuten trong kho dữ liệu Kho dữ liệu được xacircy dựng cho lợi iacutech của những nhagrave phacircn tiacutech kinh

doanh caacutec nhagrave quản trị cho tất cả caacutec khu vực chức năng Trong cơ sở dữ liệu riecircng caacutec khu vực khaacutec nhau coacute thể định nghĩa vagrave lưu

trữ dữ liệu thocircng qua phiecircn bản của chiacutenh noacute Khi dữ liệu được lấy từ những vugraveng khaacutec nhau đoacute vagrave được đặt vagraveo kho dữ

liệu Việc chuyển đổi vagrave lagravem sạch caacutec tiến trigravenh sẽ đảm bảo noacute lagrave duy nhất được tiacutech hợp tại một mức của tổ chức

15Ragrave soaacutet lại dữ liệu ndash Thực thi siecircu dữ liệu

Bất kể cấu truacutec tự nhiecircn của 1 cacircu truy vấn thế nagraveo thigrave caacutec thagravenh phần của siecircu dữ liệu rất quan trọng đối với người ra quyết định

Bảng thuộc tiacutenh khoacutea được lưu trữ bởi kho dữ liệu Tập hợp dữ liệu được lấy từ đacircu Những chuyển đổi nagraveo được thực thi với việc lagravem sạch

16Siecircu dữ liệu lagrave gigrave Metadata - lagrave thocircng tin mocirc tả nội dung của cơ sở dữ liệu (CSDL) Metadata baacuteo cho người dugraveng biết thời gian cập nhật sau cugraveng của dữ liệu

định dạng vagrave mục điacutech sử dụng của noacute Những thocircng tin nagravey coacute thể hướng dẫn người dugraveng duyệt qua CSDL vagrave

giuacutep họ hiểu được yacute nghĩa vagrave ngữ cảnh của dữ liệu Trong CSDL metadata lagrave caacutec dạng biểu diễn khaacutec nhau của caacutec đối tượng

trong CSDL Trong CSDL quan hệ metadata lagrave caacutec định nghĩa của bảng cột CSDL

view vagrave nhiều đối tượng khaacutec Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột

một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi -gtMetadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu

Bảng chuyển đổi Ghi lại những chuyển đổi đatilde được thực hiện

Lịch sử thực thi Ghi lại những dữ liệu đatilde được

phacircn tiacutech

Higravenh thaacutei kết nốiGhi lại những dữ liệu được kết nối vagrave tần suất

17Aacutenh xạ thocircng thường của siecircu dữ liệu Bản ghi aacutenh xạ chuyển đổi bao gồm

Định danh của nguồn gốc Chuyển đổi thuộc tiacutenh Chuyển đổi thuộc tiacutenh vật lyacute Matilde hoacutea tham chiếu bảng chuyển đổi Đổi tecircn Đổi khoacutea Gaacuten giaacute trị cho thuộc tiacutenh mặc định Chọn logic cho caacutec nguồn nhiều giaacute trị Đổi thuật toaacuten

18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để

phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai

lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave

tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec

Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm

Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo

19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua

caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau

SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được

Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra

một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức

Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ

Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ

Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech

CHƯƠNG 11 KHAI PHAacute DỮ LIỆU

1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn

ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993

Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng

2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd

1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều

2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP

3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn

4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng

5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server

6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo

7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động

8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời

9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều

10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện

11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech

12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP

3 Xử lyacute phacircn tiacutech trực tuyến OLAP

MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave

dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu

ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave

thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu

HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave

ROLAP4 Khai phaacute dữ liệu

Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh

khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn

Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan

5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp

6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại

Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp

Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec

Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt

Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra

Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh

vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho

Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec

Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm

Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục

Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng

gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp

Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn

Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec

Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper

Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2

Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25

Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước

Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng

Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện

trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp

Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute

độ hỗ trợ ge ngưỡng minsup

độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan

Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn

Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết

Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu

MOLAP ROLAP HOLAP

Lưu trữ dữ liệu cơ sở

Khối Bảng quan hệ Bảng quan hệ

Lưu trữ thocircng tin tổng hợp

Khối Bảng quan hệ Khối

Hiệu suất thực hiện truy vấn

Nhanh nhất Chậm nhất Nhanh

Tiecircu thụ khocircng gian lưu trữ

Nhiều Thấp Trung bigravenh

Chi phiacute bảo trigrave Cao Thấp Trung bigravenh

Page 27: De cuong(1-11)

Sự phacircn xử

Hệ thocircng tin dựa trecircn vấn đề

Nemawashi

Kỹ thuật nhoacutem định danh

1-Mỗi người tham gia viết ra những yacute tưởng về những gigrave necircn quyết định

2-Lần lượt mỗi người tham gia trigravenh bagravey yacute tưởng của migravenh được ghi lại trecircn bảng Khocircng thảo luận ở đacircy

3-Sau khi tất cả caacutec yacute tưởng được trigravenh bagravey caacutec đại biểu coacute thể chất vấn những người khaacutec

4-Mỗi người tham gia bỏ phiếu cho mỗi yacute tưởng

Kỹ thuật Delphi

Về cơ bản tương tự như kỹ thuật nhoacutem định danh ngoại trừ những người khocircng bao giờ tham gia cuộc họp

Một cocircng cụ khảo saacutet được sử dụng để thu thập đầu vagraveo ban đầu từ caacutec thagravenh viecircn

Một cuộc khảo saacutet thứ hai được gửi đi với một bản toacutem tắt caacutec kết quả chung

Những bước lặp lại cho đến khi đạt được một sự đồng thuận hoặc nhigraven nhận của đa số

Sự phacircn xử(Arbitration )

Thiacutech hợp nhất khi caacutec thagravenh viecircn của MDM đại diện cho caacutec yếu tố đối lập

Những người tham gia đồng yacute rằng nếu lựa chọn thay thế hai becircn thỏa thuận khocircng được tigravem thấy thigrave một trọng tagravei viecircn becircn ngoagravei sẽ tham gia

Trọng tagravei sau đoacute lựa chọn thay thế ocircng hoặc xeacutet thấy thiacutech hợp nhất

Hệ thống thocircng tin dựa trecircn vấn đề (IBIS)

Lagrave một phương phaacutep lập luận cấu truacutec

Một đại diện cho IBIS lagrave một đồ thị với caacutec nuacutet vagrave caacutec liecircn kết

IBIS bắt đầu với lựa chọn của một nuacutet vấn đề gốc sau đoacute caacutec nuacutet vị triacute khaacutec nhau được liecircn kết với nuacutet gốc

Caacutec nuacutet vị triacute nagravey sau đoacute được đaacutenh giaacute dựa trecircn những lập luận gắn liền với chuacuteng

Nemawashi (được sử dụng rộng ratildei tại Nhật Bản)

1-Một hoặc nhiều thagravenh viecircn của MDM được chỉ định lagrave điều phối viecircnCaacutec điều phối viecircn sau đoacute chọn người tham gia cograven lại

2-Điều phối viecircn xacircy dựng một tổng hợp caacutec sự lựa chọn vagrave sau đoacute caacutec chuyecircn gia đaacutenh giaacute caacutec lựa chọn

3-Điều phối viecircn lựa chọn một sự lựa chọn dựa trecircn kết quả ở trecircn(ở 2)

4-Sự thay thế được luacircn chuyển điều phối viecircn tigravem kiếm sự đồng thuận thocircng qua sự thuyết phục vagrave đagravem phaacuten

5-Nếu đạt được sự đồng thuận điều phối viecircn cho lưu thocircng một tagravei liệu magrave mỗi thagravenh viecircn MDM để lại dấu hiệu trecircn đoacute

55Nơi lagravem việc ảo

Nhiều tổ chức trecircn toagraven thế giới kinh doanh bất động sản cho cocircng nghệ hợp taacutec

Cocircng việc được trở thagravenh một điều bạn lagravem hơn lagrave một nơi bạn đi

Những thay đổi lớn nhất mang lại bởi nơi lagravem việc ảo coacute thể lagrave về văn hoaacute hay xatilde hội hơn lagrave về cocircng nghệ

Chương 6 Hệ thống thocircng tin điều hagravenh

61 Yacute nghĩa của EIS- Hệ thống thocircng tin điều hagravenh

- EIS lagrave một dạng đặc biệt của DSS được thiết kế để hỗ trợ ra quyết định ở cấp cao nhất của một tổ chức

- Lagrave một hệ thống thocircng tin hỗ trợ nhu cầu lập kế hoạch vagrave đaacutenh giaacute của caacutec nhagrave quản lyacute điều hagravenh

- EIS coacute thể giuacutep một CEO coacute được bức tranh tổng thể chiacutenh xaacutec nhất về caacutec hoạt động vagrave một bản toacutem tắt những gigrave magrave đối thủ cạnh tranh đang lagravem

- Caacutec hệ thống nagravey noacutei chung hoạt động dễ dagraveng vagrave trigravenh bagravey thocircng tin theo những caacutech dễ hiểu để việc tiếp thu được nhanh choacuteng (biểu đồ đồ thịhellip)

(Tagravei liệu thecircm EIS lagrave những loại hệ thống lagrave rất phức tạp trong tự nhiecircn Coacute thể noacutei hệ thống nagravey cũng cung cấp cho caacutec nhagrave quản lyacute với caacutec thiết bị coacute khả năng ra quyết định bằng caacutech sử dụng của noacute Hệ thống nagravey hoạt động trong điều kiện như vậy quan trọng như trong caacutec hệ thống khaacutec khocircng hỗ trợ Khả năng lưu trữ dữ liệu nặng lagravem cho noacute lyacute tưởng để được thocircng qua khocircng chỉ bởi caacutec doanh nghiệp lớn magrave cograven bởi caacutec doanh nghiệp nhỏ hơn Nhigraven chung hệ thống nagravey lagrave dagravenh cho caacutec nhacircn viecircn cấp cao hỗ trợ thagravenh thạo trong việc đưa ra caacutec quyết định quan trọng)

Caacutec phiecircn EIS tiecircu biểu- Phiecircn lagravem việc coacute thể bắt đầu với một baacuteo caacuteo về tigravenh higravenh tagravei chiacutenh vagrave kinh

doanh của một cocircng ty caacutec chỉ số hoạt động quan trọng được hiển thị rotilde ragraveng- EIS sẽ cho pheacutep caacutec giaacutem đốc điều hagravenh coacute thể đi sacircu vagraveo dữ liệu từ những con

số bất kỳ magrave noacute hỗ trợ- Việc điều hagravenh coacute thể lựa chọn một mức độ chi tiết ( VD danh số baacuten hagraveng) nếu

như cần điều tra thecircm- Lagrave một phương phaacutep tiếp cận coacute thể giuacutep việc ra quyết định tốt hơn

Những điều magrave EIS ko coacute- EIS khocircng phải lagrave sự thay thế cho caacutec hệ thống dựa trecircn caacutec maacutey tiacutenh khaacutec EIS

thực sự chỉ cung cấp dữ liệu cho caacutec hệ thống nagravey- Noacute khocircng thể biến caacutec bộ hệ điều hagravenh của maacutey tiacutenh thagravenh những ldquochuyecircn viecircn

giỏirdquo- Coacute thể được viacute một caacutech cao hơn như lagrave một trợ lyacute đaacuteng tin cậy coacute thể được gọi

đến bất khi nagraveo vagrave mỗi khi cần thiết

Tagravei liệu thecircm Sự khaacutec nhau giữa EIS vagrave DSS+ EIS thiết kế để hỗ trợ những người điều hagravenh cấp cao giuacutep họ khaacutem phaacute caacutec vấn đề vagrave caacutec cơ hội DSS hỗ trợ những nười phacircn tiacutech cố gắng trả lời cacircu hỏi caacutei gigrave coacute thể lagravem cugraveng với một cơ hội hoặc một vấn đề

Chiều EIS DSSNhững người sử dụng thocircng thường

Duyệt dữ liệu đi xuống truy xuất trạng thaacutei

Hỗ trợ phacircn tiacutech vagrave quyết định

Sự thuacutec đẩy Tiacutenh thiacutech hợp Tiacutenh hiệu quảỨng dụng Queacutet mocirci trường đaacutenh giaacute

hiệu suất nhận dạng caacutec vấn đề vagrave caacutec cơ hội

Caacutec quyết định quản lyacute trecircn caacutec lĩnh vực đa dạng

Hỗ trợ quyết định Caacutec chiacutenh saacutech caacutec quyết định khocircng coacute cấu truacutec ở mức cao vagrave hỗ trợ giaacuten tiếp

Hỗ trợ caacutec quyết định lặp lại caacutec quyết định khocircng thể đoaacuten trước ra quyết định khocircng coacute cấu truacutec vagrave baacuten cấu truacutec

Loại thocircng tin Caacutec thocircng tin tin tức thocircng tin becircn ngoagravei về khaacutech hagraveng đối thủ cạnh tranh mocirci trường caacutec baacuteo caacuteo theo yecircu cầu vagrave định thời về caacutec hoạt động becircn trong

Caacutec thocircng tin hỗ trợ caacutec tigravenh huống đặc biệt

Sử dụng coacute nguyecircn tắc

Dograve theo vết vagrave điều khiển nhận dạng cơ hội

Hoạch định tổ chức phacircn nhoacutem vagrave điều khiển

Khả năng phugrave hợp với những người sử dụng caacute nhacircn

Thiết kế loại ra quyết định cho mỗi người điều hagravenh caacute nhacircn bằng nhiều lựa chọn đầu ra

Cho pheacutep caacutec đaacutenh giaacute caacute nhacircn caacutec khả năng what-if lựa chọn loại hộp hội thoại

Đồ họa Phải coacute Lagrave một phần quan trọng của nhiều DSS

Thacircn thiện người sử dụng

Phải coacute Phải coacute nếu khocircng coacute người sử dụng trung gian

Xử lyacute thocircng tin Lọc neacuten thocircng tin dograve theo vết dữ liệu vagrave thocircng tin quan trọng

EIS kiacutech thiacutech caacutec cacircu hỏi caacutec cacircu trả lời bằng caacutech sử dụng DSS vagrave phản hồi lại EIS

Hỗ trợ caacutec thocircng tin chi tiết

Truy xuất thường xuyecircn caacutec mức chi tiết của bất kỳ thocircng tin tổng hợp nagraveo (duyệt dữ

Coacute thể coacute trong DSS nhưng khocircng thường

liệu chi tiết)Cơ sở mocirc higravenh Caacutec chức năng coacute sẵn bị hạn

chếLagrave điểm cốt lotildei của DSS

Cấu truacutec Theo người baacuten sản phẩm hoặc theo caacutec chuyecircn gia hệ thống thocircng tin

Theo người sử dụng hoặc caacute nhacircn hoặc caacutec chuyecircn gia từ caacutec trung tacircm thocircng tin hoặc phograveng ban hệ thống thocircng tin

Phần cứng Mainframe caacutec trạm RISC mạng LANs hoặc caacutec hệ thống phacircn bố

Mainframe caacutec trạm RISC caacutec maacutey PC hoặc caacutec hệ thống phacircn bố

Bản chất caacutec goacutei phần mềm

Truy xuất tương taacutec dễ dagraveng đến nhiều cơ sở dữ liệu truy xuất trực tuyến caacutec khả năng DBMS phức tạp caacutec liecircn kết phức tạp

Caacutec khả năng tiacutenh toaacuten lớn caacutec ngocircn ngữ mocirc higravenh mocirc phỏng ứng dụng vagrave caacutec bộ tạo DSS

Bản chất caacutec thocircng tin

Trigravenh bagravey thocircng tin được phaacutet sinh trước về quaacute khứ vagrave hiện tại tạo caacutec thocircng tin mới về quaacute khứ hiện tại tương lai

Tạo thocircng tin mới về quaacute khứ hiện tại tương lai

62 Lịch sử EIS- EIS xuất hiện lần đầu tiecircn tại MIT vagraveo những năm 1970

- Những EIS đầu tiecircn được phaacutet triển bởi caacutec doanh ngiệp lớn sẵn sagraveng chấp nhận rủi ro để đạt được lợi thế cạnh tranh

- Vagraveo những năm 1980 caacutec nhagrave cung cấp đatilde phaacutet triển một số cơ sở khaacutech hagraveng rộng vagrave cocircng nghệ EIS được tiếp tục phaacutet triển cho đến ngagravey nay

(Tagravei liệu thecircm Sử dụng DSSEIS cho phaacutet triển bền vững + Một số nghiecircn cứu đatilde được tiến hagravenh để kiểm tra việc thực hiện của EIS trong khu vực cocircng cộng vagrave chiacutenh phủ caacutec nước tổ chức kể từ khi chuacuteng được phaacutet triển theo định hướng lợi nhuận cho caacutec cocircng ty tư nhacircn (Hasan vagrave Hasan năm 1997) Theo một nghiecircn cứu tiến hagravenh tại Mỹ ở hơn 300 cocircng ty kết quả cho thấy sự khaacutec biệt của EIS giữa tư nhacircn vagrave chiacutenh phủ một số kết quả thuacute vị được phaacutet hiệnViacute dụ khoacute khăn hơn để chuyển tiền từ một tagravei khoản khaacutec trong một EIS của chiacutenh phủ cũng lagrave khoacute khăn hơn để biện giải thiacutech cho những chi phiacute phaacutet triển EIS của chiacutenh phủ Một nghiecircn cứu khaacutec được tiến hagravenh ở Australia

cho thấy rằng EIS cung cấp cho quản lyacute một higravenh ảnh chiacutenh xaacutec hơn về tổ chức thực hiện vagrave cung cấp hỗ trợ cho caacutec lợi iacutech chiến lược cải thiện khocircng chỉ cho caacutec nhagrave quản lyacute nhưng cograven cho phần cograven lại của tổ chức Dựa trecircn caacutec hệ thống được thiết kế cho caacutec cocircng ty tư nhacircn với một caacutech rotilde ragravengxaacutec định mục tiecircu EIS lagrave thiacutech hợp cho caacutec tổ chức cocircng cộng hiện đại nhưng cần phải được linh hoạt hơn vagrave kết thagravenh chugravem một phạm vi rộng hơn khả năng vagrave phương tiện hơn so với khu vực tư nhacircn ban đầu theo định hướng sản phẩm (Hasan vagrave Hasan năm 1997) Điều nagravey coacute thể lagrave do thực tế rằng caacutec hoạt động khu vực cocircng lagrave bắt buộc coacute taacutec động rộng phải đaacutep ứng sự mong đợi duy nhất cocircng cộng thường coacute mục tiecircu mơ hồ vagrave macircu thuẫn iacutet quyền tự chủ vagrave kiểm soaacutet việc ra quyết định vagrave nhacircn viecircn lagrave khoacute khăn hơn (Watson vagrave Carte2000) + Toacutem lại EIS lagrave một khaacutei niệm thagravenh cocircng noacute phaacutet triển qua nhiều năm tuy nhiecircn EIS khắc phục khiếm khuyết của migravenh bằng caacutech tiến hagravenh nghiecircn cứu liecircn tục)

63 Tại sao những người điều hagravenh hagraveng đầu lại khaacutec nhau- Họ lagrave những doanh nghiệp theo định hướng coacute suy nghĩ

- Coacute một khoảng khocircng gian rộng để kiểm soaacutet

- Họ chịu traacutech nhiệm cho việc thiết lập chiacutenh saacutech

- Họ đại diện cho tổ chức mocirci trường becircn ngoagravei

- Hagravenh động của họ tạo ra những kết quả đaacuteng kể về tagravei chiacutenh vagrave con người

Tần số caacutec hoạt động điều hagravenh- Xử lyacute xaacuteo trộn 42

- Hoạt động kinh doanh 32

- Phacircn bổ nguồn lực 17

- Đagravem phaacuten 3

- Những điều khaacutec 6

Handling Disturbances 42

Entrepreneurial Activites 32

Resource Allocation 17

Negotiation 3

Other 6

Những thocircng tin điều hagravenh cần thiết- Quản lyacute xaacuteo trộn coacute thể yecircu cầu sự chuacute yacute xung quanh đồng hồ

- Hoạt động kinh doanh yecircu cầu điều hagravenh để dự đoaacuten những thay đổi trong mocirci trường

- Nhiệm vụ phacircn bổ tagravei nguyecircn yecircu cầu lựa chọn người quản lyacute vagrave caacutec nguồn lực hạn chế được triển khai

- Đagravem phaacuten yecircu cầu cập nhật thocircng tin từng phuacutet để coacute thể xacircy dựng được sự đồng thuận

Caacutec loại thocircng tin điều hagravenh- Hệ thống kế toaacuten coacute liecircn quan đến việc tiacutenh toaacuten thu nhập hoạt động cho caacutec lĩnh

vực cụ thể lagrave quan trọng hơn so với caacutec hệ thống kế toaacuten truyền thocircng- Thocircng tin về thị trường khaacutech hagraveng cung cấp giaacute trị trong việc quyết định chiến

lược- Caacutec thocircng tin cần thiết thường được truyền đi trecircn một số hệ thống maacutey tiacutenh vagrave

nằm trong toagraven tổ chức- Caacutec thocircng tin được sử dụng thường lagrave ngắn hạn vagrave dễ thay đổi

Phương thức để xaacutec định thocircng tin cần thiết

Rockart xaacutec định được năm phương thức cơ bản để xaacutec định thocircng tin cần thiết

- Phương thức dựa trecircn kết quả- Phương thức rỗng- Phương thức chỉ số khoacutea- Phương thức tổng hợp nghiecircn cứu- Phương thức dựa vagraveo nhacircn tố then chốt dẫn đến thagravenh cocircng

64 Thagravenh phần EIS

- Sản phẩm EIS đầu tiecircn được phaacutet triển để sử dụng trecircn maacutey tiacutenh cấu higravenh cao nhưng caacutec sản phẩm hiện nay nhằm mục tiecircu lagrave nền tảng ClientServer

- Những nền tảng linh hoạt hơn coacute thể thiacutech ứng với thay đổi trong tổ chức vagrave cocircng nghệ

- Sử dụng dữ liệu thời gian thực dẫn đến quyết định nhanh hơn nhiều thocircng tin hơn

Thagravenh phần phần cứng- Một EIS khocircng đogravei hỏi coacute phần cứng cụ thể hoặc duy nhất nagraveo- Chigravea khoacutea của vấn đề lagrave để đảm bảo rằng caacutec thagravenh phần của EIS tối ưu hoacutea vagrave

phugrave hợp với tagravei nguyecircn maacutey tiacutenh của tổ chức- Hệ thống nagravey phải được cấu higravenh để caacutec nguồn tagravei nguyecircn phugrave hợp với những

người điều hagravenh chuacuteng

Thagravenh phần phần mềm- Traacutei ngược với phần cứng phần mềm thường được chuyecircn mocircn hoacutea cao cho caacutec

bagravei toaacuten về miền- Sự chuyecircn mocircn hoacutea nagravey thường đạt được bằng caacutech sử dụng thagravenh phần off-the-

shelf cho toagraven bộ EIS vagrave caacutec mocirc-đun tugravey chỉnh để đaacutep ứng nhu cầu cụ thể- Lotus Notes lagrave một viacute dụ điển higravenh Noacute coacute thể được sử dụng một migravenh hoặc coacute

thể phục vụ becircn thứ ba mocirc-đun plug-in

Cocircng nghệ EIS hiện nay

Dobrzeniecki đề xuấtphacircn loạitừng cấptheo bachức năng- Loại 1 sản phẩm bao gồmmột bộ đầy đủcaacutec ứng dụngtừ mộtnhagrave cung cấp- Loại 2 sản phẩm đượcthựchiệnở phần đầu củacaacutecsản phẩmDSS đượcphaacutet triển

bởicugravengmộtnhagrave cung cấp- Loại 3 sản phẩmkết hợp với nhautheo bất kỳ số lượngthuộc sở hữu củacocircng ty

65 Xacircy dựng EIS

- Xacircy dựngmộtEISgiống nhưxacircydựngmột số hệ thống khaacutec củamocirc higravenh hệ thống thocircng tin

- Việcphaacutet triểncấu truacutecnecircn được theo dotildeitừ quaacute trigravenh thiết kế đến quaacute trigravenhthực hiện

- Tuy nhiecircn một dự aacuten phaacutet triển EIScoacute xu hướnglagrave thống nhấtvagraveyecircu cầu hỗ trợ caacutec nhagrave quản lyacute latildenh đạo

- Xacircy dựng một EIScoacute thểphaacutet hiện ra đượccaacutectigravenh huống khoacute khănmagravemột nhagrave phaacutet triển chưabao giờ gặp phải

Mocirc higravenh EIS

Khung phaacutet triển một EIS

- Watson et al đề nghị xacircy dựngkhung với ba thagravenh phần+ Caacutech tiếp cận tập trung vagraveo yếu tốcon người vagrave dữ liệu coacute liecircn quan đến EIS+ Quaacute trigravenh phaacutet triển cần sự linh hoạt vagrave tương taacutec+ Người sử dụng - hệ thống hộp thoại bao gồm một ngocircn ngữ hagravenh động để xử lyacute caacutec lệnh

Lợi iacutech của EIS- Dễ duy trigrave caacutec mục tiecircu coacute tổ chức- Dễ truy xuất thocircng tin- Cho pheacutep người sử dụng nacircng cao hiệu suất hơn

- Tăng chất lượng ra quyết định- Cung cấp sự cải tiến cạnh tranh- Tiết kiệm thời gian của người sử dụng- Tăng khả năng vagrave chất lượng giao tiếp- Cung cấp khả năng điều khiển tốt hơn trong tổ chức- Cho pheacutep tham gia caacutec vấn đề vagrave caacutec cơ hội- Cho pheacutep hoạch định- Cho pheacutep tigravem kiếm nguyecircn nhacircn của một vấn đề- Thảo matilden caacutec yecircu cầu của người điều hagravenh

Hạn chế của EIS vagrave 1 số sai lầm cần traacutenh

- Chi phiacute một cuộc khảo saacutetnăm1991 chothấychi phiacute phaacutet triểntrungbigravenh365000USDvớichi phiacute vận hagravenhhagraveng năm lagrave$200000 (EIS)

- Cocircng nghệ hạn chếEIScần phảiđượctiacutech hợp hoagraven toagravenvagraveokiếntruacuteccủadoanh nghiệphiện tại do đoacute noacutelagrave một thaacutech thứclớn đối vớithiết kế

- Hạn chế tổ chức cơ cấu tổ chứccoacute thể khocircng phugrave hợp

Sự hạn chế về tổ chức- Chương trigravenh nghị sự vagrave thời gian chệch EIS mocirc tả một phần việc thực hiện một

chương trigravenh nghị sự vagrave coacute thể dễ dagraveng đạt được sự tin cậy một caacutech chắc chắn- Đồng bộ hoacutea việc quản lyacute sự tin cậy đuacuteng luacutec đặc biệt baacuteo caacuteo EIS coacute thể phaacute

vỡ sự ổn định thiết lập caacutec chu trigravenh baacuteo caacuteo một caacutech tốt nhất- Sự bất ổn EIS phản ứng nhanh coacute thể gacircy ra việc taacutec động trở lại một caacutech

nhanh choacuteng dẫn đến sự thiếu ổn định trong tổ chức

Sự thất bại lagrave thay thế khocircng thể chấp nhận được- Một số yếu tố lagravem EIS thất bại

+ Thiếu sự hỗ trợ về mặt quản lyacute+ Vấn đề chiacutenh trị+ Thất bại của nhagrave phaacutet triển+ Lỗi về cocircng nghệ+ Giaacute cả+ Thời gian

66 Ra quyết định điều hagravenh trong tương lai vagrave EIS

- Coacute một vagravei điều kiện sẽ được hợp nhất cho việc chuyển đổi cocircng nghệ Trong đoacute một vagravei điều kiện coacute thể dễ dự đoaacuten Hai điều kiện magrave ta coacute thể thấy lagrave+ Phaacutet triển cocircng nghệ maacutey tiacutenh trong việc điều hagravenh sẽ tạo ra sự chuyển đổi được chấp nhận một caacutech dễ dagraveng hơn+ Mở rộng traacutech nhiệm điều hagravenh sẽ mở rộng nhu cầu thocircng tin

Tương lai của EIS- EIS thocircng minh Những tiến bộ trong cocircng nghệ AI sẽ được triển khai trong caacutec

EIS- EIS đa phương tiện Cơ sở dữ liệu đa phương tiện sẽ cho pheacutep tiacutech hợp văn bản

giọng noacutei vagrave higravenh ảnh trong tương lai- EIS thocircng tin Tương lai EIS sẽ mở rộng hơn trong việc sử dụng dữ liệu becircn

ngoagravei doanh nghiệp- EIS kết nối Giao tiếp với băng thocircng rộng cho pheacutep kết nối liecircn thocircng lớn hơn

Chương 7 HỆ CHUYEcircN GIA VAgrave TRIacute TUỆ NHAcircN TẠO

71 Caacutec khaacutei niệm

72 Triacute thocircng minh của triacute tuệ nhacircn tạo

73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia

74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia

75 Lợi iacutech vagrave hạn chế của hệ chuyecircn gia

71 Caacutec khaacutei niệm

Chuyecircn mocircn (Expertise) sự hiểu biết rộng trong 1 lĩnh vực hẹp

Hệ chuyecircn gia (Expert Systems)1 chương trigravenh maacutey tiacutenh sử dụng 1 tập caacutec luật dựa trecircn tri thức của con người để giải quyết caacutec vấn đề đogravei hogravei phải coacute sự chuyecircn mocircn

Một số hệ chuyecircn gia nổi tiếng

DENDRAL (Standford 1960s Edward Feigenbaum)

MYCIN (Standford1970s Edward Shortliffe)

PROSPECTOR (MIT 1979)

Triacute tuệ nhacircn tạo (Artificial Intelligence ndash AI)

Triacute tuệ nhacircn tạo một bộ phacircn của ngagravenh khoa học maacutey tiacutenh quan tacircm đến việc thiết kế caacutec hệ thống maacutey tiacutenh thocircng minh đoacute lagrave caacutec hệ thống đưa ra caacutec đặc điểm magrave từ đoacute chuacuteng ta liecircn hệ với sự thocircng minh trong hagravenh động của con người (Barr vagrave Feigenbaum 1981)

Mục điacutech của AI

Mục điacutech khoa học xaacutec định caacutec gợi yacute để giải thiacutech caacutec loại khaacutec nhau của triacute tuệ thực

Mục điacutech kỹ thuật giải quyết caacutec vấn đề trong thế giới thực

Triacute tuệ nhacircn tạo kế thừa nhiều yacute tưởng quan điểm kỹ thuật từ caacutec ngagravenh khoa học khaacutec

- Triết học

- Logic Toaacuten học

- Tiacutenh toaacuten

- Khoa học tacircm lyacute Khoa học nhận thức

- Sinh học Thần kinh học

- Tiến hoacutea

Caacutec lĩnh vực ứng dụng trong Triacute tuệ nhacircn tạo

Mạng nơ ron thần kinh (Neural Networks)

Tiacutenh toaacuten sự tiến hoacutea

(Evolutionary Computation)

Hệ chuyecircn gia (Expert Systems)

Kỹ thuật xử lyacute tiếng noacutei (Speech Processing)

Kỹ thuật xử lyacute ngocircn ngữ tự nhiecircn

(Natural Language Processing)

Lập kế hoạch (Planning)

Robot (Robotics)

Khoa học higravenh ảnh (Vision)

Caacutec kỹ thuật thocircng dụng dugraveng trong AI

Biểu diễn(Representation)

Học (Learning)

Caacutec luật (Rules)

Tigravem kiếm (Search)

72 Triacute thocircng minh của triacute tuệ nhacircn tạo

Con người suy diễn như thế nagraveo

Phacircn loại (Categorization)

Caacutec quy tắc cụ thể

Heuristics

Kinh nghiệm trước đoacute

Dự tiacutenh trước

Maacutey tiacutenh suy diễn như thế nagraveo

Lập luận dựa trecircn luật IF-THEN mocirc tả tri thức được matilde hoacutea dưới dạng caacutec luật

Caacutec khung (Frames) lagrave caacutec đại diện mocirc tả caacutec tigravenh huống giống nhau lagrave điển higravenh của một vagravei phacircn loại

Lập luận dựa trecircn caacutec trường hợp mocirc phỏng giải phaacutep trước đoacute cho một vấn đề hiện tại

Nhận dạng mẫu phaacutet hiện acircm thanh higravenh dạng hoặc caacutec chuỗi dagravei

Caacutec dạng khaacutec của Triacute tuệ nhacircn tạo

Học maacutey- mạng nơron vagrave giải thuật di truyền

Lập trigravenh tự động ndash lagrave những kỹ thuật tạo ra caacutec chương trigravenh để lagravem 1 nhiệm vụ riecircng biệt (cho pheacutep những người khocircng phải lagrave người lập trigravenh coacute thể lập trigravenh được)

Cuộc sống nhacircn tạo ndash nỗ lực để taacutei tạo caacutec hiện tượng sinh học trong caacutec hệ thống dựa trecircn maacutey tiacutenh

73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia(Expert Systems- ES)

Theo Jackson (1999) Một hệ chuyecircn gia lagrave một chương trigravenh maacutey tiacutenh mocirc tả vagrave suy diễn với tri thức của một vagravei lĩnh vực để giải quyết vấn đề hay đưa ra caacutec lời khuyecircn

Cấu truacutec cơ bản của ES được dựa theo cấu truacutec chung của DSS Sự khaacutec biệt chiacutenh giữa ES vagraveDSS lagrave hệ ES thu thập caacutec kiến thức từ những

chuyecircn gia trong lĩnh vực quan tacircmĐặc trưng của hệ chuyecircn gia Hiệu quả cao Thời gian trả lời thỏa đaacuteng Độ tin cậy cao Dễ hiểu

Giao diện người dugraveng trong ES

Thiết kế giao diện người dugraveng tập trung vagraveo caacutec yếu tố như dễ dagraveng sử dụngcoacute độ tin cậy cao giảm tải những khoacute khăn khi sử dụng

Thiết kế necircn coacute một số tương taacutec (đầu vagraveo kiểm soaacutet vagrave truy vấn)

Cấu tạo giao diện người dugraveng gồm coacute magraven higravenh cảm ứng bagraven phiacutem buacutet saacuteng lệnh thoại caacutec phiacutem chuyecircn dụng

Cơ sở tri thức (Knowledge Base)

Chứa đựng caacutec tri thức cụ thể miền thu được từ caacutec chuyecircn gia miền

Coacute thể chứa caacutec mocirc tả caacutec hagravenh vi giải quyết vấn đề caacutec ragraveng buộc caacutec heuristics

Thagravenh cocircng của một ES dựa trecircn tiacutenh đầy đủ vagrave tiacutenh chiacutenh xaacutec của cơ sở tri thức

Mocirc tơ suy diễn (Inference Engine)

Ở đacircy tri thức được đặt để sử dụng tạo ra caacutec giải phaacutep để giải quyết vấn đề

Mocirc tơ nagravey coacute khả năng thực hiện diễn dịch hoặc suy diễn dựa trecircn caacutec luật hay caacutec caacutec sự kiện

Đồng thời cũng coacute khả năng sử dụng caacutec suy diễn mờ hay khocircng chiacutenh xaacutec dựa trecircn xaacutec suất hay aacutenh xạ mẫu

Vograveng điều khiển suy diễn

1 Aacutenh xạ caacutec luật với caacutec sự kiện đatilde được cho

2 Chọn luật để thực hiện

3 Thực hiện luật bằng caacutech thecircm caacutec sự kiện được suy diễn ra vagraveo bộ nhớ lagravem việc

Chuỗi suy diễn (Chaining)

Suy diễn tiến (forward chaining) maacutey suy diễn bắt đầu từ dữ liệu ban đầu vagrave thực hiện việc suy luận để đưa ra caacutec kết luận cuối cugraveng

Suy diễn lugravei (backward chaining) maacutey suy diễn bắt đầu từ dữ liệu điacutech vagrave tigravem ra tri thức hỗ trợ cho dữ liệu điacutech đoacute

Viacute dụ suy diễn lugravei

R1 Nếu coacute A vagrave B thigrave suy ra coacute D

R2 Nếu coacute B thigrave suy ra coacute C

R3 Nếu coacute C vagrave D thigrave suy ra coacute E

Ta coacute E ta xem trong 3 luật R1 R2 R3 luật nagraveo coacute E ta thấy R3 chứa E đồng thời chứa C vagrave D Xeacutet tiếp trong 2 luật R1 R2 luật nagraveo chứa C vagrave D R2 chứa C R3 chứa D Từ đoacute ta coacute được caacutec tri thức hỗ trợ suy diễn vagrave kết luận lagrave nếu coacute A vagrave B thigrave sẽ coacute E Hay nếu A vagrave B đuacuteng thigrave sẽ coacute E

Viacute dụ suy diễn tiến

Giả sử coacute tập chứa 3 luật sau

R1 Nếu coacute A vagrave B thigrave suy ra coacute D

R2 Nếu coacute B thigrave suy ra coacute C

R3 Nếu coacute C vagrave D thigrave suy ra coacute E

Nếu ta coacute A vagrave B thigrave chuacuteng ta suy ra được D từ R1 vagrave suy ra C từ R2 Với D vagrave C đatilde được suy ra ở trecircn giờ chuacuteng ta suy ra được E từ R3

Viacute dụ thực tế

Giả sử muốn biết magraveu của một con vật nuocirci tecircn lagrave Fred biết rằng noacute kecircu ộp ộp vagrave ăn ruồi

Coacute tập 4 luật ban đầu như sau

R1 Nếu X kecircu ộp ộp vagrave ăn ruồi thigrave X lagrave con ếch

R2 Nếu X kecircu chiecircm chiếp vagrave biết hoacutet thigrave X lagrave con chim

R3 Nếu X lagrave con ếch thigrave X coacute magraveu xanh

R4 Nếu X lagrave con chim thigrave X coacute magraveu vagraveng

74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia

Expert system shells lagrave một tập caacutec goacutei phần mềm vagrave caacutec cocircng cụ dugraveng để phaacutet triển caacutec hệ chuyecircn gia

Những Expert system shells đầu tiecircn thường rất rườm ragrave Mặc dugrave vậy noacute vẫn giuacutep cho người sử dụng sẽ khocircng phải bắt đầu lại từ đầu khi xacircy dựng một hệ chuyecircn gia mới

Những shell hiện đại bao gồm hai mocirc-đun chiacutenh lagrave cocircng cụ xacircy dựng một tập quy tắc vagrave mocirc tơ suy diễn

Xacircy dựng hệ chuyecircn gia

Bước 1 xacircy dựng mocirc higravenh bagravei toaacuten xaacutec định vấn đề nhiệm vụ magrave hệ thống sẽ thực hiện Caacutec dạng bagravei toaacuten cần hệ chuyecircn gia

Bagravei toaacuten diễn giải (InterPretation)

Bagravei toaacuten dự baacuteo (Prediction)

Bagravei toaacuten chuẩn đoaacuten (Diagnose)

Bagravei toaacuten gỡ rối (Debugging)

Bagravei toaacuten thiết kế

Tương tự như một dự aacuten phần mềm để xacircy dựng một hệ chuyecircn gia cần phải coacute caacutec yếu tố về nhacircn lực tagravei nguyecircn vagrave thời gian Những yếu tố nagravey ảnh hưởng đến giaacute thah của một hệ chuyecircn giaTrong phần nagravey cacircu hỏi thường được đặt ra lagrave tại sao cần phải xacircy dựng một hệ chuyecircn giaTrước khi bắt đầu phải xaacute định rotilde bagravei toaacuten đạt ra lagrave jiAi lagrave chuyecircn giaAi lagrave người sử dụng

1 Diễn giải (InterPretation) Nghiecircn cứu 1 vấn đề -gt Dựa trecircn những biểu hiện thuộc tiacutenh đặc trưng becircn ngoagravei -gt Tư vấn

(hoặc đưa ra kết luận hay mocirc tả dễ hiểu từ tập dữ liệu thocirc)

2 Bagravei toaacuten dự baacuteo (Prediction) Coacute thể dự đoaacuten được hagravenh vi kết quả dựa trecircn caacutec hiện tượng -gt dự baacuteo

VD Dự baacuteo thời tiết động đấthellip

3 Bagravei toaacuten chẩn đoaacuten (Diagnoss) Xaacutec định caacutec lỗi caacutec bộ phận hỏng hoacutec của hệ thống dựa trecircn caacutec dữ liệu quan saacutet được

4 Bagravei toaacuten gỡ rối (Debugging) Mocirc tả caacutec phương phaacutep khắc phục hệ thống khi gặp sự cố

5 Bagravei toaacuten thiết kế Lựa chọn cấu higravenh caacutec đối tượng nhằm thoả matilden một số ragraveng buộc nagraveo đoacute

6 Giảng dạy Phần mềm dạy học coacute thể chuẩn đoaacuten vagrave sủa lỗi của học sinh trong quaacute trigravenh học tập

Để xaacutec định đuacuteng bagravei toaacuten magrave chuacuteng ta cần giải quyết thigrave phải trả lời đc một số cacircu hỏi

- cần hệ chuyecircn gia

Bước 2 thu thập tri thức lựa chọn cocircng cụ vagrave aacutep dụng

Trong bước thu thập tri thức vấn đề quan trọng lagrave lựa chọn chuyecircn gia những người magrave sẽ đoacuteng goacutep tri thức cho hệ thống Thocircng thường trong suốt quaacute trigravenh phaacutet triển thigrave chuyecircn gia được xem như một thagravenh viecircn của đội phaacutet triển

Hiện nay coacute rất nhiều cocircng cụ để xacircy dựng một hệ chuyecircn gia Phổ biến nhất lagrave JESS CLIPS vagrave OPS5

Bước 3 Thiết kế cơ sở tri thức thiết kế hệ thốngTri thức được biểu diễn trường minh trong cơ sở tri thức

Caacutec chuyecircn gia vagrave kỹ sư tri thức sẽ đối thoại với nhau bằng caacutec kỹ thuật đối thoại Suy diễn (SD) bảng Mocirc higravenh hoacutea SD quy nạp phacircn loại

Vấn đề bagraveo trigrave vagrave phaacutet triển

Caacutec hệ chuyecircn gia đogravei hỏi phải bảo trigrave vagrave phaacutet triển nhiều hơn so với caacutec hệ thống khaacutec Phải thường xuyecircn bổ sung tri thức mới vagrave thay đổi caacutec tri thức cũ để đổi mới hệ chuyecircn gia

Thu thập vagrave khắc phục lỗi do người sử dụng phaacutet hiện để kịp thời khắc phục những sai soacutet của hệ chuyecircn gia

75 Lợi iacutech vagrave hạn chế của caacutec hệ chuyecircn gia

Một số lợi iacutech chiacutenh

Thời gian trả lời hợp lyacute bằng hoặc nhanh hơn so với chuyecircn gia (người) để đi đến cugraveng một quyết định Hệ chuyecircn gia lagrave một hệ thống thời gian thực (real time system)

Khả năng trả lời với mức độ tinh thocircng bằng hoặc cao hơn so với chuyecircn gia (người) trong cugraveng lĩnh vực

Hệ chuyecircn gia giuacutep cho hiệu quả lagravem việc tăng bằng việc sử dụng tập caacutec luật một caacutech nhanh choacuteng magrave ko bị nhầm lẫn chuyecircn gia lagrave người coacute thể quecircn đi một số tri thức cơ sở lyacute luậ nhưng HCG thigrave ko

Quyết định của một người chuyecircn gia coacute thể bị thay đổi vagrave ko coacute tiacutenh thống nhất như quyết định của một hệ chuyecircn gia tạo ra

Hệ chuyecircn gia giuacutep cho người sử dụng coacute thể trau dồi sự hiểu biết trecircn lĩnh vuej cụ thể magrave noacute giải quyết hỗ trợ người ra quyết định coacute trigravenh độ như 1 chuyecircn gia trong quaacute trigravenh gia quyết định

Kiến thức của rất nhiều chuyecircn gia về một lĩnh vực nagraveo đoacute được đưa vagraveo hệ chuyecircn gia lagravem cho CSTT cuat HCG phong phuacute vagrave rộng lớn hơn rất nhiều

HCG giải thiacutech caacutec bước suy luận một caacutech dễ hiểu nhất quaacuten luacutec nagraveo cũng coacute thể sử dụng ko như chuyecircn gia con người

Hạn chế của caacutec hệ chuyecircn gia

Nhược điểm lớn nhất của hệ chuyecircn gia lagrave những yacute kiến chuyecircn mocircn thường rất khoacute matilde hoacutea vagrave giải neacuten

Hệ chuyecircn gia khocircng coacute khả năng tự học tự cập nhật kiến thức mới như caacutec chuyecircn gia magrave cần phải được matilde hoacutea lại khi noacute được cập nhật

Hệ chuyecircn gia khocircng thể nhận ra được vấn đề khocircng nằm trong miền kiến thức của hệ thống

Chương 8 Tri thức vagrave tiếp nhận

1 Bao gồm caacutec vấn đề

Dữ liệu thực tế đo lường hoặc quan saacutet coacute hoặc khocircng coacute bối cảnh

Thocircng tin dữ liệu được tổng hợp một caacutech hữu iacutech để giải quyết những khoacute khăn trong việc đưa ra quyết định

Tri thức bao gồm caacutec ứng dụng quy tắc thocircng tin hướng dẫn của người ra quyết định

2 Những caacutei nhigraven về tri thức

Đại diện lagravem thế nagraveo để diễn tả tri thức viacute dụ như một quyển saacutech khocircng phải lagrave tri thức nhưng noacute lại lagrave một đại diện của tri thức

Sản xuất tri thức lagrave một tập hơp của hagraveng tồn kho coacute thể được sản xuất cũng như mua lại

Tri thức lagrave 1 trong 6 trạng thaacutei của hệ thống

1Dữ liệu 2Thocircng tin 3Cấu truacutec thocircng tin 4Sự thấu hiểu 5Yacute kiến 6 Quyết định

3 Caacutec loại tri thức Phổ biến mocirc tả dữ liệu thocircng tin thủ tục mọi thứ lagravem như thế nagraveo lập luận chiacutenh saacutech hoặc caacutec quy tắc

4 Thu thập Tri thức hệ chuyecircn gia Hầu hết caacutec phương phaacutep đều bắt đầu với mocirc higravenh của caacutec taacutec vụ trong đoacute

hệ chuyecircn gia được xacircy dựng Trong đoacute mocirc tả về caacutec lĩnh vực được tạo ra Caacutec kỹ sư sử dụng caacutec mocirc higravenh giả thuyết vagrave nhận thức về quaacute trigravenh phacircn

tiacutech để gợi ra caacutech giải quyết vấn đề về tri thức từ caacutec chuyecircn gia

5 Caacutec chiều của thu thập tri thức KE- driven caacutec kỹ sư trao đổi trực tiếp với caacutec chuyecircn gia Expert-driven Caacutec chuyecircn gia trực tiếp đưa chuyecircn mocircn của họ vagraveo hệ

thống maacutey tiacutenh Machine-driven Sử dụng caacutec cocircng cụ suy luận để triacutech xuất tri thức từ một

tập caacutec viacute dụ

6 Kỹ thuật thu thập tri thức Trao đổi gồm 2 loại cơ bản lagrave coacute cấu truacutec(coacute kịch bản) vagrave khocircng coacute cấu

truacutec( đối thoại trực tiếp) Giao thức phacircn tiacutech bằng lời Khi caacutec chuyecircn gia thực hiện một cocircng việc

của họ thigrave một bản ghi về cocircng việc đoacute được thực hiện Caacutec kỹ sư sẽ xacircy dựng mocirc higravenh cho những gigrave được ghi lại trong bản ghi

Phương phaacutep sagraveng lọc caacutec chuyecircn gia so saacutenh caacutec nhoacutem liecircn tiếp trong ba đối tượng vagrave cho biết tại sao nhoacutem thứ hai lại khaacutec nhoacutem thứ ba

7 Thu thập tri thức từ nhiều nguồn Thu thập tri thức từ nhiều nguồn lagrave cần thiết để coacute được đầy đủ caacutec tri thức

cho một vấn đề quan điểm yacute kiến traacutei ngược nhau thường phaacutet sinh Phương phaacutep đồng thuận sẽ giuacutep giải quyết được vấn đề macircu thuẫn Kỹ thuật phacircn tiacutech Meta lagrave kỹ thuật được aacutep dụng trong caacutec trường hợp

khaacutec Caacutech tiếp cận bằng định lượng đogravei hỏi caacutec kỹ sư cần cacircn nhắc yếu tố đầu vagraveo của caacutec chuyecircn gia khaacutec nhau

8 Xaacutec nhận hợp lệ vagrave kiểm tra tri thức Một khi thu thập tri thức noacute phải được đaacutenh giaacute về khả năng sử dụng vagrave độ

chiacutenh xaacutec Hai vấn đề cụ thể lagrave hiệu lực của những kiến thức vagrave kiểm tra việc xacircy dựng cơ sở của tri thức

Cần xaacutec nhận xem liệu hệ thống coacute thể hoạt động ở mức độ tối thiểu khocircng

Xaacutec minh liecircn quan đến việc so saacutenh từng chi tiết kỹ thuật của hệ thống những gigrave đatilde được thực hiện cuối cugraveng

9 Một số caacutec biện phaacutep xaacutec nhận Độ chiacutenh xaacutec Khả năng thiacutech nghi Mức độ đầy đủ Bề rộng Độ sacircu Hiệu lực Tổng quan Chiacutenh xaacutec Hiện thực Độ tin cậy Tiacutenh hữu dụng Mức độ

Chương 9 Học maacutey

1 Logic mờ vagrave ngocircn ngữ mờ(Fuzzy Logic and Linguistic Ambiguity)

Ngocircn ngữ tự nhiecircn gồm những khaacutei niệm mơ hồ vagrave khocircng chiacutenh xaacutectruyền tải ngữ nghĩa thocircng qua tiacutenh xấp xỉkhocircng rotilde ragraveng

Những xấp xỉ nagravey giuacutep con người coacute thể truyền tải hết được yacute nghĩa nhưng maacutey thigrave khocircng hiểu

Lagravem sao biểu diễn caacutec tri thức sử dụng caacutec khaacutei niệm khocircng rotilde ragraveng(mờ) hoặc khocircng chiacutenh xaacutec

2 Khaacutei niệm cơ bản của logic mờ tập mờ lagrave những tập hợp khocircng coacute một giới hạn rotilde Mỗi phần tử của noacute chỉ

chứa một mức độ hagravem liecircn thuộc của từng phần tử Vigrave vậy tập mờ khocircng giống như tập cổ điển Tập mờ coacute thể kết hợp với nhau qua những luật mờ magrave đặc trưng cho những hagravenh động trạng thaacutei vagrave thuộc tiacutenh của logic mờ được tận dụng khi thực hiện một bộ điều khiển mờ

Logic mờ dựa trecircn yacute tưởng mỗi phần tử thuộc vagraveo một tập hợp ở một mức độ nagraveo đấy

Locircgic mờ cho pheacutep độ liecircn thuộc (microA )coacute giaacute trị trong khoảng (01) Locircgic mờ coacute thể được coi lagrave mặt ứng dụng của lyacute thuyết tập mờ để xử lyacute caacutec

giaacute trị trong thế giới thực cho caacutec bagravei toaacuten phức tạp

3 So saacutenh tiacutenh đuacuteng đắn logic mờ vagrave xaacutec suất Xaacutec suất thigrave đề cập đến khả năng xảy ra một biến cố hay một điều gigrave đoacute Logic mờ đề cập đến cấp độ magrave đặc tiacutenh ở hiện tại

o viacute dụ1 người coacute chiều cao 6 feet thigrave coacute cấp độ lagrave 05 về chiều cao

4 Ưu điểm của logic mờ Caacutech tiếp cận rất tự nhiecircnkhocircng phức tạp Coacute thể mocirc higravenh hoacutea caacutec hagravem phi tuyến tugravey yacute phức tạp

Coacute thể tận dụng được kinh nghiệm từ những chuyecircn gia hagraveng đầu trong mọi lĩnh vực

Logic mờ được xacircy dựng dựa trecircn ngocircn ngữ tự nhiecircnNền tảng của logic mờ lagrave dựa trecircn cơ sở giao tiếp của con người

5 Nhược điểm của logic mờ Trong 1 hệ thống phức tạpsử dụng logic mờ coacute thể trở thagravenh trở ngại cho

việc xaacutec thực độ tin cậy của hệ thống Cơ chế lập luận mờ khocircng thể học hỏi từ những lỗi sai

6 Mạng noron nhacircn tạo(ANN) Mạng noron nhacircn tạo lagrave một mocirc phỏng xử lyacute thocircng tinđược nghiecircn cứu ra

từ hệ thống thần kinh của sinh vậtgiống như bộ natildeo để xử lyacute thocircng tin ANNs lagrave chương trigravenh dựa trecircn maacutey tiacutenh đơn giản coacute chức năng lagrave một mocirc

higravenh bagravei toaacuten khocircng gian dựa trecircn thử nghiệm vagrave baacuteo lỗi

7 Học từ kinh nghiệm Tiến trigravenh Một mẫu dữ liệu được biểu diễn như một mạng lưới noronANN ldquodự

đoaacutenrdquo 1 đầu radự đoaacuten được so saacutenh với giaacute trị thực tế hoặc giaacute trị chiacutenh xaacutecNếu đoaacuten được chiacutenh xaacutec thigrave khocircng coacute hagravenh động nagraveo được thực hiện

Nếu dự đoaacuten sai ANN kiểm tra lại vagrave xaacutec định lại thocircng số để điều chỉnh Một mẫu dữ liệu khaacutec được biểu diễn vagrave quaacute trigravenh nagravey được lặp lại

8 Nguyecircn tắc cơ bản của cocircng nghệ nơron Caacutec yếu tố xử lyacute cơ bản trong hệ thống thần kinh của con người lagrave tế bagraveo

thần kinhMạng lưới của tế bagraveo nagravey lagrave liecircn kết với nhau nhận được thocircng tin từ caacutec cảm biến trong mắt taihellip

Thocircng tin nhận được bởi tế bagraveo thần kinh hoặc lagrave sẽ kiacutech thiacutech noacute(sẽ được chuyển qua 1 thocircng điệp dọc theo mạng lưới) hoặc lagrave sẽ ngăn cản noacute(ngăn cản dograveng thocircng tin)

Độ nhạy coacute thể thay đổi qua thời gian hoặc sau khi coacute được kinh nghiệm

9 Cấu truacutec mạng Một ANN gồm 3 lớp cơ bản

Lớp đầu vagraveo nhận dữ liệu Lớp becircn trong hoặc lagrave lớp ẩn xử lyacute dữ liệu Lớp đầu ra chuyển tiếp kết quả cuối cugraveng của mạng

10Mạng nơ ron Thường coacute nhiều đầu vagraveo mỗi đầu vagraveo với mức ảnh hưởng vagrave tầm quan

trọng riecircng của noacute Một đầu vagraveo quan trọng coacute thể được sử dụng để khuếch đại đầu ra caacutec hagravem trạng thaacutei tổng hợp caacutec trọng số của caacutec yếu tố

đầuvagraveo khaacutec nhauvagraveo một giaacute trị duy nhất Caacutec hagravem chuyển giao xử lyacute caacutec giaacute trị trạng thaacutei vagrave tạo đầu ra

11Huấn luyện mạng nơ ron Trong mocirc higravenh coacute giaacutem saacutetANN được đến so saacutenh dự đoaacuten của chiacutenh

noacute với thocircng tin phản hồi coacute chứa caacutec kết quả mong muốn ANN sẽ phải tigravem caacutech thay đổi caacutec tham số becircn trong củamigravenh (caacutec trọng số vagrave caacutec ngưỡng) để tạo necircn một aacutenh xạ coacute khả năng aacutenh xạcaacutec đầu vagraveo thagravenh caacutec đầu ra mong muốn Sự thay đổi nagravey được tiến hagravenh nhờ việc so saacutenh giữa đầu ra thực sự vagrave đầu ra mong muốn

Trong mocirc higravenh khocircng coacute giaacutem saacutetANN nhận được dữ liệu vagraveo nhưng khocircng phải coacute bất kỳ thocircng tin phản hồi về kết quả mong muốn

Phần lớn caacutec ứng dụng nằm trong vugraveng của caacutec bagravei toaacuten ước lượng như mocirc higravenh hoacuteathống kecirc neacuten lọc phacircn cụm

12Lợi iacutech Liecircn kết với mạng noron Traacutenh caacutech lập trigravenh tường minh Giảm nhu cầu của chuyecircn gia ANNs thigrave thiacutech nghi với caacutec yếu tố đầu vagraveo thay đổi Khocircng cần thiết cho cơ sở tri thức tinh chế ANNs coacute tiacutenh động vagrave cải thiện với việc sử dụng Coacute khả năng xử lyacute dữ liệu khocircng chiacutenh xaacutec hoặc khocircng đầy đủ Cho pheacutep tổng quaacutet hoacutea từ thocircng tin cụ thể Cho pheacutep thu thập cảm giaacutec thocircng thường vagraveo miền giải quyết vấn đề

13Hạn chế của việc liecircn kết với mạng noron ANNs khocircng thể giải thiacutech được suy luận Bản chất hộp đen thường khiến cho vấn đề traacutech nhiệm vagrave độ tin cậy phaacutet

sinh lagrave khoacute khăn Lặp đi lặp lại quaacute trigravenh huấn luyện rất tốn thời gian Nguồn lực caacutec nhagrave phacircn tiacutech vagrave thiết kế coacute tay nghề cao vẫn lagrave đaacuteng lo

ngại Cocircng nghệ ANN thuacutec đẩy hạn chế của phần cứng hiện tại ANN yecircu cầu phải coacute sự tin tưởng ở đầu ra

14Giới thiệu về thuật toaacuten di truyền Cũng như mạng lưới thần kinh caacutec thuật toaacuten di truyền được dựa trecircn lyacute

thuyết sinh học Thuật toaacuten di truyền tigravem thấy nguồn gốc của chuacuteng trong caacutec lyacute thuyết

tiến hoacutea của chọn lọc tự nhiecircn vagrave thiacutech ứng với biến đổi khiacute hậu Kết quả thuật toaacuten di truyền lagrave từ giao phối 2 caacute thể trong quần thế để tạo

ra con caacutei đocirci khi tốt hơn so với bậc cha mẹ của chuacuteng 15Caacutec thagravenh phần cơ bản của thuật toaacuten di truyền

Toaacuten tử chọn lọc Caacutec caacute thể tốt được chọn lọc để đưa vagraveo thế hệ sau Sự chọn lọc nagravey căn cứ vagraveo độ thiacutech nghi với mocirci trường của mỗi caacute thể

Toaacuten tử lai gheacutep (crossover) Hai caacute thể cha vagrave mẹ trao đổi caacutec gen với nhau để tạo ra caacute thể con

Toaacuten tử đột biến (mutation) Một caacute thể thay đổi một số gen để biến đổi thagravenh một caacute thể mớiTất cả caacutec toaacuten tử trecircn khi thực hiện đều mang tiacutenh ngẫu nhiecircn

16Quaacute trigravenh cơ bản của một thuật toaacuten di truyền Khởi tạo

Đaacutenh giaacute quần thể

Lựa chọn NST thiacutech hợp nhất vagrave loại bỏ NST yếu nhất

Quy trigravenh giao nhau vagrave cải thiện quần thể

đột biến tiến trigravenh để khaacutem phaacute ra NST mới

17Ưu nhược điểm của việc kết hợp với thuật toaacuten di truyền Kiacutech thước quần thể lagrave 1 yếu tố quan trọng trong tốc độ của việc tigravem

kiếmnhưng noacute tương đối dễ dagraveng để dự đoaacuten tốc độ nagravey Giao nhau hoặc đột biến lagrave khocircng necircn đc sử dụng quaacute thường xuyecircn Luocircn coacute được iacutet nhất 1 giải phaacutep hợp lyacute Necircn coacute thể aacutep dụng chuacuteng cho caacutec vấn đề magrave chuacuteng ta khocircng coacute hướng

về caacutech giải quyết Sức mạnh của thuật toaacuten xuất phaacutet từ khaacutei niệm đơn giảnkhocircng phải từ

một thủ tục thuật toaacuten phức tạp 18Tương lai của học maacutey

Mạng lưới thần kinh nhacircn tạo vượt quaacute năng lực của con người trong caacutec trường hợp bị cocirc lập

Về mặt lyacute thuyếtmột maacutey tiacutenh coacute thể xử lyacute dũ liệu nhanh hơn hagraveng triệu lần so với 1 con người

May mắn thay cho chuacuteng tacon người tốt hơn nhiều khi magrave coacute được dữ liệumaacutey tiacutenh khocircng coacute 1 số thứ như lagrave 5 giaacutec quan

CHƯƠNG 10 KHO DỮ LIỆU

1 Kho dữ liệu Kho dữ liệu lagrave tuyển tập caacutec cơ sở dữ liệu tiacutech hợp hướng chủ đề được

thiết kế để trợ giuacutep cho một hệ hỗ trợ quyết định

Theo John Ladley Cocircng nghệ kho dữ liệu lagrave tập caacutec phương phaacutep kỹ thuật vagrave caacutec cocircng cụ coacute thể kết hợp hỗ trợ nhau để cung cấp thocircng tin cho người sử dụng trecircn cơ sở tiacutech hợp từ nhiều nguồn dữ liệu nhiều mocirci trường khaacutec nhau

Kho dữ liệu thường rất lớn tới hagraveng trăm GB hay thậm chiacute hagraveng Terabyte

2 Kho dữ liệu vận hagravenh (ODS) Một kho dữ liệu vận hagravenh Aacutep dụng kỹ thuật kho dữ liệu vagraveo caacutec hệ xử

lyacute giao taacutec lưu trữ dữ liệu cho một ứng dụng đặc thugrave Noacute đưa vagraveo kho dữ liệu một dograveng caacutec dữ liệu thocirc được thiết kế

3 So saacutenh

Kho dữ liệu vận hagravenh Kho dữ liệu

Dữ liệu theo chủ đề Dữ liệu theo chủ đề

Dữ liệu tiacutech hợp Dữ liệu tiacutech hợp

Dữ liệu thay đổi Dữ liệu khocircng thay đổi

Dữ liệu được cập nhật khi thay đổi

Dữ liệu giữ nguyecircn

Chỉ coacute dữ liệu hiện tạiDữliệu hiện tại vagrave dữ liệu lịch sử

Chu kỳ lagravem tươi dữ liệu ngắn Chu kỳ lagravem tươi dữ liệu dagravei

Chỉ coacute dữ liệu chi tiết Dữ liệu chi tiết vagrave dữ liệu tổng kết

Dugraveng cho caacutec quyết định ngắn hạn

Dugraveng cho hoạch định dagravei hạn

4 Kho dữ liệu cục bộ (Data Mart - DM)

Kho dữ liệu cục bộ lagrave CSDL coacute những đặc điểm giống với kho dữ liệu nhưng với quy mocirc nhỏ hơn vagrave lưu trữ dữ liệu về một lĩnh vực một chuyecircn ngagravenh

Data mart phụ thuộc Chứa những dữ liệu được lấy từ DW vagrave những dữ liệu nagravey sẽ được triacutech lọc vagrave tinh chế tiacutech hợp lại ở mức cao hơn để phục vụ một chủ đề nhất định của Datamart

Data mart độc lập Khocircng giống như Datamart phụ thuộc Data mart độc lập được xacircy dựng trước DW vagrave dữ liệu được trực tiếp lấy từ caacutec nguồn khaacutec nhau

5 Siecircu dữ liệu Metadata lagrave dữ liệu để mocirc tả dữ liệu Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột

một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi Metadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu

6 Mocirci trường kho dữ liệu Hệ thống của tổ chức vagrave kho cung cấp dữ liệu để xacircy dựng kho dữ liệu Trong quaacute trigravenh chuyển dữ liệu từ caacutec nguồn khaacutec nhau dữ liệu coacute thể

được lagravem sạch hoặc chuyển đổi vagrave vigrave thế DW được xem như lagrave một chuẩn cho việc lưu trữ

Đồng thời siecircu dữ liệu được ghi lại Cuối cugraveng DW hoặc siecircu thị coacute thể được sử dụng để tạo ra một kho dữ

liệu ldquocaacute nhacircnrdquo 7 Caacutec đặc điểm của kho dữ liệu

Đặc điểm Mocirc tả

Hướng chủ đề - DL tổ chức theo caacutech thức người dugraveng tham chiếu

Tiacutech hợp - Dữ liệu ldquosạchrdquo loại bỏ tiacutenh thiếu nhất quaacuten

Khocircng thay đổi - DL ldquochỉ đọcrdquo người dugraveng khocircng thay đổi được

Chuỗi thời gian - DL lagrave chuỗi thời gian khocircng phải lagrave trạng thaacutei hiện tại

Được tổng kết - DL vận hagravenhthao taacutec khi cần thiết

được kết hợp lại thagravenh dạng coacute thể dugraveng được cho quyết định

Kiacutech cỡ lớn hơn - Lưu giữ theo chuỗi thời gian tức lagrave giữ lại nhiều DL

Khocircng được chuẩn hoacutea - Coacute thể dư thừa DLSiecircu dữ liệu - Dữ liệu của dữ liệu được lưu trữNguồn dữ liệu - DL vận hagravenh (caacutec hệ sẵn coacute) cugraveng

với caacutec nguồn ngoagravei 8 Kho dữ liệu hướng chủ đề

Hướng chủ để coacute nghĩa lagrave kho dữ liệu được tổ chức xung quanh caacutec chủ đề chiacutenh như khaacutech hagraveng sản phẩm sản xuất Tập trung vagraveo việc mocirc higravenh hoacutea vagrave phacircn tiacutech dữ liệu cho caacutec nhagrave ra quyết định magrave khocircng tập trung vagraveo caacutec xử lyacute thocircng thường Cung cấp cho người dugraveng một khung nhigraven toagraven vẹn đơn giản vagrave đầy đủ về caacutec sự kiện quanh caacutec chủ đề

9 Dữ liệu trong DW được tiacutech hợp Dữ liệu trong kho dữ liệu được xacircy dựng bằng caacutech tổng hợp dữ liệu từ

nhiều nguồn khaacutec nhau vagrave caacutec nguồn coacute tổ chức khaacutec nhau Cơ sở dữ liệu caacutec file excel caacutec flat file hoặc caacutec raw file Khi đưa vagraveo kho dữ liệu caacutec dữ liệu được lagravem sạch vagrave tiacutech hợp dữ liệu nhằm đảm bảo tiacutenh nhất quaacuten của dữ liệu

10Kiến truacutec kho dữ liệu Tầng cơ sở dữ liệu hoạt động Tầng truy xuất thocircng tin Tầng truy xuất dữ liệu Tầng siecircu dữ liệu Tầng quản lyacute tiến trigravenh Tầng thocircng điệp của ứng dụng Tầng vật liacute của kho dữ liệu Tầng trigravenh diễn dữ liệu

11Higravenh trạng kho dữ liệu Kho dữ liệu ảo - người dugraveng cuối coacute thể truy cập trực tiếp đến kho dữ liệu

sử dụng caacutec cocircng cụ cho pheacutep ở tầng truy xuất dữ liệu Kho dữ liệu trung tacircm-1 cơ sở dữ liệu vật lyacute chứa tất cả dữ liệu cho một

vugraveng chuyecircn dụng nagraveo đoacute

Kho dữ liệu phacircn taacuten- Thagravenh phần được phacircn taacuten qua nhiều hệ cơ sở dữ liệu vật lyacute

12METADATA- Siecircu dữ liệu Định nghĩa Siecircu dữ liệu lagrave dữ liệu về dữ liệu Lagrave 1 lưu trữ dugraveng để

Miecircu tả kho dữ liệu tổng thể Nhận dạng kiểu kho dữ liệu Quản liacute quaacute trigravenh tiacutech hợp dữ liệu Quản liacute quaacute trigravenh cập nhật kho dữ liệu Quản liacute bảo mật

Lagrave chigravea khoacutea quyết định sự thagravenh cocircng của kho dữ liệu luocircn được thay đổi vagrave cập nhật theo sự phaacutet triển của kho dữ liệu

Dugraveng để quản liacute điều khiển kho dữ liệu Sự ra đời của kho dữ liệu như 1 cấu truacutec hỗ trợ ra quyết định siecircu dữ liệu

được xem như nguồn tagravei nguyecircn dữ liệu Siecircu dữ liệu lagrave trừu tượng Chuacuteng lagrave dữ liệu bậc cao cung cấp mocirc tả ngắn

gọn caacutec dữ liệu bậc thấp hơn 13Hoạt động của Siecircu dữ liệu

Siecircu dữ liệu rất cần thiết trong việc chuyển hoacutea thocircng tin trở thagravenh tri thức Lagrave chigravea khoacutea giuacutep chuacuteng ta xử lyacute được dữ liệu thocirc Viacute dụ một dograveng dữ liệu baacuten hagraveng 1023 K596 11121 agraveNoacute sẽ khocircng coacute nghĩa gigrave cho đến khi chuacuteng ta đưa vagraveo siecircu dữ liệu (thư

mục chứa dữ liệu) agrave cửa hagraveng 1023 sản phẩm K596 vagrave số tiền baacuten được lagrave 11121 đocirc la

14Sự cần thiết phải nhất quaacuten trong kho dữ liệu Kho dữ liệu được xacircy dựng cho lợi iacutech của những nhagrave phacircn tiacutech kinh

doanh caacutec nhagrave quản trị cho tất cả caacutec khu vực chức năng Trong cơ sở dữ liệu riecircng caacutec khu vực khaacutec nhau coacute thể định nghĩa vagrave lưu

trữ dữ liệu thocircng qua phiecircn bản của chiacutenh noacute Khi dữ liệu được lấy từ những vugraveng khaacutec nhau đoacute vagrave được đặt vagraveo kho dữ

liệu Việc chuyển đổi vagrave lagravem sạch caacutec tiến trigravenh sẽ đảm bảo noacute lagrave duy nhất được tiacutech hợp tại một mức của tổ chức

15Ragrave soaacutet lại dữ liệu ndash Thực thi siecircu dữ liệu

Bất kể cấu truacutec tự nhiecircn của 1 cacircu truy vấn thế nagraveo thigrave caacutec thagravenh phần của siecircu dữ liệu rất quan trọng đối với người ra quyết định

Bảng thuộc tiacutenh khoacutea được lưu trữ bởi kho dữ liệu Tập hợp dữ liệu được lấy từ đacircu Những chuyển đổi nagraveo được thực thi với việc lagravem sạch

16Siecircu dữ liệu lagrave gigrave Metadata - lagrave thocircng tin mocirc tả nội dung của cơ sở dữ liệu (CSDL) Metadata baacuteo cho người dugraveng biết thời gian cập nhật sau cugraveng của dữ liệu

định dạng vagrave mục điacutech sử dụng của noacute Những thocircng tin nagravey coacute thể hướng dẫn người dugraveng duyệt qua CSDL vagrave

giuacutep họ hiểu được yacute nghĩa vagrave ngữ cảnh của dữ liệu Trong CSDL metadata lagrave caacutec dạng biểu diễn khaacutec nhau của caacutec đối tượng

trong CSDL Trong CSDL quan hệ metadata lagrave caacutec định nghĩa của bảng cột CSDL

view vagrave nhiều đối tượng khaacutec Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột

một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi -gtMetadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu

Bảng chuyển đổi Ghi lại những chuyển đổi đatilde được thực hiện

Lịch sử thực thi Ghi lại những dữ liệu đatilde được

phacircn tiacutech

Higravenh thaacutei kết nốiGhi lại những dữ liệu được kết nối vagrave tần suất

17Aacutenh xạ thocircng thường của siecircu dữ liệu Bản ghi aacutenh xạ chuyển đổi bao gồm

Định danh của nguồn gốc Chuyển đổi thuộc tiacutenh Chuyển đổi thuộc tiacutenh vật lyacute Matilde hoacutea tham chiếu bảng chuyển đổi Đổi tecircn Đổi khoacutea Gaacuten giaacute trị cho thuộc tiacutenh mặc định Chọn logic cho caacutec nguồn nhiều giaacute trị Đổi thuật toaacuten

18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để

phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai

lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave

tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec

Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm

Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo

19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua

caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau

SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được

Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra

một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức

Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ

Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ

Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech

CHƯƠNG 11 KHAI PHAacute DỮ LIỆU

1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn

ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993

Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng

2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd

1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều

2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP

3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn

4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng

5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server

6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo

7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động

8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời

9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều

10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện

11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech

12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP

3 Xử lyacute phacircn tiacutech trực tuyến OLAP

MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave

dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu

ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave

thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu

HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave

ROLAP4 Khai phaacute dữ liệu

Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh

khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn

Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan

5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp

6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại

Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp

Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec

Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt

Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra

Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh

vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho

Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec

Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm

Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục

Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng

gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp

Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn

Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec

Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper

Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2

Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25

Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước

Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng

Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện

trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp

Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute

độ hỗ trợ ge ngưỡng minsup

độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan

Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn

Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết

Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu

MOLAP ROLAP HOLAP

Lưu trữ dữ liệu cơ sở

Khối Bảng quan hệ Bảng quan hệ

Lưu trữ thocircng tin tổng hợp

Khối Bảng quan hệ Khối

Hiệu suất thực hiện truy vấn

Nhanh nhất Chậm nhất Nhanh

Tiecircu thụ khocircng gian lưu trữ

Nhiều Thấp Trung bigravenh

Chi phiacute bảo trigrave Cao Thấp Trung bigravenh

Page 28: De cuong(1-11)

Một đại diện cho IBIS lagrave một đồ thị với caacutec nuacutet vagrave caacutec liecircn kết

IBIS bắt đầu với lựa chọn của một nuacutet vấn đề gốc sau đoacute caacutec nuacutet vị triacute khaacutec nhau được liecircn kết với nuacutet gốc

Caacutec nuacutet vị triacute nagravey sau đoacute được đaacutenh giaacute dựa trecircn những lập luận gắn liền với chuacuteng

Nemawashi (được sử dụng rộng ratildei tại Nhật Bản)

1-Một hoặc nhiều thagravenh viecircn của MDM được chỉ định lagrave điều phối viecircnCaacutec điều phối viecircn sau đoacute chọn người tham gia cograven lại

2-Điều phối viecircn xacircy dựng một tổng hợp caacutec sự lựa chọn vagrave sau đoacute caacutec chuyecircn gia đaacutenh giaacute caacutec lựa chọn

3-Điều phối viecircn lựa chọn một sự lựa chọn dựa trecircn kết quả ở trecircn(ở 2)

4-Sự thay thế được luacircn chuyển điều phối viecircn tigravem kiếm sự đồng thuận thocircng qua sự thuyết phục vagrave đagravem phaacuten

5-Nếu đạt được sự đồng thuận điều phối viecircn cho lưu thocircng một tagravei liệu magrave mỗi thagravenh viecircn MDM để lại dấu hiệu trecircn đoacute

55Nơi lagravem việc ảo

Nhiều tổ chức trecircn toagraven thế giới kinh doanh bất động sản cho cocircng nghệ hợp taacutec

Cocircng việc được trở thagravenh một điều bạn lagravem hơn lagrave một nơi bạn đi

Những thay đổi lớn nhất mang lại bởi nơi lagravem việc ảo coacute thể lagrave về văn hoaacute hay xatilde hội hơn lagrave về cocircng nghệ

Chương 6 Hệ thống thocircng tin điều hagravenh

61 Yacute nghĩa của EIS- Hệ thống thocircng tin điều hagravenh

- EIS lagrave một dạng đặc biệt của DSS được thiết kế để hỗ trợ ra quyết định ở cấp cao nhất của một tổ chức

- Lagrave một hệ thống thocircng tin hỗ trợ nhu cầu lập kế hoạch vagrave đaacutenh giaacute của caacutec nhagrave quản lyacute điều hagravenh

- EIS coacute thể giuacutep một CEO coacute được bức tranh tổng thể chiacutenh xaacutec nhất về caacutec hoạt động vagrave một bản toacutem tắt những gigrave magrave đối thủ cạnh tranh đang lagravem

- Caacutec hệ thống nagravey noacutei chung hoạt động dễ dagraveng vagrave trigravenh bagravey thocircng tin theo những caacutech dễ hiểu để việc tiếp thu được nhanh choacuteng (biểu đồ đồ thịhellip)

(Tagravei liệu thecircm EIS lagrave những loại hệ thống lagrave rất phức tạp trong tự nhiecircn Coacute thể noacutei hệ thống nagravey cũng cung cấp cho caacutec nhagrave quản lyacute với caacutec thiết bị coacute khả năng ra quyết định bằng caacutech sử dụng của noacute Hệ thống nagravey hoạt động trong điều kiện như vậy quan trọng như trong caacutec hệ thống khaacutec khocircng hỗ trợ Khả năng lưu trữ dữ liệu nặng lagravem cho noacute lyacute tưởng để được thocircng qua khocircng chỉ bởi caacutec doanh nghiệp lớn magrave cograven bởi caacutec doanh nghiệp nhỏ hơn Nhigraven chung hệ thống nagravey lagrave dagravenh cho caacutec nhacircn viecircn cấp cao hỗ trợ thagravenh thạo trong việc đưa ra caacutec quyết định quan trọng)

Caacutec phiecircn EIS tiecircu biểu- Phiecircn lagravem việc coacute thể bắt đầu với một baacuteo caacuteo về tigravenh higravenh tagravei chiacutenh vagrave kinh

doanh của một cocircng ty caacutec chỉ số hoạt động quan trọng được hiển thị rotilde ragraveng- EIS sẽ cho pheacutep caacutec giaacutem đốc điều hagravenh coacute thể đi sacircu vagraveo dữ liệu từ những con

số bất kỳ magrave noacute hỗ trợ- Việc điều hagravenh coacute thể lựa chọn một mức độ chi tiết ( VD danh số baacuten hagraveng) nếu

như cần điều tra thecircm- Lagrave một phương phaacutep tiếp cận coacute thể giuacutep việc ra quyết định tốt hơn

Những điều magrave EIS ko coacute- EIS khocircng phải lagrave sự thay thế cho caacutec hệ thống dựa trecircn caacutec maacutey tiacutenh khaacutec EIS

thực sự chỉ cung cấp dữ liệu cho caacutec hệ thống nagravey- Noacute khocircng thể biến caacutec bộ hệ điều hagravenh của maacutey tiacutenh thagravenh những ldquochuyecircn viecircn

giỏirdquo- Coacute thể được viacute một caacutech cao hơn như lagrave một trợ lyacute đaacuteng tin cậy coacute thể được gọi

đến bất khi nagraveo vagrave mỗi khi cần thiết

Tagravei liệu thecircm Sự khaacutec nhau giữa EIS vagrave DSS+ EIS thiết kế để hỗ trợ những người điều hagravenh cấp cao giuacutep họ khaacutem phaacute caacutec vấn đề vagrave caacutec cơ hội DSS hỗ trợ những nười phacircn tiacutech cố gắng trả lời cacircu hỏi caacutei gigrave coacute thể lagravem cugraveng với một cơ hội hoặc một vấn đề

Chiều EIS DSSNhững người sử dụng thocircng thường

Duyệt dữ liệu đi xuống truy xuất trạng thaacutei

Hỗ trợ phacircn tiacutech vagrave quyết định

Sự thuacutec đẩy Tiacutenh thiacutech hợp Tiacutenh hiệu quảỨng dụng Queacutet mocirci trường đaacutenh giaacute

hiệu suất nhận dạng caacutec vấn đề vagrave caacutec cơ hội

Caacutec quyết định quản lyacute trecircn caacutec lĩnh vực đa dạng

Hỗ trợ quyết định Caacutec chiacutenh saacutech caacutec quyết định khocircng coacute cấu truacutec ở mức cao vagrave hỗ trợ giaacuten tiếp

Hỗ trợ caacutec quyết định lặp lại caacutec quyết định khocircng thể đoaacuten trước ra quyết định khocircng coacute cấu truacutec vagrave baacuten cấu truacutec

Loại thocircng tin Caacutec thocircng tin tin tức thocircng tin becircn ngoagravei về khaacutech hagraveng đối thủ cạnh tranh mocirci trường caacutec baacuteo caacuteo theo yecircu cầu vagrave định thời về caacutec hoạt động becircn trong

Caacutec thocircng tin hỗ trợ caacutec tigravenh huống đặc biệt

Sử dụng coacute nguyecircn tắc

Dograve theo vết vagrave điều khiển nhận dạng cơ hội

Hoạch định tổ chức phacircn nhoacutem vagrave điều khiển

Khả năng phugrave hợp với những người sử dụng caacute nhacircn

Thiết kế loại ra quyết định cho mỗi người điều hagravenh caacute nhacircn bằng nhiều lựa chọn đầu ra

Cho pheacutep caacutec đaacutenh giaacute caacute nhacircn caacutec khả năng what-if lựa chọn loại hộp hội thoại

Đồ họa Phải coacute Lagrave một phần quan trọng của nhiều DSS

Thacircn thiện người sử dụng

Phải coacute Phải coacute nếu khocircng coacute người sử dụng trung gian

Xử lyacute thocircng tin Lọc neacuten thocircng tin dograve theo vết dữ liệu vagrave thocircng tin quan trọng

EIS kiacutech thiacutech caacutec cacircu hỏi caacutec cacircu trả lời bằng caacutech sử dụng DSS vagrave phản hồi lại EIS

Hỗ trợ caacutec thocircng tin chi tiết

Truy xuất thường xuyecircn caacutec mức chi tiết của bất kỳ thocircng tin tổng hợp nagraveo (duyệt dữ

Coacute thể coacute trong DSS nhưng khocircng thường

liệu chi tiết)Cơ sở mocirc higravenh Caacutec chức năng coacute sẵn bị hạn

chếLagrave điểm cốt lotildei của DSS

Cấu truacutec Theo người baacuten sản phẩm hoặc theo caacutec chuyecircn gia hệ thống thocircng tin

Theo người sử dụng hoặc caacute nhacircn hoặc caacutec chuyecircn gia từ caacutec trung tacircm thocircng tin hoặc phograveng ban hệ thống thocircng tin

Phần cứng Mainframe caacutec trạm RISC mạng LANs hoặc caacutec hệ thống phacircn bố

Mainframe caacutec trạm RISC caacutec maacutey PC hoặc caacutec hệ thống phacircn bố

Bản chất caacutec goacutei phần mềm

Truy xuất tương taacutec dễ dagraveng đến nhiều cơ sở dữ liệu truy xuất trực tuyến caacutec khả năng DBMS phức tạp caacutec liecircn kết phức tạp

Caacutec khả năng tiacutenh toaacuten lớn caacutec ngocircn ngữ mocirc higravenh mocirc phỏng ứng dụng vagrave caacutec bộ tạo DSS

Bản chất caacutec thocircng tin

Trigravenh bagravey thocircng tin được phaacutet sinh trước về quaacute khứ vagrave hiện tại tạo caacutec thocircng tin mới về quaacute khứ hiện tại tương lai

Tạo thocircng tin mới về quaacute khứ hiện tại tương lai

62 Lịch sử EIS- EIS xuất hiện lần đầu tiecircn tại MIT vagraveo những năm 1970

- Những EIS đầu tiecircn được phaacutet triển bởi caacutec doanh ngiệp lớn sẵn sagraveng chấp nhận rủi ro để đạt được lợi thế cạnh tranh

- Vagraveo những năm 1980 caacutec nhagrave cung cấp đatilde phaacutet triển một số cơ sở khaacutech hagraveng rộng vagrave cocircng nghệ EIS được tiếp tục phaacutet triển cho đến ngagravey nay

(Tagravei liệu thecircm Sử dụng DSSEIS cho phaacutet triển bền vững + Một số nghiecircn cứu đatilde được tiến hagravenh để kiểm tra việc thực hiện của EIS trong khu vực cocircng cộng vagrave chiacutenh phủ caacutec nước tổ chức kể từ khi chuacuteng được phaacutet triển theo định hướng lợi nhuận cho caacutec cocircng ty tư nhacircn (Hasan vagrave Hasan năm 1997) Theo một nghiecircn cứu tiến hagravenh tại Mỹ ở hơn 300 cocircng ty kết quả cho thấy sự khaacutec biệt của EIS giữa tư nhacircn vagrave chiacutenh phủ một số kết quả thuacute vị được phaacutet hiệnViacute dụ khoacute khăn hơn để chuyển tiền từ một tagravei khoản khaacutec trong một EIS của chiacutenh phủ cũng lagrave khoacute khăn hơn để biện giải thiacutech cho những chi phiacute phaacutet triển EIS của chiacutenh phủ Một nghiecircn cứu khaacutec được tiến hagravenh ở Australia

cho thấy rằng EIS cung cấp cho quản lyacute một higravenh ảnh chiacutenh xaacutec hơn về tổ chức thực hiện vagrave cung cấp hỗ trợ cho caacutec lợi iacutech chiến lược cải thiện khocircng chỉ cho caacutec nhagrave quản lyacute nhưng cograven cho phần cograven lại của tổ chức Dựa trecircn caacutec hệ thống được thiết kế cho caacutec cocircng ty tư nhacircn với một caacutech rotilde ragravengxaacutec định mục tiecircu EIS lagrave thiacutech hợp cho caacutec tổ chức cocircng cộng hiện đại nhưng cần phải được linh hoạt hơn vagrave kết thagravenh chugravem một phạm vi rộng hơn khả năng vagrave phương tiện hơn so với khu vực tư nhacircn ban đầu theo định hướng sản phẩm (Hasan vagrave Hasan năm 1997) Điều nagravey coacute thể lagrave do thực tế rằng caacutec hoạt động khu vực cocircng lagrave bắt buộc coacute taacutec động rộng phải đaacutep ứng sự mong đợi duy nhất cocircng cộng thường coacute mục tiecircu mơ hồ vagrave macircu thuẫn iacutet quyền tự chủ vagrave kiểm soaacutet việc ra quyết định vagrave nhacircn viecircn lagrave khoacute khăn hơn (Watson vagrave Carte2000) + Toacutem lại EIS lagrave một khaacutei niệm thagravenh cocircng noacute phaacutet triển qua nhiều năm tuy nhiecircn EIS khắc phục khiếm khuyết của migravenh bằng caacutech tiến hagravenh nghiecircn cứu liecircn tục)

63 Tại sao những người điều hagravenh hagraveng đầu lại khaacutec nhau- Họ lagrave những doanh nghiệp theo định hướng coacute suy nghĩ

- Coacute một khoảng khocircng gian rộng để kiểm soaacutet

- Họ chịu traacutech nhiệm cho việc thiết lập chiacutenh saacutech

- Họ đại diện cho tổ chức mocirci trường becircn ngoagravei

- Hagravenh động của họ tạo ra những kết quả đaacuteng kể về tagravei chiacutenh vagrave con người

Tần số caacutec hoạt động điều hagravenh- Xử lyacute xaacuteo trộn 42

- Hoạt động kinh doanh 32

- Phacircn bổ nguồn lực 17

- Đagravem phaacuten 3

- Những điều khaacutec 6

Handling Disturbances 42

Entrepreneurial Activites 32

Resource Allocation 17

Negotiation 3

Other 6

Những thocircng tin điều hagravenh cần thiết- Quản lyacute xaacuteo trộn coacute thể yecircu cầu sự chuacute yacute xung quanh đồng hồ

- Hoạt động kinh doanh yecircu cầu điều hagravenh để dự đoaacuten những thay đổi trong mocirci trường

- Nhiệm vụ phacircn bổ tagravei nguyecircn yecircu cầu lựa chọn người quản lyacute vagrave caacutec nguồn lực hạn chế được triển khai

- Đagravem phaacuten yecircu cầu cập nhật thocircng tin từng phuacutet để coacute thể xacircy dựng được sự đồng thuận

Caacutec loại thocircng tin điều hagravenh- Hệ thống kế toaacuten coacute liecircn quan đến việc tiacutenh toaacuten thu nhập hoạt động cho caacutec lĩnh

vực cụ thể lagrave quan trọng hơn so với caacutec hệ thống kế toaacuten truyền thocircng- Thocircng tin về thị trường khaacutech hagraveng cung cấp giaacute trị trong việc quyết định chiến

lược- Caacutec thocircng tin cần thiết thường được truyền đi trecircn một số hệ thống maacutey tiacutenh vagrave

nằm trong toagraven tổ chức- Caacutec thocircng tin được sử dụng thường lagrave ngắn hạn vagrave dễ thay đổi

Phương thức để xaacutec định thocircng tin cần thiết

Rockart xaacutec định được năm phương thức cơ bản để xaacutec định thocircng tin cần thiết

- Phương thức dựa trecircn kết quả- Phương thức rỗng- Phương thức chỉ số khoacutea- Phương thức tổng hợp nghiecircn cứu- Phương thức dựa vagraveo nhacircn tố then chốt dẫn đến thagravenh cocircng

64 Thagravenh phần EIS

- Sản phẩm EIS đầu tiecircn được phaacutet triển để sử dụng trecircn maacutey tiacutenh cấu higravenh cao nhưng caacutec sản phẩm hiện nay nhằm mục tiecircu lagrave nền tảng ClientServer

- Những nền tảng linh hoạt hơn coacute thể thiacutech ứng với thay đổi trong tổ chức vagrave cocircng nghệ

- Sử dụng dữ liệu thời gian thực dẫn đến quyết định nhanh hơn nhiều thocircng tin hơn

Thagravenh phần phần cứng- Một EIS khocircng đogravei hỏi coacute phần cứng cụ thể hoặc duy nhất nagraveo- Chigravea khoacutea của vấn đề lagrave để đảm bảo rằng caacutec thagravenh phần của EIS tối ưu hoacutea vagrave

phugrave hợp với tagravei nguyecircn maacutey tiacutenh của tổ chức- Hệ thống nagravey phải được cấu higravenh để caacutec nguồn tagravei nguyecircn phugrave hợp với những

người điều hagravenh chuacuteng

Thagravenh phần phần mềm- Traacutei ngược với phần cứng phần mềm thường được chuyecircn mocircn hoacutea cao cho caacutec

bagravei toaacuten về miền- Sự chuyecircn mocircn hoacutea nagravey thường đạt được bằng caacutech sử dụng thagravenh phần off-the-

shelf cho toagraven bộ EIS vagrave caacutec mocirc-đun tugravey chỉnh để đaacutep ứng nhu cầu cụ thể- Lotus Notes lagrave một viacute dụ điển higravenh Noacute coacute thể được sử dụng một migravenh hoặc coacute

thể phục vụ becircn thứ ba mocirc-đun plug-in

Cocircng nghệ EIS hiện nay

Dobrzeniecki đề xuấtphacircn loạitừng cấptheo bachức năng- Loại 1 sản phẩm bao gồmmột bộ đầy đủcaacutec ứng dụngtừ mộtnhagrave cung cấp- Loại 2 sản phẩm đượcthựchiệnở phần đầu củacaacutecsản phẩmDSS đượcphaacutet triển

bởicugravengmộtnhagrave cung cấp- Loại 3 sản phẩmkết hợp với nhautheo bất kỳ số lượngthuộc sở hữu củacocircng ty

65 Xacircy dựng EIS

- Xacircy dựngmộtEISgiống nhưxacircydựngmột số hệ thống khaacutec củamocirc higravenh hệ thống thocircng tin

- Việcphaacutet triểncấu truacutecnecircn được theo dotildeitừ quaacute trigravenh thiết kế đến quaacute trigravenhthực hiện

- Tuy nhiecircn một dự aacuten phaacutet triển EIScoacute xu hướnglagrave thống nhấtvagraveyecircu cầu hỗ trợ caacutec nhagrave quản lyacute latildenh đạo

- Xacircy dựng một EIScoacute thểphaacutet hiện ra đượccaacutectigravenh huống khoacute khănmagravemột nhagrave phaacutet triển chưabao giờ gặp phải

Mocirc higravenh EIS

Khung phaacutet triển một EIS

- Watson et al đề nghị xacircy dựngkhung với ba thagravenh phần+ Caacutech tiếp cận tập trung vagraveo yếu tốcon người vagrave dữ liệu coacute liecircn quan đến EIS+ Quaacute trigravenh phaacutet triển cần sự linh hoạt vagrave tương taacutec+ Người sử dụng - hệ thống hộp thoại bao gồm một ngocircn ngữ hagravenh động để xử lyacute caacutec lệnh

Lợi iacutech của EIS- Dễ duy trigrave caacutec mục tiecircu coacute tổ chức- Dễ truy xuất thocircng tin- Cho pheacutep người sử dụng nacircng cao hiệu suất hơn

- Tăng chất lượng ra quyết định- Cung cấp sự cải tiến cạnh tranh- Tiết kiệm thời gian của người sử dụng- Tăng khả năng vagrave chất lượng giao tiếp- Cung cấp khả năng điều khiển tốt hơn trong tổ chức- Cho pheacutep tham gia caacutec vấn đề vagrave caacutec cơ hội- Cho pheacutep hoạch định- Cho pheacutep tigravem kiếm nguyecircn nhacircn của một vấn đề- Thảo matilden caacutec yecircu cầu của người điều hagravenh

Hạn chế của EIS vagrave 1 số sai lầm cần traacutenh

- Chi phiacute một cuộc khảo saacutetnăm1991 chothấychi phiacute phaacutet triểntrungbigravenh365000USDvớichi phiacute vận hagravenhhagraveng năm lagrave$200000 (EIS)

- Cocircng nghệ hạn chếEIScần phảiđượctiacutech hợp hoagraven toagravenvagraveokiếntruacuteccủadoanh nghiệphiện tại do đoacute noacutelagrave một thaacutech thứclớn đối vớithiết kế

- Hạn chế tổ chức cơ cấu tổ chứccoacute thể khocircng phugrave hợp

Sự hạn chế về tổ chức- Chương trigravenh nghị sự vagrave thời gian chệch EIS mocirc tả một phần việc thực hiện một

chương trigravenh nghị sự vagrave coacute thể dễ dagraveng đạt được sự tin cậy một caacutech chắc chắn- Đồng bộ hoacutea việc quản lyacute sự tin cậy đuacuteng luacutec đặc biệt baacuteo caacuteo EIS coacute thể phaacute

vỡ sự ổn định thiết lập caacutec chu trigravenh baacuteo caacuteo một caacutech tốt nhất- Sự bất ổn EIS phản ứng nhanh coacute thể gacircy ra việc taacutec động trở lại một caacutech

nhanh choacuteng dẫn đến sự thiếu ổn định trong tổ chức

Sự thất bại lagrave thay thế khocircng thể chấp nhận được- Một số yếu tố lagravem EIS thất bại

+ Thiếu sự hỗ trợ về mặt quản lyacute+ Vấn đề chiacutenh trị+ Thất bại của nhagrave phaacutet triển+ Lỗi về cocircng nghệ+ Giaacute cả+ Thời gian

66 Ra quyết định điều hagravenh trong tương lai vagrave EIS

- Coacute một vagravei điều kiện sẽ được hợp nhất cho việc chuyển đổi cocircng nghệ Trong đoacute một vagravei điều kiện coacute thể dễ dự đoaacuten Hai điều kiện magrave ta coacute thể thấy lagrave+ Phaacutet triển cocircng nghệ maacutey tiacutenh trong việc điều hagravenh sẽ tạo ra sự chuyển đổi được chấp nhận một caacutech dễ dagraveng hơn+ Mở rộng traacutech nhiệm điều hagravenh sẽ mở rộng nhu cầu thocircng tin

Tương lai của EIS- EIS thocircng minh Những tiến bộ trong cocircng nghệ AI sẽ được triển khai trong caacutec

EIS- EIS đa phương tiện Cơ sở dữ liệu đa phương tiện sẽ cho pheacutep tiacutech hợp văn bản

giọng noacutei vagrave higravenh ảnh trong tương lai- EIS thocircng tin Tương lai EIS sẽ mở rộng hơn trong việc sử dụng dữ liệu becircn

ngoagravei doanh nghiệp- EIS kết nối Giao tiếp với băng thocircng rộng cho pheacutep kết nối liecircn thocircng lớn hơn

Chương 7 HỆ CHUYEcircN GIA VAgrave TRIacute TUỆ NHAcircN TẠO

71 Caacutec khaacutei niệm

72 Triacute thocircng minh của triacute tuệ nhacircn tạo

73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia

74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia

75 Lợi iacutech vagrave hạn chế của hệ chuyecircn gia

71 Caacutec khaacutei niệm

Chuyecircn mocircn (Expertise) sự hiểu biết rộng trong 1 lĩnh vực hẹp

Hệ chuyecircn gia (Expert Systems)1 chương trigravenh maacutey tiacutenh sử dụng 1 tập caacutec luật dựa trecircn tri thức của con người để giải quyết caacutec vấn đề đogravei hogravei phải coacute sự chuyecircn mocircn

Một số hệ chuyecircn gia nổi tiếng

DENDRAL (Standford 1960s Edward Feigenbaum)

MYCIN (Standford1970s Edward Shortliffe)

PROSPECTOR (MIT 1979)

Triacute tuệ nhacircn tạo (Artificial Intelligence ndash AI)

Triacute tuệ nhacircn tạo một bộ phacircn của ngagravenh khoa học maacutey tiacutenh quan tacircm đến việc thiết kế caacutec hệ thống maacutey tiacutenh thocircng minh đoacute lagrave caacutec hệ thống đưa ra caacutec đặc điểm magrave từ đoacute chuacuteng ta liecircn hệ với sự thocircng minh trong hagravenh động của con người (Barr vagrave Feigenbaum 1981)

Mục điacutech của AI

Mục điacutech khoa học xaacutec định caacutec gợi yacute để giải thiacutech caacutec loại khaacutec nhau của triacute tuệ thực

Mục điacutech kỹ thuật giải quyết caacutec vấn đề trong thế giới thực

Triacute tuệ nhacircn tạo kế thừa nhiều yacute tưởng quan điểm kỹ thuật từ caacutec ngagravenh khoa học khaacutec

- Triết học

- Logic Toaacuten học

- Tiacutenh toaacuten

- Khoa học tacircm lyacute Khoa học nhận thức

- Sinh học Thần kinh học

- Tiến hoacutea

Caacutec lĩnh vực ứng dụng trong Triacute tuệ nhacircn tạo

Mạng nơ ron thần kinh (Neural Networks)

Tiacutenh toaacuten sự tiến hoacutea

(Evolutionary Computation)

Hệ chuyecircn gia (Expert Systems)

Kỹ thuật xử lyacute tiếng noacutei (Speech Processing)

Kỹ thuật xử lyacute ngocircn ngữ tự nhiecircn

(Natural Language Processing)

Lập kế hoạch (Planning)

Robot (Robotics)

Khoa học higravenh ảnh (Vision)

Caacutec kỹ thuật thocircng dụng dugraveng trong AI

Biểu diễn(Representation)

Học (Learning)

Caacutec luật (Rules)

Tigravem kiếm (Search)

72 Triacute thocircng minh của triacute tuệ nhacircn tạo

Con người suy diễn như thế nagraveo

Phacircn loại (Categorization)

Caacutec quy tắc cụ thể

Heuristics

Kinh nghiệm trước đoacute

Dự tiacutenh trước

Maacutey tiacutenh suy diễn như thế nagraveo

Lập luận dựa trecircn luật IF-THEN mocirc tả tri thức được matilde hoacutea dưới dạng caacutec luật

Caacutec khung (Frames) lagrave caacutec đại diện mocirc tả caacutec tigravenh huống giống nhau lagrave điển higravenh của một vagravei phacircn loại

Lập luận dựa trecircn caacutec trường hợp mocirc phỏng giải phaacutep trước đoacute cho một vấn đề hiện tại

Nhận dạng mẫu phaacutet hiện acircm thanh higravenh dạng hoặc caacutec chuỗi dagravei

Caacutec dạng khaacutec của Triacute tuệ nhacircn tạo

Học maacutey- mạng nơron vagrave giải thuật di truyền

Lập trigravenh tự động ndash lagrave những kỹ thuật tạo ra caacutec chương trigravenh để lagravem 1 nhiệm vụ riecircng biệt (cho pheacutep những người khocircng phải lagrave người lập trigravenh coacute thể lập trigravenh được)

Cuộc sống nhacircn tạo ndash nỗ lực để taacutei tạo caacutec hiện tượng sinh học trong caacutec hệ thống dựa trecircn maacutey tiacutenh

73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia(Expert Systems- ES)

Theo Jackson (1999) Một hệ chuyecircn gia lagrave một chương trigravenh maacutey tiacutenh mocirc tả vagrave suy diễn với tri thức của một vagravei lĩnh vực để giải quyết vấn đề hay đưa ra caacutec lời khuyecircn

Cấu truacutec cơ bản của ES được dựa theo cấu truacutec chung của DSS Sự khaacutec biệt chiacutenh giữa ES vagraveDSS lagrave hệ ES thu thập caacutec kiến thức từ những

chuyecircn gia trong lĩnh vực quan tacircmĐặc trưng của hệ chuyecircn gia Hiệu quả cao Thời gian trả lời thỏa đaacuteng Độ tin cậy cao Dễ hiểu

Giao diện người dugraveng trong ES

Thiết kế giao diện người dugraveng tập trung vagraveo caacutec yếu tố như dễ dagraveng sử dụngcoacute độ tin cậy cao giảm tải những khoacute khăn khi sử dụng

Thiết kế necircn coacute một số tương taacutec (đầu vagraveo kiểm soaacutet vagrave truy vấn)

Cấu tạo giao diện người dugraveng gồm coacute magraven higravenh cảm ứng bagraven phiacutem buacutet saacuteng lệnh thoại caacutec phiacutem chuyecircn dụng

Cơ sở tri thức (Knowledge Base)

Chứa đựng caacutec tri thức cụ thể miền thu được từ caacutec chuyecircn gia miền

Coacute thể chứa caacutec mocirc tả caacutec hagravenh vi giải quyết vấn đề caacutec ragraveng buộc caacutec heuristics

Thagravenh cocircng của một ES dựa trecircn tiacutenh đầy đủ vagrave tiacutenh chiacutenh xaacutec của cơ sở tri thức

Mocirc tơ suy diễn (Inference Engine)

Ở đacircy tri thức được đặt để sử dụng tạo ra caacutec giải phaacutep để giải quyết vấn đề

Mocirc tơ nagravey coacute khả năng thực hiện diễn dịch hoặc suy diễn dựa trecircn caacutec luật hay caacutec caacutec sự kiện

Đồng thời cũng coacute khả năng sử dụng caacutec suy diễn mờ hay khocircng chiacutenh xaacutec dựa trecircn xaacutec suất hay aacutenh xạ mẫu

Vograveng điều khiển suy diễn

1 Aacutenh xạ caacutec luật với caacutec sự kiện đatilde được cho

2 Chọn luật để thực hiện

3 Thực hiện luật bằng caacutech thecircm caacutec sự kiện được suy diễn ra vagraveo bộ nhớ lagravem việc

Chuỗi suy diễn (Chaining)

Suy diễn tiến (forward chaining) maacutey suy diễn bắt đầu từ dữ liệu ban đầu vagrave thực hiện việc suy luận để đưa ra caacutec kết luận cuối cugraveng

Suy diễn lugravei (backward chaining) maacutey suy diễn bắt đầu từ dữ liệu điacutech vagrave tigravem ra tri thức hỗ trợ cho dữ liệu điacutech đoacute

Viacute dụ suy diễn lugravei

R1 Nếu coacute A vagrave B thigrave suy ra coacute D

R2 Nếu coacute B thigrave suy ra coacute C

R3 Nếu coacute C vagrave D thigrave suy ra coacute E

Ta coacute E ta xem trong 3 luật R1 R2 R3 luật nagraveo coacute E ta thấy R3 chứa E đồng thời chứa C vagrave D Xeacutet tiếp trong 2 luật R1 R2 luật nagraveo chứa C vagrave D R2 chứa C R3 chứa D Từ đoacute ta coacute được caacutec tri thức hỗ trợ suy diễn vagrave kết luận lagrave nếu coacute A vagrave B thigrave sẽ coacute E Hay nếu A vagrave B đuacuteng thigrave sẽ coacute E

Viacute dụ suy diễn tiến

Giả sử coacute tập chứa 3 luật sau

R1 Nếu coacute A vagrave B thigrave suy ra coacute D

R2 Nếu coacute B thigrave suy ra coacute C

R3 Nếu coacute C vagrave D thigrave suy ra coacute E

Nếu ta coacute A vagrave B thigrave chuacuteng ta suy ra được D từ R1 vagrave suy ra C từ R2 Với D vagrave C đatilde được suy ra ở trecircn giờ chuacuteng ta suy ra được E từ R3

Viacute dụ thực tế

Giả sử muốn biết magraveu của một con vật nuocirci tecircn lagrave Fred biết rằng noacute kecircu ộp ộp vagrave ăn ruồi

Coacute tập 4 luật ban đầu như sau

R1 Nếu X kecircu ộp ộp vagrave ăn ruồi thigrave X lagrave con ếch

R2 Nếu X kecircu chiecircm chiếp vagrave biết hoacutet thigrave X lagrave con chim

R3 Nếu X lagrave con ếch thigrave X coacute magraveu xanh

R4 Nếu X lagrave con chim thigrave X coacute magraveu vagraveng

74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia

Expert system shells lagrave một tập caacutec goacutei phần mềm vagrave caacutec cocircng cụ dugraveng để phaacutet triển caacutec hệ chuyecircn gia

Những Expert system shells đầu tiecircn thường rất rườm ragrave Mặc dugrave vậy noacute vẫn giuacutep cho người sử dụng sẽ khocircng phải bắt đầu lại từ đầu khi xacircy dựng một hệ chuyecircn gia mới

Những shell hiện đại bao gồm hai mocirc-đun chiacutenh lagrave cocircng cụ xacircy dựng một tập quy tắc vagrave mocirc tơ suy diễn

Xacircy dựng hệ chuyecircn gia

Bước 1 xacircy dựng mocirc higravenh bagravei toaacuten xaacutec định vấn đề nhiệm vụ magrave hệ thống sẽ thực hiện Caacutec dạng bagravei toaacuten cần hệ chuyecircn gia

Bagravei toaacuten diễn giải (InterPretation)

Bagravei toaacuten dự baacuteo (Prediction)

Bagravei toaacuten chuẩn đoaacuten (Diagnose)

Bagravei toaacuten gỡ rối (Debugging)

Bagravei toaacuten thiết kế

Tương tự như một dự aacuten phần mềm để xacircy dựng một hệ chuyecircn gia cần phải coacute caacutec yếu tố về nhacircn lực tagravei nguyecircn vagrave thời gian Những yếu tố nagravey ảnh hưởng đến giaacute thah của một hệ chuyecircn giaTrong phần nagravey cacircu hỏi thường được đặt ra lagrave tại sao cần phải xacircy dựng một hệ chuyecircn giaTrước khi bắt đầu phải xaacute định rotilde bagravei toaacuten đạt ra lagrave jiAi lagrave chuyecircn giaAi lagrave người sử dụng

1 Diễn giải (InterPretation) Nghiecircn cứu 1 vấn đề -gt Dựa trecircn những biểu hiện thuộc tiacutenh đặc trưng becircn ngoagravei -gt Tư vấn

(hoặc đưa ra kết luận hay mocirc tả dễ hiểu từ tập dữ liệu thocirc)

2 Bagravei toaacuten dự baacuteo (Prediction) Coacute thể dự đoaacuten được hagravenh vi kết quả dựa trecircn caacutec hiện tượng -gt dự baacuteo

VD Dự baacuteo thời tiết động đấthellip

3 Bagravei toaacuten chẩn đoaacuten (Diagnoss) Xaacutec định caacutec lỗi caacutec bộ phận hỏng hoacutec của hệ thống dựa trecircn caacutec dữ liệu quan saacutet được

4 Bagravei toaacuten gỡ rối (Debugging) Mocirc tả caacutec phương phaacutep khắc phục hệ thống khi gặp sự cố

5 Bagravei toaacuten thiết kế Lựa chọn cấu higravenh caacutec đối tượng nhằm thoả matilden một số ragraveng buộc nagraveo đoacute

6 Giảng dạy Phần mềm dạy học coacute thể chuẩn đoaacuten vagrave sủa lỗi của học sinh trong quaacute trigravenh học tập

Để xaacutec định đuacuteng bagravei toaacuten magrave chuacuteng ta cần giải quyết thigrave phải trả lời đc một số cacircu hỏi

- cần hệ chuyecircn gia

Bước 2 thu thập tri thức lựa chọn cocircng cụ vagrave aacutep dụng

Trong bước thu thập tri thức vấn đề quan trọng lagrave lựa chọn chuyecircn gia những người magrave sẽ đoacuteng goacutep tri thức cho hệ thống Thocircng thường trong suốt quaacute trigravenh phaacutet triển thigrave chuyecircn gia được xem như một thagravenh viecircn của đội phaacutet triển

Hiện nay coacute rất nhiều cocircng cụ để xacircy dựng một hệ chuyecircn gia Phổ biến nhất lagrave JESS CLIPS vagrave OPS5

Bước 3 Thiết kế cơ sở tri thức thiết kế hệ thốngTri thức được biểu diễn trường minh trong cơ sở tri thức

Caacutec chuyecircn gia vagrave kỹ sư tri thức sẽ đối thoại với nhau bằng caacutec kỹ thuật đối thoại Suy diễn (SD) bảng Mocirc higravenh hoacutea SD quy nạp phacircn loại

Vấn đề bagraveo trigrave vagrave phaacutet triển

Caacutec hệ chuyecircn gia đogravei hỏi phải bảo trigrave vagrave phaacutet triển nhiều hơn so với caacutec hệ thống khaacutec Phải thường xuyecircn bổ sung tri thức mới vagrave thay đổi caacutec tri thức cũ để đổi mới hệ chuyecircn gia

Thu thập vagrave khắc phục lỗi do người sử dụng phaacutet hiện để kịp thời khắc phục những sai soacutet của hệ chuyecircn gia

75 Lợi iacutech vagrave hạn chế của caacutec hệ chuyecircn gia

Một số lợi iacutech chiacutenh

Thời gian trả lời hợp lyacute bằng hoặc nhanh hơn so với chuyecircn gia (người) để đi đến cugraveng một quyết định Hệ chuyecircn gia lagrave một hệ thống thời gian thực (real time system)

Khả năng trả lời với mức độ tinh thocircng bằng hoặc cao hơn so với chuyecircn gia (người) trong cugraveng lĩnh vực

Hệ chuyecircn gia giuacutep cho hiệu quả lagravem việc tăng bằng việc sử dụng tập caacutec luật một caacutech nhanh choacuteng magrave ko bị nhầm lẫn chuyecircn gia lagrave người coacute thể quecircn đi một số tri thức cơ sở lyacute luậ nhưng HCG thigrave ko

Quyết định của một người chuyecircn gia coacute thể bị thay đổi vagrave ko coacute tiacutenh thống nhất như quyết định của một hệ chuyecircn gia tạo ra

Hệ chuyecircn gia giuacutep cho người sử dụng coacute thể trau dồi sự hiểu biết trecircn lĩnh vuej cụ thể magrave noacute giải quyết hỗ trợ người ra quyết định coacute trigravenh độ như 1 chuyecircn gia trong quaacute trigravenh gia quyết định

Kiến thức của rất nhiều chuyecircn gia về một lĩnh vực nagraveo đoacute được đưa vagraveo hệ chuyecircn gia lagravem cho CSTT cuat HCG phong phuacute vagrave rộng lớn hơn rất nhiều

HCG giải thiacutech caacutec bước suy luận một caacutech dễ hiểu nhất quaacuten luacutec nagraveo cũng coacute thể sử dụng ko như chuyecircn gia con người

Hạn chế của caacutec hệ chuyecircn gia

Nhược điểm lớn nhất của hệ chuyecircn gia lagrave những yacute kiến chuyecircn mocircn thường rất khoacute matilde hoacutea vagrave giải neacuten

Hệ chuyecircn gia khocircng coacute khả năng tự học tự cập nhật kiến thức mới như caacutec chuyecircn gia magrave cần phải được matilde hoacutea lại khi noacute được cập nhật

Hệ chuyecircn gia khocircng thể nhận ra được vấn đề khocircng nằm trong miền kiến thức của hệ thống

Chương 8 Tri thức vagrave tiếp nhận

1 Bao gồm caacutec vấn đề

Dữ liệu thực tế đo lường hoặc quan saacutet coacute hoặc khocircng coacute bối cảnh

Thocircng tin dữ liệu được tổng hợp một caacutech hữu iacutech để giải quyết những khoacute khăn trong việc đưa ra quyết định

Tri thức bao gồm caacutec ứng dụng quy tắc thocircng tin hướng dẫn của người ra quyết định

2 Những caacutei nhigraven về tri thức

Đại diện lagravem thế nagraveo để diễn tả tri thức viacute dụ như một quyển saacutech khocircng phải lagrave tri thức nhưng noacute lại lagrave một đại diện của tri thức

Sản xuất tri thức lagrave một tập hơp của hagraveng tồn kho coacute thể được sản xuất cũng như mua lại

Tri thức lagrave 1 trong 6 trạng thaacutei của hệ thống

1Dữ liệu 2Thocircng tin 3Cấu truacutec thocircng tin 4Sự thấu hiểu 5Yacute kiến 6 Quyết định

3 Caacutec loại tri thức Phổ biến mocirc tả dữ liệu thocircng tin thủ tục mọi thứ lagravem như thế nagraveo lập luận chiacutenh saacutech hoặc caacutec quy tắc

4 Thu thập Tri thức hệ chuyecircn gia Hầu hết caacutec phương phaacutep đều bắt đầu với mocirc higravenh của caacutec taacutec vụ trong đoacute

hệ chuyecircn gia được xacircy dựng Trong đoacute mocirc tả về caacutec lĩnh vực được tạo ra Caacutec kỹ sư sử dụng caacutec mocirc higravenh giả thuyết vagrave nhận thức về quaacute trigravenh phacircn

tiacutech để gợi ra caacutech giải quyết vấn đề về tri thức từ caacutec chuyecircn gia

5 Caacutec chiều của thu thập tri thức KE- driven caacutec kỹ sư trao đổi trực tiếp với caacutec chuyecircn gia Expert-driven Caacutec chuyecircn gia trực tiếp đưa chuyecircn mocircn của họ vagraveo hệ

thống maacutey tiacutenh Machine-driven Sử dụng caacutec cocircng cụ suy luận để triacutech xuất tri thức từ một

tập caacutec viacute dụ

6 Kỹ thuật thu thập tri thức Trao đổi gồm 2 loại cơ bản lagrave coacute cấu truacutec(coacute kịch bản) vagrave khocircng coacute cấu

truacutec( đối thoại trực tiếp) Giao thức phacircn tiacutech bằng lời Khi caacutec chuyecircn gia thực hiện một cocircng việc

của họ thigrave một bản ghi về cocircng việc đoacute được thực hiện Caacutec kỹ sư sẽ xacircy dựng mocirc higravenh cho những gigrave được ghi lại trong bản ghi

Phương phaacutep sagraveng lọc caacutec chuyecircn gia so saacutenh caacutec nhoacutem liecircn tiếp trong ba đối tượng vagrave cho biết tại sao nhoacutem thứ hai lại khaacutec nhoacutem thứ ba

7 Thu thập tri thức từ nhiều nguồn Thu thập tri thức từ nhiều nguồn lagrave cần thiết để coacute được đầy đủ caacutec tri thức

cho một vấn đề quan điểm yacute kiến traacutei ngược nhau thường phaacutet sinh Phương phaacutep đồng thuận sẽ giuacutep giải quyết được vấn đề macircu thuẫn Kỹ thuật phacircn tiacutech Meta lagrave kỹ thuật được aacutep dụng trong caacutec trường hợp

khaacutec Caacutech tiếp cận bằng định lượng đogravei hỏi caacutec kỹ sư cần cacircn nhắc yếu tố đầu vagraveo của caacutec chuyecircn gia khaacutec nhau

8 Xaacutec nhận hợp lệ vagrave kiểm tra tri thức Một khi thu thập tri thức noacute phải được đaacutenh giaacute về khả năng sử dụng vagrave độ

chiacutenh xaacutec Hai vấn đề cụ thể lagrave hiệu lực của những kiến thức vagrave kiểm tra việc xacircy dựng cơ sở của tri thức

Cần xaacutec nhận xem liệu hệ thống coacute thể hoạt động ở mức độ tối thiểu khocircng

Xaacutec minh liecircn quan đến việc so saacutenh từng chi tiết kỹ thuật của hệ thống những gigrave đatilde được thực hiện cuối cugraveng

9 Một số caacutec biện phaacutep xaacutec nhận Độ chiacutenh xaacutec Khả năng thiacutech nghi Mức độ đầy đủ Bề rộng Độ sacircu Hiệu lực Tổng quan Chiacutenh xaacutec Hiện thực Độ tin cậy Tiacutenh hữu dụng Mức độ

Chương 9 Học maacutey

1 Logic mờ vagrave ngocircn ngữ mờ(Fuzzy Logic and Linguistic Ambiguity)

Ngocircn ngữ tự nhiecircn gồm những khaacutei niệm mơ hồ vagrave khocircng chiacutenh xaacutectruyền tải ngữ nghĩa thocircng qua tiacutenh xấp xỉkhocircng rotilde ragraveng

Những xấp xỉ nagravey giuacutep con người coacute thể truyền tải hết được yacute nghĩa nhưng maacutey thigrave khocircng hiểu

Lagravem sao biểu diễn caacutec tri thức sử dụng caacutec khaacutei niệm khocircng rotilde ragraveng(mờ) hoặc khocircng chiacutenh xaacutec

2 Khaacutei niệm cơ bản của logic mờ tập mờ lagrave những tập hợp khocircng coacute một giới hạn rotilde Mỗi phần tử của noacute chỉ

chứa một mức độ hagravem liecircn thuộc của từng phần tử Vigrave vậy tập mờ khocircng giống như tập cổ điển Tập mờ coacute thể kết hợp với nhau qua những luật mờ magrave đặc trưng cho những hagravenh động trạng thaacutei vagrave thuộc tiacutenh của logic mờ được tận dụng khi thực hiện một bộ điều khiển mờ

Logic mờ dựa trecircn yacute tưởng mỗi phần tử thuộc vagraveo một tập hợp ở một mức độ nagraveo đấy

Locircgic mờ cho pheacutep độ liecircn thuộc (microA )coacute giaacute trị trong khoảng (01) Locircgic mờ coacute thể được coi lagrave mặt ứng dụng của lyacute thuyết tập mờ để xử lyacute caacutec

giaacute trị trong thế giới thực cho caacutec bagravei toaacuten phức tạp

3 So saacutenh tiacutenh đuacuteng đắn logic mờ vagrave xaacutec suất Xaacutec suất thigrave đề cập đến khả năng xảy ra một biến cố hay một điều gigrave đoacute Logic mờ đề cập đến cấp độ magrave đặc tiacutenh ở hiện tại

o viacute dụ1 người coacute chiều cao 6 feet thigrave coacute cấp độ lagrave 05 về chiều cao

4 Ưu điểm của logic mờ Caacutech tiếp cận rất tự nhiecircnkhocircng phức tạp Coacute thể mocirc higravenh hoacutea caacutec hagravem phi tuyến tugravey yacute phức tạp

Coacute thể tận dụng được kinh nghiệm từ những chuyecircn gia hagraveng đầu trong mọi lĩnh vực

Logic mờ được xacircy dựng dựa trecircn ngocircn ngữ tự nhiecircnNền tảng của logic mờ lagrave dựa trecircn cơ sở giao tiếp của con người

5 Nhược điểm của logic mờ Trong 1 hệ thống phức tạpsử dụng logic mờ coacute thể trở thagravenh trở ngại cho

việc xaacutec thực độ tin cậy của hệ thống Cơ chế lập luận mờ khocircng thể học hỏi từ những lỗi sai

6 Mạng noron nhacircn tạo(ANN) Mạng noron nhacircn tạo lagrave một mocirc phỏng xử lyacute thocircng tinđược nghiecircn cứu ra

từ hệ thống thần kinh của sinh vậtgiống như bộ natildeo để xử lyacute thocircng tin ANNs lagrave chương trigravenh dựa trecircn maacutey tiacutenh đơn giản coacute chức năng lagrave một mocirc

higravenh bagravei toaacuten khocircng gian dựa trecircn thử nghiệm vagrave baacuteo lỗi

7 Học từ kinh nghiệm Tiến trigravenh Một mẫu dữ liệu được biểu diễn như một mạng lưới noronANN ldquodự

đoaacutenrdquo 1 đầu radự đoaacuten được so saacutenh với giaacute trị thực tế hoặc giaacute trị chiacutenh xaacutecNếu đoaacuten được chiacutenh xaacutec thigrave khocircng coacute hagravenh động nagraveo được thực hiện

Nếu dự đoaacuten sai ANN kiểm tra lại vagrave xaacutec định lại thocircng số để điều chỉnh Một mẫu dữ liệu khaacutec được biểu diễn vagrave quaacute trigravenh nagravey được lặp lại

8 Nguyecircn tắc cơ bản của cocircng nghệ nơron Caacutec yếu tố xử lyacute cơ bản trong hệ thống thần kinh của con người lagrave tế bagraveo

thần kinhMạng lưới của tế bagraveo nagravey lagrave liecircn kết với nhau nhận được thocircng tin từ caacutec cảm biến trong mắt taihellip

Thocircng tin nhận được bởi tế bagraveo thần kinh hoặc lagrave sẽ kiacutech thiacutech noacute(sẽ được chuyển qua 1 thocircng điệp dọc theo mạng lưới) hoặc lagrave sẽ ngăn cản noacute(ngăn cản dograveng thocircng tin)

Độ nhạy coacute thể thay đổi qua thời gian hoặc sau khi coacute được kinh nghiệm

9 Cấu truacutec mạng Một ANN gồm 3 lớp cơ bản

Lớp đầu vagraveo nhận dữ liệu Lớp becircn trong hoặc lagrave lớp ẩn xử lyacute dữ liệu Lớp đầu ra chuyển tiếp kết quả cuối cugraveng của mạng

10Mạng nơ ron Thường coacute nhiều đầu vagraveo mỗi đầu vagraveo với mức ảnh hưởng vagrave tầm quan

trọng riecircng của noacute Một đầu vagraveo quan trọng coacute thể được sử dụng để khuếch đại đầu ra caacutec hagravem trạng thaacutei tổng hợp caacutec trọng số của caacutec yếu tố

đầuvagraveo khaacutec nhauvagraveo một giaacute trị duy nhất Caacutec hagravem chuyển giao xử lyacute caacutec giaacute trị trạng thaacutei vagrave tạo đầu ra

11Huấn luyện mạng nơ ron Trong mocirc higravenh coacute giaacutem saacutetANN được đến so saacutenh dự đoaacuten của chiacutenh

noacute với thocircng tin phản hồi coacute chứa caacutec kết quả mong muốn ANN sẽ phải tigravem caacutech thay đổi caacutec tham số becircn trong củamigravenh (caacutec trọng số vagrave caacutec ngưỡng) để tạo necircn một aacutenh xạ coacute khả năng aacutenh xạcaacutec đầu vagraveo thagravenh caacutec đầu ra mong muốn Sự thay đổi nagravey được tiến hagravenh nhờ việc so saacutenh giữa đầu ra thực sự vagrave đầu ra mong muốn

Trong mocirc higravenh khocircng coacute giaacutem saacutetANN nhận được dữ liệu vagraveo nhưng khocircng phải coacute bất kỳ thocircng tin phản hồi về kết quả mong muốn

Phần lớn caacutec ứng dụng nằm trong vugraveng của caacutec bagravei toaacuten ước lượng như mocirc higravenh hoacuteathống kecirc neacuten lọc phacircn cụm

12Lợi iacutech Liecircn kết với mạng noron Traacutenh caacutech lập trigravenh tường minh Giảm nhu cầu của chuyecircn gia ANNs thigrave thiacutech nghi với caacutec yếu tố đầu vagraveo thay đổi Khocircng cần thiết cho cơ sở tri thức tinh chế ANNs coacute tiacutenh động vagrave cải thiện với việc sử dụng Coacute khả năng xử lyacute dữ liệu khocircng chiacutenh xaacutec hoặc khocircng đầy đủ Cho pheacutep tổng quaacutet hoacutea từ thocircng tin cụ thể Cho pheacutep thu thập cảm giaacutec thocircng thường vagraveo miền giải quyết vấn đề

13Hạn chế của việc liecircn kết với mạng noron ANNs khocircng thể giải thiacutech được suy luận Bản chất hộp đen thường khiến cho vấn đề traacutech nhiệm vagrave độ tin cậy phaacutet

sinh lagrave khoacute khăn Lặp đi lặp lại quaacute trigravenh huấn luyện rất tốn thời gian Nguồn lực caacutec nhagrave phacircn tiacutech vagrave thiết kế coacute tay nghề cao vẫn lagrave đaacuteng lo

ngại Cocircng nghệ ANN thuacutec đẩy hạn chế của phần cứng hiện tại ANN yecircu cầu phải coacute sự tin tưởng ở đầu ra

14Giới thiệu về thuật toaacuten di truyền Cũng như mạng lưới thần kinh caacutec thuật toaacuten di truyền được dựa trecircn lyacute

thuyết sinh học Thuật toaacuten di truyền tigravem thấy nguồn gốc của chuacuteng trong caacutec lyacute thuyết

tiến hoacutea của chọn lọc tự nhiecircn vagrave thiacutech ứng với biến đổi khiacute hậu Kết quả thuật toaacuten di truyền lagrave từ giao phối 2 caacute thể trong quần thế để tạo

ra con caacutei đocirci khi tốt hơn so với bậc cha mẹ của chuacuteng 15Caacutec thagravenh phần cơ bản của thuật toaacuten di truyền

Toaacuten tử chọn lọc Caacutec caacute thể tốt được chọn lọc để đưa vagraveo thế hệ sau Sự chọn lọc nagravey căn cứ vagraveo độ thiacutech nghi với mocirci trường của mỗi caacute thể

Toaacuten tử lai gheacutep (crossover) Hai caacute thể cha vagrave mẹ trao đổi caacutec gen với nhau để tạo ra caacute thể con

Toaacuten tử đột biến (mutation) Một caacute thể thay đổi một số gen để biến đổi thagravenh một caacute thể mớiTất cả caacutec toaacuten tử trecircn khi thực hiện đều mang tiacutenh ngẫu nhiecircn

16Quaacute trigravenh cơ bản của một thuật toaacuten di truyền Khởi tạo

Đaacutenh giaacute quần thể

Lựa chọn NST thiacutech hợp nhất vagrave loại bỏ NST yếu nhất

Quy trigravenh giao nhau vagrave cải thiện quần thể

đột biến tiến trigravenh để khaacutem phaacute ra NST mới

17Ưu nhược điểm của việc kết hợp với thuật toaacuten di truyền Kiacutech thước quần thể lagrave 1 yếu tố quan trọng trong tốc độ của việc tigravem

kiếmnhưng noacute tương đối dễ dagraveng để dự đoaacuten tốc độ nagravey Giao nhau hoặc đột biến lagrave khocircng necircn đc sử dụng quaacute thường xuyecircn Luocircn coacute được iacutet nhất 1 giải phaacutep hợp lyacute Necircn coacute thể aacutep dụng chuacuteng cho caacutec vấn đề magrave chuacuteng ta khocircng coacute hướng

về caacutech giải quyết Sức mạnh của thuật toaacuten xuất phaacutet từ khaacutei niệm đơn giảnkhocircng phải từ

một thủ tục thuật toaacuten phức tạp 18Tương lai của học maacutey

Mạng lưới thần kinh nhacircn tạo vượt quaacute năng lực của con người trong caacutec trường hợp bị cocirc lập

Về mặt lyacute thuyếtmột maacutey tiacutenh coacute thể xử lyacute dũ liệu nhanh hơn hagraveng triệu lần so với 1 con người

May mắn thay cho chuacuteng tacon người tốt hơn nhiều khi magrave coacute được dữ liệumaacutey tiacutenh khocircng coacute 1 số thứ như lagrave 5 giaacutec quan

CHƯƠNG 10 KHO DỮ LIỆU

1 Kho dữ liệu Kho dữ liệu lagrave tuyển tập caacutec cơ sở dữ liệu tiacutech hợp hướng chủ đề được

thiết kế để trợ giuacutep cho một hệ hỗ trợ quyết định

Theo John Ladley Cocircng nghệ kho dữ liệu lagrave tập caacutec phương phaacutep kỹ thuật vagrave caacutec cocircng cụ coacute thể kết hợp hỗ trợ nhau để cung cấp thocircng tin cho người sử dụng trecircn cơ sở tiacutech hợp từ nhiều nguồn dữ liệu nhiều mocirci trường khaacutec nhau

Kho dữ liệu thường rất lớn tới hagraveng trăm GB hay thậm chiacute hagraveng Terabyte

2 Kho dữ liệu vận hagravenh (ODS) Một kho dữ liệu vận hagravenh Aacutep dụng kỹ thuật kho dữ liệu vagraveo caacutec hệ xử

lyacute giao taacutec lưu trữ dữ liệu cho một ứng dụng đặc thugrave Noacute đưa vagraveo kho dữ liệu một dograveng caacutec dữ liệu thocirc được thiết kế

3 So saacutenh

Kho dữ liệu vận hagravenh Kho dữ liệu

Dữ liệu theo chủ đề Dữ liệu theo chủ đề

Dữ liệu tiacutech hợp Dữ liệu tiacutech hợp

Dữ liệu thay đổi Dữ liệu khocircng thay đổi

Dữ liệu được cập nhật khi thay đổi

Dữ liệu giữ nguyecircn

Chỉ coacute dữ liệu hiện tạiDữliệu hiện tại vagrave dữ liệu lịch sử

Chu kỳ lagravem tươi dữ liệu ngắn Chu kỳ lagravem tươi dữ liệu dagravei

Chỉ coacute dữ liệu chi tiết Dữ liệu chi tiết vagrave dữ liệu tổng kết

Dugraveng cho caacutec quyết định ngắn hạn

Dugraveng cho hoạch định dagravei hạn

4 Kho dữ liệu cục bộ (Data Mart - DM)

Kho dữ liệu cục bộ lagrave CSDL coacute những đặc điểm giống với kho dữ liệu nhưng với quy mocirc nhỏ hơn vagrave lưu trữ dữ liệu về một lĩnh vực một chuyecircn ngagravenh

Data mart phụ thuộc Chứa những dữ liệu được lấy từ DW vagrave những dữ liệu nagravey sẽ được triacutech lọc vagrave tinh chế tiacutech hợp lại ở mức cao hơn để phục vụ một chủ đề nhất định của Datamart

Data mart độc lập Khocircng giống như Datamart phụ thuộc Data mart độc lập được xacircy dựng trước DW vagrave dữ liệu được trực tiếp lấy từ caacutec nguồn khaacutec nhau

5 Siecircu dữ liệu Metadata lagrave dữ liệu để mocirc tả dữ liệu Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột

một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi Metadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu

6 Mocirci trường kho dữ liệu Hệ thống của tổ chức vagrave kho cung cấp dữ liệu để xacircy dựng kho dữ liệu Trong quaacute trigravenh chuyển dữ liệu từ caacutec nguồn khaacutec nhau dữ liệu coacute thể

được lagravem sạch hoặc chuyển đổi vagrave vigrave thế DW được xem như lagrave một chuẩn cho việc lưu trữ

Đồng thời siecircu dữ liệu được ghi lại Cuối cugraveng DW hoặc siecircu thị coacute thể được sử dụng để tạo ra một kho dữ

liệu ldquocaacute nhacircnrdquo 7 Caacutec đặc điểm của kho dữ liệu

Đặc điểm Mocirc tả

Hướng chủ đề - DL tổ chức theo caacutech thức người dugraveng tham chiếu

Tiacutech hợp - Dữ liệu ldquosạchrdquo loại bỏ tiacutenh thiếu nhất quaacuten

Khocircng thay đổi - DL ldquochỉ đọcrdquo người dugraveng khocircng thay đổi được

Chuỗi thời gian - DL lagrave chuỗi thời gian khocircng phải lagrave trạng thaacutei hiện tại

Được tổng kết - DL vận hagravenhthao taacutec khi cần thiết

được kết hợp lại thagravenh dạng coacute thể dugraveng được cho quyết định

Kiacutech cỡ lớn hơn - Lưu giữ theo chuỗi thời gian tức lagrave giữ lại nhiều DL

Khocircng được chuẩn hoacutea - Coacute thể dư thừa DLSiecircu dữ liệu - Dữ liệu của dữ liệu được lưu trữNguồn dữ liệu - DL vận hagravenh (caacutec hệ sẵn coacute) cugraveng

với caacutec nguồn ngoagravei 8 Kho dữ liệu hướng chủ đề

Hướng chủ để coacute nghĩa lagrave kho dữ liệu được tổ chức xung quanh caacutec chủ đề chiacutenh như khaacutech hagraveng sản phẩm sản xuất Tập trung vagraveo việc mocirc higravenh hoacutea vagrave phacircn tiacutech dữ liệu cho caacutec nhagrave ra quyết định magrave khocircng tập trung vagraveo caacutec xử lyacute thocircng thường Cung cấp cho người dugraveng một khung nhigraven toagraven vẹn đơn giản vagrave đầy đủ về caacutec sự kiện quanh caacutec chủ đề

9 Dữ liệu trong DW được tiacutech hợp Dữ liệu trong kho dữ liệu được xacircy dựng bằng caacutech tổng hợp dữ liệu từ

nhiều nguồn khaacutec nhau vagrave caacutec nguồn coacute tổ chức khaacutec nhau Cơ sở dữ liệu caacutec file excel caacutec flat file hoặc caacutec raw file Khi đưa vagraveo kho dữ liệu caacutec dữ liệu được lagravem sạch vagrave tiacutech hợp dữ liệu nhằm đảm bảo tiacutenh nhất quaacuten của dữ liệu

10Kiến truacutec kho dữ liệu Tầng cơ sở dữ liệu hoạt động Tầng truy xuất thocircng tin Tầng truy xuất dữ liệu Tầng siecircu dữ liệu Tầng quản lyacute tiến trigravenh Tầng thocircng điệp của ứng dụng Tầng vật liacute của kho dữ liệu Tầng trigravenh diễn dữ liệu

11Higravenh trạng kho dữ liệu Kho dữ liệu ảo - người dugraveng cuối coacute thể truy cập trực tiếp đến kho dữ liệu

sử dụng caacutec cocircng cụ cho pheacutep ở tầng truy xuất dữ liệu Kho dữ liệu trung tacircm-1 cơ sở dữ liệu vật lyacute chứa tất cả dữ liệu cho một

vugraveng chuyecircn dụng nagraveo đoacute

Kho dữ liệu phacircn taacuten- Thagravenh phần được phacircn taacuten qua nhiều hệ cơ sở dữ liệu vật lyacute

12METADATA- Siecircu dữ liệu Định nghĩa Siecircu dữ liệu lagrave dữ liệu về dữ liệu Lagrave 1 lưu trữ dugraveng để

Miecircu tả kho dữ liệu tổng thể Nhận dạng kiểu kho dữ liệu Quản liacute quaacute trigravenh tiacutech hợp dữ liệu Quản liacute quaacute trigravenh cập nhật kho dữ liệu Quản liacute bảo mật

Lagrave chigravea khoacutea quyết định sự thagravenh cocircng của kho dữ liệu luocircn được thay đổi vagrave cập nhật theo sự phaacutet triển của kho dữ liệu

Dugraveng để quản liacute điều khiển kho dữ liệu Sự ra đời của kho dữ liệu như 1 cấu truacutec hỗ trợ ra quyết định siecircu dữ liệu

được xem như nguồn tagravei nguyecircn dữ liệu Siecircu dữ liệu lagrave trừu tượng Chuacuteng lagrave dữ liệu bậc cao cung cấp mocirc tả ngắn

gọn caacutec dữ liệu bậc thấp hơn 13Hoạt động của Siecircu dữ liệu

Siecircu dữ liệu rất cần thiết trong việc chuyển hoacutea thocircng tin trở thagravenh tri thức Lagrave chigravea khoacutea giuacutep chuacuteng ta xử lyacute được dữ liệu thocirc Viacute dụ một dograveng dữ liệu baacuten hagraveng 1023 K596 11121 agraveNoacute sẽ khocircng coacute nghĩa gigrave cho đến khi chuacuteng ta đưa vagraveo siecircu dữ liệu (thư

mục chứa dữ liệu) agrave cửa hagraveng 1023 sản phẩm K596 vagrave số tiền baacuten được lagrave 11121 đocirc la

14Sự cần thiết phải nhất quaacuten trong kho dữ liệu Kho dữ liệu được xacircy dựng cho lợi iacutech của những nhagrave phacircn tiacutech kinh

doanh caacutec nhagrave quản trị cho tất cả caacutec khu vực chức năng Trong cơ sở dữ liệu riecircng caacutec khu vực khaacutec nhau coacute thể định nghĩa vagrave lưu

trữ dữ liệu thocircng qua phiecircn bản của chiacutenh noacute Khi dữ liệu được lấy từ những vugraveng khaacutec nhau đoacute vagrave được đặt vagraveo kho dữ

liệu Việc chuyển đổi vagrave lagravem sạch caacutec tiến trigravenh sẽ đảm bảo noacute lagrave duy nhất được tiacutech hợp tại một mức của tổ chức

15Ragrave soaacutet lại dữ liệu ndash Thực thi siecircu dữ liệu

Bất kể cấu truacutec tự nhiecircn của 1 cacircu truy vấn thế nagraveo thigrave caacutec thagravenh phần của siecircu dữ liệu rất quan trọng đối với người ra quyết định

Bảng thuộc tiacutenh khoacutea được lưu trữ bởi kho dữ liệu Tập hợp dữ liệu được lấy từ đacircu Những chuyển đổi nagraveo được thực thi với việc lagravem sạch

16Siecircu dữ liệu lagrave gigrave Metadata - lagrave thocircng tin mocirc tả nội dung của cơ sở dữ liệu (CSDL) Metadata baacuteo cho người dugraveng biết thời gian cập nhật sau cugraveng của dữ liệu

định dạng vagrave mục điacutech sử dụng của noacute Những thocircng tin nagravey coacute thể hướng dẫn người dugraveng duyệt qua CSDL vagrave

giuacutep họ hiểu được yacute nghĩa vagrave ngữ cảnh của dữ liệu Trong CSDL metadata lagrave caacutec dạng biểu diễn khaacutec nhau của caacutec đối tượng

trong CSDL Trong CSDL quan hệ metadata lagrave caacutec định nghĩa của bảng cột CSDL

view vagrave nhiều đối tượng khaacutec Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột

một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi -gtMetadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu

Bảng chuyển đổi Ghi lại những chuyển đổi đatilde được thực hiện

Lịch sử thực thi Ghi lại những dữ liệu đatilde được

phacircn tiacutech

Higravenh thaacutei kết nốiGhi lại những dữ liệu được kết nối vagrave tần suất

17Aacutenh xạ thocircng thường của siecircu dữ liệu Bản ghi aacutenh xạ chuyển đổi bao gồm

Định danh của nguồn gốc Chuyển đổi thuộc tiacutenh Chuyển đổi thuộc tiacutenh vật lyacute Matilde hoacutea tham chiếu bảng chuyển đổi Đổi tecircn Đổi khoacutea Gaacuten giaacute trị cho thuộc tiacutenh mặc định Chọn logic cho caacutec nguồn nhiều giaacute trị Đổi thuật toaacuten

18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để

phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai

lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave

tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec

Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm

Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo

19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua

caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau

SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được

Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra

một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức

Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ

Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ

Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech

CHƯƠNG 11 KHAI PHAacute DỮ LIỆU

1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn

ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993

Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng

2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd

1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều

2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP

3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn

4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng

5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server

6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo

7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động

8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời

9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều

10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện

11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech

12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP

3 Xử lyacute phacircn tiacutech trực tuyến OLAP

MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave

dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu

ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave

thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu

HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave

ROLAP4 Khai phaacute dữ liệu

Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh

khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn

Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan

5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp

6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại

Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp

Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec

Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt

Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra

Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh

vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho

Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec

Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm

Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục

Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng

gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp

Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn

Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec

Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper

Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2

Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25

Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước

Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng

Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện

trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp

Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute

độ hỗ trợ ge ngưỡng minsup

độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan

Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn

Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết

Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu

MOLAP ROLAP HOLAP

Lưu trữ dữ liệu cơ sở

Khối Bảng quan hệ Bảng quan hệ

Lưu trữ thocircng tin tổng hợp

Khối Bảng quan hệ Khối

Hiệu suất thực hiện truy vấn

Nhanh nhất Chậm nhất Nhanh

Tiecircu thụ khocircng gian lưu trữ

Nhiều Thấp Trung bigravenh

Chi phiacute bảo trigrave Cao Thấp Trung bigravenh

Page 29: De cuong(1-11)

- EIS lagrave một dạng đặc biệt của DSS được thiết kế để hỗ trợ ra quyết định ở cấp cao nhất của một tổ chức

- Lagrave một hệ thống thocircng tin hỗ trợ nhu cầu lập kế hoạch vagrave đaacutenh giaacute của caacutec nhagrave quản lyacute điều hagravenh

- EIS coacute thể giuacutep một CEO coacute được bức tranh tổng thể chiacutenh xaacutec nhất về caacutec hoạt động vagrave một bản toacutem tắt những gigrave magrave đối thủ cạnh tranh đang lagravem

- Caacutec hệ thống nagravey noacutei chung hoạt động dễ dagraveng vagrave trigravenh bagravey thocircng tin theo những caacutech dễ hiểu để việc tiếp thu được nhanh choacuteng (biểu đồ đồ thịhellip)

(Tagravei liệu thecircm EIS lagrave những loại hệ thống lagrave rất phức tạp trong tự nhiecircn Coacute thể noacutei hệ thống nagravey cũng cung cấp cho caacutec nhagrave quản lyacute với caacutec thiết bị coacute khả năng ra quyết định bằng caacutech sử dụng của noacute Hệ thống nagravey hoạt động trong điều kiện như vậy quan trọng như trong caacutec hệ thống khaacutec khocircng hỗ trợ Khả năng lưu trữ dữ liệu nặng lagravem cho noacute lyacute tưởng để được thocircng qua khocircng chỉ bởi caacutec doanh nghiệp lớn magrave cograven bởi caacutec doanh nghiệp nhỏ hơn Nhigraven chung hệ thống nagravey lagrave dagravenh cho caacutec nhacircn viecircn cấp cao hỗ trợ thagravenh thạo trong việc đưa ra caacutec quyết định quan trọng)

Caacutec phiecircn EIS tiecircu biểu- Phiecircn lagravem việc coacute thể bắt đầu với một baacuteo caacuteo về tigravenh higravenh tagravei chiacutenh vagrave kinh

doanh của một cocircng ty caacutec chỉ số hoạt động quan trọng được hiển thị rotilde ragraveng- EIS sẽ cho pheacutep caacutec giaacutem đốc điều hagravenh coacute thể đi sacircu vagraveo dữ liệu từ những con

số bất kỳ magrave noacute hỗ trợ- Việc điều hagravenh coacute thể lựa chọn một mức độ chi tiết ( VD danh số baacuten hagraveng) nếu

như cần điều tra thecircm- Lagrave một phương phaacutep tiếp cận coacute thể giuacutep việc ra quyết định tốt hơn

Những điều magrave EIS ko coacute- EIS khocircng phải lagrave sự thay thế cho caacutec hệ thống dựa trecircn caacutec maacutey tiacutenh khaacutec EIS

thực sự chỉ cung cấp dữ liệu cho caacutec hệ thống nagravey- Noacute khocircng thể biến caacutec bộ hệ điều hagravenh của maacutey tiacutenh thagravenh những ldquochuyecircn viecircn

giỏirdquo- Coacute thể được viacute một caacutech cao hơn như lagrave một trợ lyacute đaacuteng tin cậy coacute thể được gọi

đến bất khi nagraveo vagrave mỗi khi cần thiết

Tagravei liệu thecircm Sự khaacutec nhau giữa EIS vagrave DSS+ EIS thiết kế để hỗ trợ những người điều hagravenh cấp cao giuacutep họ khaacutem phaacute caacutec vấn đề vagrave caacutec cơ hội DSS hỗ trợ những nười phacircn tiacutech cố gắng trả lời cacircu hỏi caacutei gigrave coacute thể lagravem cugraveng với một cơ hội hoặc một vấn đề

Chiều EIS DSSNhững người sử dụng thocircng thường

Duyệt dữ liệu đi xuống truy xuất trạng thaacutei

Hỗ trợ phacircn tiacutech vagrave quyết định

Sự thuacutec đẩy Tiacutenh thiacutech hợp Tiacutenh hiệu quảỨng dụng Queacutet mocirci trường đaacutenh giaacute

hiệu suất nhận dạng caacutec vấn đề vagrave caacutec cơ hội

Caacutec quyết định quản lyacute trecircn caacutec lĩnh vực đa dạng

Hỗ trợ quyết định Caacutec chiacutenh saacutech caacutec quyết định khocircng coacute cấu truacutec ở mức cao vagrave hỗ trợ giaacuten tiếp

Hỗ trợ caacutec quyết định lặp lại caacutec quyết định khocircng thể đoaacuten trước ra quyết định khocircng coacute cấu truacutec vagrave baacuten cấu truacutec

Loại thocircng tin Caacutec thocircng tin tin tức thocircng tin becircn ngoagravei về khaacutech hagraveng đối thủ cạnh tranh mocirci trường caacutec baacuteo caacuteo theo yecircu cầu vagrave định thời về caacutec hoạt động becircn trong

Caacutec thocircng tin hỗ trợ caacutec tigravenh huống đặc biệt

Sử dụng coacute nguyecircn tắc

Dograve theo vết vagrave điều khiển nhận dạng cơ hội

Hoạch định tổ chức phacircn nhoacutem vagrave điều khiển

Khả năng phugrave hợp với những người sử dụng caacute nhacircn

Thiết kế loại ra quyết định cho mỗi người điều hagravenh caacute nhacircn bằng nhiều lựa chọn đầu ra

Cho pheacutep caacutec đaacutenh giaacute caacute nhacircn caacutec khả năng what-if lựa chọn loại hộp hội thoại

Đồ họa Phải coacute Lagrave một phần quan trọng của nhiều DSS

Thacircn thiện người sử dụng

Phải coacute Phải coacute nếu khocircng coacute người sử dụng trung gian

Xử lyacute thocircng tin Lọc neacuten thocircng tin dograve theo vết dữ liệu vagrave thocircng tin quan trọng

EIS kiacutech thiacutech caacutec cacircu hỏi caacutec cacircu trả lời bằng caacutech sử dụng DSS vagrave phản hồi lại EIS

Hỗ trợ caacutec thocircng tin chi tiết

Truy xuất thường xuyecircn caacutec mức chi tiết của bất kỳ thocircng tin tổng hợp nagraveo (duyệt dữ

Coacute thể coacute trong DSS nhưng khocircng thường

liệu chi tiết)Cơ sở mocirc higravenh Caacutec chức năng coacute sẵn bị hạn

chếLagrave điểm cốt lotildei của DSS

Cấu truacutec Theo người baacuten sản phẩm hoặc theo caacutec chuyecircn gia hệ thống thocircng tin

Theo người sử dụng hoặc caacute nhacircn hoặc caacutec chuyecircn gia từ caacutec trung tacircm thocircng tin hoặc phograveng ban hệ thống thocircng tin

Phần cứng Mainframe caacutec trạm RISC mạng LANs hoặc caacutec hệ thống phacircn bố

Mainframe caacutec trạm RISC caacutec maacutey PC hoặc caacutec hệ thống phacircn bố

Bản chất caacutec goacutei phần mềm

Truy xuất tương taacutec dễ dagraveng đến nhiều cơ sở dữ liệu truy xuất trực tuyến caacutec khả năng DBMS phức tạp caacutec liecircn kết phức tạp

Caacutec khả năng tiacutenh toaacuten lớn caacutec ngocircn ngữ mocirc higravenh mocirc phỏng ứng dụng vagrave caacutec bộ tạo DSS

Bản chất caacutec thocircng tin

Trigravenh bagravey thocircng tin được phaacutet sinh trước về quaacute khứ vagrave hiện tại tạo caacutec thocircng tin mới về quaacute khứ hiện tại tương lai

Tạo thocircng tin mới về quaacute khứ hiện tại tương lai

62 Lịch sử EIS- EIS xuất hiện lần đầu tiecircn tại MIT vagraveo những năm 1970

- Những EIS đầu tiecircn được phaacutet triển bởi caacutec doanh ngiệp lớn sẵn sagraveng chấp nhận rủi ro để đạt được lợi thế cạnh tranh

- Vagraveo những năm 1980 caacutec nhagrave cung cấp đatilde phaacutet triển một số cơ sở khaacutech hagraveng rộng vagrave cocircng nghệ EIS được tiếp tục phaacutet triển cho đến ngagravey nay

(Tagravei liệu thecircm Sử dụng DSSEIS cho phaacutet triển bền vững + Một số nghiecircn cứu đatilde được tiến hagravenh để kiểm tra việc thực hiện của EIS trong khu vực cocircng cộng vagrave chiacutenh phủ caacutec nước tổ chức kể từ khi chuacuteng được phaacutet triển theo định hướng lợi nhuận cho caacutec cocircng ty tư nhacircn (Hasan vagrave Hasan năm 1997) Theo một nghiecircn cứu tiến hagravenh tại Mỹ ở hơn 300 cocircng ty kết quả cho thấy sự khaacutec biệt của EIS giữa tư nhacircn vagrave chiacutenh phủ một số kết quả thuacute vị được phaacutet hiệnViacute dụ khoacute khăn hơn để chuyển tiền từ một tagravei khoản khaacutec trong một EIS của chiacutenh phủ cũng lagrave khoacute khăn hơn để biện giải thiacutech cho những chi phiacute phaacutet triển EIS của chiacutenh phủ Một nghiecircn cứu khaacutec được tiến hagravenh ở Australia

cho thấy rằng EIS cung cấp cho quản lyacute một higravenh ảnh chiacutenh xaacutec hơn về tổ chức thực hiện vagrave cung cấp hỗ trợ cho caacutec lợi iacutech chiến lược cải thiện khocircng chỉ cho caacutec nhagrave quản lyacute nhưng cograven cho phần cograven lại của tổ chức Dựa trecircn caacutec hệ thống được thiết kế cho caacutec cocircng ty tư nhacircn với một caacutech rotilde ragravengxaacutec định mục tiecircu EIS lagrave thiacutech hợp cho caacutec tổ chức cocircng cộng hiện đại nhưng cần phải được linh hoạt hơn vagrave kết thagravenh chugravem một phạm vi rộng hơn khả năng vagrave phương tiện hơn so với khu vực tư nhacircn ban đầu theo định hướng sản phẩm (Hasan vagrave Hasan năm 1997) Điều nagravey coacute thể lagrave do thực tế rằng caacutec hoạt động khu vực cocircng lagrave bắt buộc coacute taacutec động rộng phải đaacutep ứng sự mong đợi duy nhất cocircng cộng thường coacute mục tiecircu mơ hồ vagrave macircu thuẫn iacutet quyền tự chủ vagrave kiểm soaacutet việc ra quyết định vagrave nhacircn viecircn lagrave khoacute khăn hơn (Watson vagrave Carte2000) + Toacutem lại EIS lagrave một khaacutei niệm thagravenh cocircng noacute phaacutet triển qua nhiều năm tuy nhiecircn EIS khắc phục khiếm khuyết của migravenh bằng caacutech tiến hagravenh nghiecircn cứu liecircn tục)

63 Tại sao những người điều hagravenh hagraveng đầu lại khaacutec nhau- Họ lagrave những doanh nghiệp theo định hướng coacute suy nghĩ

- Coacute một khoảng khocircng gian rộng để kiểm soaacutet

- Họ chịu traacutech nhiệm cho việc thiết lập chiacutenh saacutech

- Họ đại diện cho tổ chức mocirci trường becircn ngoagravei

- Hagravenh động của họ tạo ra những kết quả đaacuteng kể về tagravei chiacutenh vagrave con người

Tần số caacutec hoạt động điều hagravenh- Xử lyacute xaacuteo trộn 42

- Hoạt động kinh doanh 32

- Phacircn bổ nguồn lực 17

- Đagravem phaacuten 3

- Những điều khaacutec 6

Handling Disturbances 42

Entrepreneurial Activites 32

Resource Allocation 17

Negotiation 3

Other 6

Những thocircng tin điều hagravenh cần thiết- Quản lyacute xaacuteo trộn coacute thể yecircu cầu sự chuacute yacute xung quanh đồng hồ

- Hoạt động kinh doanh yecircu cầu điều hagravenh để dự đoaacuten những thay đổi trong mocirci trường

- Nhiệm vụ phacircn bổ tagravei nguyecircn yecircu cầu lựa chọn người quản lyacute vagrave caacutec nguồn lực hạn chế được triển khai

- Đagravem phaacuten yecircu cầu cập nhật thocircng tin từng phuacutet để coacute thể xacircy dựng được sự đồng thuận

Caacutec loại thocircng tin điều hagravenh- Hệ thống kế toaacuten coacute liecircn quan đến việc tiacutenh toaacuten thu nhập hoạt động cho caacutec lĩnh

vực cụ thể lagrave quan trọng hơn so với caacutec hệ thống kế toaacuten truyền thocircng- Thocircng tin về thị trường khaacutech hagraveng cung cấp giaacute trị trong việc quyết định chiến

lược- Caacutec thocircng tin cần thiết thường được truyền đi trecircn một số hệ thống maacutey tiacutenh vagrave

nằm trong toagraven tổ chức- Caacutec thocircng tin được sử dụng thường lagrave ngắn hạn vagrave dễ thay đổi

Phương thức để xaacutec định thocircng tin cần thiết

Rockart xaacutec định được năm phương thức cơ bản để xaacutec định thocircng tin cần thiết

- Phương thức dựa trecircn kết quả- Phương thức rỗng- Phương thức chỉ số khoacutea- Phương thức tổng hợp nghiecircn cứu- Phương thức dựa vagraveo nhacircn tố then chốt dẫn đến thagravenh cocircng

64 Thagravenh phần EIS

- Sản phẩm EIS đầu tiecircn được phaacutet triển để sử dụng trecircn maacutey tiacutenh cấu higravenh cao nhưng caacutec sản phẩm hiện nay nhằm mục tiecircu lagrave nền tảng ClientServer

- Những nền tảng linh hoạt hơn coacute thể thiacutech ứng với thay đổi trong tổ chức vagrave cocircng nghệ

- Sử dụng dữ liệu thời gian thực dẫn đến quyết định nhanh hơn nhiều thocircng tin hơn

Thagravenh phần phần cứng- Một EIS khocircng đogravei hỏi coacute phần cứng cụ thể hoặc duy nhất nagraveo- Chigravea khoacutea của vấn đề lagrave để đảm bảo rằng caacutec thagravenh phần của EIS tối ưu hoacutea vagrave

phugrave hợp với tagravei nguyecircn maacutey tiacutenh của tổ chức- Hệ thống nagravey phải được cấu higravenh để caacutec nguồn tagravei nguyecircn phugrave hợp với những

người điều hagravenh chuacuteng

Thagravenh phần phần mềm- Traacutei ngược với phần cứng phần mềm thường được chuyecircn mocircn hoacutea cao cho caacutec

bagravei toaacuten về miền- Sự chuyecircn mocircn hoacutea nagravey thường đạt được bằng caacutech sử dụng thagravenh phần off-the-

shelf cho toagraven bộ EIS vagrave caacutec mocirc-đun tugravey chỉnh để đaacutep ứng nhu cầu cụ thể- Lotus Notes lagrave một viacute dụ điển higravenh Noacute coacute thể được sử dụng một migravenh hoặc coacute

thể phục vụ becircn thứ ba mocirc-đun plug-in

Cocircng nghệ EIS hiện nay

Dobrzeniecki đề xuấtphacircn loạitừng cấptheo bachức năng- Loại 1 sản phẩm bao gồmmột bộ đầy đủcaacutec ứng dụngtừ mộtnhagrave cung cấp- Loại 2 sản phẩm đượcthựchiệnở phần đầu củacaacutecsản phẩmDSS đượcphaacutet triển

bởicugravengmộtnhagrave cung cấp- Loại 3 sản phẩmkết hợp với nhautheo bất kỳ số lượngthuộc sở hữu củacocircng ty

65 Xacircy dựng EIS

- Xacircy dựngmộtEISgiống nhưxacircydựngmột số hệ thống khaacutec củamocirc higravenh hệ thống thocircng tin

- Việcphaacutet triểncấu truacutecnecircn được theo dotildeitừ quaacute trigravenh thiết kế đến quaacute trigravenhthực hiện

- Tuy nhiecircn một dự aacuten phaacutet triển EIScoacute xu hướnglagrave thống nhấtvagraveyecircu cầu hỗ trợ caacutec nhagrave quản lyacute latildenh đạo

- Xacircy dựng một EIScoacute thểphaacutet hiện ra đượccaacutectigravenh huống khoacute khănmagravemột nhagrave phaacutet triển chưabao giờ gặp phải

Mocirc higravenh EIS

Khung phaacutet triển một EIS

- Watson et al đề nghị xacircy dựngkhung với ba thagravenh phần+ Caacutech tiếp cận tập trung vagraveo yếu tốcon người vagrave dữ liệu coacute liecircn quan đến EIS+ Quaacute trigravenh phaacutet triển cần sự linh hoạt vagrave tương taacutec+ Người sử dụng - hệ thống hộp thoại bao gồm một ngocircn ngữ hagravenh động để xử lyacute caacutec lệnh

Lợi iacutech của EIS- Dễ duy trigrave caacutec mục tiecircu coacute tổ chức- Dễ truy xuất thocircng tin- Cho pheacutep người sử dụng nacircng cao hiệu suất hơn

- Tăng chất lượng ra quyết định- Cung cấp sự cải tiến cạnh tranh- Tiết kiệm thời gian của người sử dụng- Tăng khả năng vagrave chất lượng giao tiếp- Cung cấp khả năng điều khiển tốt hơn trong tổ chức- Cho pheacutep tham gia caacutec vấn đề vagrave caacutec cơ hội- Cho pheacutep hoạch định- Cho pheacutep tigravem kiếm nguyecircn nhacircn của một vấn đề- Thảo matilden caacutec yecircu cầu của người điều hagravenh

Hạn chế của EIS vagrave 1 số sai lầm cần traacutenh

- Chi phiacute một cuộc khảo saacutetnăm1991 chothấychi phiacute phaacutet triểntrungbigravenh365000USDvớichi phiacute vận hagravenhhagraveng năm lagrave$200000 (EIS)

- Cocircng nghệ hạn chếEIScần phảiđượctiacutech hợp hoagraven toagravenvagraveokiếntruacuteccủadoanh nghiệphiện tại do đoacute noacutelagrave một thaacutech thứclớn đối vớithiết kế

- Hạn chế tổ chức cơ cấu tổ chứccoacute thể khocircng phugrave hợp

Sự hạn chế về tổ chức- Chương trigravenh nghị sự vagrave thời gian chệch EIS mocirc tả một phần việc thực hiện một

chương trigravenh nghị sự vagrave coacute thể dễ dagraveng đạt được sự tin cậy một caacutech chắc chắn- Đồng bộ hoacutea việc quản lyacute sự tin cậy đuacuteng luacutec đặc biệt baacuteo caacuteo EIS coacute thể phaacute

vỡ sự ổn định thiết lập caacutec chu trigravenh baacuteo caacuteo một caacutech tốt nhất- Sự bất ổn EIS phản ứng nhanh coacute thể gacircy ra việc taacutec động trở lại một caacutech

nhanh choacuteng dẫn đến sự thiếu ổn định trong tổ chức

Sự thất bại lagrave thay thế khocircng thể chấp nhận được- Một số yếu tố lagravem EIS thất bại

+ Thiếu sự hỗ trợ về mặt quản lyacute+ Vấn đề chiacutenh trị+ Thất bại của nhagrave phaacutet triển+ Lỗi về cocircng nghệ+ Giaacute cả+ Thời gian

66 Ra quyết định điều hagravenh trong tương lai vagrave EIS

- Coacute một vagravei điều kiện sẽ được hợp nhất cho việc chuyển đổi cocircng nghệ Trong đoacute một vagravei điều kiện coacute thể dễ dự đoaacuten Hai điều kiện magrave ta coacute thể thấy lagrave+ Phaacutet triển cocircng nghệ maacutey tiacutenh trong việc điều hagravenh sẽ tạo ra sự chuyển đổi được chấp nhận một caacutech dễ dagraveng hơn+ Mở rộng traacutech nhiệm điều hagravenh sẽ mở rộng nhu cầu thocircng tin

Tương lai của EIS- EIS thocircng minh Những tiến bộ trong cocircng nghệ AI sẽ được triển khai trong caacutec

EIS- EIS đa phương tiện Cơ sở dữ liệu đa phương tiện sẽ cho pheacutep tiacutech hợp văn bản

giọng noacutei vagrave higravenh ảnh trong tương lai- EIS thocircng tin Tương lai EIS sẽ mở rộng hơn trong việc sử dụng dữ liệu becircn

ngoagravei doanh nghiệp- EIS kết nối Giao tiếp với băng thocircng rộng cho pheacutep kết nối liecircn thocircng lớn hơn

Chương 7 HỆ CHUYEcircN GIA VAgrave TRIacute TUỆ NHAcircN TẠO

71 Caacutec khaacutei niệm

72 Triacute thocircng minh của triacute tuệ nhacircn tạo

73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia

74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia

75 Lợi iacutech vagrave hạn chế của hệ chuyecircn gia

71 Caacutec khaacutei niệm

Chuyecircn mocircn (Expertise) sự hiểu biết rộng trong 1 lĩnh vực hẹp

Hệ chuyecircn gia (Expert Systems)1 chương trigravenh maacutey tiacutenh sử dụng 1 tập caacutec luật dựa trecircn tri thức của con người để giải quyết caacutec vấn đề đogravei hogravei phải coacute sự chuyecircn mocircn

Một số hệ chuyecircn gia nổi tiếng

DENDRAL (Standford 1960s Edward Feigenbaum)

MYCIN (Standford1970s Edward Shortliffe)

PROSPECTOR (MIT 1979)

Triacute tuệ nhacircn tạo (Artificial Intelligence ndash AI)

Triacute tuệ nhacircn tạo một bộ phacircn của ngagravenh khoa học maacutey tiacutenh quan tacircm đến việc thiết kế caacutec hệ thống maacutey tiacutenh thocircng minh đoacute lagrave caacutec hệ thống đưa ra caacutec đặc điểm magrave từ đoacute chuacuteng ta liecircn hệ với sự thocircng minh trong hagravenh động của con người (Barr vagrave Feigenbaum 1981)

Mục điacutech của AI

Mục điacutech khoa học xaacutec định caacutec gợi yacute để giải thiacutech caacutec loại khaacutec nhau của triacute tuệ thực

Mục điacutech kỹ thuật giải quyết caacutec vấn đề trong thế giới thực

Triacute tuệ nhacircn tạo kế thừa nhiều yacute tưởng quan điểm kỹ thuật từ caacutec ngagravenh khoa học khaacutec

- Triết học

- Logic Toaacuten học

- Tiacutenh toaacuten

- Khoa học tacircm lyacute Khoa học nhận thức

- Sinh học Thần kinh học

- Tiến hoacutea

Caacutec lĩnh vực ứng dụng trong Triacute tuệ nhacircn tạo

Mạng nơ ron thần kinh (Neural Networks)

Tiacutenh toaacuten sự tiến hoacutea

(Evolutionary Computation)

Hệ chuyecircn gia (Expert Systems)

Kỹ thuật xử lyacute tiếng noacutei (Speech Processing)

Kỹ thuật xử lyacute ngocircn ngữ tự nhiecircn

(Natural Language Processing)

Lập kế hoạch (Planning)

Robot (Robotics)

Khoa học higravenh ảnh (Vision)

Caacutec kỹ thuật thocircng dụng dugraveng trong AI

Biểu diễn(Representation)

Học (Learning)

Caacutec luật (Rules)

Tigravem kiếm (Search)

72 Triacute thocircng minh của triacute tuệ nhacircn tạo

Con người suy diễn như thế nagraveo

Phacircn loại (Categorization)

Caacutec quy tắc cụ thể

Heuristics

Kinh nghiệm trước đoacute

Dự tiacutenh trước

Maacutey tiacutenh suy diễn như thế nagraveo

Lập luận dựa trecircn luật IF-THEN mocirc tả tri thức được matilde hoacutea dưới dạng caacutec luật

Caacutec khung (Frames) lagrave caacutec đại diện mocirc tả caacutec tigravenh huống giống nhau lagrave điển higravenh của một vagravei phacircn loại

Lập luận dựa trecircn caacutec trường hợp mocirc phỏng giải phaacutep trước đoacute cho một vấn đề hiện tại

Nhận dạng mẫu phaacutet hiện acircm thanh higravenh dạng hoặc caacutec chuỗi dagravei

Caacutec dạng khaacutec của Triacute tuệ nhacircn tạo

Học maacutey- mạng nơron vagrave giải thuật di truyền

Lập trigravenh tự động ndash lagrave những kỹ thuật tạo ra caacutec chương trigravenh để lagravem 1 nhiệm vụ riecircng biệt (cho pheacutep những người khocircng phải lagrave người lập trigravenh coacute thể lập trigravenh được)

Cuộc sống nhacircn tạo ndash nỗ lực để taacutei tạo caacutec hiện tượng sinh học trong caacutec hệ thống dựa trecircn maacutey tiacutenh

73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia(Expert Systems- ES)

Theo Jackson (1999) Một hệ chuyecircn gia lagrave một chương trigravenh maacutey tiacutenh mocirc tả vagrave suy diễn với tri thức của một vagravei lĩnh vực để giải quyết vấn đề hay đưa ra caacutec lời khuyecircn

Cấu truacutec cơ bản của ES được dựa theo cấu truacutec chung của DSS Sự khaacutec biệt chiacutenh giữa ES vagraveDSS lagrave hệ ES thu thập caacutec kiến thức từ những

chuyecircn gia trong lĩnh vực quan tacircmĐặc trưng của hệ chuyecircn gia Hiệu quả cao Thời gian trả lời thỏa đaacuteng Độ tin cậy cao Dễ hiểu

Giao diện người dugraveng trong ES

Thiết kế giao diện người dugraveng tập trung vagraveo caacutec yếu tố như dễ dagraveng sử dụngcoacute độ tin cậy cao giảm tải những khoacute khăn khi sử dụng

Thiết kế necircn coacute một số tương taacutec (đầu vagraveo kiểm soaacutet vagrave truy vấn)

Cấu tạo giao diện người dugraveng gồm coacute magraven higravenh cảm ứng bagraven phiacutem buacutet saacuteng lệnh thoại caacutec phiacutem chuyecircn dụng

Cơ sở tri thức (Knowledge Base)

Chứa đựng caacutec tri thức cụ thể miền thu được từ caacutec chuyecircn gia miền

Coacute thể chứa caacutec mocirc tả caacutec hagravenh vi giải quyết vấn đề caacutec ragraveng buộc caacutec heuristics

Thagravenh cocircng của một ES dựa trecircn tiacutenh đầy đủ vagrave tiacutenh chiacutenh xaacutec của cơ sở tri thức

Mocirc tơ suy diễn (Inference Engine)

Ở đacircy tri thức được đặt để sử dụng tạo ra caacutec giải phaacutep để giải quyết vấn đề

Mocirc tơ nagravey coacute khả năng thực hiện diễn dịch hoặc suy diễn dựa trecircn caacutec luật hay caacutec caacutec sự kiện

Đồng thời cũng coacute khả năng sử dụng caacutec suy diễn mờ hay khocircng chiacutenh xaacutec dựa trecircn xaacutec suất hay aacutenh xạ mẫu

Vograveng điều khiển suy diễn

1 Aacutenh xạ caacutec luật với caacutec sự kiện đatilde được cho

2 Chọn luật để thực hiện

3 Thực hiện luật bằng caacutech thecircm caacutec sự kiện được suy diễn ra vagraveo bộ nhớ lagravem việc

Chuỗi suy diễn (Chaining)

Suy diễn tiến (forward chaining) maacutey suy diễn bắt đầu từ dữ liệu ban đầu vagrave thực hiện việc suy luận để đưa ra caacutec kết luận cuối cugraveng

Suy diễn lugravei (backward chaining) maacutey suy diễn bắt đầu từ dữ liệu điacutech vagrave tigravem ra tri thức hỗ trợ cho dữ liệu điacutech đoacute

Viacute dụ suy diễn lugravei

R1 Nếu coacute A vagrave B thigrave suy ra coacute D

R2 Nếu coacute B thigrave suy ra coacute C

R3 Nếu coacute C vagrave D thigrave suy ra coacute E

Ta coacute E ta xem trong 3 luật R1 R2 R3 luật nagraveo coacute E ta thấy R3 chứa E đồng thời chứa C vagrave D Xeacutet tiếp trong 2 luật R1 R2 luật nagraveo chứa C vagrave D R2 chứa C R3 chứa D Từ đoacute ta coacute được caacutec tri thức hỗ trợ suy diễn vagrave kết luận lagrave nếu coacute A vagrave B thigrave sẽ coacute E Hay nếu A vagrave B đuacuteng thigrave sẽ coacute E

Viacute dụ suy diễn tiến

Giả sử coacute tập chứa 3 luật sau

R1 Nếu coacute A vagrave B thigrave suy ra coacute D

R2 Nếu coacute B thigrave suy ra coacute C

R3 Nếu coacute C vagrave D thigrave suy ra coacute E

Nếu ta coacute A vagrave B thigrave chuacuteng ta suy ra được D từ R1 vagrave suy ra C từ R2 Với D vagrave C đatilde được suy ra ở trecircn giờ chuacuteng ta suy ra được E từ R3

Viacute dụ thực tế

Giả sử muốn biết magraveu của một con vật nuocirci tecircn lagrave Fred biết rằng noacute kecircu ộp ộp vagrave ăn ruồi

Coacute tập 4 luật ban đầu như sau

R1 Nếu X kecircu ộp ộp vagrave ăn ruồi thigrave X lagrave con ếch

R2 Nếu X kecircu chiecircm chiếp vagrave biết hoacutet thigrave X lagrave con chim

R3 Nếu X lagrave con ếch thigrave X coacute magraveu xanh

R4 Nếu X lagrave con chim thigrave X coacute magraveu vagraveng

74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia

Expert system shells lagrave một tập caacutec goacutei phần mềm vagrave caacutec cocircng cụ dugraveng để phaacutet triển caacutec hệ chuyecircn gia

Những Expert system shells đầu tiecircn thường rất rườm ragrave Mặc dugrave vậy noacute vẫn giuacutep cho người sử dụng sẽ khocircng phải bắt đầu lại từ đầu khi xacircy dựng một hệ chuyecircn gia mới

Những shell hiện đại bao gồm hai mocirc-đun chiacutenh lagrave cocircng cụ xacircy dựng một tập quy tắc vagrave mocirc tơ suy diễn

Xacircy dựng hệ chuyecircn gia

Bước 1 xacircy dựng mocirc higravenh bagravei toaacuten xaacutec định vấn đề nhiệm vụ magrave hệ thống sẽ thực hiện Caacutec dạng bagravei toaacuten cần hệ chuyecircn gia

Bagravei toaacuten diễn giải (InterPretation)

Bagravei toaacuten dự baacuteo (Prediction)

Bagravei toaacuten chuẩn đoaacuten (Diagnose)

Bagravei toaacuten gỡ rối (Debugging)

Bagravei toaacuten thiết kế

Tương tự như một dự aacuten phần mềm để xacircy dựng một hệ chuyecircn gia cần phải coacute caacutec yếu tố về nhacircn lực tagravei nguyecircn vagrave thời gian Những yếu tố nagravey ảnh hưởng đến giaacute thah của một hệ chuyecircn giaTrong phần nagravey cacircu hỏi thường được đặt ra lagrave tại sao cần phải xacircy dựng một hệ chuyecircn giaTrước khi bắt đầu phải xaacute định rotilde bagravei toaacuten đạt ra lagrave jiAi lagrave chuyecircn giaAi lagrave người sử dụng

1 Diễn giải (InterPretation) Nghiecircn cứu 1 vấn đề -gt Dựa trecircn những biểu hiện thuộc tiacutenh đặc trưng becircn ngoagravei -gt Tư vấn

(hoặc đưa ra kết luận hay mocirc tả dễ hiểu từ tập dữ liệu thocirc)

2 Bagravei toaacuten dự baacuteo (Prediction) Coacute thể dự đoaacuten được hagravenh vi kết quả dựa trecircn caacutec hiện tượng -gt dự baacuteo

VD Dự baacuteo thời tiết động đấthellip

3 Bagravei toaacuten chẩn đoaacuten (Diagnoss) Xaacutec định caacutec lỗi caacutec bộ phận hỏng hoacutec của hệ thống dựa trecircn caacutec dữ liệu quan saacutet được

4 Bagravei toaacuten gỡ rối (Debugging) Mocirc tả caacutec phương phaacutep khắc phục hệ thống khi gặp sự cố

5 Bagravei toaacuten thiết kế Lựa chọn cấu higravenh caacutec đối tượng nhằm thoả matilden một số ragraveng buộc nagraveo đoacute

6 Giảng dạy Phần mềm dạy học coacute thể chuẩn đoaacuten vagrave sủa lỗi của học sinh trong quaacute trigravenh học tập

Để xaacutec định đuacuteng bagravei toaacuten magrave chuacuteng ta cần giải quyết thigrave phải trả lời đc một số cacircu hỏi

- cần hệ chuyecircn gia

Bước 2 thu thập tri thức lựa chọn cocircng cụ vagrave aacutep dụng

Trong bước thu thập tri thức vấn đề quan trọng lagrave lựa chọn chuyecircn gia những người magrave sẽ đoacuteng goacutep tri thức cho hệ thống Thocircng thường trong suốt quaacute trigravenh phaacutet triển thigrave chuyecircn gia được xem như một thagravenh viecircn của đội phaacutet triển

Hiện nay coacute rất nhiều cocircng cụ để xacircy dựng một hệ chuyecircn gia Phổ biến nhất lagrave JESS CLIPS vagrave OPS5

Bước 3 Thiết kế cơ sở tri thức thiết kế hệ thốngTri thức được biểu diễn trường minh trong cơ sở tri thức

Caacutec chuyecircn gia vagrave kỹ sư tri thức sẽ đối thoại với nhau bằng caacutec kỹ thuật đối thoại Suy diễn (SD) bảng Mocirc higravenh hoacutea SD quy nạp phacircn loại

Vấn đề bagraveo trigrave vagrave phaacutet triển

Caacutec hệ chuyecircn gia đogravei hỏi phải bảo trigrave vagrave phaacutet triển nhiều hơn so với caacutec hệ thống khaacutec Phải thường xuyecircn bổ sung tri thức mới vagrave thay đổi caacutec tri thức cũ để đổi mới hệ chuyecircn gia

Thu thập vagrave khắc phục lỗi do người sử dụng phaacutet hiện để kịp thời khắc phục những sai soacutet của hệ chuyecircn gia

75 Lợi iacutech vagrave hạn chế của caacutec hệ chuyecircn gia

Một số lợi iacutech chiacutenh

Thời gian trả lời hợp lyacute bằng hoặc nhanh hơn so với chuyecircn gia (người) để đi đến cugraveng một quyết định Hệ chuyecircn gia lagrave một hệ thống thời gian thực (real time system)

Khả năng trả lời với mức độ tinh thocircng bằng hoặc cao hơn so với chuyecircn gia (người) trong cugraveng lĩnh vực

Hệ chuyecircn gia giuacutep cho hiệu quả lagravem việc tăng bằng việc sử dụng tập caacutec luật một caacutech nhanh choacuteng magrave ko bị nhầm lẫn chuyecircn gia lagrave người coacute thể quecircn đi một số tri thức cơ sở lyacute luậ nhưng HCG thigrave ko

Quyết định của một người chuyecircn gia coacute thể bị thay đổi vagrave ko coacute tiacutenh thống nhất như quyết định của một hệ chuyecircn gia tạo ra

Hệ chuyecircn gia giuacutep cho người sử dụng coacute thể trau dồi sự hiểu biết trecircn lĩnh vuej cụ thể magrave noacute giải quyết hỗ trợ người ra quyết định coacute trigravenh độ như 1 chuyecircn gia trong quaacute trigravenh gia quyết định

Kiến thức của rất nhiều chuyecircn gia về một lĩnh vực nagraveo đoacute được đưa vagraveo hệ chuyecircn gia lagravem cho CSTT cuat HCG phong phuacute vagrave rộng lớn hơn rất nhiều

HCG giải thiacutech caacutec bước suy luận một caacutech dễ hiểu nhất quaacuten luacutec nagraveo cũng coacute thể sử dụng ko như chuyecircn gia con người

Hạn chế của caacutec hệ chuyecircn gia

Nhược điểm lớn nhất của hệ chuyecircn gia lagrave những yacute kiến chuyecircn mocircn thường rất khoacute matilde hoacutea vagrave giải neacuten

Hệ chuyecircn gia khocircng coacute khả năng tự học tự cập nhật kiến thức mới như caacutec chuyecircn gia magrave cần phải được matilde hoacutea lại khi noacute được cập nhật

Hệ chuyecircn gia khocircng thể nhận ra được vấn đề khocircng nằm trong miền kiến thức của hệ thống

Chương 8 Tri thức vagrave tiếp nhận

1 Bao gồm caacutec vấn đề

Dữ liệu thực tế đo lường hoặc quan saacutet coacute hoặc khocircng coacute bối cảnh

Thocircng tin dữ liệu được tổng hợp một caacutech hữu iacutech để giải quyết những khoacute khăn trong việc đưa ra quyết định

Tri thức bao gồm caacutec ứng dụng quy tắc thocircng tin hướng dẫn của người ra quyết định

2 Những caacutei nhigraven về tri thức

Đại diện lagravem thế nagraveo để diễn tả tri thức viacute dụ như một quyển saacutech khocircng phải lagrave tri thức nhưng noacute lại lagrave một đại diện của tri thức

Sản xuất tri thức lagrave một tập hơp của hagraveng tồn kho coacute thể được sản xuất cũng như mua lại

Tri thức lagrave 1 trong 6 trạng thaacutei của hệ thống

1Dữ liệu 2Thocircng tin 3Cấu truacutec thocircng tin 4Sự thấu hiểu 5Yacute kiến 6 Quyết định

3 Caacutec loại tri thức Phổ biến mocirc tả dữ liệu thocircng tin thủ tục mọi thứ lagravem như thế nagraveo lập luận chiacutenh saacutech hoặc caacutec quy tắc

4 Thu thập Tri thức hệ chuyecircn gia Hầu hết caacutec phương phaacutep đều bắt đầu với mocirc higravenh của caacutec taacutec vụ trong đoacute

hệ chuyecircn gia được xacircy dựng Trong đoacute mocirc tả về caacutec lĩnh vực được tạo ra Caacutec kỹ sư sử dụng caacutec mocirc higravenh giả thuyết vagrave nhận thức về quaacute trigravenh phacircn

tiacutech để gợi ra caacutech giải quyết vấn đề về tri thức từ caacutec chuyecircn gia

5 Caacutec chiều của thu thập tri thức KE- driven caacutec kỹ sư trao đổi trực tiếp với caacutec chuyecircn gia Expert-driven Caacutec chuyecircn gia trực tiếp đưa chuyecircn mocircn của họ vagraveo hệ

thống maacutey tiacutenh Machine-driven Sử dụng caacutec cocircng cụ suy luận để triacutech xuất tri thức từ một

tập caacutec viacute dụ

6 Kỹ thuật thu thập tri thức Trao đổi gồm 2 loại cơ bản lagrave coacute cấu truacutec(coacute kịch bản) vagrave khocircng coacute cấu

truacutec( đối thoại trực tiếp) Giao thức phacircn tiacutech bằng lời Khi caacutec chuyecircn gia thực hiện một cocircng việc

của họ thigrave một bản ghi về cocircng việc đoacute được thực hiện Caacutec kỹ sư sẽ xacircy dựng mocirc higravenh cho những gigrave được ghi lại trong bản ghi

Phương phaacutep sagraveng lọc caacutec chuyecircn gia so saacutenh caacutec nhoacutem liecircn tiếp trong ba đối tượng vagrave cho biết tại sao nhoacutem thứ hai lại khaacutec nhoacutem thứ ba

7 Thu thập tri thức từ nhiều nguồn Thu thập tri thức từ nhiều nguồn lagrave cần thiết để coacute được đầy đủ caacutec tri thức

cho một vấn đề quan điểm yacute kiến traacutei ngược nhau thường phaacutet sinh Phương phaacutep đồng thuận sẽ giuacutep giải quyết được vấn đề macircu thuẫn Kỹ thuật phacircn tiacutech Meta lagrave kỹ thuật được aacutep dụng trong caacutec trường hợp

khaacutec Caacutech tiếp cận bằng định lượng đogravei hỏi caacutec kỹ sư cần cacircn nhắc yếu tố đầu vagraveo của caacutec chuyecircn gia khaacutec nhau

8 Xaacutec nhận hợp lệ vagrave kiểm tra tri thức Một khi thu thập tri thức noacute phải được đaacutenh giaacute về khả năng sử dụng vagrave độ

chiacutenh xaacutec Hai vấn đề cụ thể lagrave hiệu lực của những kiến thức vagrave kiểm tra việc xacircy dựng cơ sở của tri thức

Cần xaacutec nhận xem liệu hệ thống coacute thể hoạt động ở mức độ tối thiểu khocircng

Xaacutec minh liecircn quan đến việc so saacutenh từng chi tiết kỹ thuật của hệ thống những gigrave đatilde được thực hiện cuối cugraveng

9 Một số caacutec biện phaacutep xaacutec nhận Độ chiacutenh xaacutec Khả năng thiacutech nghi Mức độ đầy đủ Bề rộng Độ sacircu Hiệu lực Tổng quan Chiacutenh xaacutec Hiện thực Độ tin cậy Tiacutenh hữu dụng Mức độ

Chương 9 Học maacutey

1 Logic mờ vagrave ngocircn ngữ mờ(Fuzzy Logic and Linguistic Ambiguity)

Ngocircn ngữ tự nhiecircn gồm những khaacutei niệm mơ hồ vagrave khocircng chiacutenh xaacutectruyền tải ngữ nghĩa thocircng qua tiacutenh xấp xỉkhocircng rotilde ragraveng

Những xấp xỉ nagravey giuacutep con người coacute thể truyền tải hết được yacute nghĩa nhưng maacutey thigrave khocircng hiểu

Lagravem sao biểu diễn caacutec tri thức sử dụng caacutec khaacutei niệm khocircng rotilde ragraveng(mờ) hoặc khocircng chiacutenh xaacutec

2 Khaacutei niệm cơ bản của logic mờ tập mờ lagrave những tập hợp khocircng coacute một giới hạn rotilde Mỗi phần tử của noacute chỉ

chứa một mức độ hagravem liecircn thuộc của từng phần tử Vigrave vậy tập mờ khocircng giống như tập cổ điển Tập mờ coacute thể kết hợp với nhau qua những luật mờ magrave đặc trưng cho những hagravenh động trạng thaacutei vagrave thuộc tiacutenh của logic mờ được tận dụng khi thực hiện một bộ điều khiển mờ

Logic mờ dựa trecircn yacute tưởng mỗi phần tử thuộc vagraveo một tập hợp ở một mức độ nagraveo đấy

Locircgic mờ cho pheacutep độ liecircn thuộc (microA )coacute giaacute trị trong khoảng (01) Locircgic mờ coacute thể được coi lagrave mặt ứng dụng của lyacute thuyết tập mờ để xử lyacute caacutec

giaacute trị trong thế giới thực cho caacutec bagravei toaacuten phức tạp

3 So saacutenh tiacutenh đuacuteng đắn logic mờ vagrave xaacutec suất Xaacutec suất thigrave đề cập đến khả năng xảy ra một biến cố hay một điều gigrave đoacute Logic mờ đề cập đến cấp độ magrave đặc tiacutenh ở hiện tại

o viacute dụ1 người coacute chiều cao 6 feet thigrave coacute cấp độ lagrave 05 về chiều cao

4 Ưu điểm của logic mờ Caacutech tiếp cận rất tự nhiecircnkhocircng phức tạp Coacute thể mocirc higravenh hoacutea caacutec hagravem phi tuyến tugravey yacute phức tạp

Coacute thể tận dụng được kinh nghiệm từ những chuyecircn gia hagraveng đầu trong mọi lĩnh vực

Logic mờ được xacircy dựng dựa trecircn ngocircn ngữ tự nhiecircnNền tảng của logic mờ lagrave dựa trecircn cơ sở giao tiếp của con người

5 Nhược điểm của logic mờ Trong 1 hệ thống phức tạpsử dụng logic mờ coacute thể trở thagravenh trở ngại cho

việc xaacutec thực độ tin cậy của hệ thống Cơ chế lập luận mờ khocircng thể học hỏi từ những lỗi sai

6 Mạng noron nhacircn tạo(ANN) Mạng noron nhacircn tạo lagrave một mocirc phỏng xử lyacute thocircng tinđược nghiecircn cứu ra

từ hệ thống thần kinh của sinh vậtgiống như bộ natildeo để xử lyacute thocircng tin ANNs lagrave chương trigravenh dựa trecircn maacutey tiacutenh đơn giản coacute chức năng lagrave một mocirc

higravenh bagravei toaacuten khocircng gian dựa trecircn thử nghiệm vagrave baacuteo lỗi

7 Học từ kinh nghiệm Tiến trigravenh Một mẫu dữ liệu được biểu diễn như một mạng lưới noronANN ldquodự

đoaacutenrdquo 1 đầu radự đoaacuten được so saacutenh với giaacute trị thực tế hoặc giaacute trị chiacutenh xaacutecNếu đoaacuten được chiacutenh xaacutec thigrave khocircng coacute hagravenh động nagraveo được thực hiện

Nếu dự đoaacuten sai ANN kiểm tra lại vagrave xaacutec định lại thocircng số để điều chỉnh Một mẫu dữ liệu khaacutec được biểu diễn vagrave quaacute trigravenh nagravey được lặp lại

8 Nguyecircn tắc cơ bản của cocircng nghệ nơron Caacutec yếu tố xử lyacute cơ bản trong hệ thống thần kinh của con người lagrave tế bagraveo

thần kinhMạng lưới của tế bagraveo nagravey lagrave liecircn kết với nhau nhận được thocircng tin từ caacutec cảm biến trong mắt taihellip

Thocircng tin nhận được bởi tế bagraveo thần kinh hoặc lagrave sẽ kiacutech thiacutech noacute(sẽ được chuyển qua 1 thocircng điệp dọc theo mạng lưới) hoặc lagrave sẽ ngăn cản noacute(ngăn cản dograveng thocircng tin)

Độ nhạy coacute thể thay đổi qua thời gian hoặc sau khi coacute được kinh nghiệm

9 Cấu truacutec mạng Một ANN gồm 3 lớp cơ bản

Lớp đầu vagraveo nhận dữ liệu Lớp becircn trong hoặc lagrave lớp ẩn xử lyacute dữ liệu Lớp đầu ra chuyển tiếp kết quả cuối cugraveng của mạng

10Mạng nơ ron Thường coacute nhiều đầu vagraveo mỗi đầu vagraveo với mức ảnh hưởng vagrave tầm quan

trọng riecircng của noacute Một đầu vagraveo quan trọng coacute thể được sử dụng để khuếch đại đầu ra caacutec hagravem trạng thaacutei tổng hợp caacutec trọng số của caacutec yếu tố

đầuvagraveo khaacutec nhauvagraveo một giaacute trị duy nhất Caacutec hagravem chuyển giao xử lyacute caacutec giaacute trị trạng thaacutei vagrave tạo đầu ra

11Huấn luyện mạng nơ ron Trong mocirc higravenh coacute giaacutem saacutetANN được đến so saacutenh dự đoaacuten của chiacutenh

noacute với thocircng tin phản hồi coacute chứa caacutec kết quả mong muốn ANN sẽ phải tigravem caacutech thay đổi caacutec tham số becircn trong củamigravenh (caacutec trọng số vagrave caacutec ngưỡng) để tạo necircn một aacutenh xạ coacute khả năng aacutenh xạcaacutec đầu vagraveo thagravenh caacutec đầu ra mong muốn Sự thay đổi nagravey được tiến hagravenh nhờ việc so saacutenh giữa đầu ra thực sự vagrave đầu ra mong muốn

Trong mocirc higravenh khocircng coacute giaacutem saacutetANN nhận được dữ liệu vagraveo nhưng khocircng phải coacute bất kỳ thocircng tin phản hồi về kết quả mong muốn

Phần lớn caacutec ứng dụng nằm trong vugraveng của caacutec bagravei toaacuten ước lượng như mocirc higravenh hoacuteathống kecirc neacuten lọc phacircn cụm

12Lợi iacutech Liecircn kết với mạng noron Traacutenh caacutech lập trigravenh tường minh Giảm nhu cầu của chuyecircn gia ANNs thigrave thiacutech nghi với caacutec yếu tố đầu vagraveo thay đổi Khocircng cần thiết cho cơ sở tri thức tinh chế ANNs coacute tiacutenh động vagrave cải thiện với việc sử dụng Coacute khả năng xử lyacute dữ liệu khocircng chiacutenh xaacutec hoặc khocircng đầy đủ Cho pheacutep tổng quaacutet hoacutea từ thocircng tin cụ thể Cho pheacutep thu thập cảm giaacutec thocircng thường vagraveo miền giải quyết vấn đề

13Hạn chế của việc liecircn kết với mạng noron ANNs khocircng thể giải thiacutech được suy luận Bản chất hộp đen thường khiến cho vấn đề traacutech nhiệm vagrave độ tin cậy phaacutet

sinh lagrave khoacute khăn Lặp đi lặp lại quaacute trigravenh huấn luyện rất tốn thời gian Nguồn lực caacutec nhagrave phacircn tiacutech vagrave thiết kế coacute tay nghề cao vẫn lagrave đaacuteng lo

ngại Cocircng nghệ ANN thuacutec đẩy hạn chế của phần cứng hiện tại ANN yecircu cầu phải coacute sự tin tưởng ở đầu ra

14Giới thiệu về thuật toaacuten di truyền Cũng như mạng lưới thần kinh caacutec thuật toaacuten di truyền được dựa trecircn lyacute

thuyết sinh học Thuật toaacuten di truyền tigravem thấy nguồn gốc của chuacuteng trong caacutec lyacute thuyết

tiến hoacutea của chọn lọc tự nhiecircn vagrave thiacutech ứng với biến đổi khiacute hậu Kết quả thuật toaacuten di truyền lagrave từ giao phối 2 caacute thể trong quần thế để tạo

ra con caacutei đocirci khi tốt hơn so với bậc cha mẹ của chuacuteng 15Caacutec thagravenh phần cơ bản của thuật toaacuten di truyền

Toaacuten tử chọn lọc Caacutec caacute thể tốt được chọn lọc để đưa vagraveo thế hệ sau Sự chọn lọc nagravey căn cứ vagraveo độ thiacutech nghi với mocirci trường của mỗi caacute thể

Toaacuten tử lai gheacutep (crossover) Hai caacute thể cha vagrave mẹ trao đổi caacutec gen với nhau để tạo ra caacute thể con

Toaacuten tử đột biến (mutation) Một caacute thể thay đổi một số gen để biến đổi thagravenh một caacute thể mớiTất cả caacutec toaacuten tử trecircn khi thực hiện đều mang tiacutenh ngẫu nhiecircn

16Quaacute trigravenh cơ bản của một thuật toaacuten di truyền Khởi tạo

Đaacutenh giaacute quần thể

Lựa chọn NST thiacutech hợp nhất vagrave loại bỏ NST yếu nhất

Quy trigravenh giao nhau vagrave cải thiện quần thể

đột biến tiến trigravenh để khaacutem phaacute ra NST mới

17Ưu nhược điểm của việc kết hợp với thuật toaacuten di truyền Kiacutech thước quần thể lagrave 1 yếu tố quan trọng trong tốc độ của việc tigravem

kiếmnhưng noacute tương đối dễ dagraveng để dự đoaacuten tốc độ nagravey Giao nhau hoặc đột biến lagrave khocircng necircn đc sử dụng quaacute thường xuyecircn Luocircn coacute được iacutet nhất 1 giải phaacutep hợp lyacute Necircn coacute thể aacutep dụng chuacuteng cho caacutec vấn đề magrave chuacuteng ta khocircng coacute hướng

về caacutech giải quyết Sức mạnh của thuật toaacuten xuất phaacutet từ khaacutei niệm đơn giảnkhocircng phải từ

một thủ tục thuật toaacuten phức tạp 18Tương lai của học maacutey

Mạng lưới thần kinh nhacircn tạo vượt quaacute năng lực của con người trong caacutec trường hợp bị cocirc lập

Về mặt lyacute thuyếtmột maacutey tiacutenh coacute thể xử lyacute dũ liệu nhanh hơn hagraveng triệu lần so với 1 con người

May mắn thay cho chuacuteng tacon người tốt hơn nhiều khi magrave coacute được dữ liệumaacutey tiacutenh khocircng coacute 1 số thứ như lagrave 5 giaacutec quan

CHƯƠNG 10 KHO DỮ LIỆU

1 Kho dữ liệu Kho dữ liệu lagrave tuyển tập caacutec cơ sở dữ liệu tiacutech hợp hướng chủ đề được

thiết kế để trợ giuacutep cho một hệ hỗ trợ quyết định

Theo John Ladley Cocircng nghệ kho dữ liệu lagrave tập caacutec phương phaacutep kỹ thuật vagrave caacutec cocircng cụ coacute thể kết hợp hỗ trợ nhau để cung cấp thocircng tin cho người sử dụng trecircn cơ sở tiacutech hợp từ nhiều nguồn dữ liệu nhiều mocirci trường khaacutec nhau

Kho dữ liệu thường rất lớn tới hagraveng trăm GB hay thậm chiacute hagraveng Terabyte

2 Kho dữ liệu vận hagravenh (ODS) Một kho dữ liệu vận hagravenh Aacutep dụng kỹ thuật kho dữ liệu vagraveo caacutec hệ xử

lyacute giao taacutec lưu trữ dữ liệu cho một ứng dụng đặc thugrave Noacute đưa vagraveo kho dữ liệu một dograveng caacutec dữ liệu thocirc được thiết kế

3 So saacutenh

Kho dữ liệu vận hagravenh Kho dữ liệu

Dữ liệu theo chủ đề Dữ liệu theo chủ đề

Dữ liệu tiacutech hợp Dữ liệu tiacutech hợp

Dữ liệu thay đổi Dữ liệu khocircng thay đổi

Dữ liệu được cập nhật khi thay đổi

Dữ liệu giữ nguyecircn

Chỉ coacute dữ liệu hiện tạiDữliệu hiện tại vagrave dữ liệu lịch sử

Chu kỳ lagravem tươi dữ liệu ngắn Chu kỳ lagravem tươi dữ liệu dagravei

Chỉ coacute dữ liệu chi tiết Dữ liệu chi tiết vagrave dữ liệu tổng kết

Dugraveng cho caacutec quyết định ngắn hạn

Dugraveng cho hoạch định dagravei hạn

4 Kho dữ liệu cục bộ (Data Mart - DM)

Kho dữ liệu cục bộ lagrave CSDL coacute những đặc điểm giống với kho dữ liệu nhưng với quy mocirc nhỏ hơn vagrave lưu trữ dữ liệu về một lĩnh vực một chuyecircn ngagravenh

Data mart phụ thuộc Chứa những dữ liệu được lấy từ DW vagrave những dữ liệu nagravey sẽ được triacutech lọc vagrave tinh chế tiacutech hợp lại ở mức cao hơn để phục vụ một chủ đề nhất định của Datamart

Data mart độc lập Khocircng giống như Datamart phụ thuộc Data mart độc lập được xacircy dựng trước DW vagrave dữ liệu được trực tiếp lấy từ caacutec nguồn khaacutec nhau

5 Siecircu dữ liệu Metadata lagrave dữ liệu để mocirc tả dữ liệu Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột

một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi Metadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu

6 Mocirci trường kho dữ liệu Hệ thống của tổ chức vagrave kho cung cấp dữ liệu để xacircy dựng kho dữ liệu Trong quaacute trigravenh chuyển dữ liệu từ caacutec nguồn khaacutec nhau dữ liệu coacute thể

được lagravem sạch hoặc chuyển đổi vagrave vigrave thế DW được xem như lagrave một chuẩn cho việc lưu trữ

Đồng thời siecircu dữ liệu được ghi lại Cuối cugraveng DW hoặc siecircu thị coacute thể được sử dụng để tạo ra một kho dữ

liệu ldquocaacute nhacircnrdquo 7 Caacutec đặc điểm của kho dữ liệu

Đặc điểm Mocirc tả

Hướng chủ đề - DL tổ chức theo caacutech thức người dugraveng tham chiếu

Tiacutech hợp - Dữ liệu ldquosạchrdquo loại bỏ tiacutenh thiếu nhất quaacuten

Khocircng thay đổi - DL ldquochỉ đọcrdquo người dugraveng khocircng thay đổi được

Chuỗi thời gian - DL lagrave chuỗi thời gian khocircng phải lagrave trạng thaacutei hiện tại

Được tổng kết - DL vận hagravenhthao taacutec khi cần thiết

được kết hợp lại thagravenh dạng coacute thể dugraveng được cho quyết định

Kiacutech cỡ lớn hơn - Lưu giữ theo chuỗi thời gian tức lagrave giữ lại nhiều DL

Khocircng được chuẩn hoacutea - Coacute thể dư thừa DLSiecircu dữ liệu - Dữ liệu của dữ liệu được lưu trữNguồn dữ liệu - DL vận hagravenh (caacutec hệ sẵn coacute) cugraveng

với caacutec nguồn ngoagravei 8 Kho dữ liệu hướng chủ đề

Hướng chủ để coacute nghĩa lagrave kho dữ liệu được tổ chức xung quanh caacutec chủ đề chiacutenh như khaacutech hagraveng sản phẩm sản xuất Tập trung vagraveo việc mocirc higravenh hoacutea vagrave phacircn tiacutech dữ liệu cho caacutec nhagrave ra quyết định magrave khocircng tập trung vagraveo caacutec xử lyacute thocircng thường Cung cấp cho người dugraveng một khung nhigraven toagraven vẹn đơn giản vagrave đầy đủ về caacutec sự kiện quanh caacutec chủ đề

9 Dữ liệu trong DW được tiacutech hợp Dữ liệu trong kho dữ liệu được xacircy dựng bằng caacutech tổng hợp dữ liệu từ

nhiều nguồn khaacutec nhau vagrave caacutec nguồn coacute tổ chức khaacutec nhau Cơ sở dữ liệu caacutec file excel caacutec flat file hoặc caacutec raw file Khi đưa vagraveo kho dữ liệu caacutec dữ liệu được lagravem sạch vagrave tiacutech hợp dữ liệu nhằm đảm bảo tiacutenh nhất quaacuten của dữ liệu

10Kiến truacutec kho dữ liệu Tầng cơ sở dữ liệu hoạt động Tầng truy xuất thocircng tin Tầng truy xuất dữ liệu Tầng siecircu dữ liệu Tầng quản lyacute tiến trigravenh Tầng thocircng điệp của ứng dụng Tầng vật liacute của kho dữ liệu Tầng trigravenh diễn dữ liệu

11Higravenh trạng kho dữ liệu Kho dữ liệu ảo - người dugraveng cuối coacute thể truy cập trực tiếp đến kho dữ liệu

sử dụng caacutec cocircng cụ cho pheacutep ở tầng truy xuất dữ liệu Kho dữ liệu trung tacircm-1 cơ sở dữ liệu vật lyacute chứa tất cả dữ liệu cho một

vugraveng chuyecircn dụng nagraveo đoacute

Kho dữ liệu phacircn taacuten- Thagravenh phần được phacircn taacuten qua nhiều hệ cơ sở dữ liệu vật lyacute

12METADATA- Siecircu dữ liệu Định nghĩa Siecircu dữ liệu lagrave dữ liệu về dữ liệu Lagrave 1 lưu trữ dugraveng để

Miecircu tả kho dữ liệu tổng thể Nhận dạng kiểu kho dữ liệu Quản liacute quaacute trigravenh tiacutech hợp dữ liệu Quản liacute quaacute trigravenh cập nhật kho dữ liệu Quản liacute bảo mật

Lagrave chigravea khoacutea quyết định sự thagravenh cocircng của kho dữ liệu luocircn được thay đổi vagrave cập nhật theo sự phaacutet triển của kho dữ liệu

Dugraveng để quản liacute điều khiển kho dữ liệu Sự ra đời của kho dữ liệu như 1 cấu truacutec hỗ trợ ra quyết định siecircu dữ liệu

được xem như nguồn tagravei nguyecircn dữ liệu Siecircu dữ liệu lagrave trừu tượng Chuacuteng lagrave dữ liệu bậc cao cung cấp mocirc tả ngắn

gọn caacutec dữ liệu bậc thấp hơn 13Hoạt động của Siecircu dữ liệu

Siecircu dữ liệu rất cần thiết trong việc chuyển hoacutea thocircng tin trở thagravenh tri thức Lagrave chigravea khoacutea giuacutep chuacuteng ta xử lyacute được dữ liệu thocirc Viacute dụ một dograveng dữ liệu baacuten hagraveng 1023 K596 11121 agraveNoacute sẽ khocircng coacute nghĩa gigrave cho đến khi chuacuteng ta đưa vagraveo siecircu dữ liệu (thư

mục chứa dữ liệu) agrave cửa hagraveng 1023 sản phẩm K596 vagrave số tiền baacuten được lagrave 11121 đocirc la

14Sự cần thiết phải nhất quaacuten trong kho dữ liệu Kho dữ liệu được xacircy dựng cho lợi iacutech của những nhagrave phacircn tiacutech kinh

doanh caacutec nhagrave quản trị cho tất cả caacutec khu vực chức năng Trong cơ sở dữ liệu riecircng caacutec khu vực khaacutec nhau coacute thể định nghĩa vagrave lưu

trữ dữ liệu thocircng qua phiecircn bản của chiacutenh noacute Khi dữ liệu được lấy từ những vugraveng khaacutec nhau đoacute vagrave được đặt vagraveo kho dữ

liệu Việc chuyển đổi vagrave lagravem sạch caacutec tiến trigravenh sẽ đảm bảo noacute lagrave duy nhất được tiacutech hợp tại một mức của tổ chức

15Ragrave soaacutet lại dữ liệu ndash Thực thi siecircu dữ liệu

Bất kể cấu truacutec tự nhiecircn của 1 cacircu truy vấn thế nagraveo thigrave caacutec thagravenh phần của siecircu dữ liệu rất quan trọng đối với người ra quyết định

Bảng thuộc tiacutenh khoacutea được lưu trữ bởi kho dữ liệu Tập hợp dữ liệu được lấy từ đacircu Những chuyển đổi nagraveo được thực thi với việc lagravem sạch

16Siecircu dữ liệu lagrave gigrave Metadata - lagrave thocircng tin mocirc tả nội dung của cơ sở dữ liệu (CSDL) Metadata baacuteo cho người dugraveng biết thời gian cập nhật sau cugraveng của dữ liệu

định dạng vagrave mục điacutech sử dụng của noacute Những thocircng tin nagravey coacute thể hướng dẫn người dugraveng duyệt qua CSDL vagrave

giuacutep họ hiểu được yacute nghĩa vagrave ngữ cảnh của dữ liệu Trong CSDL metadata lagrave caacutec dạng biểu diễn khaacutec nhau của caacutec đối tượng

trong CSDL Trong CSDL quan hệ metadata lagrave caacutec định nghĩa của bảng cột CSDL

view vagrave nhiều đối tượng khaacutec Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột

một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi -gtMetadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu

Bảng chuyển đổi Ghi lại những chuyển đổi đatilde được thực hiện

Lịch sử thực thi Ghi lại những dữ liệu đatilde được

phacircn tiacutech

Higravenh thaacutei kết nốiGhi lại những dữ liệu được kết nối vagrave tần suất

17Aacutenh xạ thocircng thường của siecircu dữ liệu Bản ghi aacutenh xạ chuyển đổi bao gồm

Định danh của nguồn gốc Chuyển đổi thuộc tiacutenh Chuyển đổi thuộc tiacutenh vật lyacute Matilde hoacutea tham chiếu bảng chuyển đổi Đổi tecircn Đổi khoacutea Gaacuten giaacute trị cho thuộc tiacutenh mặc định Chọn logic cho caacutec nguồn nhiều giaacute trị Đổi thuật toaacuten

18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để

phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai

lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave

tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec

Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm

Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo

19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua

caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau

SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được

Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra

một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức

Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ

Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ

Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech

CHƯƠNG 11 KHAI PHAacute DỮ LIỆU

1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn

ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993

Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng

2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd

1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều

2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP

3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn

4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng

5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server

6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo

7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động

8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời

9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều

10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện

11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech

12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP

3 Xử lyacute phacircn tiacutech trực tuyến OLAP

MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave

dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu

ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave

thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu

HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave

ROLAP4 Khai phaacute dữ liệu

Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh

khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn

Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan

5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp

6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại

Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp

Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec

Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt

Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra

Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh

vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho

Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec

Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm

Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục

Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng

gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp

Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn

Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec

Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper

Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2

Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25

Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước

Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng

Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện

trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp

Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute

độ hỗ trợ ge ngưỡng minsup

độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan

Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn

Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết

Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu

MOLAP ROLAP HOLAP

Lưu trữ dữ liệu cơ sở

Khối Bảng quan hệ Bảng quan hệ

Lưu trữ thocircng tin tổng hợp

Khối Bảng quan hệ Khối

Hiệu suất thực hiện truy vấn

Nhanh nhất Chậm nhất Nhanh

Tiecircu thụ khocircng gian lưu trữ

Nhiều Thấp Trung bigravenh

Chi phiacute bảo trigrave Cao Thấp Trung bigravenh

Page 30: De cuong(1-11)

Tagravei liệu thecircm Sự khaacutec nhau giữa EIS vagrave DSS+ EIS thiết kế để hỗ trợ những người điều hagravenh cấp cao giuacutep họ khaacutem phaacute caacutec vấn đề vagrave caacutec cơ hội DSS hỗ trợ những nười phacircn tiacutech cố gắng trả lời cacircu hỏi caacutei gigrave coacute thể lagravem cugraveng với một cơ hội hoặc một vấn đề

Chiều EIS DSSNhững người sử dụng thocircng thường

Duyệt dữ liệu đi xuống truy xuất trạng thaacutei

Hỗ trợ phacircn tiacutech vagrave quyết định

Sự thuacutec đẩy Tiacutenh thiacutech hợp Tiacutenh hiệu quảỨng dụng Queacutet mocirci trường đaacutenh giaacute

hiệu suất nhận dạng caacutec vấn đề vagrave caacutec cơ hội

Caacutec quyết định quản lyacute trecircn caacutec lĩnh vực đa dạng

Hỗ trợ quyết định Caacutec chiacutenh saacutech caacutec quyết định khocircng coacute cấu truacutec ở mức cao vagrave hỗ trợ giaacuten tiếp

Hỗ trợ caacutec quyết định lặp lại caacutec quyết định khocircng thể đoaacuten trước ra quyết định khocircng coacute cấu truacutec vagrave baacuten cấu truacutec

Loại thocircng tin Caacutec thocircng tin tin tức thocircng tin becircn ngoagravei về khaacutech hagraveng đối thủ cạnh tranh mocirci trường caacutec baacuteo caacuteo theo yecircu cầu vagrave định thời về caacutec hoạt động becircn trong

Caacutec thocircng tin hỗ trợ caacutec tigravenh huống đặc biệt

Sử dụng coacute nguyecircn tắc

Dograve theo vết vagrave điều khiển nhận dạng cơ hội

Hoạch định tổ chức phacircn nhoacutem vagrave điều khiển

Khả năng phugrave hợp với những người sử dụng caacute nhacircn

Thiết kế loại ra quyết định cho mỗi người điều hagravenh caacute nhacircn bằng nhiều lựa chọn đầu ra

Cho pheacutep caacutec đaacutenh giaacute caacute nhacircn caacutec khả năng what-if lựa chọn loại hộp hội thoại

Đồ họa Phải coacute Lagrave một phần quan trọng của nhiều DSS

Thacircn thiện người sử dụng

Phải coacute Phải coacute nếu khocircng coacute người sử dụng trung gian

Xử lyacute thocircng tin Lọc neacuten thocircng tin dograve theo vết dữ liệu vagrave thocircng tin quan trọng

EIS kiacutech thiacutech caacutec cacircu hỏi caacutec cacircu trả lời bằng caacutech sử dụng DSS vagrave phản hồi lại EIS

Hỗ trợ caacutec thocircng tin chi tiết

Truy xuất thường xuyecircn caacutec mức chi tiết của bất kỳ thocircng tin tổng hợp nagraveo (duyệt dữ

Coacute thể coacute trong DSS nhưng khocircng thường

liệu chi tiết)Cơ sở mocirc higravenh Caacutec chức năng coacute sẵn bị hạn

chếLagrave điểm cốt lotildei của DSS

Cấu truacutec Theo người baacuten sản phẩm hoặc theo caacutec chuyecircn gia hệ thống thocircng tin

Theo người sử dụng hoặc caacute nhacircn hoặc caacutec chuyecircn gia từ caacutec trung tacircm thocircng tin hoặc phograveng ban hệ thống thocircng tin

Phần cứng Mainframe caacutec trạm RISC mạng LANs hoặc caacutec hệ thống phacircn bố

Mainframe caacutec trạm RISC caacutec maacutey PC hoặc caacutec hệ thống phacircn bố

Bản chất caacutec goacutei phần mềm

Truy xuất tương taacutec dễ dagraveng đến nhiều cơ sở dữ liệu truy xuất trực tuyến caacutec khả năng DBMS phức tạp caacutec liecircn kết phức tạp

Caacutec khả năng tiacutenh toaacuten lớn caacutec ngocircn ngữ mocirc higravenh mocirc phỏng ứng dụng vagrave caacutec bộ tạo DSS

Bản chất caacutec thocircng tin

Trigravenh bagravey thocircng tin được phaacutet sinh trước về quaacute khứ vagrave hiện tại tạo caacutec thocircng tin mới về quaacute khứ hiện tại tương lai

Tạo thocircng tin mới về quaacute khứ hiện tại tương lai

62 Lịch sử EIS- EIS xuất hiện lần đầu tiecircn tại MIT vagraveo những năm 1970

- Những EIS đầu tiecircn được phaacutet triển bởi caacutec doanh ngiệp lớn sẵn sagraveng chấp nhận rủi ro để đạt được lợi thế cạnh tranh

- Vagraveo những năm 1980 caacutec nhagrave cung cấp đatilde phaacutet triển một số cơ sở khaacutech hagraveng rộng vagrave cocircng nghệ EIS được tiếp tục phaacutet triển cho đến ngagravey nay

(Tagravei liệu thecircm Sử dụng DSSEIS cho phaacutet triển bền vững + Một số nghiecircn cứu đatilde được tiến hagravenh để kiểm tra việc thực hiện của EIS trong khu vực cocircng cộng vagrave chiacutenh phủ caacutec nước tổ chức kể từ khi chuacuteng được phaacutet triển theo định hướng lợi nhuận cho caacutec cocircng ty tư nhacircn (Hasan vagrave Hasan năm 1997) Theo một nghiecircn cứu tiến hagravenh tại Mỹ ở hơn 300 cocircng ty kết quả cho thấy sự khaacutec biệt của EIS giữa tư nhacircn vagrave chiacutenh phủ một số kết quả thuacute vị được phaacutet hiệnViacute dụ khoacute khăn hơn để chuyển tiền từ một tagravei khoản khaacutec trong một EIS của chiacutenh phủ cũng lagrave khoacute khăn hơn để biện giải thiacutech cho những chi phiacute phaacutet triển EIS của chiacutenh phủ Một nghiecircn cứu khaacutec được tiến hagravenh ở Australia

cho thấy rằng EIS cung cấp cho quản lyacute một higravenh ảnh chiacutenh xaacutec hơn về tổ chức thực hiện vagrave cung cấp hỗ trợ cho caacutec lợi iacutech chiến lược cải thiện khocircng chỉ cho caacutec nhagrave quản lyacute nhưng cograven cho phần cograven lại của tổ chức Dựa trecircn caacutec hệ thống được thiết kế cho caacutec cocircng ty tư nhacircn với một caacutech rotilde ragravengxaacutec định mục tiecircu EIS lagrave thiacutech hợp cho caacutec tổ chức cocircng cộng hiện đại nhưng cần phải được linh hoạt hơn vagrave kết thagravenh chugravem một phạm vi rộng hơn khả năng vagrave phương tiện hơn so với khu vực tư nhacircn ban đầu theo định hướng sản phẩm (Hasan vagrave Hasan năm 1997) Điều nagravey coacute thể lagrave do thực tế rằng caacutec hoạt động khu vực cocircng lagrave bắt buộc coacute taacutec động rộng phải đaacutep ứng sự mong đợi duy nhất cocircng cộng thường coacute mục tiecircu mơ hồ vagrave macircu thuẫn iacutet quyền tự chủ vagrave kiểm soaacutet việc ra quyết định vagrave nhacircn viecircn lagrave khoacute khăn hơn (Watson vagrave Carte2000) + Toacutem lại EIS lagrave một khaacutei niệm thagravenh cocircng noacute phaacutet triển qua nhiều năm tuy nhiecircn EIS khắc phục khiếm khuyết của migravenh bằng caacutech tiến hagravenh nghiecircn cứu liecircn tục)

63 Tại sao những người điều hagravenh hagraveng đầu lại khaacutec nhau- Họ lagrave những doanh nghiệp theo định hướng coacute suy nghĩ

- Coacute một khoảng khocircng gian rộng để kiểm soaacutet

- Họ chịu traacutech nhiệm cho việc thiết lập chiacutenh saacutech

- Họ đại diện cho tổ chức mocirci trường becircn ngoagravei

- Hagravenh động của họ tạo ra những kết quả đaacuteng kể về tagravei chiacutenh vagrave con người

Tần số caacutec hoạt động điều hagravenh- Xử lyacute xaacuteo trộn 42

- Hoạt động kinh doanh 32

- Phacircn bổ nguồn lực 17

- Đagravem phaacuten 3

- Những điều khaacutec 6

Handling Disturbances 42

Entrepreneurial Activites 32

Resource Allocation 17

Negotiation 3

Other 6

Những thocircng tin điều hagravenh cần thiết- Quản lyacute xaacuteo trộn coacute thể yecircu cầu sự chuacute yacute xung quanh đồng hồ

- Hoạt động kinh doanh yecircu cầu điều hagravenh để dự đoaacuten những thay đổi trong mocirci trường

- Nhiệm vụ phacircn bổ tagravei nguyecircn yecircu cầu lựa chọn người quản lyacute vagrave caacutec nguồn lực hạn chế được triển khai

- Đagravem phaacuten yecircu cầu cập nhật thocircng tin từng phuacutet để coacute thể xacircy dựng được sự đồng thuận

Caacutec loại thocircng tin điều hagravenh- Hệ thống kế toaacuten coacute liecircn quan đến việc tiacutenh toaacuten thu nhập hoạt động cho caacutec lĩnh

vực cụ thể lagrave quan trọng hơn so với caacutec hệ thống kế toaacuten truyền thocircng- Thocircng tin về thị trường khaacutech hagraveng cung cấp giaacute trị trong việc quyết định chiến

lược- Caacutec thocircng tin cần thiết thường được truyền đi trecircn một số hệ thống maacutey tiacutenh vagrave

nằm trong toagraven tổ chức- Caacutec thocircng tin được sử dụng thường lagrave ngắn hạn vagrave dễ thay đổi

Phương thức để xaacutec định thocircng tin cần thiết

Rockart xaacutec định được năm phương thức cơ bản để xaacutec định thocircng tin cần thiết

- Phương thức dựa trecircn kết quả- Phương thức rỗng- Phương thức chỉ số khoacutea- Phương thức tổng hợp nghiecircn cứu- Phương thức dựa vagraveo nhacircn tố then chốt dẫn đến thagravenh cocircng

64 Thagravenh phần EIS

- Sản phẩm EIS đầu tiecircn được phaacutet triển để sử dụng trecircn maacutey tiacutenh cấu higravenh cao nhưng caacutec sản phẩm hiện nay nhằm mục tiecircu lagrave nền tảng ClientServer

- Những nền tảng linh hoạt hơn coacute thể thiacutech ứng với thay đổi trong tổ chức vagrave cocircng nghệ

- Sử dụng dữ liệu thời gian thực dẫn đến quyết định nhanh hơn nhiều thocircng tin hơn

Thagravenh phần phần cứng- Một EIS khocircng đogravei hỏi coacute phần cứng cụ thể hoặc duy nhất nagraveo- Chigravea khoacutea của vấn đề lagrave để đảm bảo rằng caacutec thagravenh phần của EIS tối ưu hoacutea vagrave

phugrave hợp với tagravei nguyecircn maacutey tiacutenh của tổ chức- Hệ thống nagravey phải được cấu higravenh để caacutec nguồn tagravei nguyecircn phugrave hợp với những

người điều hagravenh chuacuteng

Thagravenh phần phần mềm- Traacutei ngược với phần cứng phần mềm thường được chuyecircn mocircn hoacutea cao cho caacutec

bagravei toaacuten về miền- Sự chuyecircn mocircn hoacutea nagravey thường đạt được bằng caacutech sử dụng thagravenh phần off-the-

shelf cho toagraven bộ EIS vagrave caacutec mocirc-đun tugravey chỉnh để đaacutep ứng nhu cầu cụ thể- Lotus Notes lagrave một viacute dụ điển higravenh Noacute coacute thể được sử dụng một migravenh hoặc coacute

thể phục vụ becircn thứ ba mocirc-đun plug-in

Cocircng nghệ EIS hiện nay

Dobrzeniecki đề xuấtphacircn loạitừng cấptheo bachức năng- Loại 1 sản phẩm bao gồmmột bộ đầy đủcaacutec ứng dụngtừ mộtnhagrave cung cấp- Loại 2 sản phẩm đượcthựchiệnở phần đầu củacaacutecsản phẩmDSS đượcphaacutet triển

bởicugravengmộtnhagrave cung cấp- Loại 3 sản phẩmkết hợp với nhautheo bất kỳ số lượngthuộc sở hữu củacocircng ty

65 Xacircy dựng EIS

- Xacircy dựngmộtEISgiống nhưxacircydựngmột số hệ thống khaacutec củamocirc higravenh hệ thống thocircng tin

- Việcphaacutet triểncấu truacutecnecircn được theo dotildeitừ quaacute trigravenh thiết kế đến quaacute trigravenhthực hiện

- Tuy nhiecircn một dự aacuten phaacutet triển EIScoacute xu hướnglagrave thống nhấtvagraveyecircu cầu hỗ trợ caacutec nhagrave quản lyacute latildenh đạo

- Xacircy dựng một EIScoacute thểphaacutet hiện ra đượccaacutectigravenh huống khoacute khănmagravemột nhagrave phaacutet triển chưabao giờ gặp phải

Mocirc higravenh EIS

Khung phaacutet triển một EIS

- Watson et al đề nghị xacircy dựngkhung với ba thagravenh phần+ Caacutech tiếp cận tập trung vagraveo yếu tốcon người vagrave dữ liệu coacute liecircn quan đến EIS+ Quaacute trigravenh phaacutet triển cần sự linh hoạt vagrave tương taacutec+ Người sử dụng - hệ thống hộp thoại bao gồm một ngocircn ngữ hagravenh động để xử lyacute caacutec lệnh

Lợi iacutech của EIS- Dễ duy trigrave caacutec mục tiecircu coacute tổ chức- Dễ truy xuất thocircng tin- Cho pheacutep người sử dụng nacircng cao hiệu suất hơn

- Tăng chất lượng ra quyết định- Cung cấp sự cải tiến cạnh tranh- Tiết kiệm thời gian của người sử dụng- Tăng khả năng vagrave chất lượng giao tiếp- Cung cấp khả năng điều khiển tốt hơn trong tổ chức- Cho pheacutep tham gia caacutec vấn đề vagrave caacutec cơ hội- Cho pheacutep hoạch định- Cho pheacutep tigravem kiếm nguyecircn nhacircn của một vấn đề- Thảo matilden caacutec yecircu cầu của người điều hagravenh

Hạn chế của EIS vagrave 1 số sai lầm cần traacutenh

- Chi phiacute một cuộc khảo saacutetnăm1991 chothấychi phiacute phaacutet triểntrungbigravenh365000USDvớichi phiacute vận hagravenhhagraveng năm lagrave$200000 (EIS)

- Cocircng nghệ hạn chếEIScần phảiđượctiacutech hợp hoagraven toagravenvagraveokiếntruacuteccủadoanh nghiệphiện tại do đoacute noacutelagrave một thaacutech thứclớn đối vớithiết kế

- Hạn chế tổ chức cơ cấu tổ chứccoacute thể khocircng phugrave hợp

Sự hạn chế về tổ chức- Chương trigravenh nghị sự vagrave thời gian chệch EIS mocirc tả một phần việc thực hiện một

chương trigravenh nghị sự vagrave coacute thể dễ dagraveng đạt được sự tin cậy một caacutech chắc chắn- Đồng bộ hoacutea việc quản lyacute sự tin cậy đuacuteng luacutec đặc biệt baacuteo caacuteo EIS coacute thể phaacute

vỡ sự ổn định thiết lập caacutec chu trigravenh baacuteo caacuteo một caacutech tốt nhất- Sự bất ổn EIS phản ứng nhanh coacute thể gacircy ra việc taacutec động trở lại một caacutech

nhanh choacuteng dẫn đến sự thiếu ổn định trong tổ chức

Sự thất bại lagrave thay thế khocircng thể chấp nhận được- Một số yếu tố lagravem EIS thất bại

+ Thiếu sự hỗ trợ về mặt quản lyacute+ Vấn đề chiacutenh trị+ Thất bại của nhagrave phaacutet triển+ Lỗi về cocircng nghệ+ Giaacute cả+ Thời gian

66 Ra quyết định điều hagravenh trong tương lai vagrave EIS

- Coacute một vagravei điều kiện sẽ được hợp nhất cho việc chuyển đổi cocircng nghệ Trong đoacute một vagravei điều kiện coacute thể dễ dự đoaacuten Hai điều kiện magrave ta coacute thể thấy lagrave+ Phaacutet triển cocircng nghệ maacutey tiacutenh trong việc điều hagravenh sẽ tạo ra sự chuyển đổi được chấp nhận một caacutech dễ dagraveng hơn+ Mở rộng traacutech nhiệm điều hagravenh sẽ mở rộng nhu cầu thocircng tin

Tương lai của EIS- EIS thocircng minh Những tiến bộ trong cocircng nghệ AI sẽ được triển khai trong caacutec

EIS- EIS đa phương tiện Cơ sở dữ liệu đa phương tiện sẽ cho pheacutep tiacutech hợp văn bản

giọng noacutei vagrave higravenh ảnh trong tương lai- EIS thocircng tin Tương lai EIS sẽ mở rộng hơn trong việc sử dụng dữ liệu becircn

ngoagravei doanh nghiệp- EIS kết nối Giao tiếp với băng thocircng rộng cho pheacutep kết nối liecircn thocircng lớn hơn

Chương 7 HỆ CHUYEcircN GIA VAgrave TRIacute TUỆ NHAcircN TẠO

71 Caacutec khaacutei niệm

72 Triacute thocircng minh của triacute tuệ nhacircn tạo

73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia

74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia

75 Lợi iacutech vagrave hạn chế của hệ chuyecircn gia

71 Caacutec khaacutei niệm

Chuyecircn mocircn (Expertise) sự hiểu biết rộng trong 1 lĩnh vực hẹp

Hệ chuyecircn gia (Expert Systems)1 chương trigravenh maacutey tiacutenh sử dụng 1 tập caacutec luật dựa trecircn tri thức của con người để giải quyết caacutec vấn đề đogravei hogravei phải coacute sự chuyecircn mocircn

Một số hệ chuyecircn gia nổi tiếng

DENDRAL (Standford 1960s Edward Feigenbaum)

MYCIN (Standford1970s Edward Shortliffe)

PROSPECTOR (MIT 1979)

Triacute tuệ nhacircn tạo (Artificial Intelligence ndash AI)

Triacute tuệ nhacircn tạo một bộ phacircn của ngagravenh khoa học maacutey tiacutenh quan tacircm đến việc thiết kế caacutec hệ thống maacutey tiacutenh thocircng minh đoacute lagrave caacutec hệ thống đưa ra caacutec đặc điểm magrave từ đoacute chuacuteng ta liecircn hệ với sự thocircng minh trong hagravenh động của con người (Barr vagrave Feigenbaum 1981)

Mục điacutech của AI

Mục điacutech khoa học xaacutec định caacutec gợi yacute để giải thiacutech caacutec loại khaacutec nhau của triacute tuệ thực

Mục điacutech kỹ thuật giải quyết caacutec vấn đề trong thế giới thực

Triacute tuệ nhacircn tạo kế thừa nhiều yacute tưởng quan điểm kỹ thuật từ caacutec ngagravenh khoa học khaacutec

- Triết học

- Logic Toaacuten học

- Tiacutenh toaacuten

- Khoa học tacircm lyacute Khoa học nhận thức

- Sinh học Thần kinh học

- Tiến hoacutea

Caacutec lĩnh vực ứng dụng trong Triacute tuệ nhacircn tạo

Mạng nơ ron thần kinh (Neural Networks)

Tiacutenh toaacuten sự tiến hoacutea

(Evolutionary Computation)

Hệ chuyecircn gia (Expert Systems)

Kỹ thuật xử lyacute tiếng noacutei (Speech Processing)

Kỹ thuật xử lyacute ngocircn ngữ tự nhiecircn

(Natural Language Processing)

Lập kế hoạch (Planning)

Robot (Robotics)

Khoa học higravenh ảnh (Vision)

Caacutec kỹ thuật thocircng dụng dugraveng trong AI

Biểu diễn(Representation)

Học (Learning)

Caacutec luật (Rules)

Tigravem kiếm (Search)

72 Triacute thocircng minh của triacute tuệ nhacircn tạo

Con người suy diễn như thế nagraveo

Phacircn loại (Categorization)

Caacutec quy tắc cụ thể

Heuristics

Kinh nghiệm trước đoacute

Dự tiacutenh trước

Maacutey tiacutenh suy diễn như thế nagraveo

Lập luận dựa trecircn luật IF-THEN mocirc tả tri thức được matilde hoacutea dưới dạng caacutec luật

Caacutec khung (Frames) lagrave caacutec đại diện mocirc tả caacutec tigravenh huống giống nhau lagrave điển higravenh của một vagravei phacircn loại

Lập luận dựa trecircn caacutec trường hợp mocirc phỏng giải phaacutep trước đoacute cho một vấn đề hiện tại

Nhận dạng mẫu phaacutet hiện acircm thanh higravenh dạng hoặc caacutec chuỗi dagravei

Caacutec dạng khaacutec của Triacute tuệ nhacircn tạo

Học maacutey- mạng nơron vagrave giải thuật di truyền

Lập trigravenh tự động ndash lagrave những kỹ thuật tạo ra caacutec chương trigravenh để lagravem 1 nhiệm vụ riecircng biệt (cho pheacutep những người khocircng phải lagrave người lập trigravenh coacute thể lập trigravenh được)

Cuộc sống nhacircn tạo ndash nỗ lực để taacutei tạo caacutec hiện tượng sinh học trong caacutec hệ thống dựa trecircn maacutey tiacutenh

73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia(Expert Systems- ES)

Theo Jackson (1999) Một hệ chuyecircn gia lagrave một chương trigravenh maacutey tiacutenh mocirc tả vagrave suy diễn với tri thức của một vagravei lĩnh vực để giải quyết vấn đề hay đưa ra caacutec lời khuyecircn

Cấu truacutec cơ bản của ES được dựa theo cấu truacutec chung của DSS Sự khaacutec biệt chiacutenh giữa ES vagraveDSS lagrave hệ ES thu thập caacutec kiến thức từ những

chuyecircn gia trong lĩnh vực quan tacircmĐặc trưng của hệ chuyecircn gia Hiệu quả cao Thời gian trả lời thỏa đaacuteng Độ tin cậy cao Dễ hiểu

Giao diện người dugraveng trong ES

Thiết kế giao diện người dugraveng tập trung vagraveo caacutec yếu tố như dễ dagraveng sử dụngcoacute độ tin cậy cao giảm tải những khoacute khăn khi sử dụng

Thiết kế necircn coacute một số tương taacutec (đầu vagraveo kiểm soaacutet vagrave truy vấn)

Cấu tạo giao diện người dugraveng gồm coacute magraven higravenh cảm ứng bagraven phiacutem buacutet saacuteng lệnh thoại caacutec phiacutem chuyecircn dụng

Cơ sở tri thức (Knowledge Base)

Chứa đựng caacutec tri thức cụ thể miền thu được từ caacutec chuyecircn gia miền

Coacute thể chứa caacutec mocirc tả caacutec hagravenh vi giải quyết vấn đề caacutec ragraveng buộc caacutec heuristics

Thagravenh cocircng của một ES dựa trecircn tiacutenh đầy đủ vagrave tiacutenh chiacutenh xaacutec của cơ sở tri thức

Mocirc tơ suy diễn (Inference Engine)

Ở đacircy tri thức được đặt để sử dụng tạo ra caacutec giải phaacutep để giải quyết vấn đề

Mocirc tơ nagravey coacute khả năng thực hiện diễn dịch hoặc suy diễn dựa trecircn caacutec luật hay caacutec caacutec sự kiện

Đồng thời cũng coacute khả năng sử dụng caacutec suy diễn mờ hay khocircng chiacutenh xaacutec dựa trecircn xaacutec suất hay aacutenh xạ mẫu

Vograveng điều khiển suy diễn

1 Aacutenh xạ caacutec luật với caacutec sự kiện đatilde được cho

2 Chọn luật để thực hiện

3 Thực hiện luật bằng caacutech thecircm caacutec sự kiện được suy diễn ra vagraveo bộ nhớ lagravem việc

Chuỗi suy diễn (Chaining)

Suy diễn tiến (forward chaining) maacutey suy diễn bắt đầu từ dữ liệu ban đầu vagrave thực hiện việc suy luận để đưa ra caacutec kết luận cuối cugraveng

Suy diễn lugravei (backward chaining) maacutey suy diễn bắt đầu từ dữ liệu điacutech vagrave tigravem ra tri thức hỗ trợ cho dữ liệu điacutech đoacute

Viacute dụ suy diễn lugravei

R1 Nếu coacute A vagrave B thigrave suy ra coacute D

R2 Nếu coacute B thigrave suy ra coacute C

R3 Nếu coacute C vagrave D thigrave suy ra coacute E

Ta coacute E ta xem trong 3 luật R1 R2 R3 luật nagraveo coacute E ta thấy R3 chứa E đồng thời chứa C vagrave D Xeacutet tiếp trong 2 luật R1 R2 luật nagraveo chứa C vagrave D R2 chứa C R3 chứa D Từ đoacute ta coacute được caacutec tri thức hỗ trợ suy diễn vagrave kết luận lagrave nếu coacute A vagrave B thigrave sẽ coacute E Hay nếu A vagrave B đuacuteng thigrave sẽ coacute E

Viacute dụ suy diễn tiến

Giả sử coacute tập chứa 3 luật sau

R1 Nếu coacute A vagrave B thigrave suy ra coacute D

R2 Nếu coacute B thigrave suy ra coacute C

R3 Nếu coacute C vagrave D thigrave suy ra coacute E

Nếu ta coacute A vagrave B thigrave chuacuteng ta suy ra được D từ R1 vagrave suy ra C từ R2 Với D vagrave C đatilde được suy ra ở trecircn giờ chuacuteng ta suy ra được E từ R3

Viacute dụ thực tế

Giả sử muốn biết magraveu của một con vật nuocirci tecircn lagrave Fred biết rằng noacute kecircu ộp ộp vagrave ăn ruồi

Coacute tập 4 luật ban đầu như sau

R1 Nếu X kecircu ộp ộp vagrave ăn ruồi thigrave X lagrave con ếch

R2 Nếu X kecircu chiecircm chiếp vagrave biết hoacutet thigrave X lagrave con chim

R3 Nếu X lagrave con ếch thigrave X coacute magraveu xanh

R4 Nếu X lagrave con chim thigrave X coacute magraveu vagraveng

74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia

Expert system shells lagrave một tập caacutec goacutei phần mềm vagrave caacutec cocircng cụ dugraveng để phaacutet triển caacutec hệ chuyecircn gia

Những Expert system shells đầu tiecircn thường rất rườm ragrave Mặc dugrave vậy noacute vẫn giuacutep cho người sử dụng sẽ khocircng phải bắt đầu lại từ đầu khi xacircy dựng một hệ chuyecircn gia mới

Những shell hiện đại bao gồm hai mocirc-đun chiacutenh lagrave cocircng cụ xacircy dựng một tập quy tắc vagrave mocirc tơ suy diễn

Xacircy dựng hệ chuyecircn gia

Bước 1 xacircy dựng mocirc higravenh bagravei toaacuten xaacutec định vấn đề nhiệm vụ magrave hệ thống sẽ thực hiện Caacutec dạng bagravei toaacuten cần hệ chuyecircn gia

Bagravei toaacuten diễn giải (InterPretation)

Bagravei toaacuten dự baacuteo (Prediction)

Bagravei toaacuten chuẩn đoaacuten (Diagnose)

Bagravei toaacuten gỡ rối (Debugging)

Bagravei toaacuten thiết kế

Tương tự như một dự aacuten phần mềm để xacircy dựng một hệ chuyecircn gia cần phải coacute caacutec yếu tố về nhacircn lực tagravei nguyecircn vagrave thời gian Những yếu tố nagravey ảnh hưởng đến giaacute thah của một hệ chuyecircn giaTrong phần nagravey cacircu hỏi thường được đặt ra lagrave tại sao cần phải xacircy dựng một hệ chuyecircn giaTrước khi bắt đầu phải xaacute định rotilde bagravei toaacuten đạt ra lagrave jiAi lagrave chuyecircn giaAi lagrave người sử dụng

1 Diễn giải (InterPretation) Nghiecircn cứu 1 vấn đề -gt Dựa trecircn những biểu hiện thuộc tiacutenh đặc trưng becircn ngoagravei -gt Tư vấn

(hoặc đưa ra kết luận hay mocirc tả dễ hiểu từ tập dữ liệu thocirc)

2 Bagravei toaacuten dự baacuteo (Prediction) Coacute thể dự đoaacuten được hagravenh vi kết quả dựa trecircn caacutec hiện tượng -gt dự baacuteo

VD Dự baacuteo thời tiết động đấthellip

3 Bagravei toaacuten chẩn đoaacuten (Diagnoss) Xaacutec định caacutec lỗi caacutec bộ phận hỏng hoacutec của hệ thống dựa trecircn caacutec dữ liệu quan saacutet được

4 Bagravei toaacuten gỡ rối (Debugging) Mocirc tả caacutec phương phaacutep khắc phục hệ thống khi gặp sự cố

5 Bagravei toaacuten thiết kế Lựa chọn cấu higravenh caacutec đối tượng nhằm thoả matilden một số ragraveng buộc nagraveo đoacute

6 Giảng dạy Phần mềm dạy học coacute thể chuẩn đoaacuten vagrave sủa lỗi của học sinh trong quaacute trigravenh học tập

Để xaacutec định đuacuteng bagravei toaacuten magrave chuacuteng ta cần giải quyết thigrave phải trả lời đc một số cacircu hỏi

- cần hệ chuyecircn gia

Bước 2 thu thập tri thức lựa chọn cocircng cụ vagrave aacutep dụng

Trong bước thu thập tri thức vấn đề quan trọng lagrave lựa chọn chuyecircn gia những người magrave sẽ đoacuteng goacutep tri thức cho hệ thống Thocircng thường trong suốt quaacute trigravenh phaacutet triển thigrave chuyecircn gia được xem như một thagravenh viecircn của đội phaacutet triển

Hiện nay coacute rất nhiều cocircng cụ để xacircy dựng một hệ chuyecircn gia Phổ biến nhất lagrave JESS CLIPS vagrave OPS5

Bước 3 Thiết kế cơ sở tri thức thiết kế hệ thốngTri thức được biểu diễn trường minh trong cơ sở tri thức

Caacutec chuyecircn gia vagrave kỹ sư tri thức sẽ đối thoại với nhau bằng caacutec kỹ thuật đối thoại Suy diễn (SD) bảng Mocirc higravenh hoacutea SD quy nạp phacircn loại

Vấn đề bagraveo trigrave vagrave phaacutet triển

Caacutec hệ chuyecircn gia đogravei hỏi phải bảo trigrave vagrave phaacutet triển nhiều hơn so với caacutec hệ thống khaacutec Phải thường xuyecircn bổ sung tri thức mới vagrave thay đổi caacutec tri thức cũ để đổi mới hệ chuyecircn gia

Thu thập vagrave khắc phục lỗi do người sử dụng phaacutet hiện để kịp thời khắc phục những sai soacutet của hệ chuyecircn gia

75 Lợi iacutech vagrave hạn chế của caacutec hệ chuyecircn gia

Một số lợi iacutech chiacutenh

Thời gian trả lời hợp lyacute bằng hoặc nhanh hơn so với chuyecircn gia (người) để đi đến cugraveng một quyết định Hệ chuyecircn gia lagrave một hệ thống thời gian thực (real time system)

Khả năng trả lời với mức độ tinh thocircng bằng hoặc cao hơn so với chuyecircn gia (người) trong cugraveng lĩnh vực

Hệ chuyecircn gia giuacutep cho hiệu quả lagravem việc tăng bằng việc sử dụng tập caacutec luật một caacutech nhanh choacuteng magrave ko bị nhầm lẫn chuyecircn gia lagrave người coacute thể quecircn đi một số tri thức cơ sở lyacute luậ nhưng HCG thigrave ko

Quyết định của một người chuyecircn gia coacute thể bị thay đổi vagrave ko coacute tiacutenh thống nhất như quyết định của một hệ chuyecircn gia tạo ra

Hệ chuyecircn gia giuacutep cho người sử dụng coacute thể trau dồi sự hiểu biết trecircn lĩnh vuej cụ thể magrave noacute giải quyết hỗ trợ người ra quyết định coacute trigravenh độ như 1 chuyecircn gia trong quaacute trigravenh gia quyết định

Kiến thức của rất nhiều chuyecircn gia về một lĩnh vực nagraveo đoacute được đưa vagraveo hệ chuyecircn gia lagravem cho CSTT cuat HCG phong phuacute vagrave rộng lớn hơn rất nhiều

HCG giải thiacutech caacutec bước suy luận một caacutech dễ hiểu nhất quaacuten luacutec nagraveo cũng coacute thể sử dụng ko như chuyecircn gia con người

Hạn chế của caacutec hệ chuyecircn gia

Nhược điểm lớn nhất của hệ chuyecircn gia lagrave những yacute kiến chuyecircn mocircn thường rất khoacute matilde hoacutea vagrave giải neacuten

Hệ chuyecircn gia khocircng coacute khả năng tự học tự cập nhật kiến thức mới như caacutec chuyecircn gia magrave cần phải được matilde hoacutea lại khi noacute được cập nhật

Hệ chuyecircn gia khocircng thể nhận ra được vấn đề khocircng nằm trong miền kiến thức của hệ thống

Chương 8 Tri thức vagrave tiếp nhận

1 Bao gồm caacutec vấn đề

Dữ liệu thực tế đo lường hoặc quan saacutet coacute hoặc khocircng coacute bối cảnh

Thocircng tin dữ liệu được tổng hợp một caacutech hữu iacutech để giải quyết những khoacute khăn trong việc đưa ra quyết định

Tri thức bao gồm caacutec ứng dụng quy tắc thocircng tin hướng dẫn của người ra quyết định

2 Những caacutei nhigraven về tri thức

Đại diện lagravem thế nagraveo để diễn tả tri thức viacute dụ như một quyển saacutech khocircng phải lagrave tri thức nhưng noacute lại lagrave một đại diện của tri thức

Sản xuất tri thức lagrave một tập hơp của hagraveng tồn kho coacute thể được sản xuất cũng như mua lại

Tri thức lagrave 1 trong 6 trạng thaacutei của hệ thống

1Dữ liệu 2Thocircng tin 3Cấu truacutec thocircng tin 4Sự thấu hiểu 5Yacute kiến 6 Quyết định

3 Caacutec loại tri thức Phổ biến mocirc tả dữ liệu thocircng tin thủ tục mọi thứ lagravem như thế nagraveo lập luận chiacutenh saacutech hoặc caacutec quy tắc

4 Thu thập Tri thức hệ chuyecircn gia Hầu hết caacutec phương phaacutep đều bắt đầu với mocirc higravenh của caacutec taacutec vụ trong đoacute

hệ chuyecircn gia được xacircy dựng Trong đoacute mocirc tả về caacutec lĩnh vực được tạo ra Caacutec kỹ sư sử dụng caacutec mocirc higravenh giả thuyết vagrave nhận thức về quaacute trigravenh phacircn

tiacutech để gợi ra caacutech giải quyết vấn đề về tri thức từ caacutec chuyecircn gia

5 Caacutec chiều của thu thập tri thức KE- driven caacutec kỹ sư trao đổi trực tiếp với caacutec chuyecircn gia Expert-driven Caacutec chuyecircn gia trực tiếp đưa chuyecircn mocircn của họ vagraveo hệ

thống maacutey tiacutenh Machine-driven Sử dụng caacutec cocircng cụ suy luận để triacutech xuất tri thức từ một

tập caacutec viacute dụ

6 Kỹ thuật thu thập tri thức Trao đổi gồm 2 loại cơ bản lagrave coacute cấu truacutec(coacute kịch bản) vagrave khocircng coacute cấu

truacutec( đối thoại trực tiếp) Giao thức phacircn tiacutech bằng lời Khi caacutec chuyecircn gia thực hiện một cocircng việc

của họ thigrave một bản ghi về cocircng việc đoacute được thực hiện Caacutec kỹ sư sẽ xacircy dựng mocirc higravenh cho những gigrave được ghi lại trong bản ghi

Phương phaacutep sagraveng lọc caacutec chuyecircn gia so saacutenh caacutec nhoacutem liecircn tiếp trong ba đối tượng vagrave cho biết tại sao nhoacutem thứ hai lại khaacutec nhoacutem thứ ba

7 Thu thập tri thức từ nhiều nguồn Thu thập tri thức từ nhiều nguồn lagrave cần thiết để coacute được đầy đủ caacutec tri thức

cho một vấn đề quan điểm yacute kiến traacutei ngược nhau thường phaacutet sinh Phương phaacutep đồng thuận sẽ giuacutep giải quyết được vấn đề macircu thuẫn Kỹ thuật phacircn tiacutech Meta lagrave kỹ thuật được aacutep dụng trong caacutec trường hợp

khaacutec Caacutech tiếp cận bằng định lượng đogravei hỏi caacutec kỹ sư cần cacircn nhắc yếu tố đầu vagraveo của caacutec chuyecircn gia khaacutec nhau

8 Xaacutec nhận hợp lệ vagrave kiểm tra tri thức Một khi thu thập tri thức noacute phải được đaacutenh giaacute về khả năng sử dụng vagrave độ

chiacutenh xaacutec Hai vấn đề cụ thể lagrave hiệu lực của những kiến thức vagrave kiểm tra việc xacircy dựng cơ sở của tri thức

Cần xaacutec nhận xem liệu hệ thống coacute thể hoạt động ở mức độ tối thiểu khocircng

Xaacutec minh liecircn quan đến việc so saacutenh từng chi tiết kỹ thuật của hệ thống những gigrave đatilde được thực hiện cuối cugraveng

9 Một số caacutec biện phaacutep xaacutec nhận Độ chiacutenh xaacutec Khả năng thiacutech nghi Mức độ đầy đủ Bề rộng Độ sacircu Hiệu lực Tổng quan Chiacutenh xaacutec Hiện thực Độ tin cậy Tiacutenh hữu dụng Mức độ

Chương 9 Học maacutey

1 Logic mờ vagrave ngocircn ngữ mờ(Fuzzy Logic and Linguistic Ambiguity)

Ngocircn ngữ tự nhiecircn gồm những khaacutei niệm mơ hồ vagrave khocircng chiacutenh xaacutectruyền tải ngữ nghĩa thocircng qua tiacutenh xấp xỉkhocircng rotilde ragraveng

Những xấp xỉ nagravey giuacutep con người coacute thể truyền tải hết được yacute nghĩa nhưng maacutey thigrave khocircng hiểu

Lagravem sao biểu diễn caacutec tri thức sử dụng caacutec khaacutei niệm khocircng rotilde ragraveng(mờ) hoặc khocircng chiacutenh xaacutec

2 Khaacutei niệm cơ bản của logic mờ tập mờ lagrave những tập hợp khocircng coacute một giới hạn rotilde Mỗi phần tử của noacute chỉ

chứa một mức độ hagravem liecircn thuộc của từng phần tử Vigrave vậy tập mờ khocircng giống như tập cổ điển Tập mờ coacute thể kết hợp với nhau qua những luật mờ magrave đặc trưng cho những hagravenh động trạng thaacutei vagrave thuộc tiacutenh của logic mờ được tận dụng khi thực hiện một bộ điều khiển mờ

Logic mờ dựa trecircn yacute tưởng mỗi phần tử thuộc vagraveo một tập hợp ở một mức độ nagraveo đấy

Locircgic mờ cho pheacutep độ liecircn thuộc (microA )coacute giaacute trị trong khoảng (01) Locircgic mờ coacute thể được coi lagrave mặt ứng dụng của lyacute thuyết tập mờ để xử lyacute caacutec

giaacute trị trong thế giới thực cho caacutec bagravei toaacuten phức tạp

3 So saacutenh tiacutenh đuacuteng đắn logic mờ vagrave xaacutec suất Xaacutec suất thigrave đề cập đến khả năng xảy ra một biến cố hay một điều gigrave đoacute Logic mờ đề cập đến cấp độ magrave đặc tiacutenh ở hiện tại

o viacute dụ1 người coacute chiều cao 6 feet thigrave coacute cấp độ lagrave 05 về chiều cao

4 Ưu điểm của logic mờ Caacutech tiếp cận rất tự nhiecircnkhocircng phức tạp Coacute thể mocirc higravenh hoacutea caacutec hagravem phi tuyến tugravey yacute phức tạp

Coacute thể tận dụng được kinh nghiệm từ những chuyecircn gia hagraveng đầu trong mọi lĩnh vực

Logic mờ được xacircy dựng dựa trecircn ngocircn ngữ tự nhiecircnNền tảng của logic mờ lagrave dựa trecircn cơ sở giao tiếp của con người

5 Nhược điểm của logic mờ Trong 1 hệ thống phức tạpsử dụng logic mờ coacute thể trở thagravenh trở ngại cho

việc xaacutec thực độ tin cậy của hệ thống Cơ chế lập luận mờ khocircng thể học hỏi từ những lỗi sai

6 Mạng noron nhacircn tạo(ANN) Mạng noron nhacircn tạo lagrave một mocirc phỏng xử lyacute thocircng tinđược nghiecircn cứu ra

từ hệ thống thần kinh của sinh vậtgiống như bộ natildeo để xử lyacute thocircng tin ANNs lagrave chương trigravenh dựa trecircn maacutey tiacutenh đơn giản coacute chức năng lagrave một mocirc

higravenh bagravei toaacuten khocircng gian dựa trecircn thử nghiệm vagrave baacuteo lỗi

7 Học từ kinh nghiệm Tiến trigravenh Một mẫu dữ liệu được biểu diễn như một mạng lưới noronANN ldquodự

đoaacutenrdquo 1 đầu radự đoaacuten được so saacutenh với giaacute trị thực tế hoặc giaacute trị chiacutenh xaacutecNếu đoaacuten được chiacutenh xaacutec thigrave khocircng coacute hagravenh động nagraveo được thực hiện

Nếu dự đoaacuten sai ANN kiểm tra lại vagrave xaacutec định lại thocircng số để điều chỉnh Một mẫu dữ liệu khaacutec được biểu diễn vagrave quaacute trigravenh nagravey được lặp lại

8 Nguyecircn tắc cơ bản của cocircng nghệ nơron Caacutec yếu tố xử lyacute cơ bản trong hệ thống thần kinh của con người lagrave tế bagraveo

thần kinhMạng lưới của tế bagraveo nagravey lagrave liecircn kết với nhau nhận được thocircng tin từ caacutec cảm biến trong mắt taihellip

Thocircng tin nhận được bởi tế bagraveo thần kinh hoặc lagrave sẽ kiacutech thiacutech noacute(sẽ được chuyển qua 1 thocircng điệp dọc theo mạng lưới) hoặc lagrave sẽ ngăn cản noacute(ngăn cản dograveng thocircng tin)

Độ nhạy coacute thể thay đổi qua thời gian hoặc sau khi coacute được kinh nghiệm

9 Cấu truacutec mạng Một ANN gồm 3 lớp cơ bản

Lớp đầu vagraveo nhận dữ liệu Lớp becircn trong hoặc lagrave lớp ẩn xử lyacute dữ liệu Lớp đầu ra chuyển tiếp kết quả cuối cugraveng của mạng

10Mạng nơ ron Thường coacute nhiều đầu vagraveo mỗi đầu vagraveo với mức ảnh hưởng vagrave tầm quan

trọng riecircng của noacute Một đầu vagraveo quan trọng coacute thể được sử dụng để khuếch đại đầu ra caacutec hagravem trạng thaacutei tổng hợp caacutec trọng số của caacutec yếu tố

đầuvagraveo khaacutec nhauvagraveo một giaacute trị duy nhất Caacutec hagravem chuyển giao xử lyacute caacutec giaacute trị trạng thaacutei vagrave tạo đầu ra

11Huấn luyện mạng nơ ron Trong mocirc higravenh coacute giaacutem saacutetANN được đến so saacutenh dự đoaacuten của chiacutenh

noacute với thocircng tin phản hồi coacute chứa caacutec kết quả mong muốn ANN sẽ phải tigravem caacutech thay đổi caacutec tham số becircn trong củamigravenh (caacutec trọng số vagrave caacutec ngưỡng) để tạo necircn một aacutenh xạ coacute khả năng aacutenh xạcaacutec đầu vagraveo thagravenh caacutec đầu ra mong muốn Sự thay đổi nagravey được tiến hagravenh nhờ việc so saacutenh giữa đầu ra thực sự vagrave đầu ra mong muốn

Trong mocirc higravenh khocircng coacute giaacutem saacutetANN nhận được dữ liệu vagraveo nhưng khocircng phải coacute bất kỳ thocircng tin phản hồi về kết quả mong muốn

Phần lớn caacutec ứng dụng nằm trong vugraveng của caacutec bagravei toaacuten ước lượng như mocirc higravenh hoacuteathống kecirc neacuten lọc phacircn cụm

12Lợi iacutech Liecircn kết với mạng noron Traacutenh caacutech lập trigravenh tường minh Giảm nhu cầu của chuyecircn gia ANNs thigrave thiacutech nghi với caacutec yếu tố đầu vagraveo thay đổi Khocircng cần thiết cho cơ sở tri thức tinh chế ANNs coacute tiacutenh động vagrave cải thiện với việc sử dụng Coacute khả năng xử lyacute dữ liệu khocircng chiacutenh xaacutec hoặc khocircng đầy đủ Cho pheacutep tổng quaacutet hoacutea từ thocircng tin cụ thể Cho pheacutep thu thập cảm giaacutec thocircng thường vagraveo miền giải quyết vấn đề

13Hạn chế của việc liecircn kết với mạng noron ANNs khocircng thể giải thiacutech được suy luận Bản chất hộp đen thường khiến cho vấn đề traacutech nhiệm vagrave độ tin cậy phaacutet

sinh lagrave khoacute khăn Lặp đi lặp lại quaacute trigravenh huấn luyện rất tốn thời gian Nguồn lực caacutec nhagrave phacircn tiacutech vagrave thiết kế coacute tay nghề cao vẫn lagrave đaacuteng lo

ngại Cocircng nghệ ANN thuacutec đẩy hạn chế của phần cứng hiện tại ANN yecircu cầu phải coacute sự tin tưởng ở đầu ra

14Giới thiệu về thuật toaacuten di truyền Cũng như mạng lưới thần kinh caacutec thuật toaacuten di truyền được dựa trecircn lyacute

thuyết sinh học Thuật toaacuten di truyền tigravem thấy nguồn gốc của chuacuteng trong caacutec lyacute thuyết

tiến hoacutea của chọn lọc tự nhiecircn vagrave thiacutech ứng với biến đổi khiacute hậu Kết quả thuật toaacuten di truyền lagrave từ giao phối 2 caacute thể trong quần thế để tạo

ra con caacutei đocirci khi tốt hơn so với bậc cha mẹ của chuacuteng 15Caacutec thagravenh phần cơ bản của thuật toaacuten di truyền

Toaacuten tử chọn lọc Caacutec caacute thể tốt được chọn lọc để đưa vagraveo thế hệ sau Sự chọn lọc nagravey căn cứ vagraveo độ thiacutech nghi với mocirci trường của mỗi caacute thể

Toaacuten tử lai gheacutep (crossover) Hai caacute thể cha vagrave mẹ trao đổi caacutec gen với nhau để tạo ra caacute thể con

Toaacuten tử đột biến (mutation) Một caacute thể thay đổi một số gen để biến đổi thagravenh một caacute thể mớiTất cả caacutec toaacuten tử trecircn khi thực hiện đều mang tiacutenh ngẫu nhiecircn

16Quaacute trigravenh cơ bản của một thuật toaacuten di truyền Khởi tạo

Đaacutenh giaacute quần thể

Lựa chọn NST thiacutech hợp nhất vagrave loại bỏ NST yếu nhất

Quy trigravenh giao nhau vagrave cải thiện quần thể

đột biến tiến trigravenh để khaacutem phaacute ra NST mới

17Ưu nhược điểm của việc kết hợp với thuật toaacuten di truyền Kiacutech thước quần thể lagrave 1 yếu tố quan trọng trong tốc độ của việc tigravem

kiếmnhưng noacute tương đối dễ dagraveng để dự đoaacuten tốc độ nagravey Giao nhau hoặc đột biến lagrave khocircng necircn đc sử dụng quaacute thường xuyecircn Luocircn coacute được iacutet nhất 1 giải phaacutep hợp lyacute Necircn coacute thể aacutep dụng chuacuteng cho caacutec vấn đề magrave chuacuteng ta khocircng coacute hướng

về caacutech giải quyết Sức mạnh của thuật toaacuten xuất phaacutet từ khaacutei niệm đơn giảnkhocircng phải từ

một thủ tục thuật toaacuten phức tạp 18Tương lai của học maacutey

Mạng lưới thần kinh nhacircn tạo vượt quaacute năng lực của con người trong caacutec trường hợp bị cocirc lập

Về mặt lyacute thuyếtmột maacutey tiacutenh coacute thể xử lyacute dũ liệu nhanh hơn hagraveng triệu lần so với 1 con người

May mắn thay cho chuacuteng tacon người tốt hơn nhiều khi magrave coacute được dữ liệumaacutey tiacutenh khocircng coacute 1 số thứ như lagrave 5 giaacutec quan

CHƯƠNG 10 KHO DỮ LIỆU

1 Kho dữ liệu Kho dữ liệu lagrave tuyển tập caacutec cơ sở dữ liệu tiacutech hợp hướng chủ đề được

thiết kế để trợ giuacutep cho một hệ hỗ trợ quyết định

Theo John Ladley Cocircng nghệ kho dữ liệu lagrave tập caacutec phương phaacutep kỹ thuật vagrave caacutec cocircng cụ coacute thể kết hợp hỗ trợ nhau để cung cấp thocircng tin cho người sử dụng trecircn cơ sở tiacutech hợp từ nhiều nguồn dữ liệu nhiều mocirci trường khaacutec nhau

Kho dữ liệu thường rất lớn tới hagraveng trăm GB hay thậm chiacute hagraveng Terabyte

2 Kho dữ liệu vận hagravenh (ODS) Một kho dữ liệu vận hagravenh Aacutep dụng kỹ thuật kho dữ liệu vagraveo caacutec hệ xử

lyacute giao taacutec lưu trữ dữ liệu cho một ứng dụng đặc thugrave Noacute đưa vagraveo kho dữ liệu một dograveng caacutec dữ liệu thocirc được thiết kế

3 So saacutenh

Kho dữ liệu vận hagravenh Kho dữ liệu

Dữ liệu theo chủ đề Dữ liệu theo chủ đề

Dữ liệu tiacutech hợp Dữ liệu tiacutech hợp

Dữ liệu thay đổi Dữ liệu khocircng thay đổi

Dữ liệu được cập nhật khi thay đổi

Dữ liệu giữ nguyecircn

Chỉ coacute dữ liệu hiện tạiDữliệu hiện tại vagrave dữ liệu lịch sử

Chu kỳ lagravem tươi dữ liệu ngắn Chu kỳ lagravem tươi dữ liệu dagravei

Chỉ coacute dữ liệu chi tiết Dữ liệu chi tiết vagrave dữ liệu tổng kết

Dugraveng cho caacutec quyết định ngắn hạn

Dugraveng cho hoạch định dagravei hạn

4 Kho dữ liệu cục bộ (Data Mart - DM)

Kho dữ liệu cục bộ lagrave CSDL coacute những đặc điểm giống với kho dữ liệu nhưng với quy mocirc nhỏ hơn vagrave lưu trữ dữ liệu về một lĩnh vực một chuyecircn ngagravenh

Data mart phụ thuộc Chứa những dữ liệu được lấy từ DW vagrave những dữ liệu nagravey sẽ được triacutech lọc vagrave tinh chế tiacutech hợp lại ở mức cao hơn để phục vụ một chủ đề nhất định của Datamart

Data mart độc lập Khocircng giống như Datamart phụ thuộc Data mart độc lập được xacircy dựng trước DW vagrave dữ liệu được trực tiếp lấy từ caacutec nguồn khaacutec nhau

5 Siecircu dữ liệu Metadata lagrave dữ liệu để mocirc tả dữ liệu Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột

một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi Metadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu

6 Mocirci trường kho dữ liệu Hệ thống của tổ chức vagrave kho cung cấp dữ liệu để xacircy dựng kho dữ liệu Trong quaacute trigravenh chuyển dữ liệu từ caacutec nguồn khaacutec nhau dữ liệu coacute thể

được lagravem sạch hoặc chuyển đổi vagrave vigrave thế DW được xem như lagrave một chuẩn cho việc lưu trữ

Đồng thời siecircu dữ liệu được ghi lại Cuối cugraveng DW hoặc siecircu thị coacute thể được sử dụng để tạo ra một kho dữ

liệu ldquocaacute nhacircnrdquo 7 Caacutec đặc điểm của kho dữ liệu

Đặc điểm Mocirc tả

Hướng chủ đề - DL tổ chức theo caacutech thức người dugraveng tham chiếu

Tiacutech hợp - Dữ liệu ldquosạchrdquo loại bỏ tiacutenh thiếu nhất quaacuten

Khocircng thay đổi - DL ldquochỉ đọcrdquo người dugraveng khocircng thay đổi được

Chuỗi thời gian - DL lagrave chuỗi thời gian khocircng phải lagrave trạng thaacutei hiện tại

Được tổng kết - DL vận hagravenhthao taacutec khi cần thiết

được kết hợp lại thagravenh dạng coacute thể dugraveng được cho quyết định

Kiacutech cỡ lớn hơn - Lưu giữ theo chuỗi thời gian tức lagrave giữ lại nhiều DL

Khocircng được chuẩn hoacutea - Coacute thể dư thừa DLSiecircu dữ liệu - Dữ liệu của dữ liệu được lưu trữNguồn dữ liệu - DL vận hagravenh (caacutec hệ sẵn coacute) cugraveng

với caacutec nguồn ngoagravei 8 Kho dữ liệu hướng chủ đề

Hướng chủ để coacute nghĩa lagrave kho dữ liệu được tổ chức xung quanh caacutec chủ đề chiacutenh như khaacutech hagraveng sản phẩm sản xuất Tập trung vagraveo việc mocirc higravenh hoacutea vagrave phacircn tiacutech dữ liệu cho caacutec nhagrave ra quyết định magrave khocircng tập trung vagraveo caacutec xử lyacute thocircng thường Cung cấp cho người dugraveng một khung nhigraven toagraven vẹn đơn giản vagrave đầy đủ về caacutec sự kiện quanh caacutec chủ đề

9 Dữ liệu trong DW được tiacutech hợp Dữ liệu trong kho dữ liệu được xacircy dựng bằng caacutech tổng hợp dữ liệu từ

nhiều nguồn khaacutec nhau vagrave caacutec nguồn coacute tổ chức khaacutec nhau Cơ sở dữ liệu caacutec file excel caacutec flat file hoặc caacutec raw file Khi đưa vagraveo kho dữ liệu caacutec dữ liệu được lagravem sạch vagrave tiacutech hợp dữ liệu nhằm đảm bảo tiacutenh nhất quaacuten của dữ liệu

10Kiến truacutec kho dữ liệu Tầng cơ sở dữ liệu hoạt động Tầng truy xuất thocircng tin Tầng truy xuất dữ liệu Tầng siecircu dữ liệu Tầng quản lyacute tiến trigravenh Tầng thocircng điệp của ứng dụng Tầng vật liacute của kho dữ liệu Tầng trigravenh diễn dữ liệu

11Higravenh trạng kho dữ liệu Kho dữ liệu ảo - người dugraveng cuối coacute thể truy cập trực tiếp đến kho dữ liệu

sử dụng caacutec cocircng cụ cho pheacutep ở tầng truy xuất dữ liệu Kho dữ liệu trung tacircm-1 cơ sở dữ liệu vật lyacute chứa tất cả dữ liệu cho một

vugraveng chuyecircn dụng nagraveo đoacute

Kho dữ liệu phacircn taacuten- Thagravenh phần được phacircn taacuten qua nhiều hệ cơ sở dữ liệu vật lyacute

12METADATA- Siecircu dữ liệu Định nghĩa Siecircu dữ liệu lagrave dữ liệu về dữ liệu Lagrave 1 lưu trữ dugraveng để

Miecircu tả kho dữ liệu tổng thể Nhận dạng kiểu kho dữ liệu Quản liacute quaacute trigravenh tiacutech hợp dữ liệu Quản liacute quaacute trigravenh cập nhật kho dữ liệu Quản liacute bảo mật

Lagrave chigravea khoacutea quyết định sự thagravenh cocircng của kho dữ liệu luocircn được thay đổi vagrave cập nhật theo sự phaacutet triển của kho dữ liệu

Dugraveng để quản liacute điều khiển kho dữ liệu Sự ra đời của kho dữ liệu như 1 cấu truacutec hỗ trợ ra quyết định siecircu dữ liệu

được xem như nguồn tagravei nguyecircn dữ liệu Siecircu dữ liệu lagrave trừu tượng Chuacuteng lagrave dữ liệu bậc cao cung cấp mocirc tả ngắn

gọn caacutec dữ liệu bậc thấp hơn 13Hoạt động của Siecircu dữ liệu

Siecircu dữ liệu rất cần thiết trong việc chuyển hoacutea thocircng tin trở thagravenh tri thức Lagrave chigravea khoacutea giuacutep chuacuteng ta xử lyacute được dữ liệu thocirc Viacute dụ một dograveng dữ liệu baacuten hagraveng 1023 K596 11121 agraveNoacute sẽ khocircng coacute nghĩa gigrave cho đến khi chuacuteng ta đưa vagraveo siecircu dữ liệu (thư

mục chứa dữ liệu) agrave cửa hagraveng 1023 sản phẩm K596 vagrave số tiền baacuten được lagrave 11121 đocirc la

14Sự cần thiết phải nhất quaacuten trong kho dữ liệu Kho dữ liệu được xacircy dựng cho lợi iacutech của những nhagrave phacircn tiacutech kinh

doanh caacutec nhagrave quản trị cho tất cả caacutec khu vực chức năng Trong cơ sở dữ liệu riecircng caacutec khu vực khaacutec nhau coacute thể định nghĩa vagrave lưu

trữ dữ liệu thocircng qua phiecircn bản của chiacutenh noacute Khi dữ liệu được lấy từ những vugraveng khaacutec nhau đoacute vagrave được đặt vagraveo kho dữ

liệu Việc chuyển đổi vagrave lagravem sạch caacutec tiến trigravenh sẽ đảm bảo noacute lagrave duy nhất được tiacutech hợp tại một mức của tổ chức

15Ragrave soaacutet lại dữ liệu ndash Thực thi siecircu dữ liệu

Bất kể cấu truacutec tự nhiecircn của 1 cacircu truy vấn thế nagraveo thigrave caacutec thagravenh phần của siecircu dữ liệu rất quan trọng đối với người ra quyết định

Bảng thuộc tiacutenh khoacutea được lưu trữ bởi kho dữ liệu Tập hợp dữ liệu được lấy từ đacircu Những chuyển đổi nagraveo được thực thi với việc lagravem sạch

16Siecircu dữ liệu lagrave gigrave Metadata - lagrave thocircng tin mocirc tả nội dung của cơ sở dữ liệu (CSDL) Metadata baacuteo cho người dugraveng biết thời gian cập nhật sau cugraveng của dữ liệu

định dạng vagrave mục điacutech sử dụng của noacute Những thocircng tin nagravey coacute thể hướng dẫn người dugraveng duyệt qua CSDL vagrave

giuacutep họ hiểu được yacute nghĩa vagrave ngữ cảnh của dữ liệu Trong CSDL metadata lagrave caacutec dạng biểu diễn khaacutec nhau của caacutec đối tượng

trong CSDL Trong CSDL quan hệ metadata lagrave caacutec định nghĩa của bảng cột CSDL

view vagrave nhiều đối tượng khaacutec Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột

một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi -gtMetadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu

Bảng chuyển đổi Ghi lại những chuyển đổi đatilde được thực hiện

Lịch sử thực thi Ghi lại những dữ liệu đatilde được

phacircn tiacutech

Higravenh thaacutei kết nốiGhi lại những dữ liệu được kết nối vagrave tần suất

17Aacutenh xạ thocircng thường của siecircu dữ liệu Bản ghi aacutenh xạ chuyển đổi bao gồm

Định danh của nguồn gốc Chuyển đổi thuộc tiacutenh Chuyển đổi thuộc tiacutenh vật lyacute Matilde hoacutea tham chiếu bảng chuyển đổi Đổi tecircn Đổi khoacutea Gaacuten giaacute trị cho thuộc tiacutenh mặc định Chọn logic cho caacutec nguồn nhiều giaacute trị Đổi thuật toaacuten

18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để

phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai

lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave

tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec

Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm

Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo

19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua

caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau

SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được

Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra

một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức

Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ

Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ

Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech

CHƯƠNG 11 KHAI PHAacute DỮ LIỆU

1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn

ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993

Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng

2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd

1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều

2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP

3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn

4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng

5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server

6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo

7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động

8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời

9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều

10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện

11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech

12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP

3 Xử lyacute phacircn tiacutech trực tuyến OLAP

MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave

dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu

ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave

thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu

HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave

ROLAP4 Khai phaacute dữ liệu

Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh

khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn

Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan

5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp

6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại

Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp

Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec

Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt

Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra

Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh

vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho

Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec

Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm

Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục

Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng

gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp

Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn

Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec

Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper

Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2

Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25

Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước

Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng

Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện

trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp

Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute

độ hỗ trợ ge ngưỡng minsup

độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan

Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn

Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết

Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu

MOLAP ROLAP HOLAP

Lưu trữ dữ liệu cơ sở

Khối Bảng quan hệ Bảng quan hệ

Lưu trữ thocircng tin tổng hợp

Khối Bảng quan hệ Khối

Hiệu suất thực hiện truy vấn

Nhanh nhất Chậm nhất Nhanh

Tiecircu thụ khocircng gian lưu trữ

Nhiều Thấp Trung bigravenh

Chi phiacute bảo trigrave Cao Thấp Trung bigravenh

Page 31: De cuong(1-11)

liệu chi tiết)Cơ sở mocirc higravenh Caacutec chức năng coacute sẵn bị hạn

chếLagrave điểm cốt lotildei của DSS

Cấu truacutec Theo người baacuten sản phẩm hoặc theo caacutec chuyecircn gia hệ thống thocircng tin

Theo người sử dụng hoặc caacute nhacircn hoặc caacutec chuyecircn gia từ caacutec trung tacircm thocircng tin hoặc phograveng ban hệ thống thocircng tin

Phần cứng Mainframe caacutec trạm RISC mạng LANs hoặc caacutec hệ thống phacircn bố

Mainframe caacutec trạm RISC caacutec maacutey PC hoặc caacutec hệ thống phacircn bố

Bản chất caacutec goacutei phần mềm

Truy xuất tương taacutec dễ dagraveng đến nhiều cơ sở dữ liệu truy xuất trực tuyến caacutec khả năng DBMS phức tạp caacutec liecircn kết phức tạp

Caacutec khả năng tiacutenh toaacuten lớn caacutec ngocircn ngữ mocirc higravenh mocirc phỏng ứng dụng vagrave caacutec bộ tạo DSS

Bản chất caacutec thocircng tin

Trigravenh bagravey thocircng tin được phaacutet sinh trước về quaacute khứ vagrave hiện tại tạo caacutec thocircng tin mới về quaacute khứ hiện tại tương lai

Tạo thocircng tin mới về quaacute khứ hiện tại tương lai

62 Lịch sử EIS- EIS xuất hiện lần đầu tiecircn tại MIT vagraveo những năm 1970

- Những EIS đầu tiecircn được phaacutet triển bởi caacutec doanh ngiệp lớn sẵn sagraveng chấp nhận rủi ro để đạt được lợi thế cạnh tranh

- Vagraveo những năm 1980 caacutec nhagrave cung cấp đatilde phaacutet triển một số cơ sở khaacutech hagraveng rộng vagrave cocircng nghệ EIS được tiếp tục phaacutet triển cho đến ngagravey nay

(Tagravei liệu thecircm Sử dụng DSSEIS cho phaacutet triển bền vững + Một số nghiecircn cứu đatilde được tiến hagravenh để kiểm tra việc thực hiện của EIS trong khu vực cocircng cộng vagrave chiacutenh phủ caacutec nước tổ chức kể từ khi chuacuteng được phaacutet triển theo định hướng lợi nhuận cho caacutec cocircng ty tư nhacircn (Hasan vagrave Hasan năm 1997) Theo một nghiecircn cứu tiến hagravenh tại Mỹ ở hơn 300 cocircng ty kết quả cho thấy sự khaacutec biệt của EIS giữa tư nhacircn vagrave chiacutenh phủ một số kết quả thuacute vị được phaacutet hiệnViacute dụ khoacute khăn hơn để chuyển tiền từ một tagravei khoản khaacutec trong một EIS của chiacutenh phủ cũng lagrave khoacute khăn hơn để biện giải thiacutech cho những chi phiacute phaacutet triển EIS của chiacutenh phủ Một nghiecircn cứu khaacutec được tiến hagravenh ở Australia

cho thấy rằng EIS cung cấp cho quản lyacute một higravenh ảnh chiacutenh xaacutec hơn về tổ chức thực hiện vagrave cung cấp hỗ trợ cho caacutec lợi iacutech chiến lược cải thiện khocircng chỉ cho caacutec nhagrave quản lyacute nhưng cograven cho phần cograven lại của tổ chức Dựa trecircn caacutec hệ thống được thiết kế cho caacutec cocircng ty tư nhacircn với một caacutech rotilde ragravengxaacutec định mục tiecircu EIS lagrave thiacutech hợp cho caacutec tổ chức cocircng cộng hiện đại nhưng cần phải được linh hoạt hơn vagrave kết thagravenh chugravem một phạm vi rộng hơn khả năng vagrave phương tiện hơn so với khu vực tư nhacircn ban đầu theo định hướng sản phẩm (Hasan vagrave Hasan năm 1997) Điều nagravey coacute thể lagrave do thực tế rằng caacutec hoạt động khu vực cocircng lagrave bắt buộc coacute taacutec động rộng phải đaacutep ứng sự mong đợi duy nhất cocircng cộng thường coacute mục tiecircu mơ hồ vagrave macircu thuẫn iacutet quyền tự chủ vagrave kiểm soaacutet việc ra quyết định vagrave nhacircn viecircn lagrave khoacute khăn hơn (Watson vagrave Carte2000) + Toacutem lại EIS lagrave một khaacutei niệm thagravenh cocircng noacute phaacutet triển qua nhiều năm tuy nhiecircn EIS khắc phục khiếm khuyết của migravenh bằng caacutech tiến hagravenh nghiecircn cứu liecircn tục)

63 Tại sao những người điều hagravenh hagraveng đầu lại khaacutec nhau- Họ lagrave những doanh nghiệp theo định hướng coacute suy nghĩ

- Coacute một khoảng khocircng gian rộng để kiểm soaacutet

- Họ chịu traacutech nhiệm cho việc thiết lập chiacutenh saacutech

- Họ đại diện cho tổ chức mocirci trường becircn ngoagravei

- Hagravenh động của họ tạo ra những kết quả đaacuteng kể về tagravei chiacutenh vagrave con người

Tần số caacutec hoạt động điều hagravenh- Xử lyacute xaacuteo trộn 42

- Hoạt động kinh doanh 32

- Phacircn bổ nguồn lực 17

- Đagravem phaacuten 3

- Những điều khaacutec 6

Handling Disturbances 42

Entrepreneurial Activites 32

Resource Allocation 17

Negotiation 3

Other 6

Những thocircng tin điều hagravenh cần thiết- Quản lyacute xaacuteo trộn coacute thể yecircu cầu sự chuacute yacute xung quanh đồng hồ

- Hoạt động kinh doanh yecircu cầu điều hagravenh để dự đoaacuten những thay đổi trong mocirci trường

- Nhiệm vụ phacircn bổ tagravei nguyecircn yecircu cầu lựa chọn người quản lyacute vagrave caacutec nguồn lực hạn chế được triển khai

- Đagravem phaacuten yecircu cầu cập nhật thocircng tin từng phuacutet để coacute thể xacircy dựng được sự đồng thuận

Caacutec loại thocircng tin điều hagravenh- Hệ thống kế toaacuten coacute liecircn quan đến việc tiacutenh toaacuten thu nhập hoạt động cho caacutec lĩnh

vực cụ thể lagrave quan trọng hơn so với caacutec hệ thống kế toaacuten truyền thocircng- Thocircng tin về thị trường khaacutech hagraveng cung cấp giaacute trị trong việc quyết định chiến

lược- Caacutec thocircng tin cần thiết thường được truyền đi trecircn một số hệ thống maacutey tiacutenh vagrave

nằm trong toagraven tổ chức- Caacutec thocircng tin được sử dụng thường lagrave ngắn hạn vagrave dễ thay đổi

Phương thức để xaacutec định thocircng tin cần thiết

Rockart xaacutec định được năm phương thức cơ bản để xaacutec định thocircng tin cần thiết

- Phương thức dựa trecircn kết quả- Phương thức rỗng- Phương thức chỉ số khoacutea- Phương thức tổng hợp nghiecircn cứu- Phương thức dựa vagraveo nhacircn tố then chốt dẫn đến thagravenh cocircng

64 Thagravenh phần EIS

- Sản phẩm EIS đầu tiecircn được phaacutet triển để sử dụng trecircn maacutey tiacutenh cấu higravenh cao nhưng caacutec sản phẩm hiện nay nhằm mục tiecircu lagrave nền tảng ClientServer

- Những nền tảng linh hoạt hơn coacute thể thiacutech ứng với thay đổi trong tổ chức vagrave cocircng nghệ

- Sử dụng dữ liệu thời gian thực dẫn đến quyết định nhanh hơn nhiều thocircng tin hơn

Thagravenh phần phần cứng- Một EIS khocircng đogravei hỏi coacute phần cứng cụ thể hoặc duy nhất nagraveo- Chigravea khoacutea của vấn đề lagrave để đảm bảo rằng caacutec thagravenh phần của EIS tối ưu hoacutea vagrave

phugrave hợp với tagravei nguyecircn maacutey tiacutenh của tổ chức- Hệ thống nagravey phải được cấu higravenh để caacutec nguồn tagravei nguyecircn phugrave hợp với những

người điều hagravenh chuacuteng

Thagravenh phần phần mềm- Traacutei ngược với phần cứng phần mềm thường được chuyecircn mocircn hoacutea cao cho caacutec

bagravei toaacuten về miền- Sự chuyecircn mocircn hoacutea nagravey thường đạt được bằng caacutech sử dụng thagravenh phần off-the-

shelf cho toagraven bộ EIS vagrave caacutec mocirc-đun tugravey chỉnh để đaacutep ứng nhu cầu cụ thể- Lotus Notes lagrave một viacute dụ điển higravenh Noacute coacute thể được sử dụng một migravenh hoặc coacute

thể phục vụ becircn thứ ba mocirc-đun plug-in

Cocircng nghệ EIS hiện nay

Dobrzeniecki đề xuấtphacircn loạitừng cấptheo bachức năng- Loại 1 sản phẩm bao gồmmột bộ đầy đủcaacutec ứng dụngtừ mộtnhagrave cung cấp- Loại 2 sản phẩm đượcthựchiệnở phần đầu củacaacutecsản phẩmDSS đượcphaacutet triển

bởicugravengmộtnhagrave cung cấp- Loại 3 sản phẩmkết hợp với nhautheo bất kỳ số lượngthuộc sở hữu củacocircng ty

65 Xacircy dựng EIS

- Xacircy dựngmộtEISgiống nhưxacircydựngmột số hệ thống khaacutec củamocirc higravenh hệ thống thocircng tin

- Việcphaacutet triểncấu truacutecnecircn được theo dotildeitừ quaacute trigravenh thiết kế đến quaacute trigravenhthực hiện

- Tuy nhiecircn một dự aacuten phaacutet triển EIScoacute xu hướnglagrave thống nhấtvagraveyecircu cầu hỗ trợ caacutec nhagrave quản lyacute latildenh đạo

- Xacircy dựng một EIScoacute thểphaacutet hiện ra đượccaacutectigravenh huống khoacute khănmagravemột nhagrave phaacutet triển chưabao giờ gặp phải

Mocirc higravenh EIS

Khung phaacutet triển một EIS

- Watson et al đề nghị xacircy dựngkhung với ba thagravenh phần+ Caacutech tiếp cận tập trung vagraveo yếu tốcon người vagrave dữ liệu coacute liecircn quan đến EIS+ Quaacute trigravenh phaacutet triển cần sự linh hoạt vagrave tương taacutec+ Người sử dụng - hệ thống hộp thoại bao gồm một ngocircn ngữ hagravenh động để xử lyacute caacutec lệnh

Lợi iacutech của EIS- Dễ duy trigrave caacutec mục tiecircu coacute tổ chức- Dễ truy xuất thocircng tin- Cho pheacutep người sử dụng nacircng cao hiệu suất hơn

- Tăng chất lượng ra quyết định- Cung cấp sự cải tiến cạnh tranh- Tiết kiệm thời gian của người sử dụng- Tăng khả năng vagrave chất lượng giao tiếp- Cung cấp khả năng điều khiển tốt hơn trong tổ chức- Cho pheacutep tham gia caacutec vấn đề vagrave caacutec cơ hội- Cho pheacutep hoạch định- Cho pheacutep tigravem kiếm nguyecircn nhacircn của một vấn đề- Thảo matilden caacutec yecircu cầu của người điều hagravenh

Hạn chế của EIS vagrave 1 số sai lầm cần traacutenh

- Chi phiacute một cuộc khảo saacutetnăm1991 chothấychi phiacute phaacutet triểntrungbigravenh365000USDvớichi phiacute vận hagravenhhagraveng năm lagrave$200000 (EIS)

- Cocircng nghệ hạn chếEIScần phảiđượctiacutech hợp hoagraven toagravenvagraveokiếntruacuteccủadoanh nghiệphiện tại do đoacute noacutelagrave một thaacutech thứclớn đối vớithiết kế

- Hạn chế tổ chức cơ cấu tổ chứccoacute thể khocircng phugrave hợp

Sự hạn chế về tổ chức- Chương trigravenh nghị sự vagrave thời gian chệch EIS mocirc tả một phần việc thực hiện một

chương trigravenh nghị sự vagrave coacute thể dễ dagraveng đạt được sự tin cậy một caacutech chắc chắn- Đồng bộ hoacutea việc quản lyacute sự tin cậy đuacuteng luacutec đặc biệt baacuteo caacuteo EIS coacute thể phaacute

vỡ sự ổn định thiết lập caacutec chu trigravenh baacuteo caacuteo một caacutech tốt nhất- Sự bất ổn EIS phản ứng nhanh coacute thể gacircy ra việc taacutec động trở lại một caacutech

nhanh choacuteng dẫn đến sự thiếu ổn định trong tổ chức

Sự thất bại lagrave thay thế khocircng thể chấp nhận được- Một số yếu tố lagravem EIS thất bại

+ Thiếu sự hỗ trợ về mặt quản lyacute+ Vấn đề chiacutenh trị+ Thất bại của nhagrave phaacutet triển+ Lỗi về cocircng nghệ+ Giaacute cả+ Thời gian

66 Ra quyết định điều hagravenh trong tương lai vagrave EIS

- Coacute một vagravei điều kiện sẽ được hợp nhất cho việc chuyển đổi cocircng nghệ Trong đoacute một vagravei điều kiện coacute thể dễ dự đoaacuten Hai điều kiện magrave ta coacute thể thấy lagrave+ Phaacutet triển cocircng nghệ maacutey tiacutenh trong việc điều hagravenh sẽ tạo ra sự chuyển đổi được chấp nhận một caacutech dễ dagraveng hơn+ Mở rộng traacutech nhiệm điều hagravenh sẽ mở rộng nhu cầu thocircng tin

Tương lai của EIS- EIS thocircng minh Những tiến bộ trong cocircng nghệ AI sẽ được triển khai trong caacutec

EIS- EIS đa phương tiện Cơ sở dữ liệu đa phương tiện sẽ cho pheacutep tiacutech hợp văn bản

giọng noacutei vagrave higravenh ảnh trong tương lai- EIS thocircng tin Tương lai EIS sẽ mở rộng hơn trong việc sử dụng dữ liệu becircn

ngoagravei doanh nghiệp- EIS kết nối Giao tiếp với băng thocircng rộng cho pheacutep kết nối liecircn thocircng lớn hơn

Chương 7 HỆ CHUYEcircN GIA VAgrave TRIacute TUỆ NHAcircN TẠO

71 Caacutec khaacutei niệm

72 Triacute thocircng minh của triacute tuệ nhacircn tạo

73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia

74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia

75 Lợi iacutech vagrave hạn chế của hệ chuyecircn gia

71 Caacutec khaacutei niệm

Chuyecircn mocircn (Expertise) sự hiểu biết rộng trong 1 lĩnh vực hẹp

Hệ chuyecircn gia (Expert Systems)1 chương trigravenh maacutey tiacutenh sử dụng 1 tập caacutec luật dựa trecircn tri thức của con người để giải quyết caacutec vấn đề đogravei hogravei phải coacute sự chuyecircn mocircn

Một số hệ chuyecircn gia nổi tiếng

DENDRAL (Standford 1960s Edward Feigenbaum)

MYCIN (Standford1970s Edward Shortliffe)

PROSPECTOR (MIT 1979)

Triacute tuệ nhacircn tạo (Artificial Intelligence ndash AI)

Triacute tuệ nhacircn tạo một bộ phacircn của ngagravenh khoa học maacutey tiacutenh quan tacircm đến việc thiết kế caacutec hệ thống maacutey tiacutenh thocircng minh đoacute lagrave caacutec hệ thống đưa ra caacutec đặc điểm magrave từ đoacute chuacuteng ta liecircn hệ với sự thocircng minh trong hagravenh động của con người (Barr vagrave Feigenbaum 1981)

Mục điacutech của AI

Mục điacutech khoa học xaacutec định caacutec gợi yacute để giải thiacutech caacutec loại khaacutec nhau của triacute tuệ thực

Mục điacutech kỹ thuật giải quyết caacutec vấn đề trong thế giới thực

Triacute tuệ nhacircn tạo kế thừa nhiều yacute tưởng quan điểm kỹ thuật từ caacutec ngagravenh khoa học khaacutec

- Triết học

- Logic Toaacuten học

- Tiacutenh toaacuten

- Khoa học tacircm lyacute Khoa học nhận thức

- Sinh học Thần kinh học

- Tiến hoacutea

Caacutec lĩnh vực ứng dụng trong Triacute tuệ nhacircn tạo

Mạng nơ ron thần kinh (Neural Networks)

Tiacutenh toaacuten sự tiến hoacutea

(Evolutionary Computation)

Hệ chuyecircn gia (Expert Systems)

Kỹ thuật xử lyacute tiếng noacutei (Speech Processing)

Kỹ thuật xử lyacute ngocircn ngữ tự nhiecircn

(Natural Language Processing)

Lập kế hoạch (Planning)

Robot (Robotics)

Khoa học higravenh ảnh (Vision)

Caacutec kỹ thuật thocircng dụng dugraveng trong AI

Biểu diễn(Representation)

Học (Learning)

Caacutec luật (Rules)

Tigravem kiếm (Search)

72 Triacute thocircng minh của triacute tuệ nhacircn tạo

Con người suy diễn như thế nagraveo

Phacircn loại (Categorization)

Caacutec quy tắc cụ thể

Heuristics

Kinh nghiệm trước đoacute

Dự tiacutenh trước

Maacutey tiacutenh suy diễn như thế nagraveo

Lập luận dựa trecircn luật IF-THEN mocirc tả tri thức được matilde hoacutea dưới dạng caacutec luật

Caacutec khung (Frames) lagrave caacutec đại diện mocirc tả caacutec tigravenh huống giống nhau lagrave điển higravenh của một vagravei phacircn loại

Lập luận dựa trecircn caacutec trường hợp mocirc phỏng giải phaacutep trước đoacute cho một vấn đề hiện tại

Nhận dạng mẫu phaacutet hiện acircm thanh higravenh dạng hoặc caacutec chuỗi dagravei

Caacutec dạng khaacutec của Triacute tuệ nhacircn tạo

Học maacutey- mạng nơron vagrave giải thuật di truyền

Lập trigravenh tự động ndash lagrave những kỹ thuật tạo ra caacutec chương trigravenh để lagravem 1 nhiệm vụ riecircng biệt (cho pheacutep những người khocircng phải lagrave người lập trigravenh coacute thể lập trigravenh được)

Cuộc sống nhacircn tạo ndash nỗ lực để taacutei tạo caacutec hiện tượng sinh học trong caacutec hệ thống dựa trecircn maacutey tiacutenh

73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia(Expert Systems- ES)

Theo Jackson (1999) Một hệ chuyecircn gia lagrave một chương trigravenh maacutey tiacutenh mocirc tả vagrave suy diễn với tri thức của một vagravei lĩnh vực để giải quyết vấn đề hay đưa ra caacutec lời khuyecircn

Cấu truacutec cơ bản của ES được dựa theo cấu truacutec chung của DSS Sự khaacutec biệt chiacutenh giữa ES vagraveDSS lagrave hệ ES thu thập caacutec kiến thức từ những

chuyecircn gia trong lĩnh vực quan tacircmĐặc trưng của hệ chuyecircn gia Hiệu quả cao Thời gian trả lời thỏa đaacuteng Độ tin cậy cao Dễ hiểu

Giao diện người dugraveng trong ES

Thiết kế giao diện người dugraveng tập trung vagraveo caacutec yếu tố như dễ dagraveng sử dụngcoacute độ tin cậy cao giảm tải những khoacute khăn khi sử dụng

Thiết kế necircn coacute một số tương taacutec (đầu vagraveo kiểm soaacutet vagrave truy vấn)

Cấu tạo giao diện người dugraveng gồm coacute magraven higravenh cảm ứng bagraven phiacutem buacutet saacuteng lệnh thoại caacutec phiacutem chuyecircn dụng

Cơ sở tri thức (Knowledge Base)

Chứa đựng caacutec tri thức cụ thể miền thu được từ caacutec chuyecircn gia miền

Coacute thể chứa caacutec mocirc tả caacutec hagravenh vi giải quyết vấn đề caacutec ragraveng buộc caacutec heuristics

Thagravenh cocircng của một ES dựa trecircn tiacutenh đầy đủ vagrave tiacutenh chiacutenh xaacutec của cơ sở tri thức

Mocirc tơ suy diễn (Inference Engine)

Ở đacircy tri thức được đặt để sử dụng tạo ra caacutec giải phaacutep để giải quyết vấn đề

Mocirc tơ nagravey coacute khả năng thực hiện diễn dịch hoặc suy diễn dựa trecircn caacutec luật hay caacutec caacutec sự kiện

Đồng thời cũng coacute khả năng sử dụng caacutec suy diễn mờ hay khocircng chiacutenh xaacutec dựa trecircn xaacutec suất hay aacutenh xạ mẫu

Vograveng điều khiển suy diễn

1 Aacutenh xạ caacutec luật với caacutec sự kiện đatilde được cho

2 Chọn luật để thực hiện

3 Thực hiện luật bằng caacutech thecircm caacutec sự kiện được suy diễn ra vagraveo bộ nhớ lagravem việc

Chuỗi suy diễn (Chaining)

Suy diễn tiến (forward chaining) maacutey suy diễn bắt đầu từ dữ liệu ban đầu vagrave thực hiện việc suy luận để đưa ra caacutec kết luận cuối cugraveng

Suy diễn lugravei (backward chaining) maacutey suy diễn bắt đầu từ dữ liệu điacutech vagrave tigravem ra tri thức hỗ trợ cho dữ liệu điacutech đoacute

Viacute dụ suy diễn lugravei

R1 Nếu coacute A vagrave B thigrave suy ra coacute D

R2 Nếu coacute B thigrave suy ra coacute C

R3 Nếu coacute C vagrave D thigrave suy ra coacute E

Ta coacute E ta xem trong 3 luật R1 R2 R3 luật nagraveo coacute E ta thấy R3 chứa E đồng thời chứa C vagrave D Xeacutet tiếp trong 2 luật R1 R2 luật nagraveo chứa C vagrave D R2 chứa C R3 chứa D Từ đoacute ta coacute được caacutec tri thức hỗ trợ suy diễn vagrave kết luận lagrave nếu coacute A vagrave B thigrave sẽ coacute E Hay nếu A vagrave B đuacuteng thigrave sẽ coacute E

Viacute dụ suy diễn tiến

Giả sử coacute tập chứa 3 luật sau

R1 Nếu coacute A vagrave B thigrave suy ra coacute D

R2 Nếu coacute B thigrave suy ra coacute C

R3 Nếu coacute C vagrave D thigrave suy ra coacute E

Nếu ta coacute A vagrave B thigrave chuacuteng ta suy ra được D từ R1 vagrave suy ra C từ R2 Với D vagrave C đatilde được suy ra ở trecircn giờ chuacuteng ta suy ra được E từ R3

Viacute dụ thực tế

Giả sử muốn biết magraveu của một con vật nuocirci tecircn lagrave Fred biết rằng noacute kecircu ộp ộp vagrave ăn ruồi

Coacute tập 4 luật ban đầu như sau

R1 Nếu X kecircu ộp ộp vagrave ăn ruồi thigrave X lagrave con ếch

R2 Nếu X kecircu chiecircm chiếp vagrave biết hoacutet thigrave X lagrave con chim

R3 Nếu X lagrave con ếch thigrave X coacute magraveu xanh

R4 Nếu X lagrave con chim thigrave X coacute magraveu vagraveng

74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia

Expert system shells lagrave một tập caacutec goacutei phần mềm vagrave caacutec cocircng cụ dugraveng để phaacutet triển caacutec hệ chuyecircn gia

Những Expert system shells đầu tiecircn thường rất rườm ragrave Mặc dugrave vậy noacute vẫn giuacutep cho người sử dụng sẽ khocircng phải bắt đầu lại từ đầu khi xacircy dựng một hệ chuyecircn gia mới

Những shell hiện đại bao gồm hai mocirc-đun chiacutenh lagrave cocircng cụ xacircy dựng một tập quy tắc vagrave mocirc tơ suy diễn

Xacircy dựng hệ chuyecircn gia

Bước 1 xacircy dựng mocirc higravenh bagravei toaacuten xaacutec định vấn đề nhiệm vụ magrave hệ thống sẽ thực hiện Caacutec dạng bagravei toaacuten cần hệ chuyecircn gia

Bagravei toaacuten diễn giải (InterPretation)

Bagravei toaacuten dự baacuteo (Prediction)

Bagravei toaacuten chuẩn đoaacuten (Diagnose)

Bagravei toaacuten gỡ rối (Debugging)

Bagravei toaacuten thiết kế

Tương tự như một dự aacuten phần mềm để xacircy dựng một hệ chuyecircn gia cần phải coacute caacutec yếu tố về nhacircn lực tagravei nguyecircn vagrave thời gian Những yếu tố nagravey ảnh hưởng đến giaacute thah của một hệ chuyecircn giaTrong phần nagravey cacircu hỏi thường được đặt ra lagrave tại sao cần phải xacircy dựng một hệ chuyecircn giaTrước khi bắt đầu phải xaacute định rotilde bagravei toaacuten đạt ra lagrave jiAi lagrave chuyecircn giaAi lagrave người sử dụng

1 Diễn giải (InterPretation) Nghiecircn cứu 1 vấn đề -gt Dựa trecircn những biểu hiện thuộc tiacutenh đặc trưng becircn ngoagravei -gt Tư vấn

(hoặc đưa ra kết luận hay mocirc tả dễ hiểu từ tập dữ liệu thocirc)

2 Bagravei toaacuten dự baacuteo (Prediction) Coacute thể dự đoaacuten được hagravenh vi kết quả dựa trecircn caacutec hiện tượng -gt dự baacuteo

VD Dự baacuteo thời tiết động đấthellip

3 Bagravei toaacuten chẩn đoaacuten (Diagnoss) Xaacutec định caacutec lỗi caacutec bộ phận hỏng hoacutec của hệ thống dựa trecircn caacutec dữ liệu quan saacutet được

4 Bagravei toaacuten gỡ rối (Debugging) Mocirc tả caacutec phương phaacutep khắc phục hệ thống khi gặp sự cố

5 Bagravei toaacuten thiết kế Lựa chọn cấu higravenh caacutec đối tượng nhằm thoả matilden một số ragraveng buộc nagraveo đoacute

6 Giảng dạy Phần mềm dạy học coacute thể chuẩn đoaacuten vagrave sủa lỗi của học sinh trong quaacute trigravenh học tập

Để xaacutec định đuacuteng bagravei toaacuten magrave chuacuteng ta cần giải quyết thigrave phải trả lời đc một số cacircu hỏi

- cần hệ chuyecircn gia

Bước 2 thu thập tri thức lựa chọn cocircng cụ vagrave aacutep dụng

Trong bước thu thập tri thức vấn đề quan trọng lagrave lựa chọn chuyecircn gia những người magrave sẽ đoacuteng goacutep tri thức cho hệ thống Thocircng thường trong suốt quaacute trigravenh phaacutet triển thigrave chuyecircn gia được xem như một thagravenh viecircn của đội phaacutet triển

Hiện nay coacute rất nhiều cocircng cụ để xacircy dựng một hệ chuyecircn gia Phổ biến nhất lagrave JESS CLIPS vagrave OPS5

Bước 3 Thiết kế cơ sở tri thức thiết kế hệ thốngTri thức được biểu diễn trường minh trong cơ sở tri thức

Caacutec chuyecircn gia vagrave kỹ sư tri thức sẽ đối thoại với nhau bằng caacutec kỹ thuật đối thoại Suy diễn (SD) bảng Mocirc higravenh hoacutea SD quy nạp phacircn loại

Vấn đề bagraveo trigrave vagrave phaacutet triển

Caacutec hệ chuyecircn gia đogravei hỏi phải bảo trigrave vagrave phaacutet triển nhiều hơn so với caacutec hệ thống khaacutec Phải thường xuyecircn bổ sung tri thức mới vagrave thay đổi caacutec tri thức cũ để đổi mới hệ chuyecircn gia

Thu thập vagrave khắc phục lỗi do người sử dụng phaacutet hiện để kịp thời khắc phục những sai soacutet của hệ chuyecircn gia

75 Lợi iacutech vagrave hạn chế của caacutec hệ chuyecircn gia

Một số lợi iacutech chiacutenh

Thời gian trả lời hợp lyacute bằng hoặc nhanh hơn so với chuyecircn gia (người) để đi đến cugraveng một quyết định Hệ chuyecircn gia lagrave một hệ thống thời gian thực (real time system)

Khả năng trả lời với mức độ tinh thocircng bằng hoặc cao hơn so với chuyecircn gia (người) trong cugraveng lĩnh vực

Hệ chuyecircn gia giuacutep cho hiệu quả lagravem việc tăng bằng việc sử dụng tập caacutec luật một caacutech nhanh choacuteng magrave ko bị nhầm lẫn chuyecircn gia lagrave người coacute thể quecircn đi một số tri thức cơ sở lyacute luậ nhưng HCG thigrave ko

Quyết định của một người chuyecircn gia coacute thể bị thay đổi vagrave ko coacute tiacutenh thống nhất như quyết định của một hệ chuyecircn gia tạo ra

Hệ chuyecircn gia giuacutep cho người sử dụng coacute thể trau dồi sự hiểu biết trecircn lĩnh vuej cụ thể magrave noacute giải quyết hỗ trợ người ra quyết định coacute trigravenh độ như 1 chuyecircn gia trong quaacute trigravenh gia quyết định

Kiến thức của rất nhiều chuyecircn gia về một lĩnh vực nagraveo đoacute được đưa vagraveo hệ chuyecircn gia lagravem cho CSTT cuat HCG phong phuacute vagrave rộng lớn hơn rất nhiều

HCG giải thiacutech caacutec bước suy luận một caacutech dễ hiểu nhất quaacuten luacutec nagraveo cũng coacute thể sử dụng ko như chuyecircn gia con người

Hạn chế của caacutec hệ chuyecircn gia

Nhược điểm lớn nhất của hệ chuyecircn gia lagrave những yacute kiến chuyecircn mocircn thường rất khoacute matilde hoacutea vagrave giải neacuten

Hệ chuyecircn gia khocircng coacute khả năng tự học tự cập nhật kiến thức mới như caacutec chuyecircn gia magrave cần phải được matilde hoacutea lại khi noacute được cập nhật

Hệ chuyecircn gia khocircng thể nhận ra được vấn đề khocircng nằm trong miền kiến thức của hệ thống

Chương 8 Tri thức vagrave tiếp nhận

1 Bao gồm caacutec vấn đề

Dữ liệu thực tế đo lường hoặc quan saacutet coacute hoặc khocircng coacute bối cảnh

Thocircng tin dữ liệu được tổng hợp một caacutech hữu iacutech để giải quyết những khoacute khăn trong việc đưa ra quyết định

Tri thức bao gồm caacutec ứng dụng quy tắc thocircng tin hướng dẫn của người ra quyết định

2 Những caacutei nhigraven về tri thức

Đại diện lagravem thế nagraveo để diễn tả tri thức viacute dụ như một quyển saacutech khocircng phải lagrave tri thức nhưng noacute lại lagrave một đại diện của tri thức

Sản xuất tri thức lagrave một tập hơp của hagraveng tồn kho coacute thể được sản xuất cũng như mua lại

Tri thức lagrave 1 trong 6 trạng thaacutei của hệ thống

1Dữ liệu 2Thocircng tin 3Cấu truacutec thocircng tin 4Sự thấu hiểu 5Yacute kiến 6 Quyết định

3 Caacutec loại tri thức Phổ biến mocirc tả dữ liệu thocircng tin thủ tục mọi thứ lagravem như thế nagraveo lập luận chiacutenh saacutech hoặc caacutec quy tắc

4 Thu thập Tri thức hệ chuyecircn gia Hầu hết caacutec phương phaacutep đều bắt đầu với mocirc higravenh của caacutec taacutec vụ trong đoacute

hệ chuyecircn gia được xacircy dựng Trong đoacute mocirc tả về caacutec lĩnh vực được tạo ra Caacutec kỹ sư sử dụng caacutec mocirc higravenh giả thuyết vagrave nhận thức về quaacute trigravenh phacircn

tiacutech để gợi ra caacutech giải quyết vấn đề về tri thức từ caacutec chuyecircn gia

5 Caacutec chiều của thu thập tri thức KE- driven caacutec kỹ sư trao đổi trực tiếp với caacutec chuyecircn gia Expert-driven Caacutec chuyecircn gia trực tiếp đưa chuyecircn mocircn của họ vagraveo hệ

thống maacutey tiacutenh Machine-driven Sử dụng caacutec cocircng cụ suy luận để triacutech xuất tri thức từ một

tập caacutec viacute dụ

6 Kỹ thuật thu thập tri thức Trao đổi gồm 2 loại cơ bản lagrave coacute cấu truacutec(coacute kịch bản) vagrave khocircng coacute cấu

truacutec( đối thoại trực tiếp) Giao thức phacircn tiacutech bằng lời Khi caacutec chuyecircn gia thực hiện một cocircng việc

của họ thigrave một bản ghi về cocircng việc đoacute được thực hiện Caacutec kỹ sư sẽ xacircy dựng mocirc higravenh cho những gigrave được ghi lại trong bản ghi

Phương phaacutep sagraveng lọc caacutec chuyecircn gia so saacutenh caacutec nhoacutem liecircn tiếp trong ba đối tượng vagrave cho biết tại sao nhoacutem thứ hai lại khaacutec nhoacutem thứ ba

7 Thu thập tri thức từ nhiều nguồn Thu thập tri thức từ nhiều nguồn lagrave cần thiết để coacute được đầy đủ caacutec tri thức

cho một vấn đề quan điểm yacute kiến traacutei ngược nhau thường phaacutet sinh Phương phaacutep đồng thuận sẽ giuacutep giải quyết được vấn đề macircu thuẫn Kỹ thuật phacircn tiacutech Meta lagrave kỹ thuật được aacutep dụng trong caacutec trường hợp

khaacutec Caacutech tiếp cận bằng định lượng đogravei hỏi caacutec kỹ sư cần cacircn nhắc yếu tố đầu vagraveo của caacutec chuyecircn gia khaacutec nhau

8 Xaacutec nhận hợp lệ vagrave kiểm tra tri thức Một khi thu thập tri thức noacute phải được đaacutenh giaacute về khả năng sử dụng vagrave độ

chiacutenh xaacutec Hai vấn đề cụ thể lagrave hiệu lực của những kiến thức vagrave kiểm tra việc xacircy dựng cơ sở của tri thức

Cần xaacutec nhận xem liệu hệ thống coacute thể hoạt động ở mức độ tối thiểu khocircng

Xaacutec minh liecircn quan đến việc so saacutenh từng chi tiết kỹ thuật của hệ thống những gigrave đatilde được thực hiện cuối cugraveng

9 Một số caacutec biện phaacutep xaacutec nhận Độ chiacutenh xaacutec Khả năng thiacutech nghi Mức độ đầy đủ Bề rộng Độ sacircu Hiệu lực Tổng quan Chiacutenh xaacutec Hiện thực Độ tin cậy Tiacutenh hữu dụng Mức độ

Chương 9 Học maacutey

1 Logic mờ vagrave ngocircn ngữ mờ(Fuzzy Logic and Linguistic Ambiguity)

Ngocircn ngữ tự nhiecircn gồm những khaacutei niệm mơ hồ vagrave khocircng chiacutenh xaacutectruyền tải ngữ nghĩa thocircng qua tiacutenh xấp xỉkhocircng rotilde ragraveng

Những xấp xỉ nagravey giuacutep con người coacute thể truyền tải hết được yacute nghĩa nhưng maacutey thigrave khocircng hiểu

Lagravem sao biểu diễn caacutec tri thức sử dụng caacutec khaacutei niệm khocircng rotilde ragraveng(mờ) hoặc khocircng chiacutenh xaacutec

2 Khaacutei niệm cơ bản của logic mờ tập mờ lagrave những tập hợp khocircng coacute một giới hạn rotilde Mỗi phần tử của noacute chỉ

chứa một mức độ hagravem liecircn thuộc của từng phần tử Vigrave vậy tập mờ khocircng giống như tập cổ điển Tập mờ coacute thể kết hợp với nhau qua những luật mờ magrave đặc trưng cho những hagravenh động trạng thaacutei vagrave thuộc tiacutenh của logic mờ được tận dụng khi thực hiện một bộ điều khiển mờ

Logic mờ dựa trecircn yacute tưởng mỗi phần tử thuộc vagraveo một tập hợp ở một mức độ nagraveo đấy

Locircgic mờ cho pheacutep độ liecircn thuộc (microA )coacute giaacute trị trong khoảng (01) Locircgic mờ coacute thể được coi lagrave mặt ứng dụng của lyacute thuyết tập mờ để xử lyacute caacutec

giaacute trị trong thế giới thực cho caacutec bagravei toaacuten phức tạp

3 So saacutenh tiacutenh đuacuteng đắn logic mờ vagrave xaacutec suất Xaacutec suất thigrave đề cập đến khả năng xảy ra một biến cố hay một điều gigrave đoacute Logic mờ đề cập đến cấp độ magrave đặc tiacutenh ở hiện tại

o viacute dụ1 người coacute chiều cao 6 feet thigrave coacute cấp độ lagrave 05 về chiều cao

4 Ưu điểm của logic mờ Caacutech tiếp cận rất tự nhiecircnkhocircng phức tạp Coacute thể mocirc higravenh hoacutea caacutec hagravem phi tuyến tugravey yacute phức tạp

Coacute thể tận dụng được kinh nghiệm từ những chuyecircn gia hagraveng đầu trong mọi lĩnh vực

Logic mờ được xacircy dựng dựa trecircn ngocircn ngữ tự nhiecircnNền tảng của logic mờ lagrave dựa trecircn cơ sở giao tiếp của con người

5 Nhược điểm của logic mờ Trong 1 hệ thống phức tạpsử dụng logic mờ coacute thể trở thagravenh trở ngại cho

việc xaacutec thực độ tin cậy của hệ thống Cơ chế lập luận mờ khocircng thể học hỏi từ những lỗi sai

6 Mạng noron nhacircn tạo(ANN) Mạng noron nhacircn tạo lagrave một mocirc phỏng xử lyacute thocircng tinđược nghiecircn cứu ra

từ hệ thống thần kinh của sinh vậtgiống như bộ natildeo để xử lyacute thocircng tin ANNs lagrave chương trigravenh dựa trecircn maacutey tiacutenh đơn giản coacute chức năng lagrave một mocirc

higravenh bagravei toaacuten khocircng gian dựa trecircn thử nghiệm vagrave baacuteo lỗi

7 Học từ kinh nghiệm Tiến trigravenh Một mẫu dữ liệu được biểu diễn như một mạng lưới noronANN ldquodự

đoaacutenrdquo 1 đầu radự đoaacuten được so saacutenh với giaacute trị thực tế hoặc giaacute trị chiacutenh xaacutecNếu đoaacuten được chiacutenh xaacutec thigrave khocircng coacute hagravenh động nagraveo được thực hiện

Nếu dự đoaacuten sai ANN kiểm tra lại vagrave xaacutec định lại thocircng số để điều chỉnh Một mẫu dữ liệu khaacutec được biểu diễn vagrave quaacute trigravenh nagravey được lặp lại

8 Nguyecircn tắc cơ bản của cocircng nghệ nơron Caacutec yếu tố xử lyacute cơ bản trong hệ thống thần kinh của con người lagrave tế bagraveo

thần kinhMạng lưới của tế bagraveo nagravey lagrave liecircn kết với nhau nhận được thocircng tin từ caacutec cảm biến trong mắt taihellip

Thocircng tin nhận được bởi tế bagraveo thần kinh hoặc lagrave sẽ kiacutech thiacutech noacute(sẽ được chuyển qua 1 thocircng điệp dọc theo mạng lưới) hoặc lagrave sẽ ngăn cản noacute(ngăn cản dograveng thocircng tin)

Độ nhạy coacute thể thay đổi qua thời gian hoặc sau khi coacute được kinh nghiệm

9 Cấu truacutec mạng Một ANN gồm 3 lớp cơ bản

Lớp đầu vagraveo nhận dữ liệu Lớp becircn trong hoặc lagrave lớp ẩn xử lyacute dữ liệu Lớp đầu ra chuyển tiếp kết quả cuối cugraveng của mạng

10Mạng nơ ron Thường coacute nhiều đầu vagraveo mỗi đầu vagraveo với mức ảnh hưởng vagrave tầm quan

trọng riecircng của noacute Một đầu vagraveo quan trọng coacute thể được sử dụng để khuếch đại đầu ra caacutec hagravem trạng thaacutei tổng hợp caacutec trọng số của caacutec yếu tố

đầuvagraveo khaacutec nhauvagraveo một giaacute trị duy nhất Caacutec hagravem chuyển giao xử lyacute caacutec giaacute trị trạng thaacutei vagrave tạo đầu ra

11Huấn luyện mạng nơ ron Trong mocirc higravenh coacute giaacutem saacutetANN được đến so saacutenh dự đoaacuten của chiacutenh

noacute với thocircng tin phản hồi coacute chứa caacutec kết quả mong muốn ANN sẽ phải tigravem caacutech thay đổi caacutec tham số becircn trong củamigravenh (caacutec trọng số vagrave caacutec ngưỡng) để tạo necircn một aacutenh xạ coacute khả năng aacutenh xạcaacutec đầu vagraveo thagravenh caacutec đầu ra mong muốn Sự thay đổi nagravey được tiến hagravenh nhờ việc so saacutenh giữa đầu ra thực sự vagrave đầu ra mong muốn

Trong mocirc higravenh khocircng coacute giaacutem saacutetANN nhận được dữ liệu vagraveo nhưng khocircng phải coacute bất kỳ thocircng tin phản hồi về kết quả mong muốn

Phần lớn caacutec ứng dụng nằm trong vugraveng của caacutec bagravei toaacuten ước lượng như mocirc higravenh hoacuteathống kecirc neacuten lọc phacircn cụm

12Lợi iacutech Liecircn kết với mạng noron Traacutenh caacutech lập trigravenh tường minh Giảm nhu cầu của chuyecircn gia ANNs thigrave thiacutech nghi với caacutec yếu tố đầu vagraveo thay đổi Khocircng cần thiết cho cơ sở tri thức tinh chế ANNs coacute tiacutenh động vagrave cải thiện với việc sử dụng Coacute khả năng xử lyacute dữ liệu khocircng chiacutenh xaacutec hoặc khocircng đầy đủ Cho pheacutep tổng quaacutet hoacutea từ thocircng tin cụ thể Cho pheacutep thu thập cảm giaacutec thocircng thường vagraveo miền giải quyết vấn đề

13Hạn chế của việc liecircn kết với mạng noron ANNs khocircng thể giải thiacutech được suy luận Bản chất hộp đen thường khiến cho vấn đề traacutech nhiệm vagrave độ tin cậy phaacutet

sinh lagrave khoacute khăn Lặp đi lặp lại quaacute trigravenh huấn luyện rất tốn thời gian Nguồn lực caacutec nhagrave phacircn tiacutech vagrave thiết kế coacute tay nghề cao vẫn lagrave đaacuteng lo

ngại Cocircng nghệ ANN thuacutec đẩy hạn chế của phần cứng hiện tại ANN yecircu cầu phải coacute sự tin tưởng ở đầu ra

14Giới thiệu về thuật toaacuten di truyền Cũng như mạng lưới thần kinh caacutec thuật toaacuten di truyền được dựa trecircn lyacute

thuyết sinh học Thuật toaacuten di truyền tigravem thấy nguồn gốc của chuacuteng trong caacutec lyacute thuyết

tiến hoacutea của chọn lọc tự nhiecircn vagrave thiacutech ứng với biến đổi khiacute hậu Kết quả thuật toaacuten di truyền lagrave từ giao phối 2 caacute thể trong quần thế để tạo

ra con caacutei đocirci khi tốt hơn so với bậc cha mẹ của chuacuteng 15Caacutec thagravenh phần cơ bản của thuật toaacuten di truyền

Toaacuten tử chọn lọc Caacutec caacute thể tốt được chọn lọc để đưa vagraveo thế hệ sau Sự chọn lọc nagravey căn cứ vagraveo độ thiacutech nghi với mocirci trường của mỗi caacute thể

Toaacuten tử lai gheacutep (crossover) Hai caacute thể cha vagrave mẹ trao đổi caacutec gen với nhau để tạo ra caacute thể con

Toaacuten tử đột biến (mutation) Một caacute thể thay đổi một số gen để biến đổi thagravenh một caacute thể mớiTất cả caacutec toaacuten tử trecircn khi thực hiện đều mang tiacutenh ngẫu nhiecircn

16Quaacute trigravenh cơ bản của một thuật toaacuten di truyền Khởi tạo

Đaacutenh giaacute quần thể

Lựa chọn NST thiacutech hợp nhất vagrave loại bỏ NST yếu nhất

Quy trigravenh giao nhau vagrave cải thiện quần thể

đột biến tiến trigravenh để khaacutem phaacute ra NST mới

17Ưu nhược điểm của việc kết hợp với thuật toaacuten di truyền Kiacutech thước quần thể lagrave 1 yếu tố quan trọng trong tốc độ của việc tigravem

kiếmnhưng noacute tương đối dễ dagraveng để dự đoaacuten tốc độ nagravey Giao nhau hoặc đột biến lagrave khocircng necircn đc sử dụng quaacute thường xuyecircn Luocircn coacute được iacutet nhất 1 giải phaacutep hợp lyacute Necircn coacute thể aacutep dụng chuacuteng cho caacutec vấn đề magrave chuacuteng ta khocircng coacute hướng

về caacutech giải quyết Sức mạnh của thuật toaacuten xuất phaacutet từ khaacutei niệm đơn giảnkhocircng phải từ

một thủ tục thuật toaacuten phức tạp 18Tương lai của học maacutey

Mạng lưới thần kinh nhacircn tạo vượt quaacute năng lực của con người trong caacutec trường hợp bị cocirc lập

Về mặt lyacute thuyếtmột maacutey tiacutenh coacute thể xử lyacute dũ liệu nhanh hơn hagraveng triệu lần so với 1 con người

May mắn thay cho chuacuteng tacon người tốt hơn nhiều khi magrave coacute được dữ liệumaacutey tiacutenh khocircng coacute 1 số thứ như lagrave 5 giaacutec quan

CHƯƠNG 10 KHO DỮ LIỆU

1 Kho dữ liệu Kho dữ liệu lagrave tuyển tập caacutec cơ sở dữ liệu tiacutech hợp hướng chủ đề được

thiết kế để trợ giuacutep cho một hệ hỗ trợ quyết định

Theo John Ladley Cocircng nghệ kho dữ liệu lagrave tập caacutec phương phaacutep kỹ thuật vagrave caacutec cocircng cụ coacute thể kết hợp hỗ trợ nhau để cung cấp thocircng tin cho người sử dụng trecircn cơ sở tiacutech hợp từ nhiều nguồn dữ liệu nhiều mocirci trường khaacutec nhau

Kho dữ liệu thường rất lớn tới hagraveng trăm GB hay thậm chiacute hagraveng Terabyte

2 Kho dữ liệu vận hagravenh (ODS) Một kho dữ liệu vận hagravenh Aacutep dụng kỹ thuật kho dữ liệu vagraveo caacutec hệ xử

lyacute giao taacutec lưu trữ dữ liệu cho một ứng dụng đặc thugrave Noacute đưa vagraveo kho dữ liệu một dograveng caacutec dữ liệu thocirc được thiết kế

3 So saacutenh

Kho dữ liệu vận hagravenh Kho dữ liệu

Dữ liệu theo chủ đề Dữ liệu theo chủ đề

Dữ liệu tiacutech hợp Dữ liệu tiacutech hợp

Dữ liệu thay đổi Dữ liệu khocircng thay đổi

Dữ liệu được cập nhật khi thay đổi

Dữ liệu giữ nguyecircn

Chỉ coacute dữ liệu hiện tạiDữliệu hiện tại vagrave dữ liệu lịch sử

Chu kỳ lagravem tươi dữ liệu ngắn Chu kỳ lagravem tươi dữ liệu dagravei

Chỉ coacute dữ liệu chi tiết Dữ liệu chi tiết vagrave dữ liệu tổng kết

Dugraveng cho caacutec quyết định ngắn hạn

Dugraveng cho hoạch định dagravei hạn

4 Kho dữ liệu cục bộ (Data Mart - DM)

Kho dữ liệu cục bộ lagrave CSDL coacute những đặc điểm giống với kho dữ liệu nhưng với quy mocirc nhỏ hơn vagrave lưu trữ dữ liệu về một lĩnh vực một chuyecircn ngagravenh

Data mart phụ thuộc Chứa những dữ liệu được lấy từ DW vagrave những dữ liệu nagravey sẽ được triacutech lọc vagrave tinh chế tiacutech hợp lại ở mức cao hơn để phục vụ một chủ đề nhất định của Datamart

Data mart độc lập Khocircng giống như Datamart phụ thuộc Data mart độc lập được xacircy dựng trước DW vagrave dữ liệu được trực tiếp lấy từ caacutec nguồn khaacutec nhau

5 Siecircu dữ liệu Metadata lagrave dữ liệu để mocirc tả dữ liệu Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột

một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi Metadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu

6 Mocirci trường kho dữ liệu Hệ thống của tổ chức vagrave kho cung cấp dữ liệu để xacircy dựng kho dữ liệu Trong quaacute trigravenh chuyển dữ liệu từ caacutec nguồn khaacutec nhau dữ liệu coacute thể

được lagravem sạch hoặc chuyển đổi vagrave vigrave thế DW được xem như lagrave một chuẩn cho việc lưu trữ

Đồng thời siecircu dữ liệu được ghi lại Cuối cugraveng DW hoặc siecircu thị coacute thể được sử dụng để tạo ra một kho dữ

liệu ldquocaacute nhacircnrdquo 7 Caacutec đặc điểm của kho dữ liệu

Đặc điểm Mocirc tả

Hướng chủ đề - DL tổ chức theo caacutech thức người dugraveng tham chiếu

Tiacutech hợp - Dữ liệu ldquosạchrdquo loại bỏ tiacutenh thiếu nhất quaacuten

Khocircng thay đổi - DL ldquochỉ đọcrdquo người dugraveng khocircng thay đổi được

Chuỗi thời gian - DL lagrave chuỗi thời gian khocircng phải lagrave trạng thaacutei hiện tại

Được tổng kết - DL vận hagravenhthao taacutec khi cần thiết

được kết hợp lại thagravenh dạng coacute thể dugraveng được cho quyết định

Kiacutech cỡ lớn hơn - Lưu giữ theo chuỗi thời gian tức lagrave giữ lại nhiều DL

Khocircng được chuẩn hoacutea - Coacute thể dư thừa DLSiecircu dữ liệu - Dữ liệu của dữ liệu được lưu trữNguồn dữ liệu - DL vận hagravenh (caacutec hệ sẵn coacute) cugraveng

với caacutec nguồn ngoagravei 8 Kho dữ liệu hướng chủ đề

Hướng chủ để coacute nghĩa lagrave kho dữ liệu được tổ chức xung quanh caacutec chủ đề chiacutenh như khaacutech hagraveng sản phẩm sản xuất Tập trung vagraveo việc mocirc higravenh hoacutea vagrave phacircn tiacutech dữ liệu cho caacutec nhagrave ra quyết định magrave khocircng tập trung vagraveo caacutec xử lyacute thocircng thường Cung cấp cho người dugraveng một khung nhigraven toagraven vẹn đơn giản vagrave đầy đủ về caacutec sự kiện quanh caacutec chủ đề

9 Dữ liệu trong DW được tiacutech hợp Dữ liệu trong kho dữ liệu được xacircy dựng bằng caacutech tổng hợp dữ liệu từ

nhiều nguồn khaacutec nhau vagrave caacutec nguồn coacute tổ chức khaacutec nhau Cơ sở dữ liệu caacutec file excel caacutec flat file hoặc caacutec raw file Khi đưa vagraveo kho dữ liệu caacutec dữ liệu được lagravem sạch vagrave tiacutech hợp dữ liệu nhằm đảm bảo tiacutenh nhất quaacuten của dữ liệu

10Kiến truacutec kho dữ liệu Tầng cơ sở dữ liệu hoạt động Tầng truy xuất thocircng tin Tầng truy xuất dữ liệu Tầng siecircu dữ liệu Tầng quản lyacute tiến trigravenh Tầng thocircng điệp của ứng dụng Tầng vật liacute của kho dữ liệu Tầng trigravenh diễn dữ liệu

11Higravenh trạng kho dữ liệu Kho dữ liệu ảo - người dugraveng cuối coacute thể truy cập trực tiếp đến kho dữ liệu

sử dụng caacutec cocircng cụ cho pheacutep ở tầng truy xuất dữ liệu Kho dữ liệu trung tacircm-1 cơ sở dữ liệu vật lyacute chứa tất cả dữ liệu cho một

vugraveng chuyecircn dụng nagraveo đoacute

Kho dữ liệu phacircn taacuten- Thagravenh phần được phacircn taacuten qua nhiều hệ cơ sở dữ liệu vật lyacute

12METADATA- Siecircu dữ liệu Định nghĩa Siecircu dữ liệu lagrave dữ liệu về dữ liệu Lagrave 1 lưu trữ dugraveng để

Miecircu tả kho dữ liệu tổng thể Nhận dạng kiểu kho dữ liệu Quản liacute quaacute trigravenh tiacutech hợp dữ liệu Quản liacute quaacute trigravenh cập nhật kho dữ liệu Quản liacute bảo mật

Lagrave chigravea khoacutea quyết định sự thagravenh cocircng của kho dữ liệu luocircn được thay đổi vagrave cập nhật theo sự phaacutet triển của kho dữ liệu

Dugraveng để quản liacute điều khiển kho dữ liệu Sự ra đời của kho dữ liệu như 1 cấu truacutec hỗ trợ ra quyết định siecircu dữ liệu

được xem như nguồn tagravei nguyecircn dữ liệu Siecircu dữ liệu lagrave trừu tượng Chuacuteng lagrave dữ liệu bậc cao cung cấp mocirc tả ngắn

gọn caacutec dữ liệu bậc thấp hơn 13Hoạt động của Siecircu dữ liệu

Siecircu dữ liệu rất cần thiết trong việc chuyển hoacutea thocircng tin trở thagravenh tri thức Lagrave chigravea khoacutea giuacutep chuacuteng ta xử lyacute được dữ liệu thocirc Viacute dụ một dograveng dữ liệu baacuten hagraveng 1023 K596 11121 agraveNoacute sẽ khocircng coacute nghĩa gigrave cho đến khi chuacuteng ta đưa vagraveo siecircu dữ liệu (thư

mục chứa dữ liệu) agrave cửa hagraveng 1023 sản phẩm K596 vagrave số tiền baacuten được lagrave 11121 đocirc la

14Sự cần thiết phải nhất quaacuten trong kho dữ liệu Kho dữ liệu được xacircy dựng cho lợi iacutech của những nhagrave phacircn tiacutech kinh

doanh caacutec nhagrave quản trị cho tất cả caacutec khu vực chức năng Trong cơ sở dữ liệu riecircng caacutec khu vực khaacutec nhau coacute thể định nghĩa vagrave lưu

trữ dữ liệu thocircng qua phiecircn bản của chiacutenh noacute Khi dữ liệu được lấy từ những vugraveng khaacutec nhau đoacute vagrave được đặt vagraveo kho dữ

liệu Việc chuyển đổi vagrave lagravem sạch caacutec tiến trigravenh sẽ đảm bảo noacute lagrave duy nhất được tiacutech hợp tại một mức của tổ chức

15Ragrave soaacutet lại dữ liệu ndash Thực thi siecircu dữ liệu

Bất kể cấu truacutec tự nhiecircn của 1 cacircu truy vấn thế nagraveo thigrave caacutec thagravenh phần của siecircu dữ liệu rất quan trọng đối với người ra quyết định

Bảng thuộc tiacutenh khoacutea được lưu trữ bởi kho dữ liệu Tập hợp dữ liệu được lấy từ đacircu Những chuyển đổi nagraveo được thực thi với việc lagravem sạch

16Siecircu dữ liệu lagrave gigrave Metadata - lagrave thocircng tin mocirc tả nội dung của cơ sở dữ liệu (CSDL) Metadata baacuteo cho người dugraveng biết thời gian cập nhật sau cugraveng của dữ liệu

định dạng vagrave mục điacutech sử dụng của noacute Những thocircng tin nagravey coacute thể hướng dẫn người dugraveng duyệt qua CSDL vagrave

giuacutep họ hiểu được yacute nghĩa vagrave ngữ cảnh của dữ liệu Trong CSDL metadata lagrave caacutec dạng biểu diễn khaacutec nhau của caacutec đối tượng

trong CSDL Trong CSDL quan hệ metadata lagrave caacutec định nghĩa của bảng cột CSDL

view vagrave nhiều đối tượng khaacutec Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột

một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi -gtMetadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu

Bảng chuyển đổi Ghi lại những chuyển đổi đatilde được thực hiện

Lịch sử thực thi Ghi lại những dữ liệu đatilde được

phacircn tiacutech

Higravenh thaacutei kết nốiGhi lại những dữ liệu được kết nối vagrave tần suất

17Aacutenh xạ thocircng thường của siecircu dữ liệu Bản ghi aacutenh xạ chuyển đổi bao gồm

Định danh của nguồn gốc Chuyển đổi thuộc tiacutenh Chuyển đổi thuộc tiacutenh vật lyacute Matilde hoacutea tham chiếu bảng chuyển đổi Đổi tecircn Đổi khoacutea Gaacuten giaacute trị cho thuộc tiacutenh mặc định Chọn logic cho caacutec nguồn nhiều giaacute trị Đổi thuật toaacuten

18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để

phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai

lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave

tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec

Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm

Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo

19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua

caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau

SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được

Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra

một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức

Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ

Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ

Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech

CHƯƠNG 11 KHAI PHAacute DỮ LIỆU

1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn

ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993

Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng

2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd

1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều

2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP

3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn

4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng

5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server

6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo

7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động

8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời

9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều

10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện

11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech

12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP

3 Xử lyacute phacircn tiacutech trực tuyến OLAP

MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave

dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu

ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave

thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu

HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave

ROLAP4 Khai phaacute dữ liệu

Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh

khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn

Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan

5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp

6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại

Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp

Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec

Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt

Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra

Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh

vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho

Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec

Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm

Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục

Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng

gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp

Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn

Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec

Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper

Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2

Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25

Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước

Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng

Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện

trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp

Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute

độ hỗ trợ ge ngưỡng minsup

độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan

Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn

Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết

Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu

MOLAP ROLAP HOLAP

Lưu trữ dữ liệu cơ sở

Khối Bảng quan hệ Bảng quan hệ

Lưu trữ thocircng tin tổng hợp

Khối Bảng quan hệ Khối

Hiệu suất thực hiện truy vấn

Nhanh nhất Chậm nhất Nhanh

Tiecircu thụ khocircng gian lưu trữ

Nhiều Thấp Trung bigravenh

Chi phiacute bảo trigrave Cao Thấp Trung bigravenh

Page 32: De cuong(1-11)

cho thấy rằng EIS cung cấp cho quản lyacute một higravenh ảnh chiacutenh xaacutec hơn về tổ chức thực hiện vagrave cung cấp hỗ trợ cho caacutec lợi iacutech chiến lược cải thiện khocircng chỉ cho caacutec nhagrave quản lyacute nhưng cograven cho phần cograven lại của tổ chức Dựa trecircn caacutec hệ thống được thiết kế cho caacutec cocircng ty tư nhacircn với một caacutech rotilde ragravengxaacutec định mục tiecircu EIS lagrave thiacutech hợp cho caacutec tổ chức cocircng cộng hiện đại nhưng cần phải được linh hoạt hơn vagrave kết thagravenh chugravem một phạm vi rộng hơn khả năng vagrave phương tiện hơn so với khu vực tư nhacircn ban đầu theo định hướng sản phẩm (Hasan vagrave Hasan năm 1997) Điều nagravey coacute thể lagrave do thực tế rằng caacutec hoạt động khu vực cocircng lagrave bắt buộc coacute taacutec động rộng phải đaacutep ứng sự mong đợi duy nhất cocircng cộng thường coacute mục tiecircu mơ hồ vagrave macircu thuẫn iacutet quyền tự chủ vagrave kiểm soaacutet việc ra quyết định vagrave nhacircn viecircn lagrave khoacute khăn hơn (Watson vagrave Carte2000) + Toacutem lại EIS lagrave một khaacutei niệm thagravenh cocircng noacute phaacutet triển qua nhiều năm tuy nhiecircn EIS khắc phục khiếm khuyết của migravenh bằng caacutech tiến hagravenh nghiecircn cứu liecircn tục)

63 Tại sao những người điều hagravenh hagraveng đầu lại khaacutec nhau- Họ lagrave những doanh nghiệp theo định hướng coacute suy nghĩ

- Coacute một khoảng khocircng gian rộng để kiểm soaacutet

- Họ chịu traacutech nhiệm cho việc thiết lập chiacutenh saacutech

- Họ đại diện cho tổ chức mocirci trường becircn ngoagravei

- Hagravenh động của họ tạo ra những kết quả đaacuteng kể về tagravei chiacutenh vagrave con người

Tần số caacutec hoạt động điều hagravenh- Xử lyacute xaacuteo trộn 42

- Hoạt động kinh doanh 32

- Phacircn bổ nguồn lực 17

- Đagravem phaacuten 3

- Những điều khaacutec 6

Handling Disturbances 42

Entrepreneurial Activites 32

Resource Allocation 17

Negotiation 3

Other 6

Những thocircng tin điều hagravenh cần thiết- Quản lyacute xaacuteo trộn coacute thể yecircu cầu sự chuacute yacute xung quanh đồng hồ

- Hoạt động kinh doanh yecircu cầu điều hagravenh để dự đoaacuten những thay đổi trong mocirci trường

- Nhiệm vụ phacircn bổ tagravei nguyecircn yecircu cầu lựa chọn người quản lyacute vagrave caacutec nguồn lực hạn chế được triển khai

- Đagravem phaacuten yecircu cầu cập nhật thocircng tin từng phuacutet để coacute thể xacircy dựng được sự đồng thuận

Caacutec loại thocircng tin điều hagravenh- Hệ thống kế toaacuten coacute liecircn quan đến việc tiacutenh toaacuten thu nhập hoạt động cho caacutec lĩnh

vực cụ thể lagrave quan trọng hơn so với caacutec hệ thống kế toaacuten truyền thocircng- Thocircng tin về thị trường khaacutech hagraveng cung cấp giaacute trị trong việc quyết định chiến

lược- Caacutec thocircng tin cần thiết thường được truyền đi trecircn một số hệ thống maacutey tiacutenh vagrave

nằm trong toagraven tổ chức- Caacutec thocircng tin được sử dụng thường lagrave ngắn hạn vagrave dễ thay đổi

Phương thức để xaacutec định thocircng tin cần thiết

Rockart xaacutec định được năm phương thức cơ bản để xaacutec định thocircng tin cần thiết

- Phương thức dựa trecircn kết quả- Phương thức rỗng- Phương thức chỉ số khoacutea- Phương thức tổng hợp nghiecircn cứu- Phương thức dựa vagraveo nhacircn tố then chốt dẫn đến thagravenh cocircng

64 Thagravenh phần EIS

- Sản phẩm EIS đầu tiecircn được phaacutet triển để sử dụng trecircn maacutey tiacutenh cấu higravenh cao nhưng caacutec sản phẩm hiện nay nhằm mục tiecircu lagrave nền tảng ClientServer

- Những nền tảng linh hoạt hơn coacute thể thiacutech ứng với thay đổi trong tổ chức vagrave cocircng nghệ

- Sử dụng dữ liệu thời gian thực dẫn đến quyết định nhanh hơn nhiều thocircng tin hơn

Thagravenh phần phần cứng- Một EIS khocircng đogravei hỏi coacute phần cứng cụ thể hoặc duy nhất nagraveo- Chigravea khoacutea của vấn đề lagrave để đảm bảo rằng caacutec thagravenh phần của EIS tối ưu hoacutea vagrave

phugrave hợp với tagravei nguyecircn maacutey tiacutenh của tổ chức- Hệ thống nagravey phải được cấu higravenh để caacutec nguồn tagravei nguyecircn phugrave hợp với những

người điều hagravenh chuacuteng

Thagravenh phần phần mềm- Traacutei ngược với phần cứng phần mềm thường được chuyecircn mocircn hoacutea cao cho caacutec

bagravei toaacuten về miền- Sự chuyecircn mocircn hoacutea nagravey thường đạt được bằng caacutech sử dụng thagravenh phần off-the-

shelf cho toagraven bộ EIS vagrave caacutec mocirc-đun tugravey chỉnh để đaacutep ứng nhu cầu cụ thể- Lotus Notes lagrave một viacute dụ điển higravenh Noacute coacute thể được sử dụng một migravenh hoặc coacute

thể phục vụ becircn thứ ba mocirc-đun plug-in

Cocircng nghệ EIS hiện nay

Dobrzeniecki đề xuấtphacircn loạitừng cấptheo bachức năng- Loại 1 sản phẩm bao gồmmột bộ đầy đủcaacutec ứng dụngtừ mộtnhagrave cung cấp- Loại 2 sản phẩm đượcthựchiệnở phần đầu củacaacutecsản phẩmDSS đượcphaacutet triển

bởicugravengmộtnhagrave cung cấp- Loại 3 sản phẩmkết hợp với nhautheo bất kỳ số lượngthuộc sở hữu củacocircng ty

65 Xacircy dựng EIS

- Xacircy dựngmộtEISgiống nhưxacircydựngmột số hệ thống khaacutec củamocirc higravenh hệ thống thocircng tin

- Việcphaacutet triểncấu truacutecnecircn được theo dotildeitừ quaacute trigravenh thiết kế đến quaacute trigravenhthực hiện

- Tuy nhiecircn một dự aacuten phaacutet triển EIScoacute xu hướnglagrave thống nhấtvagraveyecircu cầu hỗ trợ caacutec nhagrave quản lyacute latildenh đạo

- Xacircy dựng một EIScoacute thểphaacutet hiện ra đượccaacutectigravenh huống khoacute khănmagravemột nhagrave phaacutet triển chưabao giờ gặp phải

Mocirc higravenh EIS

Khung phaacutet triển một EIS

- Watson et al đề nghị xacircy dựngkhung với ba thagravenh phần+ Caacutech tiếp cận tập trung vagraveo yếu tốcon người vagrave dữ liệu coacute liecircn quan đến EIS+ Quaacute trigravenh phaacutet triển cần sự linh hoạt vagrave tương taacutec+ Người sử dụng - hệ thống hộp thoại bao gồm một ngocircn ngữ hagravenh động để xử lyacute caacutec lệnh

Lợi iacutech của EIS- Dễ duy trigrave caacutec mục tiecircu coacute tổ chức- Dễ truy xuất thocircng tin- Cho pheacutep người sử dụng nacircng cao hiệu suất hơn

- Tăng chất lượng ra quyết định- Cung cấp sự cải tiến cạnh tranh- Tiết kiệm thời gian của người sử dụng- Tăng khả năng vagrave chất lượng giao tiếp- Cung cấp khả năng điều khiển tốt hơn trong tổ chức- Cho pheacutep tham gia caacutec vấn đề vagrave caacutec cơ hội- Cho pheacutep hoạch định- Cho pheacutep tigravem kiếm nguyecircn nhacircn của một vấn đề- Thảo matilden caacutec yecircu cầu của người điều hagravenh

Hạn chế của EIS vagrave 1 số sai lầm cần traacutenh

- Chi phiacute một cuộc khảo saacutetnăm1991 chothấychi phiacute phaacutet triểntrungbigravenh365000USDvớichi phiacute vận hagravenhhagraveng năm lagrave$200000 (EIS)

- Cocircng nghệ hạn chếEIScần phảiđượctiacutech hợp hoagraven toagravenvagraveokiếntruacuteccủadoanh nghiệphiện tại do đoacute noacutelagrave một thaacutech thứclớn đối vớithiết kế

- Hạn chế tổ chức cơ cấu tổ chứccoacute thể khocircng phugrave hợp

Sự hạn chế về tổ chức- Chương trigravenh nghị sự vagrave thời gian chệch EIS mocirc tả một phần việc thực hiện một

chương trigravenh nghị sự vagrave coacute thể dễ dagraveng đạt được sự tin cậy một caacutech chắc chắn- Đồng bộ hoacutea việc quản lyacute sự tin cậy đuacuteng luacutec đặc biệt baacuteo caacuteo EIS coacute thể phaacute

vỡ sự ổn định thiết lập caacutec chu trigravenh baacuteo caacuteo một caacutech tốt nhất- Sự bất ổn EIS phản ứng nhanh coacute thể gacircy ra việc taacutec động trở lại một caacutech

nhanh choacuteng dẫn đến sự thiếu ổn định trong tổ chức

Sự thất bại lagrave thay thế khocircng thể chấp nhận được- Một số yếu tố lagravem EIS thất bại

+ Thiếu sự hỗ trợ về mặt quản lyacute+ Vấn đề chiacutenh trị+ Thất bại của nhagrave phaacutet triển+ Lỗi về cocircng nghệ+ Giaacute cả+ Thời gian

66 Ra quyết định điều hagravenh trong tương lai vagrave EIS

- Coacute một vagravei điều kiện sẽ được hợp nhất cho việc chuyển đổi cocircng nghệ Trong đoacute một vagravei điều kiện coacute thể dễ dự đoaacuten Hai điều kiện magrave ta coacute thể thấy lagrave+ Phaacutet triển cocircng nghệ maacutey tiacutenh trong việc điều hagravenh sẽ tạo ra sự chuyển đổi được chấp nhận một caacutech dễ dagraveng hơn+ Mở rộng traacutech nhiệm điều hagravenh sẽ mở rộng nhu cầu thocircng tin

Tương lai của EIS- EIS thocircng minh Những tiến bộ trong cocircng nghệ AI sẽ được triển khai trong caacutec

EIS- EIS đa phương tiện Cơ sở dữ liệu đa phương tiện sẽ cho pheacutep tiacutech hợp văn bản

giọng noacutei vagrave higravenh ảnh trong tương lai- EIS thocircng tin Tương lai EIS sẽ mở rộng hơn trong việc sử dụng dữ liệu becircn

ngoagravei doanh nghiệp- EIS kết nối Giao tiếp với băng thocircng rộng cho pheacutep kết nối liecircn thocircng lớn hơn

Chương 7 HỆ CHUYEcircN GIA VAgrave TRIacute TUỆ NHAcircN TẠO

71 Caacutec khaacutei niệm

72 Triacute thocircng minh của triacute tuệ nhacircn tạo

73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia

74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia

75 Lợi iacutech vagrave hạn chế của hệ chuyecircn gia

71 Caacutec khaacutei niệm

Chuyecircn mocircn (Expertise) sự hiểu biết rộng trong 1 lĩnh vực hẹp

Hệ chuyecircn gia (Expert Systems)1 chương trigravenh maacutey tiacutenh sử dụng 1 tập caacutec luật dựa trecircn tri thức của con người để giải quyết caacutec vấn đề đogravei hogravei phải coacute sự chuyecircn mocircn

Một số hệ chuyecircn gia nổi tiếng

DENDRAL (Standford 1960s Edward Feigenbaum)

MYCIN (Standford1970s Edward Shortliffe)

PROSPECTOR (MIT 1979)

Triacute tuệ nhacircn tạo (Artificial Intelligence ndash AI)

Triacute tuệ nhacircn tạo một bộ phacircn của ngagravenh khoa học maacutey tiacutenh quan tacircm đến việc thiết kế caacutec hệ thống maacutey tiacutenh thocircng minh đoacute lagrave caacutec hệ thống đưa ra caacutec đặc điểm magrave từ đoacute chuacuteng ta liecircn hệ với sự thocircng minh trong hagravenh động của con người (Barr vagrave Feigenbaum 1981)

Mục điacutech của AI

Mục điacutech khoa học xaacutec định caacutec gợi yacute để giải thiacutech caacutec loại khaacutec nhau của triacute tuệ thực

Mục điacutech kỹ thuật giải quyết caacutec vấn đề trong thế giới thực

Triacute tuệ nhacircn tạo kế thừa nhiều yacute tưởng quan điểm kỹ thuật từ caacutec ngagravenh khoa học khaacutec

- Triết học

- Logic Toaacuten học

- Tiacutenh toaacuten

- Khoa học tacircm lyacute Khoa học nhận thức

- Sinh học Thần kinh học

- Tiến hoacutea

Caacutec lĩnh vực ứng dụng trong Triacute tuệ nhacircn tạo

Mạng nơ ron thần kinh (Neural Networks)

Tiacutenh toaacuten sự tiến hoacutea

(Evolutionary Computation)

Hệ chuyecircn gia (Expert Systems)

Kỹ thuật xử lyacute tiếng noacutei (Speech Processing)

Kỹ thuật xử lyacute ngocircn ngữ tự nhiecircn

(Natural Language Processing)

Lập kế hoạch (Planning)

Robot (Robotics)

Khoa học higravenh ảnh (Vision)

Caacutec kỹ thuật thocircng dụng dugraveng trong AI

Biểu diễn(Representation)

Học (Learning)

Caacutec luật (Rules)

Tigravem kiếm (Search)

72 Triacute thocircng minh của triacute tuệ nhacircn tạo

Con người suy diễn như thế nagraveo

Phacircn loại (Categorization)

Caacutec quy tắc cụ thể

Heuristics

Kinh nghiệm trước đoacute

Dự tiacutenh trước

Maacutey tiacutenh suy diễn như thế nagraveo

Lập luận dựa trecircn luật IF-THEN mocirc tả tri thức được matilde hoacutea dưới dạng caacutec luật

Caacutec khung (Frames) lagrave caacutec đại diện mocirc tả caacutec tigravenh huống giống nhau lagrave điển higravenh của một vagravei phacircn loại

Lập luận dựa trecircn caacutec trường hợp mocirc phỏng giải phaacutep trước đoacute cho một vấn đề hiện tại

Nhận dạng mẫu phaacutet hiện acircm thanh higravenh dạng hoặc caacutec chuỗi dagravei

Caacutec dạng khaacutec của Triacute tuệ nhacircn tạo

Học maacutey- mạng nơron vagrave giải thuật di truyền

Lập trigravenh tự động ndash lagrave những kỹ thuật tạo ra caacutec chương trigravenh để lagravem 1 nhiệm vụ riecircng biệt (cho pheacutep những người khocircng phải lagrave người lập trigravenh coacute thể lập trigravenh được)

Cuộc sống nhacircn tạo ndash nỗ lực để taacutei tạo caacutec hiện tượng sinh học trong caacutec hệ thống dựa trecircn maacutey tiacutenh

73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia(Expert Systems- ES)

Theo Jackson (1999) Một hệ chuyecircn gia lagrave một chương trigravenh maacutey tiacutenh mocirc tả vagrave suy diễn với tri thức của một vagravei lĩnh vực để giải quyết vấn đề hay đưa ra caacutec lời khuyecircn

Cấu truacutec cơ bản của ES được dựa theo cấu truacutec chung của DSS Sự khaacutec biệt chiacutenh giữa ES vagraveDSS lagrave hệ ES thu thập caacutec kiến thức từ những

chuyecircn gia trong lĩnh vực quan tacircmĐặc trưng của hệ chuyecircn gia Hiệu quả cao Thời gian trả lời thỏa đaacuteng Độ tin cậy cao Dễ hiểu

Giao diện người dugraveng trong ES

Thiết kế giao diện người dugraveng tập trung vagraveo caacutec yếu tố như dễ dagraveng sử dụngcoacute độ tin cậy cao giảm tải những khoacute khăn khi sử dụng

Thiết kế necircn coacute một số tương taacutec (đầu vagraveo kiểm soaacutet vagrave truy vấn)

Cấu tạo giao diện người dugraveng gồm coacute magraven higravenh cảm ứng bagraven phiacutem buacutet saacuteng lệnh thoại caacutec phiacutem chuyecircn dụng

Cơ sở tri thức (Knowledge Base)

Chứa đựng caacutec tri thức cụ thể miền thu được từ caacutec chuyecircn gia miền

Coacute thể chứa caacutec mocirc tả caacutec hagravenh vi giải quyết vấn đề caacutec ragraveng buộc caacutec heuristics

Thagravenh cocircng của một ES dựa trecircn tiacutenh đầy đủ vagrave tiacutenh chiacutenh xaacutec của cơ sở tri thức

Mocirc tơ suy diễn (Inference Engine)

Ở đacircy tri thức được đặt để sử dụng tạo ra caacutec giải phaacutep để giải quyết vấn đề

Mocirc tơ nagravey coacute khả năng thực hiện diễn dịch hoặc suy diễn dựa trecircn caacutec luật hay caacutec caacutec sự kiện

Đồng thời cũng coacute khả năng sử dụng caacutec suy diễn mờ hay khocircng chiacutenh xaacutec dựa trecircn xaacutec suất hay aacutenh xạ mẫu

Vograveng điều khiển suy diễn

1 Aacutenh xạ caacutec luật với caacutec sự kiện đatilde được cho

2 Chọn luật để thực hiện

3 Thực hiện luật bằng caacutech thecircm caacutec sự kiện được suy diễn ra vagraveo bộ nhớ lagravem việc

Chuỗi suy diễn (Chaining)

Suy diễn tiến (forward chaining) maacutey suy diễn bắt đầu từ dữ liệu ban đầu vagrave thực hiện việc suy luận để đưa ra caacutec kết luận cuối cugraveng

Suy diễn lugravei (backward chaining) maacutey suy diễn bắt đầu từ dữ liệu điacutech vagrave tigravem ra tri thức hỗ trợ cho dữ liệu điacutech đoacute

Viacute dụ suy diễn lugravei

R1 Nếu coacute A vagrave B thigrave suy ra coacute D

R2 Nếu coacute B thigrave suy ra coacute C

R3 Nếu coacute C vagrave D thigrave suy ra coacute E

Ta coacute E ta xem trong 3 luật R1 R2 R3 luật nagraveo coacute E ta thấy R3 chứa E đồng thời chứa C vagrave D Xeacutet tiếp trong 2 luật R1 R2 luật nagraveo chứa C vagrave D R2 chứa C R3 chứa D Từ đoacute ta coacute được caacutec tri thức hỗ trợ suy diễn vagrave kết luận lagrave nếu coacute A vagrave B thigrave sẽ coacute E Hay nếu A vagrave B đuacuteng thigrave sẽ coacute E

Viacute dụ suy diễn tiến

Giả sử coacute tập chứa 3 luật sau

R1 Nếu coacute A vagrave B thigrave suy ra coacute D

R2 Nếu coacute B thigrave suy ra coacute C

R3 Nếu coacute C vagrave D thigrave suy ra coacute E

Nếu ta coacute A vagrave B thigrave chuacuteng ta suy ra được D từ R1 vagrave suy ra C từ R2 Với D vagrave C đatilde được suy ra ở trecircn giờ chuacuteng ta suy ra được E từ R3

Viacute dụ thực tế

Giả sử muốn biết magraveu của một con vật nuocirci tecircn lagrave Fred biết rằng noacute kecircu ộp ộp vagrave ăn ruồi

Coacute tập 4 luật ban đầu như sau

R1 Nếu X kecircu ộp ộp vagrave ăn ruồi thigrave X lagrave con ếch

R2 Nếu X kecircu chiecircm chiếp vagrave biết hoacutet thigrave X lagrave con chim

R3 Nếu X lagrave con ếch thigrave X coacute magraveu xanh

R4 Nếu X lagrave con chim thigrave X coacute magraveu vagraveng

74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia

Expert system shells lagrave một tập caacutec goacutei phần mềm vagrave caacutec cocircng cụ dugraveng để phaacutet triển caacutec hệ chuyecircn gia

Những Expert system shells đầu tiecircn thường rất rườm ragrave Mặc dugrave vậy noacute vẫn giuacutep cho người sử dụng sẽ khocircng phải bắt đầu lại từ đầu khi xacircy dựng một hệ chuyecircn gia mới

Những shell hiện đại bao gồm hai mocirc-đun chiacutenh lagrave cocircng cụ xacircy dựng một tập quy tắc vagrave mocirc tơ suy diễn

Xacircy dựng hệ chuyecircn gia

Bước 1 xacircy dựng mocirc higravenh bagravei toaacuten xaacutec định vấn đề nhiệm vụ magrave hệ thống sẽ thực hiện Caacutec dạng bagravei toaacuten cần hệ chuyecircn gia

Bagravei toaacuten diễn giải (InterPretation)

Bagravei toaacuten dự baacuteo (Prediction)

Bagravei toaacuten chuẩn đoaacuten (Diagnose)

Bagravei toaacuten gỡ rối (Debugging)

Bagravei toaacuten thiết kế

Tương tự như một dự aacuten phần mềm để xacircy dựng một hệ chuyecircn gia cần phải coacute caacutec yếu tố về nhacircn lực tagravei nguyecircn vagrave thời gian Những yếu tố nagravey ảnh hưởng đến giaacute thah của một hệ chuyecircn giaTrong phần nagravey cacircu hỏi thường được đặt ra lagrave tại sao cần phải xacircy dựng một hệ chuyecircn giaTrước khi bắt đầu phải xaacute định rotilde bagravei toaacuten đạt ra lagrave jiAi lagrave chuyecircn giaAi lagrave người sử dụng

1 Diễn giải (InterPretation) Nghiecircn cứu 1 vấn đề -gt Dựa trecircn những biểu hiện thuộc tiacutenh đặc trưng becircn ngoagravei -gt Tư vấn

(hoặc đưa ra kết luận hay mocirc tả dễ hiểu từ tập dữ liệu thocirc)

2 Bagravei toaacuten dự baacuteo (Prediction) Coacute thể dự đoaacuten được hagravenh vi kết quả dựa trecircn caacutec hiện tượng -gt dự baacuteo

VD Dự baacuteo thời tiết động đấthellip

3 Bagravei toaacuten chẩn đoaacuten (Diagnoss) Xaacutec định caacutec lỗi caacutec bộ phận hỏng hoacutec của hệ thống dựa trecircn caacutec dữ liệu quan saacutet được

4 Bagravei toaacuten gỡ rối (Debugging) Mocirc tả caacutec phương phaacutep khắc phục hệ thống khi gặp sự cố

5 Bagravei toaacuten thiết kế Lựa chọn cấu higravenh caacutec đối tượng nhằm thoả matilden một số ragraveng buộc nagraveo đoacute

6 Giảng dạy Phần mềm dạy học coacute thể chuẩn đoaacuten vagrave sủa lỗi của học sinh trong quaacute trigravenh học tập

Để xaacutec định đuacuteng bagravei toaacuten magrave chuacuteng ta cần giải quyết thigrave phải trả lời đc một số cacircu hỏi

- cần hệ chuyecircn gia

Bước 2 thu thập tri thức lựa chọn cocircng cụ vagrave aacutep dụng

Trong bước thu thập tri thức vấn đề quan trọng lagrave lựa chọn chuyecircn gia những người magrave sẽ đoacuteng goacutep tri thức cho hệ thống Thocircng thường trong suốt quaacute trigravenh phaacutet triển thigrave chuyecircn gia được xem như một thagravenh viecircn của đội phaacutet triển

Hiện nay coacute rất nhiều cocircng cụ để xacircy dựng một hệ chuyecircn gia Phổ biến nhất lagrave JESS CLIPS vagrave OPS5

Bước 3 Thiết kế cơ sở tri thức thiết kế hệ thốngTri thức được biểu diễn trường minh trong cơ sở tri thức

Caacutec chuyecircn gia vagrave kỹ sư tri thức sẽ đối thoại với nhau bằng caacutec kỹ thuật đối thoại Suy diễn (SD) bảng Mocirc higravenh hoacutea SD quy nạp phacircn loại

Vấn đề bagraveo trigrave vagrave phaacutet triển

Caacutec hệ chuyecircn gia đogravei hỏi phải bảo trigrave vagrave phaacutet triển nhiều hơn so với caacutec hệ thống khaacutec Phải thường xuyecircn bổ sung tri thức mới vagrave thay đổi caacutec tri thức cũ để đổi mới hệ chuyecircn gia

Thu thập vagrave khắc phục lỗi do người sử dụng phaacutet hiện để kịp thời khắc phục những sai soacutet của hệ chuyecircn gia

75 Lợi iacutech vagrave hạn chế của caacutec hệ chuyecircn gia

Một số lợi iacutech chiacutenh

Thời gian trả lời hợp lyacute bằng hoặc nhanh hơn so với chuyecircn gia (người) để đi đến cugraveng một quyết định Hệ chuyecircn gia lagrave một hệ thống thời gian thực (real time system)

Khả năng trả lời với mức độ tinh thocircng bằng hoặc cao hơn so với chuyecircn gia (người) trong cugraveng lĩnh vực

Hệ chuyecircn gia giuacutep cho hiệu quả lagravem việc tăng bằng việc sử dụng tập caacutec luật một caacutech nhanh choacuteng magrave ko bị nhầm lẫn chuyecircn gia lagrave người coacute thể quecircn đi một số tri thức cơ sở lyacute luậ nhưng HCG thigrave ko

Quyết định của một người chuyecircn gia coacute thể bị thay đổi vagrave ko coacute tiacutenh thống nhất như quyết định của một hệ chuyecircn gia tạo ra

Hệ chuyecircn gia giuacutep cho người sử dụng coacute thể trau dồi sự hiểu biết trecircn lĩnh vuej cụ thể magrave noacute giải quyết hỗ trợ người ra quyết định coacute trigravenh độ như 1 chuyecircn gia trong quaacute trigravenh gia quyết định

Kiến thức của rất nhiều chuyecircn gia về một lĩnh vực nagraveo đoacute được đưa vagraveo hệ chuyecircn gia lagravem cho CSTT cuat HCG phong phuacute vagrave rộng lớn hơn rất nhiều

HCG giải thiacutech caacutec bước suy luận một caacutech dễ hiểu nhất quaacuten luacutec nagraveo cũng coacute thể sử dụng ko như chuyecircn gia con người

Hạn chế của caacutec hệ chuyecircn gia

Nhược điểm lớn nhất của hệ chuyecircn gia lagrave những yacute kiến chuyecircn mocircn thường rất khoacute matilde hoacutea vagrave giải neacuten

Hệ chuyecircn gia khocircng coacute khả năng tự học tự cập nhật kiến thức mới như caacutec chuyecircn gia magrave cần phải được matilde hoacutea lại khi noacute được cập nhật

Hệ chuyecircn gia khocircng thể nhận ra được vấn đề khocircng nằm trong miền kiến thức của hệ thống

Chương 8 Tri thức vagrave tiếp nhận

1 Bao gồm caacutec vấn đề

Dữ liệu thực tế đo lường hoặc quan saacutet coacute hoặc khocircng coacute bối cảnh

Thocircng tin dữ liệu được tổng hợp một caacutech hữu iacutech để giải quyết những khoacute khăn trong việc đưa ra quyết định

Tri thức bao gồm caacutec ứng dụng quy tắc thocircng tin hướng dẫn của người ra quyết định

2 Những caacutei nhigraven về tri thức

Đại diện lagravem thế nagraveo để diễn tả tri thức viacute dụ như một quyển saacutech khocircng phải lagrave tri thức nhưng noacute lại lagrave một đại diện của tri thức

Sản xuất tri thức lagrave một tập hơp của hagraveng tồn kho coacute thể được sản xuất cũng như mua lại

Tri thức lagrave 1 trong 6 trạng thaacutei của hệ thống

1Dữ liệu 2Thocircng tin 3Cấu truacutec thocircng tin 4Sự thấu hiểu 5Yacute kiến 6 Quyết định

3 Caacutec loại tri thức Phổ biến mocirc tả dữ liệu thocircng tin thủ tục mọi thứ lagravem như thế nagraveo lập luận chiacutenh saacutech hoặc caacutec quy tắc

4 Thu thập Tri thức hệ chuyecircn gia Hầu hết caacutec phương phaacutep đều bắt đầu với mocirc higravenh của caacutec taacutec vụ trong đoacute

hệ chuyecircn gia được xacircy dựng Trong đoacute mocirc tả về caacutec lĩnh vực được tạo ra Caacutec kỹ sư sử dụng caacutec mocirc higravenh giả thuyết vagrave nhận thức về quaacute trigravenh phacircn

tiacutech để gợi ra caacutech giải quyết vấn đề về tri thức từ caacutec chuyecircn gia

5 Caacutec chiều của thu thập tri thức KE- driven caacutec kỹ sư trao đổi trực tiếp với caacutec chuyecircn gia Expert-driven Caacutec chuyecircn gia trực tiếp đưa chuyecircn mocircn của họ vagraveo hệ

thống maacutey tiacutenh Machine-driven Sử dụng caacutec cocircng cụ suy luận để triacutech xuất tri thức từ một

tập caacutec viacute dụ

6 Kỹ thuật thu thập tri thức Trao đổi gồm 2 loại cơ bản lagrave coacute cấu truacutec(coacute kịch bản) vagrave khocircng coacute cấu

truacutec( đối thoại trực tiếp) Giao thức phacircn tiacutech bằng lời Khi caacutec chuyecircn gia thực hiện một cocircng việc

của họ thigrave một bản ghi về cocircng việc đoacute được thực hiện Caacutec kỹ sư sẽ xacircy dựng mocirc higravenh cho những gigrave được ghi lại trong bản ghi

Phương phaacutep sagraveng lọc caacutec chuyecircn gia so saacutenh caacutec nhoacutem liecircn tiếp trong ba đối tượng vagrave cho biết tại sao nhoacutem thứ hai lại khaacutec nhoacutem thứ ba

7 Thu thập tri thức từ nhiều nguồn Thu thập tri thức từ nhiều nguồn lagrave cần thiết để coacute được đầy đủ caacutec tri thức

cho một vấn đề quan điểm yacute kiến traacutei ngược nhau thường phaacutet sinh Phương phaacutep đồng thuận sẽ giuacutep giải quyết được vấn đề macircu thuẫn Kỹ thuật phacircn tiacutech Meta lagrave kỹ thuật được aacutep dụng trong caacutec trường hợp

khaacutec Caacutech tiếp cận bằng định lượng đogravei hỏi caacutec kỹ sư cần cacircn nhắc yếu tố đầu vagraveo của caacutec chuyecircn gia khaacutec nhau

8 Xaacutec nhận hợp lệ vagrave kiểm tra tri thức Một khi thu thập tri thức noacute phải được đaacutenh giaacute về khả năng sử dụng vagrave độ

chiacutenh xaacutec Hai vấn đề cụ thể lagrave hiệu lực của những kiến thức vagrave kiểm tra việc xacircy dựng cơ sở của tri thức

Cần xaacutec nhận xem liệu hệ thống coacute thể hoạt động ở mức độ tối thiểu khocircng

Xaacutec minh liecircn quan đến việc so saacutenh từng chi tiết kỹ thuật của hệ thống những gigrave đatilde được thực hiện cuối cugraveng

9 Một số caacutec biện phaacutep xaacutec nhận Độ chiacutenh xaacutec Khả năng thiacutech nghi Mức độ đầy đủ Bề rộng Độ sacircu Hiệu lực Tổng quan Chiacutenh xaacutec Hiện thực Độ tin cậy Tiacutenh hữu dụng Mức độ

Chương 9 Học maacutey

1 Logic mờ vagrave ngocircn ngữ mờ(Fuzzy Logic and Linguistic Ambiguity)

Ngocircn ngữ tự nhiecircn gồm những khaacutei niệm mơ hồ vagrave khocircng chiacutenh xaacutectruyền tải ngữ nghĩa thocircng qua tiacutenh xấp xỉkhocircng rotilde ragraveng

Những xấp xỉ nagravey giuacutep con người coacute thể truyền tải hết được yacute nghĩa nhưng maacutey thigrave khocircng hiểu

Lagravem sao biểu diễn caacutec tri thức sử dụng caacutec khaacutei niệm khocircng rotilde ragraveng(mờ) hoặc khocircng chiacutenh xaacutec

2 Khaacutei niệm cơ bản của logic mờ tập mờ lagrave những tập hợp khocircng coacute một giới hạn rotilde Mỗi phần tử của noacute chỉ

chứa một mức độ hagravem liecircn thuộc của từng phần tử Vigrave vậy tập mờ khocircng giống như tập cổ điển Tập mờ coacute thể kết hợp với nhau qua những luật mờ magrave đặc trưng cho những hagravenh động trạng thaacutei vagrave thuộc tiacutenh của logic mờ được tận dụng khi thực hiện một bộ điều khiển mờ

Logic mờ dựa trecircn yacute tưởng mỗi phần tử thuộc vagraveo một tập hợp ở một mức độ nagraveo đấy

Locircgic mờ cho pheacutep độ liecircn thuộc (microA )coacute giaacute trị trong khoảng (01) Locircgic mờ coacute thể được coi lagrave mặt ứng dụng của lyacute thuyết tập mờ để xử lyacute caacutec

giaacute trị trong thế giới thực cho caacutec bagravei toaacuten phức tạp

3 So saacutenh tiacutenh đuacuteng đắn logic mờ vagrave xaacutec suất Xaacutec suất thigrave đề cập đến khả năng xảy ra một biến cố hay một điều gigrave đoacute Logic mờ đề cập đến cấp độ magrave đặc tiacutenh ở hiện tại

o viacute dụ1 người coacute chiều cao 6 feet thigrave coacute cấp độ lagrave 05 về chiều cao

4 Ưu điểm của logic mờ Caacutech tiếp cận rất tự nhiecircnkhocircng phức tạp Coacute thể mocirc higravenh hoacutea caacutec hagravem phi tuyến tugravey yacute phức tạp

Coacute thể tận dụng được kinh nghiệm từ những chuyecircn gia hagraveng đầu trong mọi lĩnh vực

Logic mờ được xacircy dựng dựa trecircn ngocircn ngữ tự nhiecircnNền tảng của logic mờ lagrave dựa trecircn cơ sở giao tiếp của con người

5 Nhược điểm của logic mờ Trong 1 hệ thống phức tạpsử dụng logic mờ coacute thể trở thagravenh trở ngại cho

việc xaacutec thực độ tin cậy của hệ thống Cơ chế lập luận mờ khocircng thể học hỏi từ những lỗi sai

6 Mạng noron nhacircn tạo(ANN) Mạng noron nhacircn tạo lagrave một mocirc phỏng xử lyacute thocircng tinđược nghiecircn cứu ra

từ hệ thống thần kinh của sinh vậtgiống như bộ natildeo để xử lyacute thocircng tin ANNs lagrave chương trigravenh dựa trecircn maacutey tiacutenh đơn giản coacute chức năng lagrave một mocirc

higravenh bagravei toaacuten khocircng gian dựa trecircn thử nghiệm vagrave baacuteo lỗi

7 Học từ kinh nghiệm Tiến trigravenh Một mẫu dữ liệu được biểu diễn như một mạng lưới noronANN ldquodự

đoaacutenrdquo 1 đầu radự đoaacuten được so saacutenh với giaacute trị thực tế hoặc giaacute trị chiacutenh xaacutecNếu đoaacuten được chiacutenh xaacutec thigrave khocircng coacute hagravenh động nagraveo được thực hiện

Nếu dự đoaacuten sai ANN kiểm tra lại vagrave xaacutec định lại thocircng số để điều chỉnh Một mẫu dữ liệu khaacutec được biểu diễn vagrave quaacute trigravenh nagravey được lặp lại

8 Nguyecircn tắc cơ bản của cocircng nghệ nơron Caacutec yếu tố xử lyacute cơ bản trong hệ thống thần kinh của con người lagrave tế bagraveo

thần kinhMạng lưới của tế bagraveo nagravey lagrave liecircn kết với nhau nhận được thocircng tin từ caacutec cảm biến trong mắt taihellip

Thocircng tin nhận được bởi tế bagraveo thần kinh hoặc lagrave sẽ kiacutech thiacutech noacute(sẽ được chuyển qua 1 thocircng điệp dọc theo mạng lưới) hoặc lagrave sẽ ngăn cản noacute(ngăn cản dograveng thocircng tin)

Độ nhạy coacute thể thay đổi qua thời gian hoặc sau khi coacute được kinh nghiệm

9 Cấu truacutec mạng Một ANN gồm 3 lớp cơ bản

Lớp đầu vagraveo nhận dữ liệu Lớp becircn trong hoặc lagrave lớp ẩn xử lyacute dữ liệu Lớp đầu ra chuyển tiếp kết quả cuối cugraveng của mạng

10Mạng nơ ron Thường coacute nhiều đầu vagraveo mỗi đầu vagraveo với mức ảnh hưởng vagrave tầm quan

trọng riecircng của noacute Một đầu vagraveo quan trọng coacute thể được sử dụng để khuếch đại đầu ra caacutec hagravem trạng thaacutei tổng hợp caacutec trọng số của caacutec yếu tố

đầuvagraveo khaacutec nhauvagraveo một giaacute trị duy nhất Caacutec hagravem chuyển giao xử lyacute caacutec giaacute trị trạng thaacutei vagrave tạo đầu ra

11Huấn luyện mạng nơ ron Trong mocirc higravenh coacute giaacutem saacutetANN được đến so saacutenh dự đoaacuten của chiacutenh

noacute với thocircng tin phản hồi coacute chứa caacutec kết quả mong muốn ANN sẽ phải tigravem caacutech thay đổi caacutec tham số becircn trong củamigravenh (caacutec trọng số vagrave caacutec ngưỡng) để tạo necircn một aacutenh xạ coacute khả năng aacutenh xạcaacutec đầu vagraveo thagravenh caacutec đầu ra mong muốn Sự thay đổi nagravey được tiến hagravenh nhờ việc so saacutenh giữa đầu ra thực sự vagrave đầu ra mong muốn

Trong mocirc higravenh khocircng coacute giaacutem saacutetANN nhận được dữ liệu vagraveo nhưng khocircng phải coacute bất kỳ thocircng tin phản hồi về kết quả mong muốn

Phần lớn caacutec ứng dụng nằm trong vugraveng của caacutec bagravei toaacuten ước lượng như mocirc higravenh hoacuteathống kecirc neacuten lọc phacircn cụm

12Lợi iacutech Liecircn kết với mạng noron Traacutenh caacutech lập trigravenh tường minh Giảm nhu cầu của chuyecircn gia ANNs thigrave thiacutech nghi với caacutec yếu tố đầu vagraveo thay đổi Khocircng cần thiết cho cơ sở tri thức tinh chế ANNs coacute tiacutenh động vagrave cải thiện với việc sử dụng Coacute khả năng xử lyacute dữ liệu khocircng chiacutenh xaacutec hoặc khocircng đầy đủ Cho pheacutep tổng quaacutet hoacutea từ thocircng tin cụ thể Cho pheacutep thu thập cảm giaacutec thocircng thường vagraveo miền giải quyết vấn đề

13Hạn chế của việc liecircn kết với mạng noron ANNs khocircng thể giải thiacutech được suy luận Bản chất hộp đen thường khiến cho vấn đề traacutech nhiệm vagrave độ tin cậy phaacutet

sinh lagrave khoacute khăn Lặp đi lặp lại quaacute trigravenh huấn luyện rất tốn thời gian Nguồn lực caacutec nhagrave phacircn tiacutech vagrave thiết kế coacute tay nghề cao vẫn lagrave đaacuteng lo

ngại Cocircng nghệ ANN thuacutec đẩy hạn chế của phần cứng hiện tại ANN yecircu cầu phải coacute sự tin tưởng ở đầu ra

14Giới thiệu về thuật toaacuten di truyền Cũng như mạng lưới thần kinh caacutec thuật toaacuten di truyền được dựa trecircn lyacute

thuyết sinh học Thuật toaacuten di truyền tigravem thấy nguồn gốc của chuacuteng trong caacutec lyacute thuyết

tiến hoacutea của chọn lọc tự nhiecircn vagrave thiacutech ứng với biến đổi khiacute hậu Kết quả thuật toaacuten di truyền lagrave từ giao phối 2 caacute thể trong quần thế để tạo

ra con caacutei đocirci khi tốt hơn so với bậc cha mẹ của chuacuteng 15Caacutec thagravenh phần cơ bản của thuật toaacuten di truyền

Toaacuten tử chọn lọc Caacutec caacute thể tốt được chọn lọc để đưa vagraveo thế hệ sau Sự chọn lọc nagravey căn cứ vagraveo độ thiacutech nghi với mocirci trường của mỗi caacute thể

Toaacuten tử lai gheacutep (crossover) Hai caacute thể cha vagrave mẹ trao đổi caacutec gen với nhau để tạo ra caacute thể con

Toaacuten tử đột biến (mutation) Một caacute thể thay đổi một số gen để biến đổi thagravenh một caacute thể mớiTất cả caacutec toaacuten tử trecircn khi thực hiện đều mang tiacutenh ngẫu nhiecircn

16Quaacute trigravenh cơ bản của một thuật toaacuten di truyền Khởi tạo

Đaacutenh giaacute quần thể

Lựa chọn NST thiacutech hợp nhất vagrave loại bỏ NST yếu nhất

Quy trigravenh giao nhau vagrave cải thiện quần thể

đột biến tiến trigravenh để khaacutem phaacute ra NST mới

17Ưu nhược điểm của việc kết hợp với thuật toaacuten di truyền Kiacutech thước quần thể lagrave 1 yếu tố quan trọng trong tốc độ của việc tigravem

kiếmnhưng noacute tương đối dễ dagraveng để dự đoaacuten tốc độ nagravey Giao nhau hoặc đột biến lagrave khocircng necircn đc sử dụng quaacute thường xuyecircn Luocircn coacute được iacutet nhất 1 giải phaacutep hợp lyacute Necircn coacute thể aacutep dụng chuacuteng cho caacutec vấn đề magrave chuacuteng ta khocircng coacute hướng

về caacutech giải quyết Sức mạnh của thuật toaacuten xuất phaacutet từ khaacutei niệm đơn giảnkhocircng phải từ

một thủ tục thuật toaacuten phức tạp 18Tương lai của học maacutey

Mạng lưới thần kinh nhacircn tạo vượt quaacute năng lực của con người trong caacutec trường hợp bị cocirc lập

Về mặt lyacute thuyếtmột maacutey tiacutenh coacute thể xử lyacute dũ liệu nhanh hơn hagraveng triệu lần so với 1 con người

May mắn thay cho chuacuteng tacon người tốt hơn nhiều khi magrave coacute được dữ liệumaacutey tiacutenh khocircng coacute 1 số thứ như lagrave 5 giaacutec quan

CHƯƠNG 10 KHO DỮ LIỆU

1 Kho dữ liệu Kho dữ liệu lagrave tuyển tập caacutec cơ sở dữ liệu tiacutech hợp hướng chủ đề được

thiết kế để trợ giuacutep cho một hệ hỗ trợ quyết định

Theo John Ladley Cocircng nghệ kho dữ liệu lagrave tập caacutec phương phaacutep kỹ thuật vagrave caacutec cocircng cụ coacute thể kết hợp hỗ trợ nhau để cung cấp thocircng tin cho người sử dụng trecircn cơ sở tiacutech hợp từ nhiều nguồn dữ liệu nhiều mocirci trường khaacutec nhau

Kho dữ liệu thường rất lớn tới hagraveng trăm GB hay thậm chiacute hagraveng Terabyte

2 Kho dữ liệu vận hagravenh (ODS) Một kho dữ liệu vận hagravenh Aacutep dụng kỹ thuật kho dữ liệu vagraveo caacutec hệ xử

lyacute giao taacutec lưu trữ dữ liệu cho một ứng dụng đặc thugrave Noacute đưa vagraveo kho dữ liệu một dograveng caacutec dữ liệu thocirc được thiết kế

3 So saacutenh

Kho dữ liệu vận hagravenh Kho dữ liệu

Dữ liệu theo chủ đề Dữ liệu theo chủ đề

Dữ liệu tiacutech hợp Dữ liệu tiacutech hợp

Dữ liệu thay đổi Dữ liệu khocircng thay đổi

Dữ liệu được cập nhật khi thay đổi

Dữ liệu giữ nguyecircn

Chỉ coacute dữ liệu hiện tạiDữliệu hiện tại vagrave dữ liệu lịch sử

Chu kỳ lagravem tươi dữ liệu ngắn Chu kỳ lagravem tươi dữ liệu dagravei

Chỉ coacute dữ liệu chi tiết Dữ liệu chi tiết vagrave dữ liệu tổng kết

Dugraveng cho caacutec quyết định ngắn hạn

Dugraveng cho hoạch định dagravei hạn

4 Kho dữ liệu cục bộ (Data Mart - DM)

Kho dữ liệu cục bộ lagrave CSDL coacute những đặc điểm giống với kho dữ liệu nhưng với quy mocirc nhỏ hơn vagrave lưu trữ dữ liệu về một lĩnh vực một chuyecircn ngagravenh

Data mart phụ thuộc Chứa những dữ liệu được lấy từ DW vagrave những dữ liệu nagravey sẽ được triacutech lọc vagrave tinh chế tiacutech hợp lại ở mức cao hơn để phục vụ một chủ đề nhất định của Datamart

Data mart độc lập Khocircng giống như Datamart phụ thuộc Data mart độc lập được xacircy dựng trước DW vagrave dữ liệu được trực tiếp lấy từ caacutec nguồn khaacutec nhau

5 Siecircu dữ liệu Metadata lagrave dữ liệu để mocirc tả dữ liệu Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột

một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi Metadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu

6 Mocirci trường kho dữ liệu Hệ thống của tổ chức vagrave kho cung cấp dữ liệu để xacircy dựng kho dữ liệu Trong quaacute trigravenh chuyển dữ liệu từ caacutec nguồn khaacutec nhau dữ liệu coacute thể

được lagravem sạch hoặc chuyển đổi vagrave vigrave thế DW được xem như lagrave một chuẩn cho việc lưu trữ

Đồng thời siecircu dữ liệu được ghi lại Cuối cugraveng DW hoặc siecircu thị coacute thể được sử dụng để tạo ra một kho dữ

liệu ldquocaacute nhacircnrdquo 7 Caacutec đặc điểm của kho dữ liệu

Đặc điểm Mocirc tả

Hướng chủ đề - DL tổ chức theo caacutech thức người dugraveng tham chiếu

Tiacutech hợp - Dữ liệu ldquosạchrdquo loại bỏ tiacutenh thiếu nhất quaacuten

Khocircng thay đổi - DL ldquochỉ đọcrdquo người dugraveng khocircng thay đổi được

Chuỗi thời gian - DL lagrave chuỗi thời gian khocircng phải lagrave trạng thaacutei hiện tại

Được tổng kết - DL vận hagravenhthao taacutec khi cần thiết

được kết hợp lại thagravenh dạng coacute thể dugraveng được cho quyết định

Kiacutech cỡ lớn hơn - Lưu giữ theo chuỗi thời gian tức lagrave giữ lại nhiều DL

Khocircng được chuẩn hoacutea - Coacute thể dư thừa DLSiecircu dữ liệu - Dữ liệu của dữ liệu được lưu trữNguồn dữ liệu - DL vận hagravenh (caacutec hệ sẵn coacute) cugraveng

với caacutec nguồn ngoagravei 8 Kho dữ liệu hướng chủ đề

Hướng chủ để coacute nghĩa lagrave kho dữ liệu được tổ chức xung quanh caacutec chủ đề chiacutenh như khaacutech hagraveng sản phẩm sản xuất Tập trung vagraveo việc mocirc higravenh hoacutea vagrave phacircn tiacutech dữ liệu cho caacutec nhagrave ra quyết định magrave khocircng tập trung vagraveo caacutec xử lyacute thocircng thường Cung cấp cho người dugraveng một khung nhigraven toagraven vẹn đơn giản vagrave đầy đủ về caacutec sự kiện quanh caacutec chủ đề

9 Dữ liệu trong DW được tiacutech hợp Dữ liệu trong kho dữ liệu được xacircy dựng bằng caacutech tổng hợp dữ liệu từ

nhiều nguồn khaacutec nhau vagrave caacutec nguồn coacute tổ chức khaacutec nhau Cơ sở dữ liệu caacutec file excel caacutec flat file hoặc caacutec raw file Khi đưa vagraveo kho dữ liệu caacutec dữ liệu được lagravem sạch vagrave tiacutech hợp dữ liệu nhằm đảm bảo tiacutenh nhất quaacuten của dữ liệu

10Kiến truacutec kho dữ liệu Tầng cơ sở dữ liệu hoạt động Tầng truy xuất thocircng tin Tầng truy xuất dữ liệu Tầng siecircu dữ liệu Tầng quản lyacute tiến trigravenh Tầng thocircng điệp của ứng dụng Tầng vật liacute của kho dữ liệu Tầng trigravenh diễn dữ liệu

11Higravenh trạng kho dữ liệu Kho dữ liệu ảo - người dugraveng cuối coacute thể truy cập trực tiếp đến kho dữ liệu

sử dụng caacutec cocircng cụ cho pheacutep ở tầng truy xuất dữ liệu Kho dữ liệu trung tacircm-1 cơ sở dữ liệu vật lyacute chứa tất cả dữ liệu cho một

vugraveng chuyecircn dụng nagraveo đoacute

Kho dữ liệu phacircn taacuten- Thagravenh phần được phacircn taacuten qua nhiều hệ cơ sở dữ liệu vật lyacute

12METADATA- Siecircu dữ liệu Định nghĩa Siecircu dữ liệu lagrave dữ liệu về dữ liệu Lagrave 1 lưu trữ dugraveng để

Miecircu tả kho dữ liệu tổng thể Nhận dạng kiểu kho dữ liệu Quản liacute quaacute trigravenh tiacutech hợp dữ liệu Quản liacute quaacute trigravenh cập nhật kho dữ liệu Quản liacute bảo mật

Lagrave chigravea khoacutea quyết định sự thagravenh cocircng của kho dữ liệu luocircn được thay đổi vagrave cập nhật theo sự phaacutet triển của kho dữ liệu

Dugraveng để quản liacute điều khiển kho dữ liệu Sự ra đời của kho dữ liệu như 1 cấu truacutec hỗ trợ ra quyết định siecircu dữ liệu

được xem như nguồn tagravei nguyecircn dữ liệu Siecircu dữ liệu lagrave trừu tượng Chuacuteng lagrave dữ liệu bậc cao cung cấp mocirc tả ngắn

gọn caacutec dữ liệu bậc thấp hơn 13Hoạt động của Siecircu dữ liệu

Siecircu dữ liệu rất cần thiết trong việc chuyển hoacutea thocircng tin trở thagravenh tri thức Lagrave chigravea khoacutea giuacutep chuacuteng ta xử lyacute được dữ liệu thocirc Viacute dụ một dograveng dữ liệu baacuten hagraveng 1023 K596 11121 agraveNoacute sẽ khocircng coacute nghĩa gigrave cho đến khi chuacuteng ta đưa vagraveo siecircu dữ liệu (thư

mục chứa dữ liệu) agrave cửa hagraveng 1023 sản phẩm K596 vagrave số tiền baacuten được lagrave 11121 đocirc la

14Sự cần thiết phải nhất quaacuten trong kho dữ liệu Kho dữ liệu được xacircy dựng cho lợi iacutech của những nhagrave phacircn tiacutech kinh

doanh caacutec nhagrave quản trị cho tất cả caacutec khu vực chức năng Trong cơ sở dữ liệu riecircng caacutec khu vực khaacutec nhau coacute thể định nghĩa vagrave lưu

trữ dữ liệu thocircng qua phiecircn bản của chiacutenh noacute Khi dữ liệu được lấy từ những vugraveng khaacutec nhau đoacute vagrave được đặt vagraveo kho dữ

liệu Việc chuyển đổi vagrave lagravem sạch caacutec tiến trigravenh sẽ đảm bảo noacute lagrave duy nhất được tiacutech hợp tại một mức của tổ chức

15Ragrave soaacutet lại dữ liệu ndash Thực thi siecircu dữ liệu

Bất kể cấu truacutec tự nhiecircn của 1 cacircu truy vấn thế nagraveo thigrave caacutec thagravenh phần của siecircu dữ liệu rất quan trọng đối với người ra quyết định

Bảng thuộc tiacutenh khoacutea được lưu trữ bởi kho dữ liệu Tập hợp dữ liệu được lấy từ đacircu Những chuyển đổi nagraveo được thực thi với việc lagravem sạch

16Siecircu dữ liệu lagrave gigrave Metadata - lagrave thocircng tin mocirc tả nội dung của cơ sở dữ liệu (CSDL) Metadata baacuteo cho người dugraveng biết thời gian cập nhật sau cugraveng của dữ liệu

định dạng vagrave mục điacutech sử dụng của noacute Những thocircng tin nagravey coacute thể hướng dẫn người dugraveng duyệt qua CSDL vagrave

giuacutep họ hiểu được yacute nghĩa vagrave ngữ cảnh của dữ liệu Trong CSDL metadata lagrave caacutec dạng biểu diễn khaacutec nhau của caacutec đối tượng

trong CSDL Trong CSDL quan hệ metadata lagrave caacutec định nghĩa của bảng cột CSDL

view vagrave nhiều đối tượng khaacutec Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột

một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi -gtMetadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu

Bảng chuyển đổi Ghi lại những chuyển đổi đatilde được thực hiện

Lịch sử thực thi Ghi lại những dữ liệu đatilde được

phacircn tiacutech

Higravenh thaacutei kết nốiGhi lại những dữ liệu được kết nối vagrave tần suất

17Aacutenh xạ thocircng thường của siecircu dữ liệu Bản ghi aacutenh xạ chuyển đổi bao gồm

Định danh của nguồn gốc Chuyển đổi thuộc tiacutenh Chuyển đổi thuộc tiacutenh vật lyacute Matilde hoacutea tham chiếu bảng chuyển đổi Đổi tecircn Đổi khoacutea Gaacuten giaacute trị cho thuộc tiacutenh mặc định Chọn logic cho caacutec nguồn nhiều giaacute trị Đổi thuật toaacuten

18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để

phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai

lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave

tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec

Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm

Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo

19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua

caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau

SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được

Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra

một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức

Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ

Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ

Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech

CHƯƠNG 11 KHAI PHAacute DỮ LIỆU

1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn

ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993

Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng

2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd

1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều

2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP

3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn

4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng

5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server

6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo

7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động

8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời

9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều

10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện

11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech

12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP

3 Xử lyacute phacircn tiacutech trực tuyến OLAP

MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave

dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu

ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave

thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu

HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave

ROLAP4 Khai phaacute dữ liệu

Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh

khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn

Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan

5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp

6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại

Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp

Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec

Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt

Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra

Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh

vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho

Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec

Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm

Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục

Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng

gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp

Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn

Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec

Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper

Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2

Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25

Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước

Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng

Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện

trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp

Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute

độ hỗ trợ ge ngưỡng minsup

độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan

Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn

Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết

Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu

MOLAP ROLAP HOLAP

Lưu trữ dữ liệu cơ sở

Khối Bảng quan hệ Bảng quan hệ

Lưu trữ thocircng tin tổng hợp

Khối Bảng quan hệ Khối

Hiệu suất thực hiện truy vấn

Nhanh nhất Chậm nhất Nhanh

Tiecircu thụ khocircng gian lưu trữ

Nhiều Thấp Trung bigravenh

Chi phiacute bảo trigrave Cao Thấp Trung bigravenh

Page 33: De cuong(1-11)

Những thocircng tin điều hagravenh cần thiết- Quản lyacute xaacuteo trộn coacute thể yecircu cầu sự chuacute yacute xung quanh đồng hồ

- Hoạt động kinh doanh yecircu cầu điều hagravenh để dự đoaacuten những thay đổi trong mocirci trường

- Nhiệm vụ phacircn bổ tagravei nguyecircn yecircu cầu lựa chọn người quản lyacute vagrave caacutec nguồn lực hạn chế được triển khai

- Đagravem phaacuten yecircu cầu cập nhật thocircng tin từng phuacutet để coacute thể xacircy dựng được sự đồng thuận

Caacutec loại thocircng tin điều hagravenh- Hệ thống kế toaacuten coacute liecircn quan đến việc tiacutenh toaacuten thu nhập hoạt động cho caacutec lĩnh

vực cụ thể lagrave quan trọng hơn so với caacutec hệ thống kế toaacuten truyền thocircng- Thocircng tin về thị trường khaacutech hagraveng cung cấp giaacute trị trong việc quyết định chiến

lược- Caacutec thocircng tin cần thiết thường được truyền đi trecircn một số hệ thống maacutey tiacutenh vagrave

nằm trong toagraven tổ chức- Caacutec thocircng tin được sử dụng thường lagrave ngắn hạn vagrave dễ thay đổi

Phương thức để xaacutec định thocircng tin cần thiết

Rockart xaacutec định được năm phương thức cơ bản để xaacutec định thocircng tin cần thiết

- Phương thức dựa trecircn kết quả- Phương thức rỗng- Phương thức chỉ số khoacutea- Phương thức tổng hợp nghiecircn cứu- Phương thức dựa vagraveo nhacircn tố then chốt dẫn đến thagravenh cocircng

64 Thagravenh phần EIS

- Sản phẩm EIS đầu tiecircn được phaacutet triển để sử dụng trecircn maacutey tiacutenh cấu higravenh cao nhưng caacutec sản phẩm hiện nay nhằm mục tiecircu lagrave nền tảng ClientServer

- Những nền tảng linh hoạt hơn coacute thể thiacutech ứng với thay đổi trong tổ chức vagrave cocircng nghệ

- Sử dụng dữ liệu thời gian thực dẫn đến quyết định nhanh hơn nhiều thocircng tin hơn

Thagravenh phần phần cứng- Một EIS khocircng đogravei hỏi coacute phần cứng cụ thể hoặc duy nhất nagraveo- Chigravea khoacutea của vấn đề lagrave để đảm bảo rằng caacutec thagravenh phần của EIS tối ưu hoacutea vagrave

phugrave hợp với tagravei nguyecircn maacutey tiacutenh của tổ chức- Hệ thống nagravey phải được cấu higravenh để caacutec nguồn tagravei nguyecircn phugrave hợp với những

người điều hagravenh chuacuteng

Thagravenh phần phần mềm- Traacutei ngược với phần cứng phần mềm thường được chuyecircn mocircn hoacutea cao cho caacutec

bagravei toaacuten về miền- Sự chuyecircn mocircn hoacutea nagravey thường đạt được bằng caacutech sử dụng thagravenh phần off-the-

shelf cho toagraven bộ EIS vagrave caacutec mocirc-đun tugravey chỉnh để đaacutep ứng nhu cầu cụ thể- Lotus Notes lagrave một viacute dụ điển higravenh Noacute coacute thể được sử dụng một migravenh hoặc coacute

thể phục vụ becircn thứ ba mocirc-đun plug-in

Cocircng nghệ EIS hiện nay

Dobrzeniecki đề xuấtphacircn loạitừng cấptheo bachức năng- Loại 1 sản phẩm bao gồmmột bộ đầy đủcaacutec ứng dụngtừ mộtnhagrave cung cấp- Loại 2 sản phẩm đượcthựchiệnở phần đầu củacaacutecsản phẩmDSS đượcphaacutet triển

bởicugravengmộtnhagrave cung cấp- Loại 3 sản phẩmkết hợp với nhautheo bất kỳ số lượngthuộc sở hữu củacocircng ty

65 Xacircy dựng EIS

- Xacircy dựngmộtEISgiống nhưxacircydựngmột số hệ thống khaacutec củamocirc higravenh hệ thống thocircng tin

- Việcphaacutet triểncấu truacutecnecircn được theo dotildeitừ quaacute trigravenh thiết kế đến quaacute trigravenhthực hiện

- Tuy nhiecircn một dự aacuten phaacutet triển EIScoacute xu hướnglagrave thống nhấtvagraveyecircu cầu hỗ trợ caacutec nhagrave quản lyacute latildenh đạo

- Xacircy dựng một EIScoacute thểphaacutet hiện ra đượccaacutectigravenh huống khoacute khănmagravemột nhagrave phaacutet triển chưabao giờ gặp phải

Mocirc higravenh EIS

Khung phaacutet triển một EIS

- Watson et al đề nghị xacircy dựngkhung với ba thagravenh phần+ Caacutech tiếp cận tập trung vagraveo yếu tốcon người vagrave dữ liệu coacute liecircn quan đến EIS+ Quaacute trigravenh phaacutet triển cần sự linh hoạt vagrave tương taacutec+ Người sử dụng - hệ thống hộp thoại bao gồm một ngocircn ngữ hagravenh động để xử lyacute caacutec lệnh

Lợi iacutech của EIS- Dễ duy trigrave caacutec mục tiecircu coacute tổ chức- Dễ truy xuất thocircng tin- Cho pheacutep người sử dụng nacircng cao hiệu suất hơn

- Tăng chất lượng ra quyết định- Cung cấp sự cải tiến cạnh tranh- Tiết kiệm thời gian của người sử dụng- Tăng khả năng vagrave chất lượng giao tiếp- Cung cấp khả năng điều khiển tốt hơn trong tổ chức- Cho pheacutep tham gia caacutec vấn đề vagrave caacutec cơ hội- Cho pheacutep hoạch định- Cho pheacutep tigravem kiếm nguyecircn nhacircn của một vấn đề- Thảo matilden caacutec yecircu cầu của người điều hagravenh

Hạn chế của EIS vagrave 1 số sai lầm cần traacutenh

- Chi phiacute một cuộc khảo saacutetnăm1991 chothấychi phiacute phaacutet triểntrungbigravenh365000USDvớichi phiacute vận hagravenhhagraveng năm lagrave$200000 (EIS)

- Cocircng nghệ hạn chếEIScần phảiđượctiacutech hợp hoagraven toagravenvagraveokiếntruacuteccủadoanh nghiệphiện tại do đoacute noacutelagrave một thaacutech thứclớn đối vớithiết kế

- Hạn chế tổ chức cơ cấu tổ chứccoacute thể khocircng phugrave hợp

Sự hạn chế về tổ chức- Chương trigravenh nghị sự vagrave thời gian chệch EIS mocirc tả một phần việc thực hiện một

chương trigravenh nghị sự vagrave coacute thể dễ dagraveng đạt được sự tin cậy một caacutech chắc chắn- Đồng bộ hoacutea việc quản lyacute sự tin cậy đuacuteng luacutec đặc biệt baacuteo caacuteo EIS coacute thể phaacute

vỡ sự ổn định thiết lập caacutec chu trigravenh baacuteo caacuteo một caacutech tốt nhất- Sự bất ổn EIS phản ứng nhanh coacute thể gacircy ra việc taacutec động trở lại một caacutech

nhanh choacuteng dẫn đến sự thiếu ổn định trong tổ chức

Sự thất bại lagrave thay thế khocircng thể chấp nhận được- Một số yếu tố lagravem EIS thất bại

+ Thiếu sự hỗ trợ về mặt quản lyacute+ Vấn đề chiacutenh trị+ Thất bại của nhagrave phaacutet triển+ Lỗi về cocircng nghệ+ Giaacute cả+ Thời gian

66 Ra quyết định điều hagravenh trong tương lai vagrave EIS

- Coacute một vagravei điều kiện sẽ được hợp nhất cho việc chuyển đổi cocircng nghệ Trong đoacute một vagravei điều kiện coacute thể dễ dự đoaacuten Hai điều kiện magrave ta coacute thể thấy lagrave+ Phaacutet triển cocircng nghệ maacutey tiacutenh trong việc điều hagravenh sẽ tạo ra sự chuyển đổi được chấp nhận một caacutech dễ dagraveng hơn+ Mở rộng traacutech nhiệm điều hagravenh sẽ mở rộng nhu cầu thocircng tin

Tương lai của EIS- EIS thocircng minh Những tiến bộ trong cocircng nghệ AI sẽ được triển khai trong caacutec

EIS- EIS đa phương tiện Cơ sở dữ liệu đa phương tiện sẽ cho pheacutep tiacutech hợp văn bản

giọng noacutei vagrave higravenh ảnh trong tương lai- EIS thocircng tin Tương lai EIS sẽ mở rộng hơn trong việc sử dụng dữ liệu becircn

ngoagravei doanh nghiệp- EIS kết nối Giao tiếp với băng thocircng rộng cho pheacutep kết nối liecircn thocircng lớn hơn

Chương 7 HỆ CHUYEcircN GIA VAgrave TRIacute TUỆ NHAcircN TẠO

71 Caacutec khaacutei niệm

72 Triacute thocircng minh của triacute tuệ nhacircn tạo

73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia

74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia

75 Lợi iacutech vagrave hạn chế của hệ chuyecircn gia

71 Caacutec khaacutei niệm

Chuyecircn mocircn (Expertise) sự hiểu biết rộng trong 1 lĩnh vực hẹp

Hệ chuyecircn gia (Expert Systems)1 chương trigravenh maacutey tiacutenh sử dụng 1 tập caacutec luật dựa trecircn tri thức của con người để giải quyết caacutec vấn đề đogravei hogravei phải coacute sự chuyecircn mocircn

Một số hệ chuyecircn gia nổi tiếng

DENDRAL (Standford 1960s Edward Feigenbaum)

MYCIN (Standford1970s Edward Shortliffe)

PROSPECTOR (MIT 1979)

Triacute tuệ nhacircn tạo (Artificial Intelligence ndash AI)

Triacute tuệ nhacircn tạo một bộ phacircn của ngagravenh khoa học maacutey tiacutenh quan tacircm đến việc thiết kế caacutec hệ thống maacutey tiacutenh thocircng minh đoacute lagrave caacutec hệ thống đưa ra caacutec đặc điểm magrave từ đoacute chuacuteng ta liecircn hệ với sự thocircng minh trong hagravenh động của con người (Barr vagrave Feigenbaum 1981)

Mục điacutech của AI

Mục điacutech khoa học xaacutec định caacutec gợi yacute để giải thiacutech caacutec loại khaacutec nhau của triacute tuệ thực

Mục điacutech kỹ thuật giải quyết caacutec vấn đề trong thế giới thực

Triacute tuệ nhacircn tạo kế thừa nhiều yacute tưởng quan điểm kỹ thuật từ caacutec ngagravenh khoa học khaacutec

- Triết học

- Logic Toaacuten học

- Tiacutenh toaacuten

- Khoa học tacircm lyacute Khoa học nhận thức

- Sinh học Thần kinh học

- Tiến hoacutea

Caacutec lĩnh vực ứng dụng trong Triacute tuệ nhacircn tạo

Mạng nơ ron thần kinh (Neural Networks)

Tiacutenh toaacuten sự tiến hoacutea

(Evolutionary Computation)

Hệ chuyecircn gia (Expert Systems)

Kỹ thuật xử lyacute tiếng noacutei (Speech Processing)

Kỹ thuật xử lyacute ngocircn ngữ tự nhiecircn

(Natural Language Processing)

Lập kế hoạch (Planning)

Robot (Robotics)

Khoa học higravenh ảnh (Vision)

Caacutec kỹ thuật thocircng dụng dugraveng trong AI

Biểu diễn(Representation)

Học (Learning)

Caacutec luật (Rules)

Tigravem kiếm (Search)

72 Triacute thocircng minh của triacute tuệ nhacircn tạo

Con người suy diễn như thế nagraveo

Phacircn loại (Categorization)

Caacutec quy tắc cụ thể

Heuristics

Kinh nghiệm trước đoacute

Dự tiacutenh trước

Maacutey tiacutenh suy diễn như thế nagraveo

Lập luận dựa trecircn luật IF-THEN mocirc tả tri thức được matilde hoacutea dưới dạng caacutec luật

Caacutec khung (Frames) lagrave caacutec đại diện mocirc tả caacutec tigravenh huống giống nhau lagrave điển higravenh của một vagravei phacircn loại

Lập luận dựa trecircn caacutec trường hợp mocirc phỏng giải phaacutep trước đoacute cho một vấn đề hiện tại

Nhận dạng mẫu phaacutet hiện acircm thanh higravenh dạng hoặc caacutec chuỗi dagravei

Caacutec dạng khaacutec của Triacute tuệ nhacircn tạo

Học maacutey- mạng nơron vagrave giải thuật di truyền

Lập trigravenh tự động ndash lagrave những kỹ thuật tạo ra caacutec chương trigravenh để lagravem 1 nhiệm vụ riecircng biệt (cho pheacutep những người khocircng phải lagrave người lập trigravenh coacute thể lập trigravenh được)

Cuộc sống nhacircn tạo ndash nỗ lực để taacutei tạo caacutec hiện tượng sinh học trong caacutec hệ thống dựa trecircn maacutey tiacutenh

73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia(Expert Systems- ES)

Theo Jackson (1999) Một hệ chuyecircn gia lagrave một chương trigravenh maacutey tiacutenh mocirc tả vagrave suy diễn với tri thức của một vagravei lĩnh vực để giải quyết vấn đề hay đưa ra caacutec lời khuyecircn

Cấu truacutec cơ bản của ES được dựa theo cấu truacutec chung của DSS Sự khaacutec biệt chiacutenh giữa ES vagraveDSS lagrave hệ ES thu thập caacutec kiến thức từ những

chuyecircn gia trong lĩnh vực quan tacircmĐặc trưng của hệ chuyecircn gia Hiệu quả cao Thời gian trả lời thỏa đaacuteng Độ tin cậy cao Dễ hiểu

Giao diện người dugraveng trong ES

Thiết kế giao diện người dugraveng tập trung vagraveo caacutec yếu tố như dễ dagraveng sử dụngcoacute độ tin cậy cao giảm tải những khoacute khăn khi sử dụng

Thiết kế necircn coacute một số tương taacutec (đầu vagraveo kiểm soaacutet vagrave truy vấn)

Cấu tạo giao diện người dugraveng gồm coacute magraven higravenh cảm ứng bagraven phiacutem buacutet saacuteng lệnh thoại caacutec phiacutem chuyecircn dụng

Cơ sở tri thức (Knowledge Base)

Chứa đựng caacutec tri thức cụ thể miền thu được từ caacutec chuyecircn gia miền

Coacute thể chứa caacutec mocirc tả caacutec hagravenh vi giải quyết vấn đề caacutec ragraveng buộc caacutec heuristics

Thagravenh cocircng của một ES dựa trecircn tiacutenh đầy đủ vagrave tiacutenh chiacutenh xaacutec của cơ sở tri thức

Mocirc tơ suy diễn (Inference Engine)

Ở đacircy tri thức được đặt để sử dụng tạo ra caacutec giải phaacutep để giải quyết vấn đề

Mocirc tơ nagravey coacute khả năng thực hiện diễn dịch hoặc suy diễn dựa trecircn caacutec luật hay caacutec caacutec sự kiện

Đồng thời cũng coacute khả năng sử dụng caacutec suy diễn mờ hay khocircng chiacutenh xaacutec dựa trecircn xaacutec suất hay aacutenh xạ mẫu

Vograveng điều khiển suy diễn

1 Aacutenh xạ caacutec luật với caacutec sự kiện đatilde được cho

2 Chọn luật để thực hiện

3 Thực hiện luật bằng caacutech thecircm caacutec sự kiện được suy diễn ra vagraveo bộ nhớ lagravem việc

Chuỗi suy diễn (Chaining)

Suy diễn tiến (forward chaining) maacutey suy diễn bắt đầu từ dữ liệu ban đầu vagrave thực hiện việc suy luận để đưa ra caacutec kết luận cuối cugraveng

Suy diễn lugravei (backward chaining) maacutey suy diễn bắt đầu từ dữ liệu điacutech vagrave tigravem ra tri thức hỗ trợ cho dữ liệu điacutech đoacute

Viacute dụ suy diễn lugravei

R1 Nếu coacute A vagrave B thigrave suy ra coacute D

R2 Nếu coacute B thigrave suy ra coacute C

R3 Nếu coacute C vagrave D thigrave suy ra coacute E

Ta coacute E ta xem trong 3 luật R1 R2 R3 luật nagraveo coacute E ta thấy R3 chứa E đồng thời chứa C vagrave D Xeacutet tiếp trong 2 luật R1 R2 luật nagraveo chứa C vagrave D R2 chứa C R3 chứa D Từ đoacute ta coacute được caacutec tri thức hỗ trợ suy diễn vagrave kết luận lagrave nếu coacute A vagrave B thigrave sẽ coacute E Hay nếu A vagrave B đuacuteng thigrave sẽ coacute E

Viacute dụ suy diễn tiến

Giả sử coacute tập chứa 3 luật sau

R1 Nếu coacute A vagrave B thigrave suy ra coacute D

R2 Nếu coacute B thigrave suy ra coacute C

R3 Nếu coacute C vagrave D thigrave suy ra coacute E

Nếu ta coacute A vagrave B thigrave chuacuteng ta suy ra được D từ R1 vagrave suy ra C từ R2 Với D vagrave C đatilde được suy ra ở trecircn giờ chuacuteng ta suy ra được E từ R3

Viacute dụ thực tế

Giả sử muốn biết magraveu của một con vật nuocirci tecircn lagrave Fred biết rằng noacute kecircu ộp ộp vagrave ăn ruồi

Coacute tập 4 luật ban đầu như sau

R1 Nếu X kecircu ộp ộp vagrave ăn ruồi thigrave X lagrave con ếch

R2 Nếu X kecircu chiecircm chiếp vagrave biết hoacutet thigrave X lagrave con chim

R3 Nếu X lagrave con ếch thigrave X coacute magraveu xanh

R4 Nếu X lagrave con chim thigrave X coacute magraveu vagraveng

74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia

Expert system shells lagrave một tập caacutec goacutei phần mềm vagrave caacutec cocircng cụ dugraveng để phaacutet triển caacutec hệ chuyecircn gia

Những Expert system shells đầu tiecircn thường rất rườm ragrave Mặc dugrave vậy noacute vẫn giuacutep cho người sử dụng sẽ khocircng phải bắt đầu lại từ đầu khi xacircy dựng một hệ chuyecircn gia mới

Những shell hiện đại bao gồm hai mocirc-đun chiacutenh lagrave cocircng cụ xacircy dựng một tập quy tắc vagrave mocirc tơ suy diễn

Xacircy dựng hệ chuyecircn gia

Bước 1 xacircy dựng mocirc higravenh bagravei toaacuten xaacutec định vấn đề nhiệm vụ magrave hệ thống sẽ thực hiện Caacutec dạng bagravei toaacuten cần hệ chuyecircn gia

Bagravei toaacuten diễn giải (InterPretation)

Bagravei toaacuten dự baacuteo (Prediction)

Bagravei toaacuten chuẩn đoaacuten (Diagnose)

Bagravei toaacuten gỡ rối (Debugging)

Bagravei toaacuten thiết kế

Tương tự như một dự aacuten phần mềm để xacircy dựng một hệ chuyecircn gia cần phải coacute caacutec yếu tố về nhacircn lực tagravei nguyecircn vagrave thời gian Những yếu tố nagravey ảnh hưởng đến giaacute thah của một hệ chuyecircn giaTrong phần nagravey cacircu hỏi thường được đặt ra lagrave tại sao cần phải xacircy dựng một hệ chuyecircn giaTrước khi bắt đầu phải xaacute định rotilde bagravei toaacuten đạt ra lagrave jiAi lagrave chuyecircn giaAi lagrave người sử dụng

1 Diễn giải (InterPretation) Nghiecircn cứu 1 vấn đề -gt Dựa trecircn những biểu hiện thuộc tiacutenh đặc trưng becircn ngoagravei -gt Tư vấn

(hoặc đưa ra kết luận hay mocirc tả dễ hiểu từ tập dữ liệu thocirc)

2 Bagravei toaacuten dự baacuteo (Prediction) Coacute thể dự đoaacuten được hagravenh vi kết quả dựa trecircn caacutec hiện tượng -gt dự baacuteo

VD Dự baacuteo thời tiết động đấthellip

3 Bagravei toaacuten chẩn đoaacuten (Diagnoss) Xaacutec định caacutec lỗi caacutec bộ phận hỏng hoacutec của hệ thống dựa trecircn caacutec dữ liệu quan saacutet được

4 Bagravei toaacuten gỡ rối (Debugging) Mocirc tả caacutec phương phaacutep khắc phục hệ thống khi gặp sự cố

5 Bagravei toaacuten thiết kế Lựa chọn cấu higravenh caacutec đối tượng nhằm thoả matilden một số ragraveng buộc nagraveo đoacute

6 Giảng dạy Phần mềm dạy học coacute thể chuẩn đoaacuten vagrave sủa lỗi của học sinh trong quaacute trigravenh học tập

Để xaacutec định đuacuteng bagravei toaacuten magrave chuacuteng ta cần giải quyết thigrave phải trả lời đc một số cacircu hỏi

- cần hệ chuyecircn gia

Bước 2 thu thập tri thức lựa chọn cocircng cụ vagrave aacutep dụng

Trong bước thu thập tri thức vấn đề quan trọng lagrave lựa chọn chuyecircn gia những người magrave sẽ đoacuteng goacutep tri thức cho hệ thống Thocircng thường trong suốt quaacute trigravenh phaacutet triển thigrave chuyecircn gia được xem như một thagravenh viecircn của đội phaacutet triển

Hiện nay coacute rất nhiều cocircng cụ để xacircy dựng một hệ chuyecircn gia Phổ biến nhất lagrave JESS CLIPS vagrave OPS5

Bước 3 Thiết kế cơ sở tri thức thiết kế hệ thốngTri thức được biểu diễn trường minh trong cơ sở tri thức

Caacutec chuyecircn gia vagrave kỹ sư tri thức sẽ đối thoại với nhau bằng caacutec kỹ thuật đối thoại Suy diễn (SD) bảng Mocirc higravenh hoacutea SD quy nạp phacircn loại

Vấn đề bagraveo trigrave vagrave phaacutet triển

Caacutec hệ chuyecircn gia đogravei hỏi phải bảo trigrave vagrave phaacutet triển nhiều hơn so với caacutec hệ thống khaacutec Phải thường xuyecircn bổ sung tri thức mới vagrave thay đổi caacutec tri thức cũ để đổi mới hệ chuyecircn gia

Thu thập vagrave khắc phục lỗi do người sử dụng phaacutet hiện để kịp thời khắc phục những sai soacutet của hệ chuyecircn gia

75 Lợi iacutech vagrave hạn chế của caacutec hệ chuyecircn gia

Một số lợi iacutech chiacutenh

Thời gian trả lời hợp lyacute bằng hoặc nhanh hơn so với chuyecircn gia (người) để đi đến cugraveng một quyết định Hệ chuyecircn gia lagrave một hệ thống thời gian thực (real time system)

Khả năng trả lời với mức độ tinh thocircng bằng hoặc cao hơn so với chuyecircn gia (người) trong cugraveng lĩnh vực

Hệ chuyecircn gia giuacutep cho hiệu quả lagravem việc tăng bằng việc sử dụng tập caacutec luật một caacutech nhanh choacuteng magrave ko bị nhầm lẫn chuyecircn gia lagrave người coacute thể quecircn đi một số tri thức cơ sở lyacute luậ nhưng HCG thigrave ko

Quyết định của một người chuyecircn gia coacute thể bị thay đổi vagrave ko coacute tiacutenh thống nhất như quyết định của một hệ chuyecircn gia tạo ra

Hệ chuyecircn gia giuacutep cho người sử dụng coacute thể trau dồi sự hiểu biết trecircn lĩnh vuej cụ thể magrave noacute giải quyết hỗ trợ người ra quyết định coacute trigravenh độ như 1 chuyecircn gia trong quaacute trigravenh gia quyết định

Kiến thức của rất nhiều chuyecircn gia về một lĩnh vực nagraveo đoacute được đưa vagraveo hệ chuyecircn gia lagravem cho CSTT cuat HCG phong phuacute vagrave rộng lớn hơn rất nhiều

HCG giải thiacutech caacutec bước suy luận một caacutech dễ hiểu nhất quaacuten luacutec nagraveo cũng coacute thể sử dụng ko như chuyecircn gia con người

Hạn chế của caacutec hệ chuyecircn gia

Nhược điểm lớn nhất của hệ chuyecircn gia lagrave những yacute kiến chuyecircn mocircn thường rất khoacute matilde hoacutea vagrave giải neacuten

Hệ chuyecircn gia khocircng coacute khả năng tự học tự cập nhật kiến thức mới như caacutec chuyecircn gia magrave cần phải được matilde hoacutea lại khi noacute được cập nhật

Hệ chuyecircn gia khocircng thể nhận ra được vấn đề khocircng nằm trong miền kiến thức của hệ thống

Chương 8 Tri thức vagrave tiếp nhận

1 Bao gồm caacutec vấn đề

Dữ liệu thực tế đo lường hoặc quan saacutet coacute hoặc khocircng coacute bối cảnh

Thocircng tin dữ liệu được tổng hợp một caacutech hữu iacutech để giải quyết những khoacute khăn trong việc đưa ra quyết định

Tri thức bao gồm caacutec ứng dụng quy tắc thocircng tin hướng dẫn của người ra quyết định

2 Những caacutei nhigraven về tri thức

Đại diện lagravem thế nagraveo để diễn tả tri thức viacute dụ như một quyển saacutech khocircng phải lagrave tri thức nhưng noacute lại lagrave một đại diện của tri thức

Sản xuất tri thức lagrave một tập hơp của hagraveng tồn kho coacute thể được sản xuất cũng như mua lại

Tri thức lagrave 1 trong 6 trạng thaacutei của hệ thống

1Dữ liệu 2Thocircng tin 3Cấu truacutec thocircng tin 4Sự thấu hiểu 5Yacute kiến 6 Quyết định

3 Caacutec loại tri thức Phổ biến mocirc tả dữ liệu thocircng tin thủ tục mọi thứ lagravem như thế nagraveo lập luận chiacutenh saacutech hoặc caacutec quy tắc

4 Thu thập Tri thức hệ chuyecircn gia Hầu hết caacutec phương phaacutep đều bắt đầu với mocirc higravenh của caacutec taacutec vụ trong đoacute

hệ chuyecircn gia được xacircy dựng Trong đoacute mocirc tả về caacutec lĩnh vực được tạo ra Caacutec kỹ sư sử dụng caacutec mocirc higravenh giả thuyết vagrave nhận thức về quaacute trigravenh phacircn

tiacutech để gợi ra caacutech giải quyết vấn đề về tri thức từ caacutec chuyecircn gia

5 Caacutec chiều của thu thập tri thức KE- driven caacutec kỹ sư trao đổi trực tiếp với caacutec chuyecircn gia Expert-driven Caacutec chuyecircn gia trực tiếp đưa chuyecircn mocircn của họ vagraveo hệ

thống maacutey tiacutenh Machine-driven Sử dụng caacutec cocircng cụ suy luận để triacutech xuất tri thức từ một

tập caacutec viacute dụ

6 Kỹ thuật thu thập tri thức Trao đổi gồm 2 loại cơ bản lagrave coacute cấu truacutec(coacute kịch bản) vagrave khocircng coacute cấu

truacutec( đối thoại trực tiếp) Giao thức phacircn tiacutech bằng lời Khi caacutec chuyecircn gia thực hiện một cocircng việc

của họ thigrave một bản ghi về cocircng việc đoacute được thực hiện Caacutec kỹ sư sẽ xacircy dựng mocirc higravenh cho những gigrave được ghi lại trong bản ghi

Phương phaacutep sagraveng lọc caacutec chuyecircn gia so saacutenh caacutec nhoacutem liecircn tiếp trong ba đối tượng vagrave cho biết tại sao nhoacutem thứ hai lại khaacutec nhoacutem thứ ba

7 Thu thập tri thức từ nhiều nguồn Thu thập tri thức từ nhiều nguồn lagrave cần thiết để coacute được đầy đủ caacutec tri thức

cho một vấn đề quan điểm yacute kiến traacutei ngược nhau thường phaacutet sinh Phương phaacutep đồng thuận sẽ giuacutep giải quyết được vấn đề macircu thuẫn Kỹ thuật phacircn tiacutech Meta lagrave kỹ thuật được aacutep dụng trong caacutec trường hợp

khaacutec Caacutech tiếp cận bằng định lượng đogravei hỏi caacutec kỹ sư cần cacircn nhắc yếu tố đầu vagraveo của caacutec chuyecircn gia khaacutec nhau

8 Xaacutec nhận hợp lệ vagrave kiểm tra tri thức Một khi thu thập tri thức noacute phải được đaacutenh giaacute về khả năng sử dụng vagrave độ

chiacutenh xaacutec Hai vấn đề cụ thể lagrave hiệu lực của những kiến thức vagrave kiểm tra việc xacircy dựng cơ sở của tri thức

Cần xaacutec nhận xem liệu hệ thống coacute thể hoạt động ở mức độ tối thiểu khocircng

Xaacutec minh liecircn quan đến việc so saacutenh từng chi tiết kỹ thuật của hệ thống những gigrave đatilde được thực hiện cuối cugraveng

9 Một số caacutec biện phaacutep xaacutec nhận Độ chiacutenh xaacutec Khả năng thiacutech nghi Mức độ đầy đủ Bề rộng Độ sacircu Hiệu lực Tổng quan Chiacutenh xaacutec Hiện thực Độ tin cậy Tiacutenh hữu dụng Mức độ

Chương 9 Học maacutey

1 Logic mờ vagrave ngocircn ngữ mờ(Fuzzy Logic and Linguistic Ambiguity)

Ngocircn ngữ tự nhiecircn gồm những khaacutei niệm mơ hồ vagrave khocircng chiacutenh xaacutectruyền tải ngữ nghĩa thocircng qua tiacutenh xấp xỉkhocircng rotilde ragraveng

Những xấp xỉ nagravey giuacutep con người coacute thể truyền tải hết được yacute nghĩa nhưng maacutey thigrave khocircng hiểu

Lagravem sao biểu diễn caacutec tri thức sử dụng caacutec khaacutei niệm khocircng rotilde ragraveng(mờ) hoặc khocircng chiacutenh xaacutec

2 Khaacutei niệm cơ bản của logic mờ tập mờ lagrave những tập hợp khocircng coacute một giới hạn rotilde Mỗi phần tử của noacute chỉ

chứa một mức độ hagravem liecircn thuộc của từng phần tử Vigrave vậy tập mờ khocircng giống như tập cổ điển Tập mờ coacute thể kết hợp với nhau qua những luật mờ magrave đặc trưng cho những hagravenh động trạng thaacutei vagrave thuộc tiacutenh của logic mờ được tận dụng khi thực hiện một bộ điều khiển mờ

Logic mờ dựa trecircn yacute tưởng mỗi phần tử thuộc vagraveo một tập hợp ở một mức độ nagraveo đấy

Locircgic mờ cho pheacutep độ liecircn thuộc (microA )coacute giaacute trị trong khoảng (01) Locircgic mờ coacute thể được coi lagrave mặt ứng dụng của lyacute thuyết tập mờ để xử lyacute caacutec

giaacute trị trong thế giới thực cho caacutec bagravei toaacuten phức tạp

3 So saacutenh tiacutenh đuacuteng đắn logic mờ vagrave xaacutec suất Xaacutec suất thigrave đề cập đến khả năng xảy ra một biến cố hay một điều gigrave đoacute Logic mờ đề cập đến cấp độ magrave đặc tiacutenh ở hiện tại

o viacute dụ1 người coacute chiều cao 6 feet thigrave coacute cấp độ lagrave 05 về chiều cao

4 Ưu điểm của logic mờ Caacutech tiếp cận rất tự nhiecircnkhocircng phức tạp Coacute thể mocirc higravenh hoacutea caacutec hagravem phi tuyến tugravey yacute phức tạp

Coacute thể tận dụng được kinh nghiệm từ những chuyecircn gia hagraveng đầu trong mọi lĩnh vực

Logic mờ được xacircy dựng dựa trecircn ngocircn ngữ tự nhiecircnNền tảng của logic mờ lagrave dựa trecircn cơ sở giao tiếp của con người

5 Nhược điểm của logic mờ Trong 1 hệ thống phức tạpsử dụng logic mờ coacute thể trở thagravenh trở ngại cho

việc xaacutec thực độ tin cậy của hệ thống Cơ chế lập luận mờ khocircng thể học hỏi từ những lỗi sai

6 Mạng noron nhacircn tạo(ANN) Mạng noron nhacircn tạo lagrave một mocirc phỏng xử lyacute thocircng tinđược nghiecircn cứu ra

từ hệ thống thần kinh của sinh vậtgiống như bộ natildeo để xử lyacute thocircng tin ANNs lagrave chương trigravenh dựa trecircn maacutey tiacutenh đơn giản coacute chức năng lagrave một mocirc

higravenh bagravei toaacuten khocircng gian dựa trecircn thử nghiệm vagrave baacuteo lỗi

7 Học từ kinh nghiệm Tiến trigravenh Một mẫu dữ liệu được biểu diễn như một mạng lưới noronANN ldquodự

đoaacutenrdquo 1 đầu radự đoaacuten được so saacutenh với giaacute trị thực tế hoặc giaacute trị chiacutenh xaacutecNếu đoaacuten được chiacutenh xaacutec thigrave khocircng coacute hagravenh động nagraveo được thực hiện

Nếu dự đoaacuten sai ANN kiểm tra lại vagrave xaacutec định lại thocircng số để điều chỉnh Một mẫu dữ liệu khaacutec được biểu diễn vagrave quaacute trigravenh nagravey được lặp lại

8 Nguyecircn tắc cơ bản của cocircng nghệ nơron Caacutec yếu tố xử lyacute cơ bản trong hệ thống thần kinh của con người lagrave tế bagraveo

thần kinhMạng lưới của tế bagraveo nagravey lagrave liecircn kết với nhau nhận được thocircng tin từ caacutec cảm biến trong mắt taihellip

Thocircng tin nhận được bởi tế bagraveo thần kinh hoặc lagrave sẽ kiacutech thiacutech noacute(sẽ được chuyển qua 1 thocircng điệp dọc theo mạng lưới) hoặc lagrave sẽ ngăn cản noacute(ngăn cản dograveng thocircng tin)

Độ nhạy coacute thể thay đổi qua thời gian hoặc sau khi coacute được kinh nghiệm

9 Cấu truacutec mạng Một ANN gồm 3 lớp cơ bản

Lớp đầu vagraveo nhận dữ liệu Lớp becircn trong hoặc lagrave lớp ẩn xử lyacute dữ liệu Lớp đầu ra chuyển tiếp kết quả cuối cugraveng của mạng

10Mạng nơ ron Thường coacute nhiều đầu vagraveo mỗi đầu vagraveo với mức ảnh hưởng vagrave tầm quan

trọng riecircng của noacute Một đầu vagraveo quan trọng coacute thể được sử dụng để khuếch đại đầu ra caacutec hagravem trạng thaacutei tổng hợp caacutec trọng số của caacutec yếu tố

đầuvagraveo khaacutec nhauvagraveo một giaacute trị duy nhất Caacutec hagravem chuyển giao xử lyacute caacutec giaacute trị trạng thaacutei vagrave tạo đầu ra

11Huấn luyện mạng nơ ron Trong mocirc higravenh coacute giaacutem saacutetANN được đến so saacutenh dự đoaacuten của chiacutenh

noacute với thocircng tin phản hồi coacute chứa caacutec kết quả mong muốn ANN sẽ phải tigravem caacutech thay đổi caacutec tham số becircn trong củamigravenh (caacutec trọng số vagrave caacutec ngưỡng) để tạo necircn một aacutenh xạ coacute khả năng aacutenh xạcaacutec đầu vagraveo thagravenh caacutec đầu ra mong muốn Sự thay đổi nagravey được tiến hagravenh nhờ việc so saacutenh giữa đầu ra thực sự vagrave đầu ra mong muốn

Trong mocirc higravenh khocircng coacute giaacutem saacutetANN nhận được dữ liệu vagraveo nhưng khocircng phải coacute bất kỳ thocircng tin phản hồi về kết quả mong muốn

Phần lớn caacutec ứng dụng nằm trong vugraveng của caacutec bagravei toaacuten ước lượng như mocirc higravenh hoacuteathống kecirc neacuten lọc phacircn cụm

12Lợi iacutech Liecircn kết với mạng noron Traacutenh caacutech lập trigravenh tường minh Giảm nhu cầu của chuyecircn gia ANNs thigrave thiacutech nghi với caacutec yếu tố đầu vagraveo thay đổi Khocircng cần thiết cho cơ sở tri thức tinh chế ANNs coacute tiacutenh động vagrave cải thiện với việc sử dụng Coacute khả năng xử lyacute dữ liệu khocircng chiacutenh xaacutec hoặc khocircng đầy đủ Cho pheacutep tổng quaacutet hoacutea từ thocircng tin cụ thể Cho pheacutep thu thập cảm giaacutec thocircng thường vagraveo miền giải quyết vấn đề

13Hạn chế của việc liecircn kết với mạng noron ANNs khocircng thể giải thiacutech được suy luận Bản chất hộp đen thường khiến cho vấn đề traacutech nhiệm vagrave độ tin cậy phaacutet

sinh lagrave khoacute khăn Lặp đi lặp lại quaacute trigravenh huấn luyện rất tốn thời gian Nguồn lực caacutec nhagrave phacircn tiacutech vagrave thiết kế coacute tay nghề cao vẫn lagrave đaacuteng lo

ngại Cocircng nghệ ANN thuacutec đẩy hạn chế của phần cứng hiện tại ANN yecircu cầu phải coacute sự tin tưởng ở đầu ra

14Giới thiệu về thuật toaacuten di truyền Cũng như mạng lưới thần kinh caacutec thuật toaacuten di truyền được dựa trecircn lyacute

thuyết sinh học Thuật toaacuten di truyền tigravem thấy nguồn gốc của chuacuteng trong caacutec lyacute thuyết

tiến hoacutea của chọn lọc tự nhiecircn vagrave thiacutech ứng với biến đổi khiacute hậu Kết quả thuật toaacuten di truyền lagrave từ giao phối 2 caacute thể trong quần thế để tạo

ra con caacutei đocirci khi tốt hơn so với bậc cha mẹ của chuacuteng 15Caacutec thagravenh phần cơ bản của thuật toaacuten di truyền

Toaacuten tử chọn lọc Caacutec caacute thể tốt được chọn lọc để đưa vagraveo thế hệ sau Sự chọn lọc nagravey căn cứ vagraveo độ thiacutech nghi với mocirci trường của mỗi caacute thể

Toaacuten tử lai gheacutep (crossover) Hai caacute thể cha vagrave mẹ trao đổi caacutec gen với nhau để tạo ra caacute thể con

Toaacuten tử đột biến (mutation) Một caacute thể thay đổi một số gen để biến đổi thagravenh một caacute thể mớiTất cả caacutec toaacuten tử trecircn khi thực hiện đều mang tiacutenh ngẫu nhiecircn

16Quaacute trigravenh cơ bản của một thuật toaacuten di truyền Khởi tạo

Đaacutenh giaacute quần thể

Lựa chọn NST thiacutech hợp nhất vagrave loại bỏ NST yếu nhất

Quy trigravenh giao nhau vagrave cải thiện quần thể

đột biến tiến trigravenh để khaacutem phaacute ra NST mới

17Ưu nhược điểm của việc kết hợp với thuật toaacuten di truyền Kiacutech thước quần thể lagrave 1 yếu tố quan trọng trong tốc độ của việc tigravem

kiếmnhưng noacute tương đối dễ dagraveng để dự đoaacuten tốc độ nagravey Giao nhau hoặc đột biến lagrave khocircng necircn đc sử dụng quaacute thường xuyecircn Luocircn coacute được iacutet nhất 1 giải phaacutep hợp lyacute Necircn coacute thể aacutep dụng chuacuteng cho caacutec vấn đề magrave chuacuteng ta khocircng coacute hướng

về caacutech giải quyết Sức mạnh của thuật toaacuten xuất phaacutet từ khaacutei niệm đơn giảnkhocircng phải từ

một thủ tục thuật toaacuten phức tạp 18Tương lai của học maacutey

Mạng lưới thần kinh nhacircn tạo vượt quaacute năng lực của con người trong caacutec trường hợp bị cocirc lập

Về mặt lyacute thuyếtmột maacutey tiacutenh coacute thể xử lyacute dũ liệu nhanh hơn hagraveng triệu lần so với 1 con người

May mắn thay cho chuacuteng tacon người tốt hơn nhiều khi magrave coacute được dữ liệumaacutey tiacutenh khocircng coacute 1 số thứ như lagrave 5 giaacutec quan

CHƯƠNG 10 KHO DỮ LIỆU

1 Kho dữ liệu Kho dữ liệu lagrave tuyển tập caacutec cơ sở dữ liệu tiacutech hợp hướng chủ đề được

thiết kế để trợ giuacutep cho một hệ hỗ trợ quyết định

Theo John Ladley Cocircng nghệ kho dữ liệu lagrave tập caacutec phương phaacutep kỹ thuật vagrave caacutec cocircng cụ coacute thể kết hợp hỗ trợ nhau để cung cấp thocircng tin cho người sử dụng trecircn cơ sở tiacutech hợp từ nhiều nguồn dữ liệu nhiều mocirci trường khaacutec nhau

Kho dữ liệu thường rất lớn tới hagraveng trăm GB hay thậm chiacute hagraveng Terabyte

2 Kho dữ liệu vận hagravenh (ODS) Một kho dữ liệu vận hagravenh Aacutep dụng kỹ thuật kho dữ liệu vagraveo caacutec hệ xử

lyacute giao taacutec lưu trữ dữ liệu cho một ứng dụng đặc thugrave Noacute đưa vagraveo kho dữ liệu một dograveng caacutec dữ liệu thocirc được thiết kế

3 So saacutenh

Kho dữ liệu vận hagravenh Kho dữ liệu

Dữ liệu theo chủ đề Dữ liệu theo chủ đề

Dữ liệu tiacutech hợp Dữ liệu tiacutech hợp

Dữ liệu thay đổi Dữ liệu khocircng thay đổi

Dữ liệu được cập nhật khi thay đổi

Dữ liệu giữ nguyecircn

Chỉ coacute dữ liệu hiện tạiDữliệu hiện tại vagrave dữ liệu lịch sử

Chu kỳ lagravem tươi dữ liệu ngắn Chu kỳ lagravem tươi dữ liệu dagravei

Chỉ coacute dữ liệu chi tiết Dữ liệu chi tiết vagrave dữ liệu tổng kết

Dugraveng cho caacutec quyết định ngắn hạn

Dugraveng cho hoạch định dagravei hạn

4 Kho dữ liệu cục bộ (Data Mart - DM)

Kho dữ liệu cục bộ lagrave CSDL coacute những đặc điểm giống với kho dữ liệu nhưng với quy mocirc nhỏ hơn vagrave lưu trữ dữ liệu về một lĩnh vực một chuyecircn ngagravenh

Data mart phụ thuộc Chứa những dữ liệu được lấy từ DW vagrave những dữ liệu nagravey sẽ được triacutech lọc vagrave tinh chế tiacutech hợp lại ở mức cao hơn để phục vụ một chủ đề nhất định của Datamart

Data mart độc lập Khocircng giống như Datamart phụ thuộc Data mart độc lập được xacircy dựng trước DW vagrave dữ liệu được trực tiếp lấy từ caacutec nguồn khaacutec nhau

5 Siecircu dữ liệu Metadata lagrave dữ liệu để mocirc tả dữ liệu Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột

một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi Metadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu

6 Mocirci trường kho dữ liệu Hệ thống của tổ chức vagrave kho cung cấp dữ liệu để xacircy dựng kho dữ liệu Trong quaacute trigravenh chuyển dữ liệu từ caacutec nguồn khaacutec nhau dữ liệu coacute thể

được lagravem sạch hoặc chuyển đổi vagrave vigrave thế DW được xem như lagrave một chuẩn cho việc lưu trữ

Đồng thời siecircu dữ liệu được ghi lại Cuối cugraveng DW hoặc siecircu thị coacute thể được sử dụng để tạo ra một kho dữ

liệu ldquocaacute nhacircnrdquo 7 Caacutec đặc điểm của kho dữ liệu

Đặc điểm Mocirc tả

Hướng chủ đề - DL tổ chức theo caacutech thức người dugraveng tham chiếu

Tiacutech hợp - Dữ liệu ldquosạchrdquo loại bỏ tiacutenh thiếu nhất quaacuten

Khocircng thay đổi - DL ldquochỉ đọcrdquo người dugraveng khocircng thay đổi được

Chuỗi thời gian - DL lagrave chuỗi thời gian khocircng phải lagrave trạng thaacutei hiện tại

Được tổng kết - DL vận hagravenhthao taacutec khi cần thiết

được kết hợp lại thagravenh dạng coacute thể dugraveng được cho quyết định

Kiacutech cỡ lớn hơn - Lưu giữ theo chuỗi thời gian tức lagrave giữ lại nhiều DL

Khocircng được chuẩn hoacutea - Coacute thể dư thừa DLSiecircu dữ liệu - Dữ liệu của dữ liệu được lưu trữNguồn dữ liệu - DL vận hagravenh (caacutec hệ sẵn coacute) cugraveng

với caacutec nguồn ngoagravei 8 Kho dữ liệu hướng chủ đề

Hướng chủ để coacute nghĩa lagrave kho dữ liệu được tổ chức xung quanh caacutec chủ đề chiacutenh như khaacutech hagraveng sản phẩm sản xuất Tập trung vagraveo việc mocirc higravenh hoacutea vagrave phacircn tiacutech dữ liệu cho caacutec nhagrave ra quyết định magrave khocircng tập trung vagraveo caacutec xử lyacute thocircng thường Cung cấp cho người dugraveng một khung nhigraven toagraven vẹn đơn giản vagrave đầy đủ về caacutec sự kiện quanh caacutec chủ đề

9 Dữ liệu trong DW được tiacutech hợp Dữ liệu trong kho dữ liệu được xacircy dựng bằng caacutech tổng hợp dữ liệu từ

nhiều nguồn khaacutec nhau vagrave caacutec nguồn coacute tổ chức khaacutec nhau Cơ sở dữ liệu caacutec file excel caacutec flat file hoặc caacutec raw file Khi đưa vagraveo kho dữ liệu caacutec dữ liệu được lagravem sạch vagrave tiacutech hợp dữ liệu nhằm đảm bảo tiacutenh nhất quaacuten của dữ liệu

10Kiến truacutec kho dữ liệu Tầng cơ sở dữ liệu hoạt động Tầng truy xuất thocircng tin Tầng truy xuất dữ liệu Tầng siecircu dữ liệu Tầng quản lyacute tiến trigravenh Tầng thocircng điệp của ứng dụng Tầng vật liacute của kho dữ liệu Tầng trigravenh diễn dữ liệu

11Higravenh trạng kho dữ liệu Kho dữ liệu ảo - người dugraveng cuối coacute thể truy cập trực tiếp đến kho dữ liệu

sử dụng caacutec cocircng cụ cho pheacutep ở tầng truy xuất dữ liệu Kho dữ liệu trung tacircm-1 cơ sở dữ liệu vật lyacute chứa tất cả dữ liệu cho một

vugraveng chuyecircn dụng nagraveo đoacute

Kho dữ liệu phacircn taacuten- Thagravenh phần được phacircn taacuten qua nhiều hệ cơ sở dữ liệu vật lyacute

12METADATA- Siecircu dữ liệu Định nghĩa Siecircu dữ liệu lagrave dữ liệu về dữ liệu Lagrave 1 lưu trữ dugraveng để

Miecircu tả kho dữ liệu tổng thể Nhận dạng kiểu kho dữ liệu Quản liacute quaacute trigravenh tiacutech hợp dữ liệu Quản liacute quaacute trigravenh cập nhật kho dữ liệu Quản liacute bảo mật

Lagrave chigravea khoacutea quyết định sự thagravenh cocircng của kho dữ liệu luocircn được thay đổi vagrave cập nhật theo sự phaacutet triển của kho dữ liệu

Dugraveng để quản liacute điều khiển kho dữ liệu Sự ra đời của kho dữ liệu như 1 cấu truacutec hỗ trợ ra quyết định siecircu dữ liệu

được xem như nguồn tagravei nguyecircn dữ liệu Siecircu dữ liệu lagrave trừu tượng Chuacuteng lagrave dữ liệu bậc cao cung cấp mocirc tả ngắn

gọn caacutec dữ liệu bậc thấp hơn 13Hoạt động của Siecircu dữ liệu

Siecircu dữ liệu rất cần thiết trong việc chuyển hoacutea thocircng tin trở thagravenh tri thức Lagrave chigravea khoacutea giuacutep chuacuteng ta xử lyacute được dữ liệu thocirc Viacute dụ một dograveng dữ liệu baacuten hagraveng 1023 K596 11121 agraveNoacute sẽ khocircng coacute nghĩa gigrave cho đến khi chuacuteng ta đưa vagraveo siecircu dữ liệu (thư

mục chứa dữ liệu) agrave cửa hagraveng 1023 sản phẩm K596 vagrave số tiền baacuten được lagrave 11121 đocirc la

14Sự cần thiết phải nhất quaacuten trong kho dữ liệu Kho dữ liệu được xacircy dựng cho lợi iacutech của những nhagrave phacircn tiacutech kinh

doanh caacutec nhagrave quản trị cho tất cả caacutec khu vực chức năng Trong cơ sở dữ liệu riecircng caacutec khu vực khaacutec nhau coacute thể định nghĩa vagrave lưu

trữ dữ liệu thocircng qua phiecircn bản của chiacutenh noacute Khi dữ liệu được lấy từ những vugraveng khaacutec nhau đoacute vagrave được đặt vagraveo kho dữ

liệu Việc chuyển đổi vagrave lagravem sạch caacutec tiến trigravenh sẽ đảm bảo noacute lagrave duy nhất được tiacutech hợp tại một mức của tổ chức

15Ragrave soaacutet lại dữ liệu ndash Thực thi siecircu dữ liệu

Bất kể cấu truacutec tự nhiecircn của 1 cacircu truy vấn thế nagraveo thigrave caacutec thagravenh phần của siecircu dữ liệu rất quan trọng đối với người ra quyết định

Bảng thuộc tiacutenh khoacutea được lưu trữ bởi kho dữ liệu Tập hợp dữ liệu được lấy từ đacircu Những chuyển đổi nagraveo được thực thi với việc lagravem sạch

16Siecircu dữ liệu lagrave gigrave Metadata - lagrave thocircng tin mocirc tả nội dung của cơ sở dữ liệu (CSDL) Metadata baacuteo cho người dugraveng biết thời gian cập nhật sau cugraveng của dữ liệu

định dạng vagrave mục điacutech sử dụng của noacute Những thocircng tin nagravey coacute thể hướng dẫn người dugraveng duyệt qua CSDL vagrave

giuacutep họ hiểu được yacute nghĩa vagrave ngữ cảnh của dữ liệu Trong CSDL metadata lagrave caacutec dạng biểu diễn khaacutec nhau của caacutec đối tượng

trong CSDL Trong CSDL quan hệ metadata lagrave caacutec định nghĩa của bảng cột CSDL

view vagrave nhiều đối tượng khaacutec Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột

một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi -gtMetadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu

Bảng chuyển đổi Ghi lại những chuyển đổi đatilde được thực hiện

Lịch sử thực thi Ghi lại những dữ liệu đatilde được

phacircn tiacutech

Higravenh thaacutei kết nốiGhi lại những dữ liệu được kết nối vagrave tần suất

17Aacutenh xạ thocircng thường của siecircu dữ liệu Bản ghi aacutenh xạ chuyển đổi bao gồm

Định danh của nguồn gốc Chuyển đổi thuộc tiacutenh Chuyển đổi thuộc tiacutenh vật lyacute Matilde hoacutea tham chiếu bảng chuyển đổi Đổi tecircn Đổi khoacutea Gaacuten giaacute trị cho thuộc tiacutenh mặc định Chọn logic cho caacutec nguồn nhiều giaacute trị Đổi thuật toaacuten

18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để

phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai

lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave

tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec

Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm

Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo

19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua

caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau

SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được

Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra

một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức

Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ

Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ

Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech

CHƯƠNG 11 KHAI PHAacute DỮ LIỆU

1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn

ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993

Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng

2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd

1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều

2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP

3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn

4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng

5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server

6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo

7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động

8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời

9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều

10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện

11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech

12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP

3 Xử lyacute phacircn tiacutech trực tuyến OLAP

MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave

dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu

ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave

thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu

HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave

ROLAP4 Khai phaacute dữ liệu

Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh

khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn

Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan

5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp

6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại

Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp

Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec

Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt

Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra

Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh

vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho

Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec

Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm

Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục

Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng

gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp

Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn

Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec

Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper

Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2

Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25

Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước

Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng

Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện

trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp

Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute

độ hỗ trợ ge ngưỡng minsup

độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan

Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn

Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết

Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu

MOLAP ROLAP HOLAP

Lưu trữ dữ liệu cơ sở

Khối Bảng quan hệ Bảng quan hệ

Lưu trữ thocircng tin tổng hợp

Khối Bảng quan hệ Khối

Hiệu suất thực hiện truy vấn

Nhanh nhất Chậm nhất Nhanh

Tiecircu thụ khocircng gian lưu trữ

Nhiều Thấp Trung bigravenh

Chi phiacute bảo trigrave Cao Thấp Trung bigravenh

Page 34: De cuong(1-11)

- Sản phẩm EIS đầu tiecircn được phaacutet triển để sử dụng trecircn maacutey tiacutenh cấu higravenh cao nhưng caacutec sản phẩm hiện nay nhằm mục tiecircu lagrave nền tảng ClientServer

- Những nền tảng linh hoạt hơn coacute thể thiacutech ứng với thay đổi trong tổ chức vagrave cocircng nghệ

- Sử dụng dữ liệu thời gian thực dẫn đến quyết định nhanh hơn nhiều thocircng tin hơn

Thagravenh phần phần cứng- Một EIS khocircng đogravei hỏi coacute phần cứng cụ thể hoặc duy nhất nagraveo- Chigravea khoacutea của vấn đề lagrave để đảm bảo rằng caacutec thagravenh phần của EIS tối ưu hoacutea vagrave

phugrave hợp với tagravei nguyecircn maacutey tiacutenh của tổ chức- Hệ thống nagravey phải được cấu higravenh để caacutec nguồn tagravei nguyecircn phugrave hợp với những

người điều hagravenh chuacuteng

Thagravenh phần phần mềm- Traacutei ngược với phần cứng phần mềm thường được chuyecircn mocircn hoacutea cao cho caacutec

bagravei toaacuten về miền- Sự chuyecircn mocircn hoacutea nagravey thường đạt được bằng caacutech sử dụng thagravenh phần off-the-

shelf cho toagraven bộ EIS vagrave caacutec mocirc-đun tugravey chỉnh để đaacutep ứng nhu cầu cụ thể- Lotus Notes lagrave một viacute dụ điển higravenh Noacute coacute thể được sử dụng một migravenh hoặc coacute

thể phục vụ becircn thứ ba mocirc-đun plug-in

Cocircng nghệ EIS hiện nay

Dobrzeniecki đề xuấtphacircn loạitừng cấptheo bachức năng- Loại 1 sản phẩm bao gồmmột bộ đầy đủcaacutec ứng dụngtừ mộtnhagrave cung cấp- Loại 2 sản phẩm đượcthựchiệnở phần đầu củacaacutecsản phẩmDSS đượcphaacutet triển

bởicugravengmộtnhagrave cung cấp- Loại 3 sản phẩmkết hợp với nhautheo bất kỳ số lượngthuộc sở hữu củacocircng ty

65 Xacircy dựng EIS

- Xacircy dựngmộtEISgiống nhưxacircydựngmột số hệ thống khaacutec củamocirc higravenh hệ thống thocircng tin

- Việcphaacutet triểncấu truacutecnecircn được theo dotildeitừ quaacute trigravenh thiết kế đến quaacute trigravenhthực hiện

- Tuy nhiecircn một dự aacuten phaacutet triển EIScoacute xu hướnglagrave thống nhấtvagraveyecircu cầu hỗ trợ caacutec nhagrave quản lyacute latildenh đạo

- Xacircy dựng một EIScoacute thểphaacutet hiện ra đượccaacutectigravenh huống khoacute khănmagravemột nhagrave phaacutet triển chưabao giờ gặp phải

Mocirc higravenh EIS

Khung phaacutet triển một EIS

- Watson et al đề nghị xacircy dựngkhung với ba thagravenh phần+ Caacutech tiếp cận tập trung vagraveo yếu tốcon người vagrave dữ liệu coacute liecircn quan đến EIS+ Quaacute trigravenh phaacutet triển cần sự linh hoạt vagrave tương taacutec+ Người sử dụng - hệ thống hộp thoại bao gồm một ngocircn ngữ hagravenh động để xử lyacute caacutec lệnh

Lợi iacutech của EIS- Dễ duy trigrave caacutec mục tiecircu coacute tổ chức- Dễ truy xuất thocircng tin- Cho pheacutep người sử dụng nacircng cao hiệu suất hơn

- Tăng chất lượng ra quyết định- Cung cấp sự cải tiến cạnh tranh- Tiết kiệm thời gian của người sử dụng- Tăng khả năng vagrave chất lượng giao tiếp- Cung cấp khả năng điều khiển tốt hơn trong tổ chức- Cho pheacutep tham gia caacutec vấn đề vagrave caacutec cơ hội- Cho pheacutep hoạch định- Cho pheacutep tigravem kiếm nguyecircn nhacircn của một vấn đề- Thảo matilden caacutec yecircu cầu của người điều hagravenh

Hạn chế của EIS vagrave 1 số sai lầm cần traacutenh

- Chi phiacute một cuộc khảo saacutetnăm1991 chothấychi phiacute phaacutet triểntrungbigravenh365000USDvớichi phiacute vận hagravenhhagraveng năm lagrave$200000 (EIS)

- Cocircng nghệ hạn chếEIScần phảiđượctiacutech hợp hoagraven toagravenvagraveokiếntruacuteccủadoanh nghiệphiện tại do đoacute noacutelagrave một thaacutech thứclớn đối vớithiết kế

- Hạn chế tổ chức cơ cấu tổ chứccoacute thể khocircng phugrave hợp

Sự hạn chế về tổ chức- Chương trigravenh nghị sự vagrave thời gian chệch EIS mocirc tả một phần việc thực hiện một

chương trigravenh nghị sự vagrave coacute thể dễ dagraveng đạt được sự tin cậy một caacutech chắc chắn- Đồng bộ hoacutea việc quản lyacute sự tin cậy đuacuteng luacutec đặc biệt baacuteo caacuteo EIS coacute thể phaacute

vỡ sự ổn định thiết lập caacutec chu trigravenh baacuteo caacuteo một caacutech tốt nhất- Sự bất ổn EIS phản ứng nhanh coacute thể gacircy ra việc taacutec động trở lại một caacutech

nhanh choacuteng dẫn đến sự thiếu ổn định trong tổ chức

Sự thất bại lagrave thay thế khocircng thể chấp nhận được- Một số yếu tố lagravem EIS thất bại

+ Thiếu sự hỗ trợ về mặt quản lyacute+ Vấn đề chiacutenh trị+ Thất bại của nhagrave phaacutet triển+ Lỗi về cocircng nghệ+ Giaacute cả+ Thời gian

66 Ra quyết định điều hagravenh trong tương lai vagrave EIS

- Coacute một vagravei điều kiện sẽ được hợp nhất cho việc chuyển đổi cocircng nghệ Trong đoacute một vagravei điều kiện coacute thể dễ dự đoaacuten Hai điều kiện magrave ta coacute thể thấy lagrave+ Phaacutet triển cocircng nghệ maacutey tiacutenh trong việc điều hagravenh sẽ tạo ra sự chuyển đổi được chấp nhận một caacutech dễ dagraveng hơn+ Mở rộng traacutech nhiệm điều hagravenh sẽ mở rộng nhu cầu thocircng tin

Tương lai của EIS- EIS thocircng minh Những tiến bộ trong cocircng nghệ AI sẽ được triển khai trong caacutec

EIS- EIS đa phương tiện Cơ sở dữ liệu đa phương tiện sẽ cho pheacutep tiacutech hợp văn bản

giọng noacutei vagrave higravenh ảnh trong tương lai- EIS thocircng tin Tương lai EIS sẽ mở rộng hơn trong việc sử dụng dữ liệu becircn

ngoagravei doanh nghiệp- EIS kết nối Giao tiếp với băng thocircng rộng cho pheacutep kết nối liecircn thocircng lớn hơn

Chương 7 HỆ CHUYEcircN GIA VAgrave TRIacute TUỆ NHAcircN TẠO

71 Caacutec khaacutei niệm

72 Triacute thocircng minh của triacute tuệ nhacircn tạo

73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia

74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia

75 Lợi iacutech vagrave hạn chế của hệ chuyecircn gia

71 Caacutec khaacutei niệm

Chuyecircn mocircn (Expertise) sự hiểu biết rộng trong 1 lĩnh vực hẹp

Hệ chuyecircn gia (Expert Systems)1 chương trigravenh maacutey tiacutenh sử dụng 1 tập caacutec luật dựa trecircn tri thức của con người để giải quyết caacutec vấn đề đogravei hogravei phải coacute sự chuyecircn mocircn

Một số hệ chuyecircn gia nổi tiếng

DENDRAL (Standford 1960s Edward Feigenbaum)

MYCIN (Standford1970s Edward Shortliffe)

PROSPECTOR (MIT 1979)

Triacute tuệ nhacircn tạo (Artificial Intelligence ndash AI)

Triacute tuệ nhacircn tạo một bộ phacircn của ngagravenh khoa học maacutey tiacutenh quan tacircm đến việc thiết kế caacutec hệ thống maacutey tiacutenh thocircng minh đoacute lagrave caacutec hệ thống đưa ra caacutec đặc điểm magrave từ đoacute chuacuteng ta liecircn hệ với sự thocircng minh trong hagravenh động của con người (Barr vagrave Feigenbaum 1981)

Mục điacutech của AI

Mục điacutech khoa học xaacutec định caacutec gợi yacute để giải thiacutech caacutec loại khaacutec nhau của triacute tuệ thực

Mục điacutech kỹ thuật giải quyết caacutec vấn đề trong thế giới thực

Triacute tuệ nhacircn tạo kế thừa nhiều yacute tưởng quan điểm kỹ thuật từ caacutec ngagravenh khoa học khaacutec

- Triết học

- Logic Toaacuten học

- Tiacutenh toaacuten

- Khoa học tacircm lyacute Khoa học nhận thức

- Sinh học Thần kinh học

- Tiến hoacutea

Caacutec lĩnh vực ứng dụng trong Triacute tuệ nhacircn tạo

Mạng nơ ron thần kinh (Neural Networks)

Tiacutenh toaacuten sự tiến hoacutea

(Evolutionary Computation)

Hệ chuyecircn gia (Expert Systems)

Kỹ thuật xử lyacute tiếng noacutei (Speech Processing)

Kỹ thuật xử lyacute ngocircn ngữ tự nhiecircn

(Natural Language Processing)

Lập kế hoạch (Planning)

Robot (Robotics)

Khoa học higravenh ảnh (Vision)

Caacutec kỹ thuật thocircng dụng dugraveng trong AI

Biểu diễn(Representation)

Học (Learning)

Caacutec luật (Rules)

Tigravem kiếm (Search)

72 Triacute thocircng minh của triacute tuệ nhacircn tạo

Con người suy diễn như thế nagraveo

Phacircn loại (Categorization)

Caacutec quy tắc cụ thể

Heuristics

Kinh nghiệm trước đoacute

Dự tiacutenh trước

Maacutey tiacutenh suy diễn như thế nagraveo

Lập luận dựa trecircn luật IF-THEN mocirc tả tri thức được matilde hoacutea dưới dạng caacutec luật

Caacutec khung (Frames) lagrave caacutec đại diện mocirc tả caacutec tigravenh huống giống nhau lagrave điển higravenh của một vagravei phacircn loại

Lập luận dựa trecircn caacutec trường hợp mocirc phỏng giải phaacutep trước đoacute cho một vấn đề hiện tại

Nhận dạng mẫu phaacutet hiện acircm thanh higravenh dạng hoặc caacutec chuỗi dagravei

Caacutec dạng khaacutec của Triacute tuệ nhacircn tạo

Học maacutey- mạng nơron vagrave giải thuật di truyền

Lập trigravenh tự động ndash lagrave những kỹ thuật tạo ra caacutec chương trigravenh để lagravem 1 nhiệm vụ riecircng biệt (cho pheacutep những người khocircng phải lagrave người lập trigravenh coacute thể lập trigravenh được)

Cuộc sống nhacircn tạo ndash nỗ lực để taacutei tạo caacutec hiện tượng sinh học trong caacutec hệ thống dựa trecircn maacutey tiacutenh

73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia(Expert Systems- ES)

Theo Jackson (1999) Một hệ chuyecircn gia lagrave một chương trigravenh maacutey tiacutenh mocirc tả vagrave suy diễn với tri thức của một vagravei lĩnh vực để giải quyết vấn đề hay đưa ra caacutec lời khuyecircn

Cấu truacutec cơ bản của ES được dựa theo cấu truacutec chung của DSS Sự khaacutec biệt chiacutenh giữa ES vagraveDSS lagrave hệ ES thu thập caacutec kiến thức từ những

chuyecircn gia trong lĩnh vực quan tacircmĐặc trưng của hệ chuyecircn gia Hiệu quả cao Thời gian trả lời thỏa đaacuteng Độ tin cậy cao Dễ hiểu

Giao diện người dugraveng trong ES

Thiết kế giao diện người dugraveng tập trung vagraveo caacutec yếu tố như dễ dagraveng sử dụngcoacute độ tin cậy cao giảm tải những khoacute khăn khi sử dụng

Thiết kế necircn coacute một số tương taacutec (đầu vagraveo kiểm soaacutet vagrave truy vấn)

Cấu tạo giao diện người dugraveng gồm coacute magraven higravenh cảm ứng bagraven phiacutem buacutet saacuteng lệnh thoại caacutec phiacutem chuyecircn dụng

Cơ sở tri thức (Knowledge Base)

Chứa đựng caacutec tri thức cụ thể miền thu được từ caacutec chuyecircn gia miền

Coacute thể chứa caacutec mocirc tả caacutec hagravenh vi giải quyết vấn đề caacutec ragraveng buộc caacutec heuristics

Thagravenh cocircng của một ES dựa trecircn tiacutenh đầy đủ vagrave tiacutenh chiacutenh xaacutec của cơ sở tri thức

Mocirc tơ suy diễn (Inference Engine)

Ở đacircy tri thức được đặt để sử dụng tạo ra caacutec giải phaacutep để giải quyết vấn đề

Mocirc tơ nagravey coacute khả năng thực hiện diễn dịch hoặc suy diễn dựa trecircn caacutec luật hay caacutec caacutec sự kiện

Đồng thời cũng coacute khả năng sử dụng caacutec suy diễn mờ hay khocircng chiacutenh xaacutec dựa trecircn xaacutec suất hay aacutenh xạ mẫu

Vograveng điều khiển suy diễn

1 Aacutenh xạ caacutec luật với caacutec sự kiện đatilde được cho

2 Chọn luật để thực hiện

3 Thực hiện luật bằng caacutech thecircm caacutec sự kiện được suy diễn ra vagraveo bộ nhớ lagravem việc

Chuỗi suy diễn (Chaining)

Suy diễn tiến (forward chaining) maacutey suy diễn bắt đầu từ dữ liệu ban đầu vagrave thực hiện việc suy luận để đưa ra caacutec kết luận cuối cugraveng

Suy diễn lugravei (backward chaining) maacutey suy diễn bắt đầu từ dữ liệu điacutech vagrave tigravem ra tri thức hỗ trợ cho dữ liệu điacutech đoacute

Viacute dụ suy diễn lugravei

R1 Nếu coacute A vagrave B thigrave suy ra coacute D

R2 Nếu coacute B thigrave suy ra coacute C

R3 Nếu coacute C vagrave D thigrave suy ra coacute E

Ta coacute E ta xem trong 3 luật R1 R2 R3 luật nagraveo coacute E ta thấy R3 chứa E đồng thời chứa C vagrave D Xeacutet tiếp trong 2 luật R1 R2 luật nagraveo chứa C vagrave D R2 chứa C R3 chứa D Từ đoacute ta coacute được caacutec tri thức hỗ trợ suy diễn vagrave kết luận lagrave nếu coacute A vagrave B thigrave sẽ coacute E Hay nếu A vagrave B đuacuteng thigrave sẽ coacute E

Viacute dụ suy diễn tiến

Giả sử coacute tập chứa 3 luật sau

R1 Nếu coacute A vagrave B thigrave suy ra coacute D

R2 Nếu coacute B thigrave suy ra coacute C

R3 Nếu coacute C vagrave D thigrave suy ra coacute E

Nếu ta coacute A vagrave B thigrave chuacuteng ta suy ra được D từ R1 vagrave suy ra C từ R2 Với D vagrave C đatilde được suy ra ở trecircn giờ chuacuteng ta suy ra được E từ R3

Viacute dụ thực tế

Giả sử muốn biết magraveu của một con vật nuocirci tecircn lagrave Fred biết rằng noacute kecircu ộp ộp vagrave ăn ruồi

Coacute tập 4 luật ban đầu như sau

R1 Nếu X kecircu ộp ộp vagrave ăn ruồi thigrave X lagrave con ếch

R2 Nếu X kecircu chiecircm chiếp vagrave biết hoacutet thigrave X lagrave con chim

R3 Nếu X lagrave con ếch thigrave X coacute magraveu xanh

R4 Nếu X lagrave con chim thigrave X coacute magraveu vagraveng

74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia

Expert system shells lagrave một tập caacutec goacutei phần mềm vagrave caacutec cocircng cụ dugraveng để phaacutet triển caacutec hệ chuyecircn gia

Những Expert system shells đầu tiecircn thường rất rườm ragrave Mặc dugrave vậy noacute vẫn giuacutep cho người sử dụng sẽ khocircng phải bắt đầu lại từ đầu khi xacircy dựng một hệ chuyecircn gia mới

Những shell hiện đại bao gồm hai mocirc-đun chiacutenh lagrave cocircng cụ xacircy dựng một tập quy tắc vagrave mocirc tơ suy diễn

Xacircy dựng hệ chuyecircn gia

Bước 1 xacircy dựng mocirc higravenh bagravei toaacuten xaacutec định vấn đề nhiệm vụ magrave hệ thống sẽ thực hiện Caacutec dạng bagravei toaacuten cần hệ chuyecircn gia

Bagravei toaacuten diễn giải (InterPretation)

Bagravei toaacuten dự baacuteo (Prediction)

Bagravei toaacuten chuẩn đoaacuten (Diagnose)

Bagravei toaacuten gỡ rối (Debugging)

Bagravei toaacuten thiết kế

Tương tự như một dự aacuten phần mềm để xacircy dựng một hệ chuyecircn gia cần phải coacute caacutec yếu tố về nhacircn lực tagravei nguyecircn vagrave thời gian Những yếu tố nagravey ảnh hưởng đến giaacute thah của một hệ chuyecircn giaTrong phần nagravey cacircu hỏi thường được đặt ra lagrave tại sao cần phải xacircy dựng một hệ chuyecircn giaTrước khi bắt đầu phải xaacute định rotilde bagravei toaacuten đạt ra lagrave jiAi lagrave chuyecircn giaAi lagrave người sử dụng

1 Diễn giải (InterPretation) Nghiecircn cứu 1 vấn đề -gt Dựa trecircn những biểu hiện thuộc tiacutenh đặc trưng becircn ngoagravei -gt Tư vấn

(hoặc đưa ra kết luận hay mocirc tả dễ hiểu từ tập dữ liệu thocirc)

2 Bagravei toaacuten dự baacuteo (Prediction) Coacute thể dự đoaacuten được hagravenh vi kết quả dựa trecircn caacutec hiện tượng -gt dự baacuteo

VD Dự baacuteo thời tiết động đấthellip

3 Bagravei toaacuten chẩn đoaacuten (Diagnoss) Xaacutec định caacutec lỗi caacutec bộ phận hỏng hoacutec của hệ thống dựa trecircn caacutec dữ liệu quan saacutet được

4 Bagravei toaacuten gỡ rối (Debugging) Mocirc tả caacutec phương phaacutep khắc phục hệ thống khi gặp sự cố

5 Bagravei toaacuten thiết kế Lựa chọn cấu higravenh caacutec đối tượng nhằm thoả matilden một số ragraveng buộc nagraveo đoacute

6 Giảng dạy Phần mềm dạy học coacute thể chuẩn đoaacuten vagrave sủa lỗi của học sinh trong quaacute trigravenh học tập

Để xaacutec định đuacuteng bagravei toaacuten magrave chuacuteng ta cần giải quyết thigrave phải trả lời đc một số cacircu hỏi

- cần hệ chuyecircn gia

Bước 2 thu thập tri thức lựa chọn cocircng cụ vagrave aacutep dụng

Trong bước thu thập tri thức vấn đề quan trọng lagrave lựa chọn chuyecircn gia những người magrave sẽ đoacuteng goacutep tri thức cho hệ thống Thocircng thường trong suốt quaacute trigravenh phaacutet triển thigrave chuyecircn gia được xem như một thagravenh viecircn của đội phaacutet triển

Hiện nay coacute rất nhiều cocircng cụ để xacircy dựng một hệ chuyecircn gia Phổ biến nhất lagrave JESS CLIPS vagrave OPS5

Bước 3 Thiết kế cơ sở tri thức thiết kế hệ thốngTri thức được biểu diễn trường minh trong cơ sở tri thức

Caacutec chuyecircn gia vagrave kỹ sư tri thức sẽ đối thoại với nhau bằng caacutec kỹ thuật đối thoại Suy diễn (SD) bảng Mocirc higravenh hoacutea SD quy nạp phacircn loại

Vấn đề bagraveo trigrave vagrave phaacutet triển

Caacutec hệ chuyecircn gia đogravei hỏi phải bảo trigrave vagrave phaacutet triển nhiều hơn so với caacutec hệ thống khaacutec Phải thường xuyecircn bổ sung tri thức mới vagrave thay đổi caacutec tri thức cũ để đổi mới hệ chuyecircn gia

Thu thập vagrave khắc phục lỗi do người sử dụng phaacutet hiện để kịp thời khắc phục những sai soacutet của hệ chuyecircn gia

75 Lợi iacutech vagrave hạn chế của caacutec hệ chuyecircn gia

Một số lợi iacutech chiacutenh

Thời gian trả lời hợp lyacute bằng hoặc nhanh hơn so với chuyecircn gia (người) để đi đến cugraveng một quyết định Hệ chuyecircn gia lagrave một hệ thống thời gian thực (real time system)

Khả năng trả lời với mức độ tinh thocircng bằng hoặc cao hơn so với chuyecircn gia (người) trong cugraveng lĩnh vực

Hệ chuyecircn gia giuacutep cho hiệu quả lagravem việc tăng bằng việc sử dụng tập caacutec luật một caacutech nhanh choacuteng magrave ko bị nhầm lẫn chuyecircn gia lagrave người coacute thể quecircn đi một số tri thức cơ sở lyacute luậ nhưng HCG thigrave ko

Quyết định của một người chuyecircn gia coacute thể bị thay đổi vagrave ko coacute tiacutenh thống nhất như quyết định của một hệ chuyecircn gia tạo ra

Hệ chuyecircn gia giuacutep cho người sử dụng coacute thể trau dồi sự hiểu biết trecircn lĩnh vuej cụ thể magrave noacute giải quyết hỗ trợ người ra quyết định coacute trigravenh độ như 1 chuyecircn gia trong quaacute trigravenh gia quyết định

Kiến thức của rất nhiều chuyecircn gia về một lĩnh vực nagraveo đoacute được đưa vagraveo hệ chuyecircn gia lagravem cho CSTT cuat HCG phong phuacute vagrave rộng lớn hơn rất nhiều

HCG giải thiacutech caacutec bước suy luận một caacutech dễ hiểu nhất quaacuten luacutec nagraveo cũng coacute thể sử dụng ko như chuyecircn gia con người

Hạn chế của caacutec hệ chuyecircn gia

Nhược điểm lớn nhất của hệ chuyecircn gia lagrave những yacute kiến chuyecircn mocircn thường rất khoacute matilde hoacutea vagrave giải neacuten

Hệ chuyecircn gia khocircng coacute khả năng tự học tự cập nhật kiến thức mới như caacutec chuyecircn gia magrave cần phải được matilde hoacutea lại khi noacute được cập nhật

Hệ chuyecircn gia khocircng thể nhận ra được vấn đề khocircng nằm trong miền kiến thức của hệ thống

Chương 8 Tri thức vagrave tiếp nhận

1 Bao gồm caacutec vấn đề

Dữ liệu thực tế đo lường hoặc quan saacutet coacute hoặc khocircng coacute bối cảnh

Thocircng tin dữ liệu được tổng hợp một caacutech hữu iacutech để giải quyết những khoacute khăn trong việc đưa ra quyết định

Tri thức bao gồm caacutec ứng dụng quy tắc thocircng tin hướng dẫn của người ra quyết định

2 Những caacutei nhigraven về tri thức

Đại diện lagravem thế nagraveo để diễn tả tri thức viacute dụ như một quyển saacutech khocircng phải lagrave tri thức nhưng noacute lại lagrave một đại diện của tri thức

Sản xuất tri thức lagrave một tập hơp của hagraveng tồn kho coacute thể được sản xuất cũng như mua lại

Tri thức lagrave 1 trong 6 trạng thaacutei của hệ thống

1Dữ liệu 2Thocircng tin 3Cấu truacutec thocircng tin 4Sự thấu hiểu 5Yacute kiến 6 Quyết định

3 Caacutec loại tri thức Phổ biến mocirc tả dữ liệu thocircng tin thủ tục mọi thứ lagravem như thế nagraveo lập luận chiacutenh saacutech hoặc caacutec quy tắc

4 Thu thập Tri thức hệ chuyecircn gia Hầu hết caacutec phương phaacutep đều bắt đầu với mocirc higravenh của caacutec taacutec vụ trong đoacute

hệ chuyecircn gia được xacircy dựng Trong đoacute mocirc tả về caacutec lĩnh vực được tạo ra Caacutec kỹ sư sử dụng caacutec mocirc higravenh giả thuyết vagrave nhận thức về quaacute trigravenh phacircn

tiacutech để gợi ra caacutech giải quyết vấn đề về tri thức từ caacutec chuyecircn gia

5 Caacutec chiều của thu thập tri thức KE- driven caacutec kỹ sư trao đổi trực tiếp với caacutec chuyecircn gia Expert-driven Caacutec chuyecircn gia trực tiếp đưa chuyecircn mocircn của họ vagraveo hệ

thống maacutey tiacutenh Machine-driven Sử dụng caacutec cocircng cụ suy luận để triacutech xuất tri thức từ một

tập caacutec viacute dụ

6 Kỹ thuật thu thập tri thức Trao đổi gồm 2 loại cơ bản lagrave coacute cấu truacutec(coacute kịch bản) vagrave khocircng coacute cấu

truacutec( đối thoại trực tiếp) Giao thức phacircn tiacutech bằng lời Khi caacutec chuyecircn gia thực hiện một cocircng việc

của họ thigrave một bản ghi về cocircng việc đoacute được thực hiện Caacutec kỹ sư sẽ xacircy dựng mocirc higravenh cho những gigrave được ghi lại trong bản ghi

Phương phaacutep sagraveng lọc caacutec chuyecircn gia so saacutenh caacutec nhoacutem liecircn tiếp trong ba đối tượng vagrave cho biết tại sao nhoacutem thứ hai lại khaacutec nhoacutem thứ ba

7 Thu thập tri thức từ nhiều nguồn Thu thập tri thức từ nhiều nguồn lagrave cần thiết để coacute được đầy đủ caacutec tri thức

cho một vấn đề quan điểm yacute kiến traacutei ngược nhau thường phaacutet sinh Phương phaacutep đồng thuận sẽ giuacutep giải quyết được vấn đề macircu thuẫn Kỹ thuật phacircn tiacutech Meta lagrave kỹ thuật được aacutep dụng trong caacutec trường hợp

khaacutec Caacutech tiếp cận bằng định lượng đogravei hỏi caacutec kỹ sư cần cacircn nhắc yếu tố đầu vagraveo của caacutec chuyecircn gia khaacutec nhau

8 Xaacutec nhận hợp lệ vagrave kiểm tra tri thức Một khi thu thập tri thức noacute phải được đaacutenh giaacute về khả năng sử dụng vagrave độ

chiacutenh xaacutec Hai vấn đề cụ thể lagrave hiệu lực của những kiến thức vagrave kiểm tra việc xacircy dựng cơ sở của tri thức

Cần xaacutec nhận xem liệu hệ thống coacute thể hoạt động ở mức độ tối thiểu khocircng

Xaacutec minh liecircn quan đến việc so saacutenh từng chi tiết kỹ thuật của hệ thống những gigrave đatilde được thực hiện cuối cugraveng

9 Một số caacutec biện phaacutep xaacutec nhận Độ chiacutenh xaacutec Khả năng thiacutech nghi Mức độ đầy đủ Bề rộng Độ sacircu Hiệu lực Tổng quan Chiacutenh xaacutec Hiện thực Độ tin cậy Tiacutenh hữu dụng Mức độ

Chương 9 Học maacutey

1 Logic mờ vagrave ngocircn ngữ mờ(Fuzzy Logic and Linguistic Ambiguity)

Ngocircn ngữ tự nhiecircn gồm những khaacutei niệm mơ hồ vagrave khocircng chiacutenh xaacutectruyền tải ngữ nghĩa thocircng qua tiacutenh xấp xỉkhocircng rotilde ragraveng

Những xấp xỉ nagravey giuacutep con người coacute thể truyền tải hết được yacute nghĩa nhưng maacutey thigrave khocircng hiểu

Lagravem sao biểu diễn caacutec tri thức sử dụng caacutec khaacutei niệm khocircng rotilde ragraveng(mờ) hoặc khocircng chiacutenh xaacutec

2 Khaacutei niệm cơ bản của logic mờ tập mờ lagrave những tập hợp khocircng coacute một giới hạn rotilde Mỗi phần tử của noacute chỉ

chứa một mức độ hagravem liecircn thuộc của từng phần tử Vigrave vậy tập mờ khocircng giống như tập cổ điển Tập mờ coacute thể kết hợp với nhau qua những luật mờ magrave đặc trưng cho những hagravenh động trạng thaacutei vagrave thuộc tiacutenh của logic mờ được tận dụng khi thực hiện một bộ điều khiển mờ

Logic mờ dựa trecircn yacute tưởng mỗi phần tử thuộc vagraveo một tập hợp ở một mức độ nagraveo đấy

Locircgic mờ cho pheacutep độ liecircn thuộc (microA )coacute giaacute trị trong khoảng (01) Locircgic mờ coacute thể được coi lagrave mặt ứng dụng của lyacute thuyết tập mờ để xử lyacute caacutec

giaacute trị trong thế giới thực cho caacutec bagravei toaacuten phức tạp

3 So saacutenh tiacutenh đuacuteng đắn logic mờ vagrave xaacutec suất Xaacutec suất thigrave đề cập đến khả năng xảy ra một biến cố hay một điều gigrave đoacute Logic mờ đề cập đến cấp độ magrave đặc tiacutenh ở hiện tại

o viacute dụ1 người coacute chiều cao 6 feet thigrave coacute cấp độ lagrave 05 về chiều cao

4 Ưu điểm của logic mờ Caacutech tiếp cận rất tự nhiecircnkhocircng phức tạp Coacute thể mocirc higravenh hoacutea caacutec hagravem phi tuyến tugravey yacute phức tạp

Coacute thể tận dụng được kinh nghiệm từ những chuyecircn gia hagraveng đầu trong mọi lĩnh vực

Logic mờ được xacircy dựng dựa trecircn ngocircn ngữ tự nhiecircnNền tảng của logic mờ lagrave dựa trecircn cơ sở giao tiếp của con người

5 Nhược điểm của logic mờ Trong 1 hệ thống phức tạpsử dụng logic mờ coacute thể trở thagravenh trở ngại cho

việc xaacutec thực độ tin cậy của hệ thống Cơ chế lập luận mờ khocircng thể học hỏi từ những lỗi sai

6 Mạng noron nhacircn tạo(ANN) Mạng noron nhacircn tạo lagrave một mocirc phỏng xử lyacute thocircng tinđược nghiecircn cứu ra

từ hệ thống thần kinh của sinh vậtgiống như bộ natildeo để xử lyacute thocircng tin ANNs lagrave chương trigravenh dựa trecircn maacutey tiacutenh đơn giản coacute chức năng lagrave một mocirc

higravenh bagravei toaacuten khocircng gian dựa trecircn thử nghiệm vagrave baacuteo lỗi

7 Học từ kinh nghiệm Tiến trigravenh Một mẫu dữ liệu được biểu diễn như một mạng lưới noronANN ldquodự

đoaacutenrdquo 1 đầu radự đoaacuten được so saacutenh với giaacute trị thực tế hoặc giaacute trị chiacutenh xaacutecNếu đoaacuten được chiacutenh xaacutec thigrave khocircng coacute hagravenh động nagraveo được thực hiện

Nếu dự đoaacuten sai ANN kiểm tra lại vagrave xaacutec định lại thocircng số để điều chỉnh Một mẫu dữ liệu khaacutec được biểu diễn vagrave quaacute trigravenh nagravey được lặp lại

8 Nguyecircn tắc cơ bản của cocircng nghệ nơron Caacutec yếu tố xử lyacute cơ bản trong hệ thống thần kinh của con người lagrave tế bagraveo

thần kinhMạng lưới của tế bagraveo nagravey lagrave liecircn kết với nhau nhận được thocircng tin từ caacutec cảm biến trong mắt taihellip

Thocircng tin nhận được bởi tế bagraveo thần kinh hoặc lagrave sẽ kiacutech thiacutech noacute(sẽ được chuyển qua 1 thocircng điệp dọc theo mạng lưới) hoặc lagrave sẽ ngăn cản noacute(ngăn cản dograveng thocircng tin)

Độ nhạy coacute thể thay đổi qua thời gian hoặc sau khi coacute được kinh nghiệm

9 Cấu truacutec mạng Một ANN gồm 3 lớp cơ bản

Lớp đầu vagraveo nhận dữ liệu Lớp becircn trong hoặc lagrave lớp ẩn xử lyacute dữ liệu Lớp đầu ra chuyển tiếp kết quả cuối cugraveng của mạng

10Mạng nơ ron Thường coacute nhiều đầu vagraveo mỗi đầu vagraveo với mức ảnh hưởng vagrave tầm quan

trọng riecircng của noacute Một đầu vagraveo quan trọng coacute thể được sử dụng để khuếch đại đầu ra caacutec hagravem trạng thaacutei tổng hợp caacutec trọng số của caacutec yếu tố

đầuvagraveo khaacutec nhauvagraveo một giaacute trị duy nhất Caacutec hagravem chuyển giao xử lyacute caacutec giaacute trị trạng thaacutei vagrave tạo đầu ra

11Huấn luyện mạng nơ ron Trong mocirc higravenh coacute giaacutem saacutetANN được đến so saacutenh dự đoaacuten của chiacutenh

noacute với thocircng tin phản hồi coacute chứa caacutec kết quả mong muốn ANN sẽ phải tigravem caacutech thay đổi caacutec tham số becircn trong củamigravenh (caacutec trọng số vagrave caacutec ngưỡng) để tạo necircn một aacutenh xạ coacute khả năng aacutenh xạcaacutec đầu vagraveo thagravenh caacutec đầu ra mong muốn Sự thay đổi nagravey được tiến hagravenh nhờ việc so saacutenh giữa đầu ra thực sự vagrave đầu ra mong muốn

Trong mocirc higravenh khocircng coacute giaacutem saacutetANN nhận được dữ liệu vagraveo nhưng khocircng phải coacute bất kỳ thocircng tin phản hồi về kết quả mong muốn

Phần lớn caacutec ứng dụng nằm trong vugraveng của caacutec bagravei toaacuten ước lượng như mocirc higravenh hoacuteathống kecirc neacuten lọc phacircn cụm

12Lợi iacutech Liecircn kết với mạng noron Traacutenh caacutech lập trigravenh tường minh Giảm nhu cầu của chuyecircn gia ANNs thigrave thiacutech nghi với caacutec yếu tố đầu vagraveo thay đổi Khocircng cần thiết cho cơ sở tri thức tinh chế ANNs coacute tiacutenh động vagrave cải thiện với việc sử dụng Coacute khả năng xử lyacute dữ liệu khocircng chiacutenh xaacutec hoặc khocircng đầy đủ Cho pheacutep tổng quaacutet hoacutea từ thocircng tin cụ thể Cho pheacutep thu thập cảm giaacutec thocircng thường vagraveo miền giải quyết vấn đề

13Hạn chế của việc liecircn kết với mạng noron ANNs khocircng thể giải thiacutech được suy luận Bản chất hộp đen thường khiến cho vấn đề traacutech nhiệm vagrave độ tin cậy phaacutet

sinh lagrave khoacute khăn Lặp đi lặp lại quaacute trigravenh huấn luyện rất tốn thời gian Nguồn lực caacutec nhagrave phacircn tiacutech vagrave thiết kế coacute tay nghề cao vẫn lagrave đaacuteng lo

ngại Cocircng nghệ ANN thuacutec đẩy hạn chế của phần cứng hiện tại ANN yecircu cầu phải coacute sự tin tưởng ở đầu ra

14Giới thiệu về thuật toaacuten di truyền Cũng như mạng lưới thần kinh caacutec thuật toaacuten di truyền được dựa trecircn lyacute

thuyết sinh học Thuật toaacuten di truyền tigravem thấy nguồn gốc của chuacuteng trong caacutec lyacute thuyết

tiến hoacutea của chọn lọc tự nhiecircn vagrave thiacutech ứng với biến đổi khiacute hậu Kết quả thuật toaacuten di truyền lagrave từ giao phối 2 caacute thể trong quần thế để tạo

ra con caacutei đocirci khi tốt hơn so với bậc cha mẹ của chuacuteng 15Caacutec thagravenh phần cơ bản của thuật toaacuten di truyền

Toaacuten tử chọn lọc Caacutec caacute thể tốt được chọn lọc để đưa vagraveo thế hệ sau Sự chọn lọc nagravey căn cứ vagraveo độ thiacutech nghi với mocirci trường của mỗi caacute thể

Toaacuten tử lai gheacutep (crossover) Hai caacute thể cha vagrave mẹ trao đổi caacutec gen với nhau để tạo ra caacute thể con

Toaacuten tử đột biến (mutation) Một caacute thể thay đổi một số gen để biến đổi thagravenh một caacute thể mớiTất cả caacutec toaacuten tử trecircn khi thực hiện đều mang tiacutenh ngẫu nhiecircn

16Quaacute trigravenh cơ bản của một thuật toaacuten di truyền Khởi tạo

Đaacutenh giaacute quần thể

Lựa chọn NST thiacutech hợp nhất vagrave loại bỏ NST yếu nhất

Quy trigravenh giao nhau vagrave cải thiện quần thể

đột biến tiến trigravenh để khaacutem phaacute ra NST mới

17Ưu nhược điểm của việc kết hợp với thuật toaacuten di truyền Kiacutech thước quần thể lagrave 1 yếu tố quan trọng trong tốc độ của việc tigravem

kiếmnhưng noacute tương đối dễ dagraveng để dự đoaacuten tốc độ nagravey Giao nhau hoặc đột biến lagrave khocircng necircn đc sử dụng quaacute thường xuyecircn Luocircn coacute được iacutet nhất 1 giải phaacutep hợp lyacute Necircn coacute thể aacutep dụng chuacuteng cho caacutec vấn đề magrave chuacuteng ta khocircng coacute hướng

về caacutech giải quyết Sức mạnh của thuật toaacuten xuất phaacutet từ khaacutei niệm đơn giảnkhocircng phải từ

một thủ tục thuật toaacuten phức tạp 18Tương lai của học maacutey

Mạng lưới thần kinh nhacircn tạo vượt quaacute năng lực của con người trong caacutec trường hợp bị cocirc lập

Về mặt lyacute thuyếtmột maacutey tiacutenh coacute thể xử lyacute dũ liệu nhanh hơn hagraveng triệu lần so với 1 con người

May mắn thay cho chuacuteng tacon người tốt hơn nhiều khi magrave coacute được dữ liệumaacutey tiacutenh khocircng coacute 1 số thứ như lagrave 5 giaacutec quan

CHƯƠNG 10 KHO DỮ LIỆU

1 Kho dữ liệu Kho dữ liệu lagrave tuyển tập caacutec cơ sở dữ liệu tiacutech hợp hướng chủ đề được

thiết kế để trợ giuacutep cho một hệ hỗ trợ quyết định

Theo John Ladley Cocircng nghệ kho dữ liệu lagrave tập caacutec phương phaacutep kỹ thuật vagrave caacutec cocircng cụ coacute thể kết hợp hỗ trợ nhau để cung cấp thocircng tin cho người sử dụng trecircn cơ sở tiacutech hợp từ nhiều nguồn dữ liệu nhiều mocirci trường khaacutec nhau

Kho dữ liệu thường rất lớn tới hagraveng trăm GB hay thậm chiacute hagraveng Terabyte

2 Kho dữ liệu vận hagravenh (ODS) Một kho dữ liệu vận hagravenh Aacutep dụng kỹ thuật kho dữ liệu vagraveo caacutec hệ xử

lyacute giao taacutec lưu trữ dữ liệu cho một ứng dụng đặc thugrave Noacute đưa vagraveo kho dữ liệu một dograveng caacutec dữ liệu thocirc được thiết kế

3 So saacutenh

Kho dữ liệu vận hagravenh Kho dữ liệu

Dữ liệu theo chủ đề Dữ liệu theo chủ đề

Dữ liệu tiacutech hợp Dữ liệu tiacutech hợp

Dữ liệu thay đổi Dữ liệu khocircng thay đổi

Dữ liệu được cập nhật khi thay đổi

Dữ liệu giữ nguyecircn

Chỉ coacute dữ liệu hiện tạiDữliệu hiện tại vagrave dữ liệu lịch sử

Chu kỳ lagravem tươi dữ liệu ngắn Chu kỳ lagravem tươi dữ liệu dagravei

Chỉ coacute dữ liệu chi tiết Dữ liệu chi tiết vagrave dữ liệu tổng kết

Dugraveng cho caacutec quyết định ngắn hạn

Dugraveng cho hoạch định dagravei hạn

4 Kho dữ liệu cục bộ (Data Mart - DM)

Kho dữ liệu cục bộ lagrave CSDL coacute những đặc điểm giống với kho dữ liệu nhưng với quy mocirc nhỏ hơn vagrave lưu trữ dữ liệu về một lĩnh vực một chuyecircn ngagravenh

Data mart phụ thuộc Chứa những dữ liệu được lấy từ DW vagrave những dữ liệu nagravey sẽ được triacutech lọc vagrave tinh chế tiacutech hợp lại ở mức cao hơn để phục vụ một chủ đề nhất định của Datamart

Data mart độc lập Khocircng giống như Datamart phụ thuộc Data mart độc lập được xacircy dựng trước DW vagrave dữ liệu được trực tiếp lấy từ caacutec nguồn khaacutec nhau

5 Siecircu dữ liệu Metadata lagrave dữ liệu để mocirc tả dữ liệu Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột

một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi Metadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu

6 Mocirci trường kho dữ liệu Hệ thống của tổ chức vagrave kho cung cấp dữ liệu để xacircy dựng kho dữ liệu Trong quaacute trigravenh chuyển dữ liệu từ caacutec nguồn khaacutec nhau dữ liệu coacute thể

được lagravem sạch hoặc chuyển đổi vagrave vigrave thế DW được xem như lagrave một chuẩn cho việc lưu trữ

Đồng thời siecircu dữ liệu được ghi lại Cuối cugraveng DW hoặc siecircu thị coacute thể được sử dụng để tạo ra một kho dữ

liệu ldquocaacute nhacircnrdquo 7 Caacutec đặc điểm của kho dữ liệu

Đặc điểm Mocirc tả

Hướng chủ đề - DL tổ chức theo caacutech thức người dugraveng tham chiếu

Tiacutech hợp - Dữ liệu ldquosạchrdquo loại bỏ tiacutenh thiếu nhất quaacuten

Khocircng thay đổi - DL ldquochỉ đọcrdquo người dugraveng khocircng thay đổi được

Chuỗi thời gian - DL lagrave chuỗi thời gian khocircng phải lagrave trạng thaacutei hiện tại

Được tổng kết - DL vận hagravenhthao taacutec khi cần thiết

được kết hợp lại thagravenh dạng coacute thể dugraveng được cho quyết định

Kiacutech cỡ lớn hơn - Lưu giữ theo chuỗi thời gian tức lagrave giữ lại nhiều DL

Khocircng được chuẩn hoacutea - Coacute thể dư thừa DLSiecircu dữ liệu - Dữ liệu của dữ liệu được lưu trữNguồn dữ liệu - DL vận hagravenh (caacutec hệ sẵn coacute) cugraveng

với caacutec nguồn ngoagravei 8 Kho dữ liệu hướng chủ đề

Hướng chủ để coacute nghĩa lagrave kho dữ liệu được tổ chức xung quanh caacutec chủ đề chiacutenh như khaacutech hagraveng sản phẩm sản xuất Tập trung vagraveo việc mocirc higravenh hoacutea vagrave phacircn tiacutech dữ liệu cho caacutec nhagrave ra quyết định magrave khocircng tập trung vagraveo caacutec xử lyacute thocircng thường Cung cấp cho người dugraveng một khung nhigraven toagraven vẹn đơn giản vagrave đầy đủ về caacutec sự kiện quanh caacutec chủ đề

9 Dữ liệu trong DW được tiacutech hợp Dữ liệu trong kho dữ liệu được xacircy dựng bằng caacutech tổng hợp dữ liệu từ

nhiều nguồn khaacutec nhau vagrave caacutec nguồn coacute tổ chức khaacutec nhau Cơ sở dữ liệu caacutec file excel caacutec flat file hoặc caacutec raw file Khi đưa vagraveo kho dữ liệu caacutec dữ liệu được lagravem sạch vagrave tiacutech hợp dữ liệu nhằm đảm bảo tiacutenh nhất quaacuten của dữ liệu

10Kiến truacutec kho dữ liệu Tầng cơ sở dữ liệu hoạt động Tầng truy xuất thocircng tin Tầng truy xuất dữ liệu Tầng siecircu dữ liệu Tầng quản lyacute tiến trigravenh Tầng thocircng điệp của ứng dụng Tầng vật liacute của kho dữ liệu Tầng trigravenh diễn dữ liệu

11Higravenh trạng kho dữ liệu Kho dữ liệu ảo - người dugraveng cuối coacute thể truy cập trực tiếp đến kho dữ liệu

sử dụng caacutec cocircng cụ cho pheacutep ở tầng truy xuất dữ liệu Kho dữ liệu trung tacircm-1 cơ sở dữ liệu vật lyacute chứa tất cả dữ liệu cho một

vugraveng chuyecircn dụng nagraveo đoacute

Kho dữ liệu phacircn taacuten- Thagravenh phần được phacircn taacuten qua nhiều hệ cơ sở dữ liệu vật lyacute

12METADATA- Siecircu dữ liệu Định nghĩa Siecircu dữ liệu lagrave dữ liệu về dữ liệu Lagrave 1 lưu trữ dugraveng để

Miecircu tả kho dữ liệu tổng thể Nhận dạng kiểu kho dữ liệu Quản liacute quaacute trigravenh tiacutech hợp dữ liệu Quản liacute quaacute trigravenh cập nhật kho dữ liệu Quản liacute bảo mật

Lagrave chigravea khoacutea quyết định sự thagravenh cocircng của kho dữ liệu luocircn được thay đổi vagrave cập nhật theo sự phaacutet triển của kho dữ liệu

Dugraveng để quản liacute điều khiển kho dữ liệu Sự ra đời của kho dữ liệu như 1 cấu truacutec hỗ trợ ra quyết định siecircu dữ liệu

được xem như nguồn tagravei nguyecircn dữ liệu Siecircu dữ liệu lagrave trừu tượng Chuacuteng lagrave dữ liệu bậc cao cung cấp mocirc tả ngắn

gọn caacutec dữ liệu bậc thấp hơn 13Hoạt động của Siecircu dữ liệu

Siecircu dữ liệu rất cần thiết trong việc chuyển hoacutea thocircng tin trở thagravenh tri thức Lagrave chigravea khoacutea giuacutep chuacuteng ta xử lyacute được dữ liệu thocirc Viacute dụ một dograveng dữ liệu baacuten hagraveng 1023 K596 11121 agraveNoacute sẽ khocircng coacute nghĩa gigrave cho đến khi chuacuteng ta đưa vagraveo siecircu dữ liệu (thư

mục chứa dữ liệu) agrave cửa hagraveng 1023 sản phẩm K596 vagrave số tiền baacuten được lagrave 11121 đocirc la

14Sự cần thiết phải nhất quaacuten trong kho dữ liệu Kho dữ liệu được xacircy dựng cho lợi iacutech của những nhagrave phacircn tiacutech kinh

doanh caacutec nhagrave quản trị cho tất cả caacutec khu vực chức năng Trong cơ sở dữ liệu riecircng caacutec khu vực khaacutec nhau coacute thể định nghĩa vagrave lưu

trữ dữ liệu thocircng qua phiecircn bản của chiacutenh noacute Khi dữ liệu được lấy từ những vugraveng khaacutec nhau đoacute vagrave được đặt vagraveo kho dữ

liệu Việc chuyển đổi vagrave lagravem sạch caacutec tiến trigravenh sẽ đảm bảo noacute lagrave duy nhất được tiacutech hợp tại một mức của tổ chức

15Ragrave soaacutet lại dữ liệu ndash Thực thi siecircu dữ liệu

Bất kể cấu truacutec tự nhiecircn của 1 cacircu truy vấn thế nagraveo thigrave caacutec thagravenh phần của siecircu dữ liệu rất quan trọng đối với người ra quyết định

Bảng thuộc tiacutenh khoacutea được lưu trữ bởi kho dữ liệu Tập hợp dữ liệu được lấy từ đacircu Những chuyển đổi nagraveo được thực thi với việc lagravem sạch

16Siecircu dữ liệu lagrave gigrave Metadata - lagrave thocircng tin mocirc tả nội dung của cơ sở dữ liệu (CSDL) Metadata baacuteo cho người dugraveng biết thời gian cập nhật sau cugraveng của dữ liệu

định dạng vagrave mục điacutech sử dụng của noacute Những thocircng tin nagravey coacute thể hướng dẫn người dugraveng duyệt qua CSDL vagrave

giuacutep họ hiểu được yacute nghĩa vagrave ngữ cảnh của dữ liệu Trong CSDL metadata lagrave caacutec dạng biểu diễn khaacutec nhau của caacutec đối tượng

trong CSDL Trong CSDL quan hệ metadata lagrave caacutec định nghĩa của bảng cột CSDL

view vagrave nhiều đối tượng khaacutec Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột

một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi -gtMetadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu

Bảng chuyển đổi Ghi lại những chuyển đổi đatilde được thực hiện

Lịch sử thực thi Ghi lại những dữ liệu đatilde được

phacircn tiacutech

Higravenh thaacutei kết nốiGhi lại những dữ liệu được kết nối vagrave tần suất

17Aacutenh xạ thocircng thường của siecircu dữ liệu Bản ghi aacutenh xạ chuyển đổi bao gồm

Định danh của nguồn gốc Chuyển đổi thuộc tiacutenh Chuyển đổi thuộc tiacutenh vật lyacute Matilde hoacutea tham chiếu bảng chuyển đổi Đổi tecircn Đổi khoacutea Gaacuten giaacute trị cho thuộc tiacutenh mặc định Chọn logic cho caacutec nguồn nhiều giaacute trị Đổi thuật toaacuten

18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để

phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai

lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave

tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec

Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm

Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo

19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua

caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau

SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được

Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra

một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức

Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ

Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ

Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech

CHƯƠNG 11 KHAI PHAacute DỮ LIỆU

1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn

ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993

Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng

2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd

1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều

2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP

3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn

4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng

5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server

6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo

7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động

8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời

9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều

10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện

11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech

12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP

3 Xử lyacute phacircn tiacutech trực tuyến OLAP

MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave

dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu

ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave

thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu

HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave

ROLAP4 Khai phaacute dữ liệu

Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh

khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn

Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan

5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp

6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại

Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp

Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec

Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt

Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra

Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh

vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho

Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec

Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm

Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục

Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng

gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp

Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn

Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec

Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper

Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2

Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25

Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước

Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng

Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện

trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp

Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute

độ hỗ trợ ge ngưỡng minsup

độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan

Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn

Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết

Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu

MOLAP ROLAP HOLAP

Lưu trữ dữ liệu cơ sở

Khối Bảng quan hệ Bảng quan hệ

Lưu trữ thocircng tin tổng hợp

Khối Bảng quan hệ Khối

Hiệu suất thực hiện truy vấn

Nhanh nhất Chậm nhất Nhanh

Tiecircu thụ khocircng gian lưu trữ

Nhiều Thấp Trung bigravenh

Chi phiacute bảo trigrave Cao Thấp Trung bigravenh

Page 35: De cuong(1-11)

- Việcphaacutet triểncấu truacutecnecircn được theo dotildeitừ quaacute trigravenh thiết kế đến quaacute trigravenhthực hiện

- Tuy nhiecircn một dự aacuten phaacutet triển EIScoacute xu hướnglagrave thống nhấtvagraveyecircu cầu hỗ trợ caacutec nhagrave quản lyacute latildenh đạo

- Xacircy dựng một EIScoacute thểphaacutet hiện ra đượccaacutectigravenh huống khoacute khănmagravemột nhagrave phaacutet triển chưabao giờ gặp phải

Mocirc higravenh EIS

Khung phaacutet triển một EIS

- Watson et al đề nghị xacircy dựngkhung với ba thagravenh phần+ Caacutech tiếp cận tập trung vagraveo yếu tốcon người vagrave dữ liệu coacute liecircn quan đến EIS+ Quaacute trigravenh phaacutet triển cần sự linh hoạt vagrave tương taacutec+ Người sử dụng - hệ thống hộp thoại bao gồm một ngocircn ngữ hagravenh động để xử lyacute caacutec lệnh

Lợi iacutech của EIS- Dễ duy trigrave caacutec mục tiecircu coacute tổ chức- Dễ truy xuất thocircng tin- Cho pheacutep người sử dụng nacircng cao hiệu suất hơn

- Tăng chất lượng ra quyết định- Cung cấp sự cải tiến cạnh tranh- Tiết kiệm thời gian của người sử dụng- Tăng khả năng vagrave chất lượng giao tiếp- Cung cấp khả năng điều khiển tốt hơn trong tổ chức- Cho pheacutep tham gia caacutec vấn đề vagrave caacutec cơ hội- Cho pheacutep hoạch định- Cho pheacutep tigravem kiếm nguyecircn nhacircn của một vấn đề- Thảo matilden caacutec yecircu cầu của người điều hagravenh

Hạn chế của EIS vagrave 1 số sai lầm cần traacutenh

- Chi phiacute một cuộc khảo saacutetnăm1991 chothấychi phiacute phaacutet triểntrungbigravenh365000USDvớichi phiacute vận hagravenhhagraveng năm lagrave$200000 (EIS)

- Cocircng nghệ hạn chếEIScần phảiđượctiacutech hợp hoagraven toagravenvagraveokiếntruacuteccủadoanh nghiệphiện tại do đoacute noacutelagrave một thaacutech thứclớn đối vớithiết kế

- Hạn chế tổ chức cơ cấu tổ chứccoacute thể khocircng phugrave hợp

Sự hạn chế về tổ chức- Chương trigravenh nghị sự vagrave thời gian chệch EIS mocirc tả một phần việc thực hiện một

chương trigravenh nghị sự vagrave coacute thể dễ dagraveng đạt được sự tin cậy một caacutech chắc chắn- Đồng bộ hoacutea việc quản lyacute sự tin cậy đuacuteng luacutec đặc biệt baacuteo caacuteo EIS coacute thể phaacute

vỡ sự ổn định thiết lập caacutec chu trigravenh baacuteo caacuteo một caacutech tốt nhất- Sự bất ổn EIS phản ứng nhanh coacute thể gacircy ra việc taacutec động trở lại một caacutech

nhanh choacuteng dẫn đến sự thiếu ổn định trong tổ chức

Sự thất bại lagrave thay thế khocircng thể chấp nhận được- Một số yếu tố lagravem EIS thất bại

+ Thiếu sự hỗ trợ về mặt quản lyacute+ Vấn đề chiacutenh trị+ Thất bại của nhagrave phaacutet triển+ Lỗi về cocircng nghệ+ Giaacute cả+ Thời gian

66 Ra quyết định điều hagravenh trong tương lai vagrave EIS

- Coacute một vagravei điều kiện sẽ được hợp nhất cho việc chuyển đổi cocircng nghệ Trong đoacute một vagravei điều kiện coacute thể dễ dự đoaacuten Hai điều kiện magrave ta coacute thể thấy lagrave+ Phaacutet triển cocircng nghệ maacutey tiacutenh trong việc điều hagravenh sẽ tạo ra sự chuyển đổi được chấp nhận một caacutech dễ dagraveng hơn+ Mở rộng traacutech nhiệm điều hagravenh sẽ mở rộng nhu cầu thocircng tin

Tương lai của EIS- EIS thocircng minh Những tiến bộ trong cocircng nghệ AI sẽ được triển khai trong caacutec

EIS- EIS đa phương tiện Cơ sở dữ liệu đa phương tiện sẽ cho pheacutep tiacutech hợp văn bản

giọng noacutei vagrave higravenh ảnh trong tương lai- EIS thocircng tin Tương lai EIS sẽ mở rộng hơn trong việc sử dụng dữ liệu becircn

ngoagravei doanh nghiệp- EIS kết nối Giao tiếp với băng thocircng rộng cho pheacutep kết nối liecircn thocircng lớn hơn

Chương 7 HỆ CHUYEcircN GIA VAgrave TRIacute TUỆ NHAcircN TẠO

71 Caacutec khaacutei niệm

72 Triacute thocircng minh của triacute tuệ nhacircn tạo

73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia

74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia

75 Lợi iacutech vagrave hạn chế của hệ chuyecircn gia

71 Caacutec khaacutei niệm

Chuyecircn mocircn (Expertise) sự hiểu biết rộng trong 1 lĩnh vực hẹp

Hệ chuyecircn gia (Expert Systems)1 chương trigravenh maacutey tiacutenh sử dụng 1 tập caacutec luật dựa trecircn tri thức của con người để giải quyết caacutec vấn đề đogravei hogravei phải coacute sự chuyecircn mocircn

Một số hệ chuyecircn gia nổi tiếng

DENDRAL (Standford 1960s Edward Feigenbaum)

MYCIN (Standford1970s Edward Shortliffe)

PROSPECTOR (MIT 1979)

Triacute tuệ nhacircn tạo (Artificial Intelligence ndash AI)

Triacute tuệ nhacircn tạo một bộ phacircn của ngagravenh khoa học maacutey tiacutenh quan tacircm đến việc thiết kế caacutec hệ thống maacutey tiacutenh thocircng minh đoacute lagrave caacutec hệ thống đưa ra caacutec đặc điểm magrave từ đoacute chuacuteng ta liecircn hệ với sự thocircng minh trong hagravenh động của con người (Barr vagrave Feigenbaum 1981)

Mục điacutech của AI

Mục điacutech khoa học xaacutec định caacutec gợi yacute để giải thiacutech caacutec loại khaacutec nhau của triacute tuệ thực

Mục điacutech kỹ thuật giải quyết caacutec vấn đề trong thế giới thực

Triacute tuệ nhacircn tạo kế thừa nhiều yacute tưởng quan điểm kỹ thuật từ caacutec ngagravenh khoa học khaacutec

- Triết học

- Logic Toaacuten học

- Tiacutenh toaacuten

- Khoa học tacircm lyacute Khoa học nhận thức

- Sinh học Thần kinh học

- Tiến hoacutea

Caacutec lĩnh vực ứng dụng trong Triacute tuệ nhacircn tạo

Mạng nơ ron thần kinh (Neural Networks)

Tiacutenh toaacuten sự tiến hoacutea

(Evolutionary Computation)

Hệ chuyecircn gia (Expert Systems)

Kỹ thuật xử lyacute tiếng noacutei (Speech Processing)

Kỹ thuật xử lyacute ngocircn ngữ tự nhiecircn

(Natural Language Processing)

Lập kế hoạch (Planning)

Robot (Robotics)

Khoa học higravenh ảnh (Vision)

Caacutec kỹ thuật thocircng dụng dugraveng trong AI

Biểu diễn(Representation)

Học (Learning)

Caacutec luật (Rules)

Tigravem kiếm (Search)

72 Triacute thocircng minh của triacute tuệ nhacircn tạo

Con người suy diễn như thế nagraveo

Phacircn loại (Categorization)

Caacutec quy tắc cụ thể

Heuristics

Kinh nghiệm trước đoacute

Dự tiacutenh trước

Maacutey tiacutenh suy diễn như thế nagraveo

Lập luận dựa trecircn luật IF-THEN mocirc tả tri thức được matilde hoacutea dưới dạng caacutec luật

Caacutec khung (Frames) lagrave caacutec đại diện mocirc tả caacutec tigravenh huống giống nhau lagrave điển higravenh của một vagravei phacircn loại

Lập luận dựa trecircn caacutec trường hợp mocirc phỏng giải phaacutep trước đoacute cho một vấn đề hiện tại

Nhận dạng mẫu phaacutet hiện acircm thanh higravenh dạng hoặc caacutec chuỗi dagravei

Caacutec dạng khaacutec của Triacute tuệ nhacircn tạo

Học maacutey- mạng nơron vagrave giải thuật di truyền

Lập trigravenh tự động ndash lagrave những kỹ thuật tạo ra caacutec chương trigravenh để lagravem 1 nhiệm vụ riecircng biệt (cho pheacutep những người khocircng phải lagrave người lập trigravenh coacute thể lập trigravenh được)

Cuộc sống nhacircn tạo ndash nỗ lực để taacutei tạo caacutec hiện tượng sinh học trong caacutec hệ thống dựa trecircn maacutey tiacutenh

73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia(Expert Systems- ES)

Theo Jackson (1999) Một hệ chuyecircn gia lagrave một chương trigravenh maacutey tiacutenh mocirc tả vagrave suy diễn với tri thức của một vagravei lĩnh vực để giải quyết vấn đề hay đưa ra caacutec lời khuyecircn

Cấu truacutec cơ bản của ES được dựa theo cấu truacutec chung của DSS Sự khaacutec biệt chiacutenh giữa ES vagraveDSS lagrave hệ ES thu thập caacutec kiến thức từ những

chuyecircn gia trong lĩnh vực quan tacircmĐặc trưng của hệ chuyecircn gia Hiệu quả cao Thời gian trả lời thỏa đaacuteng Độ tin cậy cao Dễ hiểu

Giao diện người dugraveng trong ES

Thiết kế giao diện người dugraveng tập trung vagraveo caacutec yếu tố như dễ dagraveng sử dụngcoacute độ tin cậy cao giảm tải những khoacute khăn khi sử dụng

Thiết kế necircn coacute một số tương taacutec (đầu vagraveo kiểm soaacutet vagrave truy vấn)

Cấu tạo giao diện người dugraveng gồm coacute magraven higravenh cảm ứng bagraven phiacutem buacutet saacuteng lệnh thoại caacutec phiacutem chuyecircn dụng

Cơ sở tri thức (Knowledge Base)

Chứa đựng caacutec tri thức cụ thể miền thu được từ caacutec chuyecircn gia miền

Coacute thể chứa caacutec mocirc tả caacutec hagravenh vi giải quyết vấn đề caacutec ragraveng buộc caacutec heuristics

Thagravenh cocircng của một ES dựa trecircn tiacutenh đầy đủ vagrave tiacutenh chiacutenh xaacutec của cơ sở tri thức

Mocirc tơ suy diễn (Inference Engine)

Ở đacircy tri thức được đặt để sử dụng tạo ra caacutec giải phaacutep để giải quyết vấn đề

Mocirc tơ nagravey coacute khả năng thực hiện diễn dịch hoặc suy diễn dựa trecircn caacutec luật hay caacutec caacutec sự kiện

Đồng thời cũng coacute khả năng sử dụng caacutec suy diễn mờ hay khocircng chiacutenh xaacutec dựa trecircn xaacutec suất hay aacutenh xạ mẫu

Vograveng điều khiển suy diễn

1 Aacutenh xạ caacutec luật với caacutec sự kiện đatilde được cho

2 Chọn luật để thực hiện

3 Thực hiện luật bằng caacutech thecircm caacutec sự kiện được suy diễn ra vagraveo bộ nhớ lagravem việc

Chuỗi suy diễn (Chaining)

Suy diễn tiến (forward chaining) maacutey suy diễn bắt đầu từ dữ liệu ban đầu vagrave thực hiện việc suy luận để đưa ra caacutec kết luận cuối cugraveng

Suy diễn lugravei (backward chaining) maacutey suy diễn bắt đầu từ dữ liệu điacutech vagrave tigravem ra tri thức hỗ trợ cho dữ liệu điacutech đoacute

Viacute dụ suy diễn lugravei

R1 Nếu coacute A vagrave B thigrave suy ra coacute D

R2 Nếu coacute B thigrave suy ra coacute C

R3 Nếu coacute C vagrave D thigrave suy ra coacute E

Ta coacute E ta xem trong 3 luật R1 R2 R3 luật nagraveo coacute E ta thấy R3 chứa E đồng thời chứa C vagrave D Xeacutet tiếp trong 2 luật R1 R2 luật nagraveo chứa C vagrave D R2 chứa C R3 chứa D Từ đoacute ta coacute được caacutec tri thức hỗ trợ suy diễn vagrave kết luận lagrave nếu coacute A vagrave B thigrave sẽ coacute E Hay nếu A vagrave B đuacuteng thigrave sẽ coacute E

Viacute dụ suy diễn tiến

Giả sử coacute tập chứa 3 luật sau

R1 Nếu coacute A vagrave B thigrave suy ra coacute D

R2 Nếu coacute B thigrave suy ra coacute C

R3 Nếu coacute C vagrave D thigrave suy ra coacute E

Nếu ta coacute A vagrave B thigrave chuacuteng ta suy ra được D từ R1 vagrave suy ra C từ R2 Với D vagrave C đatilde được suy ra ở trecircn giờ chuacuteng ta suy ra được E từ R3

Viacute dụ thực tế

Giả sử muốn biết magraveu của một con vật nuocirci tecircn lagrave Fred biết rằng noacute kecircu ộp ộp vagrave ăn ruồi

Coacute tập 4 luật ban đầu như sau

R1 Nếu X kecircu ộp ộp vagrave ăn ruồi thigrave X lagrave con ếch

R2 Nếu X kecircu chiecircm chiếp vagrave biết hoacutet thigrave X lagrave con chim

R3 Nếu X lagrave con ếch thigrave X coacute magraveu xanh

R4 Nếu X lagrave con chim thigrave X coacute magraveu vagraveng

74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia

Expert system shells lagrave một tập caacutec goacutei phần mềm vagrave caacutec cocircng cụ dugraveng để phaacutet triển caacutec hệ chuyecircn gia

Những Expert system shells đầu tiecircn thường rất rườm ragrave Mặc dugrave vậy noacute vẫn giuacutep cho người sử dụng sẽ khocircng phải bắt đầu lại từ đầu khi xacircy dựng một hệ chuyecircn gia mới

Những shell hiện đại bao gồm hai mocirc-đun chiacutenh lagrave cocircng cụ xacircy dựng một tập quy tắc vagrave mocirc tơ suy diễn

Xacircy dựng hệ chuyecircn gia

Bước 1 xacircy dựng mocirc higravenh bagravei toaacuten xaacutec định vấn đề nhiệm vụ magrave hệ thống sẽ thực hiện Caacutec dạng bagravei toaacuten cần hệ chuyecircn gia

Bagravei toaacuten diễn giải (InterPretation)

Bagravei toaacuten dự baacuteo (Prediction)

Bagravei toaacuten chuẩn đoaacuten (Diagnose)

Bagravei toaacuten gỡ rối (Debugging)

Bagravei toaacuten thiết kế

Tương tự như một dự aacuten phần mềm để xacircy dựng một hệ chuyecircn gia cần phải coacute caacutec yếu tố về nhacircn lực tagravei nguyecircn vagrave thời gian Những yếu tố nagravey ảnh hưởng đến giaacute thah của một hệ chuyecircn giaTrong phần nagravey cacircu hỏi thường được đặt ra lagrave tại sao cần phải xacircy dựng một hệ chuyecircn giaTrước khi bắt đầu phải xaacute định rotilde bagravei toaacuten đạt ra lagrave jiAi lagrave chuyecircn giaAi lagrave người sử dụng

1 Diễn giải (InterPretation) Nghiecircn cứu 1 vấn đề -gt Dựa trecircn những biểu hiện thuộc tiacutenh đặc trưng becircn ngoagravei -gt Tư vấn

(hoặc đưa ra kết luận hay mocirc tả dễ hiểu từ tập dữ liệu thocirc)

2 Bagravei toaacuten dự baacuteo (Prediction) Coacute thể dự đoaacuten được hagravenh vi kết quả dựa trecircn caacutec hiện tượng -gt dự baacuteo

VD Dự baacuteo thời tiết động đấthellip

3 Bagravei toaacuten chẩn đoaacuten (Diagnoss) Xaacutec định caacutec lỗi caacutec bộ phận hỏng hoacutec của hệ thống dựa trecircn caacutec dữ liệu quan saacutet được

4 Bagravei toaacuten gỡ rối (Debugging) Mocirc tả caacutec phương phaacutep khắc phục hệ thống khi gặp sự cố

5 Bagravei toaacuten thiết kế Lựa chọn cấu higravenh caacutec đối tượng nhằm thoả matilden một số ragraveng buộc nagraveo đoacute

6 Giảng dạy Phần mềm dạy học coacute thể chuẩn đoaacuten vagrave sủa lỗi của học sinh trong quaacute trigravenh học tập

Để xaacutec định đuacuteng bagravei toaacuten magrave chuacuteng ta cần giải quyết thigrave phải trả lời đc một số cacircu hỏi

- cần hệ chuyecircn gia

Bước 2 thu thập tri thức lựa chọn cocircng cụ vagrave aacutep dụng

Trong bước thu thập tri thức vấn đề quan trọng lagrave lựa chọn chuyecircn gia những người magrave sẽ đoacuteng goacutep tri thức cho hệ thống Thocircng thường trong suốt quaacute trigravenh phaacutet triển thigrave chuyecircn gia được xem như một thagravenh viecircn của đội phaacutet triển

Hiện nay coacute rất nhiều cocircng cụ để xacircy dựng một hệ chuyecircn gia Phổ biến nhất lagrave JESS CLIPS vagrave OPS5

Bước 3 Thiết kế cơ sở tri thức thiết kế hệ thốngTri thức được biểu diễn trường minh trong cơ sở tri thức

Caacutec chuyecircn gia vagrave kỹ sư tri thức sẽ đối thoại với nhau bằng caacutec kỹ thuật đối thoại Suy diễn (SD) bảng Mocirc higravenh hoacutea SD quy nạp phacircn loại

Vấn đề bagraveo trigrave vagrave phaacutet triển

Caacutec hệ chuyecircn gia đogravei hỏi phải bảo trigrave vagrave phaacutet triển nhiều hơn so với caacutec hệ thống khaacutec Phải thường xuyecircn bổ sung tri thức mới vagrave thay đổi caacutec tri thức cũ để đổi mới hệ chuyecircn gia

Thu thập vagrave khắc phục lỗi do người sử dụng phaacutet hiện để kịp thời khắc phục những sai soacutet của hệ chuyecircn gia

75 Lợi iacutech vagrave hạn chế của caacutec hệ chuyecircn gia

Một số lợi iacutech chiacutenh

Thời gian trả lời hợp lyacute bằng hoặc nhanh hơn so với chuyecircn gia (người) để đi đến cugraveng một quyết định Hệ chuyecircn gia lagrave một hệ thống thời gian thực (real time system)

Khả năng trả lời với mức độ tinh thocircng bằng hoặc cao hơn so với chuyecircn gia (người) trong cugraveng lĩnh vực

Hệ chuyecircn gia giuacutep cho hiệu quả lagravem việc tăng bằng việc sử dụng tập caacutec luật một caacutech nhanh choacuteng magrave ko bị nhầm lẫn chuyecircn gia lagrave người coacute thể quecircn đi một số tri thức cơ sở lyacute luậ nhưng HCG thigrave ko

Quyết định của một người chuyecircn gia coacute thể bị thay đổi vagrave ko coacute tiacutenh thống nhất như quyết định của một hệ chuyecircn gia tạo ra

Hệ chuyecircn gia giuacutep cho người sử dụng coacute thể trau dồi sự hiểu biết trecircn lĩnh vuej cụ thể magrave noacute giải quyết hỗ trợ người ra quyết định coacute trigravenh độ như 1 chuyecircn gia trong quaacute trigravenh gia quyết định

Kiến thức của rất nhiều chuyecircn gia về một lĩnh vực nagraveo đoacute được đưa vagraveo hệ chuyecircn gia lagravem cho CSTT cuat HCG phong phuacute vagrave rộng lớn hơn rất nhiều

HCG giải thiacutech caacutec bước suy luận một caacutech dễ hiểu nhất quaacuten luacutec nagraveo cũng coacute thể sử dụng ko như chuyecircn gia con người

Hạn chế của caacutec hệ chuyecircn gia

Nhược điểm lớn nhất của hệ chuyecircn gia lagrave những yacute kiến chuyecircn mocircn thường rất khoacute matilde hoacutea vagrave giải neacuten

Hệ chuyecircn gia khocircng coacute khả năng tự học tự cập nhật kiến thức mới như caacutec chuyecircn gia magrave cần phải được matilde hoacutea lại khi noacute được cập nhật

Hệ chuyecircn gia khocircng thể nhận ra được vấn đề khocircng nằm trong miền kiến thức của hệ thống

Chương 8 Tri thức vagrave tiếp nhận

1 Bao gồm caacutec vấn đề

Dữ liệu thực tế đo lường hoặc quan saacutet coacute hoặc khocircng coacute bối cảnh

Thocircng tin dữ liệu được tổng hợp một caacutech hữu iacutech để giải quyết những khoacute khăn trong việc đưa ra quyết định

Tri thức bao gồm caacutec ứng dụng quy tắc thocircng tin hướng dẫn của người ra quyết định

2 Những caacutei nhigraven về tri thức

Đại diện lagravem thế nagraveo để diễn tả tri thức viacute dụ như một quyển saacutech khocircng phải lagrave tri thức nhưng noacute lại lagrave một đại diện của tri thức

Sản xuất tri thức lagrave một tập hơp của hagraveng tồn kho coacute thể được sản xuất cũng như mua lại

Tri thức lagrave 1 trong 6 trạng thaacutei của hệ thống

1Dữ liệu 2Thocircng tin 3Cấu truacutec thocircng tin 4Sự thấu hiểu 5Yacute kiến 6 Quyết định

3 Caacutec loại tri thức Phổ biến mocirc tả dữ liệu thocircng tin thủ tục mọi thứ lagravem như thế nagraveo lập luận chiacutenh saacutech hoặc caacutec quy tắc

4 Thu thập Tri thức hệ chuyecircn gia Hầu hết caacutec phương phaacutep đều bắt đầu với mocirc higravenh của caacutec taacutec vụ trong đoacute

hệ chuyecircn gia được xacircy dựng Trong đoacute mocirc tả về caacutec lĩnh vực được tạo ra Caacutec kỹ sư sử dụng caacutec mocirc higravenh giả thuyết vagrave nhận thức về quaacute trigravenh phacircn

tiacutech để gợi ra caacutech giải quyết vấn đề về tri thức từ caacutec chuyecircn gia

5 Caacutec chiều của thu thập tri thức KE- driven caacutec kỹ sư trao đổi trực tiếp với caacutec chuyecircn gia Expert-driven Caacutec chuyecircn gia trực tiếp đưa chuyecircn mocircn của họ vagraveo hệ

thống maacutey tiacutenh Machine-driven Sử dụng caacutec cocircng cụ suy luận để triacutech xuất tri thức từ một

tập caacutec viacute dụ

6 Kỹ thuật thu thập tri thức Trao đổi gồm 2 loại cơ bản lagrave coacute cấu truacutec(coacute kịch bản) vagrave khocircng coacute cấu

truacutec( đối thoại trực tiếp) Giao thức phacircn tiacutech bằng lời Khi caacutec chuyecircn gia thực hiện một cocircng việc

của họ thigrave một bản ghi về cocircng việc đoacute được thực hiện Caacutec kỹ sư sẽ xacircy dựng mocirc higravenh cho những gigrave được ghi lại trong bản ghi

Phương phaacutep sagraveng lọc caacutec chuyecircn gia so saacutenh caacutec nhoacutem liecircn tiếp trong ba đối tượng vagrave cho biết tại sao nhoacutem thứ hai lại khaacutec nhoacutem thứ ba

7 Thu thập tri thức từ nhiều nguồn Thu thập tri thức từ nhiều nguồn lagrave cần thiết để coacute được đầy đủ caacutec tri thức

cho một vấn đề quan điểm yacute kiến traacutei ngược nhau thường phaacutet sinh Phương phaacutep đồng thuận sẽ giuacutep giải quyết được vấn đề macircu thuẫn Kỹ thuật phacircn tiacutech Meta lagrave kỹ thuật được aacutep dụng trong caacutec trường hợp

khaacutec Caacutech tiếp cận bằng định lượng đogravei hỏi caacutec kỹ sư cần cacircn nhắc yếu tố đầu vagraveo của caacutec chuyecircn gia khaacutec nhau

8 Xaacutec nhận hợp lệ vagrave kiểm tra tri thức Một khi thu thập tri thức noacute phải được đaacutenh giaacute về khả năng sử dụng vagrave độ

chiacutenh xaacutec Hai vấn đề cụ thể lagrave hiệu lực của những kiến thức vagrave kiểm tra việc xacircy dựng cơ sở của tri thức

Cần xaacutec nhận xem liệu hệ thống coacute thể hoạt động ở mức độ tối thiểu khocircng

Xaacutec minh liecircn quan đến việc so saacutenh từng chi tiết kỹ thuật của hệ thống những gigrave đatilde được thực hiện cuối cugraveng

9 Một số caacutec biện phaacutep xaacutec nhận Độ chiacutenh xaacutec Khả năng thiacutech nghi Mức độ đầy đủ Bề rộng Độ sacircu Hiệu lực Tổng quan Chiacutenh xaacutec Hiện thực Độ tin cậy Tiacutenh hữu dụng Mức độ

Chương 9 Học maacutey

1 Logic mờ vagrave ngocircn ngữ mờ(Fuzzy Logic and Linguistic Ambiguity)

Ngocircn ngữ tự nhiecircn gồm những khaacutei niệm mơ hồ vagrave khocircng chiacutenh xaacutectruyền tải ngữ nghĩa thocircng qua tiacutenh xấp xỉkhocircng rotilde ragraveng

Những xấp xỉ nagravey giuacutep con người coacute thể truyền tải hết được yacute nghĩa nhưng maacutey thigrave khocircng hiểu

Lagravem sao biểu diễn caacutec tri thức sử dụng caacutec khaacutei niệm khocircng rotilde ragraveng(mờ) hoặc khocircng chiacutenh xaacutec

2 Khaacutei niệm cơ bản của logic mờ tập mờ lagrave những tập hợp khocircng coacute một giới hạn rotilde Mỗi phần tử của noacute chỉ

chứa một mức độ hagravem liecircn thuộc của từng phần tử Vigrave vậy tập mờ khocircng giống như tập cổ điển Tập mờ coacute thể kết hợp với nhau qua những luật mờ magrave đặc trưng cho những hagravenh động trạng thaacutei vagrave thuộc tiacutenh của logic mờ được tận dụng khi thực hiện một bộ điều khiển mờ

Logic mờ dựa trecircn yacute tưởng mỗi phần tử thuộc vagraveo một tập hợp ở một mức độ nagraveo đấy

Locircgic mờ cho pheacutep độ liecircn thuộc (microA )coacute giaacute trị trong khoảng (01) Locircgic mờ coacute thể được coi lagrave mặt ứng dụng của lyacute thuyết tập mờ để xử lyacute caacutec

giaacute trị trong thế giới thực cho caacutec bagravei toaacuten phức tạp

3 So saacutenh tiacutenh đuacuteng đắn logic mờ vagrave xaacutec suất Xaacutec suất thigrave đề cập đến khả năng xảy ra một biến cố hay một điều gigrave đoacute Logic mờ đề cập đến cấp độ magrave đặc tiacutenh ở hiện tại

o viacute dụ1 người coacute chiều cao 6 feet thigrave coacute cấp độ lagrave 05 về chiều cao

4 Ưu điểm của logic mờ Caacutech tiếp cận rất tự nhiecircnkhocircng phức tạp Coacute thể mocirc higravenh hoacutea caacutec hagravem phi tuyến tugravey yacute phức tạp

Coacute thể tận dụng được kinh nghiệm từ những chuyecircn gia hagraveng đầu trong mọi lĩnh vực

Logic mờ được xacircy dựng dựa trecircn ngocircn ngữ tự nhiecircnNền tảng của logic mờ lagrave dựa trecircn cơ sở giao tiếp của con người

5 Nhược điểm của logic mờ Trong 1 hệ thống phức tạpsử dụng logic mờ coacute thể trở thagravenh trở ngại cho

việc xaacutec thực độ tin cậy của hệ thống Cơ chế lập luận mờ khocircng thể học hỏi từ những lỗi sai

6 Mạng noron nhacircn tạo(ANN) Mạng noron nhacircn tạo lagrave một mocirc phỏng xử lyacute thocircng tinđược nghiecircn cứu ra

từ hệ thống thần kinh của sinh vậtgiống như bộ natildeo để xử lyacute thocircng tin ANNs lagrave chương trigravenh dựa trecircn maacutey tiacutenh đơn giản coacute chức năng lagrave một mocirc

higravenh bagravei toaacuten khocircng gian dựa trecircn thử nghiệm vagrave baacuteo lỗi

7 Học từ kinh nghiệm Tiến trigravenh Một mẫu dữ liệu được biểu diễn như một mạng lưới noronANN ldquodự

đoaacutenrdquo 1 đầu radự đoaacuten được so saacutenh với giaacute trị thực tế hoặc giaacute trị chiacutenh xaacutecNếu đoaacuten được chiacutenh xaacutec thigrave khocircng coacute hagravenh động nagraveo được thực hiện

Nếu dự đoaacuten sai ANN kiểm tra lại vagrave xaacutec định lại thocircng số để điều chỉnh Một mẫu dữ liệu khaacutec được biểu diễn vagrave quaacute trigravenh nagravey được lặp lại

8 Nguyecircn tắc cơ bản của cocircng nghệ nơron Caacutec yếu tố xử lyacute cơ bản trong hệ thống thần kinh của con người lagrave tế bagraveo

thần kinhMạng lưới của tế bagraveo nagravey lagrave liecircn kết với nhau nhận được thocircng tin từ caacutec cảm biến trong mắt taihellip

Thocircng tin nhận được bởi tế bagraveo thần kinh hoặc lagrave sẽ kiacutech thiacutech noacute(sẽ được chuyển qua 1 thocircng điệp dọc theo mạng lưới) hoặc lagrave sẽ ngăn cản noacute(ngăn cản dograveng thocircng tin)

Độ nhạy coacute thể thay đổi qua thời gian hoặc sau khi coacute được kinh nghiệm

9 Cấu truacutec mạng Một ANN gồm 3 lớp cơ bản

Lớp đầu vagraveo nhận dữ liệu Lớp becircn trong hoặc lagrave lớp ẩn xử lyacute dữ liệu Lớp đầu ra chuyển tiếp kết quả cuối cugraveng của mạng

10Mạng nơ ron Thường coacute nhiều đầu vagraveo mỗi đầu vagraveo với mức ảnh hưởng vagrave tầm quan

trọng riecircng của noacute Một đầu vagraveo quan trọng coacute thể được sử dụng để khuếch đại đầu ra caacutec hagravem trạng thaacutei tổng hợp caacutec trọng số của caacutec yếu tố

đầuvagraveo khaacutec nhauvagraveo một giaacute trị duy nhất Caacutec hagravem chuyển giao xử lyacute caacutec giaacute trị trạng thaacutei vagrave tạo đầu ra

11Huấn luyện mạng nơ ron Trong mocirc higravenh coacute giaacutem saacutetANN được đến so saacutenh dự đoaacuten của chiacutenh

noacute với thocircng tin phản hồi coacute chứa caacutec kết quả mong muốn ANN sẽ phải tigravem caacutech thay đổi caacutec tham số becircn trong củamigravenh (caacutec trọng số vagrave caacutec ngưỡng) để tạo necircn một aacutenh xạ coacute khả năng aacutenh xạcaacutec đầu vagraveo thagravenh caacutec đầu ra mong muốn Sự thay đổi nagravey được tiến hagravenh nhờ việc so saacutenh giữa đầu ra thực sự vagrave đầu ra mong muốn

Trong mocirc higravenh khocircng coacute giaacutem saacutetANN nhận được dữ liệu vagraveo nhưng khocircng phải coacute bất kỳ thocircng tin phản hồi về kết quả mong muốn

Phần lớn caacutec ứng dụng nằm trong vugraveng của caacutec bagravei toaacuten ước lượng như mocirc higravenh hoacuteathống kecirc neacuten lọc phacircn cụm

12Lợi iacutech Liecircn kết với mạng noron Traacutenh caacutech lập trigravenh tường minh Giảm nhu cầu của chuyecircn gia ANNs thigrave thiacutech nghi với caacutec yếu tố đầu vagraveo thay đổi Khocircng cần thiết cho cơ sở tri thức tinh chế ANNs coacute tiacutenh động vagrave cải thiện với việc sử dụng Coacute khả năng xử lyacute dữ liệu khocircng chiacutenh xaacutec hoặc khocircng đầy đủ Cho pheacutep tổng quaacutet hoacutea từ thocircng tin cụ thể Cho pheacutep thu thập cảm giaacutec thocircng thường vagraveo miền giải quyết vấn đề

13Hạn chế của việc liecircn kết với mạng noron ANNs khocircng thể giải thiacutech được suy luận Bản chất hộp đen thường khiến cho vấn đề traacutech nhiệm vagrave độ tin cậy phaacutet

sinh lagrave khoacute khăn Lặp đi lặp lại quaacute trigravenh huấn luyện rất tốn thời gian Nguồn lực caacutec nhagrave phacircn tiacutech vagrave thiết kế coacute tay nghề cao vẫn lagrave đaacuteng lo

ngại Cocircng nghệ ANN thuacutec đẩy hạn chế của phần cứng hiện tại ANN yecircu cầu phải coacute sự tin tưởng ở đầu ra

14Giới thiệu về thuật toaacuten di truyền Cũng như mạng lưới thần kinh caacutec thuật toaacuten di truyền được dựa trecircn lyacute

thuyết sinh học Thuật toaacuten di truyền tigravem thấy nguồn gốc của chuacuteng trong caacutec lyacute thuyết

tiến hoacutea của chọn lọc tự nhiecircn vagrave thiacutech ứng với biến đổi khiacute hậu Kết quả thuật toaacuten di truyền lagrave từ giao phối 2 caacute thể trong quần thế để tạo

ra con caacutei đocirci khi tốt hơn so với bậc cha mẹ của chuacuteng 15Caacutec thagravenh phần cơ bản của thuật toaacuten di truyền

Toaacuten tử chọn lọc Caacutec caacute thể tốt được chọn lọc để đưa vagraveo thế hệ sau Sự chọn lọc nagravey căn cứ vagraveo độ thiacutech nghi với mocirci trường của mỗi caacute thể

Toaacuten tử lai gheacutep (crossover) Hai caacute thể cha vagrave mẹ trao đổi caacutec gen với nhau để tạo ra caacute thể con

Toaacuten tử đột biến (mutation) Một caacute thể thay đổi một số gen để biến đổi thagravenh một caacute thể mớiTất cả caacutec toaacuten tử trecircn khi thực hiện đều mang tiacutenh ngẫu nhiecircn

16Quaacute trigravenh cơ bản của một thuật toaacuten di truyền Khởi tạo

Đaacutenh giaacute quần thể

Lựa chọn NST thiacutech hợp nhất vagrave loại bỏ NST yếu nhất

Quy trigravenh giao nhau vagrave cải thiện quần thể

đột biến tiến trigravenh để khaacutem phaacute ra NST mới

17Ưu nhược điểm của việc kết hợp với thuật toaacuten di truyền Kiacutech thước quần thể lagrave 1 yếu tố quan trọng trong tốc độ của việc tigravem

kiếmnhưng noacute tương đối dễ dagraveng để dự đoaacuten tốc độ nagravey Giao nhau hoặc đột biến lagrave khocircng necircn đc sử dụng quaacute thường xuyecircn Luocircn coacute được iacutet nhất 1 giải phaacutep hợp lyacute Necircn coacute thể aacutep dụng chuacuteng cho caacutec vấn đề magrave chuacuteng ta khocircng coacute hướng

về caacutech giải quyết Sức mạnh của thuật toaacuten xuất phaacutet từ khaacutei niệm đơn giảnkhocircng phải từ

một thủ tục thuật toaacuten phức tạp 18Tương lai của học maacutey

Mạng lưới thần kinh nhacircn tạo vượt quaacute năng lực của con người trong caacutec trường hợp bị cocirc lập

Về mặt lyacute thuyếtmột maacutey tiacutenh coacute thể xử lyacute dũ liệu nhanh hơn hagraveng triệu lần so với 1 con người

May mắn thay cho chuacuteng tacon người tốt hơn nhiều khi magrave coacute được dữ liệumaacutey tiacutenh khocircng coacute 1 số thứ như lagrave 5 giaacutec quan

CHƯƠNG 10 KHO DỮ LIỆU

1 Kho dữ liệu Kho dữ liệu lagrave tuyển tập caacutec cơ sở dữ liệu tiacutech hợp hướng chủ đề được

thiết kế để trợ giuacutep cho một hệ hỗ trợ quyết định

Theo John Ladley Cocircng nghệ kho dữ liệu lagrave tập caacutec phương phaacutep kỹ thuật vagrave caacutec cocircng cụ coacute thể kết hợp hỗ trợ nhau để cung cấp thocircng tin cho người sử dụng trecircn cơ sở tiacutech hợp từ nhiều nguồn dữ liệu nhiều mocirci trường khaacutec nhau

Kho dữ liệu thường rất lớn tới hagraveng trăm GB hay thậm chiacute hagraveng Terabyte

2 Kho dữ liệu vận hagravenh (ODS) Một kho dữ liệu vận hagravenh Aacutep dụng kỹ thuật kho dữ liệu vagraveo caacutec hệ xử

lyacute giao taacutec lưu trữ dữ liệu cho một ứng dụng đặc thugrave Noacute đưa vagraveo kho dữ liệu một dograveng caacutec dữ liệu thocirc được thiết kế

3 So saacutenh

Kho dữ liệu vận hagravenh Kho dữ liệu

Dữ liệu theo chủ đề Dữ liệu theo chủ đề

Dữ liệu tiacutech hợp Dữ liệu tiacutech hợp

Dữ liệu thay đổi Dữ liệu khocircng thay đổi

Dữ liệu được cập nhật khi thay đổi

Dữ liệu giữ nguyecircn

Chỉ coacute dữ liệu hiện tạiDữliệu hiện tại vagrave dữ liệu lịch sử

Chu kỳ lagravem tươi dữ liệu ngắn Chu kỳ lagravem tươi dữ liệu dagravei

Chỉ coacute dữ liệu chi tiết Dữ liệu chi tiết vagrave dữ liệu tổng kết

Dugraveng cho caacutec quyết định ngắn hạn

Dugraveng cho hoạch định dagravei hạn

4 Kho dữ liệu cục bộ (Data Mart - DM)

Kho dữ liệu cục bộ lagrave CSDL coacute những đặc điểm giống với kho dữ liệu nhưng với quy mocirc nhỏ hơn vagrave lưu trữ dữ liệu về một lĩnh vực một chuyecircn ngagravenh

Data mart phụ thuộc Chứa những dữ liệu được lấy từ DW vagrave những dữ liệu nagravey sẽ được triacutech lọc vagrave tinh chế tiacutech hợp lại ở mức cao hơn để phục vụ một chủ đề nhất định của Datamart

Data mart độc lập Khocircng giống như Datamart phụ thuộc Data mart độc lập được xacircy dựng trước DW vagrave dữ liệu được trực tiếp lấy từ caacutec nguồn khaacutec nhau

5 Siecircu dữ liệu Metadata lagrave dữ liệu để mocirc tả dữ liệu Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột

một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi Metadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu

6 Mocirci trường kho dữ liệu Hệ thống của tổ chức vagrave kho cung cấp dữ liệu để xacircy dựng kho dữ liệu Trong quaacute trigravenh chuyển dữ liệu từ caacutec nguồn khaacutec nhau dữ liệu coacute thể

được lagravem sạch hoặc chuyển đổi vagrave vigrave thế DW được xem như lagrave một chuẩn cho việc lưu trữ

Đồng thời siecircu dữ liệu được ghi lại Cuối cugraveng DW hoặc siecircu thị coacute thể được sử dụng để tạo ra một kho dữ

liệu ldquocaacute nhacircnrdquo 7 Caacutec đặc điểm của kho dữ liệu

Đặc điểm Mocirc tả

Hướng chủ đề - DL tổ chức theo caacutech thức người dugraveng tham chiếu

Tiacutech hợp - Dữ liệu ldquosạchrdquo loại bỏ tiacutenh thiếu nhất quaacuten

Khocircng thay đổi - DL ldquochỉ đọcrdquo người dugraveng khocircng thay đổi được

Chuỗi thời gian - DL lagrave chuỗi thời gian khocircng phải lagrave trạng thaacutei hiện tại

Được tổng kết - DL vận hagravenhthao taacutec khi cần thiết

được kết hợp lại thagravenh dạng coacute thể dugraveng được cho quyết định

Kiacutech cỡ lớn hơn - Lưu giữ theo chuỗi thời gian tức lagrave giữ lại nhiều DL

Khocircng được chuẩn hoacutea - Coacute thể dư thừa DLSiecircu dữ liệu - Dữ liệu của dữ liệu được lưu trữNguồn dữ liệu - DL vận hagravenh (caacutec hệ sẵn coacute) cugraveng

với caacutec nguồn ngoagravei 8 Kho dữ liệu hướng chủ đề

Hướng chủ để coacute nghĩa lagrave kho dữ liệu được tổ chức xung quanh caacutec chủ đề chiacutenh như khaacutech hagraveng sản phẩm sản xuất Tập trung vagraveo việc mocirc higravenh hoacutea vagrave phacircn tiacutech dữ liệu cho caacutec nhagrave ra quyết định magrave khocircng tập trung vagraveo caacutec xử lyacute thocircng thường Cung cấp cho người dugraveng một khung nhigraven toagraven vẹn đơn giản vagrave đầy đủ về caacutec sự kiện quanh caacutec chủ đề

9 Dữ liệu trong DW được tiacutech hợp Dữ liệu trong kho dữ liệu được xacircy dựng bằng caacutech tổng hợp dữ liệu từ

nhiều nguồn khaacutec nhau vagrave caacutec nguồn coacute tổ chức khaacutec nhau Cơ sở dữ liệu caacutec file excel caacutec flat file hoặc caacutec raw file Khi đưa vagraveo kho dữ liệu caacutec dữ liệu được lagravem sạch vagrave tiacutech hợp dữ liệu nhằm đảm bảo tiacutenh nhất quaacuten của dữ liệu

10Kiến truacutec kho dữ liệu Tầng cơ sở dữ liệu hoạt động Tầng truy xuất thocircng tin Tầng truy xuất dữ liệu Tầng siecircu dữ liệu Tầng quản lyacute tiến trigravenh Tầng thocircng điệp của ứng dụng Tầng vật liacute của kho dữ liệu Tầng trigravenh diễn dữ liệu

11Higravenh trạng kho dữ liệu Kho dữ liệu ảo - người dugraveng cuối coacute thể truy cập trực tiếp đến kho dữ liệu

sử dụng caacutec cocircng cụ cho pheacutep ở tầng truy xuất dữ liệu Kho dữ liệu trung tacircm-1 cơ sở dữ liệu vật lyacute chứa tất cả dữ liệu cho một

vugraveng chuyecircn dụng nagraveo đoacute

Kho dữ liệu phacircn taacuten- Thagravenh phần được phacircn taacuten qua nhiều hệ cơ sở dữ liệu vật lyacute

12METADATA- Siecircu dữ liệu Định nghĩa Siecircu dữ liệu lagrave dữ liệu về dữ liệu Lagrave 1 lưu trữ dugraveng để

Miecircu tả kho dữ liệu tổng thể Nhận dạng kiểu kho dữ liệu Quản liacute quaacute trigravenh tiacutech hợp dữ liệu Quản liacute quaacute trigravenh cập nhật kho dữ liệu Quản liacute bảo mật

Lagrave chigravea khoacutea quyết định sự thagravenh cocircng của kho dữ liệu luocircn được thay đổi vagrave cập nhật theo sự phaacutet triển của kho dữ liệu

Dugraveng để quản liacute điều khiển kho dữ liệu Sự ra đời của kho dữ liệu như 1 cấu truacutec hỗ trợ ra quyết định siecircu dữ liệu

được xem như nguồn tagravei nguyecircn dữ liệu Siecircu dữ liệu lagrave trừu tượng Chuacuteng lagrave dữ liệu bậc cao cung cấp mocirc tả ngắn

gọn caacutec dữ liệu bậc thấp hơn 13Hoạt động của Siecircu dữ liệu

Siecircu dữ liệu rất cần thiết trong việc chuyển hoacutea thocircng tin trở thagravenh tri thức Lagrave chigravea khoacutea giuacutep chuacuteng ta xử lyacute được dữ liệu thocirc Viacute dụ một dograveng dữ liệu baacuten hagraveng 1023 K596 11121 agraveNoacute sẽ khocircng coacute nghĩa gigrave cho đến khi chuacuteng ta đưa vagraveo siecircu dữ liệu (thư

mục chứa dữ liệu) agrave cửa hagraveng 1023 sản phẩm K596 vagrave số tiền baacuten được lagrave 11121 đocirc la

14Sự cần thiết phải nhất quaacuten trong kho dữ liệu Kho dữ liệu được xacircy dựng cho lợi iacutech của những nhagrave phacircn tiacutech kinh

doanh caacutec nhagrave quản trị cho tất cả caacutec khu vực chức năng Trong cơ sở dữ liệu riecircng caacutec khu vực khaacutec nhau coacute thể định nghĩa vagrave lưu

trữ dữ liệu thocircng qua phiecircn bản của chiacutenh noacute Khi dữ liệu được lấy từ những vugraveng khaacutec nhau đoacute vagrave được đặt vagraveo kho dữ

liệu Việc chuyển đổi vagrave lagravem sạch caacutec tiến trigravenh sẽ đảm bảo noacute lagrave duy nhất được tiacutech hợp tại một mức của tổ chức

15Ragrave soaacutet lại dữ liệu ndash Thực thi siecircu dữ liệu

Bất kể cấu truacutec tự nhiecircn của 1 cacircu truy vấn thế nagraveo thigrave caacutec thagravenh phần của siecircu dữ liệu rất quan trọng đối với người ra quyết định

Bảng thuộc tiacutenh khoacutea được lưu trữ bởi kho dữ liệu Tập hợp dữ liệu được lấy từ đacircu Những chuyển đổi nagraveo được thực thi với việc lagravem sạch

16Siecircu dữ liệu lagrave gigrave Metadata - lagrave thocircng tin mocirc tả nội dung của cơ sở dữ liệu (CSDL) Metadata baacuteo cho người dugraveng biết thời gian cập nhật sau cugraveng của dữ liệu

định dạng vagrave mục điacutech sử dụng của noacute Những thocircng tin nagravey coacute thể hướng dẫn người dugraveng duyệt qua CSDL vagrave

giuacutep họ hiểu được yacute nghĩa vagrave ngữ cảnh của dữ liệu Trong CSDL metadata lagrave caacutec dạng biểu diễn khaacutec nhau của caacutec đối tượng

trong CSDL Trong CSDL quan hệ metadata lagrave caacutec định nghĩa của bảng cột CSDL

view vagrave nhiều đối tượng khaacutec Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột

một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi -gtMetadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu

Bảng chuyển đổi Ghi lại những chuyển đổi đatilde được thực hiện

Lịch sử thực thi Ghi lại những dữ liệu đatilde được

phacircn tiacutech

Higravenh thaacutei kết nốiGhi lại những dữ liệu được kết nối vagrave tần suất

17Aacutenh xạ thocircng thường của siecircu dữ liệu Bản ghi aacutenh xạ chuyển đổi bao gồm

Định danh của nguồn gốc Chuyển đổi thuộc tiacutenh Chuyển đổi thuộc tiacutenh vật lyacute Matilde hoacutea tham chiếu bảng chuyển đổi Đổi tecircn Đổi khoacutea Gaacuten giaacute trị cho thuộc tiacutenh mặc định Chọn logic cho caacutec nguồn nhiều giaacute trị Đổi thuật toaacuten

18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để

phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai

lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave

tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec

Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm

Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo

19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua

caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau

SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được

Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra

một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức

Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ

Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ

Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech

CHƯƠNG 11 KHAI PHAacute DỮ LIỆU

1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn

ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993

Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng

2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd

1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều

2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP

3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn

4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng

5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server

6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo

7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động

8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời

9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều

10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện

11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech

12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP

3 Xử lyacute phacircn tiacutech trực tuyến OLAP

MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave

dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu

ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave

thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu

HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave

ROLAP4 Khai phaacute dữ liệu

Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh

khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn

Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan

5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp

6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại

Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp

Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec

Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt

Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra

Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh

vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho

Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec

Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm

Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục

Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng

gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp

Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn

Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec

Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper

Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2

Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25

Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước

Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng

Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện

trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp

Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute

độ hỗ trợ ge ngưỡng minsup

độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan

Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn

Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết

Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu

MOLAP ROLAP HOLAP

Lưu trữ dữ liệu cơ sở

Khối Bảng quan hệ Bảng quan hệ

Lưu trữ thocircng tin tổng hợp

Khối Bảng quan hệ Khối

Hiệu suất thực hiện truy vấn

Nhanh nhất Chậm nhất Nhanh

Tiecircu thụ khocircng gian lưu trữ

Nhiều Thấp Trung bigravenh

Chi phiacute bảo trigrave Cao Thấp Trung bigravenh

Page 36: De cuong(1-11)

- Tăng chất lượng ra quyết định- Cung cấp sự cải tiến cạnh tranh- Tiết kiệm thời gian của người sử dụng- Tăng khả năng vagrave chất lượng giao tiếp- Cung cấp khả năng điều khiển tốt hơn trong tổ chức- Cho pheacutep tham gia caacutec vấn đề vagrave caacutec cơ hội- Cho pheacutep hoạch định- Cho pheacutep tigravem kiếm nguyecircn nhacircn của một vấn đề- Thảo matilden caacutec yecircu cầu của người điều hagravenh

Hạn chế của EIS vagrave 1 số sai lầm cần traacutenh

- Chi phiacute một cuộc khảo saacutetnăm1991 chothấychi phiacute phaacutet triểntrungbigravenh365000USDvớichi phiacute vận hagravenhhagraveng năm lagrave$200000 (EIS)

- Cocircng nghệ hạn chếEIScần phảiđượctiacutech hợp hoagraven toagravenvagraveokiếntruacuteccủadoanh nghiệphiện tại do đoacute noacutelagrave một thaacutech thứclớn đối vớithiết kế

- Hạn chế tổ chức cơ cấu tổ chứccoacute thể khocircng phugrave hợp

Sự hạn chế về tổ chức- Chương trigravenh nghị sự vagrave thời gian chệch EIS mocirc tả một phần việc thực hiện một

chương trigravenh nghị sự vagrave coacute thể dễ dagraveng đạt được sự tin cậy một caacutech chắc chắn- Đồng bộ hoacutea việc quản lyacute sự tin cậy đuacuteng luacutec đặc biệt baacuteo caacuteo EIS coacute thể phaacute

vỡ sự ổn định thiết lập caacutec chu trigravenh baacuteo caacuteo một caacutech tốt nhất- Sự bất ổn EIS phản ứng nhanh coacute thể gacircy ra việc taacutec động trở lại một caacutech

nhanh choacuteng dẫn đến sự thiếu ổn định trong tổ chức

Sự thất bại lagrave thay thế khocircng thể chấp nhận được- Một số yếu tố lagravem EIS thất bại

+ Thiếu sự hỗ trợ về mặt quản lyacute+ Vấn đề chiacutenh trị+ Thất bại của nhagrave phaacutet triển+ Lỗi về cocircng nghệ+ Giaacute cả+ Thời gian

66 Ra quyết định điều hagravenh trong tương lai vagrave EIS

- Coacute một vagravei điều kiện sẽ được hợp nhất cho việc chuyển đổi cocircng nghệ Trong đoacute một vagravei điều kiện coacute thể dễ dự đoaacuten Hai điều kiện magrave ta coacute thể thấy lagrave+ Phaacutet triển cocircng nghệ maacutey tiacutenh trong việc điều hagravenh sẽ tạo ra sự chuyển đổi được chấp nhận một caacutech dễ dagraveng hơn+ Mở rộng traacutech nhiệm điều hagravenh sẽ mở rộng nhu cầu thocircng tin

Tương lai của EIS- EIS thocircng minh Những tiến bộ trong cocircng nghệ AI sẽ được triển khai trong caacutec

EIS- EIS đa phương tiện Cơ sở dữ liệu đa phương tiện sẽ cho pheacutep tiacutech hợp văn bản

giọng noacutei vagrave higravenh ảnh trong tương lai- EIS thocircng tin Tương lai EIS sẽ mở rộng hơn trong việc sử dụng dữ liệu becircn

ngoagravei doanh nghiệp- EIS kết nối Giao tiếp với băng thocircng rộng cho pheacutep kết nối liecircn thocircng lớn hơn

Chương 7 HỆ CHUYEcircN GIA VAgrave TRIacute TUỆ NHAcircN TẠO

71 Caacutec khaacutei niệm

72 Triacute thocircng minh của triacute tuệ nhacircn tạo

73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia

74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia

75 Lợi iacutech vagrave hạn chế của hệ chuyecircn gia

71 Caacutec khaacutei niệm

Chuyecircn mocircn (Expertise) sự hiểu biết rộng trong 1 lĩnh vực hẹp

Hệ chuyecircn gia (Expert Systems)1 chương trigravenh maacutey tiacutenh sử dụng 1 tập caacutec luật dựa trecircn tri thức của con người để giải quyết caacutec vấn đề đogravei hogravei phải coacute sự chuyecircn mocircn

Một số hệ chuyecircn gia nổi tiếng

DENDRAL (Standford 1960s Edward Feigenbaum)

MYCIN (Standford1970s Edward Shortliffe)

PROSPECTOR (MIT 1979)

Triacute tuệ nhacircn tạo (Artificial Intelligence ndash AI)

Triacute tuệ nhacircn tạo một bộ phacircn của ngagravenh khoa học maacutey tiacutenh quan tacircm đến việc thiết kế caacutec hệ thống maacutey tiacutenh thocircng minh đoacute lagrave caacutec hệ thống đưa ra caacutec đặc điểm magrave từ đoacute chuacuteng ta liecircn hệ với sự thocircng minh trong hagravenh động của con người (Barr vagrave Feigenbaum 1981)

Mục điacutech của AI

Mục điacutech khoa học xaacutec định caacutec gợi yacute để giải thiacutech caacutec loại khaacutec nhau của triacute tuệ thực

Mục điacutech kỹ thuật giải quyết caacutec vấn đề trong thế giới thực

Triacute tuệ nhacircn tạo kế thừa nhiều yacute tưởng quan điểm kỹ thuật từ caacutec ngagravenh khoa học khaacutec

- Triết học

- Logic Toaacuten học

- Tiacutenh toaacuten

- Khoa học tacircm lyacute Khoa học nhận thức

- Sinh học Thần kinh học

- Tiến hoacutea

Caacutec lĩnh vực ứng dụng trong Triacute tuệ nhacircn tạo

Mạng nơ ron thần kinh (Neural Networks)

Tiacutenh toaacuten sự tiến hoacutea

(Evolutionary Computation)

Hệ chuyecircn gia (Expert Systems)

Kỹ thuật xử lyacute tiếng noacutei (Speech Processing)

Kỹ thuật xử lyacute ngocircn ngữ tự nhiecircn

(Natural Language Processing)

Lập kế hoạch (Planning)

Robot (Robotics)

Khoa học higravenh ảnh (Vision)

Caacutec kỹ thuật thocircng dụng dugraveng trong AI

Biểu diễn(Representation)

Học (Learning)

Caacutec luật (Rules)

Tigravem kiếm (Search)

72 Triacute thocircng minh của triacute tuệ nhacircn tạo

Con người suy diễn như thế nagraveo

Phacircn loại (Categorization)

Caacutec quy tắc cụ thể

Heuristics

Kinh nghiệm trước đoacute

Dự tiacutenh trước

Maacutey tiacutenh suy diễn như thế nagraveo

Lập luận dựa trecircn luật IF-THEN mocirc tả tri thức được matilde hoacutea dưới dạng caacutec luật

Caacutec khung (Frames) lagrave caacutec đại diện mocirc tả caacutec tigravenh huống giống nhau lagrave điển higravenh của một vagravei phacircn loại

Lập luận dựa trecircn caacutec trường hợp mocirc phỏng giải phaacutep trước đoacute cho một vấn đề hiện tại

Nhận dạng mẫu phaacutet hiện acircm thanh higravenh dạng hoặc caacutec chuỗi dagravei

Caacutec dạng khaacutec của Triacute tuệ nhacircn tạo

Học maacutey- mạng nơron vagrave giải thuật di truyền

Lập trigravenh tự động ndash lagrave những kỹ thuật tạo ra caacutec chương trigravenh để lagravem 1 nhiệm vụ riecircng biệt (cho pheacutep những người khocircng phải lagrave người lập trigravenh coacute thể lập trigravenh được)

Cuộc sống nhacircn tạo ndash nỗ lực để taacutei tạo caacutec hiện tượng sinh học trong caacutec hệ thống dựa trecircn maacutey tiacutenh

73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia(Expert Systems- ES)

Theo Jackson (1999) Một hệ chuyecircn gia lagrave một chương trigravenh maacutey tiacutenh mocirc tả vagrave suy diễn với tri thức của một vagravei lĩnh vực để giải quyết vấn đề hay đưa ra caacutec lời khuyecircn

Cấu truacutec cơ bản của ES được dựa theo cấu truacutec chung của DSS Sự khaacutec biệt chiacutenh giữa ES vagraveDSS lagrave hệ ES thu thập caacutec kiến thức từ những

chuyecircn gia trong lĩnh vực quan tacircmĐặc trưng của hệ chuyecircn gia Hiệu quả cao Thời gian trả lời thỏa đaacuteng Độ tin cậy cao Dễ hiểu

Giao diện người dugraveng trong ES

Thiết kế giao diện người dugraveng tập trung vagraveo caacutec yếu tố như dễ dagraveng sử dụngcoacute độ tin cậy cao giảm tải những khoacute khăn khi sử dụng

Thiết kế necircn coacute một số tương taacutec (đầu vagraveo kiểm soaacutet vagrave truy vấn)

Cấu tạo giao diện người dugraveng gồm coacute magraven higravenh cảm ứng bagraven phiacutem buacutet saacuteng lệnh thoại caacutec phiacutem chuyecircn dụng

Cơ sở tri thức (Knowledge Base)

Chứa đựng caacutec tri thức cụ thể miền thu được từ caacutec chuyecircn gia miền

Coacute thể chứa caacutec mocirc tả caacutec hagravenh vi giải quyết vấn đề caacutec ragraveng buộc caacutec heuristics

Thagravenh cocircng của một ES dựa trecircn tiacutenh đầy đủ vagrave tiacutenh chiacutenh xaacutec của cơ sở tri thức

Mocirc tơ suy diễn (Inference Engine)

Ở đacircy tri thức được đặt để sử dụng tạo ra caacutec giải phaacutep để giải quyết vấn đề

Mocirc tơ nagravey coacute khả năng thực hiện diễn dịch hoặc suy diễn dựa trecircn caacutec luật hay caacutec caacutec sự kiện

Đồng thời cũng coacute khả năng sử dụng caacutec suy diễn mờ hay khocircng chiacutenh xaacutec dựa trecircn xaacutec suất hay aacutenh xạ mẫu

Vograveng điều khiển suy diễn

1 Aacutenh xạ caacutec luật với caacutec sự kiện đatilde được cho

2 Chọn luật để thực hiện

3 Thực hiện luật bằng caacutech thecircm caacutec sự kiện được suy diễn ra vagraveo bộ nhớ lagravem việc

Chuỗi suy diễn (Chaining)

Suy diễn tiến (forward chaining) maacutey suy diễn bắt đầu từ dữ liệu ban đầu vagrave thực hiện việc suy luận để đưa ra caacutec kết luận cuối cugraveng

Suy diễn lugravei (backward chaining) maacutey suy diễn bắt đầu từ dữ liệu điacutech vagrave tigravem ra tri thức hỗ trợ cho dữ liệu điacutech đoacute

Viacute dụ suy diễn lugravei

R1 Nếu coacute A vagrave B thigrave suy ra coacute D

R2 Nếu coacute B thigrave suy ra coacute C

R3 Nếu coacute C vagrave D thigrave suy ra coacute E

Ta coacute E ta xem trong 3 luật R1 R2 R3 luật nagraveo coacute E ta thấy R3 chứa E đồng thời chứa C vagrave D Xeacutet tiếp trong 2 luật R1 R2 luật nagraveo chứa C vagrave D R2 chứa C R3 chứa D Từ đoacute ta coacute được caacutec tri thức hỗ trợ suy diễn vagrave kết luận lagrave nếu coacute A vagrave B thigrave sẽ coacute E Hay nếu A vagrave B đuacuteng thigrave sẽ coacute E

Viacute dụ suy diễn tiến

Giả sử coacute tập chứa 3 luật sau

R1 Nếu coacute A vagrave B thigrave suy ra coacute D

R2 Nếu coacute B thigrave suy ra coacute C

R3 Nếu coacute C vagrave D thigrave suy ra coacute E

Nếu ta coacute A vagrave B thigrave chuacuteng ta suy ra được D từ R1 vagrave suy ra C từ R2 Với D vagrave C đatilde được suy ra ở trecircn giờ chuacuteng ta suy ra được E từ R3

Viacute dụ thực tế

Giả sử muốn biết magraveu của một con vật nuocirci tecircn lagrave Fred biết rằng noacute kecircu ộp ộp vagrave ăn ruồi

Coacute tập 4 luật ban đầu như sau

R1 Nếu X kecircu ộp ộp vagrave ăn ruồi thigrave X lagrave con ếch

R2 Nếu X kecircu chiecircm chiếp vagrave biết hoacutet thigrave X lagrave con chim

R3 Nếu X lagrave con ếch thigrave X coacute magraveu xanh

R4 Nếu X lagrave con chim thigrave X coacute magraveu vagraveng

74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia

Expert system shells lagrave một tập caacutec goacutei phần mềm vagrave caacutec cocircng cụ dugraveng để phaacutet triển caacutec hệ chuyecircn gia

Những Expert system shells đầu tiecircn thường rất rườm ragrave Mặc dugrave vậy noacute vẫn giuacutep cho người sử dụng sẽ khocircng phải bắt đầu lại từ đầu khi xacircy dựng một hệ chuyecircn gia mới

Những shell hiện đại bao gồm hai mocirc-đun chiacutenh lagrave cocircng cụ xacircy dựng một tập quy tắc vagrave mocirc tơ suy diễn

Xacircy dựng hệ chuyecircn gia

Bước 1 xacircy dựng mocirc higravenh bagravei toaacuten xaacutec định vấn đề nhiệm vụ magrave hệ thống sẽ thực hiện Caacutec dạng bagravei toaacuten cần hệ chuyecircn gia

Bagravei toaacuten diễn giải (InterPretation)

Bagravei toaacuten dự baacuteo (Prediction)

Bagravei toaacuten chuẩn đoaacuten (Diagnose)

Bagravei toaacuten gỡ rối (Debugging)

Bagravei toaacuten thiết kế

Tương tự như một dự aacuten phần mềm để xacircy dựng một hệ chuyecircn gia cần phải coacute caacutec yếu tố về nhacircn lực tagravei nguyecircn vagrave thời gian Những yếu tố nagravey ảnh hưởng đến giaacute thah của một hệ chuyecircn giaTrong phần nagravey cacircu hỏi thường được đặt ra lagrave tại sao cần phải xacircy dựng một hệ chuyecircn giaTrước khi bắt đầu phải xaacute định rotilde bagravei toaacuten đạt ra lagrave jiAi lagrave chuyecircn giaAi lagrave người sử dụng

1 Diễn giải (InterPretation) Nghiecircn cứu 1 vấn đề -gt Dựa trecircn những biểu hiện thuộc tiacutenh đặc trưng becircn ngoagravei -gt Tư vấn

(hoặc đưa ra kết luận hay mocirc tả dễ hiểu từ tập dữ liệu thocirc)

2 Bagravei toaacuten dự baacuteo (Prediction) Coacute thể dự đoaacuten được hagravenh vi kết quả dựa trecircn caacutec hiện tượng -gt dự baacuteo

VD Dự baacuteo thời tiết động đấthellip

3 Bagravei toaacuten chẩn đoaacuten (Diagnoss) Xaacutec định caacutec lỗi caacutec bộ phận hỏng hoacutec của hệ thống dựa trecircn caacutec dữ liệu quan saacutet được

4 Bagravei toaacuten gỡ rối (Debugging) Mocirc tả caacutec phương phaacutep khắc phục hệ thống khi gặp sự cố

5 Bagravei toaacuten thiết kế Lựa chọn cấu higravenh caacutec đối tượng nhằm thoả matilden một số ragraveng buộc nagraveo đoacute

6 Giảng dạy Phần mềm dạy học coacute thể chuẩn đoaacuten vagrave sủa lỗi của học sinh trong quaacute trigravenh học tập

Để xaacutec định đuacuteng bagravei toaacuten magrave chuacuteng ta cần giải quyết thigrave phải trả lời đc một số cacircu hỏi

- cần hệ chuyecircn gia

Bước 2 thu thập tri thức lựa chọn cocircng cụ vagrave aacutep dụng

Trong bước thu thập tri thức vấn đề quan trọng lagrave lựa chọn chuyecircn gia những người magrave sẽ đoacuteng goacutep tri thức cho hệ thống Thocircng thường trong suốt quaacute trigravenh phaacutet triển thigrave chuyecircn gia được xem như một thagravenh viecircn của đội phaacutet triển

Hiện nay coacute rất nhiều cocircng cụ để xacircy dựng một hệ chuyecircn gia Phổ biến nhất lagrave JESS CLIPS vagrave OPS5

Bước 3 Thiết kế cơ sở tri thức thiết kế hệ thốngTri thức được biểu diễn trường minh trong cơ sở tri thức

Caacutec chuyecircn gia vagrave kỹ sư tri thức sẽ đối thoại với nhau bằng caacutec kỹ thuật đối thoại Suy diễn (SD) bảng Mocirc higravenh hoacutea SD quy nạp phacircn loại

Vấn đề bagraveo trigrave vagrave phaacutet triển

Caacutec hệ chuyecircn gia đogravei hỏi phải bảo trigrave vagrave phaacutet triển nhiều hơn so với caacutec hệ thống khaacutec Phải thường xuyecircn bổ sung tri thức mới vagrave thay đổi caacutec tri thức cũ để đổi mới hệ chuyecircn gia

Thu thập vagrave khắc phục lỗi do người sử dụng phaacutet hiện để kịp thời khắc phục những sai soacutet của hệ chuyecircn gia

75 Lợi iacutech vagrave hạn chế của caacutec hệ chuyecircn gia

Một số lợi iacutech chiacutenh

Thời gian trả lời hợp lyacute bằng hoặc nhanh hơn so với chuyecircn gia (người) để đi đến cugraveng một quyết định Hệ chuyecircn gia lagrave một hệ thống thời gian thực (real time system)

Khả năng trả lời với mức độ tinh thocircng bằng hoặc cao hơn so với chuyecircn gia (người) trong cugraveng lĩnh vực

Hệ chuyecircn gia giuacutep cho hiệu quả lagravem việc tăng bằng việc sử dụng tập caacutec luật một caacutech nhanh choacuteng magrave ko bị nhầm lẫn chuyecircn gia lagrave người coacute thể quecircn đi một số tri thức cơ sở lyacute luậ nhưng HCG thigrave ko

Quyết định của một người chuyecircn gia coacute thể bị thay đổi vagrave ko coacute tiacutenh thống nhất như quyết định của một hệ chuyecircn gia tạo ra

Hệ chuyecircn gia giuacutep cho người sử dụng coacute thể trau dồi sự hiểu biết trecircn lĩnh vuej cụ thể magrave noacute giải quyết hỗ trợ người ra quyết định coacute trigravenh độ như 1 chuyecircn gia trong quaacute trigravenh gia quyết định

Kiến thức của rất nhiều chuyecircn gia về một lĩnh vực nagraveo đoacute được đưa vagraveo hệ chuyecircn gia lagravem cho CSTT cuat HCG phong phuacute vagrave rộng lớn hơn rất nhiều

HCG giải thiacutech caacutec bước suy luận một caacutech dễ hiểu nhất quaacuten luacutec nagraveo cũng coacute thể sử dụng ko như chuyecircn gia con người

Hạn chế của caacutec hệ chuyecircn gia

Nhược điểm lớn nhất của hệ chuyecircn gia lagrave những yacute kiến chuyecircn mocircn thường rất khoacute matilde hoacutea vagrave giải neacuten

Hệ chuyecircn gia khocircng coacute khả năng tự học tự cập nhật kiến thức mới như caacutec chuyecircn gia magrave cần phải được matilde hoacutea lại khi noacute được cập nhật

Hệ chuyecircn gia khocircng thể nhận ra được vấn đề khocircng nằm trong miền kiến thức của hệ thống

Chương 8 Tri thức vagrave tiếp nhận

1 Bao gồm caacutec vấn đề

Dữ liệu thực tế đo lường hoặc quan saacutet coacute hoặc khocircng coacute bối cảnh

Thocircng tin dữ liệu được tổng hợp một caacutech hữu iacutech để giải quyết những khoacute khăn trong việc đưa ra quyết định

Tri thức bao gồm caacutec ứng dụng quy tắc thocircng tin hướng dẫn của người ra quyết định

2 Những caacutei nhigraven về tri thức

Đại diện lagravem thế nagraveo để diễn tả tri thức viacute dụ như một quyển saacutech khocircng phải lagrave tri thức nhưng noacute lại lagrave một đại diện của tri thức

Sản xuất tri thức lagrave một tập hơp của hagraveng tồn kho coacute thể được sản xuất cũng như mua lại

Tri thức lagrave 1 trong 6 trạng thaacutei của hệ thống

1Dữ liệu 2Thocircng tin 3Cấu truacutec thocircng tin 4Sự thấu hiểu 5Yacute kiến 6 Quyết định

3 Caacutec loại tri thức Phổ biến mocirc tả dữ liệu thocircng tin thủ tục mọi thứ lagravem như thế nagraveo lập luận chiacutenh saacutech hoặc caacutec quy tắc

4 Thu thập Tri thức hệ chuyecircn gia Hầu hết caacutec phương phaacutep đều bắt đầu với mocirc higravenh của caacutec taacutec vụ trong đoacute

hệ chuyecircn gia được xacircy dựng Trong đoacute mocirc tả về caacutec lĩnh vực được tạo ra Caacutec kỹ sư sử dụng caacutec mocirc higravenh giả thuyết vagrave nhận thức về quaacute trigravenh phacircn

tiacutech để gợi ra caacutech giải quyết vấn đề về tri thức từ caacutec chuyecircn gia

5 Caacutec chiều của thu thập tri thức KE- driven caacutec kỹ sư trao đổi trực tiếp với caacutec chuyecircn gia Expert-driven Caacutec chuyecircn gia trực tiếp đưa chuyecircn mocircn của họ vagraveo hệ

thống maacutey tiacutenh Machine-driven Sử dụng caacutec cocircng cụ suy luận để triacutech xuất tri thức từ một

tập caacutec viacute dụ

6 Kỹ thuật thu thập tri thức Trao đổi gồm 2 loại cơ bản lagrave coacute cấu truacutec(coacute kịch bản) vagrave khocircng coacute cấu

truacutec( đối thoại trực tiếp) Giao thức phacircn tiacutech bằng lời Khi caacutec chuyecircn gia thực hiện một cocircng việc

của họ thigrave một bản ghi về cocircng việc đoacute được thực hiện Caacutec kỹ sư sẽ xacircy dựng mocirc higravenh cho những gigrave được ghi lại trong bản ghi

Phương phaacutep sagraveng lọc caacutec chuyecircn gia so saacutenh caacutec nhoacutem liecircn tiếp trong ba đối tượng vagrave cho biết tại sao nhoacutem thứ hai lại khaacutec nhoacutem thứ ba

7 Thu thập tri thức từ nhiều nguồn Thu thập tri thức từ nhiều nguồn lagrave cần thiết để coacute được đầy đủ caacutec tri thức

cho một vấn đề quan điểm yacute kiến traacutei ngược nhau thường phaacutet sinh Phương phaacutep đồng thuận sẽ giuacutep giải quyết được vấn đề macircu thuẫn Kỹ thuật phacircn tiacutech Meta lagrave kỹ thuật được aacutep dụng trong caacutec trường hợp

khaacutec Caacutech tiếp cận bằng định lượng đogravei hỏi caacutec kỹ sư cần cacircn nhắc yếu tố đầu vagraveo của caacutec chuyecircn gia khaacutec nhau

8 Xaacutec nhận hợp lệ vagrave kiểm tra tri thức Một khi thu thập tri thức noacute phải được đaacutenh giaacute về khả năng sử dụng vagrave độ

chiacutenh xaacutec Hai vấn đề cụ thể lagrave hiệu lực của những kiến thức vagrave kiểm tra việc xacircy dựng cơ sở của tri thức

Cần xaacutec nhận xem liệu hệ thống coacute thể hoạt động ở mức độ tối thiểu khocircng

Xaacutec minh liecircn quan đến việc so saacutenh từng chi tiết kỹ thuật của hệ thống những gigrave đatilde được thực hiện cuối cugraveng

9 Một số caacutec biện phaacutep xaacutec nhận Độ chiacutenh xaacutec Khả năng thiacutech nghi Mức độ đầy đủ Bề rộng Độ sacircu Hiệu lực Tổng quan Chiacutenh xaacutec Hiện thực Độ tin cậy Tiacutenh hữu dụng Mức độ

Chương 9 Học maacutey

1 Logic mờ vagrave ngocircn ngữ mờ(Fuzzy Logic and Linguistic Ambiguity)

Ngocircn ngữ tự nhiecircn gồm những khaacutei niệm mơ hồ vagrave khocircng chiacutenh xaacutectruyền tải ngữ nghĩa thocircng qua tiacutenh xấp xỉkhocircng rotilde ragraveng

Những xấp xỉ nagravey giuacutep con người coacute thể truyền tải hết được yacute nghĩa nhưng maacutey thigrave khocircng hiểu

Lagravem sao biểu diễn caacutec tri thức sử dụng caacutec khaacutei niệm khocircng rotilde ragraveng(mờ) hoặc khocircng chiacutenh xaacutec

2 Khaacutei niệm cơ bản của logic mờ tập mờ lagrave những tập hợp khocircng coacute một giới hạn rotilde Mỗi phần tử của noacute chỉ

chứa một mức độ hagravem liecircn thuộc của từng phần tử Vigrave vậy tập mờ khocircng giống như tập cổ điển Tập mờ coacute thể kết hợp với nhau qua những luật mờ magrave đặc trưng cho những hagravenh động trạng thaacutei vagrave thuộc tiacutenh của logic mờ được tận dụng khi thực hiện một bộ điều khiển mờ

Logic mờ dựa trecircn yacute tưởng mỗi phần tử thuộc vagraveo một tập hợp ở một mức độ nagraveo đấy

Locircgic mờ cho pheacutep độ liecircn thuộc (microA )coacute giaacute trị trong khoảng (01) Locircgic mờ coacute thể được coi lagrave mặt ứng dụng của lyacute thuyết tập mờ để xử lyacute caacutec

giaacute trị trong thế giới thực cho caacutec bagravei toaacuten phức tạp

3 So saacutenh tiacutenh đuacuteng đắn logic mờ vagrave xaacutec suất Xaacutec suất thigrave đề cập đến khả năng xảy ra một biến cố hay một điều gigrave đoacute Logic mờ đề cập đến cấp độ magrave đặc tiacutenh ở hiện tại

o viacute dụ1 người coacute chiều cao 6 feet thigrave coacute cấp độ lagrave 05 về chiều cao

4 Ưu điểm của logic mờ Caacutech tiếp cận rất tự nhiecircnkhocircng phức tạp Coacute thể mocirc higravenh hoacutea caacutec hagravem phi tuyến tugravey yacute phức tạp

Coacute thể tận dụng được kinh nghiệm từ những chuyecircn gia hagraveng đầu trong mọi lĩnh vực

Logic mờ được xacircy dựng dựa trecircn ngocircn ngữ tự nhiecircnNền tảng của logic mờ lagrave dựa trecircn cơ sở giao tiếp của con người

5 Nhược điểm của logic mờ Trong 1 hệ thống phức tạpsử dụng logic mờ coacute thể trở thagravenh trở ngại cho

việc xaacutec thực độ tin cậy của hệ thống Cơ chế lập luận mờ khocircng thể học hỏi từ những lỗi sai

6 Mạng noron nhacircn tạo(ANN) Mạng noron nhacircn tạo lagrave một mocirc phỏng xử lyacute thocircng tinđược nghiecircn cứu ra

từ hệ thống thần kinh của sinh vậtgiống như bộ natildeo để xử lyacute thocircng tin ANNs lagrave chương trigravenh dựa trecircn maacutey tiacutenh đơn giản coacute chức năng lagrave một mocirc

higravenh bagravei toaacuten khocircng gian dựa trecircn thử nghiệm vagrave baacuteo lỗi

7 Học từ kinh nghiệm Tiến trigravenh Một mẫu dữ liệu được biểu diễn như một mạng lưới noronANN ldquodự

đoaacutenrdquo 1 đầu radự đoaacuten được so saacutenh với giaacute trị thực tế hoặc giaacute trị chiacutenh xaacutecNếu đoaacuten được chiacutenh xaacutec thigrave khocircng coacute hagravenh động nagraveo được thực hiện

Nếu dự đoaacuten sai ANN kiểm tra lại vagrave xaacutec định lại thocircng số để điều chỉnh Một mẫu dữ liệu khaacutec được biểu diễn vagrave quaacute trigravenh nagravey được lặp lại

8 Nguyecircn tắc cơ bản của cocircng nghệ nơron Caacutec yếu tố xử lyacute cơ bản trong hệ thống thần kinh của con người lagrave tế bagraveo

thần kinhMạng lưới của tế bagraveo nagravey lagrave liecircn kết với nhau nhận được thocircng tin từ caacutec cảm biến trong mắt taihellip

Thocircng tin nhận được bởi tế bagraveo thần kinh hoặc lagrave sẽ kiacutech thiacutech noacute(sẽ được chuyển qua 1 thocircng điệp dọc theo mạng lưới) hoặc lagrave sẽ ngăn cản noacute(ngăn cản dograveng thocircng tin)

Độ nhạy coacute thể thay đổi qua thời gian hoặc sau khi coacute được kinh nghiệm

9 Cấu truacutec mạng Một ANN gồm 3 lớp cơ bản

Lớp đầu vagraveo nhận dữ liệu Lớp becircn trong hoặc lagrave lớp ẩn xử lyacute dữ liệu Lớp đầu ra chuyển tiếp kết quả cuối cugraveng của mạng

10Mạng nơ ron Thường coacute nhiều đầu vagraveo mỗi đầu vagraveo với mức ảnh hưởng vagrave tầm quan

trọng riecircng của noacute Một đầu vagraveo quan trọng coacute thể được sử dụng để khuếch đại đầu ra caacutec hagravem trạng thaacutei tổng hợp caacutec trọng số của caacutec yếu tố

đầuvagraveo khaacutec nhauvagraveo một giaacute trị duy nhất Caacutec hagravem chuyển giao xử lyacute caacutec giaacute trị trạng thaacutei vagrave tạo đầu ra

11Huấn luyện mạng nơ ron Trong mocirc higravenh coacute giaacutem saacutetANN được đến so saacutenh dự đoaacuten của chiacutenh

noacute với thocircng tin phản hồi coacute chứa caacutec kết quả mong muốn ANN sẽ phải tigravem caacutech thay đổi caacutec tham số becircn trong củamigravenh (caacutec trọng số vagrave caacutec ngưỡng) để tạo necircn một aacutenh xạ coacute khả năng aacutenh xạcaacutec đầu vagraveo thagravenh caacutec đầu ra mong muốn Sự thay đổi nagravey được tiến hagravenh nhờ việc so saacutenh giữa đầu ra thực sự vagrave đầu ra mong muốn

Trong mocirc higravenh khocircng coacute giaacutem saacutetANN nhận được dữ liệu vagraveo nhưng khocircng phải coacute bất kỳ thocircng tin phản hồi về kết quả mong muốn

Phần lớn caacutec ứng dụng nằm trong vugraveng của caacutec bagravei toaacuten ước lượng như mocirc higravenh hoacuteathống kecirc neacuten lọc phacircn cụm

12Lợi iacutech Liecircn kết với mạng noron Traacutenh caacutech lập trigravenh tường minh Giảm nhu cầu của chuyecircn gia ANNs thigrave thiacutech nghi với caacutec yếu tố đầu vagraveo thay đổi Khocircng cần thiết cho cơ sở tri thức tinh chế ANNs coacute tiacutenh động vagrave cải thiện với việc sử dụng Coacute khả năng xử lyacute dữ liệu khocircng chiacutenh xaacutec hoặc khocircng đầy đủ Cho pheacutep tổng quaacutet hoacutea từ thocircng tin cụ thể Cho pheacutep thu thập cảm giaacutec thocircng thường vagraveo miền giải quyết vấn đề

13Hạn chế của việc liecircn kết với mạng noron ANNs khocircng thể giải thiacutech được suy luận Bản chất hộp đen thường khiến cho vấn đề traacutech nhiệm vagrave độ tin cậy phaacutet

sinh lagrave khoacute khăn Lặp đi lặp lại quaacute trigravenh huấn luyện rất tốn thời gian Nguồn lực caacutec nhagrave phacircn tiacutech vagrave thiết kế coacute tay nghề cao vẫn lagrave đaacuteng lo

ngại Cocircng nghệ ANN thuacutec đẩy hạn chế của phần cứng hiện tại ANN yecircu cầu phải coacute sự tin tưởng ở đầu ra

14Giới thiệu về thuật toaacuten di truyền Cũng như mạng lưới thần kinh caacutec thuật toaacuten di truyền được dựa trecircn lyacute

thuyết sinh học Thuật toaacuten di truyền tigravem thấy nguồn gốc của chuacuteng trong caacutec lyacute thuyết

tiến hoacutea của chọn lọc tự nhiecircn vagrave thiacutech ứng với biến đổi khiacute hậu Kết quả thuật toaacuten di truyền lagrave từ giao phối 2 caacute thể trong quần thế để tạo

ra con caacutei đocirci khi tốt hơn so với bậc cha mẹ của chuacuteng 15Caacutec thagravenh phần cơ bản của thuật toaacuten di truyền

Toaacuten tử chọn lọc Caacutec caacute thể tốt được chọn lọc để đưa vagraveo thế hệ sau Sự chọn lọc nagravey căn cứ vagraveo độ thiacutech nghi với mocirci trường của mỗi caacute thể

Toaacuten tử lai gheacutep (crossover) Hai caacute thể cha vagrave mẹ trao đổi caacutec gen với nhau để tạo ra caacute thể con

Toaacuten tử đột biến (mutation) Một caacute thể thay đổi một số gen để biến đổi thagravenh một caacute thể mớiTất cả caacutec toaacuten tử trecircn khi thực hiện đều mang tiacutenh ngẫu nhiecircn

16Quaacute trigravenh cơ bản của một thuật toaacuten di truyền Khởi tạo

Đaacutenh giaacute quần thể

Lựa chọn NST thiacutech hợp nhất vagrave loại bỏ NST yếu nhất

Quy trigravenh giao nhau vagrave cải thiện quần thể

đột biến tiến trigravenh để khaacutem phaacute ra NST mới

17Ưu nhược điểm của việc kết hợp với thuật toaacuten di truyền Kiacutech thước quần thể lagrave 1 yếu tố quan trọng trong tốc độ của việc tigravem

kiếmnhưng noacute tương đối dễ dagraveng để dự đoaacuten tốc độ nagravey Giao nhau hoặc đột biến lagrave khocircng necircn đc sử dụng quaacute thường xuyecircn Luocircn coacute được iacutet nhất 1 giải phaacutep hợp lyacute Necircn coacute thể aacutep dụng chuacuteng cho caacutec vấn đề magrave chuacuteng ta khocircng coacute hướng

về caacutech giải quyết Sức mạnh của thuật toaacuten xuất phaacutet từ khaacutei niệm đơn giảnkhocircng phải từ

một thủ tục thuật toaacuten phức tạp 18Tương lai của học maacutey

Mạng lưới thần kinh nhacircn tạo vượt quaacute năng lực của con người trong caacutec trường hợp bị cocirc lập

Về mặt lyacute thuyếtmột maacutey tiacutenh coacute thể xử lyacute dũ liệu nhanh hơn hagraveng triệu lần so với 1 con người

May mắn thay cho chuacuteng tacon người tốt hơn nhiều khi magrave coacute được dữ liệumaacutey tiacutenh khocircng coacute 1 số thứ như lagrave 5 giaacutec quan

CHƯƠNG 10 KHO DỮ LIỆU

1 Kho dữ liệu Kho dữ liệu lagrave tuyển tập caacutec cơ sở dữ liệu tiacutech hợp hướng chủ đề được

thiết kế để trợ giuacutep cho một hệ hỗ trợ quyết định

Theo John Ladley Cocircng nghệ kho dữ liệu lagrave tập caacutec phương phaacutep kỹ thuật vagrave caacutec cocircng cụ coacute thể kết hợp hỗ trợ nhau để cung cấp thocircng tin cho người sử dụng trecircn cơ sở tiacutech hợp từ nhiều nguồn dữ liệu nhiều mocirci trường khaacutec nhau

Kho dữ liệu thường rất lớn tới hagraveng trăm GB hay thậm chiacute hagraveng Terabyte

2 Kho dữ liệu vận hagravenh (ODS) Một kho dữ liệu vận hagravenh Aacutep dụng kỹ thuật kho dữ liệu vagraveo caacutec hệ xử

lyacute giao taacutec lưu trữ dữ liệu cho một ứng dụng đặc thugrave Noacute đưa vagraveo kho dữ liệu một dograveng caacutec dữ liệu thocirc được thiết kế

3 So saacutenh

Kho dữ liệu vận hagravenh Kho dữ liệu

Dữ liệu theo chủ đề Dữ liệu theo chủ đề

Dữ liệu tiacutech hợp Dữ liệu tiacutech hợp

Dữ liệu thay đổi Dữ liệu khocircng thay đổi

Dữ liệu được cập nhật khi thay đổi

Dữ liệu giữ nguyecircn

Chỉ coacute dữ liệu hiện tạiDữliệu hiện tại vagrave dữ liệu lịch sử

Chu kỳ lagravem tươi dữ liệu ngắn Chu kỳ lagravem tươi dữ liệu dagravei

Chỉ coacute dữ liệu chi tiết Dữ liệu chi tiết vagrave dữ liệu tổng kết

Dugraveng cho caacutec quyết định ngắn hạn

Dugraveng cho hoạch định dagravei hạn

4 Kho dữ liệu cục bộ (Data Mart - DM)

Kho dữ liệu cục bộ lagrave CSDL coacute những đặc điểm giống với kho dữ liệu nhưng với quy mocirc nhỏ hơn vagrave lưu trữ dữ liệu về một lĩnh vực một chuyecircn ngagravenh

Data mart phụ thuộc Chứa những dữ liệu được lấy từ DW vagrave những dữ liệu nagravey sẽ được triacutech lọc vagrave tinh chế tiacutech hợp lại ở mức cao hơn để phục vụ một chủ đề nhất định của Datamart

Data mart độc lập Khocircng giống như Datamart phụ thuộc Data mart độc lập được xacircy dựng trước DW vagrave dữ liệu được trực tiếp lấy từ caacutec nguồn khaacutec nhau

5 Siecircu dữ liệu Metadata lagrave dữ liệu để mocirc tả dữ liệu Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột

một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi Metadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu

6 Mocirci trường kho dữ liệu Hệ thống của tổ chức vagrave kho cung cấp dữ liệu để xacircy dựng kho dữ liệu Trong quaacute trigravenh chuyển dữ liệu từ caacutec nguồn khaacutec nhau dữ liệu coacute thể

được lagravem sạch hoặc chuyển đổi vagrave vigrave thế DW được xem như lagrave một chuẩn cho việc lưu trữ

Đồng thời siecircu dữ liệu được ghi lại Cuối cugraveng DW hoặc siecircu thị coacute thể được sử dụng để tạo ra một kho dữ

liệu ldquocaacute nhacircnrdquo 7 Caacutec đặc điểm của kho dữ liệu

Đặc điểm Mocirc tả

Hướng chủ đề - DL tổ chức theo caacutech thức người dugraveng tham chiếu

Tiacutech hợp - Dữ liệu ldquosạchrdquo loại bỏ tiacutenh thiếu nhất quaacuten

Khocircng thay đổi - DL ldquochỉ đọcrdquo người dugraveng khocircng thay đổi được

Chuỗi thời gian - DL lagrave chuỗi thời gian khocircng phải lagrave trạng thaacutei hiện tại

Được tổng kết - DL vận hagravenhthao taacutec khi cần thiết

được kết hợp lại thagravenh dạng coacute thể dugraveng được cho quyết định

Kiacutech cỡ lớn hơn - Lưu giữ theo chuỗi thời gian tức lagrave giữ lại nhiều DL

Khocircng được chuẩn hoacutea - Coacute thể dư thừa DLSiecircu dữ liệu - Dữ liệu của dữ liệu được lưu trữNguồn dữ liệu - DL vận hagravenh (caacutec hệ sẵn coacute) cugraveng

với caacutec nguồn ngoagravei 8 Kho dữ liệu hướng chủ đề

Hướng chủ để coacute nghĩa lagrave kho dữ liệu được tổ chức xung quanh caacutec chủ đề chiacutenh như khaacutech hagraveng sản phẩm sản xuất Tập trung vagraveo việc mocirc higravenh hoacutea vagrave phacircn tiacutech dữ liệu cho caacutec nhagrave ra quyết định magrave khocircng tập trung vagraveo caacutec xử lyacute thocircng thường Cung cấp cho người dugraveng một khung nhigraven toagraven vẹn đơn giản vagrave đầy đủ về caacutec sự kiện quanh caacutec chủ đề

9 Dữ liệu trong DW được tiacutech hợp Dữ liệu trong kho dữ liệu được xacircy dựng bằng caacutech tổng hợp dữ liệu từ

nhiều nguồn khaacutec nhau vagrave caacutec nguồn coacute tổ chức khaacutec nhau Cơ sở dữ liệu caacutec file excel caacutec flat file hoặc caacutec raw file Khi đưa vagraveo kho dữ liệu caacutec dữ liệu được lagravem sạch vagrave tiacutech hợp dữ liệu nhằm đảm bảo tiacutenh nhất quaacuten của dữ liệu

10Kiến truacutec kho dữ liệu Tầng cơ sở dữ liệu hoạt động Tầng truy xuất thocircng tin Tầng truy xuất dữ liệu Tầng siecircu dữ liệu Tầng quản lyacute tiến trigravenh Tầng thocircng điệp của ứng dụng Tầng vật liacute của kho dữ liệu Tầng trigravenh diễn dữ liệu

11Higravenh trạng kho dữ liệu Kho dữ liệu ảo - người dugraveng cuối coacute thể truy cập trực tiếp đến kho dữ liệu

sử dụng caacutec cocircng cụ cho pheacutep ở tầng truy xuất dữ liệu Kho dữ liệu trung tacircm-1 cơ sở dữ liệu vật lyacute chứa tất cả dữ liệu cho một

vugraveng chuyecircn dụng nagraveo đoacute

Kho dữ liệu phacircn taacuten- Thagravenh phần được phacircn taacuten qua nhiều hệ cơ sở dữ liệu vật lyacute

12METADATA- Siecircu dữ liệu Định nghĩa Siecircu dữ liệu lagrave dữ liệu về dữ liệu Lagrave 1 lưu trữ dugraveng để

Miecircu tả kho dữ liệu tổng thể Nhận dạng kiểu kho dữ liệu Quản liacute quaacute trigravenh tiacutech hợp dữ liệu Quản liacute quaacute trigravenh cập nhật kho dữ liệu Quản liacute bảo mật

Lagrave chigravea khoacutea quyết định sự thagravenh cocircng của kho dữ liệu luocircn được thay đổi vagrave cập nhật theo sự phaacutet triển của kho dữ liệu

Dugraveng để quản liacute điều khiển kho dữ liệu Sự ra đời của kho dữ liệu như 1 cấu truacutec hỗ trợ ra quyết định siecircu dữ liệu

được xem như nguồn tagravei nguyecircn dữ liệu Siecircu dữ liệu lagrave trừu tượng Chuacuteng lagrave dữ liệu bậc cao cung cấp mocirc tả ngắn

gọn caacutec dữ liệu bậc thấp hơn 13Hoạt động của Siecircu dữ liệu

Siecircu dữ liệu rất cần thiết trong việc chuyển hoacutea thocircng tin trở thagravenh tri thức Lagrave chigravea khoacutea giuacutep chuacuteng ta xử lyacute được dữ liệu thocirc Viacute dụ một dograveng dữ liệu baacuten hagraveng 1023 K596 11121 agraveNoacute sẽ khocircng coacute nghĩa gigrave cho đến khi chuacuteng ta đưa vagraveo siecircu dữ liệu (thư

mục chứa dữ liệu) agrave cửa hagraveng 1023 sản phẩm K596 vagrave số tiền baacuten được lagrave 11121 đocirc la

14Sự cần thiết phải nhất quaacuten trong kho dữ liệu Kho dữ liệu được xacircy dựng cho lợi iacutech của những nhagrave phacircn tiacutech kinh

doanh caacutec nhagrave quản trị cho tất cả caacutec khu vực chức năng Trong cơ sở dữ liệu riecircng caacutec khu vực khaacutec nhau coacute thể định nghĩa vagrave lưu

trữ dữ liệu thocircng qua phiecircn bản của chiacutenh noacute Khi dữ liệu được lấy từ những vugraveng khaacutec nhau đoacute vagrave được đặt vagraveo kho dữ

liệu Việc chuyển đổi vagrave lagravem sạch caacutec tiến trigravenh sẽ đảm bảo noacute lagrave duy nhất được tiacutech hợp tại một mức của tổ chức

15Ragrave soaacutet lại dữ liệu ndash Thực thi siecircu dữ liệu

Bất kể cấu truacutec tự nhiecircn của 1 cacircu truy vấn thế nagraveo thigrave caacutec thagravenh phần của siecircu dữ liệu rất quan trọng đối với người ra quyết định

Bảng thuộc tiacutenh khoacutea được lưu trữ bởi kho dữ liệu Tập hợp dữ liệu được lấy từ đacircu Những chuyển đổi nagraveo được thực thi với việc lagravem sạch

16Siecircu dữ liệu lagrave gigrave Metadata - lagrave thocircng tin mocirc tả nội dung của cơ sở dữ liệu (CSDL) Metadata baacuteo cho người dugraveng biết thời gian cập nhật sau cugraveng của dữ liệu

định dạng vagrave mục điacutech sử dụng của noacute Những thocircng tin nagravey coacute thể hướng dẫn người dugraveng duyệt qua CSDL vagrave

giuacutep họ hiểu được yacute nghĩa vagrave ngữ cảnh của dữ liệu Trong CSDL metadata lagrave caacutec dạng biểu diễn khaacutec nhau của caacutec đối tượng

trong CSDL Trong CSDL quan hệ metadata lagrave caacutec định nghĩa của bảng cột CSDL

view vagrave nhiều đối tượng khaacutec Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột

một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi -gtMetadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu

Bảng chuyển đổi Ghi lại những chuyển đổi đatilde được thực hiện

Lịch sử thực thi Ghi lại những dữ liệu đatilde được

phacircn tiacutech

Higravenh thaacutei kết nốiGhi lại những dữ liệu được kết nối vagrave tần suất

17Aacutenh xạ thocircng thường của siecircu dữ liệu Bản ghi aacutenh xạ chuyển đổi bao gồm

Định danh của nguồn gốc Chuyển đổi thuộc tiacutenh Chuyển đổi thuộc tiacutenh vật lyacute Matilde hoacutea tham chiếu bảng chuyển đổi Đổi tecircn Đổi khoacutea Gaacuten giaacute trị cho thuộc tiacutenh mặc định Chọn logic cho caacutec nguồn nhiều giaacute trị Đổi thuật toaacuten

18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để

phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai

lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave

tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec

Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm

Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo

19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua

caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau

SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được

Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra

một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức

Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ

Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ

Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech

CHƯƠNG 11 KHAI PHAacute DỮ LIỆU

1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn

ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993

Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng

2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd

1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều

2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP

3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn

4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng

5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server

6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo

7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động

8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời

9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều

10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện

11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech

12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP

3 Xử lyacute phacircn tiacutech trực tuyến OLAP

MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave

dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu

ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave

thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu

HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave

ROLAP4 Khai phaacute dữ liệu

Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh

khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn

Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan

5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp

6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại

Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp

Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec

Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt

Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra

Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh

vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho

Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec

Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm

Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục

Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng

gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp

Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn

Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec

Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper

Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2

Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25

Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước

Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng

Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện

trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp

Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute

độ hỗ trợ ge ngưỡng minsup

độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan

Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn

Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết

Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu

MOLAP ROLAP HOLAP

Lưu trữ dữ liệu cơ sở

Khối Bảng quan hệ Bảng quan hệ

Lưu trữ thocircng tin tổng hợp

Khối Bảng quan hệ Khối

Hiệu suất thực hiện truy vấn

Nhanh nhất Chậm nhất Nhanh

Tiecircu thụ khocircng gian lưu trữ

Nhiều Thấp Trung bigravenh

Chi phiacute bảo trigrave Cao Thấp Trung bigravenh

Page 37: De cuong(1-11)

- Coacute một vagravei điều kiện sẽ được hợp nhất cho việc chuyển đổi cocircng nghệ Trong đoacute một vagravei điều kiện coacute thể dễ dự đoaacuten Hai điều kiện magrave ta coacute thể thấy lagrave+ Phaacutet triển cocircng nghệ maacutey tiacutenh trong việc điều hagravenh sẽ tạo ra sự chuyển đổi được chấp nhận một caacutech dễ dagraveng hơn+ Mở rộng traacutech nhiệm điều hagravenh sẽ mở rộng nhu cầu thocircng tin

Tương lai của EIS- EIS thocircng minh Những tiến bộ trong cocircng nghệ AI sẽ được triển khai trong caacutec

EIS- EIS đa phương tiện Cơ sở dữ liệu đa phương tiện sẽ cho pheacutep tiacutech hợp văn bản

giọng noacutei vagrave higravenh ảnh trong tương lai- EIS thocircng tin Tương lai EIS sẽ mở rộng hơn trong việc sử dụng dữ liệu becircn

ngoagravei doanh nghiệp- EIS kết nối Giao tiếp với băng thocircng rộng cho pheacutep kết nối liecircn thocircng lớn hơn

Chương 7 HỆ CHUYEcircN GIA VAgrave TRIacute TUỆ NHAcircN TẠO

71 Caacutec khaacutei niệm

72 Triacute thocircng minh của triacute tuệ nhacircn tạo

73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia

74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia

75 Lợi iacutech vagrave hạn chế của hệ chuyecircn gia

71 Caacutec khaacutei niệm

Chuyecircn mocircn (Expertise) sự hiểu biết rộng trong 1 lĩnh vực hẹp

Hệ chuyecircn gia (Expert Systems)1 chương trigravenh maacutey tiacutenh sử dụng 1 tập caacutec luật dựa trecircn tri thức của con người để giải quyết caacutec vấn đề đogravei hogravei phải coacute sự chuyecircn mocircn

Một số hệ chuyecircn gia nổi tiếng

DENDRAL (Standford 1960s Edward Feigenbaum)

MYCIN (Standford1970s Edward Shortliffe)

PROSPECTOR (MIT 1979)

Triacute tuệ nhacircn tạo (Artificial Intelligence ndash AI)

Triacute tuệ nhacircn tạo một bộ phacircn của ngagravenh khoa học maacutey tiacutenh quan tacircm đến việc thiết kế caacutec hệ thống maacutey tiacutenh thocircng minh đoacute lagrave caacutec hệ thống đưa ra caacutec đặc điểm magrave từ đoacute chuacuteng ta liecircn hệ với sự thocircng minh trong hagravenh động của con người (Barr vagrave Feigenbaum 1981)

Mục điacutech của AI

Mục điacutech khoa học xaacutec định caacutec gợi yacute để giải thiacutech caacutec loại khaacutec nhau của triacute tuệ thực

Mục điacutech kỹ thuật giải quyết caacutec vấn đề trong thế giới thực

Triacute tuệ nhacircn tạo kế thừa nhiều yacute tưởng quan điểm kỹ thuật từ caacutec ngagravenh khoa học khaacutec

- Triết học

- Logic Toaacuten học

- Tiacutenh toaacuten

- Khoa học tacircm lyacute Khoa học nhận thức

- Sinh học Thần kinh học

- Tiến hoacutea

Caacutec lĩnh vực ứng dụng trong Triacute tuệ nhacircn tạo

Mạng nơ ron thần kinh (Neural Networks)

Tiacutenh toaacuten sự tiến hoacutea

(Evolutionary Computation)

Hệ chuyecircn gia (Expert Systems)

Kỹ thuật xử lyacute tiếng noacutei (Speech Processing)

Kỹ thuật xử lyacute ngocircn ngữ tự nhiecircn

(Natural Language Processing)

Lập kế hoạch (Planning)

Robot (Robotics)

Khoa học higravenh ảnh (Vision)

Caacutec kỹ thuật thocircng dụng dugraveng trong AI

Biểu diễn(Representation)

Học (Learning)

Caacutec luật (Rules)

Tigravem kiếm (Search)

72 Triacute thocircng minh của triacute tuệ nhacircn tạo

Con người suy diễn như thế nagraveo

Phacircn loại (Categorization)

Caacutec quy tắc cụ thể

Heuristics

Kinh nghiệm trước đoacute

Dự tiacutenh trước

Maacutey tiacutenh suy diễn như thế nagraveo

Lập luận dựa trecircn luật IF-THEN mocirc tả tri thức được matilde hoacutea dưới dạng caacutec luật

Caacutec khung (Frames) lagrave caacutec đại diện mocirc tả caacutec tigravenh huống giống nhau lagrave điển higravenh của một vagravei phacircn loại

Lập luận dựa trecircn caacutec trường hợp mocirc phỏng giải phaacutep trước đoacute cho một vấn đề hiện tại

Nhận dạng mẫu phaacutet hiện acircm thanh higravenh dạng hoặc caacutec chuỗi dagravei

Caacutec dạng khaacutec của Triacute tuệ nhacircn tạo

Học maacutey- mạng nơron vagrave giải thuật di truyền

Lập trigravenh tự động ndash lagrave những kỹ thuật tạo ra caacutec chương trigravenh để lagravem 1 nhiệm vụ riecircng biệt (cho pheacutep những người khocircng phải lagrave người lập trigravenh coacute thể lập trigravenh được)

Cuộc sống nhacircn tạo ndash nỗ lực để taacutei tạo caacutec hiện tượng sinh học trong caacutec hệ thống dựa trecircn maacutey tiacutenh

73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia(Expert Systems- ES)

Theo Jackson (1999) Một hệ chuyecircn gia lagrave một chương trigravenh maacutey tiacutenh mocirc tả vagrave suy diễn với tri thức của một vagravei lĩnh vực để giải quyết vấn đề hay đưa ra caacutec lời khuyecircn

Cấu truacutec cơ bản của ES được dựa theo cấu truacutec chung của DSS Sự khaacutec biệt chiacutenh giữa ES vagraveDSS lagrave hệ ES thu thập caacutec kiến thức từ những

chuyecircn gia trong lĩnh vực quan tacircmĐặc trưng của hệ chuyecircn gia Hiệu quả cao Thời gian trả lời thỏa đaacuteng Độ tin cậy cao Dễ hiểu

Giao diện người dugraveng trong ES

Thiết kế giao diện người dugraveng tập trung vagraveo caacutec yếu tố như dễ dagraveng sử dụngcoacute độ tin cậy cao giảm tải những khoacute khăn khi sử dụng

Thiết kế necircn coacute một số tương taacutec (đầu vagraveo kiểm soaacutet vagrave truy vấn)

Cấu tạo giao diện người dugraveng gồm coacute magraven higravenh cảm ứng bagraven phiacutem buacutet saacuteng lệnh thoại caacutec phiacutem chuyecircn dụng

Cơ sở tri thức (Knowledge Base)

Chứa đựng caacutec tri thức cụ thể miền thu được từ caacutec chuyecircn gia miền

Coacute thể chứa caacutec mocirc tả caacutec hagravenh vi giải quyết vấn đề caacutec ragraveng buộc caacutec heuristics

Thagravenh cocircng của một ES dựa trecircn tiacutenh đầy đủ vagrave tiacutenh chiacutenh xaacutec của cơ sở tri thức

Mocirc tơ suy diễn (Inference Engine)

Ở đacircy tri thức được đặt để sử dụng tạo ra caacutec giải phaacutep để giải quyết vấn đề

Mocirc tơ nagravey coacute khả năng thực hiện diễn dịch hoặc suy diễn dựa trecircn caacutec luật hay caacutec caacutec sự kiện

Đồng thời cũng coacute khả năng sử dụng caacutec suy diễn mờ hay khocircng chiacutenh xaacutec dựa trecircn xaacutec suất hay aacutenh xạ mẫu

Vograveng điều khiển suy diễn

1 Aacutenh xạ caacutec luật với caacutec sự kiện đatilde được cho

2 Chọn luật để thực hiện

3 Thực hiện luật bằng caacutech thecircm caacutec sự kiện được suy diễn ra vagraveo bộ nhớ lagravem việc

Chuỗi suy diễn (Chaining)

Suy diễn tiến (forward chaining) maacutey suy diễn bắt đầu từ dữ liệu ban đầu vagrave thực hiện việc suy luận để đưa ra caacutec kết luận cuối cugraveng

Suy diễn lugravei (backward chaining) maacutey suy diễn bắt đầu từ dữ liệu điacutech vagrave tigravem ra tri thức hỗ trợ cho dữ liệu điacutech đoacute

Viacute dụ suy diễn lugravei

R1 Nếu coacute A vagrave B thigrave suy ra coacute D

R2 Nếu coacute B thigrave suy ra coacute C

R3 Nếu coacute C vagrave D thigrave suy ra coacute E

Ta coacute E ta xem trong 3 luật R1 R2 R3 luật nagraveo coacute E ta thấy R3 chứa E đồng thời chứa C vagrave D Xeacutet tiếp trong 2 luật R1 R2 luật nagraveo chứa C vagrave D R2 chứa C R3 chứa D Từ đoacute ta coacute được caacutec tri thức hỗ trợ suy diễn vagrave kết luận lagrave nếu coacute A vagrave B thigrave sẽ coacute E Hay nếu A vagrave B đuacuteng thigrave sẽ coacute E

Viacute dụ suy diễn tiến

Giả sử coacute tập chứa 3 luật sau

R1 Nếu coacute A vagrave B thigrave suy ra coacute D

R2 Nếu coacute B thigrave suy ra coacute C

R3 Nếu coacute C vagrave D thigrave suy ra coacute E

Nếu ta coacute A vagrave B thigrave chuacuteng ta suy ra được D từ R1 vagrave suy ra C từ R2 Với D vagrave C đatilde được suy ra ở trecircn giờ chuacuteng ta suy ra được E từ R3

Viacute dụ thực tế

Giả sử muốn biết magraveu của một con vật nuocirci tecircn lagrave Fred biết rằng noacute kecircu ộp ộp vagrave ăn ruồi

Coacute tập 4 luật ban đầu như sau

R1 Nếu X kecircu ộp ộp vagrave ăn ruồi thigrave X lagrave con ếch

R2 Nếu X kecircu chiecircm chiếp vagrave biết hoacutet thigrave X lagrave con chim

R3 Nếu X lagrave con ếch thigrave X coacute magraveu xanh

R4 Nếu X lagrave con chim thigrave X coacute magraveu vagraveng

74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia

Expert system shells lagrave một tập caacutec goacutei phần mềm vagrave caacutec cocircng cụ dugraveng để phaacutet triển caacutec hệ chuyecircn gia

Những Expert system shells đầu tiecircn thường rất rườm ragrave Mặc dugrave vậy noacute vẫn giuacutep cho người sử dụng sẽ khocircng phải bắt đầu lại từ đầu khi xacircy dựng một hệ chuyecircn gia mới

Những shell hiện đại bao gồm hai mocirc-đun chiacutenh lagrave cocircng cụ xacircy dựng một tập quy tắc vagrave mocirc tơ suy diễn

Xacircy dựng hệ chuyecircn gia

Bước 1 xacircy dựng mocirc higravenh bagravei toaacuten xaacutec định vấn đề nhiệm vụ magrave hệ thống sẽ thực hiện Caacutec dạng bagravei toaacuten cần hệ chuyecircn gia

Bagravei toaacuten diễn giải (InterPretation)

Bagravei toaacuten dự baacuteo (Prediction)

Bagravei toaacuten chuẩn đoaacuten (Diagnose)

Bagravei toaacuten gỡ rối (Debugging)

Bagravei toaacuten thiết kế

Tương tự như một dự aacuten phần mềm để xacircy dựng một hệ chuyecircn gia cần phải coacute caacutec yếu tố về nhacircn lực tagravei nguyecircn vagrave thời gian Những yếu tố nagravey ảnh hưởng đến giaacute thah của một hệ chuyecircn giaTrong phần nagravey cacircu hỏi thường được đặt ra lagrave tại sao cần phải xacircy dựng một hệ chuyecircn giaTrước khi bắt đầu phải xaacute định rotilde bagravei toaacuten đạt ra lagrave jiAi lagrave chuyecircn giaAi lagrave người sử dụng

1 Diễn giải (InterPretation) Nghiecircn cứu 1 vấn đề -gt Dựa trecircn những biểu hiện thuộc tiacutenh đặc trưng becircn ngoagravei -gt Tư vấn

(hoặc đưa ra kết luận hay mocirc tả dễ hiểu từ tập dữ liệu thocirc)

2 Bagravei toaacuten dự baacuteo (Prediction) Coacute thể dự đoaacuten được hagravenh vi kết quả dựa trecircn caacutec hiện tượng -gt dự baacuteo

VD Dự baacuteo thời tiết động đấthellip

3 Bagravei toaacuten chẩn đoaacuten (Diagnoss) Xaacutec định caacutec lỗi caacutec bộ phận hỏng hoacutec của hệ thống dựa trecircn caacutec dữ liệu quan saacutet được

4 Bagravei toaacuten gỡ rối (Debugging) Mocirc tả caacutec phương phaacutep khắc phục hệ thống khi gặp sự cố

5 Bagravei toaacuten thiết kế Lựa chọn cấu higravenh caacutec đối tượng nhằm thoả matilden một số ragraveng buộc nagraveo đoacute

6 Giảng dạy Phần mềm dạy học coacute thể chuẩn đoaacuten vagrave sủa lỗi của học sinh trong quaacute trigravenh học tập

Để xaacutec định đuacuteng bagravei toaacuten magrave chuacuteng ta cần giải quyết thigrave phải trả lời đc một số cacircu hỏi

- cần hệ chuyecircn gia

Bước 2 thu thập tri thức lựa chọn cocircng cụ vagrave aacutep dụng

Trong bước thu thập tri thức vấn đề quan trọng lagrave lựa chọn chuyecircn gia những người magrave sẽ đoacuteng goacutep tri thức cho hệ thống Thocircng thường trong suốt quaacute trigravenh phaacutet triển thigrave chuyecircn gia được xem như một thagravenh viecircn của đội phaacutet triển

Hiện nay coacute rất nhiều cocircng cụ để xacircy dựng một hệ chuyecircn gia Phổ biến nhất lagrave JESS CLIPS vagrave OPS5

Bước 3 Thiết kế cơ sở tri thức thiết kế hệ thốngTri thức được biểu diễn trường minh trong cơ sở tri thức

Caacutec chuyecircn gia vagrave kỹ sư tri thức sẽ đối thoại với nhau bằng caacutec kỹ thuật đối thoại Suy diễn (SD) bảng Mocirc higravenh hoacutea SD quy nạp phacircn loại

Vấn đề bagraveo trigrave vagrave phaacutet triển

Caacutec hệ chuyecircn gia đogravei hỏi phải bảo trigrave vagrave phaacutet triển nhiều hơn so với caacutec hệ thống khaacutec Phải thường xuyecircn bổ sung tri thức mới vagrave thay đổi caacutec tri thức cũ để đổi mới hệ chuyecircn gia

Thu thập vagrave khắc phục lỗi do người sử dụng phaacutet hiện để kịp thời khắc phục những sai soacutet của hệ chuyecircn gia

75 Lợi iacutech vagrave hạn chế của caacutec hệ chuyecircn gia

Một số lợi iacutech chiacutenh

Thời gian trả lời hợp lyacute bằng hoặc nhanh hơn so với chuyecircn gia (người) để đi đến cugraveng một quyết định Hệ chuyecircn gia lagrave một hệ thống thời gian thực (real time system)

Khả năng trả lời với mức độ tinh thocircng bằng hoặc cao hơn so với chuyecircn gia (người) trong cugraveng lĩnh vực

Hệ chuyecircn gia giuacutep cho hiệu quả lagravem việc tăng bằng việc sử dụng tập caacutec luật một caacutech nhanh choacuteng magrave ko bị nhầm lẫn chuyecircn gia lagrave người coacute thể quecircn đi một số tri thức cơ sở lyacute luậ nhưng HCG thigrave ko

Quyết định của một người chuyecircn gia coacute thể bị thay đổi vagrave ko coacute tiacutenh thống nhất như quyết định của một hệ chuyecircn gia tạo ra

Hệ chuyecircn gia giuacutep cho người sử dụng coacute thể trau dồi sự hiểu biết trecircn lĩnh vuej cụ thể magrave noacute giải quyết hỗ trợ người ra quyết định coacute trigravenh độ như 1 chuyecircn gia trong quaacute trigravenh gia quyết định

Kiến thức của rất nhiều chuyecircn gia về một lĩnh vực nagraveo đoacute được đưa vagraveo hệ chuyecircn gia lagravem cho CSTT cuat HCG phong phuacute vagrave rộng lớn hơn rất nhiều

HCG giải thiacutech caacutec bước suy luận một caacutech dễ hiểu nhất quaacuten luacutec nagraveo cũng coacute thể sử dụng ko như chuyecircn gia con người

Hạn chế của caacutec hệ chuyecircn gia

Nhược điểm lớn nhất của hệ chuyecircn gia lagrave những yacute kiến chuyecircn mocircn thường rất khoacute matilde hoacutea vagrave giải neacuten

Hệ chuyecircn gia khocircng coacute khả năng tự học tự cập nhật kiến thức mới như caacutec chuyecircn gia magrave cần phải được matilde hoacutea lại khi noacute được cập nhật

Hệ chuyecircn gia khocircng thể nhận ra được vấn đề khocircng nằm trong miền kiến thức của hệ thống

Chương 8 Tri thức vagrave tiếp nhận

1 Bao gồm caacutec vấn đề

Dữ liệu thực tế đo lường hoặc quan saacutet coacute hoặc khocircng coacute bối cảnh

Thocircng tin dữ liệu được tổng hợp một caacutech hữu iacutech để giải quyết những khoacute khăn trong việc đưa ra quyết định

Tri thức bao gồm caacutec ứng dụng quy tắc thocircng tin hướng dẫn của người ra quyết định

2 Những caacutei nhigraven về tri thức

Đại diện lagravem thế nagraveo để diễn tả tri thức viacute dụ như một quyển saacutech khocircng phải lagrave tri thức nhưng noacute lại lagrave một đại diện của tri thức

Sản xuất tri thức lagrave một tập hơp của hagraveng tồn kho coacute thể được sản xuất cũng như mua lại

Tri thức lagrave 1 trong 6 trạng thaacutei của hệ thống

1Dữ liệu 2Thocircng tin 3Cấu truacutec thocircng tin 4Sự thấu hiểu 5Yacute kiến 6 Quyết định

3 Caacutec loại tri thức Phổ biến mocirc tả dữ liệu thocircng tin thủ tục mọi thứ lagravem như thế nagraveo lập luận chiacutenh saacutech hoặc caacutec quy tắc

4 Thu thập Tri thức hệ chuyecircn gia Hầu hết caacutec phương phaacutep đều bắt đầu với mocirc higravenh của caacutec taacutec vụ trong đoacute

hệ chuyecircn gia được xacircy dựng Trong đoacute mocirc tả về caacutec lĩnh vực được tạo ra Caacutec kỹ sư sử dụng caacutec mocirc higravenh giả thuyết vagrave nhận thức về quaacute trigravenh phacircn

tiacutech để gợi ra caacutech giải quyết vấn đề về tri thức từ caacutec chuyecircn gia

5 Caacutec chiều của thu thập tri thức KE- driven caacutec kỹ sư trao đổi trực tiếp với caacutec chuyecircn gia Expert-driven Caacutec chuyecircn gia trực tiếp đưa chuyecircn mocircn của họ vagraveo hệ

thống maacutey tiacutenh Machine-driven Sử dụng caacutec cocircng cụ suy luận để triacutech xuất tri thức từ một

tập caacutec viacute dụ

6 Kỹ thuật thu thập tri thức Trao đổi gồm 2 loại cơ bản lagrave coacute cấu truacutec(coacute kịch bản) vagrave khocircng coacute cấu

truacutec( đối thoại trực tiếp) Giao thức phacircn tiacutech bằng lời Khi caacutec chuyecircn gia thực hiện một cocircng việc

của họ thigrave một bản ghi về cocircng việc đoacute được thực hiện Caacutec kỹ sư sẽ xacircy dựng mocirc higravenh cho những gigrave được ghi lại trong bản ghi

Phương phaacutep sagraveng lọc caacutec chuyecircn gia so saacutenh caacutec nhoacutem liecircn tiếp trong ba đối tượng vagrave cho biết tại sao nhoacutem thứ hai lại khaacutec nhoacutem thứ ba

7 Thu thập tri thức từ nhiều nguồn Thu thập tri thức từ nhiều nguồn lagrave cần thiết để coacute được đầy đủ caacutec tri thức

cho một vấn đề quan điểm yacute kiến traacutei ngược nhau thường phaacutet sinh Phương phaacutep đồng thuận sẽ giuacutep giải quyết được vấn đề macircu thuẫn Kỹ thuật phacircn tiacutech Meta lagrave kỹ thuật được aacutep dụng trong caacutec trường hợp

khaacutec Caacutech tiếp cận bằng định lượng đogravei hỏi caacutec kỹ sư cần cacircn nhắc yếu tố đầu vagraveo của caacutec chuyecircn gia khaacutec nhau

8 Xaacutec nhận hợp lệ vagrave kiểm tra tri thức Một khi thu thập tri thức noacute phải được đaacutenh giaacute về khả năng sử dụng vagrave độ

chiacutenh xaacutec Hai vấn đề cụ thể lagrave hiệu lực của những kiến thức vagrave kiểm tra việc xacircy dựng cơ sở của tri thức

Cần xaacutec nhận xem liệu hệ thống coacute thể hoạt động ở mức độ tối thiểu khocircng

Xaacutec minh liecircn quan đến việc so saacutenh từng chi tiết kỹ thuật của hệ thống những gigrave đatilde được thực hiện cuối cugraveng

9 Một số caacutec biện phaacutep xaacutec nhận Độ chiacutenh xaacutec Khả năng thiacutech nghi Mức độ đầy đủ Bề rộng Độ sacircu Hiệu lực Tổng quan Chiacutenh xaacutec Hiện thực Độ tin cậy Tiacutenh hữu dụng Mức độ

Chương 9 Học maacutey

1 Logic mờ vagrave ngocircn ngữ mờ(Fuzzy Logic and Linguistic Ambiguity)

Ngocircn ngữ tự nhiecircn gồm những khaacutei niệm mơ hồ vagrave khocircng chiacutenh xaacutectruyền tải ngữ nghĩa thocircng qua tiacutenh xấp xỉkhocircng rotilde ragraveng

Những xấp xỉ nagravey giuacutep con người coacute thể truyền tải hết được yacute nghĩa nhưng maacutey thigrave khocircng hiểu

Lagravem sao biểu diễn caacutec tri thức sử dụng caacutec khaacutei niệm khocircng rotilde ragraveng(mờ) hoặc khocircng chiacutenh xaacutec

2 Khaacutei niệm cơ bản của logic mờ tập mờ lagrave những tập hợp khocircng coacute một giới hạn rotilde Mỗi phần tử của noacute chỉ

chứa một mức độ hagravem liecircn thuộc của từng phần tử Vigrave vậy tập mờ khocircng giống như tập cổ điển Tập mờ coacute thể kết hợp với nhau qua những luật mờ magrave đặc trưng cho những hagravenh động trạng thaacutei vagrave thuộc tiacutenh của logic mờ được tận dụng khi thực hiện một bộ điều khiển mờ

Logic mờ dựa trecircn yacute tưởng mỗi phần tử thuộc vagraveo một tập hợp ở một mức độ nagraveo đấy

Locircgic mờ cho pheacutep độ liecircn thuộc (microA )coacute giaacute trị trong khoảng (01) Locircgic mờ coacute thể được coi lagrave mặt ứng dụng của lyacute thuyết tập mờ để xử lyacute caacutec

giaacute trị trong thế giới thực cho caacutec bagravei toaacuten phức tạp

3 So saacutenh tiacutenh đuacuteng đắn logic mờ vagrave xaacutec suất Xaacutec suất thigrave đề cập đến khả năng xảy ra một biến cố hay một điều gigrave đoacute Logic mờ đề cập đến cấp độ magrave đặc tiacutenh ở hiện tại

o viacute dụ1 người coacute chiều cao 6 feet thigrave coacute cấp độ lagrave 05 về chiều cao

4 Ưu điểm của logic mờ Caacutech tiếp cận rất tự nhiecircnkhocircng phức tạp Coacute thể mocirc higravenh hoacutea caacutec hagravem phi tuyến tugravey yacute phức tạp

Coacute thể tận dụng được kinh nghiệm từ những chuyecircn gia hagraveng đầu trong mọi lĩnh vực

Logic mờ được xacircy dựng dựa trecircn ngocircn ngữ tự nhiecircnNền tảng của logic mờ lagrave dựa trecircn cơ sở giao tiếp của con người

5 Nhược điểm của logic mờ Trong 1 hệ thống phức tạpsử dụng logic mờ coacute thể trở thagravenh trở ngại cho

việc xaacutec thực độ tin cậy của hệ thống Cơ chế lập luận mờ khocircng thể học hỏi từ những lỗi sai

6 Mạng noron nhacircn tạo(ANN) Mạng noron nhacircn tạo lagrave một mocirc phỏng xử lyacute thocircng tinđược nghiecircn cứu ra

từ hệ thống thần kinh của sinh vậtgiống như bộ natildeo để xử lyacute thocircng tin ANNs lagrave chương trigravenh dựa trecircn maacutey tiacutenh đơn giản coacute chức năng lagrave một mocirc

higravenh bagravei toaacuten khocircng gian dựa trecircn thử nghiệm vagrave baacuteo lỗi

7 Học từ kinh nghiệm Tiến trigravenh Một mẫu dữ liệu được biểu diễn như một mạng lưới noronANN ldquodự

đoaacutenrdquo 1 đầu radự đoaacuten được so saacutenh với giaacute trị thực tế hoặc giaacute trị chiacutenh xaacutecNếu đoaacuten được chiacutenh xaacutec thigrave khocircng coacute hagravenh động nagraveo được thực hiện

Nếu dự đoaacuten sai ANN kiểm tra lại vagrave xaacutec định lại thocircng số để điều chỉnh Một mẫu dữ liệu khaacutec được biểu diễn vagrave quaacute trigravenh nagravey được lặp lại

8 Nguyecircn tắc cơ bản của cocircng nghệ nơron Caacutec yếu tố xử lyacute cơ bản trong hệ thống thần kinh của con người lagrave tế bagraveo

thần kinhMạng lưới của tế bagraveo nagravey lagrave liecircn kết với nhau nhận được thocircng tin từ caacutec cảm biến trong mắt taihellip

Thocircng tin nhận được bởi tế bagraveo thần kinh hoặc lagrave sẽ kiacutech thiacutech noacute(sẽ được chuyển qua 1 thocircng điệp dọc theo mạng lưới) hoặc lagrave sẽ ngăn cản noacute(ngăn cản dograveng thocircng tin)

Độ nhạy coacute thể thay đổi qua thời gian hoặc sau khi coacute được kinh nghiệm

9 Cấu truacutec mạng Một ANN gồm 3 lớp cơ bản

Lớp đầu vagraveo nhận dữ liệu Lớp becircn trong hoặc lagrave lớp ẩn xử lyacute dữ liệu Lớp đầu ra chuyển tiếp kết quả cuối cugraveng của mạng

10Mạng nơ ron Thường coacute nhiều đầu vagraveo mỗi đầu vagraveo với mức ảnh hưởng vagrave tầm quan

trọng riecircng của noacute Một đầu vagraveo quan trọng coacute thể được sử dụng để khuếch đại đầu ra caacutec hagravem trạng thaacutei tổng hợp caacutec trọng số của caacutec yếu tố

đầuvagraveo khaacutec nhauvagraveo một giaacute trị duy nhất Caacutec hagravem chuyển giao xử lyacute caacutec giaacute trị trạng thaacutei vagrave tạo đầu ra

11Huấn luyện mạng nơ ron Trong mocirc higravenh coacute giaacutem saacutetANN được đến so saacutenh dự đoaacuten của chiacutenh

noacute với thocircng tin phản hồi coacute chứa caacutec kết quả mong muốn ANN sẽ phải tigravem caacutech thay đổi caacutec tham số becircn trong củamigravenh (caacutec trọng số vagrave caacutec ngưỡng) để tạo necircn một aacutenh xạ coacute khả năng aacutenh xạcaacutec đầu vagraveo thagravenh caacutec đầu ra mong muốn Sự thay đổi nagravey được tiến hagravenh nhờ việc so saacutenh giữa đầu ra thực sự vagrave đầu ra mong muốn

Trong mocirc higravenh khocircng coacute giaacutem saacutetANN nhận được dữ liệu vagraveo nhưng khocircng phải coacute bất kỳ thocircng tin phản hồi về kết quả mong muốn

Phần lớn caacutec ứng dụng nằm trong vugraveng của caacutec bagravei toaacuten ước lượng như mocirc higravenh hoacuteathống kecirc neacuten lọc phacircn cụm

12Lợi iacutech Liecircn kết với mạng noron Traacutenh caacutech lập trigravenh tường minh Giảm nhu cầu của chuyecircn gia ANNs thigrave thiacutech nghi với caacutec yếu tố đầu vagraveo thay đổi Khocircng cần thiết cho cơ sở tri thức tinh chế ANNs coacute tiacutenh động vagrave cải thiện với việc sử dụng Coacute khả năng xử lyacute dữ liệu khocircng chiacutenh xaacutec hoặc khocircng đầy đủ Cho pheacutep tổng quaacutet hoacutea từ thocircng tin cụ thể Cho pheacutep thu thập cảm giaacutec thocircng thường vagraveo miền giải quyết vấn đề

13Hạn chế của việc liecircn kết với mạng noron ANNs khocircng thể giải thiacutech được suy luận Bản chất hộp đen thường khiến cho vấn đề traacutech nhiệm vagrave độ tin cậy phaacutet

sinh lagrave khoacute khăn Lặp đi lặp lại quaacute trigravenh huấn luyện rất tốn thời gian Nguồn lực caacutec nhagrave phacircn tiacutech vagrave thiết kế coacute tay nghề cao vẫn lagrave đaacuteng lo

ngại Cocircng nghệ ANN thuacutec đẩy hạn chế của phần cứng hiện tại ANN yecircu cầu phải coacute sự tin tưởng ở đầu ra

14Giới thiệu về thuật toaacuten di truyền Cũng như mạng lưới thần kinh caacutec thuật toaacuten di truyền được dựa trecircn lyacute

thuyết sinh học Thuật toaacuten di truyền tigravem thấy nguồn gốc của chuacuteng trong caacutec lyacute thuyết

tiến hoacutea của chọn lọc tự nhiecircn vagrave thiacutech ứng với biến đổi khiacute hậu Kết quả thuật toaacuten di truyền lagrave từ giao phối 2 caacute thể trong quần thế để tạo

ra con caacutei đocirci khi tốt hơn so với bậc cha mẹ của chuacuteng 15Caacutec thagravenh phần cơ bản của thuật toaacuten di truyền

Toaacuten tử chọn lọc Caacutec caacute thể tốt được chọn lọc để đưa vagraveo thế hệ sau Sự chọn lọc nagravey căn cứ vagraveo độ thiacutech nghi với mocirci trường của mỗi caacute thể

Toaacuten tử lai gheacutep (crossover) Hai caacute thể cha vagrave mẹ trao đổi caacutec gen với nhau để tạo ra caacute thể con

Toaacuten tử đột biến (mutation) Một caacute thể thay đổi một số gen để biến đổi thagravenh một caacute thể mớiTất cả caacutec toaacuten tử trecircn khi thực hiện đều mang tiacutenh ngẫu nhiecircn

16Quaacute trigravenh cơ bản của một thuật toaacuten di truyền Khởi tạo

Đaacutenh giaacute quần thể

Lựa chọn NST thiacutech hợp nhất vagrave loại bỏ NST yếu nhất

Quy trigravenh giao nhau vagrave cải thiện quần thể

đột biến tiến trigravenh để khaacutem phaacute ra NST mới

17Ưu nhược điểm của việc kết hợp với thuật toaacuten di truyền Kiacutech thước quần thể lagrave 1 yếu tố quan trọng trong tốc độ của việc tigravem

kiếmnhưng noacute tương đối dễ dagraveng để dự đoaacuten tốc độ nagravey Giao nhau hoặc đột biến lagrave khocircng necircn đc sử dụng quaacute thường xuyecircn Luocircn coacute được iacutet nhất 1 giải phaacutep hợp lyacute Necircn coacute thể aacutep dụng chuacuteng cho caacutec vấn đề magrave chuacuteng ta khocircng coacute hướng

về caacutech giải quyết Sức mạnh của thuật toaacuten xuất phaacutet từ khaacutei niệm đơn giảnkhocircng phải từ

một thủ tục thuật toaacuten phức tạp 18Tương lai của học maacutey

Mạng lưới thần kinh nhacircn tạo vượt quaacute năng lực của con người trong caacutec trường hợp bị cocirc lập

Về mặt lyacute thuyếtmột maacutey tiacutenh coacute thể xử lyacute dũ liệu nhanh hơn hagraveng triệu lần so với 1 con người

May mắn thay cho chuacuteng tacon người tốt hơn nhiều khi magrave coacute được dữ liệumaacutey tiacutenh khocircng coacute 1 số thứ như lagrave 5 giaacutec quan

CHƯƠNG 10 KHO DỮ LIỆU

1 Kho dữ liệu Kho dữ liệu lagrave tuyển tập caacutec cơ sở dữ liệu tiacutech hợp hướng chủ đề được

thiết kế để trợ giuacutep cho một hệ hỗ trợ quyết định

Theo John Ladley Cocircng nghệ kho dữ liệu lagrave tập caacutec phương phaacutep kỹ thuật vagrave caacutec cocircng cụ coacute thể kết hợp hỗ trợ nhau để cung cấp thocircng tin cho người sử dụng trecircn cơ sở tiacutech hợp từ nhiều nguồn dữ liệu nhiều mocirci trường khaacutec nhau

Kho dữ liệu thường rất lớn tới hagraveng trăm GB hay thậm chiacute hagraveng Terabyte

2 Kho dữ liệu vận hagravenh (ODS) Một kho dữ liệu vận hagravenh Aacutep dụng kỹ thuật kho dữ liệu vagraveo caacutec hệ xử

lyacute giao taacutec lưu trữ dữ liệu cho một ứng dụng đặc thugrave Noacute đưa vagraveo kho dữ liệu một dograveng caacutec dữ liệu thocirc được thiết kế

3 So saacutenh

Kho dữ liệu vận hagravenh Kho dữ liệu

Dữ liệu theo chủ đề Dữ liệu theo chủ đề

Dữ liệu tiacutech hợp Dữ liệu tiacutech hợp

Dữ liệu thay đổi Dữ liệu khocircng thay đổi

Dữ liệu được cập nhật khi thay đổi

Dữ liệu giữ nguyecircn

Chỉ coacute dữ liệu hiện tạiDữliệu hiện tại vagrave dữ liệu lịch sử

Chu kỳ lagravem tươi dữ liệu ngắn Chu kỳ lagravem tươi dữ liệu dagravei

Chỉ coacute dữ liệu chi tiết Dữ liệu chi tiết vagrave dữ liệu tổng kết

Dugraveng cho caacutec quyết định ngắn hạn

Dugraveng cho hoạch định dagravei hạn

4 Kho dữ liệu cục bộ (Data Mart - DM)

Kho dữ liệu cục bộ lagrave CSDL coacute những đặc điểm giống với kho dữ liệu nhưng với quy mocirc nhỏ hơn vagrave lưu trữ dữ liệu về một lĩnh vực một chuyecircn ngagravenh

Data mart phụ thuộc Chứa những dữ liệu được lấy từ DW vagrave những dữ liệu nagravey sẽ được triacutech lọc vagrave tinh chế tiacutech hợp lại ở mức cao hơn để phục vụ một chủ đề nhất định của Datamart

Data mart độc lập Khocircng giống như Datamart phụ thuộc Data mart độc lập được xacircy dựng trước DW vagrave dữ liệu được trực tiếp lấy từ caacutec nguồn khaacutec nhau

5 Siecircu dữ liệu Metadata lagrave dữ liệu để mocirc tả dữ liệu Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột

một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi Metadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu

6 Mocirci trường kho dữ liệu Hệ thống của tổ chức vagrave kho cung cấp dữ liệu để xacircy dựng kho dữ liệu Trong quaacute trigravenh chuyển dữ liệu từ caacutec nguồn khaacutec nhau dữ liệu coacute thể

được lagravem sạch hoặc chuyển đổi vagrave vigrave thế DW được xem như lagrave một chuẩn cho việc lưu trữ

Đồng thời siecircu dữ liệu được ghi lại Cuối cugraveng DW hoặc siecircu thị coacute thể được sử dụng để tạo ra một kho dữ

liệu ldquocaacute nhacircnrdquo 7 Caacutec đặc điểm của kho dữ liệu

Đặc điểm Mocirc tả

Hướng chủ đề - DL tổ chức theo caacutech thức người dugraveng tham chiếu

Tiacutech hợp - Dữ liệu ldquosạchrdquo loại bỏ tiacutenh thiếu nhất quaacuten

Khocircng thay đổi - DL ldquochỉ đọcrdquo người dugraveng khocircng thay đổi được

Chuỗi thời gian - DL lagrave chuỗi thời gian khocircng phải lagrave trạng thaacutei hiện tại

Được tổng kết - DL vận hagravenhthao taacutec khi cần thiết

được kết hợp lại thagravenh dạng coacute thể dugraveng được cho quyết định

Kiacutech cỡ lớn hơn - Lưu giữ theo chuỗi thời gian tức lagrave giữ lại nhiều DL

Khocircng được chuẩn hoacutea - Coacute thể dư thừa DLSiecircu dữ liệu - Dữ liệu của dữ liệu được lưu trữNguồn dữ liệu - DL vận hagravenh (caacutec hệ sẵn coacute) cugraveng

với caacutec nguồn ngoagravei 8 Kho dữ liệu hướng chủ đề

Hướng chủ để coacute nghĩa lagrave kho dữ liệu được tổ chức xung quanh caacutec chủ đề chiacutenh như khaacutech hagraveng sản phẩm sản xuất Tập trung vagraveo việc mocirc higravenh hoacutea vagrave phacircn tiacutech dữ liệu cho caacutec nhagrave ra quyết định magrave khocircng tập trung vagraveo caacutec xử lyacute thocircng thường Cung cấp cho người dugraveng một khung nhigraven toagraven vẹn đơn giản vagrave đầy đủ về caacutec sự kiện quanh caacutec chủ đề

9 Dữ liệu trong DW được tiacutech hợp Dữ liệu trong kho dữ liệu được xacircy dựng bằng caacutech tổng hợp dữ liệu từ

nhiều nguồn khaacutec nhau vagrave caacutec nguồn coacute tổ chức khaacutec nhau Cơ sở dữ liệu caacutec file excel caacutec flat file hoặc caacutec raw file Khi đưa vagraveo kho dữ liệu caacutec dữ liệu được lagravem sạch vagrave tiacutech hợp dữ liệu nhằm đảm bảo tiacutenh nhất quaacuten của dữ liệu

10Kiến truacutec kho dữ liệu Tầng cơ sở dữ liệu hoạt động Tầng truy xuất thocircng tin Tầng truy xuất dữ liệu Tầng siecircu dữ liệu Tầng quản lyacute tiến trigravenh Tầng thocircng điệp của ứng dụng Tầng vật liacute của kho dữ liệu Tầng trigravenh diễn dữ liệu

11Higravenh trạng kho dữ liệu Kho dữ liệu ảo - người dugraveng cuối coacute thể truy cập trực tiếp đến kho dữ liệu

sử dụng caacutec cocircng cụ cho pheacutep ở tầng truy xuất dữ liệu Kho dữ liệu trung tacircm-1 cơ sở dữ liệu vật lyacute chứa tất cả dữ liệu cho một

vugraveng chuyecircn dụng nagraveo đoacute

Kho dữ liệu phacircn taacuten- Thagravenh phần được phacircn taacuten qua nhiều hệ cơ sở dữ liệu vật lyacute

12METADATA- Siecircu dữ liệu Định nghĩa Siecircu dữ liệu lagrave dữ liệu về dữ liệu Lagrave 1 lưu trữ dugraveng để

Miecircu tả kho dữ liệu tổng thể Nhận dạng kiểu kho dữ liệu Quản liacute quaacute trigravenh tiacutech hợp dữ liệu Quản liacute quaacute trigravenh cập nhật kho dữ liệu Quản liacute bảo mật

Lagrave chigravea khoacutea quyết định sự thagravenh cocircng của kho dữ liệu luocircn được thay đổi vagrave cập nhật theo sự phaacutet triển của kho dữ liệu

Dugraveng để quản liacute điều khiển kho dữ liệu Sự ra đời của kho dữ liệu như 1 cấu truacutec hỗ trợ ra quyết định siecircu dữ liệu

được xem như nguồn tagravei nguyecircn dữ liệu Siecircu dữ liệu lagrave trừu tượng Chuacuteng lagrave dữ liệu bậc cao cung cấp mocirc tả ngắn

gọn caacutec dữ liệu bậc thấp hơn 13Hoạt động của Siecircu dữ liệu

Siecircu dữ liệu rất cần thiết trong việc chuyển hoacutea thocircng tin trở thagravenh tri thức Lagrave chigravea khoacutea giuacutep chuacuteng ta xử lyacute được dữ liệu thocirc Viacute dụ một dograveng dữ liệu baacuten hagraveng 1023 K596 11121 agraveNoacute sẽ khocircng coacute nghĩa gigrave cho đến khi chuacuteng ta đưa vagraveo siecircu dữ liệu (thư

mục chứa dữ liệu) agrave cửa hagraveng 1023 sản phẩm K596 vagrave số tiền baacuten được lagrave 11121 đocirc la

14Sự cần thiết phải nhất quaacuten trong kho dữ liệu Kho dữ liệu được xacircy dựng cho lợi iacutech của những nhagrave phacircn tiacutech kinh

doanh caacutec nhagrave quản trị cho tất cả caacutec khu vực chức năng Trong cơ sở dữ liệu riecircng caacutec khu vực khaacutec nhau coacute thể định nghĩa vagrave lưu

trữ dữ liệu thocircng qua phiecircn bản của chiacutenh noacute Khi dữ liệu được lấy từ những vugraveng khaacutec nhau đoacute vagrave được đặt vagraveo kho dữ

liệu Việc chuyển đổi vagrave lagravem sạch caacutec tiến trigravenh sẽ đảm bảo noacute lagrave duy nhất được tiacutech hợp tại một mức của tổ chức

15Ragrave soaacutet lại dữ liệu ndash Thực thi siecircu dữ liệu

Bất kể cấu truacutec tự nhiecircn của 1 cacircu truy vấn thế nagraveo thigrave caacutec thagravenh phần của siecircu dữ liệu rất quan trọng đối với người ra quyết định

Bảng thuộc tiacutenh khoacutea được lưu trữ bởi kho dữ liệu Tập hợp dữ liệu được lấy từ đacircu Những chuyển đổi nagraveo được thực thi với việc lagravem sạch

16Siecircu dữ liệu lagrave gigrave Metadata - lagrave thocircng tin mocirc tả nội dung của cơ sở dữ liệu (CSDL) Metadata baacuteo cho người dugraveng biết thời gian cập nhật sau cugraveng của dữ liệu

định dạng vagrave mục điacutech sử dụng của noacute Những thocircng tin nagravey coacute thể hướng dẫn người dugraveng duyệt qua CSDL vagrave

giuacutep họ hiểu được yacute nghĩa vagrave ngữ cảnh của dữ liệu Trong CSDL metadata lagrave caacutec dạng biểu diễn khaacutec nhau của caacutec đối tượng

trong CSDL Trong CSDL quan hệ metadata lagrave caacutec định nghĩa của bảng cột CSDL

view vagrave nhiều đối tượng khaacutec Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột

một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi -gtMetadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu

Bảng chuyển đổi Ghi lại những chuyển đổi đatilde được thực hiện

Lịch sử thực thi Ghi lại những dữ liệu đatilde được

phacircn tiacutech

Higravenh thaacutei kết nốiGhi lại những dữ liệu được kết nối vagrave tần suất

17Aacutenh xạ thocircng thường của siecircu dữ liệu Bản ghi aacutenh xạ chuyển đổi bao gồm

Định danh của nguồn gốc Chuyển đổi thuộc tiacutenh Chuyển đổi thuộc tiacutenh vật lyacute Matilde hoacutea tham chiếu bảng chuyển đổi Đổi tecircn Đổi khoacutea Gaacuten giaacute trị cho thuộc tiacutenh mặc định Chọn logic cho caacutec nguồn nhiều giaacute trị Đổi thuật toaacuten

18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để

phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai

lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave

tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec

Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm

Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo

19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua

caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau

SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được

Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra

một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức

Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ

Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ

Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech

CHƯƠNG 11 KHAI PHAacute DỮ LIỆU

1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn

ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993

Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng

2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd

1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều

2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP

3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn

4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng

5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server

6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo

7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động

8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời

9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều

10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện

11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech

12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP

3 Xử lyacute phacircn tiacutech trực tuyến OLAP

MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave

dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu

ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave

thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu

HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave

ROLAP4 Khai phaacute dữ liệu

Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh

khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn

Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan

5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp

6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại

Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp

Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec

Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt

Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra

Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh

vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho

Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec

Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm

Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục

Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng

gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp

Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn

Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec

Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper

Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2

Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25

Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước

Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng

Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện

trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp

Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute

độ hỗ trợ ge ngưỡng minsup

độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan

Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn

Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết

Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu

MOLAP ROLAP HOLAP

Lưu trữ dữ liệu cơ sở

Khối Bảng quan hệ Bảng quan hệ

Lưu trữ thocircng tin tổng hợp

Khối Bảng quan hệ Khối

Hiệu suất thực hiện truy vấn

Nhanh nhất Chậm nhất Nhanh

Tiecircu thụ khocircng gian lưu trữ

Nhiều Thấp Trung bigravenh

Chi phiacute bảo trigrave Cao Thấp Trung bigravenh

Page 38: De cuong(1-11)

MYCIN (Standford1970s Edward Shortliffe)

PROSPECTOR (MIT 1979)

Triacute tuệ nhacircn tạo (Artificial Intelligence ndash AI)

Triacute tuệ nhacircn tạo một bộ phacircn của ngagravenh khoa học maacutey tiacutenh quan tacircm đến việc thiết kế caacutec hệ thống maacutey tiacutenh thocircng minh đoacute lagrave caacutec hệ thống đưa ra caacutec đặc điểm magrave từ đoacute chuacuteng ta liecircn hệ với sự thocircng minh trong hagravenh động của con người (Barr vagrave Feigenbaum 1981)

Mục điacutech của AI

Mục điacutech khoa học xaacutec định caacutec gợi yacute để giải thiacutech caacutec loại khaacutec nhau của triacute tuệ thực

Mục điacutech kỹ thuật giải quyết caacutec vấn đề trong thế giới thực

Triacute tuệ nhacircn tạo kế thừa nhiều yacute tưởng quan điểm kỹ thuật từ caacutec ngagravenh khoa học khaacutec

- Triết học

- Logic Toaacuten học

- Tiacutenh toaacuten

- Khoa học tacircm lyacute Khoa học nhận thức

- Sinh học Thần kinh học

- Tiến hoacutea

Caacutec lĩnh vực ứng dụng trong Triacute tuệ nhacircn tạo

Mạng nơ ron thần kinh (Neural Networks)

Tiacutenh toaacuten sự tiến hoacutea

(Evolutionary Computation)

Hệ chuyecircn gia (Expert Systems)

Kỹ thuật xử lyacute tiếng noacutei (Speech Processing)

Kỹ thuật xử lyacute ngocircn ngữ tự nhiecircn

(Natural Language Processing)

Lập kế hoạch (Planning)

Robot (Robotics)

Khoa học higravenh ảnh (Vision)

Caacutec kỹ thuật thocircng dụng dugraveng trong AI

Biểu diễn(Representation)

Học (Learning)

Caacutec luật (Rules)

Tigravem kiếm (Search)

72 Triacute thocircng minh của triacute tuệ nhacircn tạo

Con người suy diễn như thế nagraveo

Phacircn loại (Categorization)

Caacutec quy tắc cụ thể

Heuristics

Kinh nghiệm trước đoacute

Dự tiacutenh trước

Maacutey tiacutenh suy diễn như thế nagraveo

Lập luận dựa trecircn luật IF-THEN mocirc tả tri thức được matilde hoacutea dưới dạng caacutec luật

Caacutec khung (Frames) lagrave caacutec đại diện mocirc tả caacutec tigravenh huống giống nhau lagrave điển higravenh của một vagravei phacircn loại

Lập luận dựa trecircn caacutec trường hợp mocirc phỏng giải phaacutep trước đoacute cho một vấn đề hiện tại

Nhận dạng mẫu phaacutet hiện acircm thanh higravenh dạng hoặc caacutec chuỗi dagravei

Caacutec dạng khaacutec của Triacute tuệ nhacircn tạo

Học maacutey- mạng nơron vagrave giải thuật di truyền

Lập trigravenh tự động ndash lagrave những kỹ thuật tạo ra caacutec chương trigravenh để lagravem 1 nhiệm vụ riecircng biệt (cho pheacutep những người khocircng phải lagrave người lập trigravenh coacute thể lập trigravenh được)

Cuộc sống nhacircn tạo ndash nỗ lực để taacutei tạo caacutec hiện tượng sinh học trong caacutec hệ thống dựa trecircn maacutey tiacutenh

73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia(Expert Systems- ES)

Theo Jackson (1999) Một hệ chuyecircn gia lagrave một chương trigravenh maacutey tiacutenh mocirc tả vagrave suy diễn với tri thức của một vagravei lĩnh vực để giải quyết vấn đề hay đưa ra caacutec lời khuyecircn

Cấu truacutec cơ bản của ES được dựa theo cấu truacutec chung của DSS Sự khaacutec biệt chiacutenh giữa ES vagraveDSS lagrave hệ ES thu thập caacutec kiến thức từ những

chuyecircn gia trong lĩnh vực quan tacircmĐặc trưng của hệ chuyecircn gia Hiệu quả cao Thời gian trả lời thỏa đaacuteng Độ tin cậy cao Dễ hiểu

Giao diện người dugraveng trong ES

Thiết kế giao diện người dugraveng tập trung vagraveo caacutec yếu tố như dễ dagraveng sử dụngcoacute độ tin cậy cao giảm tải những khoacute khăn khi sử dụng

Thiết kế necircn coacute một số tương taacutec (đầu vagraveo kiểm soaacutet vagrave truy vấn)

Cấu tạo giao diện người dugraveng gồm coacute magraven higravenh cảm ứng bagraven phiacutem buacutet saacuteng lệnh thoại caacutec phiacutem chuyecircn dụng

Cơ sở tri thức (Knowledge Base)

Chứa đựng caacutec tri thức cụ thể miền thu được từ caacutec chuyecircn gia miền

Coacute thể chứa caacutec mocirc tả caacutec hagravenh vi giải quyết vấn đề caacutec ragraveng buộc caacutec heuristics

Thagravenh cocircng của một ES dựa trecircn tiacutenh đầy đủ vagrave tiacutenh chiacutenh xaacutec của cơ sở tri thức

Mocirc tơ suy diễn (Inference Engine)

Ở đacircy tri thức được đặt để sử dụng tạo ra caacutec giải phaacutep để giải quyết vấn đề

Mocirc tơ nagravey coacute khả năng thực hiện diễn dịch hoặc suy diễn dựa trecircn caacutec luật hay caacutec caacutec sự kiện

Đồng thời cũng coacute khả năng sử dụng caacutec suy diễn mờ hay khocircng chiacutenh xaacutec dựa trecircn xaacutec suất hay aacutenh xạ mẫu

Vograveng điều khiển suy diễn

1 Aacutenh xạ caacutec luật với caacutec sự kiện đatilde được cho

2 Chọn luật để thực hiện

3 Thực hiện luật bằng caacutech thecircm caacutec sự kiện được suy diễn ra vagraveo bộ nhớ lagravem việc

Chuỗi suy diễn (Chaining)

Suy diễn tiến (forward chaining) maacutey suy diễn bắt đầu từ dữ liệu ban đầu vagrave thực hiện việc suy luận để đưa ra caacutec kết luận cuối cugraveng

Suy diễn lugravei (backward chaining) maacutey suy diễn bắt đầu từ dữ liệu điacutech vagrave tigravem ra tri thức hỗ trợ cho dữ liệu điacutech đoacute

Viacute dụ suy diễn lugravei

R1 Nếu coacute A vagrave B thigrave suy ra coacute D

R2 Nếu coacute B thigrave suy ra coacute C

R3 Nếu coacute C vagrave D thigrave suy ra coacute E

Ta coacute E ta xem trong 3 luật R1 R2 R3 luật nagraveo coacute E ta thấy R3 chứa E đồng thời chứa C vagrave D Xeacutet tiếp trong 2 luật R1 R2 luật nagraveo chứa C vagrave D R2 chứa C R3 chứa D Từ đoacute ta coacute được caacutec tri thức hỗ trợ suy diễn vagrave kết luận lagrave nếu coacute A vagrave B thigrave sẽ coacute E Hay nếu A vagrave B đuacuteng thigrave sẽ coacute E

Viacute dụ suy diễn tiến

Giả sử coacute tập chứa 3 luật sau

R1 Nếu coacute A vagrave B thigrave suy ra coacute D

R2 Nếu coacute B thigrave suy ra coacute C

R3 Nếu coacute C vagrave D thigrave suy ra coacute E

Nếu ta coacute A vagrave B thigrave chuacuteng ta suy ra được D từ R1 vagrave suy ra C từ R2 Với D vagrave C đatilde được suy ra ở trecircn giờ chuacuteng ta suy ra được E từ R3

Viacute dụ thực tế

Giả sử muốn biết magraveu của một con vật nuocirci tecircn lagrave Fred biết rằng noacute kecircu ộp ộp vagrave ăn ruồi

Coacute tập 4 luật ban đầu như sau

R1 Nếu X kecircu ộp ộp vagrave ăn ruồi thigrave X lagrave con ếch

R2 Nếu X kecircu chiecircm chiếp vagrave biết hoacutet thigrave X lagrave con chim

R3 Nếu X lagrave con ếch thigrave X coacute magraveu xanh

R4 Nếu X lagrave con chim thigrave X coacute magraveu vagraveng

74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia

Expert system shells lagrave một tập caacutec goacutei phần mềm vagrave caacutec cocircng cụ dugraveng để phaacutet triển caacutec hệ chuyecircn gia

Những Expert system shells đầu tiecircn thường rất rườm ragrave Mặc dugrave vậy noacute vẫn giuacutep cho người sử dụng sẽ khocircng phải bắt đầu lại từ đầu khi xacircy dựng một hệ chuyecircn gia mới

Những shell hiện đại bao gồm hai mocirc-đun chiacutenh lagrave cocircng cụ xacircy dựng một tập quy tắc vagrave mocirc tơ suy diễn

Xacircy dựng hệ chuyecircn gia

Bước 1 xacircy dựng mocirc higravenh bagravei toaacuten xaacutec định vấn đề nhiệm vụ magrave hệ thống sẽ thực hiện Caacutec dạng bagravei toaacuten cần hệ chuyecircn gia

Bagravei toaacuten diễn giải (InterPretation)

Bagravei toaacuten dự baacuteo (Prediction)

Bagravei toaacuten chuẩn đoaacuten (Diagnose)

Bagravei toaacuten gỡ rối (Debugging)

Bagravei toaacuten thiết kế

Tương tự như một dự aacuten phần mềm để xacircy dựng một hệ chuyecircn gia cần phải coacute caacutec yếu tố về nhacircn lực tagravei nguyecircn vagrave thời gian Những yếu tố nagravey ảnh hưởng đến giaacute thah của một hệ chuyecircn giaTrong phần nagravey cacircu hỏi thường được đặt ra lagrave tại sao cần phải xacircy dựng một hệ chuyecircn giaTrước khi bắt đầu phải xaacute định rotilde bagravei toaacuten đạt ra lagrave jiAi lagrave chuyecircn giaAi lagrave người sử dụng

1 Diễn giải (InterPretation) Nghiecircn cứu 1 vấn đề -gt Dựa trecircn những biểu hiện thuộc tiacutenh đặc trưng becircn ngoagravei -gt Tư vấn

(hoặc đưa ra kết luận hay mocirc tả dễ hiểu từ tập dữ liệu thocirc)

2 Bagravei toaacuten dự baacuteo (Prediction) Coacute thể dự đoaacuten được hagravenh vi kết quả dựa trecircn caacutec hiện tượng -gt dự baacuteo

VD Dự baacuteo thời tiết động đấthellip

3 Bagravei toaacuten chẩn đoaacuten (Diagnoss) Xaacutec định caacutec lỗi caacutec bộ phận hỏng hoacutec của hệ thống dựa trecircn caacutec dữ liệu quan saacutet được

4 Bagravei toaacuten gỡ rối (Debugging) Mocirc tả caacutec phương phaacutep khắc phục hệ thống khi gặp sự cố

5 Bagravei toaacuten thiết kế Lựa chọn cấu higravenh caacutec đối tượng nhằm thoả matilden một số ragraveng buộc nagraveo đoacute

6 Giảng dạy Phần mềm dạy học coacute thể chuẩn đoaacuten vagrave sủa lỗi của học sinh trong quaacute trigravenh học tập

Để xaacutec định đuacuteng bagravei toaacuten magrave chuacuteng ta cần giải quyết thigrave phải trả lời đc một số cacircu hỏi

- cần hệ chuyecircn gia

Bước 2 thu thập tri thức lựa chọn cocircng cụ vagrave aacutep dụng

Trong bước thu thập tri thức vấn đề quan trọng lagrave lựa chọn chuyecircn gia những người magrave sẽ đoacuteng goacutep tri thức cho hệ thống Thocircng thường trong suốt quaacute trigravenh phaacutet triển thigrave chuyecircn gia được xem như một thagravenh viecircn của đội phaacutet triển

Hiện nay coacute rất nhiều cocircng cụ để xacircy dựng một hệ chuyecircn gia Phổ biến nhất lagrave JESS CLIPS vagrave OPS5

Bước 3 Thiết kế cơ sở tri thức thiết kế hệ thốngTri thức được biểu diễn trường minh trong cơ sở tri thức

Caacutec chuyecircn gia vagrave kỹ sư tri thức sẽ đối thoại với nhau bằng caacutec kỹ thuật đối thoại Suy diễn (SD) bảng Mocirc higravenh hoacutea SD quy nạp phacircn loại

Vấn đề bagraveo trigrave vagrave phaacutet triển

Caacutec hệ chuyecircn gia đogravei hỏi phải bảo trigrave vagrave phaacutet triển nhiều hơn so với caacutec hệ thống khaacutec Phải thường xuyecircn bổ sung tri thức mới vagrave thay đổi caacutec tri thức cũ để đổi mới hệ chuyecircn gia

Thu thập vagrave khắc phục lỗi do người sử dụng phaacutet hiện để kịp thời khắc phục những sai soacutet của hệ chuyecircn gia

75 Lợi iacutech vagrave hạn chế của caacutec hệ chuyecircn gia

Một số lợi iacutech chiacutenh

Thời gian trả lời hợp lyacute bằng hoặc nhanh hơn so với chuyecircn gia (người) để đi đến cugraveng một quyết định Hệ chuyecircn gia lagrave một hệ thống thời gian thực (real time system)

Khả năng trả lời với mức độ tinh thocircng bằng hoặc cao hơn so với chuyecircn gia (người) trong cugraveng lĩnh vực

Hệ chuyecircn gia giuacutep cho hiệu quả lagravem việc tăng bằng việc sử dụng tập caacutec luật một caacutech nhanh choacuteng magrave ko bị nhầm lẫn chuyecircn gia lagrave người coacute thể quecircn đi một số tri thức cơ sở lyacute luậ nhưng HCG thigrave ko

Quyết định của một người chuyecircn gia coacute thể bị thay đổi vagrave ko coacute tiacutenh thống nhất như quyết định của một hệ chuyecircn gia tạo ra

Hệ chuyecircn gia giuacutep cho người sử dụng coacute thể trau dồi sự hiểu biết trecircn lĩnh vuej cụ thể magrave noacute giải quyết hỗ trợ người ra quyết định coacute trigravenh độ như 1 chuyecircn gia trong quaacute trigravenh gia quyết định

Kiến thức của rất nhiều chuyecircn gia về một lĩnh vực nagraveo đoacute được đưa vagraveo hệ chuyecircn gia lagravem cho CSTT cuat HCG phong phuacute vagrave rộng lớn hơn rất nhiều

HCG giải thiacutech caacutec bước suy luận một caacutech dễ hiểu nhất quaacuten luacutec nagraveo cũng coacute thể sử dụng ko như chuyecircn gia con người

Hạn chế của caacutec hệ chuyecircn gia

Nhược điểm lớn nhất của hệ chuyecircn gia lagrave những yacute kiến chuyecircn mocircn thường rất khoacute matilde hoacutea vagrave giải neacuten

Hệ chuyecircn gia khocircng coacute khả năng tự học tự cập nhật kiến thức mới như caacutec chuyecircn gia magrave cần phải được matilde hoacutea lại khi noacute được cập nhật

Hệ chuyecircn gia khocircng thể nhận ra được vấn đề khocircng nằm trong miền kiến thức của hệ thống

Chương 8 Tri thức vagrave tiếp nhận

1 Bao gồm caacutec vấn đề

Dữ liệu thực tế đo lường hoặc quan saacutet coacute hoặc khocircng coacute bối cảnh

Thocircng tin dữ liệu được tổng hợp một caacutech hữu iacutech để giải quyết những khoacute khăn trong việc đưa ra quyết định

Tri thức bao gồm caacutec ứng dụng quy tắc thocircng tin hướng dẫn của người ra quyết định

2 Những caacutei nhigraven về tri thức

Đại diện lagravem thế nagraveo để diễn tả tri thức viacute dụ như một quyển saacutech khocircng phải lagrave tri thức nhưng noacute lại lagrave một đại diện của tri thức

Sản xuất tri thức lagrave một tập hơp của hagraveng tồn kho coacute thể được sản xuất cũng như mua lại

Tri thức lagrave 1 trong 6 trạng thaacutei của hệ thống

1Dữ liệu 2Thocircng tin 3Cấu truacutec thocircng tin 4Sự thấu hiểu 5Yacute kiến 6 Quyết định

3 Caacutec loại tri thức Phổ biến mocirc tả dữ liệu thocircng tin thủ tục mọi thứ lagravem như thế nagraveo lập luận chiacutenh saacutech hoặc caacutec quy tắc

4 Thu thập Tri thức hệ chuyecircn gia Hầu hết caacutec phương phaacutep đều bắt đầu với mocirc higravenh của caacutec taacutec vụ trong đoacute

hệ chuyecircn gia được xacircy dựng Trong đoacute mocirc tả về caacutec lĩnh vực được tạo ra Caacutec kỹ sư sử dụng caacutec mocirc higravenh giả thuyết vagrave nhận thức về quaacute trigravenh phacircn

tiacutech để gợi ra caacutech giải quyết vấn đề về tri thức từ caacutec chuyecircn gia

5 Caacutec chiều của thu thập tri thức KE- driven caacutec kỹ sư trao đổi trực tiếp với caacutec chuyecircn gia Expert-driven Caacutec chuyecircn gia trực tiếp đưa chuyecircn mocircn của họ vagraveo hệ

thống maacutey tiacutenh Machine-driven Sử dụng caacutec cocircng cụ suy luận để triacutech xuất tri thức từ một

tập caacutec viacute dụ

6 Kỹ thuật thu thập tri thức Trao đổi gồm 2 loại cơ bản lagrave coacute cấu truacutec(coacute kịch bản) vagrave khocircng coacute cấu

truacutec( đối thoại trực tiếp) Giao thức phacircn tiacutech bằng lời Khi caacutec chuyecircn gia thực hiện một cocircng việc

của họ thigrave một bản ghi về cocircng việc đoacute được thực hiện Caacutec kỹ sư sẽ xacircy dựng mocirc higravenh cho những gigrave được ghi lại trong bản ghi

Phương phaacutep sagraveng lọc caacutec chuyecircn gia so saacutenh caacutec nhoacutem liecircn tiếp trong ba đối tượng vagrave cho biết tại sao nhoacutem thứ hai lại khaacutec nhoacutem thứ ba

7 Thu thập tri thức từ nhiều nguồn Thu thập tri thức từ nhiều nguồn lagrave cần thiết để coacute được đầy đủ caacutec tri thức

cho một vấn đề quan điểm yacute kiến traacutei ngược nhau thường phaacutet sinh Phương phaacutep đồng thuận sẽ giuacutep giải quyết được vấn đề macircu thuẫn Kỹ thuật phacircn tiacutech Meta lagrave kỹ thuật được aacutep dụng trong caacutec trường hợp

khaacutec Caacutech tiếp cận bằng định lượng đogravei hỏi caacutec kỹ sư cần cacircn nhắc yếu tố đầu vagraveo của caacutec chuyecircn gia khaacutec nhau

8 Xaacutec nhận hợp lệ vagrave kiểm tra tri thức Một khi thu thập tri thức noacute phải được đaacutenh giaacute về khả năng sử dụng vagrave độ

chiacutenh xaacutec Hai vấn đề cụ thể lagrave hiệu lực của những kiến thức vagrave kiểm tra việc xacircy dựng cơ sở của tri thức

Cần xaacutec nhận xem liệu hệ thống coacute thể hoạt động ở mức độ tối thiểu khocircng

Xaacutec minh liecircn quan đến việc so saacutenh từng chi tiết kỹ thuật của hệ thống những gigrave đatilde được thực hiện cuối cugraveng

9 Một số caacutec biện phaacutep xaacutec nhận Độ chiacutenh xaacutec Khả năng thiacutech nghi Mức độ đầy đủ Bề rộng Độ sacircu Hiệu lực Tổng quan Chiacutenh xaacutec Hiện thực Độ tin cậy Tiacutenh hữu dụng Mức độ

Chương 9 Học maacutey

1 Logic mờ vagrave ngocircn ngữ mờ(Fuzzy Logic and Linguistic Ambiguity)

Ngocircn ngữ tự nhiecircn gồm những khaacutei niệm mơ hồ vagrave khocircng chiacutenh xaacutectruyền tải ngữ nghĩa thocircng qua tiacutenh xấp xỉkhocircng rotilde ragraveng

Những xấp xỉ nagravey giuacutep con người coacute thể truyền tải hết được yacute nghĩa nhưng maacutey thigrave khocircng hiểu

Lagravem sao biểu diễn caacutec tri thức sử dụng caacutec khaacutei niệm khocircng rotilde ragraveng(mờ) hoặc khocircng chiacutenh xaacutec

2 Khaacutei niệm cơ bản của logic mờ tập mờ lagrave những tập hợp khocircng coacute một giới hạn rotilde Mỗi phần tử của noacute chỉ

chứa một mức độ hagravem liecircn thuộc của từng phần tử Vigrave vậy tập mờ khocircng giống như tập cổ điển Tập mờ coacute thể kết hợp với nhau qua những luật mờ magrave đặc trưng cho những hagravenh động trạng thaacutei vagrave thuộc tiacutenh của logic mờ được tận dụng khi thực hiện một bộ điều khiển mờ

Logic mờ dựa trecircn yacute tưởng mỗi phần tử thuộc vagraveo một tập hợp ở một mức độ nagraveo đấy

Locircgic mờ cho pheacutep độ liecircn thuộc (microA )coacute giaacute trị trong khoảng (01) Locircgic mờ coacute thể được coi lagrave mặt ứng dụng của lyacute thuyết tập mờ để xử lyacute caacutec

giaacute trị trong thế giới thực cho caacutec bagravei toaacuten phức tạp

3 So saacutenh tiacutenh đuacuteng đắn logic mờ vagrave xaacutec suất Xaacutec suất thigrave đề cập đến khả năng xảy ra một biến cố hay một điều gigrave đoacute Logic mờ đề cập đến cấp độ magrave đặc tiacutenh ở hiện tại

o viacute dụ1 người coacute chiều cao 6 feet thigrave coacute cấp độ lagrave 05 về chiều cao

4 Ưu điểm của logic mờ Caacutech tiếp cận rất tự nhiecircnkhocircng phức tạp Coacute thể mocirc higravenh hoacutea caacutec hagravem phi tuyến tugravey yacute phức tạp

Coacute thể tận dụng được kinh nghiệm từ những chuyecircn gia hagraveng đầu trong mọi lĩnh vực

Logic mờ được xacircy dựng dựa trecircn ngocircn ngữ tự nhiecircnNền tảng của logic mờ lagrave dựa trecircn cơ sở giao tiếp của con người

5 Nhược điểm của logic mờ Trong 1 hệ thống phức tạpsử dụng logic mờ coacute thể trở thagravenh trở ngại cho

việc xaacutec thực độ tin cậy của hệ thống Cơ chế lập luận mờ khocircng thể học hỏi từ những lỗi sai

6 Mạng noron nhacircn tạo(ANN) Mạng noron nhacircn tạo lagrave một mocirc phỏng xử lyacute thocircng tinđược nghiecircn cứu ra

từ hệ thống thần kinh của sinh vậtgiống như bộ natildeo để xử lyacute thocircng tin ANNs lagrave chương trigravenh dựa trecircn maacutey tiacutenh đơn giản coacute chức năng lagrave một mocirc

higravenh bagravei toaacuten khocircng gian dựa trecircn thử nghiệm vagrave baacuteo lỗi

7 Học từ kinh nghiệm Tiến trigravenh Một mẫu dữ liệu được biểu diễn như một mạng lưới noronANN ldquodự

đoaacutenrdquo 1 đầu radự đoaacuten được so saacutenh với giaacute trị thực tế hoặc giaacute trị chiacutenh xaacutecNếu đoaacuten được chiacutenh xaacutec thigrave khocircng coacute hagravenh động nagraveo được thực hiện

Nếu dự đoaacuten sai ANN kiểm tra lại vagrave xaacutec định lại thocircng số để điều chỉnh Một mẫu dữ liệu khaacutec được biểu diễn vagrave quaacute trigravenh nagravey được lặp lại

8 Nguyecircn tắc cơ bản của cocircng nghệ nơron Caacutec yếu tố xử lyacute cơ bản trong hệ thống thần kinh của con người lagrave tế bagraveo

thần kinhMạng lưới của tế bagraveo nagravey lagrave liecircn kết với nhau nhận được thocircng tin từ caacutec cảm biến trong mắt taihellip

Thocircng tin nhận được bởi tế bagraveo thần kinh hoặc lagrave sẽ kiacutech thiacutech noacute(sẽ được chuyển qua 1 thocircng điệp dọc theo mạng lưới) hoặc lagrave sẽ ngăn cản noacute(ngăn cản dograveng thocircng tin)

Độ nhạy coacute thể thay đổi qua thời gian hoặc sau khi coacute được kinh nghiệm

9 Cấu truacutec mạng Một ANN gồm 3 lớp cơ bản

Lớp đầu vagraveo nhận dữ liệu Lớp becircn trong hoặc lagrave lớp ẩn xử lyacute dữ liệu Lớp đầu ra chuyển tiếp kết quả cuối cugraveng của mạng

10Mạng nơ ron Thường coacute nhiều đầu vagraveo mỗi đầu vagraveo với mức ảnh hưởng vagrave tầm quan

trọng riecircng của noacute Một đầu vagraveo quan trọng coacute thể được sử dụng để khuếch đại đầu ra caacutec hagravem trạng thaacutei tổng hợp caacutec trọng số của caacutec yếu tố

đầuvagraveo khaacutec nhauvagraveo một giaacute trị duy nhất Caacutec hagravem chuyển giao xử lyacute caacutec giaacute trị trạng thaacutei vagrave tạo đầu ra

11Huấn luyện mạng nơ ron Trong mocirc higravenh coacute giaacutem saacutetANN được đến so saacutenh dự đoaacuten của chiacutenh

noacute với thocircng tin phản hồi coacute chứa caacutec kết quả mong muốn ANN sẽ phải tigravem caacutech thay đổi caacutec tham số becircn trong củamigravenh (caacutec trọng số vagrave caacutec ngưỡng) để tạo necircn một aacutenh xạ coacute khả năng aacutenh xạcaacutec đầu vagraveo thagravenh caacutec đầu ra mong muốn Sự thay đổi nagravey được tiến hagravenh nhờ việc so saacutenh giữa đầu ra thực sự vagrave đầu ra mong muốn

Trong mocirc higravenh khocircng coacute giaacutem saacutetANN nhận được dữ liệu vagraveo nhưng khocircng phải coacute bất kỳ thocircng tin phản hồi về kết quả mong muốn

Phần lớn caacutec ứng dụng nằm trong vugraveng của caacutec bagravei toaacuten ước lượng như mocirc higravenh hoacuteathống kecirc neacuten lọc phacircn cụm

12Lợi iacutech Liecircn kết với mạng noron Traacutenh caacutech lập trigravenh tường minh Giảm nhu cầu của chuyecircn gia ANNs thigrave thiacutech nghi với caacutec yếu tố đầu vagraveo thay đổi Khocircng cần thiết cho cơ sở tri thức tinh chế ANNs coacute tiacutenh động vagrave cải thiện với việc sử dụng Coacute khả năng xử lyacute dữ liệu khocircng chiacutenh xaacutec hoặc khocircng đầy đủ Cho pheacutep tổng quaacutet hoacutea từ thocircng tin cụ thể Cho pheacutep thu thập cảm giaacutec thocircng thường vagraveo miền giải quyết vấn đề

13Hạn chế của việc liecircn kết với mạng noron ANNs khocircng thể giải thiacutech được suy luận Bản chất hộp đen thường khiến cho vấn đề traacutech nhiệm vagrave độ tin cậy phaacutet

sinh lagrave khoacute khăn Lặp đi lặp lại quaacute trigravenh huấn luyện rất tốn thời gian Nguồn lực caacutec nhagrave phacircn tiacutech vagrave thiết kế coacute tay nghề cao vẫn lagrave đaacuteng lo

ngại Cocircng nghệ ANN thuacutec đẩy hạn chế của phần cứng hiện tại ANN yecircu cầu phải coacute sự tin tưởng ở đầu ra

14Giới thiệu về thuật toaacuten di truyền Cũng như mạng lưới thần kinh caacutec thuật toaacuten di truyền được dựa trecircn lyacute

thuyết sinh học Thuật toaacuten di truyền tigravem thấy nguồn gốc của chuacuteng trong caacutec lyacute thuyết

tiến hoacutea của chọn lọc tự nhiecircn vagrave thiacutech ứng với biến đổi khiacute hậu Kết quả thuật toaacuten di truyền lagrave từ giao phối 2 caacute thể trong quần thế để tạo

ra con caacutei đocirci khi tốt hơn so với bậc cha mẹ của chuacuteng 15Caacutec thagravenh phần cơ bản của thuật toaacuten di truyền

Toaacuten tử chọn lọc Caacutec caacute thể tốt được chọn lọc để đưa vagraveo thế hệ sau Sự chọn lọc nagravey căn cứ vagraveo độ thiacutech nghi với mocirci trường của mỗi caacute thể

Toaacuten tử lai gheacutep (crossover) Hai caacute thể cha vagrave mẹ trao đổi caacutec gen với nhau để tạo ra caacute thể con

Toaacuten tử đột biến (mutation) Một caacute thể thay đổi một số gen để biến đổi thagravenh một caacute thể mớiTất cả caacutec toaacuten tử trecircn khi thực hiện đều mang tiacutenh ngẫu nhiecircn

16Quaacute trigravenh cơ bản của một thuật toaacuten di truyền Khởi tạo

Đaacutenh giaacute quần thể

Lựa chọn NST thiacutech hợp nhất vagrave loại bỏ NST yếu nhất

Quy trigravenh giao nhau vagrave cải thiện quần thể

đột biến tiến trigravenh để khaacutem phaacute ra NST mới

17Ưu nhược điểm của việc kết hợp với thuật toaacuten di truyền Kiacutech thước quần thể lagrave 1 yếu tố quan trọng trong tốc độ của việc tigravem

kiếmnhưng noacute tương đối dễ dagraveng để dự đoaacuten tốc độ nagravey Giao nhau hoặc đột biến lagrave khocircng necircn đc sử dụng quaacute thường xuyecircn Luocircn coacute được iacutet nhất 1 giải phaacutep hợp lyacute Necircn coacute thể aacutep dụng chuacuteng cho caacutec vấn đề magrave chuacuteng ta khocircng coacute hướng

về caacutech giải quyết Sức mạnh của thuật toaacuten xuất phaacutet từ khaacutei niệm đơn giảnkhocircng phải từ

một thủ tục thuật toaacuten phức tạp 18Tương lai của học maacutey

Mạng lưới thần kinh nhacircn tạo vượt quaacute năng lực của con người trong caacutec trường hợp bị cocirc lập

Về mặt lyacute thuyếtmột maacutey tiacutenh coacute thể xử lyacute dũ liệu nhanh hơn hagraveng triệu lần so với 1 con người

May mắn thay cho chuacuteng tacon người tốt hơn nhiều khi magrave coacute được dữ liệumaacutey tiacutenh khocircng coacute 1 số thứ như lagrave 5 giaacutec quan

CHƯƠNG 10 KHO DỮ LIỆU

1 Kho dữ liệu Kho dữ liệu lagrave tuyển tập caacutec cơ sở dữ liệu tiacutech hợp hướng chủ đề được

thiết kế để trợ giuacutep cho một hệ hỗ trợ quyết định

Theo John Ladley Cocircng nghệ kho dữ liệu lagrave tập caacutec phương phaacutep kỹ thuật vagrave caacutec cocircng cụ coacute thể kết hợp hỗ trợ nhau để cung cấp thocircng tin cho người sử dụng trecircn cơ sở tiacutech hợp từ nhiều nguồn dữ liệu nhiều mocirci trường khaacutec nhau

Kho dữ liệu thường rất lớn tới hagraveng trăm GB hay thậm chiacute hagraveng Terabyte

2 Kho dữ liệu vận hagravenh (ODS) Một kho dữ liệu vận hagravenh Aacutep dụng kỹ thuật kho dữ liệu vagraveo caacutec hệ xử

lyacute giao taacutec lưu trữ dữ liệu cho một ứng dụng đặc thugrave Noacute đưa vagraveo kho dữ liệu một dograveng caacutec dữ liệu thocirc được thiết kế

3 So saacutenh

Kho dữ liệu vận hagravenh Kho dữ liệu

Dữ liệu theo chủ đề Dữ liệu theo chủ đề

Dữ liệu tiacutech hợp Dữ liệu tiacutech hợp

Dữ liệu thay đổi Dữ liệu khocircng thay đổi

Dữ liệu được cập nhật khi thay đổi

Dữ liệu giữ nguyecircn

Chỉ coacute dữ liệu hiện tạiDữliệu hiện tại vagrave dữ liệu lịch sử

Chu kỳ lagravem tươi dữ liệu ngắn Chu kỳ lagravem tươi dữ liệu dagravei

Chỉ coacute dữ liệu chi tiết Dữ liệu chi tiết vagrave dữ liệu tổng kết

Dugraveng cho caacutec quyết định ngắn hạn

Dugraveng cho hoạch định dagravei hạn

4 Kho dữ liệu cục bộ (Data Mart - DM)

Kho dữ liệu cục bộ lagrave CSDL coacute những đặc điểm giống với kho dữ liệu nhưng với quy mocirc nhỏ hơn vagrave lưu trữ dữ liệu về một lĩnh vực một chuyecircn ngagravenh

Data mart phụ thuộc Chứa những dữ liệu được lấy từ DW vagrave những dữ liệu nagravey sẽ được triacutech lọc vagrave tinh chế tiacutech hợp lại ở mức cao hơn để phục vụ một chủ đề nhất định của Datamart

Data mart độc lập Khocircng giống như Datamart phụ thuộc Data mart độc lập được xacircy dựng trước DW vagrave dữ liệu được trực tiếp lấy từ caacutec nguồn khaacutec nhau

5 Siecircu dữ liệu Metadata lagrave dữ liệu để mocirc tả dữ liệu Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột

một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi Metadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu

6 Mocirci trường kho dữ liệu Hệ thống của tổ chức vagrave kho cung cấp dữ liệu để xacircy dựng kho dữ liệu Trong quaacute trigravenh chuyển dữ liệu từ caacutec nguồn khaacutec nhau dữ liệu coacute thể

được lagravem sạch hoặc chuyển đổi vagrave vigrave thế DW được xem như lagrave một chuẩn cho việc lưu trữ

Đồng thời siecircu dữ liệu được ghi lại Cuối cugraveng DW hoặc siecircu thị coacute thể được sử dụng để tạo ra một kho dữ

liệu ldquocaacute nhacircnrdquo 7 Caacutec đặc điểm của kho dữ liệu

Đặc điểm Mocirc tả

Hướng chủ đề - DL tổ chức theo caacutech thức người dugraveng tham chiếu

Tiacutech hợp - Dữ liệu ldquosạchrdquo loại bỏ tiacutenh thiếu nhất quaacuten

Khocircng thay đổi - DL ldquochỉ đọcrdquo người dugraveng khocircng thay đổi được

Chuỗi thời gian - DL lagrave chuỗi thời gian khocircng phải lagrave trạng thaacutei hiện tại

Được tổng kết - DL vận hagravenhthao taacutec khi cần thiết

được kết hợp lại thagravenh dạng coacute thể dugraveng được cho quyết định

Kiacutech cỡ lớn hơn - Lưu giữ theo chuỗi thời gian tức lagrave giữ lại nhiều DL

Khocircng được chuẩn hoacutea - Coacute thể dư thừa DLSiecircu dữ liệu - Dữ liệu của dữ liệu được lưu trữNguồn dữ liệu - DL vận hagravenh (caacutec hệ sẵn coacute) cugraveng

với caacutec nguồn ngoagravei 8 Kho dữ liệu hướng chủ đề

Hướng chủ để coacute nghĩa lagrave kho dữ liệu được tổ chức xung quanh caacutec chủ đề chiacutenh như khaacutech hagraveng sản phẩm sản xuất Tập trung vagraveo việc mocirc higravenh hoacutea vagrave phacircn tiacutech dữ liệu cho caacutec nhagrave ra quyết định magrave khocircng tập trung vagraveo caacutec xử lyacute thocircng thường Cung cấp cho người dugraveng một khung nhigraven toagraven vẹn đơn giản vagrave đầy đủ về caacutec sự kiện quanh caacutec chủ đề

9 Dữ liệu trong DW được tiacutech hợp Dữ liệu trong kho dữ liệu được xacircy dựng bằng caacutech tổng hợp dữ liệu từ

nhiều nguồn khaacutec nhau vagrave caacutec nguồn coacute tổ chức khaacutec nhau Cơ sở dữ liệu caacutec file excel caacutec flat file hoặc caacutec raw file Khi đưa vagraveo kho dữ liệu caacutec dữ liệu được lagravem sạch vagrave tiacutech hợp dữ liệu nhằm đảm bảo tiacutenh nhất quaacuten của dữ liệu

10Kiến truacutec kho dữ liệu Tầng cơ sở dữ liệu hoạt động Tầng truy xuất thocircng tin Tầng truy xuất dữ liệu Tầng siecircu dữ liệu Tầng quản lyacute tiến trigravenh Tầng thocircng điệp của ứng dụng Tầng vật liacute của kho dữ liệu Tầng trigravenh diễn dữ liệu

11Higravenh trạng kho dữ liệu Kho dữ liệu ảo - người dugraveng cuối coacute thể truy cập trực tiếp đến kho dữ liệu

sử dụng caacutec cocircng cụ cho pheacutep ở tầng truy xuất dữ liệu Kho dữ liệu trung tacircm-1 cơ sở dữ liệu vật lyacute chứa tất cả dữ liệu cho một

vugraveng chuyecircn dụng nagraveo đoacute

Kho dữ liệu phacircn taacuten- Thagravenh phần được phacircn taacuten qua nhiều hệ cơ sở dữ liệu vật lyacute

12METADATA- Siecircu dữ liệu Định nghĩa Siecircu dữ liệu lagrave dữ liệu về dữ liệu Lagrave 1 lưu trữ dugraveng để

Miecircu tả kho dữ liệu tổng thể Nhận dạng kiểu kho dữ liệu Quản liacute quaacute trigravenh tiacutech hợp dữ liệu Quản liacute quaacute trigravenh cập nhật kho dữ liệu Quản liacute bảo mật

Lagrave chigravea khoacutea quyết định sự thagravenh cocircng của kho dữ liệu luocircn được thay đổi vagrave cập nhật theo sự phaacutet triển của kho dữ liệu

Dugraveng để quản liacute điều khiển kho dữ liệu Sự ra đời của kho dữ liệu như 1 cấu truacutec hỗ trợ ra quyết định siecircu dữ liệu

được xem như nguồn tagravei nguyecircn dữ liệu Siecircu dữ liệu lagrave trừu tượng Chuacuteng lagrave dữ liệu bậc cao cung cấp mocirc tả ngắn

gọn caacutec dữ liệu bậc thấp hơn 13Hoạt động của Siecircu dữ liệu

Siecircu dữ liệu rất cần thiết trong việc chuyển hoacutea thocircng tin trở thagravenh tri thức Lagrave chigravea khoacutea giuacutep chuacuteng ta xử lyacute được dữ liệu thocirc Viacute dụ một dograveng dữ liệu baacuten hagraveng 1023 K596 11121 agraveNoacute sẽ khocircng coacute nghĩa gigrave cho đến khi chuacuteng ta đưa vagraveo siecircu dữ liệu (thư

mục chứa dữ liệu) agrave cửa hagraveng 1023 sản phẩm K596 vagrave số tiền baacuten được lagrave 11121 đocirc la

14Sự cần thiết phải nhất quaacuten trong kho dữ liệu Kho dữ liệu được xacircy dựng cho lợi iacutech của những nhagrave phacircn tiacutech kinh

doanh caacutec nhagrave quản trị cho tất cả caacutec khu vực chức năng Trong cơ sở dữ liệu riecircng caacutec khu vực khaacutec nhau coacute thể định nghĩa vagrave lưu

trữ dữ liệu thocircng qua phiecircn bản của chiacutenh noacute Khi dữ liệu được lấy từ những vugraveng khaacutec nhau đoacute vagrave được đặt vagraveo kho dữ

liệu Việc chuyển đổi vagrave lagravem sạch caacutec tiến trigravenh sẽ đảm bảo noacute lagrave duy nhất được tiacutech hợp tại một mức của tổ chức

15Ragrave soaacutet lại dữ liệu ndash Thực thi siecircu dữ liệu

Bất kể cấu truacutec tự nhiecircn của 1 cacircu truy vấn thế nagraveo thigrave caacutec thagravenh phần của siecircu dữ liệu rất quan trọng đối với người ra quyết định

Bảng thuộc tiacutenh khoacutea được lưu trữ bởi kho dữ liệu Tập hợp dữ liệu được lấy từ đacircu Những chuyển đổi nagraveo được thực thi với việc lagravem sạch

16Siecircu dữ liệu lagrave gigrave Metadata - lagrave thocircng tin mocirc tả nội dung của cơ sở dữ liệu (CSDL) Metadata baacuteo cho người dugraveng biết thời gian cập nhật sau cugraveng của dữ liệu

định dạng vagrave mục điacutech sử dụng của noacute Những thocircng tin nagravey coacute thể hướng dẫn người dugraveng duyệt qua CSDL vagrave

giuacutep họ hiểu được yacute nghĩa vagrave ngữ cảnh của dữ liệu Trong CSDL metadata lagrave caacutec dạng biểu diễn khaacutec nhau của caacutec đối tượng

trong CSDL Trong CSDL quan hệ metadata lagrave caacutec định nghĩa của bảng cột CSDL

view vagrave nhiều đối tượng khaacutec Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột

một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi -gtMetadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu

Bảng chuyển đổi Ghi lại những chuyển đổi đatilde được thực hiện

Lịch sử thực thi Ghi lại những dữ liệu đatilde được

phacircn tiacutech

Higravenh thaacutei kết nốiGhi lại những dữ liệu được kết nối vagrave tần suất

17Aacutenh xạ thocircng thường của siecircu dữ liệu Bản ghi aacutenh xạ chuyển đổi bao gồm

Định danh của nguồn gốc Chuyển đổi thuộc tiacutenh Chuyển đổi thuộc tiacutenh vật lyacute Matilde hoacutea tham chiếu bảng chuyển đổi Đổi tecircn Đổi khoacutea Gaacuten giaacute trị cho thuộc tiacutenh mặc định Chọn logic cho caacutec nguồn nhiều giaacute trị Đổi thuật toaacuten

18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để

phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai

lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave

tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec

Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm

Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo

19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua

caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau

SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được

Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra

một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức

Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ

Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ

Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech

CHƯƠNG 11 KHAI PHAacute DỮ LIỆU

1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn

ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993

Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng

2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd

1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều

2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP

3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn

4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng

5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server

6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo

7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động

8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời

9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều

10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện

11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech

12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP

3 Xử lyacute phacircn tiacutech trực tuyến OLAP

MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave

dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu

ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave

thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu

HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave

ROLAP4 Khai phaacute dữ liệu

Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh

khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn

Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan

5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp

6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại

Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp

Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec

Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt

Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra

Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh

vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho

Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec

Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm

Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục

Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng

gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp

Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn

Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec

Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper

Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2

Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25

Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước

Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng

Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện

trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp

Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute

độ hỗ trợ ge ngưỡng minsup

độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan

Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn

Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết

Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu

MOLAP ROLAP HOLAP

Lưu trữ dữ liệu cơ sở

Khối Bảng quan hệ Bảng quan hệ

Lưu trữ thocircng tin tổng hợp

Khối Bảng quan hệ Khối

Hiệu suất thực hiện truy vấn

Nhanh nhất Chậm nhất Nhanh

Tiecircu thụ khocircng gian lưu trữ

Nhiều Thấp Trung bigravenh

Chi phiacute bảo trigrave Cao Thấp Trung bigravenh

Page 39: De cuong(1-11)

Kỹ thuật xử lyacute tiếng noacutei (Speech Processing)

Kỹ thuật xử lyacute ngocircn ngữ tự nhiecircn

(Natural Language Processing)

Lập kế hoạch (Planning)

Robot (Robotics)

Khoa học higravenh ảnh (Vision)

Caacutec kỹ thuật thocircng dụng dugraveng trong AI

Biểu diễn(Representation)

Học (Learning)

Caacutec luật (Rules)

Tigravem kiếm (Search)

72 Triacute thocircng minh của triacute tuệ nhacircn tạo

Con người suy diễn như thế nagraveo

Phacircn loại (Categorization)

Caacutec quy tắc cụ thể

Heuristics

Kinh nghiệm trước đoacute

Dự tiacutenh trước

Maacutey tiacutenh suy diễn như thế nagraveo

Lập luận dựa trecircn luật IF-THEN mocirc tả tri thức được matilde hoacutea dưới dạng caacutec luật

Caacutec khung (Frames) lagrave caacutec đại diện mocirc tả caacutec tigravenh huống giống nhau lagrave điển higravenh của một vagravei phacircn loại

Lập luận dựa trecircn caacutec trường hợp mocirc phỏng giải phaacutep trước đoacute cho một vấn đề hiện tại

Nhận dạng mẫu phaacutet hiện acircm thanh higravenh dạng hoặc caacutec chuỗi dagravei

Caacutec dạng khaacutec của Triacute tuệ nhacircn tạo

Học maacutey- mạng nơron vagrave giải thuật di truyền

Lập trigravenh tự động ndash lagrave những kỹ thuật tạo ra caacutec chương trigravenh để lagravem 1 nhiệm vụ riecircng biệt (cho pheacutep những người khocircng phải lagrave người lập trigravenh coacute thể lập trigravenh được)

Cuộc sống nhacircn tạo ndash nỗ lực để taacutei tạo caacutec hiện tượng sinh học trong caacutec hệ thống dựa trecircn maacutey tiacutenh

73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia(Expert Systems- ES)

Theo Jackson (1999) Một hệ chuyecircn gia lagrave một chương trigravenh maacutey tiacutenh mocirc tả vagrave suy diễn với tri thức của một vagravei lĩnh vực để giải quyết vấn đề hay đưa ra caacutec lời khuyecircn

Cấu truacutec cơ bản của ES được dựa theo cấu truacutec chung của DSS Sự khaacutec biệt chiacutenh giữa ES vagraveDSS lagrave hệ ES thu thập caacutec kiến thức từ những

chuyecircn gia trong lĩnh vực quan tacircmĐặc trưng của hệ chuyecircn gia Hiệu quả cao Thời gian trả lời thỏa đaacuteng Độ tin cậy cao Dễ hiểu

Giao diện người dugraveng trong ES

Thiết kế giao diện người dugraveng tập trung vagraveo caacutec yếu tố như dễ dagraveng sử dụngcoacute độ tin cậy cao giảm tải những khoacute khăn khi sử dụng

Thiết kế necircn coacute một số tương taacutec (đầu vagraveo kiểm soaacutet vagrave truy vấn)

Cấu tạo giao diện người dugraveng gồm coacute magraven higravenh cảm ứng bagraven phiacutem buacutet saacuteng lệnh thoại caacutec phiacutem chuyecircn dụng

Cơ sở tri thức (Knowledge Base)

Chứa đựng caacutec tri thức cụ thể miền thu được từ caacutec chuyecircn gia miền

Coacute thể chứa caacutec mocirc tả caacutec hagravenh vi giải quyết vấn đề caacutec ragraveng buộc caacutec heuristics

Thagravenh cocircng của một ES dựa trecircn tiacutenh đầy đủ vagrave tiacutenh chiacutenh xaacutec của cơ sở tri thức

Mocirc tơ suy diễn (Inference Engine)

Ở đacircy tri thức được đặt để sử dụng tạo ra caacutec giải phaacutep để giải quyết vấn đề

Mocirc tơ nagravey coacute khả năng thực hiện diễn dịch hoặc suy diễn dựa trecircn caacutec luật hay caacutec caacutec sự kiện

Đồng thời cũng coacute khả năng sử dụng caacutec suy diễn mờ hay khocircng chiacutenh xaacutec dựa trecircn xaacutec suất hay aacutenh xạ mẫu

Vograveng điều khiển suy diễn

1 Aacutenh xạ caacutec luật với caacutec sự kiện đatilde được cho

2 Chọn luật để thực hiện

3 Thực hiện luật bằng caacutech thecircm caacutec sự kiện được suy diễn ra vagraveo bộ nhớ lagravem việc

Chuỗi suy diễn (Chaining)

Suy diễn tiến (forward chaining) maacutey suy diễn bắt đầu từ dữ liệu ban đầu vagrave thực hiện việc suy luận để đưa ra caacutec kết luận cuối cugraveng

Suy diễn lugravei (backward chaining) maacutey suy diễn bắt đầu từ dữ liệu điacutech vagrave tigravem ra tri thức hỗ trợ cho dữ liệu điacutech đoacute

Viacute dụ suy diễn lugravei

R1 Nếu coacute A vagrave B thigrave suy ra coacute D

R2 Nếu coacute B thigrave suy ra coacute C

R3 Nếu coacute C vagrave D thigrave suy ra coacute E

Ta coacute E ta xem trong 3 luật R1 R2 R3 luật nagraveo coacute E ta thấy R3 chứa E đồng thời chứa C vagrave D Xeacutet tiếp trong 2 luật R1 R2 luật nagraveo chứa C vagrave D R2 chứa C R3 chứa D Từ đoacute ta coacute được caacutec tri thức hỗ trợ suy diễn vagrave kết luận lagrave nếu coacute A vagrave B thigrave sẽ coacute E Hay nếu A vagrave B đuacuteng thigrave sẽ coacute E

Viacute dụ suy diễn tiến

Giả sử coacute tập chứa 3 luật sau

R1 Nếu coacute A vagrave B thigrave suy ra coacute D

R2 Nếu coacute B thigrave suy ra coacute C

R3 Nếu coacute C vagrave D thigrave suy ra coacute E

Nếu ta coacute A vagrave B thigrave chuacuteng ta suy ra được D từ R1 vagrave suy ra C từ R2 Với D vagrave C đatilde được suy ra ở trecircn giờ chuacuteng ta suy ra được E từ R3

Viacute dụ thực tế

Giả sử muốn biết magraveu của một con vật nuocirci tecircn lagrave Fred biết rằng noacute kecircu ộp ộp vagrave ăn ruồi

Coacute tập 4 luật ban đầu như sau

R1 Nếu X kecircu ộp ộp vagrave ăn ruồi thigrave X lagrave con ếch

R2 Nếu X kecircu chiecircm chiếp vagrave biết hoacutet thigrave X lagrave con chim

R3 Nếu X lagrave con ếch thigrave X coacute magraveu xanh

R4 Nếu X lagrave con chim thigrave X coacute magraveu vagraveng

74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia

Expert system shells lagrave một tập caacutec goacutei phần mềm vagrave caacutec cocircng cụ dugraveng để phaacutet triển caacutec hệ chuyecircn gia

Những Expert system shells đầu tiecircn thường rất rườm ragrave Mặc dugrave vậy noacute vẫn giuacutep cho người sử dụng sẽ khocircng phải bắt đầu lại từ đầu khi xacircy dựng một hệ chuyecircn gia mới

Những shell hiện đại bao gồm hai mocirc-đun chiacutenh lagrave cocircng cụ xacircy dựng một tập quy tắc vagrave mocirc tơ suy diễn

Xacircy dựng hệ chuyecircn gia

Bước 1 xacircy dựng mocirc higravenh bagravei toaacuten xaacutec định vấn đề nhiệm vụ magrave hệ thống sẽ thực hiện Caacutec dạng bagravei toaacuten cần hệ chuyecircn gia

Bagravei toaacuten diễn giải (InterPretation)

Bagravei toaacuten dự baacuteo (Prediction)

Bagravei toaacuten chuẩn đoaacuten (Diagnose)

Bagravei toaacuten gỡ rối (Debugging)

Bagravei toaacuten thiết kế

Tương tự như một dự aacuten phần mềm để xacircy dựng một hệ chuyecircn gia cần phải coacute caacutec yếu tố về nhacircn lực tagravei nguyecircn vagrave thời gian Những yếu tố nagravey ảnh hưởng đến giaacute thah của một hệ chuyecircn giaTrong phần nagravey cacircu hỏi thường được đặt ra lagrave tại sao cần phải xacircy dựng một hệ chuyecircn giaTrước khi bắt đầu phải xaacute định rotilde bagravei toaacuten đạt ra lagrave jiAi lagrave chuyecircn giaAi lagrave người sử dụng

1 Diễn giải (InterPretation) Nghiecircn cứu 1 vấn đề -gt Dựa trecircn những biểu hiện thuộc tiacutenh đặc trưng becircn ngoagravei -gt Tư vấn

(hoặc đưa ra kết luận hay mocirc tả dễ hiểu từ tập dữ liệu thocirc)

2 Bagravei toaacuten dự baacuteo (Prediction) Coacute thể dự đoaacuten được hagravenh vi kết quả dựa trecircn caacutec hiện tượng -gt dự baacuteo

VD Dự baacuteo thời tiết động đấthellip

3 Bagravei toaacuten chẩn đoaacuten (Diagnoss) Xaacutec định caacutec lỗi caacutec bộ phận hỏng hoacutec của hệ thống dựa trecircn caacutec dữ liệu quan saacutet được

4 Bagravei toaacuten gỡ rối (Debugging) Mocirc tả caacutec phương phaacutep khắc phục hệ thống khi gặp sự cố

5 Bagravei toaacuten thiết kế Lựa chọn cấu higravenh caacutec đối tượng nhằm thoả matilden một số ragraveng buộc nagraveo đoacute

6 Giảng dạy Phần mềm dạy học coacute thể chuẩn đoaacuten vagrave sủa lỗi của học sinh trong quaacute trigravenh học tập

Để xaacutec định đuacuteng bagravei toaacuten magrave chuacuteng ta cần giải quyết thigrave phải trả lời đc một số cacircu hỏi

- cần hệ chuyecircn gia

Bước 2 thu thập tri thức lựa chọn cocircng cụ vagrave aacutep dụng

Trong bước thu thập tri thức vấn đề quan trọng lagrave lựa chọn chuyecircn gia những người magrave sẽ đoacuteng goacutep tri thức cho hệ thống Thocircng thường trong suốt quaacute trigravenh phaacutet triển thigrave chuyecircn gia được xem như một thagravenh viecircn của đội phaacutet triển

Hiện nay coacute rất nhiều cocircng cụ để xacircy dựng một hệ chuyecircn gia Phổ biến nhất lagrave JESS CLIPS vagrave OPS5

Bước 3 Thiết kế cơ sở tri thức thiết kế hệ thốngTri thức được biểu diễn trường minh trong cơ sở tri thức

Caacutec chuyecircn gia vagrave kỹ sư tri thức sẽ đối thoại với nhau bằng caacutec kỹ thuật đối thoại Suy diễn (SD) bảng Mocirc higravenh hoacutea SD quy nạp phacircn loại

Vấn đề bagraveo trigrave vagrave phaacutet triển

Caacutec hệ chuyecircn gia đogravei hỏi phải bảo trigrave vagrave phaacutet triển nhiều hơn so với caacutec hệ thống khaacutec Phải thường xuyecircn bổ sung tri thức mới vagrave thay đổi caacutec tri thức cũ để đổi mới hệ chuyecircn gia

Thu thập vagrave khắc phục lỗi do người sử dụng phaacutet hiện để kịp thời khắc phục những sai soacutet của hệ chuyecircn gia

75 Lợi iacutech vagrave hạn chế của caacutec hệ chuyecircn gia

Một số lợi iacutech chiacutenh

Thời gian trả lời hợp lyacute bằng hoặc nhanh hơn so với chuyecircn gia (người) để đi đến cugraveng một quyết định Hệ chuyecircn gia lagrave một hệ thống thời gian thực (real time system)

Khả năng trả lời với mức độ tinh thocircng bằng hoặc cao hơn so với chuyecircn gia (người) trong cugraveng lĩnh vực

Hệ chuyecircn gia giuacutep cho hiệu quả lagravem việc tăng bằng việc sử dụng tập caacutec luật một caacutech nhanh choacuteng magrave ko bị nhầm lẫn chuyecircn gia lagrave người coacute thể quecircn đi một số tri thức cơ sở lyacute luậ nhưng HCG thigrave ko

Quyết định của một người chuyecircn gia coacute thể bị thay đổi vagrave ko coacute tiacutenh thống nhất như quyết định của một hệ chuyecircn gia tạo ra

Hệ chuyecircn gia giuacutep cho người sử dụng coacute thể trau dồi sự hiểu biết trecircn lĩnh vuej cụ thể magrave noacute giải quyết hỗ trợ người ra quyết định coacute trigravenh độ như 1 chuyecircn gia trong quaacute trigravenh gia quyết định

Kiến thức của rất nhiều chuyecircn gia về một lĩnh vực nagraveo đoacute được đưa vagraveo hệ chuyecircn gia lagravem cho CSTT cuat HCG phong phuacute vagrave rộng lớn hơn rất nhiều

HCG giải thiacutech caacutec bước suy luận một caacutech dễ hiểu nhất quaacuten luacutec nagraveo cũng coacute thể sử dụng ko như chuyecircn gia con người

Hạn chế của caacutec hệ chuyecircn gia

Nhược điểm lớn nhất của hệ chuyecircn gia lagrave những yacute kiến chuyecircn mocircn thường rất khoacute matilde hoacutea vagrave giải neacuten

Hệ chuyecircn gia khocircng coacute khả năng tự học tự cập nhật kiến thức mới như caacutec chuyecircn gia magrave cần phải được matilde hoacutea lại khi noacute được cập nhật

Hệ chuyecircn gia khocircng thể nhận ra được vấn đề khocircng nằm trong miền kiến thức của hệ thống

Chương 8 Tri thức vagrave tiếp nhận

1 Bao gồm caacutec vấn đề

Dữ liệu thực tế đo lường hoặc quan saacutet coacute hoặc khocircng coacute bối cảnh

Thocircng tin dữ liệu được tổng hợp một caacutech hữu iacutech để giải quyết những khoacute khăn trong việc đưa ra quyết định

Tri thức bao gồm caacutec ứng dụng quy tắc thocircng tin hướng dẫn của người ra quyết định

2 Những caacutei nhigraven về tri thức

Đại diện lagravem thế nagraveo để diễn tả tri thức viacute dụ như một quyển saacutech khocircng phải lagrave tri thức nhưng noacute lại lagrave một đại diện của tri thức

Sản xuất tri thức lagrave một tập hơp của hagraveng tồn kho coacute thể được sản xuất cũng như mua lại

Tri thức lagrave 1 trong 6 trạng thaacutei của hệ thống

1Dữ liệu 2Thocircng tin 3Cấu truacutec thocircng tin 4Sự thấu hiểu 5Yacute kiến 6 Quyết định

3 Caacutec loại tri thức Phổ biến mocirc tả dữ liệu thocircng tin thủ tục mọi thứ lagravem như thế nagraveo lập luận chiacutenh saacutech hoặc caacutec quy tắc

4 Thu thập Tri thức hệ chuyecircn gia Hầu hết caacutec phương phaacutep đều bắt đầu với mocirc higravenh của caacutec taacutec vụ trong đoacute

hệ chuyecircn gia được xacircy dựng Trong đoacute mocirc tả về caacutec lĩnh vực được tạo ra Caacutec kỹ sư sử dụng caacutec mocirc higravenh giả thuyết vagrave nhận thức về quaacute trigravenh phacircn

tiacutech để gợi ra caacutech giải quyết vấn đề về tri thức từ caacutec chuyecircn gia

5 Caacutec chiều của thu thập tri thức KE- driven caacutec kỹ sư trao đổi trực tiếp với caacutec chuyecircn gia Expert-driven Caacutec chuyecircn gia trực tiếp đưa chuyecircn mocircn của họ vagraveo hệ

thống maacutey tiacutenh Machine-driven Sử dụng caacutec cocircng cụ suy luận để triacutech xuất tri thức từ một

tập caacutec viacute dụ

6 Kỹ thuật thu thập tri thức Trao đổi gồm 2 loại cơ bản lagrave coacute cấu truacutec(coacute kịch bản) vagrave khocircng coacute cấu

truacutec( đối thoại trực tiếp) Giao thức phacircn tiacutech bằng lời Khi caacutec chuyecircn gia thực hiện một cocircng việc

của họ thigrave một bản ghi về cocircng việc đoacute được thực hiện Caacutec kỹ sư sẽ xacircy dựng mocirc higravenh cho những gigrave được ghi lại trong bản ghi

Phương phaacutep sagraveng lọc caacutec chuyecircn gia so saacutenh caacutec nhoacutem liecircn tiếp trong ba đối tượng vagrave cho biết tại sao nhoacutem thứ hai lại khaacutec nhoacutem thứ ba

7 Thu thập tri thức từ nhiều nguồn Thu thập tri thức từ nhiều nguồn lagrave cần thiết để coacute được đầy đủ caacutec tri thức

cho một vấn đề quan điểm yacute kiến traacutei ngược nhau thường phaacutet sinh Phương phaacutep đồng thuận sẽ giuacutep giải quyết được vấn đề macircu thuẫn Kỹ thuật phacircn tiacutech Meta lagrave kỹ thuật được aacutep dụng trong caacutec trường hợp

khaacutec Caacutech tiếp cận bằng định lượng đogravei hỏi caacutec kỹ sư cần cacircn nhắc yếu tố đầu vagraveo của caacutec chuyecircn gia khaacutec nhau

8 Xaacutec nhận hợp lệ vagrave kiểm tra tri thức Một khi thu thập tri thức noacute phải được đaacutenh giaacute về khả năng sử dụng vagrave độ

chiacutenh xaacutec Hai vấn đề cụ thể lagrave hiệu lực của những kiến thức vagrave kiểm tra việc xacircy dựng cơ sở của tri thức

Cần xaacutec nhận xem liệu hệ thống coacute thể hoạt động ở mức độ tối thiểu khocircng

Xaacutec minh liecircn quan đến việc so saacutenh từng chi tiết kỹ thuật của hệ thống những gigrave đatilde được thực hiện cuối cugraveng

9 Một số caacutec biện phaacutep xaacutec nhận Độ chiacutenh xaacutec Khả năng thiacutech nghi Mức độ đầy đủ Bề rộng Độ sacircu Hiệu lực Tổng quan Chiacutenh xaacutec Hiện thực Độ tin cậy Tiacutenh hữu dụng Mức độ

Chương 9 Học maacutey

1 Logic mờ vagrave ngocircn ngữ mờ(Fuzzy Logic and Linguistic Ambiguity)

Ngocircn ngữ tự nhiecircn gồm những khaacutei niệm mơ hồ vagrave khocircng chiacutenh xaacutectruyền tải ngữ nghĩa thocircng qua tiacutenh xấp xỉkhocircng rotilde ragraveng

Những xấp xỉ nagravey giuacutep con người coacute thể truyền tải hết được yacute nghĩa nhưng maacutey thigrave khocircng hiểu

Lagravem sao biểu diễn caacutec tri thức sử dụng caacutec khaacutei niệm khocircng rotilde ragraveng(mờ) hoặc khocircng chiacutenh xaacutec

2 Khaacutei niệm cơ bản của logic mờ tập mờ lagrave những tập hợp khocircng coacute một giới hạn rotilde Mỗi phần tử của noacute chỉ

chứa một mức độ hagravem liecircn thuộc của từng phần tử Vigrave vậy tập mờ khocircng giống như tập cổ điển Tập mờ coacute thể kết hợp với nhau qua những luật mờ magrave đặc trưng cho những hagravenh động trạng thaacutei vagrave thuộc tiacutenh của logic mờ được tận dụng khi thực hiện một bộ điều khiển mờ

Logic mờ dựa trecircn yacute tưởng mỗi phần tử thuộc vagraveo một tập hợp ở một mức độ nagraveo đấy

Locircgic mờ cho pheacutep độ liecircn thuộc (microA )coacute giaacute trị trong khoảng (01) Locircgic mờ coacute thể được coi lagrave mặt ứng dụng của lyacute thuyết tập mờ để xử lyacute caacutec

giaacute trị trong thế giới thực cho caacutec bagravei toaacuten phức tạp

3 So saacutenh tiacutenh đuacuteng đắn logic mờ vagrave xaacutec suất Xaacutec suất thigrave đề cập đến khả năng xảy ra một biến cố hay một điều gigrave đoacute Logic mờ đề cập đến cấp độ magrave đặc tiacutenh ở hiện tại

o viacute dụ1 người coacute chiều cao 6 feet thigrave coacute cấp độ lagrave 05 về chiều cao

4 Ưu điểm của logic mờ Caacutech tiếp cận rất tự nhiecircnkhocircng phức tạp Coacute thể mocirc higravenh hoacutea caacutec hagravem phi tuyến tugravey yacute phức tạp

Coacute thể tận dụng được kinh nghiệm từ những chuyecircn gia hagraveng đầu trong mọi lĩnh vực

Logic mờ được xacircy dựng dựa trecircn ngocircn ngữ tự nhiecircnNền tảng của logic mờ lagrave dựa trecircn cơ sở giao tiếp của con người

5 Nhược điểm của logic mờ Trong 1 hệ thống phức tạpsử dụng logic mờ coacute thể trở thagravenh trở ngại cho

việc xaacutec thực độ tin cậy của hệ thống Cơ chế lập luận mờ khocircng thể học hỏi từ những lỗi sai

6 Mạng noron nhacircn tạo(ANN) Mạng noron nhacircn tạo lagrave một mocirc phỏng xử lyacute thocircng tinđược nghiecircn cứu ra

từ hệ thống thần kinh của sinh vậtgiống như bộ natildeo để xử lyacute thocircng tin ANNs lagrave chương trigravenh dựa trecircn maacutey tiacutenh đơn giản coacute chức năng lagrave một mocirc

higravenh bagravei toaacuten khocircng gian dựa trecircn thử nghiệm vagrave baacuteo lỗi

7 Học từ kinh nghiệm Tiến trigravenh Một mẫu dữ liệu được biểu diễn như một mạng lưới noronANN ldquodự

đoaacutenrdquo 1 đầu radự đoaacuten được so saacutenh với giaacute trị thực tế hoặc giaacute trị chiacutenh xaacutecNếu đoaacuten được chiacutenh xaacutec thigrave khocircng coacute hagravenh động nagraveo được thực hiện

Nếu dự đoaacuten sai ANN kiểm tra lại vagrave xaacutec định lại thocircng số để điều chỉnh Một mẫu dữ liệu khaacutec được biểu diễn vagrave quaacute trigravenh nagravey được lặp lại

8 Nguyecircn tắc cơ bản của cocircng nghệ nơron Caacutec yếu tố xử lyacute cơ bản trong hệ thống thần kinh của con người lagrave tế bagraveo

thần kinhMạng lưới của tế bagraveo nagravey lagrave liecircn kết với nhau nhận được thocircng tin từ caacutec cảm biến trong mắt taihellip

Thocircng tin nhận được bởi tế bagraveo thần kinh hoặc lagrave sẽ kiacutech thiacutech noacute(sẽ được chuyển qua 1 thocircng điệp dọc theo mạng lưới) hoặc lagrave sẽ ngăn cản noacute(ngăn cản dograveng thocircng tin)

Độ nhạy coacute thể thay đổi qua thời gian hoặc sau khi coacute được kinh nghiệm

9 Cấu truacutec mạng Một ANN gồm 3 lớp cơ bản

Lớp đầu vagraveo nhận dữ liệu Lớp becircn trong hoặc lagrave lớp ẩn xử lyacute dữ liệu Lớp đầu ra chuyển tiếp kết quả cuối cugraveng của mạng

10Mạng nơ ron Thường coacute nhiều đầu vagraveo mỗi đầu vagraveo với mức ảnh hưởng vagrave tầm quan

trọng riecircng của noacute Một đầu vagraveo quan trọng coacute thể được sử dụng để khuếch đại đầu ra caacutec hagravem trạng thaacutei tổng hợp caacutec trọng số của caacutec yếu tố

đầuvagraveo khaacutec nhauvagraveo một giaacute trị duy nhất Caacutec hagravem chuyển giao xử lyacute caacutec giaacute trị trạng thaacutei vagrave tạo đầu ra

11Huấn luyện mạng nơ ron Trong mocirc higravenh coacute giaacutem saacutetANN được đến so saacutenh dự đoaacuten của chiacutenh

noacute với thocircng tin phản hồi coacute chứa caacutec kết quả mong muốn ANN sẽ phải tigravem caacutech thay đổi caacutec tham số becircn trong củamigravenh (caacutec trọng số vagrave caacutec ngưỡng) để tạo necircn một aacutenh xạ coacute khả năng aacutenh xạcaacutec đầu vagraveo thagravenh caacutec đầu ra mong muốn Sự thay đổi nagravey được tiến hagravenh nhờ việc so saacutenh giữa đầu ra thực sự vagrave đầu ra mong muốn

Trong mocirc higravenh khocircng coacute giaacutem saacutetANN nhận được dữ liệu vagraveo nhưng khocircng phải coacute bất kỳ thocircng tin phản hồi về kết quả mong muốn

Phần lớn caacutec ứng dụng nằm trong vugraveng của caacutec bagravei toaacuten ước lượng như mocirc higravenh hoacuteathống kecirc neacuten lọc phacircn cụm

12Lợi iacutech Liecircn kết với mạng noron Traacutenh caacutech lập trigravenh tường minh Giảm nhu cầu của chuyecircn gia ANNs thigrave thiacutech nghi với caacutec yếu tố đầu vagraveo thay đổi Khocircng cần thiết cho cơ sở tri thức tinh chế ANNs coacute tiacutenh động vagrave cải thiện với việc sử dụng Coacute khả năng xử lyacute dữ liệu khocircng chiacutenh xaacutec hoặc khocircng đầy đủ Cho pheacutep tổng quaacutet hoacutea từ thocircng tin cụ thể Cho pheacutep thu thập cảm giaacutec thocircng thường vagraveo miền giải quyết vấn đề

13Hạn chế của việc liecircn kết với mạng noron ANNs khocircng thể giải thiacutech được suy luận Bản chất hộp đen thường khiến cho vấn đề traacutech nhiệm vagrave độ tin cậy phaacutet

sinh lagrave khoacute khăn Lặp đi lặp lại quaacute trigravenh huấn luyện rất tốn thời gian Nguồn lực caacutec nhagrave phacircn tiacutech vagrave thiết kế coacute tay nghề cao vẫn lagrave đaacuteng lo

ngại Cocircng nghệ ANN thuacutec đẩy hạn chế của phần cứng hiện tại ANN yecircu cầu phải coacute sự tin tưởng ở đầu ra

14Giới thiệu về thuật toaacuten di truyền Cũng như mạng lưới thần kinh caacutec thuật toaacuten di truyền được dựa trecircn lyacute

thuyết sinh học Thuật toaacuten di truyền tigravem thấy nguồn gốc của chuacuteng trong caacutec lyacute thuyết

tiến hoacutea của chọn lọc tự nhiecircn vagrave thiacutech ứng với biến đổi khiacute hậu Kết quả thuật toaacuten di truyền lagrave từ giao phối 2 caacute thể trong quần thế để tạo

ra con caacutei đocirci khi tốt hơn so với bậc cha mẹ của chuacuteng 15Caacutec thagravenh phần cơ bản của thuật toaacuten di truyền

Toaacuten tử chọn lọc Caacutec caacute thể tốt được chọn lọc để đưa vagraveo thế hệ sau Sự chọn lọc nagravey căn cứ vagraveo độ thiacutech nghi với mocirci trường của mỗi caacute thể

Toaacuten tử lai gheacutep (crossover) Hai caacute thể cha vagrave mẹ trao đổi caacutec gen với nhau để tạo ra caacute thể con

Toaacuten tử đột biến (mutation) Một caacute thể thay đổi một số gen để biến đổi thagravenh một caacute thể mớiTất cả caacutec toaacuten tử trecircn khi thực hiện đều mang tiacutenh ngẫu nhiecircn

16Quaacute trigravenh cơ bản của một thuật toaacuten di truyền Khởi tạo

Đaacutenh giaacute quần thể

Lựa chọn NST thiacutech hợp nhất vagrave loại bỏ NST yếu nhất

Quy trigravenh giao nhau vagrave cải thiện quần thể

đột biến tiến trigravenh để khaacutem phaacute ra NST mới

17Ưu nhược điểm của việc kết hợp với thuật toaacuten di truyền Kiacutech thước quần thể lagrave 1 yếu tố quan trọng trong tốc độ của việc tigravem

kiếmnhưng noacute tương đối dễ dagraveng để dự đoaacuten tốc độ nagravey Giao nhau hoặc đột biến lagrave khocircng necircn đc sử dụng quaacute thường xuyecircn Luocircn coacute được iacutet nhất 1 giải phaacutep hợp lyacute Necircn coacute thể aacutep dụng chuacuteng cho caacutec vấn đề magrave chuacuteng ta khocircng coacute hướng

về caacutech giải quyết Sức mạnh của thuật toaacuten xuất phaacutet từ khaacutei niệm đơn giảnkhocircng phải từ

một thủ tục thuật toaacuten phức tạp 18Tương lai của học maacutey

Mạng lưới thần kinh nhacircn tạo vượt quaacute năng lực của con người trong caacutec trường hợp bị cocirc lập

Về mặt lyacute thuyếtmột maacutey tiacutenh coacute thể xử lyacute dũ liệu nhanh hơn hagraveng triệu lần so với 1 con người

May mắn thay cho chuacuteng tacon người tốt hơn nhiều khi magrave coacute được dữ liệumaacutey tiacutenh khocircng coacute 1 số thứ như lagrave 5 giaacutec quan

CHƯƠNG 10 KHO DỮ LIỆU

1 Kho dữ liệu Kho dữ liệu lagrave tuyển tập caacutec cơ sở dữ liệu tiacutech hợp hướng chủ đề được

thiết kế để trợ giuacutep cho một hệ hỗ trợ quyết định

Theo John Ladley Cocircng nghệ kho dữ liệu lagrave tập caacutec phương phaacutep kỹ thuật vagrave caacutec cocircng cụ coacute thể kết hợp hỗ trợ nhau để cung cấp thocircng tin cho người sử dụng trecircn cơ sở tiacutech hợp từ nhiều nguồn dữ liệu nhiều mocirci trường khaacutec nhau

Kho dữ liệu thường rất lớn tới hagraveng trăm GB hay thậm chiacute hagraveng Terabyte

2 Kho dữ liệu vận hagravenh (ODS) Một kho dữ liệu vận hagravenh Aacutep dụng kỹ thuật kho dữ liệu vagraveo caacutec hệ xử

lyacute giao taacutec lưu trữ dữ liệu cho một ứng dụng đặc thugrave Noacute đưa vagraveo kho dữ liệu một dograveng caacutec dữ liệu thocirc được thiết kế

3 So saacutenh

Kho dữ liệu vận hagravenh Kho dữ liệu

Dữ liệu theo chủ đề Dữ liệu theo chủ đề

Dữ liệu tiacutech hợp Dữ liệu tiacutech hợp

Dữ liệu thay đổi Dữ liệu khocircng thay đổi

Dữ liệu được cập nhật khi thay đổi

Dữ liệu giữ nguyecircn

Chỉ coacute dữ liệu hiện tạiDữliệu hiện tại vagrave dữ liệu lịch sử

Chu kỳ lagravem tươi dữ liệu ngắn Chu kỳ lagravem tươi dữ liệu dagravei

Chỉ coacute dữ liệu chi tiết Dữ liệu chi tiết vagrave dữ liệu tổng kết

Dugraveng cho caacutec quyết định ngắn hạn

Dugraveng cho hoạch định dagravei hạn

4 Kho dữ liệu cục bộ (Data Mart - DM)

Kho dữ liệu cục bộ lagrave CSDL coacute những đặc điểm giống với kho dữ liệu nhưng với quy mocirc nhỏ hơn vagrave lưu trữ dữ liệu về một lĩnh vực một chuyecircn ngagravenh

Data mart phụ thuộc Chứa những dữ liệu được lấy từ DW vagrave những dữ liệu nagravey sẽ được triacutech lọc vagrave tinh chế tiacutech hợp lại ở mức cao hơn để phục vụ một chủ đề nhất định của Datamart

Data mart độc lập Khocircng giống như Datamart phụ thuộc Data mart độc lập được xacircy dựng trước DW vagrave dữ liệu được trực tiếp lấy từ caacutec nguồn khaacutec nhau

5 Siecircu dữ liệu Metadata lagrave dữ liệu để mocirc tả dữ liệu Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột

một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi Metadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu

6 Mocirci trường kho dữ liệu Hệ thống của tổ chức vagrave kho cung cấp dữ liệu để xacircy dựng kho dữ liệu Trong quaacute trigravenh chuyển dữ liệu từ caacutec nguồn khaacutec nhau dữ liệu coacute thể

được lagravem sạch hoặc chuyển đổi vagrave vigrave thế DW được xem như lagrave một chuẩn cho việc lưu trữ

Đồng thời siecircu dữ liệu được ghi lại Cuối cugraveng DW hoặc siecircu thị coacute thể được sử dụng để tạo ra một kho dữ

liệu ldquocaacute nhacircnrdquo 7 Caacutec đặc điểm của kho dữ liệu

Đặc điểm Mocirc tả

Hướng chủ đề - DL tổ chức theo caacutech thức người dugraveng tham chiếu

Tiacutech hợp - Dữ liệu ldquosạchrdquo loại bỏ tiacutenh thiếu nhất quaacuten

Khocircng thay đổi - DL ldquochỉ đọcrdquo người dugraveng khocircng thay đổi được

Chuỗi thời gian - DL lagrave chuỗi thời gian khocircng phải lagrave trạng thaacutei hiện tại

Được tổng kết - DL vận hagravenhthao taacutec khi cần thiết

được kết hợp lại thagravenh dạng coacute thể dugraveng được cho quyết định

Kiacutech cỡ lớn hơn - Lưu giữ theo chuỗi thời gian tức lagrave giữ lại nhiều DL

Khocircng được chuẩn hoacutea - Coacute thể dư thừa DLSiecircu dữ liệu - Dữ liệu của dữ liệu được lưu trữNguồn dữ liệu - DL vận hagravenh (caacutec hệ sẵn coacute) cugraveng

với caacutec nguồn ngoagravei 8 Kho dữ liệu hướng chủ đề

Hướng chủ để coacute nghĩa lagrave kho dữ liệu được tổ chức xung quanh caacutec chủ đề chiacutenh như khaacutech hagraveng sản phẩm sản xuất Tập trung vagraveo việc mocirc higravenh hoacutea vagrave phacircn tiacutech dữ liệu cho caacutec nhagrave ra quyết định magrave khocircng tập trung vagraveo caacutec xử lyacute thocircng thường Cung cấp cho người dugraveng một khung nhigraven toagraven vẹn đơn giản vagrave đầy đủ về caacutec sự kiện quanh caacutec chủ đề

9 Dữ liệu trong DW được tiacutech hợp Dữ liệu trong kho dữ liệu được xacircy dựng bằng caacutech tổng hợp dữ liệu từ

nhiều nguồn khaacutec nhau vagrave caacutec nguồn coacute tổ chức khaacutec nhau Cơ sở dữ liệu caacutec file excel caacutec flat file hoặc caacutec raw file Khi đưa vagraveo kho dữ liệu caacutec dữ liệu được lagravem sạch vagrave tiacutech hợp dữ liệu nhằm đảm bảo tiacutenh nhất quaacuten của dữ liệu

10Kiến truacutec kho dữ liệu Tầng cơ sở dữ liệu hoạt động Tầng truy xuất thocircng tin Tầng truy xuất dữ liệu Tầng siecircu dữ liệu Tầng quản lyacute tiến trigravenh Tầng thocircng điệp của ứng dụng Tầng vật liacute của kho dữ liệu Tầng trigravenh diễn dữ liệu

11Higravenh trạng kho dữ liệu Kho dữ liệu ảo - người dugraveng cuối coacute thể truy cập trực tiếp đến kho dữ liệu

sử dụng caacutec cocircng cụ cho pheacutep ở tầng truy xuất dữ liệu Kho dữ liệu trung tacircm-1 cơ sở dữ liệu vật lyacute chứa tất cả dữ liệu cho một

vugraveng chuyecircn dụng nagraveo đoacute

Kho dữ liệu phacircn taacuten- Thagravenh phần được phacircn taacuten qua nhiều hệ cơ sở dữ liệu vật lyacute

12METADATA- Siecircu dữ liệu Định nghĩa Siecircu dữ liệu lagrave dữ liệu về dữ liệu Lagrave 1 lưu trữ dugraveng để

Miecircu tả kho dữ liệu tổng thể Nhận dạng kiểu kho dữ liệu Quản liacute quaacute trigravenh tiacutech hợp dữ liệu Quản liacute quaacute trigravenh cập nhật kho dữ liệu Quản liacute bảo mật

Lagrave chigravea khoacutea quyết định sự thagravenh cocircng của kho dữ liệu luocircn được thay đổi vagrave cập nhật theo sự phaacutet triển của kho dữ liệu

Dugraveng để quản liacute điều khiển kho dữ liệu Sự ra đời của kho dữ liệu như 1 cấu truacutec hỗ trợ ra quyết định siecircu dữ liệu

được xem như nguồn tagravei nguyecircn dữ liệu Siecircu dữ liệu lagrave trừu tượng Chuacuteng lagrave dữ liệu bậc cao cung cấp mocirc tả ngắn

gọn caacutec dữ liệu bậc thấp hơn 13Hoạt động của Siecircu dữ liệu

Siecircu dữ liệu rất cần thiết trong việc chuyển hoacutea thocircng tin trở thagravenh tri thức Lagrave chigravea khoacutea giuacutep chuacuteng ta xử lyacute được dữ liệu thocirc Viacute dụ một dograveng dữ liệu baacuten hagraveng 1023 K596 11121 agraveNoacute sẽ khocircng coacute nghĩa gigrave cho đến khi chuacuteng ta đưa vagraveo siecircu dữ liệu (thư

mục chứa dữ liệu) agrave cửa hagraveng 1023 sản phẩm K596 vagrave số tiền baacuten được lagrave 11121 đocirc la

14Sự cần thiết phải nhất quaacuten trong kho dữ liệu Kho dữ liệu được xacircy dựng cho lợi iacutech của những nhagrave phacircn tiacutech kinh

doanh caacutec nhagrave quản trị cho tất cả caacutec khu vực chức năng Trong cơ sở dữ liệu riecircng caacutec khu vực khaacutec nhau coacute thể định nghĩa vagrave lưu

trữ dữ liệu thocircng qua phiecircn bản của chiacutenh noacute Khi dữ liệu được lấy từ những vugraveng khaacutec nhau đoacute vagrave được đặt vagraveo kho dữ

liệu Việc chuyển đổi vagrave lagravem sạch caacutec tiến trigravenh sẽ đảm bảo noacute lagrave duy nhất được tiacutech hợp tại một mức của tổ chức

15Ragrave soaacutet lại dữ liệu ndash Thực thi siecircu dữ liệu

Bất kể cấu truacutec tự nhiecircn của 1 cacircu truy vấn thế nagraveo thigrave caacutec thagravenh phần của siecircu dữ liệu rất quan trọng đối với người ra quyết định

Bảng thuộc tiacutenh khoacutea được lưu trữ bởi kho dữ liệu Tập hợp dữ liệu được lấy từ đacircu Những chuyển đổi nagraveo được thực thi với việc lagravem sạch

16Siecircu dữ liệu lagrave gigrave Metadata - lagrave thocircng tin mocirc tả nội dung của cơ sở dữ liệu (CSDL) Metadata baacuteo cho người dugraveng biết thời gian cập nhật sau cugraveng của dữ liệu

định dạng vagrave mục điacutech sử dụng của noacute Những thocircng tin nagravey coacute thể hướng dẫn người dugraveng duyệt qua CSDL vagrave

giuacutep họ hiểu được yacute nghĩa vagrave ngữ cảnh của dữ liệu Trong CSDL metadata lagrave caacutec dạng biểu diễn khaacutec nhau của caacutec đối tượng

trong CSDL Trong CSDL quan hệ metadata lagrave caacutec định nghĩa của bảng cột CSDL

view vagrave nhiều đối tượng khaacutec Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột

một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi -gtMetadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu

Bảng chuyển đổi Ghi lại những chuyển đổi đatilde được thực hiện

Lịch sử thực thi Ghi lại những dữ liệu đatilde được

phacircn tiacutech

Higravenh thaacutei kết nốiGhi lại những dữ liệu được kết nối vagrave tần suất

17Aacutenh xạ thocircng thường của siecircu dữ liệu Bản ghi aacutenh xạ chuyển đổi bao gồm

Định danh của nguồn gốc Chuyển đổi thuộc tiacutenh Chuyển đổi thuộc tiacutenh vật lyacute Matilde hoacutea tham chiếu bảng chuyển đổi Đổi tecircn Đổi khoacutea Gaacuten giaacute trị cho thuộc tiacutenh mặc định Chọn logic cho caacutec nguồn nhiều giaacute trị Đổi thuật toaacuten

18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để

phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai

lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave

tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec

Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm

Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo

19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua

caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau

SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được

Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra

một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức

Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ

Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ

Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech

CHƯƠNG 11 KHAI PHAacute DỮ LIỆU

1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn

ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993

Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng

2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd

1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều

2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP

3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn

4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng

5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server

6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo

7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động

8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời

9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều

10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện

11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech

12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP

3 Xử lyacute phacircn tiacutech trực tuyến OLAP

MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave

dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu

ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave

thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu

HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave

ROLAP4 Khai phaacute dữ liệu

Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh

khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn

Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan

5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp

6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại

Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp

Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec

Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt

Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra

Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh

vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho

Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec

Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm

Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục

Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng

gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp

Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn

Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec

Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper

Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2

Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25

Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước

Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng

Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện

trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp

Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute

độ hỗ trợ ge ngưỡng minsup

độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan

Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn

Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết

Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu

MOLAP ROLAP HOLAP

Lưu trữ dữ liệu cơ sở

Khối Bảng quan hệ Bảng quan hệ

Lưu trữ thocircng tin tổng hợp

Khối Bảng quan hệ Khối

Hiệu suất thực hiện truy vấn

Nhanh nhất Chậm nhất Nhanh

Tiecircu thụ khocircng gian lưu trữ

Nhiều Thấp Trung bigravenh

Chi phiacute bảo trigrave Cao Thấp Trung bigravenh

Page 40: De cuong(1-11)

Lập luận dựa trecircn caacutec trường hợp mocirc phỏng giải phaacutep trước đoacute cho một vấn đề hiện tại

Nhận dạng mẫu phaacutet hiện acircm thanh higravenh dạng hoặc caacutec chuỗi dagravei

Caacutec dạng khaacutec của Triacute tuệ nhacircn tạo

Học maacutey- mạng nơron vagrave giải thuật di truyền

Lập trigravenh tự động ndash lagrave những kỹ thuật tạo ra caacutec chương trigravenh để lagravem 1 nhiệm vụ riecircng biệt (cho pheacutep những người khocircng phải lagrave người lập trigravenh coacute thể lập trigravenh được)

Cuộc sống nhacircn tạo ndash nỗ lực để taacutei tạo caacutec hiện tượng sinh học trong caacutec hệ thống dựa trecircn maacutey tiacutenh

73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia(Expert Systems- ES)

Theo Jackson (1999) Một hệ chuyecircn gia lagrave một chương trigravenh maacutey tiacutenh mocirc tả vagrave suy diễn với tri thức của một vagravei lĩnh vực để giải quyết vấn đề hay đưa ra caacutec lời khuyecircn

Cấu truacutec cơ bản của ES được dựa theo cấu truacutec chung của DSS Sự khaacutec biệt chiacutenh giữa ES vagraveDSS lagrave hệ ES thu thập caacutec kiến thức từ những

chuyecircn gia trong lĩnh vực quan tacircmĐặc trưng của hệ chuyecircn gia Hiệu quả cao Thời gian trả lời thỏa đaacuteng Độ tin cậy cao Dễ hiểu

Giao diện người dugraveng trong ES

Thiết kế giao diện người dugraveng tập trung vagraveo caacutec yếu tố như dễ dagraveng sử dụngcoacute độ tin cậy cao giảm tải những khoacute khăn khi sử dụng

Thiết kế necircn coacute một số tương taacutec (đầu vagraveo kiểm soaacutet vagrave truy vấn)

Cấu tạo giao diện người dugraveng gồm coacute magraven higravenh cảm ứng bagraven phiacutem buacutet saacuteng lệnh thoại caacutec phiacutem chuyecircn dụng

Cơ sở tri thức (Knowledge Base)

Chứa đựng caacutec tri thức cụ thể miền thu được từ caacutec chuyecircn gia miền

Coacute thể chứa caacutec mocirc tả caacutec hagravenh vi giải quyết vấn đề caacutec ragraveng buộc caacutec heuristics

Thagravenh cocircng của một ES dựa trecircn tiacutenh đầy đủ vagrave tiacutenh chiacutenh xaacutec của cơ sở tri thức

Mocirc tơ suy diễn (Inference Engine)

Ở đacircy tri thức được đặt để sử dụng tạo ra caacutec giải phaacutep để giải quyết vấn đề

Mocirc tơ nagravey coacute khả năng thực hiện diễn dịch hoặc suy diễn dựa trecircn caacutec luật hay caacutec caacutec sự kiện

Đồng thời cũng coacute khả năng sử dụng caacutec suy diễn mờ hay khocircng chiacutenh xaacutec dựa trecircn xaacutec suất hay aacutenh xạ mẫu

Vograveng điều khiển suy diễn

1 Aacutenh xạ caacutec luật với caacutec sự kiện đatilde được cho

2 Chọn luật để thực hiện

3 Thực hiện luật bằng caacutech thecircm caacutec sự kiện được suy diễn ra vagraveo bộ nhớ lagravem việc

Chuỗi suy diễn (Chaining)

Suy diễn tiến (forward chaining) maacutey suy diễn bắt đầu từ dữ liệu ban đầu vagrave thực hiện việc suy luận để đưa ra caacutec kết luận cuối cugraveng

Suy diễn lugravei (backward chaining) maacutey suy diễn bắt đầu từ dữ liệu điacutech vagrave tigravem ra tri thức hỗ trợ cho dữ liệu điacutech đoacute

Viacute dụ suy diễn lugravei

R1 Nếu coacute A vagrave B thigrave suy ra coacute D

R2 Nếu coacute B thigrave suy ra coacute C

R3 Nếu coacute C vagrave D thigrave suy ra coacute E

Ta coacute E ta xem trong 3 luật R1 R2 R3 luật nagraveo coacute E ta thấy R3 chứa E đồng thời chứa C vagrave D Xeacutet tiếp trong 2 luật R1 R2 luật nagraveo chứa C vagrave D R2 chứa C R3 chứa D Từ đoacute ta coacute được caacutec tri thức hỗ trợ suy diễn vagrave kết luận lagrave nếu coacute A vagrave B thigrave sẽ coacute E Hay nếu A vagrave B đuacuteng thigrave sẽ coacute E

Viacute dụ suy diễn tiến

Giả sử coacute tập chứa 3 luật sau

R1 Nếu coacute A vagrave B thigrave suy ra coacute D

R2 Nếu coacute B thigrave suy ra coacute C

R3 Nếu coacute C vagrave D thigrave suy ra coacute E

Nếu ta coacute A vagrave B thigrave chuacuteng ta suy ra được D từ R1 vagrave suy ra C từ R2 Với D vagrave C đatilde được suy ra ở trecircn giờ chuacuteng ta suy ra được E từ R3

Viacute dụ thực tế

Giả sử muốn biết magraveu của một con vật nuocirci tecircn lagrave Fred biết rằng noacute kecircu ộp ộp vagrave ăn ruồi

Coacute tập 4 luật ban đầu như sau

R1 Nếu X kecircu ộp ộp vagrave ăn ruồi thigrave X lagrave con ếch

R2 Nếu X kecircu chiecircm chiếp vagrave biết hoacutet thigrave X lagrave con chim

R3 Nếu X lagrave con ếch thigrave X coacute magraveu xanh

R4 Nếu X lagrave con chim thigrave X coacute magraveu vagraveng

74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia

Expert system shells lagrave một tập caacutec goacutei phần mềm vagrave caacutec cocircng cụ dugraveng để phaacutet triển caacutec hệ chuyecircn gia

Những Expert system shells đầu tiecircn thường rất rườm ragrave Mặc dugrave vậy noacute vẫn giuacutep cho người sử dụng sẽ khocircng phải bắt đầu lại từ đầu khi xacircy dựng một hệ chuyecircn gia mới

Những shell hiện đại bao gồm hai mocirc-đun chiacutenh lagrave cocircng cụ xacircy dựng một tập quy tắc vagrave mocirc tơ suy diễn

Xacircy dựng hệ chuyecircn gia

Bước 1 xacircy dựng mocirc higravenh bagravei toaacuten xaacutec định vấn đề nhiệm vụ magrave hệ thống sẽ thực hiện Caacutec dạng bagravei toaacuten cần hệ chuyecircn gia

Bagravei toaacuten diễn giải (InterPretation)

Bagravei toaacuten dự baacuteo (Prediction)

Bagravei toaacuten chuẩn đoaacuten (Diagnose)

Bagravei toaacuten gỡ rối (Debugging)

Bagravei toaacuten thiết kế

Tương tự như một dự aacuten phần mềm để xacircy dựng một hệ chuyecircn gia cần phải coacute caacutec yếu tố về nhacircn lực tagravei nguyecircn vagrave thời gian Những yếu tố nagravey ảnh hưởng đến giaacute thah của một hệ chuyecircn giaTrong phần nagravey cacircu hỏi thường được đặt ra lagrave tại sao cần phải xacircy dựng một hệ chuyecircn giaTrước khi bắt đầu phải xaacute định rotilde bagravei toaacuten đạt ra lagrave jiAi lagrave chuyecircn giaAi lagrave người sử dụng

1 Diễn giải (InterPretation) Nghiecircn cứu 1 vấn đề -gt Dựa trecircn những biểu hiện thuộc tiacutenh đặc trưng becircn ngoagravei -gt Tư vấn

(hoặc đưa ra kết luận hay mocirc tả dễ hiểu từ tập dữ liệu thocirc)

2 Bagravei toaacuten dự baacuteo (Prediction) Coacute thể dự đoaacuten được hagravenh vi kết quả dựa trecircn caacutec hiện tượng -gt dự baacuteo

VD Dự baacuteo thời tiết động đấthellip

3 Bagravei toaacuten chẩn đoaacuten (Diagnoss) Xaacutec định caacutec lỗi caacutec bộ phận hỏng hoacutec của hệ thống dựa trecircn caacutec dữ liệu quan saacutet được

4 Bagravei toaacuten gỡ rối (Debugging) Mocirc tả caacutec phương phaacutep khắc phục hệ thống khi gặp sự cố

5 Bagravei toaacuten thiết kế Lựa chọn cấu higravenh caacutec đối tượng nhằm thoả matilden một số ragraveng buộc nagraveo đoacute

6 Giảng dạy Phần mềm dạy học coacute thể chuẩn đoaacuten vagrave sủa lỗi của học sinh trong quaacute trigravenh học tập

Để xaacutec định đuacuteng bagravei toaacuten magrave chuacuteng ta cần giải quyết thigrave phải trả lời đc một số cacircu hỏi

- cần hệ chuyecircn gia

Bước 2 thu thập tri thức lựa chọn cocircng cụ vagrave aacutep dụng

Trong bước thu thập tri thức vấn đề quan trọng lagrave lựa chọn chuyecircn gia những người magrave sẽ đoacuteng goacutep tri thức cho hệ thống Thocircng thường trong suốt quaacute trigravenh phaacutet triển thigrave chuyecircn gia được xem như một thagravenh viecircn của đội phaacutet triển

Hiện nay coacute rất nhiều cocircng cụ để xacircy dựng một hệ chuyecircn gia Phổ biến nhất lagrave JESS CLIPS vagrave OPS5

Bước 3 Thiết kế cơ sở tri thức thiết kế hệ thốngTri thức được biểu diễn trường minh trong cơ sở tri thức

Caacutec chuyecircn gia vagrave kỹ sư tri thức sẽ đối thoại với nhau bằng caacutec kỹ thuật đối thoại Suy diễn (SD) bảng Mocirc higravenh hoacutea SD quy nạp phacircn loại

Vấn đề bagraveo trigrave vagrave phaacutet triển

Caacutec hệ chuyecircn gia đogravei hỏi phải bảo trigrave vagrave phaacutet triển nhiều hơn so với caacutec hệ thống khaacutec Phải thường xuyecircn bổ sung tri thức mới vagrave thay đổi caacutec tri thức cũ để đổi mới hệ chuyecircn gia

Thu thập vagrave khắc phục lỗi do người sử dụng phaacutet hiện để kịp thời khắc phục những sai soacutet của hệ chuyecircn gia

75 Lợi iacutech vagrave hạn chế của caacutec hệ chuyecircn gia

Một số lợi iacutech chiacutenh

Thời gian trả lời hợp lyacute bằng hoặc nhanh hơn so với chuyecircn gia (người) để đi đến cugraveng một quyết định Hệ chuyecircn gia lagrave một hệ thống thời gian thực (real time system)

Khả năng trả lời với mức độ tinh thocircng bằng hoặc cao hơn so với chuyecircn gia (người) trong cugraveng lĩnh vực

Hệ chuyecircn gia giuacutep cho hiệu quả lagravem việc tăng bằng việc sử dụng tập caacutec luật một caacutech nhanh choacuteng magrave ko bị nhầm lẫn chuyecircn gia lagrave người coacute thể quecircn đi một số tri thức cơ sở lyacute luậ nhưng HCG thigrave ko

Quyết định của một người chuyecircn gia coacute thể bị thay đổi vagrave ko coacute tiacutenh thống nhất như quyết định của một hệ chuyecircn gia tạo ra

Hệ chuyecircn gia giuacutep cho người sử dụng coacute thể trau dồi sự hiểu biết trecircn lĩnh vuej cụ thể magrave noacute giải quyết hỗ trợ người ra quyết định coacute trigravenh độ như 1 chuyecircn gia trong quaacute trigravenh gia quyết định

Kiến thức của rất nhiều chuyecircn gia về một lĩnh vực nagraveo đoacute được đưa vagraveo hệ chuyecircn gia lagravem cho CSTT cuat HCG phong phuacute vagrave rộng lớn hơn rất nhiều

HCG giải thiacutech caacutec bước suy luận một caacutech dễ hiểu nhất quaacuten luacutec nagraveo cũng coacute thể sử dụng ko như chuyecircn gia con người

Hạn chế của caacutec hệ chuyecircn gia

Nhược điểm lớn nhất của hệ chuyecircn gia lagrave những yacute kiến chuyecircn mocircn thường rất khoacute matilde hoacutea vagrave giải neacuten

Hệ chuyecircn gia khocircng coacute khả năng tự học tự cập nhật kiến thức mới như caacutec chuyecircn gia magrave cần phải được matilde hoacutea lại khi noacute được cập nhật

Hệ chuyecircn gia khocircng thể nhận ra được vấn đề khocircng nằm trong miền kiến thức của hệ thống

Chương 8 Tri thức vagrave tiếp nhận

1 Bao gồm caacutec vấn đề

Dữ liệu thực tế đo lường hoặc quan saacutet coacute hoặc khocircng coacute bối cảnh

Thocircng tin dữ liệu được tổng hợp một caacutech hữu iacutech để giải quyết những khoacute khăn trong việc đưa ra quyết định

Tri thức bao gồm caacutec ứng dụng quy tắc thocircng tin hướng dẫn của người ra quyết định

2 Những caacutei nhigraven về tri thức

Đại diện lagravem thế nagraveo để diễn tả tri thức viacute dụ như một quyển saacutech khocircng phải lagrave tri thức nhưng noacute lại lagrave một đại diện của tri thức

Sản xuất tri thức lagrave một tập hơp của hagraveng tồn kho coacute thể được sản xuất cũng như mua lại

Tri thức lagrave 1 trong 6 trạng thaacutei của hệ thống

1Dữ liệu 2Thocircng tin 3Cấu truacutec thocircng tin 4Sự thấu hiểu 5Yacute kiến 6 Quyết định

3 Caacutec loại tri thức Phổ biến mocirc tả dữ liệu thocircng tin thủ tục mọi thứ lagravem như thế nagraveo lập luận chiacutenh saacutech hoặc caacutec quy tắc

4 Thu thập Tri thức hệ chuyecircn gia Hầu hết caacutec phương phaacutep đều bắt đầu với mocirc higravenh của caacutec taacutec vụ trong đoacute

hệ chuyecircn gia được xacircy dựng Trong đoacute mocirc tả về caacutec lĩnh vực được tạo ra Caacutec kỹ sư sử dụng caacutec mocirc higravenh giả thuyết vagrave nhận thức về quaacute trigravenh phacircn

tiacutech để gợi ra caacutech giải quyết vấn đề về tri thức từ caacutec chuyecircn gia

5 Caacutec chiều của thu thập tri thức KE- driven caacutec kỹ sư trao đổi trực tiếp với caacutec chuyecircn gia Expert-driven Caacutec chuyecircn gia trực tiếp đưa chuyecircn mocircn của họ vagraveo hệ

thống maacutey tiacutenh Machine-driven Sử dụng caacutec cocircng cụ suy luận để triacutech xuất tri thức từ một

tập caacutec viacute dụ

6 Kỹ thuật thu thập tri thức Trao đổi gồm 2 loại cơ bản lagrave coacute cấu truacutec(coacute kịch bản) vagrave khocircng coacute cấu

truacutec( đối thoại trực tiếp) Giao thức phacircn tiacutech bằng lời Khi caacutec chuyecircn gia thực hiện một cocircng việc

của họ thigrave một bản ghi về cocircng việc đoacute được thực hiện Caacutec kỹ sư sẽ xacircy dựng mocirc higravenh cho những gigrave được ghi lại trong bản ghi

Phương phaacutep sagraveng lọc caacutec chuyecircn gia so saacutenh caacutec nhoacutem liecircn tiếp trong ba đối tượng vagrave cho biết tại sao nhoacutem thứ hai lại khaacutec nhoacutem thứ ba

7 Thu thập tri thức từ nhiều nguồn Thu thập tri thức từ nhiều nguồn lagrave cần thiết để coacute được đầy đủ caacutec tri thức

cho một vấn đề quan điểm yacute kiến traacutei ngược nhau thường phaacutet sinh Phương phaacutep đồng thuận sẽ giuacutep giải quyết được vấn đề macircu thuẫn Kỹ thuật phacircn tiacutech Meta lagrave kỹ thuật được aacutep dụng trong caacutec trường hợp

khaacutec Caacutech tiếp cận bằng định lượng đogravei hỏi caacutec kỹ sư cần cacircn nhắc yếu tố đầu vagraveo của caacutec chuyecircn gia khaacutec nhau

8 Xaacutec nhận hợp lệ vagrave kiểm tra tri thức Một khi thu thập tri thức noacute phải được đaacutenh giaacute về khả năng sử dụng vagrave độ

chiacutenh xaacutec Hai vấn đề cụ thể lagrave hiệu lực của những kiến thức vagrave kiểm tra việc xacircy dựng cơ sở của tri thức

Cần xaacutec nhận xem liệu hệ thống coacute thể hoạt động ở mức độ tối thiểu khocircng

Xaacutec minh liecircn quan đến việc so saacutenh từng chi tiết kỹ thuật của hệ thống những gigrave đatilde được thực hiện cuối cugraveng

9 Một số caacutec biện phaacutep xaacutec nhận Độ chiacutenh xaacutec Khả năng thiacutech nghi Mức độ đầy đủ Bề rộng Độ sacircu Hiệu lực Tổng quan Chiacutenh xaacutec Hiện thực Độ tin cậy Tiacutenh hữu dụng Mức độ

Chương 9 Học maacutey

1 Logic mờ vagrave ngocircn ngữ mờ(Fuzzy Logic and Linguistic Ambiguity)

Ngocircn ngữ tự nhiecircn gồm những khaacutei niệm mơ hồ vagrave khocircng chiacutenh xaacutectruyền tải ngữ nghĩa thocircng qua tiacutenh xấp xỉkhocircng rotilde ragraveng

Những xấp xỉ nagravey giuacutep con người coacute thể truyền tải hết được yacute nghĩa nhưng maacutey thigrave khocircng hiểu

Lagravem sao biểu diễn caacutec tri thức sử dụng caacutec khaacutei niệm khocircng rotilde ragraveng(mờ) hoặc khocircng chiacutenh xaacutec

2 Khaacutei niệm cơ bản của logic mờ tập mờ lagrave những tập hợp khocircng coacute một giới hạn rotilde Mỗi phần tử của noacute chỉ

chứa một mức độ hagravem liecircn thuộc của từng phần tử Vigrave vậy tập mờ khocircng giống như tập cổ điển Tập mờ coacute thể kết hợp với nhau qua những luật mờ magrave đặc trưng cho những hagravenh động trạng thaacutei vagrave thuộc tiacutenh của logic mờ được tận dụng khi thực hiện một bộ điều khiển mờ

Logic mờ dựa trecircn yacute tưởng mỗi phần tử thuộc vagraveo một tập hợp ở một mức độ nagraveo đấy

Locircgic mờ cho pheacutep độ liecircn thuộc (microA )coacute giaacute trị trong khoảng (01) Locircgic mờ coacute thể được coi lagrave mặt ứng dụng của lyacute thuyết tập mờ để xử lyacute caacutec

giaacute trị trong thế giới thực cho caacutec bagravei toaacuten phức tạp

3 So saacutenh tiacutenh đuacuteng đắn logic mờ vagrave xaacutec suất Xaacutec suất thigrave đề cập đến khả năng xảy ra một biến cố hay một điều gigrave đoacute Logic mờ đề cập đến cấp độ magrave đặc tiacutenh ở hiện tại

o viacute dụ1 người coacute chiều cao 6 feet thigrave coacute cấp độ lagrave 05 về chiều cao

4 Ưu điểm của logic mờ Caacutech tiếp cận rất tự nhiecircnkhocircng phức tạp Coacute thể mocirc higravenh hoacutea caacutec hagravem phi tuyến tugravey yacute phức tạp

Coacute thể tận dụng được kinh nghiệm từ những chuyecircn gia hagraveng đầu trong mọi lĩnh vực

Logic mờ được xacircy dựng dựa trecircn ngocircn ngữ tự nhiecircnNền tảng của logic mờ lagrave dựa trecircn cơ sở giao tiếp của con người

5 Nhược điểm của logic mờ Trong 1 hệ thống phức tạpsử dụng logic mờ coacute thể trở thagravenh trở ngại cho

việc xaacutec thực độ tin cậy của hệ thống Cơ chế lập luận mờ khocircng thể học hỏi từ những lỗi sai

6 Mạng noron nhacircn tạo(ANN) Mạng noron nhacircn tạo lagrave một mocirc phỏng xử lyacute thocircng tinđược nghiecircn cứu ra

từ hệ thống thần kinh của sinh vậtgiống như bộ natildeo để xử lyacute thocircng tin ANNs lagrave chương trigravenh dựa trecircn maacutey tiacutenh đơn giản coacute chức năng lagrave một mocirc

higravenh bagravei toaacuten khocircng gian dựa trecircn thử nghiệm vagrave baacuteo lỗi

7 Học từ kinh nghiệm Tiến trigravenh Một mẫu dữ liệu được biểu diễn như một mạng lưới noronANN ldquodự

đoaacutenrdquo 1 đầu radự đoaacuten được so saacutenh với giaacute trị thực tế hoặc giaacute trị chiacutenh xaacutecNếu đoaacuten được chiacutenh xaacutec thigrave khocircng coacute hagravenh động nagraveo được thực hiện

Nếu dự đoaacuten sai ANN kiểm tra lại vagrave xaacutec định lại thocircng số để điều chỉnh Một mẫu dữ liệu khaacutec được biểu diễn vagrave quaacute trigravenh nagravey được lặp lại

8 Nguyecircn tắc cơ bản của cocircng nghệ nơron Caacutec yếu tố xử lyacute cơ bản trong hệ thống thần kinh của con người lagrave tế bagraveo

thần kinhMạng lưới của tế bagraveo nagravey lagrave liecircn kết với nhau nhận được thocircng tin từ caacutec cảm biến trong mắt taihellip

Thocircng tin nhận được bởi tế bagraveo thần kinh hoặc lagrave sẽ kiacutech thiacutech noacute(sẽ được chuyển qua 1 thocircng điệp dọc theo mạng lưới) hoặc lagrave sẽ ngăn cản noacute(ngăn cản dograveng thocircng tin)

Độ nhạy coacute thể thay đổi qua thời gian hoặc sau khi coacute được kinh nghiệm

9 Cấu truacutec mạng Một ANN gồm 3 lớp cơ bản

Lớp đầu vagraveo nhận dữ liệu Lớp becircn trong hoặc lagrave lớp ẩn xử lyacute dữ liệu Lớp đầu ra chuyển tiếp kết quả cuối cugraveng của mạng

10Mạng nơ ron Thường coacute nhiều đầu vagraveo mỗi đầu vagraveo với mức ảnh hưởng vagrave tầm quan

trọng riecircng của noacute Một đầu vagraveo quan trọng coacute thể được sử dụng để khuếch đại đầu ra caacutec hagravem trạng thaacutei tổng hợp caacutec trọng số của caacutec yếu tố

đầuvagraveo khaacutec nhauvagraveo một giaacute trị duy nhất Caacutec hagravem chuyển giao xử lyacute caacutec giaacute trị trạng thaacutei vagrave tạo đầu ra

11Huấn luyện mạng nơ ron Trong mocirc higravenh coacute giaacutem saacutetANN được đến so saacutenh dự đoaacuten của chiacutenh

noacute với thocircng tin phản hồi coacute chứa caacutec kết quả mong muốn ANN sẽ phải tigravem caacutech thay đổi caacutec tham số becircn trong củamigravenh (caacutec trọng số vagrave caacutec ngưỡng) để tạo necircn một aacutenh xạ coacute khả năng aacutenh xạcaacutec đầu vagraveo thagravenh caacutec đầu ra mong muốn Sự thay đổi nagravey được tiến hagravenh nhờ việc so saacutenh giữa đầu ra thực sự vagrave đầu ra mong muốn

Trong mocirc higravenh khocircng coacute giaacutem saacutetANN nhận được dữ liệu vagraveo nhưng khocircng phải coacute bất kỳ thocircng tin phản hồi về kết quả mong muốn

Phần lớn caacutec ứng dụng nằm trong vugraveng của caacutec bagravei toaacuten ước lượng như mocirc higravenh hoacuteathống kecirc neacuten lọc phacircn cụm

12Lợi iacutech Liecircn kết với mạng noron Traacutenh caacutech lập trigravenh tường minh Giảm nhu cầu của chuyecircn gia ANNs thigrave thiacutech nghi với caacutec yếu tố đầu vagraveo thay đổi Khocircng cần thiết cho cơ sở tri thức tinh chế ANNs coacute tiacutenh động vagrave cải thiện với việc sử dụng Coacute khả năng xử lyacute dữ liệu khocircng chiacutenh xaacutec hoặc khocircng đầy đủ Cho pheacutep tổng quaacutet hoacutea từ thocircng tin cụ thể Cho pheacutep thu thập cảm giaacutec thocircng thường vagraveo miền giải quyết vấn đề

13Hạn chế của việc liecircn kết với mạng noron ANNs khocircng thể giải thiacutech được suy luận Bản chất hộp đen thường khiến cho vấn đề traacutech nhiệm vagrave độ tin cậy phaacutet

sinh lagrave khoacute khăn Lặp đi lặp lại quaacute trigravenh huấn luyện rất tốn thời gian Nguồn lực caacutec nhagrave phacircn tiacutech vagrave thiết kế coacute tay nghề cao vẫn lagrave đaacuteng lo

ngại Cocircng nghệ ANN thuacutec đẩy hạn chế của phần cứng hiện tại ANN yecircu cầu phải coacute sự tin tưởng ở đầu ra

14Giới thiệu về thuật toaacuten di truyền Cũng như mạng lưới thần kinh caacutec thuật toaacuten di truyền được dựa trecircn lyacute

thuyết sinh học Thuật toaacuten di truyền tigravem thấy nguồn gốc của chuacuteng trong caacutec lyacute thuyết

tiến hoacutea của chọn lọc tự nhiecircn vagrave thiacutech ứng với biến đổi khiacute hậu Kết quả thuật toaacuten di truyền lagrave từ giao phối 2 caacute thể trong quần thế để tạo

ra con caacutei đocirci khi tốt hơn so với bậc cha mẹ của chuacuteng 15Caacutec thagravenh phần cơ bản của thuật toaacuten di truyền

Toaacuten tử chọn lọc Caacutec caacute thể tốt được chọn lọc để đưa vagraveo thế hệ sau Sự chọn lọc nagravey căn cứ vagraveo độ thiacutech nghi với mocirci trường của mỗi caacute thể

Toaacuten tử lai gheacutep (crossover) Hai caacute thể cha vagrave mẹ trao đổi caacutec gen với nhau để tạo ra caacute thể con

Toaacuten tử đột biến (mutation) Một caacute thể thay đổi một số gen để biến đổi thagravenh một caacute thể mớiTất cả caacutec toaacuten tử trecircn khi thực hiện đều mang tiacutenh ngẫu nhiecircn

16Quaacute trigravenh cơ bản của một thuật toaacuten di truyền Khởi tạo

Đaacutenh giaacute quần thể

Lựa chọn NST thiacutech hợp nhất vagrave loại bỏ NST yếu nhất

Quy trigravenh giao nhau vagrave cải thiện quần thể

đột biến tiến trigravenh để khaacutem phaacute ra NST mới

17Ưu nhược điểm của việc kết hợp với thuật toaacuten di truyền Kiacutech thước quần thể lagrave 1 yếu tố quan trọng trong tốc độ của việc tigravem

kiếmnhưng noacute tương đối dễ dagraveng để dự đoaacuten tốc độ nagravey Giao nhau hoặc đột biến lagrave khocircng necircn đc sử dụng quaacute thường xuyecircn Luocircn coacute được iacutet nhất 1 giải phaacutep hợp lyacute Necircn coacute thể aacutep dụng chuacuteng cho caacutec vấn đề magrave chuacuteng ta khocircng coacute hướng

về caacutech giải quyết Sức mạnh của thuật toaacuten xuất phaacutet từ khaacutei niệm đơn giảnkhocircng phải từ

một thủ tục thuật toaacuten phức tạp 18Tương lai của học maacutey

Mạng lưới thần kinh nhacircn tạo vượt quaacute năng lực của con người trong caacutec trường hợp bị cocirc lập

Về mặt lyacute thuyếtmột maacutey tiacutenh coacute thể xử lyacute dũ liệu nhanh hơn hagraveng triệu lần so với 1 con người

May mắn thay cho chuacuteng tacon người tốt hơn nhiều khi magrave coacute được dữ liệumaacutey tiacutenh khocircng coacute 1 số thứ như lagrave 5 giaacutec quan

CHƯƠNG 10 KHO DỮ LIỆU

1 Kho dữ liệu Kho dữ liệu lagrave tuyển tập caacutec cơ sở dữ liệu tiacutech hợp hướng chủ đề được

thiết kế để trợ giuacutep cho một hệ hỗ trợ quyết định

Theo John Ladley Cocircng nghệ kho dữ liệu lagrave tập caacutec phương phaacutep kỹ thuật vagrave caacutec cocircng cụ coacute thể kết hợp hỗ trợ nhau để cung cấp thocircng tin cho người sử dụng trecircn cơ sở tiacutech hợp từ nhiều nguồn dữ liệu nhiều mocirci trường khaacutec nhau

Kho dữ liệu thường rất lớn tới hagraveng trăm GB hay thậm chiacute hagraveng Terabyte

2 Kho dữ liệu vận hagravenh (ODS) Một kho dữ liệu vận hagravenh Aacutep dụng kỹ thuật kho dữ liệu vagraveo caacutec hệ xử

lyacute giao taacutec lưu trữ dữ liệu cho một ứng dụng đặc thugrave Noacute đưa vagraveo kho dữ liệu một dograveng caacutec dữ liệu thocirc được thiết kế

3 So saacutenh

Kho dữ liệu vận hagravenh Kho dữ liệu

Dữ liệu theo chủ đề Dữ liệu theo chủ đề

Dữ liệu tiacutech hợp Dữ liệu tiacutech hợp

Dữ liệu thay đổi Dữ liệu khocircng thay đổi

Dữ liệu được cập nhật khi thay đổi

Dữ liệu giữ nguyecircn

Chỉ coacute dữ liệu hiện tạiDữliệu hiện tại vagrave dữ liệu lịch sử

Chu kỳ lagravem tươi dữ liệu ngắn Chu kỳ lagravem tươi dữ liệu dagravei

Chỉ coacute dữ liệu chi tiết Dữ liệu chi tiết vagrave dữ liệu tổng kết

Dugraveng cho caacutec quyết định ngắn hạn

Dugraveng cho hoạch định dagravei hạn

4 Kho dữ liệu cục bộ (Data Mart - DM)

Kho dữ liệu cục bộ lagrave CSDL coacute những đặc điểm giống với kho dữ liệu nhưng với quy mocirc nhỏ hơn vagrave lưu trữ dữ liệu về một lĩnh vực một chuyecircn ngagravenh

Data mart phụ thuộc Chứa những dữ liệu được lấy từ DW vagrave những dữ liệu nagravey sẽ được triacutech lọc vagrave tinh chế tiacutech hợp lại ở mức cao hơn để phục vụ một chủ đề nhất định của Datamart

Data mart độc lập Khocircng giống như Datamart phụ thuộc Data mart độc lập được xacircy dựng trước DW vagrave dữ liệu được trực tiếp lấy từ caacutec nguồn khaacutec nhau

5 Siecircu dữ liệu Metadata lagrave dữ liệu để mocirc tả dữ liệu Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột

một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi Metadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu

6 Mocirci trường kho dữ liệu Hệ thống của tổ chức vagrave kho cung cấp dữ liệu để xacircy dựng kho dữ liệu Trong quaacute trigravenh chuyển dữ liệu từ caacutec nguồn khaacutec nhau dữ liệu coacute thể

được lagravem sạch hoặc chuyển đổi vagrave vigrave thế DW được xem như lagrave một chuẩn cho việc lưu trữ

Đồng thời siecircu dữ liệu được ghi lại Cuối cugraveng DW hoặc siecircu thị coacute thể được sử dụng để tạo ra một kho dữ

liệu ldquocaacute nhacircnrdquo 7 Caacutec đặc điểm của kho dữ liệu

Đặc điểm Mocirc tả

Hướng chủ đề - DL tổ chức theo caacutech thức người dugraveng tham chiếu

Tiacutech hợp - Dữ liệu ldquosạchrdquo loại bỏ tiacutenh thiếu nhất quaacuten

Khocircng thay đổi - DL ldquochỉ đọcrdquo người dugraveng khocircng thay đổi được

Chuỗi thời gian - DL lagrave chuỗi thời gian khocircng phải lagrave trạng thaacutei hiện tại

Được tổng kết - DL vận hagravenhthao taacutec khi cần thiết

được kết hợp lại thagravenh dạng coacute thể dugraveng được cho quyết định

Kiacutech cỡ lớn hơn - Lưu giữ theo chuỗi thời gian tức lagrave giữ lại nhiều DL

Khocircng được chuẩn hoacutea - Coacute thể dư thừa DLSiecircu dữ liệu - Dữ liệu của dữ liệu được lưu trữNguồn dữ liệu - DL vận hagravenh (caacutec hệ sẵn coacute) cugraveng

với caacutec nguồn ngoagravei 8 Kho dữ liệu hướng chủ đề

Hướng chủ để coacute nghĩa lagrave kho dữ liệu được tổ chức xung quanh caacutec chủ đề chiacutenh như khaacutech hagraveng sản phẩm sản xuất Tập trung vagraveo việc mocirc higravenh hoacutea vagrave phacircn tiacutech dữ liệu cho caacutec nhagrave ra quyết định magrave khocircng tập trung vagraveo caacutec xử lyacute thocircng thường Cung cấp cho người dugraveng một khung nhigraven toagraven vẹn đơn giản vagrave đầy đủ về caacutec sự kiện quanh caacutec chủ đề

9 Dữ liệu trong DW được tiacutech hợp Dữ liệu trong kho dữ liệu được xacircy dựng bằng caacutech tổng hợp dữ liệu từ

nhiều nguồn khaacutec nhau vagrave caacutec nguồn coacute tổ chức khaacutec nhau Cơ sở dữ liệu caacutec file excel caacutec flat file hoặc caacutec raw file Khi đưa vagraveo kho dữ liệu caacutec dữ liệu được lagravem sạch vagrave tiacutech hợp dữ liệu nhằm đảm bảo tiacutenh nhất quaacuten của dữ liệu

10Kiến truacutec kho dữ liệu Tầng cơ sở dữ liệu hoạt động Tầng truy xuất thocircng tin Tầng truy xuất dữ liệu Tầng siecircu dữ liệu Tầng quản lyacute tiến trigravenh Tầng thocircng điệp của ứng dụng Tầng vật liacute của kho dữ liệu Tầng trigravenh diễn dữ liệu

11Higravenh trạng kho dữ liệu Kho dữ liệu ảo - người dugraveng cuối coacute thể truy cập trực tiếp đến kho dữ liệu

sử dụng caacutec cocircng cụ cho pheacutep ở tầng truy xuất dữ liệu Kho dữ liệu trung tacircm-1 cơ sở dữ liệu vật lyacute chứa tất cả dữ liệu cho một

vugraveng chuyecircn dụng nagraveo đoacute

Kho dữ liệu phacircn taacuten- Thagravenh phần được phacircn taacuten qua nhiều hệ cơ sở dữ liệu vật lyacute

12METADATA- Siecircu dữ liệu Định nghĩa Siecircu dữ liệu lagrave dữ liệu về dữ liệu Lagrave 1 lưu trữ dugraveng để

Miecircu tả kho dữ liệu tổng thể Nhận dạng kiểu kho dữ liệu Quản liacute quaacute trigravenh tiacutech hợp dữ liệu Quản liacute quaacute trigravenh cập nhật kho dữ liệu Quản liacute bảo mật

Lagrave chigravea khoacutea quyết định sự thagravenh cocircng của kho dữ liệu luocircn được thay đổi vagrave cập nhật theo sự phaacutet triển của kho dữ liệu

Dugraveng để quản liacute điều khiển kho dữ liệu Sự ra đời của kho dữ liệu như 1 cấu truacutec hỗ trợ ra quyết định siecircu dữ liệu

được xem như nguồn tagravei nguyecircn dữ liệu Siecircu dữ liệu lagrave trừu tượng Chuacuteng lagrave dữ liệu bậc cao cung cấp mocirc tả ngắn

gọn caacutec dữ liệu bậc thấp hơn 13Hoạt động của Siecircu dữ liệu

Siecircu dữ liệu rất cần thiết trong việc chuyển hoacutea thocircng tin trở thagravenh tri thức Lagrave chigravea khoacutea giuacutep chuacuteng ta xử lyacute được dữ liệu thocirc Viacute dụ một dograveng dữ liệu baacuten hagraveng 1023 K596 11121 agraveNoacute sẽ khocircng coacute nghĩa gigrave cho đến khi chuacuteng ta đưa vagraveo siecircu dữ liệu (thư

mục chứa dữ liệu) agrave cửa hagraveng 1023 sản phẩm K596 vagrave số tiền baacuten được lagrave 11121 đocirc la

14Sự cần thiết phải nhất quaacuten trong kho dữ liệu Kho dữ liệu được xacircy dựng cho lợi iacutech của những nhagrave phacircn tiacutech kinh

doanh caacutec nhagrave quản trị cho tất cả caacutec khu vực chức năng Trong cơ sở dữ liệu riecircng caacutec khu vực khaacutec nhau coacute thể định nghĩa vagrave lưu

trữ dữ liệu thocircng qua phiecircn bản của chiacutenh noacute Khi dữ liệu được lấy từ những vugraveng khaacutec nhau đoacute vagrave được đặt vagraveo kho dữ

liệu Việc chuyển đổi vagrave lagravem sạch caacutec tiến trigravenh sẽ đảm bảo noacute lagrave duy nhất được tiacutech hợp tại một mức của tổ chức

15Ragrave soaacutet lại dữ liệu ndash Thực thi siecircu dữ liệu

Bất kể cấu truacutec tự nhiecircn của 1 cacircu truy vấn thế nagraveo thigrave caacutec thagravenh phần của siecircu dữ liệu rất quan trọng đối với người ra quyết định

Bảng thuộc tiacutenh khoacutea được lưu trữ bởi kho dữ liệu Tập hợp dữ liệu được lấy từ đacircu Những chuyển đổi nagraveo được thực thi với việc lagravem sạch

16Siecircu dữ liệu lagrave gigrave Metadata - lagrave thocircng tin mocirc tả nội dung của cơ sở dữ liệu (CSDL) Metadata baacuteo cho người dugraveng biết thời gian cập nhật sau cugraveng của dữ liệu

định dạng vagrave mục điacutech sử dụng của noacute Những thocircng tin nagravey coacute thể hướng dẫn người dugraveng duyệt qua CSDL vagrave

giuacutep họ hiểu được yacute nghĩa vagrave ngữ cảnh của dữ liệu Trong CSDL metadata lagrave caacutec dạng biểu diễn khaacutec nhau của caacutec đối tượng

trong CSDL Trong CSDL quan hệ metadata lagrave caacutec định nghĩa của bảng cột CSDL

view vagrave nhiều đối tượng khaacutec Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột

một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi -gtMetadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu

Bảng chuyển đổi Ghi lại những chuyển đổi đatilde được thực hiện

Lịch sử thực thi Ghi lại những dữ liệu đatilde được

phacircn tiacutech

Higravenh thaacutei kết nốiGhi lại những dữ liệu được kết nối vagrave tần suất

17Aacutenh xạ thocircng thường của siecircu dữ liệu Bản ghi aacutenh xạ chuyển đổi bao gồm

Định danh của nguồn gốc Chuyển đổi thuộc tiacutenh Chuyển đổi thuộc tiacutenh vật lyacute Matilde hoacutea tham chiếu bảng chuyển đổi Đổi tecircn Đổi khoacutea Gaacuten giaacute trị cho thuộc tiacutenh mặc định Chọn logic cho caacutec nguồn nhiều giaacute trị Đổi thuật toaacuten

18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để

phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai

lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave

tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec

Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm

Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo

19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua

caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau

SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được

Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra

một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức

Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ

Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ

Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech

CHƯƠNG 11 KHAI PHAacute DỮ LIỆU

1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn

ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993

Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng

2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd

1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều

2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP

3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn

4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng

5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server

6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo

7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động

8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời

9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều

10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện

11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech

12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP

3 Xử lyacute phacircn tiacutech trực tuyến OLAP

MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave

dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu

ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave

thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu

HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave

ROLAP4 Khai phaacute dữ liệu

Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh

khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn

Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan

5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp

6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại

Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp

Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec

Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt

Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra

Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh

vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho

Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec

Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm

Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục

Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng

gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp

Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn

Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec

Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper

Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2

Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25

Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước

Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng

Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện

trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp

Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute

độ hỗ trợ ge ngưỡng minsup

độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan

Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn

Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết

Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu

MOLAP ROLAP HOLAP

Lưu trữ dữ liệu cơ sở

Khối Bảng quan hệ Bảng quan hệ

Lưu trữ thocircng tin tổng hợp

Khối Bảng quan hệ Khối

Hiệu suất thực hiện truy vấn

Nhanh nhất Chậm nhất Nhanh

Tiecircu thụ khocircng gian lưu trữ

Nhiều Thấp Trung bigravenh

Chi phiacute bảo trigrave Cao Thấp Trung bigravenh

Page 41: De cuong(1-11)

Giao diện người dugraveng trong ES

Thiết kế giao diện người dugraveng tập trung vagraveo caacutec yếu tố như dễ dagraveng sử dụngcoacute độ tin cậy cao giảm tải những khoacute khăn khi sử dụng

Thiết kế necircn coacute một số tương taacutec (đầu vagraveo kiểm soaacutet vagrave truy vấn)

Cấu tạo giao diện người dugraveng gồm coacute magraven higravenh cảm ứng bagraven phiacutem buacutet saacuteng lệnh thoại caacutec phiacutem chuyecircn dụng

Cơ sở tri thức (Knowledge Base)

Chứa đựng caacutec tri thức cụ thể miền thu được từ caacutec chuyecircn gia miền

Coacute thể chứa caacutec mocirc tả caacutec hagravenh vi giải quyết vấn đề caacutec ragraveng buộc caacutec heuristics

Thagravenh cocircng của một ES dựa trecircn tiacutenh đầy đủ vagrave tiacutenh chiacutenh xaacutec của cơ sở tri thức

Mocirc tơ suy diễn (Inference Engine)

Ở đacircy tri thức được đặt để sử dụng tạo ra caacutec giải phaacutep để giải quyết vấn đề

Mocirc tơ nagravey coacute khả năng thực hiện diễn dịch hoặc suy diễn dựa trecircn caacutec luật hay caacutec caacutec sự kiện

Đồng thời cũng coacute khả năng sử dụng caacutec suy diễn mờ hay khocircng chiacutenh xaacutec dựa trecircn xaacutec suất hay aacutenh xạ mẫu

Vograveng điều khiển suy diễn

1 Aacutenh xạ caacutec luật với caacutec sự kiện đatilde được cho

2 Chọn luật để thực hiện

3 Thực hiện luật bằng caacutech thecircm caacutec sự kiện được suy diễn ra vagraveo bộ nhớ lagravem việc

Chuỗi suy diễn (Chaining)

Suy diễn tiến (forward chaining) maacutey suy diễn bắt đầu từ dữ liệu ban đầu vagrave thực hiện việc suy luận để đưa ra caacutec kết luận cuối cugraveng

Suy diễn lugravei (backward chaining) maacutey suy diễn bắt đầu từ dữ liệu điacutech vagrave tigravem ra tri thức hỗ trợ cho dữ liệu điacutech đoacute

Viacute dụ suy diễn lugravei

R1 Nếu coacute A vagrave B thigrave suy ra coacute D

R2 Nếu coacute B thigrave suy ra coacute C

R3 Nếu coacute C vagrave D thigrave suy ra coacute E

Ta coacute E ta xem trong 3 luật R1 R2 R3 luật nagraveo coacute E ta thấy R3 chứa E đồng thời chứa C vagrave D Xeacutet tiếp trong 2 luật R1 R2 luật nagraveo chứa C vagrave D R2 chứa C R3 chứa D Từ đoacute ta coacute được caacutec tri thức hỗ trợ suy diễn vagrave kết luận lagrave nếu coacute A vagrave B thigrave sẽ coacute E Hay nếu A vagrave B đuacuteng thigrave sẽ coacute E

Viacute dụ suy diễn tiến

Giả sử coacute tập chứa 3 luật sau

R1 Nếu coacute A vagrave B thigrave suy ra coacute D

R2 Nếu coacute B thigrave suy ra coacute C

R3 Nếu coacute C vagrave D thigrave suy ra coacute E

Nếu ta coacute A vagrave B thigrave chuacuteng ta suy ra được D từ R1 vagrave suy ra C từ R2 Với D vagrave C đatilde được suy ra ở trecircn giờ chuacuteng ta suy ra được E từ R3

Viacute dụ thực tế

Giả sử muốn biết magraveu của một con vật nuocirci tecircn lagrave Fred biết rằng noacute kecircu ộp ộp vagrave ăn ruồi

Coacute tập 4 luật ban đầu như sau

R1 Nếu X kecircu ộp ộp vagrave ăn ruồi thigrave X lagrave con ếch

R2 Nếu X kecircu chiecircm chiếp vagrave biết hoacutet thigrave X lagrave con chim

R3 Nếu X lagrave con ếch thigrave X coacute magraveu xanh

R4 Nếu X lagrave con chim thigrave X coacute magraveu vagraveng

74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia

Expert system shells lagrave một tập caacutec goacutei phần mềm vagrave caacutec cocircng cụ dugraveng để phaacutet triển caacutec hệ chuyecircn gia

Những Expert system shells đầu tiecircn thường rất rườm ragrave Mặc dugrave vậy noacute vẫn giuacutep cho người sử dụng sẽ khocircng phải bắt đầu lại từ đầu khi xacircy dựng một hệ chuyecircn gia mới

Những shell hiện đại bao gồm hai mocirc-đun chiacutenh lagrave cocircng cụ xacircy dựng một tập quy tắc vagrave mocirc tơ suy diễn

Xacircy dựng hệ chuyecircn gia

Bước 1 xacircy dựng mocirc higravenh bagravei toaacuten xaacutec định vấn đề nhiệm vụ magrave hệ thống sẽ thực hiện Caacutec dạng bagravei toaacuten cần hệ chuyecircn gia

Bagravei toaacuten diễn giải (InterPretation)

Bagravei toaacuten dự baacuteo (Prediction)

Bagravei toaacuten chuẩn đoaacuten (Diagnose)

Bagravei toaacuten gỡ rối (Debugging)

Bagravei toaacuten thiết kế

Tương tự như một dự aacuten phần mềm để xacircy dựng một hệ chuyecircn gia cần phải coacute caacutec yếu tố về nhacircn lực tagravei nguyecircn vagrave thời gian Những yếu tố nagravey ảnh hưởng đến giaacute thah của một hệ chuyecircn giaTrong phần nagravey cacircu hỏi thường được đặt ra lagrave tại sao cần phải xacircy dựng một hệ chuyecircn giaTrước khi bắt đầu phải xaacute định rotilde bagravei toaacuten đạt ra lagrave jiAi lagrave chuyecircn giaAi lagrave người sử dụng

1 Diễn giải (InterPretation) Nghiecircn cứu 1 vấn đề -gt Dựa trecircn những biểu hiện thuộc tiacutenh đặc trưng becircn ngoagravei -gt Tư vấn

(hoặc đưa ra kết luận hay mocirc tả dễ hiểu từ tập dữ liệu thocirc)

2 Bagravei toaacuten dự baacuteo (Prediction) Coacute thể dự đoaacuten được hagravenh vi kết quả dựa trecircn caacutec hiện tượng -gt dự baacuteo

VD Dự baacuteo thời tiết động đấthellip

3 Bagravei toaacuten chẩn đoaacuten (Diagnoss) Xaacutec định caacutec lỗi caacutec bộ phận hỏng hoacutec của hệ thống dựa trecircn caacutec dữ liệu quan saacutet được

4 Bagravei toaacuten gỡ rối (Debugging) Mocirc tả caacutec phương phaacutep khắc phục hệ thống khi gặp sự cố

5 Bagravei toaacuten thiết kế Lựa chọn cấu higravenh caacutec đối tượng nhằm thoả matilden một số ragraveng buộc nagraveo đoacute

6 Giảng dạy Phần mềm dạy học coacute thể chuẩn đoaacuten vagrave sủa lỗi của học sinh trong quaacute trigravenh học tập

Để xaacutec định đuacuteng bagravei toaacuten magrave chuacuteng ta cần giải quyết thigrave phải trả lời đc một số cacircu hỏi

- cần hệ chuyecircn gia

Bước 2 thu thập tri thức lựa chọn cocircng cụ vagrave aacutep dụng

Trong bước thu thập tri thức vấn đề quan trọng lagrave lựa chọn chuyecircn gia những người magrave sẽ đoacuteng goacutep tri thức cho hệ thống Thocircng thường trong suốt quaacute trigravenh phaacutet triển thigrave chuyecircn gia được xem như một thagravenh viecircn của đội phaacutet triển

Hiện nay coacute rất nhiều cocircng cụ để xacircy dựng một hệ chuyecircn gia Phổ biến nhất lagrave JESS CLIPS vagrave OPS5

Bước 3 Thiết kế cơ sở tri thức thiết kế hệ thốngTri thức được biểu diễn trường minh trong cơ sở tri thức

Caacutec chuyecircn gia vagrave kỹ sư tri thức sẽ đối thoại với nhau bằng caacutec kỹ thuật đối thoại Suy diễn (SD) bảng Mocirc higravenh hoacutea SD quy nạp phacircn loại

Vấn đề bagraveo trigrave vagrave phaacutet triển

Caacutec hệ chuyecircn gia đogravei hỏi phải bảo trigrave vagrave phaacutet triển nhiều hơn so với caacutec hệ thống khaacutec Phải thường xuyecircn bổ sung tri thức mới vagrave thay đổi caacutec tri thức cũ để đổi mới hệ chuyecircn gia

Thu thập vagrave khắc phục lỗi do người sử dụng phaacutet hiện để kịp thời khắc phục những sai soacutet của hệ chuyecircn gia

75 Lợi iacutech vagrave hạn chế của caacutec hệ chuyecircn gia

Một số lợi iacutech chiacutenh

Thời gian trả lời hợp lyacute bằng hoặc nhanh hơn so với chuyecircn gia (người) để đi đến cugraveng một quyết định Hệ chuyecircn gia lagrave một hệ thống thời gian thực (real time system)

Khả năng trả lời với mức độ tinh thocircng bằng hoặc cao hơn so với chuyecircn gia (người) trong cugraveng lĩnh vực

Hệ chuyecircn gia giuacutep cho hiệu quả lagravem việc tăng bằng việc sử dụng tập caacutec luật một caacutech nhanh choacuteng magrave ko bị nhầm lẫn chuyecircn gia lagrave người coacute thể quecircn đi một số tri thức cơ sở lyacute luậ nhưng HCG thigrave ko

Quyết định của một người chuyecircn gia coacute thể bị thay đổi vagrave ko coacute tiacutenh thống nhất như quyết định của một hệ chuyecircn gia tạo ra

Hệ chuyecircn gia giuacutep cho người sử dụng coacute thể trau dồi sự hiểu biết trecircn lĩnh vuej cụ thể magrave noacute giải quyết hỗ trợ người ra quyết định coacute trigravenh độ như 1 chuyecircn gia trong quaacute trigravenh gia quyết định

Kiến thức của rất nhiều chuyecircn gia về một lĩnh vực nagraveo đoacute được đưa vagraveo hệ chuyecircn gia lagravem cho CSTT cuat HCG phong phuacute vagrave rộng lớn hơn rất nhiều

HCG giải thiacutech caacutec bước suy luận một caacutech dễ hiểu nhất quaacuten luacutec nagraveo cũng coacute thể sử dụng ko như chuyecircn gia con người

Hạn chế của caacutec hệ chuyecircn gia

Nhược điểm lớn nhất của hệ chuyecircn gia lagrave những yacute kiến chuyecircn mocircn thường rất khoacute matilde hoacutea vagrave giải neacuten

Hệ chuyecircn gia khocircng coacute khả năng tự học tự cập nhật kiến thức mới như caacutec chuyecircn gia magrave cần phải được matilde hoacutea lại khi noacute được cập nhật

Hệ chuyecircn gia khocircng thể nhận ra được vấn đề khocircng nằm trong miền kiến thức của hệ thống

Chương 8 Tri thức vagrave tiếp nhận

1 Bao gồm caacutec vấn đề

Dữ liệu thực tế đo lường hoặc quan saacutet coacute hoặc khocircng coacute bối cảnh

Thocircng tin dữ liệu được tổng hợp một caacutech hữu iacutech để giải quyết những khoacute khăn trong việc đưa ra quyết định

Tri thức bao gồm caacutec ứng dụng quy tắc thocircng tin hướng dẫn của người ra quyết định

2 Những caacutei nhigraven về tri thức

Đại diện lagravem thế nagraveo để diễn tả tri thức viacute dụ như một quyển saacutech khocircng phải lagrave tri thức nhưng noacute lại lagrave một đại diện của tri thức

Sản xuất tri thức lagrave một tập hơp của hagraveng tồn kho coacute thể được sản xuất cũng như mua lại

Tri thức lagrave 1 trong 6 trạng thaacutei của hệ thống

1Dữ liệu 2Thocircng tin 3Cấu truacutec thocircng tin 4Sự thấu hiểu 5Yacute kiến 6 Quyết định

3 Caacutec loại tri thức Phổ biến mocirc tả dữ liệu thocircng tin thủ tục mọi thứ lagravem như thế nagraveo lập luận chiacutenh saacutech hoặc caacutec quy tắc

4 Thu thập Tri thức hệ chuyecircn gia Hầu hết caacutec phương phaacutep đều bắt đầu với mocirc higravenh của caacutec taacutec vụ trong đoacute

hệ chuyecircn gia được xacircy dựng Trong đoacute mocirc tả về caacutec lĩnh vực được tạo ra Caacutec kỹ sư sử dụng caacutec mocirc higravenh giả thuyết vagrave nhận thức về quaacute trigravenh phacircn

tiacutech để gợi ra caacutech giải quyết vấn đề về tri thức từ caacutec chuyecircn gia

5 Caacutec chiều của thu thập tri thức KE- driven caacutec kỹ sư trao đổi trực tiếp với caacutec chuyecircn gia Expert-driven Caacutec chuyecircn gia trực tiếp đưa chuyecircn mocircn của họ vagraveo hệ

thống maacutey tiacutenh Machine-driven Sử dụng caacutec cocircng cụ suy luận để triacutech xuất tri thức từ một

tập caacutec viacute dụ

6 Kỹ thuật thu thập tri thức Trao đổi gồm 2 loại cơ bản lagrave coacute cấu truacutec(coacute kịch bản) vagrave khocircng coacute cấu

truacutec( đối thoại trực tiếp) Giao thức phacircn tiacutech bằng lời Khi caacutec chuyecircn gia thực hiện một cocircng việc

của họ thigrave một bản ghi về cocircng việc đoacute được thực hiện Caacutec kỹ sư sẽ xacircy dựng mocirc higravenh cho những gigrave được ghi lại trong bản ghi

Phương phaacutep sagraveng lọc caacutec chuyecircn gia so saacutenh caacutec nhoacutem liecircn tiếp trong ba đối tượng vagrave cho biết tại sao nhoacutem thứ hai lại khaacutec nhoacutem thứ ba

7 Thu thập tri thức từ nhiều nguồn Thu thập tri thức từ nhiều nguồn lagrave cần thiết để coacute được đầy đủ caacutec tri thức

cho một vấn đề quan điểm yacute kiến traacutei ngược nhau thường phaacutet sinh Phương phaacutep đồng thuận sẽ giuacutep giải quyết được vấn đề macircu thuẫn Kỹ thuật phacircn tiacutech Meta lagrave kỹ thuật được aacutep dụng trong caacutec trường hợp

khaacutec Caacutech tiếp cận bằng định lượng đogravei hỏi caacutec kỹ sư cần cacircn nhắc yếu tố đầu vagraveo của caacutec chuyecircn gia khaacutec nhau

8 Xaacutec nhận hợp lệ vagrave kiểm tra tri thức Một khi thu thập tri thức noacute phải được đaacutenh giaacute về khả năng sử dụng vagrave độ

chiacutenh xaacutec Hai vấn đề cụ thể lagrave hiệu lực của những kiến thức vagrave kiểm tra việc xacircy dựng cơ sở của tri thức

Cần xaacutec nhận xem liệu hệ thống coacute thể hoạt động ở mức độ tối thiểu khocircng

Xaacutec minh liecircn quan đến việc so saacutenh từng chi tiết kỹ thuật của hệ thống những gigrave đatilde được thực hiện cuối cugraveng

9 Một số caacutec biện phaacutep xaacutec nhận Độ chiacutenh xaacutec Khả năng thiacutech nghi Mức độ đầy đủ Bề rộng Độ sacircu Hiệu lực Tổng quan Chiacutenh xaacutec Hiện thực Độ tin cậy Tiacutenh hữu dụng Mức độ

Chương 9 Học maacutey

1 Logic mờ vagrave ngocircn ngữ mờ(Fuzzy Logic and Linguistic Ambiguity)

Ngocircn ngữ tự nhiecircn gồm những khaacutei niệm mơ hồ vagrave khocircng chiacutenh xaacutectruyền tải ngữ nghĩa thocircng qua tiacutenh xấp xỉkhocircng rotilde ragraveng

Những xấp xỉ nagravey giuacutep con người coacute thể truyền tải hết được yacute nghĩa nhưng maacutey thigrave khocircng hiểu

Lagravem sao biểu diễn caacutec tri thức sử dụng caacutec khaacutei niệm khocircng rotilde ragraveng(mờ) hoặc khocircng chiacutenh xaacutec

2 Khaacutei niệm cơ bản của logic mờ tập mờ lagrave những tập hợp khocircng coacute một giới hạn rotilde Mỗi phần tử của noacute chỉ

chứa một mức độ hagravem liecircn thuộc của từng phần tử Vigrave vậy tập mờ khocircng giống như tập cổ điển Tập mờ coacute thể kết hợp với nhau qua những luật mờ magrave đặc trưng cho những hagravenh động trạng thaacutei vagrave thuộc tiacutenh của logic mờ được tận dụng khi thực hiện một bộ điều khiển mờ

Logic mờ dựa trecircn yacute tưởng mỗi phần tử thuộc vagraveo một tập hợp ở một mức độ nagraveo đấy

Locircgic mờ cho pheacutep độ liecircn thuộc (microA )coacute giaacute trị trong khoảng (01) Locircgic mờ coacute thể được coi lagrave mặt ứng dụng của lyacute thuyết tập mờ để xử lyacute caacutec

giaacute trị trong thế giới thực cho caacutec bagravei toaacuten phức tạp

3 So saacutenh tiacutenh đuacuteng đắn logic mờ vagrave xaacutec suất Xaacutec suất thigrave đề cập đến khả năng xảy ra một biến cố hay một điều gigrave đoacute Logic mờ đề cập đến cấp độ magrave đặc tiacutenh ở hiện tại

o viacute dụ1 người coacute chiều cao 6 feet thigrave coacute cấp độ lagrave 05 về chiều cao

4 Ưu điểm của logic mờ Caacutech tiếp cận rất tự nhiecircnkhocircng phức tạp Coacute thể mocirc higravenh hoacutea caacutec hagravem phi tuyến tugravey yacute phức tạp

Coacute thể tận dụng được kinh nghiệm từ những chuyecircn gia hagraveng đầu trong mọi lĩnh vực

Logic mờ được xacircy dựng dựa trecircn ngocircn ngữ tự nhiecircnNền tảng của logic mờ lagrave dựa trecircn cơ sở giao tiếp của con người

5 Nhược điểm của logic mờ Trong 1 hệ thống phức tạpsử dụng logic mờ coacute thể trở thagravenh trở ngại cho

việc xaacutec thực độ tin cậy của hệ thống Cơ chế lập luận mờ khocircng thể học hỏi từ những lỗi sai

6 Mạng noron nhacircn tạo(ANN) Mạng noron nhacircn tạo lagrave một mocirc phỏng xử lyacute thocircng tinđược nghiecircn cứu ra

từ hệ thống thần kinh của sinh vậtgiống như bộ natildeo để xử lyacute thocircng tin ANNs lagrave chương trigravenh dựa trecircn maacutey tiacutenh đơn giản coacute chức năng lagrave một mocirc

higravenh bagravei toaacuten khocircng gian dựa trecircn thử nghiệm vagrave baacuteo lỗi

7 Học từ kinh nghiệm Tiến trigravenh Một mẫu dữ liệu được biểu diễn như một mạng lưới noronANN ldquodự

đoaacutenrdquo 1 đầu radự đoaacuten được so saacutenh với giaacute trị thực tế hoặc giaacute trị chiacutenh xaacutecNếu đoaacuten được chiacutenh xaacutec thigrave khocircng coacute hagravenh động nagraveo được thực hiện

Nếu dự đoaacuten sai ANN kiểm tra lại vagrave xaacutec định lại thocircng số để điều chỉnh Một mẫu dữ liệu khaacutec được biểu diễn vagrave quaacute trigravenh nagravey được lặp lại

8 Nguyecircn tắc cơ bản của cocircng nghệ nơron Caacutec yếu tố xử lyacute cơ bản trong hệ thống thần kinh của con người lagrave tế bagraveo

thần kinhMạng lưới của tế bagraveo nagravey lagrave liecircn kết với nhau nhận được thocircng tin từ caacutec cảm biến trong mắt taihellip

Thocircng tin nhận được bởi tế bagraveo thần kinh hoặc lagrave sẽ kiacutech thiacutech noacute(sẽ được chuyển qua 1 thocircng điệp dọc theo mạng lưới) hoặc lagrave sẽ ngăn cản noacute(ngăn cản dograveng thocircng tin)

Độ nhạy coacute thể thay đổi qua thời gian hoặc sau khi coacute được kinh nghiệm

9 Cấu truacutec mạng Một ANN gồm 3 lớp cơ bản

Lớp đầu vagraveo nhận dữ liệu Lớp becircn trong hoặc lagrave lớp ẩn xử lyacute dữ liệu Lớp đầu ra chuyển tiếp kết quả cuối cugraveng của mạng

10Mạng nơ ron Thường coacute nhiều đầu vagraveo mỗi đầu vagraveo với mức ảnh hưởng vagrave tầm quan

trọng riecircng của noacute Một đầu vagraveo quan trọng coacute thể được sử dụng để khuếch đại đầu ra caacutec hagravem trạng thaacutei tổng hợp caacutec trọng số của caacutec yếu tố

đầuvagraveo khaacutec nhauvagraveo một giaacute trị duy nhất Caacutec hagravem chuyển giao xử lyacute caacutec giaacute trị trạng thaacutei vagrave tạo đầu ra

11Huấn luyện mạng nơ ron Trong mocirc higravenh coacute giaacutem saacutetANN được đến so saacutenh dự đoaacuten của chiacutenh

noacute với thocircng tin phản hồi coacute chứa caacutec kết quả mong muốn ANN sẽ phải tigravem caacutech thay đổi caacutec tham số becircn trong củamigravenh (caacutec trọng số vagrave caacutec ngưỡng) để tạo necircn một aacutenh xạ coacute khả năng aacutenh xạcaacutec đầu vagraveo thagravenh caacutec đầu ra mong muốn Sự thay đổi nagravey được tiến hagravenh nhờ việc so saacutenh giữa đầu ra thực sự vagrave đầu ra mong muốn

Trong mocirc higravenh khocircng coacute giaacutem saacutetANN nhận được dữ liệu vagraveo nhưng khocircng phải coacute bất kỳ thocircng tin phản hồi về kết quả mong muốn

Phần lớn caacutec ứng dụng nằm trong vugraveng của caacutec bagravei toaacuten ước lượng như mocirc higravenh hoacuteathống kecirc neacuten lọc phacircn cụm

12Lợi iacutech Liecircn kết với mạng noron Traacutenh caacutech lập trigravenh tường minh Giảm nhu cầu của chuyecircn gia ANNs thigrave thiacutech nghi với caacutec yếu tố đầu vagraveo thay đổi Khocircng cần thiết cho cơ sở tri thức tinh chế ANNs coacute tiacutenh động vagrave cải thiện với việc sử dụng Coacute khả năng xử lyacute dữ liệu khocircng chiacutenh xaacutec hoặc khocircng đầy đủ Cho pheacutep tổng quaacutet hoacutea từ thocircng tin cụ thể Cho pheacutep thu thập cảm giaacutec thocircng thường vagraveo miền giải quyết vấn đề

13Hạn chế của việc liecircn kết với mạng noron ANNs khocircng thể giải thiacutech được suy luận Bản chất hộp đen thường khiến cho vấn đề traacutech nhiệm vagrave độ tin cậy phaacutet

sinh lagrave khoacute khăn Lặp đi lặp lại quaacute trigravenh huấn luyện rất tốn thời gian Nguồn lực caacutec nhagrave phacircn tiacutech vagrave thiết kế coacute tay nghề cao vẫn lagrave đaacuteng lo

ngại Cocircng nghệ ANN thuacutec đẩy hạn chế của phần cứng hiện tại ANN yecircu cầu phải coacute sự tin tưởng ở đầu ra

14Giới thiệu về thuật toaacuten di truyền Cũng như mạng lưới thần kinh caacutec thuật toaacuten di truyền được dựa trecircn lyacute

thuyết sinh học Thuật toaacuten di truyền tigravem thấy nguồn gốc của chuacuteng trong caacutec lyacute thuyết

tiến hoacutea của chọn lọc tự nhiecircn vagrave thiacutech ứng với biến đổi khiacute hậu Kết quả thuật toaacuten di truyền lagrave từ giao phối 2 caacute thể trong quần thế để tạo

ra con caacutei đocirci khi tốt hơn so với bậc cha mẹ của chuacuteng 15Caacutec thagravenh phần cơ bản của thuật toaacuten di truyền

Toaacuten tử chọn lọc Caacutec caacute thể tốt được chọn lọc để đưa vagraveo thế hệ sau Sự chọn lọc nagravey căn cứ vagraveo độ thiacutech nghi với mocirci trường của mỗi caacute thể

Toaacuten tử lai gheacutep (crossover) Hai caacute thể cha vagrave mẹ trao đổi caacutec gen với nhau để tạo ra caacute thể con

Toaacuten tử đột biến (mutation) Một caacute thể thay đổi một số gen để biến đổi thagravenh một caacute thể mớiTất cả caacutec toaacuten tử trecircn khi thực hiện đều mang tiacutenh ngẫu nhiecircn

16Quaacute trigravenh cơ bản của một thuật toaacuten di truyền Khởi tạo

Đaacutenh giaacute quần thể

Lựa chọn NST thiacutech hợp nhất vagrave loại bỏ NST yếu nhất

Quy trigravenh giao nhau vagrave cải thiện quần thể

đột biến tiến trigravenh để khaacutem phaacute ra NST mới

17Ưu nhược điểm của việc kết hợp với thuật toaacuten di truyền Kiacutech thước quần thể lagrave 1 yếu tố quan trọng trong tốc độ của việc tigravem

kiếmnhưng noacute tương đối dễ dagraveng để dự đoaacuten tốc độ nagravey Giao nhau hoặc đột biến lagrave khocircng necircn đc sử dụng quaacute thường xuyecircn Luocircn coacute được iacutet nhất 1 giải phaacutep hợp lyacute Necircn coacute thể aacutep dụng chuacuteng cho caacutec vấn đề magrave chuacuteng ta khocircng coacute hướng

về caacutech giải quyết Sức mạnh của thuật toaacuten xuất phaacutet từ khaacutei niệm đơn giảnkhocircng phải từ

một thủ tục thuật toaacuten phức tạp 18Tương lai của học maacutey

Mạng lưới thần kinh nhacircn tạo vượt quaacute năng lực của con người trong caacutec trường hợp bị cocirc lập

Về mặt lyacute thuyếtmột maacutey tiacutenh coacute thể xử lyacute dũ liệu nhanh hơn hagraveng triệu lần so với 1 con người

May mắn thay cho chuacuteng tacon người tốt hơn nhiều khi magrave coacute được dữ liệumaacutey tiacutenh khocircng coacute 1 số thứ như lagrave 5 giaacutec quan

CHƯƠNG 10 KHO DỮ LIỆU

1 Kho dữ liệu Kho dữ liệu lagrave tuyển tập caacutec cơ sở dữ liệu tiacutech hợp hướng chủ đề được

thiết kế để trợ giuacutep cho một hệ hỗ trợ quyết định

Theo John Ladley Cocircng nghệ kho dữ liệu lagrave tập caacutec phương phaacutep kỹ thuật vagrave caacutec cocircng cụ coacute thể kết hợp hỗ trợ nhau để cung cấp thocircng tin cho người sử dụng trecircn cơ sở tiacutech hợp từ nhiều nguồn dữ liệu nhiều mocirci trường khaacutec nhau

Kho dữ liệu thường rất lớn tới hagraveng trăm GB hay thậm chiacute hagraveng Terabyte

2 Kho dữ liệu vận hagravenh (ODS) Một kho dữ liệu vận hagravenh Aacutep dụng kỹ thuật kho dữ liệu vagraveo caacutec hệ xử

lyacute giao taacutec lưu trữ dữ liệu cho một ứng dụng đặc thugrave Noacute đưa vagraveo kho dữ liệu một dograveng caacutec dữ liệu thocirc được thiết kế

3 So saacutenh

Kho dữ liệu vận hagravenh Kho dữ liệu

Dữ liệu theo chủ đề Dữ liệu theo chủ đề

Dữ liệu tiacutech hợp Dữ liệu tiacutech hợp

Dữ liệu thay đổi Dữ liệu khocircng thay đổi

Dữ liệu được cập nhật khi thay đổi

Dữ liệu giữ nguyecircn

Chỉ coacute dữ liệu hiện tạiDữliệu hiện tại vagrave dữ liệu lịch sử

Chu kỳ lagravem tươi dữ liệu ngắn Chu kỳ lagravem tươi dữ liệu dagravei

Chỉ coacute dữ liệu chi tiết Dữ liệu chi tiết vagrave dữ liệu tổng kết

Dugraveng cho caacutec quyết định ngắn hạn

Dugraveng cho hoạch định dagravei hạn

4 Kho dữ liệu cục bộ (Data Mart - DM)

Kho dữ liệu cục bộ lagrave CSDL coacute những đặc điểm giống với kho dữ liệu nhưng với quy mocirc nhỏ hơn vagrave lưu trữ dữ liệu về một lĩnh vực một chuyecircn ngagravenh

Data mart phụ thuộc Chứa những dữ liệu được lấy từ DW vagrave những dữ liệu nagravey sẽ được triacutech lọc vagrave tinh chế tiacutech hợp lại ở mức cao hơn để phục vụ một chủ đề nhất định của Datamart

Data mart độc lập Khocircng giống như Datamart phụ thuộc Data mart độc lập được xacircy dựng trước DW vagrave dữ liệu được trực tiếp lấy từ caacutec nguồn khaacutec nhau

5 Siecircu dữ liệu Metadata lagrave dữ liệu để mocirc tả dữ liệu Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột

một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi Metadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu

6 Mocirci trường kho dữ liệu Hệ thống của tổ chức vagrave kho cung cấp dữ liệu để xacircy dựng kho dữ liệu Trong quaacute trigravenh chuyển dữ liệu từ caacutec nguồn khaacutec nhau dữ liệu coacute thể

được lagravem sạch hoặc chuyển đổi vagrave vigrave thế DW được xem như lagrave một chuẩn cho việc lưu trữ

Đồng thời siecircu dữ liệu được ghi lại Cuối cugraveng DW hoặc siecircu thị coacute thể được sử dụng để tạo ra một kho dữ

liệu ldquocaacute nhacircnrdquo 7 Caacutec đặc điểm của kho dữ liệu

Đặc điểm Mocirc tả

Hướng chủ đề - DL tổ chức theo caacutech thức người dugraveng tham chiếu

Tiacutech hợp - Dữ liệu ldquosạchrdquo loại bỏ tiacutenh thiếu nhất quaacuten

Khocircng thay đổi - DL ldquochỉ đọcrdquo người dugraveng khocircng thay đổi được

Chuỗi thời gian - DL lagrave chuỗi thời gian khocircng phải lagrave trạng thaacutei hiện tại

Được tổng kết - DL vận hagravenhthao taacutec khi cần thiết

được kết hợp lại thagravenh dạng coacute thể dugraveng được cho quyết định

Kiacutech cỡ lớn hơn - Lưu giữ theo chuỗi thời gian tức lagrave giữ lại nhiều DL

Khocircng được chuẩn hoacutea - Coacute thể dư thừa DLSiecircu dữ liệu - Dữ liệu của dữ liệu được lưu trữNguồn dữ liệu - DL vận hagravenh (caacutec hệ sẵn coacute) cugraveng

với caacutec nguồn ngoagravei 8 Kho dữ liệu hướng chủ đề

Hướng chủ để coacute nghĩa lagrave kho dữ liệu được tổ chức xung quanh caacutec chủ đề chiacutenh như khaacutech hagraveng sản phẩm sản xuất Tập trung vagraveo việc mocirc higravenh hoacutea vagrave phacircn tiacutech dữ liệu cho caacutec nhagrave ra quyết định magrave khocircng tập trung vagraveo caacutec xử lyacute thocircng thường Cung cấp cho người dugraveng một khung nhigraven toagraven vẹn đơn giản vagrave đầy đủ về caacutec sự kiện quanh caacutec chủ đề

9 Dữ liệu trong DW được tiacutech hợp Dữ liệu trong kho dữ liệu được xacircy dựng bằng caacutech tổng hợp dữ liệu từ

nhiều nguồn khaacutec nhau vagrave caacutec nguồn coacute tổ chức khaacutec nhau Cơ sở dữ liệu caacutec file excel caacutec flat file hoặc caacutec raw file Khi đưa vagraveo kho dữ liệu caacutec dữ liệu được lagravem sạch vagrave tiacutech hợp dữ liệu nhằm đảm bảo tiacutenh nhất quaacuten của dữ liệu

10Kiến truacutec kho dữ liệu Tầng cơ sở dữ liệu hoạt động Tầng truy xuất thocircng tin Tầng truy xuất dữ liệu Tầng siecircu dữ liệu Tầng quản lyacute tiến trigravenh Tầng thocircng điệp của ứng dụng Tầng vật liacute của kho dữ liệu Tầng trigravenh diễn dữ liệu

11Higravenh trạng kho dữ liệu Kho dữ liệu ảo - người dugraveng cuối coacute thể truy cập trực tiếp đến kho dữ liệu

sử dụng caacutec cocircng cụ cho pheacutep ở tầng truy xuất dữ liệu Kho dữ liệu trung tacircm-1 cơ sở dữ liệu vật lyacute chứa tất cả dữ liệu cho một

vugraveng chuyecircn dụng nagraveo đoacute

Kho dữ liệu phacircn taacuten- Thagravenh phần được phacircn taacuten qua nhiều hệ cơ sở dữ liệu vật lyacute

12METADATA- Siecircu dữ liệu Định nghĩa Siecircu dữ liệu lagrave dữ liệu về dữ liệu Lagrave 1 lưu trữ dugraveng để

Miecircu tả kho dữ liệu tổng thể Nhận dạng kiểu kho dữ liệu Quản liacute quaacute trigravenh tiacutech hợp dữ liệu Quản liacute quaacute trigravenh cập nhật kho dữ liệu Quản liacute bảo mật

Lagrave chigravea khoacutea quyết định sự thagravenh cocircng của kho dữ liệu luocircn được thay đổi vagrave cập nhật theo sự phaacutet triển của kho dữ liệu

Dugraveng để quản liacute điều khiển kho dữ liệu Sự ra đời của kho dữ liệu như 1 cấu truacutec hỗ trợ ra quyết định siecircu dữ liệu

được xem như nguồn tagravei nguyecircn dữ liệu Siecircu dữ liệu lagrave trừu tượng Chuacuteng lagrave dữ liệu bậc cao cung cấp mocirc tả ngắn

gọn caacutec dữ liệu bậc thấp hơn 13Hoạt động của Siecircu dữ liệu

Siecircu dữ liệu rất cần thiết trong việc chuyển hoacutea thocircng tin trở thagravenh tri thức Lagrave chigravea khoacutea giuacutep chuacuteng ta xử lyacute được dữ liệu thocirc Viacute dụ một dograveng dữ liệu baacuten hagraveng 1023 K596 11121 agraveNoacute sẽ khocircng coacute nghĩa gigrave cho đến khi chuacuteng ta đưa vagraveo siecircu dữ liệu (thư

mục chứa dữ liệu) agrave cửa hagraveng 1023 sản phẩm K596 vagrave số tiền baacuten được lagrave 11121 đocirc la

14Sự cần thiết phải nhất quaacuten trong kho dữ liệu Kho dữ liệu được xacircy dựng cho lợi iacutech của những nhagrave phacircn tiacutech kinh

doanh caacutec nhagrave quản trị cho tất cả caacutec khu vực chức năng Trong cơ sở dữ liệu riecircng caacutec khu vực khaacutec nhau coacute thể định nghĩa vagrave lưu

trữ dữ liệu thocircng qua phiecircn bản của chiacutenh noacute Khi dữ liệu được lấy từ những vugraveng khaacutec nhau đoacute vagrave được đặt vagraveo kho dữ

liệu Việc chuyển đổi vagrave lagravem sạch caacutec tiến trigravenh sẽ đảm bảo noacute lagrave duy nhất được tiacutech hợp tại một mức của tổ chức

15Ragrave soaacutet lại dữ liệu ndash Thực thi siecircu dữ liệu

Bất kể cấu truacutec tự nhiecircn của 1 cacircu truy vấn thế nagraveo thigrave caacutec thagravenh phần của siecircu dữ liệu rất quan trọng đối với người ra quyết định

Bảng thuộc tiacutenh khoacutea được lưu trữ bởi kho dữ liệu Tập hợp dữ liệu được lấy từ đacircu Những chuyển đổi nagraveo được thực thi với việc lagravem sạch

16Siecircu dữ liệu lagrave gigrave Metadata - lagrave thocircng tin mocirc tả nội dung của cơ sở dữ liệu (CSDL) Metadata baacuteo cho người dugraveng biết thời gian cập nhật sau cugraveng của dữ liệu

định dạng vagrave mục điacutech sử dụng của noacute Những thocircng tin nagravey coacute thể hướng dẫn người dugraveng duyệt qua CSDL vagrave

giuacutep họ hiểu được yacute nghĩa vagrave ngữ cảnh của dữ liệu Trong CSDL metadata lagrave caacutec dạng biểu diễn khaacutec nhau của caacutec đối tượng

trong CSDL Trong CSDL quan hệ metadata lagrave caacutec định nghĩa của bảng cột CSDL

view vagrave nhiều đối tượng khaacutec Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột

một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi -gtMetadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu

Bảng chuyển đổi Ghi lại những chuyển đổi đatilde được thực hiện

Lịch sử thực thi Ghi lại những dữ liệu đatilde được

phacircn tiacutech

Higravenh thaacutei kết nốiGhi lại những dữ liệu được kết nối vagrave tần suất

17Aacutenh xạ thocircng thường của siecircu dữ liệu Bản ghi aacutenh xạ chuyển đổi bao gồm

Định danh của nguồn gốc Chuyển đổi thuộc tiacutenh Chuyển đổi thuộc tiacutenh vật lyacute Matilde hoacutea tham chiếu bảng chuyển đổi Đổi tecircn Đổi khoacutea Gaacuten giaacute trị cho thuộc tiacutenh mặc định Chọn logic cho caacutec nguồn nhiều giaacute trị Đổi thuật toaacuten

18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để

phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai

lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave

tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec

Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm

Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo

19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua

caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau

SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được

Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra

một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức

Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ

Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ

Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech

CHƯƠNG 11 KHAI PHAacute DỮ LIỆU

1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn

ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993

Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng

2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd

1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều

2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP

3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn

4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng

5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server

6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo

7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động

8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời

9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều

10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện

11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech

12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP

3 Xử lyacute phacircn tiacutech trực tuyến OLAP

MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave

dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu

ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave

thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu

HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave

ROLAP4 Khai phaacute dữ liệu

Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh

khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn

Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan

5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp

6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại

Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp

Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec

Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt

Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra

Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh

vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho

Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec

Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm

Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục

Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng

gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp

Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn

Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec

Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper

Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2

Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25

Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước

Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng

Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện

trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp

Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute

độ hỗ trợ ge ngưỡng minsup

độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan

Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn

Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết

Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu

MOLAP ROLAP HOLAP

Lưu trữ dữ liệu cơ sở

Khối Bảng quan hệ Bảng quan hệ

Lưu trữ thocircng tin tổng hợp

Khối Bảng quan hệ Khối

Hiệu suất thực hiện truy vấn

Nhanh nhất Chậm nhất Nhanh

Tiecircu thụ khocircng gian lưu trữ

Nhiều Thấp Trung bigravenh

Chi phiacute bảo trigrave Cao Thấp Trung bigravenh

Page 42: De cuong(1-11)

Ở đacircy tri thức được đặt để sử dụng tạo ra caacutec giải phaacutep để giải quyết vấn đề

Mocirc tơ nagravey coacute khả năng thực hiện diễn dịch hoặc suy diễn dựa trecircn caacutec luật hay caacutec caacutec sự kiện

Đồng thời cũng coacute khả năng sử dụng caacutec suy diễn mờ hay khocircng chiacutenh xaacutec dựa trecircn xaacutec suất hay aacutenh xạ mẫu

Vograveng điều khiển suy diễn

1 Aacutenh xạ caacutec luật với caacutec sự kiện đatilde được cho

2 Chọn luật để thực hiện

3 Thực hiện luật bằng caacutech thecircm caacutec sự kiện được suy diễn ra vagraveo bộ nhớ lagravem việc

Chuỗi suy diễn (Chaining)

Suy diễn tiến (forward chaining) maacutey suy diễn bắt đầu từ dữ liệu ban đầu vagrave thực hiện việc suy luận để đưa ra caacutec kết luận cuối cugraveng

Suy diễn lugravei (backward chaining) maacutey suy diễn bắt đầu từ dữ liệu điacutech vagrave tigravem ra tri thức hỗ trợ cho dữ liệu điacutech đoacute

Viacute dụ suy diễn lugravei

R1 Nếu coacute A vagrave B thigrave suy ra coacute D

R2 Nếu coacute B thigrave suy ra coacute C

R3 Nếu coacute C vagrave D thigrave suy ra coacute E

Ta coacute E ta xem trong 3 luật R1 R2 R3 luật nagraveo coacute E ta thấy R3 chứa E đồng thời chứa C vagrave D Xeacutet tiếp trong 2 luật R1 R2 luật nagraveo chứa C vagrave D R2 chứa C R3 chứa D Từ đoacute ta coacute được caacutec tri thức hỗ trợ suy diễn vagrave kết luận lagrave nếu coacute A vagrave B thigrave sẽ coacute E Hay nếu A vagrave B đuacuteng thigrave sẽ coacute E

Viacute dụ suy diễn tiến

Giả sử coacute tập chứa 3 luật sau

R1 Nếu coacute A vagrave B thigrave suy ra coacute D

R2 Nếu coacute B thigrave suy ra coacute C

R3 Nếu coacute C vagrave D thigrave suy ra coacute E

Nếu ta coacute A vagrave B thigrave chuacuteng ta suy ra được D từ R1 vagrave suy ra C từ R2 Với D vagrave C đatilde được suy ra ở trecircn giờ chuacuteng ta suy ra được E từ R3

Viacute dụ thực tế

Giả sử muốn biết magraveu của một con vật nuocirci tecircn lagrave Fred biết rằng noacute kecircu ộp ộp vagrave ăn ruồi

Coacute tập 4 luật ban đầu như sau

R1 Nếu X kecircu ộp ộp vagrave ăn ruồi thigrave X lagrave con ếch

R2 Nếu X kecircu chiecircm chiếp vagrave biết hoacutet thigrave X lagrave con chim

R3 Nếu X lagrave con ếch thigrave X coacute magraveu xanh

R4 Nếu X lagrave con chim thigrave X coacute magraveu vagraveng

74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia

Expert system shells lagrave một tập caacutec goacutei phần mềm vagrave caacutec cocircng cụ dugraveng để phaacutet triển caacutec hệ chuyecircn gia

Những Expert system shells đầu tiecircn thường rất rườm ragrave Mặc dugrave vậy noacute vẫn giuacutep cho người sử dụng sẽ khocircng phải bắt đầu lại từ đầu khi xacircy dựng một hệ chuyecircn gia mới

Những shell hiện đại bao gồm hai mocirc-đun chiacutenh lagrave cocircng cụ xacircy dựng một tập quy tắc vagrave mocirc tơ suy diễn

Xacircy dựng hệ chuyecircn gia

Bước 1 xacircy dựng mocirc higravenh bagravei toaacuten xaacutec định vấn đề nhiệm vụ magrave hệ thống sẽ thực hiện Caacutec dạng bagravei toaacuten cần hệ chuyecircn gia

Bagravei toaacuten diễn giải (InterPretation)

Bagravei toaacuten dự baacuteo (Prediction)

Bagravei toaacuten chuẩn đoaacuten (Diagnose)

Bagravei toaacuten gỡ rối (Debugging)

Bagravei toaacuten thiết kế

Tương tự như một dự aacuten phần mềm để xacircy dựng một hệ chuyecircn gia cần phải coacute caacutec yếu tố về nhacircn lực tagravei nguyecircn vagrave thời gian Những yếu tố nagravey ảnh hưởng đến giaacute thah của một hệ chuyecircn giaTrong phần nagravey cacircu hỏi thường được đặt ra lagrave tại sao cần phải xacircy dựng một hệ chuyecircn giaTrước khi bắt đầu phải xaacute định rotilde bagravei toaacuten đạt ra lagrave jiAi lagrave chuyecircn giaAi lagrave người sử dụng

1 Diễn giải (InterPretation) Nghiecircn cứu 1 vấn đề -gt Dựa trecircn những biểu hiện thuộc tiacutenh đặc trưng becircn ngoagravei -gt Tư vấn

(hoặc đưa ra kết luận hay mocirc tả dễ hiểu từ tập dữ liệu thocirc)

2 Bagravei toaacuten dự baacuteo (Prediction) Coacute thể dự đoaacuten được hagravenh vi kết quả dựa trecircn caacutec hiện tượng -gt dự baacuteo

VD Dự baacuteo thời tiết động đấthellip

3 Bagravei toaacuten chẩn đoaacuten (Diagnoss) Xaacutec định caacutec lỗi caacutec bộ phận hỏng hoacutec của hệ thống dựa trecircn caacutec dữ liệu quan saacutet được

4 Bagravei toaacuten gỡ rối (Debugging) Mocirc tả caacutec phương phaacutep khắc phục hệ thống khi gặp sự cố

5 Bagravei toaacuten thiết kế Lựa chọn cấu higravenh caacutec đối tượng nhằm thoả matilden một số ragraveng buộc nagraveo đoacute

6 Giảng dạy Phần mềm dạy học coacute thể chuẩn đoaacuten vagrave sủa lỗi của học sinh trong quaacute trigravenh học tập

Để xaacutec định đuacuteng bagravei toaacuten magrave chuacuteng ta cần giải quyết thigrave phải trả lời đc một số cacircu hỏi

- cần hệ chuyecircn gia

Bước 2 thu thập tri thức lựa chọn cocircng cụ vagrave aacutep dụng

Trong bước thu thập tri thức vấn đề quan trọng lagrave lựa chọn chuyecircn gia những người magrave sẽ đoacuteng goacutep tri thức cho hệ thống Thocircng thường trong suốt quaacute trigravenh phaacutet triển thigrave chuyecircn gia được xem như một thagravenh viecircn của đội phaacutet triển

Hiện nay coacute rất nhiều cocircng cụ để xacircy dựng một hệ chuyecircn gia Phổ biến nhất lagrave JESS CLIPS vagrave OPS5

Bước 3 Thiết kế cơ sở tri thức thiết kế hệ thốngTri thức được biểu diễn trường minh trong cơ sở tri thức

Caacutec chuyecircn gia vagrave kỹ sư tri thức sẽ đối thoại với nhau bằng caacutec kỹ thuật đối thoại Suy diễn (SD) bảng Mocirc higravenh hoacutea SD quy nạp phacircn loại

Vấn đề bagraveo trigrave vagrave phaacutet triển

Caacutec hệ chuyecircn gia đogravei hỏi phải bảo trigrave vagrave phaacutet triển nhiều hơn so với caacutec hệ thống khaacutec Phải thường xuyecircn bổ sung tri thức mới vagrave thay đổi caacutec tri thức cũ để đổi mới hệ chuyecircn gia

Thu thập vagrave khắc phục lỗi do người sử dụng phaacutet hiện để kịp thời khắc phục những sai soacutet của hệ chuyecircn gia

75 Lợi iacutech vagrave hạn chế của caacutec hệ chuyecircn gia

Một số lợi iacutech chiacutenh

Thời gian trả lời hợp lyacute bằng hoặc nhanh hơn so với chuyecircn gia (người) để đi đến cugraveng một quyết định Hệ chuyecircn gia lagrave một hệ thống thời gian thực (real time system)

Khả năng trả lời với mức độ tinh thocircng bằng hoặc cao hơn so với chuyecircn gia (người) trong cugraveng lĩnh vực

Hệ chuyecircn gia giuacutep cho hiệu quả lagravem việc tăng bằng việc sử dụng tập caacutec luật một caacutech nhanh choacuteng magrave ko bị nhầm lẫn chuyecircn gia lagrave người coacute thể quecircn đi một số tri thức cơ sở lyacute luậ nhưng HCG thigrave ko

Quyết định của một người chuyecircn gia coacute thể bị thay đổi vagrave ko coacute tiacutenh thống nhất như quyết định của một hệ chuyecircn gia tạo ra

Hệ chuyecircn gia giuacutep cho người sử dụng coacute thể trau dồi sự hiểu biết trecircn lĩnh vuej cụ thể magrave noacute giải quyết hỗ trợ người ra quyết định coacute trigravenh độ như 1 chuyecircn gia trong quaacute trigravenh gia quyết định

Kiến thức của rất nhiều chuyecircn gia về một lĩnh vực nagraveo đoacute được đưa vagraveo hệ chuyecircn gia lagravem cho CSTT cuat HCG phong phuacute vagrave rộng lớn hơn rất nhiều

HCG giải thiacutech caacutec bước suy luận một caacutech dễ hiểu nhất quaacuten luacutec nagraveo cũng coacute thể sử dụng ko như chuyecircn gia con người

Hạn chế của caacutec hệ chuyecircn gia

Nhược điểm lớn nhất của hệ chuyecircn gia lagrave những yacute kiến chuyecircn mocircn thường rất khoacute matilde hoacutea vagrave giải neacuten

Hệ chuyecircn gia khocircng coacute khả năng tự học tự cập nhật kiến thức mới như caacutec chuyecircn gia magrave cần phải được matilde hoacutea lại khi noacute được cập nhật

Hệ chuyecircn gia khocircng thể nhận ra được vấn đề khocircng nằm trong miền kiến thức của hệ thống

Chương 8 Tri thức vagrave tiếp nhận

1 Bao gồm caacutec vấn đề

Dữ liệu thực tế đo lường hoặc quan saacutet coacute hoặc khocircng coacute bối cảnh

Thocircng tin dữ liệu được tổng hợp một caacutech hữu iacutech để giải quyết những khoacute khăn trong việc đưa ra quyết định

Tri thức bao gồm caacutec ứng dụng quy tắc thocircng tin hướng dẫn của người ra quyết định

2 Những caacutei nhigraven về tri thức

Đại diện lagravem thế nagraveo để diễn tả tri thức viacute dụ như một quyển saacutech khocircng phải lagrave tri thức nhưng noacute lại lagrave một đại diện của tri thức

Sản xuất tri thức lagrave một tập hơp của hagraveng tồn kho coacute thể được sản xuất cũng như mua lại

Tri thức lagrave 1 trong 6 trạng thaacutei của hệ thống

1Dữ liệu 2Thocircng tin 3Cấu truacutec thocircng tin 4Sự thấu hiểu 5Yacute kiến 6 Quyết định

3 Caacutec loại tri thức Phổ biến mocirc tả dữ liệu thocircng tin thủ tục mọi thứ lagravem như thế nagraveo lập luận chiacutenh saacutech hoặc caacutec quy tắc

4 Thu thập Tri thức hệ chuyecircn gia Hầu hết caacutec phương phaacutep đều bắt đầu với mocirc higravenh của caacutec taacutec vụ trong đoacute

hệ chuyecircn gia được xacircy dựng Trong đoacute mocirc tả về caacutec lĩnh vực được tạo ra Caacutec kỹ sư sử dụng caacutec mocirc higravenh giả thuyết vagrave nhận thức về quaacute trigravenh phacircn

tiacutech để gợi ra caacutech giải quyết vấn đề về tri thức từ caacutec chuyecircn gia

5 Caacutec chiều của thu thập tri thức KE- driven caacutec kỹ sư trao đổi trực tiếp với caacutec chuyecircn gia Expert-driven Caacutec chuyecircn gia trực tiếp đưa chuyecircn mocircn của họ vagraveo hệ

thống maacutey tiacutenh Machine-driven Sử dụng caacutec cocircng cụ suy luận để triacutech xuất tri thức từ một

tập caacutec viacute dụ

6 Kỹ thuật thu thập tri thức Trao đổi gồm 2 loại cơ bản lagrave coacute cấu truacutec(coacute kịch bản) vagrave khocircng coacute cấu

truacutec( đối thoại trực tiếp) Giao thức phacircn tiacutech bằng lời Khi caacutec chuyecircn gia thực hiện một cocircng việc

của họ thigrave một bản ghi về cocircng việc đoacute được thực hiện Caacutec kỹ sư sẽ xacircy dựng mocirc higravenh cho những gigrave được ghi lại trong bản ghi

Phương phaacutep sagraveng lọc caacutec chuyecircn gia so saacutenh caacutec nhoacutem liecircn tiếp trong ba đối tượng vagrave cho biết tại sao nhoacutem thứ hai lại khaacutec nhoacutem thứ ba

7 Thu thập tri thức từ nhiều nguồn Thu thập tri thức từ nhiều nguồn lagrave cần thiết để coacute được đầy đủ caacutec tri thức

cho một vấn đề quan điểm yacute kiến traacutei ngược nhau thường phaacutet sinh Phương phaacutep đồng thuận sẽ giuacutep giải quyết được vấn đề macircu thuẫn Kỹ thuật phacircn tiacutech Meta lagrave kỹ thuật được aacutep dụng trong caacutec trường hợp

khaacutec Caacutech tiếp cận bằng định lượng đogravei hỏi caacutec kỹ sư cần cacircn nhắc yếu tố đầu vagraveo của caacutec chuyecircn gia khaacutec nhau

8 Xaacutec nhận hợp lệ vagrave kiểm tra tri thức Một khi thu thập tri thức noacute phải được đaacutenh giaacute về khả năng sử dụng vagrave độ

chiacutenh xaacutec Hai vấn đề cụ thể lagrave hiệu lực của những kiến thức vagrave kiểm tra việc xacircy dựng cơ sở của tri thức

Cần xaacutec nhận xem liệu hệ thống coacute thể hoạt động ở mức độ tối thiểu khocircng

Xaacutec minh liecircn quan đến việc so saacutenh từng chi tiết kỹ thuật của hệ thống những gigrave đatilde được thực hiện cuối cugraveng

9 Một số caacutec biện phaacutep xaacutec nhận Độ chiacutenh xaacutec Khả năng thiacutech nghi Mức độ đầy đủ Bề rộng Độ sacircu Hiệu lực Tổng quan Chiacutenh xaacutec Hiện thực Độ tin cậy Tiacutenh hữu dụng Mức độ

Chương 9 Học maacutey

1 Logic mờ vagrave ngocircn ngữ mờ(Fuzzy Logic and Linguistic Ambiguity)

Ngocircn ngữ tự nhiecircn gồm những khaacutei niệm mơ hồ vagrave khocircng chiacutenh xaacutectruyền tải ngữ nghĩa thocircng qua tiacutenh xấp xỉkhocircng rotilde ragraveng

Những xấp xỉ nagravey giuacutep con người coacute thể truyền tải hết được yacute nghĩa nhưng maacutey thigrave khocircng hiểu

Lagravem sao biểu diễn caacutec tri thức sử dụng caacutec khaacutei niệm khocircng rotilde ragraveng(mờ) hoặc khocircng chiacutenh xaacutec

2 Khaacutei niệm cơ bản của logic mờ tập mờ lagrave những tập hợp khocircng coacute một giới hạn rotilde Mỗi phần tử của noacute chỉ

chứa một mức độ hagravem liecircn thuộc của từng phần tử Vigrave vậy tập mờ khocircng giống như tập cổ điển Tập mờ coacute thể kết hợp với nhau qua những luật mờ magrave đặc trưng cho những hagravenh động trạng thaacutei vagrave thuộc tiacutenh của logic mờ được tận dụng khi thực hiện một bộ điều khiển mờ

Logic mờ dựa trecircn yacute tưởng mỗi phần tử thuộc vagraveo một tập hợp ở một mức độ nagraveo đấy

Locircgic mờ cho pheacutep độ liecircn thuộc (microA )coacute giaacute trị trong khoảng (01) Locircgic mờ coacute thể được coi lagrave mặt ứng dụng của lyacute thuyết tập mờ để xử lyacute caacutec

giaacute trị trong thế giới thực cho caacutec bagravei toaacuten phức tạp

3 So saacutenh tiacutenh đuacuteng đắn logic mờ vagrave xaacutec suất Xaacutec suất thigrave đề cập đến khả năng xảy ra một biến cố hay một điều gigrave đoacute Logic mờ đề cập đến cấp độ magrave đặc tiacutenh ở hiện tại

o viacute dụ1 người coacute chiều cao 6 feet thigrave coacute cấp độ lagrave 05 về chiều cao

4 Ưu điểm của logic mờ Caacutech tiếp cận rất tự nhiecircnkhocircng phức tạp Coacute thể mocirc higravenh hoacutea caacutec hagravem phi tuyến tugravey yacute phức tạp

Coacute thể tận dụng được kinh nghiệm từ những chuyecircn gia hagraveng đầu trong mọi lĩnh vực

Logic mờ được xacircy dựng dựa trecircn ngocircn ngữ tự nhiecircnNền tảng của logic mờ lagrave dựa trecircn cơ sở giao tiếp của con người

5 Nhược điểm của logic mờ Trong 1 hệ thống phức tạpsử dụng logic mờ coacute thể trở thagravenh trở ngại cho

việc xaacutec thực độ tin cậy của hệ thống Cơ chế lập luận mờ khocircng thể học hỏi từ những lỗi sai

6 Mạng noron nhacircn tạo(ANN) Mạng noron nhacircn tạo lagrave một mocirc phỏng xử lyacute thocircng tinđược nghiecircn cứu ra

từ hệ thống thần kinh của sinh vậtgiống như bộ natildeo để xử lyacute thocircng tin ANNs lagrave chương trigravenh dựa trecircn maacutey tiacutenh đơn giản coacute chức năng lagrave một mocirc

higravenh bagravei toaacuten khocircng gian dựa trecircn thử nghiệm vagrave baacuteo lỗi

7 Học từ kinh nghiệm Tiến trigravenh Một mẫu dữ liệu được biểu diễn như một mạng lưới noronANN ldquodự

đoaacutenrdquo 1 đầu radự đoaacuten được so saacutenh với giaacute trị thực tế hoặc giaacute trị chiacutenh xaacutecNếu đoaacuten được chiacutenh xaacutec thigrave khocircng coacute hagravenh động nagraveo được thực hiện

Nếu dự đoaacuten sai ANN kiểm tra lại vagrave xaacutec định lại thocircng số để điều chỉnh Một mẫu dữ liệu khaacutec được biểu diễn vagrave quaacute trigravenh nagravey được lặp lại

8 Nguyecircn tắc cơ bản của cocircng nghệ nơron Caacutec yếu tố xử lyacute cơ bản trong hệ thống thần kinh của con người lagrave tế bagraveo

thần kinhMạng lưới của tế bagraveo nagravey lagrave liecircn kết với nhau nhận được thocircng tin từ caacutec cảm biến trong mắt taihellip

Thocircng tin nhận được bởi tế bagraveo thần kinh hoặc lagrave sẽ kiacutech thiacutech noacute(sẽ được chuyển qua 1 thocircng điệp dọc theo mạng lưới) hoặc lagrave sẽ ngăn cản noacute(ngăn cản dograveng thocircng tin)

Độ nhạy coacute thể thay đổi qua thời gian hoặc sau khi coacute được kinh nghiệm

9 Cấu truacutec mạng Một ANN gồm 3 lớp cơ bản

Lớp đầu vagraveo nhận dữ liệu Lớp becircn trong hoặc lagrave lớp ẩn xử lyacute dữ liệu Lớp đầu ra chuyển tiếp kết quả cuối cugraveng của mạng

10Mạng nơ ron Thường coacute nhiều đầu vagraveo mỗi đầu vagraveo với mức ảnh hưởng vagrave tầm quan

trọng riecircng của noacute Một đầu vagraveo quan trọng coacute thể được sử dụng để khuếch đại đầu ra caacutec hagravem trạng thaacutei tổng hợp caacutec trọng số của caacutec yếu tố

đầuvagraveo khaacutec nhauvagraveo một giaacute trị duy nhất Caacutec hagravem chuyển giao xử lyacute caacutec giaacute trị trạng thaacutei vagrave tạo đầu ra

11Huấn luyện mạng nơ ron Trong mocirc higravenh coacute giaacutem saacutetANN được đến so saacutenh dự đoaacuten của chiacutenh

noacute với thocircng tin phản hồi coacute chứa caacutec kết quả mong muốn ANN sẽ phải tigravem caacutech thay đổi caacutec tham số becircn trong củamigravenh (caacutec trọng số vagrave caacutec ngưỡng) để tạo necircn một aacutenh xạ coacute khả năng aacutenh xạcaacutec đầu vagraveo thagravenh caacutec đầu ra mong muốn Sự thay đổi nagravey được tiến hagravenh nhờ việc so saacutenh giữa đầu ra thực sự vagrave đầu ra mong muốn

Trong mocirc higravenh khocircng coacute giaacutem saacutetANN nhận được dữ liệu vagraveo nhưng khocircng phải coacute bất kỳ thocircng tin phản hồi về kết quả mong muốn

Phần lớn caacutec ứng dụng nằm trong vugraveng của caacutec bagravei toaacuten ước lượng như mocirc higravenh hoacuteathống kecirc neacuten lọc phacircn cụm

12Lợi iacutech Liecircn kết với mạng noron Traacutenh caacutech lập trigravenh tường minh Giảm nhu cầu của chuyecircn gia ANNs thigrave thiacutech nghi với caacutec yếu tố đầu vagraveo thay đổi Khocircng cần thiết cho cơ sở tri thức tinh chế ANNs coacute tiacutenh động vagrave cải thiện với việc sử dụng Coacute khả năng xử lyacute dữ liệu khocircng chiacutenh xaacutec hoặc khocircng đầy đủ Cho pheacutep tổng quaacutet hoacutea từ thocircng tin cụ thể Cho pheacutep thu thập cảm giaacutec thocircng thường vagraveo miền giải quyết vấn đề

13Hạn chế của việc liecircn kết với mạng noron ANNs khocircng thể giải thiacutech được suy luận Bản chất hộp đen thường khiến cho vấn đề traacutech nhiệm vagrave độ tin cậy phaacutet

sinh lagrave khoacute khăn Lặp đi lặp lại quaacute trigravenh huấn luyện rất tốn thời gian Nguồn lực caacutec nhagrave phacircn tiacutech vagrave thiết kế coacute tay nghề cao vẫn lagrave đaacuteng lo

ngại Cocircng nghệ ANN thuacutec đẩy hạn chế của phần cứng hiện tại ANN yecircu cầu phải coacute sự tin tưởng ở đầu ra

14Giới thiệu về thuật toaacuten di truyền Cũng như mạng lưới thần kinh caacutec thuật toaacuten di truyền được dựa trecircn lyacute

thuyết sinh học Thuật toaacuten di truyền tigravem thấy nguồn gốc của chuacuteng trong caacutec lyacute thuyết

tiến hoacutea của chọn lọc tự nhiecircn vagrave thiacutech ứng với biến đổi khiacute hậu Kết quả thuật toaacuten di truyền lagrave từ giao phối 2 caacute thể trong quần thế để tạo

ra con caacutei đocirci khi tốt hơn so với bậc cha mẹ của chuacuteng 15Caacutec thagravenh phần cơ bản của thuật toaacuten di truyền

Toaacuten tử chọn lọc Caacutec caacute thể tốt được chọn lọc để đưa vagraveo thế hệ sau Sự chọn lọc nagravey căn cứ vagraveo độ thiacutech nghi với mocirci trường của mỗi caacute thể

Toaacuten tử lai gheacutep (crossover) Hai caacute thể cha vagrave mẹ trao đổi caacutec gen với nhau để tạo ra caacute thể con

Toaacuten tử đột biến (mutation) Một caacute thể thay đổi một số gen để biến đổi thagravenh một caacute thể mớiTất cả caacutec toaacuten tử trecircn khi thực hiện đều mang tiacutenh ngẫu nhiecircn

16Quaacute trigravenh cơ bản của một thuật toaacuten di truyền Khởi tạo

Đaacutenh giaacute quần thể

Lựa chọn NST thiacutech hợp nhất vagrave loại bỏ NST yếu nhất

Quy trigravenh giao nhau vagrave cải thiện quần thể

đột biến tiến trigravenh để khaacutem phaacute ra NST mới

17Ưu nhược điểm của việc kết hợp với thuật toaacuten di truyền Kiacutech thước quần thể lagrave 1 yếu tố quan trọng trong tốc độ của việc tigravem

kiếmnhưng noacute tương đối dễ dagraveng để dự đoaacuten tốc độ nagravey Giao nhau hoặc đột biến lagrave khocircng necircn đc sử dụng quaacute thường xuyecircn Luocircn coacute được iacutet nhất 1 giải phaacutep hợp lyacute Necircn coacute thể aacutep dụng chuacuteng cho caacutec vấn đề magrave chuacuteng ta khocircng coacute hướng

về caacutech giải quyết Sức mạnh của thuật toaacuten xuất phaacutet từ khaacutei niệm đơn giảnkhocircng phải từ

một thủ tục thuật toaacuten phức tạp 18Tương lai của học maacutey

Mạng lưới thần kinh nhacircn tạo vượt quaacute năng lực của con người trong caacutec trường hợp bị cocirc lập

Về mặt lyacute thuyếtmột maacutey tiacutenh coacute thể xử lyacute dũ liệu nhanh hơn hagraveng triệu lần so với 1 con người

May mắn thay cho chuacuteng tacon người tốt hơn nhiều khi magrave coacute được dữ liệumaacutey tiacutenh khocircng coacute 1 số thứ như lagrave 5 giaacutec quan

CHƯƠNG 10 KHO DỮ LIỆU

1 Kho dữ liệu Kho dữ liệu lagrave tuyển tập caacutec cơ sở dữ liệu tiacutech hợp hướng chủ đề được

thiết kế để trợ giuacutep cho một hệ hỗ trợ quyết định

Theo John Ladley Cocircng nghệ kho dữ liệu lagrave tập caacutec phương phaacutep kỹ thuật vagrave caacutec cocircng cụ coacute thể kết hợp hỗ trợ nhau để cung cấp thocircng tin cho người sử dụng trecircn cơ sở tiacutech hợp từ nhiều nguồn dữ liệu nhiều mocirci trường khaacutec nhau

Kho dữ liệu thường rất lớn tới hagraveng trăm GB hay thậm chiacute hagraveng Terabyte

2 Kho dữ liệu vận hagravenh (ODS) Một kho dữ liệu vận hagravenh Aacutep dụng kỹ thuật kho dữ liệu vagraveo caacutec hệ xử

lyacute giao taacutec lưu trữ dữ liệu cho một ứng dụng đặc thugrave Noacute đưa vagraveo kho dữ liệu một dograveng caacutec dữ liệu thocirc được thiết kế

3 So saacutenh

Kho dữ liệu vận hagravenh Kho dữ liệu

Dữ liệu theo chủ đề Dữ liệu theo chủ đề

Dữ liệu tiacutech hợp Dữ liệu tiacutech hợp

Dữ liệu thay đổi Dữ liệu khocircng thay đổi

Dữ liệu được cập nhật khi thay đổi

Dữ liệu giữ nguyecircn

Chỉ coacute dữ liệu hiện tạiDữliệu hiện tại vagrave dữ liệu lịch sử

Chu kỳ lagravem tươi dữ liệu ngắn Chu kỳ lagravem tươi dữ liệu dagravei

Chỉ coacute dữ liệu chi tiết Dữ liệu chi tiết vagrave dữ liệu tổng kết

Dugraveng cho caacutec quyết định ngắn hạn

Dugraveng cho hoạch định dagravei hạn

4 Kho dữ liệu cục bộ (Data Mart - DM)

Kho dữ liệu cục bộ lagrave CSDL coacute những đặc điểm giống với kho dữ liệu nhưng với quy mocirc nhỏ hơn vagrave lưu trữ dữ liệu về một lĩnh vực một chuyecircn ngagravenh

Data mart phụ thuộc Chứa những dữ liệu được lấy từ DW vagrave những dữ liệu nagravey sẽ được triacutech lọc vagrave tinh chế tiacutech hợp lại ở mức cao hơn để phục vụ một chủ đề nhất định của Datamart

Data mart độc lập Khocircng giống như Datamart phụ thuộc Data mart độc lập được xacircy dựng trước DW vagrave dữ liệu được trực tiếp lấy từ caacutec nguồn khaacutec nhau

5 Siecircu dữ liệu Metadata lagrave dữ liệu để mocirc tả dữ liệu Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột

một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi Metadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu

6 Mocirci trường kho dữ liệu Hệ thống của tổ chức vagrave kho cung cấp dữ liệu để xacircy dựng kho dữ liệu Trong quaacute trigravenh chuyển dữ liệu từ caacutec nguồn khaacutec nhau dữ liệu coacute thể

được lagravem sạch hoặc chuyển đổi vagrave vigrave thế DW được xem như lagrave một chuẩn cho việc lưu trữ

Đồng thời siecircu dữ liệu được ghi lại Cuối cugraveng DW hoặc siecircu thị coacute thể được sử dụng để tạo ra một kho dữ

liệu ldquocaacute nhacircnrdquo 7 Caacutec đặc điểm của kho dữ liệu

Đặc điểm Mocirc tả

Hướng chủ đề - DL tổ chức theo caacutech thức người dugraveng tham chiếu

Tiacutech hợp - Dữ liệu ldquosạchrdquo loại bỏ tiacutenh thiếu nhất quaacuten

Khocircng thay đổi - DL ldquochỉ đọcrdquo người dugraveng khocircng thay đổi được

Chuỗi thời gian - DL lagrave chuỗi thời gian khocircng phải lagrave trạng thaacutei hiện tại

Được tổng kết - DL vận hagravenhthao taacutec khi cần thiết

được kết hợp lại thagravenh dạng coacute thể dugraveng được cho quyết định

Kiacutech cỡ lớn hơn - Lưu giữ theo chuỗi thời gian tức lagrave giữ lại nhiều DL

Khocircng được chuẩn hoacutea - Coacute thể dư thừa DLSiecircu dữ liệu - Dữ liệu của dữ liệu được lưu trữNguồn dữ liệu - DL vận hagravenh (caacutec hệ sẵn coacute) cugraveng

với caacutec nguồn ngoagravei 8 Kho dữ liệu hướng chủ đề

Hướng chủ để coacute nghĩa lagrave kho dữ liệu được tổ chức xung quanh caacutec chủ đề chiacutenh như khaacutech hagraveng sản phẩm sản xuất Tập trung vagraveo việc mocirc higravenh hoacutea vagrave phacircn tiacutech dữ liệu cho caacutec nhagrave ra quyết định magrave khocircng tập trung vagraveo caacutec xử lyacute thocircng thường Cung cấp cho người dugraveng một khung nhigraven toagraven vẹn đơn giản vagrave đầy đủ về caacutec sự kiện quanh caacutec chủ đề

9 Dữ liệu trong DW được tiacutech hợp Dữ liệu trong kho dữ liệu được xacircy dựng bằng caacutech tổng hợp dữ liệu từ

nhiều nguồn khaacutec nhau vagrave caacutec nguồn coacute tổ chức khaacutec nhau Cơ sở dữ liệu caacutec file excel caacutec flat file hoặc caacutec raw file Khi đưa vagraveo kho dữ liệu caacutec dữ liệu được lagravem sạch vagrave tiacutech hợp dữ liệu nhằm đảm bảo tiacutenh nhất quaacuten của dữ liệu

10Kiến truacutec kho dữ liệu Tầng cơ sở dữ liệu hoạt động Tầng truy xuất thocircng tin Tầng truy xuất dữ liệu Tầng siecircu dữ liệu Tầng quản lyacute tiến trigravenh Tầng thocircng điệp của ứng dụng Tầng vật liacute của kho dữ liệu Tầng trigravenh diễn dữ liệu

11Higravenh trạng kho dữ liệu Kho dữ liệu ảo - người dugraveng cuối coacute thể truy cập trực tiếp đến kho dữ liệu

sử dụng caacutec cocircng cụ cho pheacutep ở tầng truy xuất dữ liệu Kho dữ liệu trung tacircm-1 cơ sở dữ liệu vật lyacute chứa tất cả dữ liệu cho một

vugraveng chuyecircn dụng nagraveo đoacute

Kho dữ liệu phacircn taacuten- Thagravenh phần được phacircn taacuten qua nhiều hệ cơ sở dữ liệu vật lyacute

12METADATA- Siecircu dữ liệu Định nghĩa Siecircu dữ liệu lagrave dữ liệu về dữ liệu Lagrave 1 lưu trữ dugraveng để

Miecircu tả kho dữ liệu tổng thể Nhận dạng kiểu kho dữ liệu Quản liacute quaacute trigravenh tiacutech hợp dữ liệu Quản liacute quaacute trigravenh cập nhật kho dữ liệu Quản liacute bảo mật

Lagrave chigravea khoacutea quyết định sự thagravenh cocircng của kho dữ liệu luocircn được thay đổi vagrave cập nhật theo sự phaacutet triển của kho dữ liệu

Dugraveng để quản liacute điều khiển kho dữ liệu Sự ra đời của kho dữ liệu như 1 cấu truacutec hỗ trợ ra quyết định siecircu dữ liệu

được xem như nguồn tagravei nguyecircn dữ liệu Siecircu dữ liệu lagrave trừu tượng Chuacuteng lagrave dữ liệu bậc cao cung cấp mocirc tả ngắn

gọn caacutec dữ liệu bậc thấp hơn 13Hoạt động của Siecircu dữ liệu

Siecircu dữ liệu rất cần thiết trong việc chuyển hoacutea thocircng tin trở thagravenh tri thức Lagrave chigravea khoacutea giuacutep chuacuteng ta xử lyacute được dữ liệu thocirc Viacute dụ một dograveng dữ liệu baacuten hagraveng 1023 K596 11121 agraveNoacute sẽ khocircng coacute nghĩa gigrave cho đến khi chuacuteng ta đưa vagraveo siecircu dữ liệu (thư

mục chứa dữ liệu) agrave cửa hagraveng 1023 sản phẩm K596 vagrave số tiền baacuten được lagrave 11121 đocirc la

14Sự cần thiết phải nhất quaacuten trong kho dữ liệu Kho dữ liệu được xacircy dựng cho lợi iacutech của những nhagrave phacircn tiacutech kinh

doanh caacutec nhagrave quản trị cho tất cả caacutec khu vực chức năng Trong cơ sở dữ liệu riecircng caacutec khu vực khaacutec nhau coacute thể định nghĩa vagrave lưu

trữ dữ liệu thocircng qua phiecircn bản của chiacutenh noacute Khi dữ liệu được lấy từ những vugraveng khaacutec nhau đoacute vagrave được đặt vagraveo kho dữ

liệu Việc chuyển đổi vagrave lagravem sạch caacutec tiến trigravenh sẽ đảm bảo noacute lagrave duy nhất được tiacutech hợp tại một mức của tổ chức

15Ragrave soaacutet lại dữ liệu ndash Thực thi siecircu dữ liệu

Bất kể cấu truacutec tự nhiecircn của 1 cacircu truy vấn thế nagraveo thigrave caacutec thagravenh phần của siecircu dữ liệu rất quan trọng đối với người ra quyết định

Bảng thuộc tiacutenh khoacutea được lưu trữ bởi kho dữ liệu Tập hợp dữ liệu được lấy từ đacircu Những chuyển đổi nagraveo được thực thi với việc lagravem sạch

16Siecircu dữ liệu lagrave gigrave Metadata - lagrave thocircng tin mocirc tả nội dung của cơ sở dữ liệu (CSDL) Metadata baacuteo cho người dugraveng biết thời gian cập nhật sau cugraveng của dữ liệu

định dạng vagrave mục điacutech sử dụng của noacute Những thocircng tin nagravey coacute thể hướng dẫn người dugraveng duyệt qua CSDL vagrave

giuacutep họ hiểu được yacute nghĩa vagrave ngữ cảnh của dữ liệu Trong CSDL metadata lagrave caacutec dạng biểu diễn khaacutec nhau của caacutec đối tượng

trong CSDL Trong CSDL quan hệ metadata lagrave caacutec định nghĩa của bảng cột CSDL

view vagrave nhiều đối tượng khaacutec Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột

một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi -gtMetadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu

Bảng chuyển đổi Ghi lại những chuyển đổi đatilde được thực hiện

Lịch sử thực thi Ghi lại những dữ liệu đatilde được

phacircn tiacutech

Higravenh thaacutei kết nốiGhi lại những dữ liệu được kết nối vagrave tần suất

17Aacutenh xạ thocircng thường của siecircu dữ liệu Bản ghi aacutenh xạ chuyển đổi bao gồm

Định danh của nguồn gốc Chuyển đổi thuộc tiacutenh Chuyển đổi thuộc tiacutenh vật lyacute Matilde hoacutea tham chiếu bảng chuyển đổi Đổi tecircn Đổi khoacutea Gaacuten giaacute trị cho thuộc tiacutenh mặc định Chọn logic cho caacutec nguồn nhiều giaacute trị Đổi thuật toaacuten

18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để

phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai

lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave

tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec

Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm

Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo

19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua

caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau

SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được

Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra

một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức

Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ

Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ

Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech

CHƯƠNG 11 KHAI PHAacute DỮ LIỆU

1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn

ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993

Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng

2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd

1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều

2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP

3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn

4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng

5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server

6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo

7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động

8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời

9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều

10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện

11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech

12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP

3 Xử lyacute phacircn tiacutech trực tuyến OLAP

MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave

dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu

ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave

thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu

HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave

ROLAP4 Khai phaacute dữ liệu

Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh

khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn

Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan

5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp

6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại

Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp

Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec

Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt

Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra

Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh

vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho

Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec

Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm

Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục

Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng

gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp

Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn

Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec

Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper

Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2

Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25

Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước

Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng

Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện

trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp

Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute

độ hỗ trợ ge ngưỡng minsup

độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan

Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn

Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết

Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu

MOLAP ROLAP HOLAP

Lưu trữ dữ liệu cơ sở

Khối Bảng quan hệ Bảng quan hệ

Lưu trữ thocircng tin tổng hợp

Khối Bảng quan hệ Khối

Hiệu suất thực hiện truy vấn

Nhanh nhất Chậm nhất Nhanh

Tiecircu thụ khocircng gian lưu trữ

Nhiều Thấp Trung bigravenh

Chi phiacute bảo trigrave Cao Thấp Trung bigravenh

Page 43: De cuong(1-11)

R2 Nếu coacute B thigrave suy ra coacute C

R3 Nếu coacute C vagrave D thigrave suy ra coacute E

Nếu ta coacute A vagrave B thigrave chuacuteng ta suy ra được D từ R1 vagrave suy ra C từ R2 Với D vagrave C đatilde được suy ra ở trecircn giờ chuacuteng ta suy ra được E từ R3

Viacute dụ thực tế

Giả sử muốn biết magraveu của một con vật nuocirci tecircn lagrave Fred biết rằng noacute kecircu ộp ộp vagrave ăn ruồi

Coacute tập 4 luật ban đầu như sau

R1 Nếu X kecircu ộp ộp vagrave ăn ruồi thigrave X lagrave con ếch

R2 Nếu X kecircu chiecircm chiếp vagrave biết hoacutet thigrave X lagrave con chim

R3 Nếu X lagrave con ếch thigrave X coacute magraveu xanh

R4 Nếu X lagrave con chim thigrave X coacute magraveu vagraveng

74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia

Expert system shells lagrave một tập caacutec goacutei phần mềm vagrave caacutec cocircng cụ dugraveng để phaacutet triển caacutec hệ chuyecircn gia

Những Expert system shells đầu tiecircn thường rất rườm ragrave Mặc dugrave vậy noacute vẫn giuacutep cho người sử dụng sẽ khocircng phải bắt đầu lại từ đầu khi xacircy dựng một hệ chuyecircn gia mới

Những shell hiện đại bao gồm hai mocirc-đun chiacutenh lagrave cocircng cụ xacircy dựng một tập quy tắc vagrave mocirc tơ suy diễn

Xacircy dựng hệ chuyecircn gia

Bước 1 xacircy dựng mocirc higravenh bagravei toaacuten xaacutec định vấn đề nhiệm vụ magrave hệ thống sẽ thực hiện Caacutec dạng bagravei toaacuten cần hệ chuyecircn gia

Bagravei toaacuten diễn giải (InterPretation)

Bagravei toaacuten dự baacuteo (Prediction)

Bagravei toaacuten chuẩn đoaacuten (Diagnose)

Bagravei toaacuten gỡ rối (Debugging)

Bagravei toaacuten thiết kế

Tương tự như một dự aacuten phần mềm để xacircy dựng một hệ chuyecircn gia cần phải coacute caacutec yếu tố về nhacircn lực tagravei nguyecircn vagrave thời gian Những yếu tố nagravey ảnh hưởng đến giaacute thah của một hệ chuyecircn giaTrong phần nagravey cacircu hỏi thường được đặt ra lagrave tại sao cần phải xacircy dựng một hệ chuyecircn giaTrước khi bắt đầu phải xaacute định rotilde bagravei toaacuten đạt ra lagrave jiAi lagrave chuyecircn giaAi lagrave người sử dụng

1 Diễn giải (InterPretation) Nghiecircn cứu 1 vấn đề -gt Dựa trecircn những biểu hiện thuộc tiacutenh đặc trưng becircn ngoagravei -gt Tư vấn

(hoặc đưa ra kết luận hay mocirc tả dễ hiểu từ tập dữ liệu thocirc)

2 Bagravei toaacuten dự baacuteo (Prediction) Coacute thể dự đoaacuten được hagravenh vi kết quả dựa trecircn caacutec hiện tượng -gt dự baacuteo

VD Dự baacuteo thời tiết động đấthellip

3 Bagravei toaacuten chẩn đoaacuten (Diagnoss) Xaacutec định caacutec lỗi caacutec bộ phận hỏng hoacutec của hệ thống dựa trecircn caacutec dữ liệu quan saacutet được

4 Bagravei toaacuten gỡ rối (Debugging) Mocirc tả caacutec phương phaacutep khắc phục hệ thống khi gặp sự cố

5 Bagravei toaacuten thiết kế Lựa chọn cấu higravenh caacutec đối tượng nhằm thoả matilden một số ragraveng buộc nagraveo đoacute

6 Giảng dạy Phần mềm dạy học coacute thể chuẩn đoaacuten vagrave sủa lỗi của học sinh trong quaacute trigravenh học tập

Để xaacutec định đuacuteng bagravei toaacuten magrave chuacuteng ta cần giải quyết thigrave phải trả lời đc một số cacircu hỏi

- cần hệ chuyecircn gia

Bước 2 thu thập tri thức lựa chọn cocircng cụ vagrave aacutep dụng

Trong bước thu thập tri thức vấn đề quan trọng lagrave lựa chọn chuyecircn gia những người magrave sẽ đoacuteng goacutep tri thức cho hệ thống Thocircng thường trong suốt quaacute trigravenh phaacutet triển thigrave chuyecircn gia được xem như một thagravenh viecircn của đội phaacutet triển

Hiện nay coacute rất nhiều cocircng cụ để xacircy dựng một hệ chuyecircn gia Phổ biến nhất lagrave JESS CLIPS vagrave OPS5

Bước 3 Thiết kế cơ sở tri thức thiết kế hệ thốngTri thức được biểu diễn trường minh trong cơ sở tri thức

Caacutec chuyecircn gia vagrave kỹ sư tri thức sẽ đối thoại với nhau bằng caacutec kỹ thuật đối thoại Suy diễn (SD) bảng Mocirc higravenh hoacutea SD quy nạp phacircn loại

Vấn đề bagraveo trigrave vagrave phaacutet triển

Caacutec hệ chuyecircn gia đogravei hỏi phải bảo trigrave vagrave phaacutet triển nhiều hơn so với caacutec hệ thống khaacutec Phải thường xuyecircn bổ sung tri thức mới vagrave thay đổi caacutec tri thức cũ để đổi mới hệ chuyecircn gia

Thu thập vagrave khắc phục lỗi do người sử dụng phaacutet hiện để kịp thời khắc phục những sai soacutet của hệ chuyecircn gia

75 Lợi iacutech vagrave hạn chế của caacutec hệ chuyecircn gia

Một số lợi iacutech chiacutenh

Thời gian trả lời hợp lyacute bằng hoặc nhanh hơn so với chuyecircn gia (người) để đi đến cugraveng một quyết định Hệ chuyecircn gia lagrave một hệ thống thời gian thực (real time system)

Khả năng trả lời với mức độ tinh thocircng bằng hoặc cao hơn so với chuyecircn gia (người) trong cugraveng lĩnh vực

Hệ chuyecircn gia giuacutep cho hiệu quả lagravem việc tăng bằng việc sử dụng tập caacutec luật một caacutech nhanh choacuteng magrave ko bị nhầm lẫn chuyecircn gia lagrave người coacute thể quecircn đi một số tri thức cơ sở lyacute luậ nhưng HCG thigrave ko

Quyết định của một người chuyecircn gia coacute thể bị thay đổi vagrave ko coacute tiacutenh thống nhất như quyết định của một hệ chuyecircn gia tạo ra

Hệ chuyecircn gia giuacutep cho người sử dụng coacute thể trau dồi sự hiểu biết trecircn lĩnh vuej cụ thể magrave noacute giải quyết hỗ trợ người ra quyết định coacute trigravenh độ như 1 chuyecircn gia trong quaacute trigravenh gia quyết định

Kiến thức của rất nhiều chuyecircn gia về một lĩnh vực nagraveo đoacute được đưa vagraveo hệ chuyecircn gia lagravem cho CSTT cuat HCG phong phuacute vagrave rộng lớn hơn rất nhiều

HCG giải thiacutech caacutec bước suy luận một caacutech dễ hiểu nhất quaacuten luacutec nagraveo cũng coacute thể sử dụng ko như chuyecircn gia con người

Hạn chế của caacutec hệ chuyecircn gia

Nhược điểm lớn nhất của hệ chuyecircn gia lagrave những yacute kiến chuyecircn mocircn thường rất khoacute matilde hoacutea vagrave giải neacuten

Hệ chuyecircn gia khocircng coacute khả năng tự học tự cập nhật kiến thức mới như caacutec chuyecircn gia magrave cần phải được matilde hoacutea lại khi noacute được cập nhật

Hệ chuyecircn gia khocircng thể nhận ra được vấn đề khocircng nằm trong miền kiến thức của hệ thống

Chương 8 Tri thức vagrave tiếp nhận

1 Bao gồm caacutec vấn đề

Dữ liệu thực tế đo lường hoặc quan saacutet coacute hoặc khocircng coacute bối cảnh

Thocircng tin dữ liệu được tổng hợp một caacutech hữu iacutech để giải quyết những khoacute khăn trong việc đưa ra quyết định

Tri thức bao gồm caacutec ứng dụng quy tắc thocircng tin hướng dẫn của người ra quyết định

2 Những caacutei nhigraven về tri thức

Đại diện lagravem thế nagraveo để diễn tả tri thức viacute dụ như một quyển saacutech khocircng phải lagrave tri thức nhưng noacute lại lagrave một đại diện của tri thức

Sản xuất tri thức lagrave một tập hơp của hagraveng tồn kho coacute thể được sản xuất cũng như mua lại

Tri thức lagrave 1 trong 6 trạng thaacutei của hệ thống

1Dữ liệu 2Thocircng tin 3Cấu truacutec thocircng tin 4Sự thấu hiểu 5Yacute kiến 6 Quyết định

3 Caacutec loại tri thức Phổ biến mocirc tả dữ liệu thocircng tin thủ tục mọi thứ lagravem như thế nagraveo lập luận chiacutenh saacutech hoặc caacutec quy tắc

4 Thu thập Tri thức hệ chuyecircn gia Hầu hết caacutec phương phaacutep đều bắt đầu với mocirc higravenh của caacutec taacutec vụ trong đoacute

hệ chuyecircn gia được xacircy dựng Trong đoacute mocirc tả về caacutec lĩnh vực được tạo ra Caacutec kỹ sư sử dụng caacutec mocirc higravenh giả thuyết vagrave nhận thức về quaacute trigravenh phacircn

tiacutech để gợi ra caacutech giải quyết vấn đề về tri thức từ caacutec chuyecircn gia

5 Caacutec chiều của thu thập tri thức KE- driven caacutec kỹ sư trao đổi trực tiếp với caacutec chuyecircn gia Expert-driven Caacutec chuyecircn gia trực tiếp đưa chuyecircn mocircn của họ vagraveo hệ

thống maacutey tiacutenh Machine-driven Sử dụng caacutec cocircng cụ suy luận để triacutech xuất tri thức từ một

tập caacutec viacute dụ

6 Kỹ thuật thu thập tri thức Trao đổi gồm 2 loại cơ bản lagrave coacute cấu truacutec(coacute kịch bản) vagrave khocircng coacute cấu

truacutec( đối thoại trực tiếp) Giao thức phacircn tiacutech bằng lời Khi caacutec chuyecircn gia thực hiện một cocircng việc

của họ thigrave một bản ghi về cocircng việc đoacute được thực hiện Caacutec kỹ sư sẽ xacircy dựng mocirc higravenh cho những gigrave được ghi lại trong bản ghi

Phương phaacutep sagraveng lọc caacutec chuyecircn gia so saacutenh caacutec nhoacutem liecircn tiếp trong ba đối tượng vagrave cho biết tại sao nhoacutem thứ hai lại khaacutec nhoacutem thứ ba

7 Thu thập tri thức từ nhiều nguồn Thu thập tri thức từ nhiều nguồn lagrave cần thiết để coacute được đầy đủ caacutec tri thức

cho một vấn đề quan điểm yacute kiến traacutei ngược nhau thường phaacutet sinh Phương phaacutep đồng thuận sẽ giuacutep giải quyết được vấn đề macircu thuẫn Kỹ thuật phacircn tiacutech Meta lagrave kỹ thuật được aacutep dụng trong caacutec trường hợp

khaacutec Caacutech tiếp cận bằng định lượng đogravei hỏi caacutec kỹ sư cần cacircn nhắc yếu tố đầu vagraveo của caacutec chuyecircn gia khaacutec nhau

8 Xaacutec nhận hợp lệ vagrave kiểm tra tri thức Một khi thu thập tri thức noacute phải được đaacutenh giaacute về khả năng sử dụng vagrave độ

chiacutenh xaacutec Hai vấn đề cụ thể lagrave hiệu lực của những kiến thức vagrave kiểm tra việc xacircy dựng cơ sở của tri thức

Cần xaacutec nhận xem liệu hệ thống coacute thể hoạt động ở mức độ tối thiểu khocircng

Xaacutec minh liecircn quan đến việc so saacutenh từng chi tiết kỹ thuật của hệ thống những gigrave đatilde được thực hiện cuối cugraveng

9 Một số caacutec biện phaacutep xaacutec nhận Độ chiacutenh xaacutec Khả năng thiacutech nghi Mức độ đầy đủ Bề rộng Độ sacircu Hiệu lực Tổng quan Chiacutenh xaacutec Hiện thực Độ tin cậy Tiacutenh hữu dụng Mức độ

Chương 9 Học maacutey

1 Logic mờ vagrave ngocircn ngữ mờ(Fuzzy Logic and Linguistic Ambiguity)

Ngocircn ngữ tự nhiecircn gồm những khaacutei niệm mơ hồ vagrave khocircng chiacutenh xaacutectruyền tải ngữ nghĩa thocircng qua tiacutenh xấp xỉkhocircng rotilde ragraveng

Những xấp xỉ nagravey giuacutep con người coacute thể truyền tải hết được yacute nghĩa nhưng maacutey thigrave khocircng hiểu

Lagravem sao biểu diễn caacutec tri thức sử dụng caacutec khaacutei niệm khocircng rotilde ragraveng(mờ) hoặc khocircng chiacutenh xaacutec

2 Khaacutei niệm cơ bản của logic mờ tập mờ lagrave những tập hợp khocircng coacute một giới hạn rotilde Mỗi phần tử của noacute chỉ

chứa một mức độ hagravem liecircn thuộc của từng phần tử Vigrave vậy tập mờ khocircng giống như tập cổ điển Tập mờ coacute thể kết hợp với nhau qua những luật mờ magrave đặc trưng cho những hagravenh động trạng thaacutei vagrave thuộc tiacutenh của logic mờ được tận dụng khi thực hiện một bộ điều khiển mờ

Logic mờ dựa trecircn yacute tưởng mỗi phần tử thuộc vagraveo một tập hợp ở một mức độ nagraveo đấy

Locircgic mờ cho pheacutep độ liecircn thuộc (microA )coacute giaacute trị trong khoảng (01) Locircgic mờ coacute thể được coi lagrave mặt ứng dụng của lyacute thuyết tập mờ để xử lyacute caacutec

giaacute trị trong thế giới thực cho caacutec bagravei toaacuten phức tạp

3 So saacutenh tiacutenh đuacuteng đắn logic mờ vagrave xaacutec suất Xaacutec suất thigrave đề cập đến khả năng xảy ra một biến cố hay một điều gigrave đoacute Logic mờ đề cập đến cấp độ magrave đặc tiacutenh ở hiện tại

o viacute dụ1 người coacute chiều cao 6 feet thigrave coacute cấp độ lagrave 05 về chiều cao

4 Ưu điểm của logic mờ Caacutech tiếp cận rất tự nhiecircnkhocircng phức tạp Coacute thể mocirc higravenh hoacutea caacutec hagravem phi tuyến tugravey yacute phức tạp

Coacute thể tận dụng được kinh nghiệm từ những chuyecircn gia hagraveng đầu trong mọi lĩnh vực

Logic mờ được xacircy dựng dựa trecircn ngocircn ngữ tự nhiecircnNền tảng của logic mờ lagrave dựa trecircn cơ sở giao tiếp của con người

5 Nhược điểm của logic mờ Trong 1 hệ thống phức tạpsử dụng logic mờ coacute thể trở thagravenh trở ngại cho

việc xaacutec thực độ tin cậy của hệ thống Cơ chế lập luận mờ khocircng thể học hỏi từ những lỗi sai

6 Mạng noron nhacircn tạo(ANN) Mạng noron nhacircn tạo lagrave một mocirc phỏng xử lyacute thocircng tinđược nghiecircn cứu ra

từ hệ thống thần kinh của sinh vậtgiống như bộ natildeo để xử lyacute thocircng tin ANNs lagrave chương trigravenh dựa trecircn maacutey tiacutenh đơn giản coacute chức năng lagrave một mocirc

higravenh bagravei toaacuten khocircng gian dựa trecircn thử nghiệm vagrave baacuteo lỗi

7 Học từ kinh nghiệm Tiến trigravenh Một mẫu dữ liệu được biểu diễn như một mạng lưới noronANN ldquodự

đoaacutenrdquo 1 đầu radự đoaacuten được so saacutenh với giaacute trị thực tế hoặc giaacute trị chiacutenh xaacutecNếu đoaacuten được chiacutenh xaacutec thigrave khocircng coacute hagravenh động nagraveo được thực hiện

Nếu dự đoaacuten sai ANN kiểm tra lại vagrave xaacutec định lại thocircng số để điều chỉnh Một mẫu dữ liệu khaacutec được biểu diễn vagrave quaacute trigravenh nagravey được lặp lại

8 Nguyecircn tắc cơ bản của cocircng nghệ nơron Caacutec yếu tố xử lyacute cơ bản trong hệ thống thần kinh của con người lagrave tế bagraveo

thần kinhMạng lưới của tế bagraveo nagravey lagrave liecircn kết với nhau nhận được thocircng tin từ caacutec cảm biến trong mắt taihellip

Thocircng tin nhận được bởi tế bagraveo thần kinh hoặc lagrave sẽ kiacutech thiacutech noacute(sẽ được chuyển qua 1 thocircng điệp dọc theo mạng lưới) hoặc lagrave sẽ ngăn cản noacute(ngăn cản dograveng thocircng tin)

Độ nhạy coacute thể thay đổi qua thời gian hoặc sau khi coacute được kinh nghiệm

9 Cấu truacutec mạng Một ANN gồm 3 lớp cơ bản

Lớp đầu vagraveo nhận dữ liệu Lớp becircn trong hoặc lagrave lớp ẩn xử lyacute dữ liệu Lớp đầu ra chuyển tiếp kết quả cuối cugraveng của mạng

10Mạng nơ ron Thường coacute nhiều đầu vagraveo mỗi đầu vagraveo với mức ảnh hưởng vagrave tầm quan

trọng riecircng của noacute Một đầu vagraveo quan trọng coacute thể được sử dụng để khuếch đại đầu ra caacutec hagravem trạng thaacutei tổng hợp caacutec trọng số của caacutec yếu tố

đầuvagraveo khaacutec nhauvagraveo một giaacute trị duy nhất Caacutec hagravem chuyển giao xử lyacute caacutec giaacute trị trạng thaacutei vagrave tạo đầu ra

11Huấn luyện mạng nơ ron Trong mocirc higravenh coacute giaacutem saacutetANN được đến so saacutenh dự đoaacuten của chiacutenh

noacute với thocircng tin phản hồi coacute chứa caacutec kết quả mong muốn ANN sẽ phải tigravem caacutech thay đổi caacutec tham số becircn trong củamigravenh (caacutec trọng số vagrave caacutec ngưỡng) để tạo necircn một aacutenh xạ coacute khả năng aacutenh xạcaacutec đầu vagraveo thagravenh caacutec đầu ra mong muốn Sự thay đổi nagravey được tiến hagravenh nhờ việc so saacutenh giữa đầu ra thực sự vagrave đầu ra mong muốn

Trong mocirc higravenh khocircng coacute giaacutem saacutetANN nhận được dữ liệu vagraveo nhưng khocircng phải coacute bất kỳ thocircng tin phản hồi về kết quả mong muốn

Phần lớn caacutec ứng dụng nằm trong vugraveng của caacutec bagravei toaacuten ước lượng như mocirc higravenh hoacuteathống kecirc neacuten lọc phacircn cụm

12Lợi iacutech Liecircn kết với mạng noron Traacutenh caacutech lập trigravenh tường minh Giảm nhu cầu của chuyecircn gia ANNs thigrave thiacutech nghi với caacutec yếu tố đầu vagraveo thay đổi Khocircng cần thiết cho cơ sở tri thức tinh chế ANNs coacute tiacutenh động vagrave cải thiện với việc sử dụng Coacute khả năng xử lyacute dữ liệu khocircng chiacutenh xaacutec hoặc khocircng đầy đủ Cho pheacutep tổng quaacutet hoacutea từ thocircng tin cụ thể Cho pheacutep thu thập cảm giaacutec thocircng thường vagraveo miền giải quyết vấn đề

13Hạn chế của việc liecircn kết với mạng noron ANNs khocircng thể giải thiacutech được suy luận Bản chất hộp đen thường khiến cho vấn đề traacutech nhiệm vagrave độ tin cậy phaacutet

sinh lagrave khoacute khăn Lặp đi lặp lại quaacute trigravenh huấn luyện rất tốn thời gian Nguồn lực caacutec nhagrave phacircn tiacutech vagrave thiết kế coacute tay nghề cao vẫn lagrave đaacuteng lo

ngại Cocircng nghệ ANN thuacutec đẩy hạn chế của phần cứng hiện tại ANN yecircu cầu phải coacute sự tin tưởng ở đầu ra

14Giới thiệu về thuật toaacuten di truyền Cũng như mạng lưới thần kinh caacutec thuật toaacuten di truyền được dựa trecircn lyacute

thuyết sinh học Thuật toaacuten di truyền tigravem thấy nguồn gốc của chuacuteng trong caacutec lyacute thuyết

tiến hoacutea của chọn lọc tự nhiecircn vagrave thiacutech ứng với biến đổi khiacute hậu Kết quả thuật toaacuten di truyền lagrave từ giao phối 2 caacute thể trong quần thế để tạo

ra con caacutei đocirci khi tốt hơn so với bậc cha mẹ của chuacuteng 15Caacutec thagravenh phần cơ bản của thuật toaacuten di truyền

Toaacuten tử chọn lọc Caacutec caacute thể tốt được chọn lọc để đưa vagraveo thế hệ sau Sự chọn lọc nagravey căn cứ vagraveo độ thiacutech nghi với mocirci trường của mỗi caacute thể

Toaacuten tử lai gheacutep (crossover) Hai caacute thể cha vagrave mẹ trao đổi caacutec gen với nhau để tạo ra caacute thể con

Toaacuten tử đột biến (mutation) Một caacute thể thay đổi một số gen để biến đổi thagravenh một caacute thể mớiTất cả caacutec toaacuten tử trecircn khi thực hiện đều mang tiacutenh ngẫu nhiecircn

16Quaacute trigravenh cơ bản của một thuật toaacuten di truyền Khởi tạo

Đaacutenh giaacute quần thể

Lựa chọn NST thiacutech hợp nhất vagrave loại bỏ NST yếu nhất

Quy trigravenh giao nhau vagrave cải thiện quần thể

đột biến tiến trigravenh để khaacutem phaacute ra NST mới

17Ưu nhược điểm của việc kết hợp với thuật toaacuten di truyền Kiacutech thước quần thể lagrave 1 yếu tố quan trọng trong tốc độ của việc tigravem

kiếmnhưng noacute tương đối dễ dagraveng để dự đoaacuten tốc độ nagravey Giao nhau hoặc đột biến lagrave khocircng necircn đc sử dụng quaacute thường xuyecircn Luocircn coacute được iacutet nhất 1 giải phaacutep hợp lyacute Necircn coacute thể aacutep dụng chuacuteng cho caacutec vấn đề magrave chuacuteng ta khocircng coacute hướng

về caacutech giải quyết Sức mạnh của thuật toaacuten xuất phaacutet từ khaacutei niệm đơn giảnkhocircng phải từ

một thủ tục thuật toaacuten phức tạp 18Tương lai của học maacutey

Mạng lưới thần kinh nhacircn tạo vượt quaacute năng lực của con người trong caacutec trường hợp bị cocirc lập

Về mặt lyacute thuyếtmột maacutey tiacutenh coacute thể xử lyacute dũ liệu nhanh hơn hagraveng triệu lần so với 1 con người

May mắn thay cho chuacuteng tacon người tốt hơn nhiều khi magrave coacute được dữ liệumaacutey tiacutenh khocircng coacute 1 số thứ như lagrave 5 giaacutec quan

CHƯƠNG 10 KHO DỮ LIỆU

1 Kho dữ liệu Kho dữ liệu lagrave tuyển tập caacutec cơ sở dữ liệu tiacutech hợp hướng chủ đề được

thiết kế để trợ giuacutep cho một hệ hỗ trợ quyết định

Theo John Ladley Cocircng nghệ kho dữ liệu lagrave tập caacutec phương phaacutep kỹ thuật vagrave caacutec cocircng cụ coacute thể kết hợp hỗ trợ nhau để cung cấp thocircng tin cho người sử dụng trecircn cơ sở tiacutech hợp từ nhiều nguồn dữ liệu nhiều mocirci trường khaacutec nhau

Kho dữ liệu thường rất lớn tới hagraveng trăm GB hay thậm chiacute hagraveng Terabyte

2 Kho dữ liệu vận hagravenh (ODS) Một kho dữ liệu vận hagravenh Aacutep dụng kỹ thuật kho dữ liệu vagraveo caacutec hệ xử

lyacute giao taacutec lưu trữ dữ liệu cho một ứng dụng đặc thugrave Noacute đưa vagraveo kho dữ liệu một dograveng caacutec dữ liệu thocirc được thiết kế

3 So saacutenh

Kho dữ liệu vận hagravenh Kho dữ liệu

Dữ liệu theo chủ đề Dữ liệu theo chủ đề

Dữ liệu tiacutech hợp Dữ liệu tiacutech hợp

Dữ liệu thay đổi Dữ liệu khocircng thay đổi

Dữ liệu được cập nhật khi thay đổi

Dữ liệu giữ nguyecircn

Chỉ coacute dữ liệu hiện tạiDữliệu hiện tại vagrave dữ liệu lịch sử

Chu kỳ lagravem tươi dữ liệu ngắn Chu kỳ lagravem tươi dữ liệu dagravei

Chỉ coacute dữ liệu chi tiết Dữ liệu chi tiết vagrave dữ liệu tổng kết

Dugraveng cho caacutec quyết định ngắn hạn

Dugraveng cho hoạch định dagravei hạn

4 Kho dữ liệu cục bộ (Data Mart - DM)

Kho dữ liệu cục bộ lagrave CSDL coacute những đặc điểm giống với kho dữ liệu nhưng với quy mocirc nhỏ hơn vagrave lưu trữ dữ liệu về một lĩnh vực một chuyecircn ngagravenh

Data mart phụ thuộc Chứa những dữ liệu được lấy từ DW vagrave những dữ liệu nagravey sẽ được triacutech lọc vagrave tinh chế tiacutech hợp lại ở mức cao hơn để phục vụ một chủ đề nhất định của Datamart

Data mart độc lập Khocircng giống như Datamart phụ thuộc Data mart độc lập được xacircy dựng trước DW vagrave dữ liệu được trực tiếp lấy từ caacutec nguồn khaacutec nhau

5 Siecircu dữ liệu Metadata lagrave dữ liệu để mocirc tả dữ liệu Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột

một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi Metadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu

6 Mocirci trường kho dữ liệu Hệ thống của tổ chức vagrave kho cung cấp dữ liệu để xacircy dựng kho dữ liệu Trong quaacute trigravenh chuyển dữ liệu từ caacutec nguồn khaacutec nhau dữ liệu coacute thể

được lagravem sạch hoặc chuyển đổi vagrave vigrave thế DW được xem như lagrave một chuẩn cho việc lưu trữ

Đồng thời siecircu dữ liệu được ghi lại Cuối cugraveng DW hoặc siecircu thị coacute thể được sử dụng để tạo ra một kho dữ

liệu ldquocaacute nhacircnrdquo 7 Caacutec đặc điểm của kho dữ liệu

Đặc điểm Mocirc tả

Hướng chủ đề - DL tổ chức theo caacutech thức người dugraveng tham chiếu

Tiacutech hợp - Dữ liệu ldquosạchrdquo loại bỏ tiacutenh thiếu nhất quaacuten

Khocircng thay đổi - DL ldquochỉ đọcrdquo người dugraveng khocircng thay đổi được

Chuỗi thời gian - DL lagrave chuỗi thời gian khocircng phải lagrave trạng thaacutei hiện tại

Được tổng kết - DL vận hagravenhthao taacutec khi cần thiết

được kết hợp lại thagravenh dạng coacute thể dugraveng được cho quyết định

Kiacutech cỡ lớn hơn - Lưu giữ theo chuỗi thời gian tức lagrave giữ lại nhiều DL

Khocircng được chuẩn hoacutea - Coacute thể dư thừa DLSiecircu dữ liệu - Dữ liệu của dữ liệu được lưu trữNguồn dữ liệu - DL vận hagravenh (caacutec hệ sẵn coacute) cugraveng

với caacutec nguồn ngoagravei 8 Kho dữ liệu hướng chủ đề

Hướng chủ để coacute nghĩa lagrave kho dữ liệu được tổ chức xung quanh caacutec chủ đề chiacutenh như khaacutech hagraveng sản phẩm sản xuất Tập trung vagraveo việc mocirc higravenh hoacutea vagrave phacircn tiacutech dữ liệu cho caacutec nhagrave ra quyết định magrave khocircng tập trung vagraveo caacutec xử lyacute thocircng thường Cung cấp cho người dugraveng một khung nhigraven toagraven vẹn đơn giản vagrave đầy đủ về caacutec sự kiện quanh caacutec chủ đề

9 Dữ liệu trong DW được tiacutech hợp Dữ liệu trong kho dữ liệu được xacircy dựng bằng caacutech tổng hợp dữ liệu từ

nhiều nguồn khaacutec nhau vagrave caacutec nguồn coacute tổ chức khaacutec nhau Cơ sở dữ liệu caacutec file excel caacutec flat file hoặc caacutec raw file Khi đưa vagraveo kho dữ liệu caacutec dữ liệu được lagravem sạch vagrave tiacutech hợp dữ liệu nhằm đảm bảo tiacutenh nhất quaacuten của dữ liệu

10Kiến truacutec kho dữ liệu Tầng cơ sở dữ liệu hoạt động Tầng truy xuất thocircng tin Tầng truy xuất dữ liệu Tầng siecircu dữ liệu Tầng quản lyacute tiến trigravenh Tầng thocircng điệp của ứng dụng Tầng vật liacute của kho dữ liệu Tầng trigravenh diễn dữ liệu

11Higravenh trạng kho dữ liệu Kho dữ liệu ảo - người dugraveng cuối coacute thể truy cập trực tiếp đến kho dữ liệu

sử dụng caacutec cocircng cụ cho pheacutep ở tầng truy xuất dữ liệu Kho dữ liệu trung tacircm-1 cơ sở dữ liệu vật lyacute chứa tất cả dữ liệu cho một

vugraveng chuyecircn dụng nagraveo đoacute

Kho dữ liệu phacircn taacuten- Thagravenh phần được phacircn taacuten qua nhiều hệ cơ sở dữ liệu vật lyacute

12METADATA- Siecircu dữ liệu Định nghĩa Siecircu dữ liệu lagrave dữ liệu về dữ liệu Lagrave 1 lưu trữ dugraveng để

Miecircu tả kho dữ liệu tổng thể Nhận dạng kiểu kho dữ liệu Quản liacute quaacute trigravenh tiacutech hợp dữ liệu Quản liacute quaacute trigravenh cập nhật kho dữ liệu Quản liacute bảo mật

Lagrave chigravea khoacutea quyết định sự thagravenh cocircng của kho dữ liệu luocircn được thay đổi vagrave cập nhật theo sự phaacutet triển của kho dữ liệu

Dugraveng để quản liacute điều khiển kho dữ liệu Sự ra đời của kho dữ liệu như 1 cấu truacutec hỗ trợ ra quyết định siecircu dữ liệu

được xem như nguồn tagravei nguyecircn dữ liệu Siecircu dữ liệu lagrave trừu tượng Chuacuteng lagrave dữ liệu bậc cao cung cấp mocirc tả ngắn

gọn caacutec dữ liệu bậc thấp hơn 13Hoạt động của Siecircu dữ liệu

Siecircu dữ liệu rất cần thiết trong việc chuyển hoacutea thocircng tin trở thagravenh tri thức Lagrave chigravea khoacutea giuacutep chuacuteng ta xử lyacute được dữ liệu thocirc Viacute dụ một dograveng dữ liệu baacuten hagraveng 1023 K596 11121 agraveNoacute sẽ khocircng coacute nghĩa gigrave cho đến khi chuacuteng ta đưa vagraveo siecircu dữ liệu (thư

mục chứa dữ liệu) agrave cửa hagraveng 1023 sản phẩm K596 vagrave số tiền baacuten được lagrave 11121 đocirc la

14Sự cần thiết phải nhất quaacuten trong kho dữ liệu Kho dữ liệu được xacircy dựng cho lợi iacutech của những nhagrave phacircn tiacutech kinh

doanh caacutec nhagrave quản trị cho tất cả caacutec khu vực chức năng Trong cơ sở dữ liệu riecircng caacutec khu vực khaacutec nhau coacute thể định nghĩa vagrave lưu

trữ dữ liệu thocircng qua phiecircn bản của chiacutenh noacute Khi dữ liệu được lấy từ những vugraveng khaacutec nhau đoacute vagrave được đặt vagraveo kho dữ

liệu Việc chuyển đổi vagrave lagravem sạch caacutec tiến trigravenh sẽ đảm bảo noacute lagrave duy nhất được tiacutech hợp tại một mức của tổ chức

15Ragrave soaacutet lại dữ liệu ndash Thực thi siecircu dữ liệu

Bất kể cấu truacutec tự nhiecircn của 1 cacircu truy vấn thế nagraveo thigrave caacutec thagravenh phần của siecircu dữ liệu rất quan trọng đối với người ra quyết định

Bảng thuộc tiacutenh khoacutea được lưu trữ bởi kho dữ liệu Tập hợp dữ liệu được lấy từ đacircu Những chuyển đổi nagraveo được thực thi với việc lagravem sạch

16Siecircu dữ liệu lagrave gigrave Metadata - lagrave thocircng tin mocirc tả nội dung của cơ sở dữ liệu (CSDL) Metadata baacuteo cho người dugraveng biết thời gian cập nhật sau cugraveng của dữ liệu

định dạng vagrave mục điacutech sử dụng của noacute Những thocircng tin nagravey coacute thể hướng dẫn người dugraveng duyệt qua CSDL vagrave

giuacutep họ hiểu được yacute nghĩa vagrave ngữ cảnh của dữ liệu Trong CSDL metadata lagrave caacutec dạng biểu diễn khaacutec nhau của caacutec đối tượng

trong CSDL Trong CSDL quan hệ metadata lagrave caacutec định nghĩa của bảng cột CSDL

view vagrave nhiều đối tượng khaacutec Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột

một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi -gtMetadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu

Bảng chuyển đổi Ghi lại những chuyển đổi đatilde được thực hiện

Lịch sử thực thi Ghi lại những dữ liệu đatilde được

phacircn tiacutech

Higravenh thaacutei kết nốiGhi lại những dữ liệu được kết nối vagrave tần suất

17Aacutenh xạ thocircng thường của siecircu dữ liệu Bản ghi aacutenh xạ chuyển đổi bao gồm

Định danh của nguồn gốc Chuyển đổi thuộc tiacutenh Chuyển đổi thuộc tiacutenh vật lyacute Matilde hoacutea tham chiếu bảng chuyển đổi Đổi tecircn Đổi khoacutea Gaacuten giaacute trị cho thuộc tiacutenh mặc định Chọn logic cho caacutec nguồn nhiều giaacute trị Đổi thuật toaacuten

18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để

phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai

lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave

tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec

Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm

Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo

19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua

caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau

SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được

Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra

một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức

Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ

Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ

Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech

CHƯƠNG 11 KHAI PHAacute DỮ LIỆU

1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn

ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993

Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng

2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd

1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều

2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP

3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn

4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng

5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server

6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo

7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động

8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời

9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều

10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện

11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech

12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP

3 Xử lyacute phacircn tiacutech trực tuyến OLAP

MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave

dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu

ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave

thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu

HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave

ROLAP4 Khai phaacute dữ liệu

Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh

khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn

Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan

5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp

6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại

Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp

Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec

Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt

Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra

Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh

vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho

Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec

Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm

Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục

Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng

gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp

Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn

Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec

Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper

Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2

Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25

Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước

Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng

Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện

trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp

Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute

độ hỗ trợ ge ngưỡng minsup

độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan

Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn

Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết

Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu

MOLAP ROLAP HOLAP

Lưu trữ dữ liệu cơ sở

Khối Bảng quan hệ Bảng quan hệ

Lưu trữ thocircng tin tổng hợp

Khối Bảng quan hệ Khối

Hiệu suất thực hiện truy vấn

Nhanh nhất Chậm nhất Nhanh

Tiecircu thụ khocircng gian lưu trữ

Nhiều Thấp Trung bigravenh

Chi phiacute bảo trigrave Cao Thấp Trung bigravenh

Page 44: De cuong(1-11)

Bagravei toaacuten chuẩn đoaacuten (Diagnose)

Bagravei toaacuten gỡ rối (Debugging)

Bagravei toaacuten thiết kế

Tương tự như một dự aacuten phần mềm để xacircy dựng một hệ chuyecircn gia cần phải coacute caacutec yếu tố về nhacircn lực tagravei nguyecircn vagrave thời gian Những yếu tố nagravey ảnh hưởng đến giaacute thah của một hệ chuyecircn giaTrong phần nagravey cacircu hỏi thường được đặt ra lagrave tại sao cần phải xacircy dựng một hệ chuyecircn giaTrước khi bắt đầu phải xaacute định rotilde bagravei toaacuten đạt ra lagrave jiAi lagrave chuyecircn giaAi lagrave người sử dụng

1 Diễn giải (InterPretation) Nghiecircn cứu 1 vấn đề -gt Dựa trecircn những biểu hiện thuộc tiacutenh đặc trưng becircn ngoagravei -gt Tư vấn

(hoặc đưa ra kết luận hay mocirc tả dễ hiểu từ tập dữ liệu thocirc)

2 Bagravei toaacuten dự baacuteo (Prediction) Coacute thể dự đoaacuten được hagravenh vi kết quả dựa trecircn caacutec hiện tượng -gt dự baacuteo

VD Dự baacuteo thời tiết động đấthellip

3 Bagravei toaacuten chẩn đoaacuten (Diagnoss) Xaacutec định caacutec lỗi caacutec bộ phận hỏng hoacutec của hệ thống dựa trecircn caacutec dữ liệu quan saacutet được

4 Bagravei toaacuten gỡ rối (Debugging) Mocirc tả caacutec phương phaacutep khắc phục hệ thống khi gặp sự cố

5 Bagravei toaacuten thiết kế Lựa chọn cấu higravenh caacutec đối tượng nhằm thoả matilden một số ragraveng buộc nagraveo đoacute

6 Giảng dạy Phần mềm dạy học coacute thể chuẩn đoaacuten vagrave sủa lỗi của học sinh trong quaacute trigravenh học tập

Để xaacutec định đuacuteng bagravei toaacuten magrave chuacuteng ta cần giải quyết thigrave phải trả lời đc một số cacircu hỏi

- cần hệ chuyecircn gia

Bước 2 thu thập tri thức lựa chọn cocircng cụ vagrave aacutep dụng

Trong bước thu thập tri thức vấn đề quan trọng lagrave lựa chọn chuyecircn gia những người magrave sẽ đoacuteng goacutep tri thức cho hệ thống Thocircng thường trong suốt quaacute trigravenh phaacutet triển thigrave chuyecircn gia được xem như một thagravenh viecircn của đội phaacutet triển

Hiện nay coacute rất nhiều cocircng cụ để xacircy dựng một hệ chuyecircn gia Phổ biến nhất lagrave JESS CLIPS vagrave OPS5

Bước 3 Thiết kế cơ sở tri thức thiết kế hệ thốngTri thức được biểu diễn trường minh trong cơ sở tri thức

Caacutec chuyecircn gia vagrave kỹ sư tri thức sẽ đối thoại với nhau bằng caacutec kỹ thuật đối thoại Suy diễn (SD) bảng Mocirc higravenh hoacutea SD quy nạp phacircn loại

Vấn đề bagraveo trigrave vagrave phaacutet triển

Caacutec hệ chuyecircn gia đogravei hỏi phải bảo trigrave vagrave phaacutet triển nhiều hơn so với caacutec hệ thống khaacutec Phải thường xuyecircn bổ sung tri thức mới vagrave thay đổi caacutec tri thức cũ để đổi mới hệ chuyecircn gia

Thu thập vagrave khắc phục lỗi do người sử dụng phaacutet hiện để kịp thời khắc phục những sai soacutet của hệ chuyecircn gia

75 Lợi iacutech vagrave hạn chế của caacutec hệ chuyecircn gia

Một số lợi iacutech chiacutenh

Thời gian trả lời hợp lyacute bằng hoặc nhanh hơn so với chuyecircn gia (người) để đi đến cugraveng một quyết định Hệ chuyecircn gia lagrave một hệ thống thời gian thực (real time system)

Khả năng trả lời với mức độ tinh thocircng bằng hoặc cao hơn so với chuyecircn gia (người) trong cugraveng lĩnh vực

Hệ chuyecircn gia giuacutep cho hiệu quả lagravem việc tăng bằng việc sử dụng tập caacutec luật một caacutech nhanh choacuteng magrave ko bị nhầm lẫn chuyecircn gia lagrave người coacute thể quecircn đi một số tri thức cơ sở lyacute luậ nhưng HCG thigrave ko

Quyết định của một người chuyecircn gia coacute thể bị thay đổi vagrave ko coacute tiacutenh thống nhất như quyết định của một hệ chuyecircn gia tạo ra

Hệ chuyecircn gia giuacutep cho người sử dụng coacute thể trau dồi sự hiểu biết trecircn lĩnh vuej cụ thể magrave noacute giải quyết hỗ trợ người ra quyết định coacute trigravenh độ như 1 chuyecircn gia trong quaacute trigravenh gia quyết định

Kiến thức của rất nhiều chuyecircn gia về một lĩnh vực nagraveo đoacute được đưa vagraveo hệ chuyecircn gia lagravem cho CSTT cuat HCG phong phuacute vagrave rộng lớn hơn rất nhiều

HCG giải thiacutech caacutec bước suy luận một caacutech dễ hiểu nhất quaacuten luacutec nagraveo cũng coacute thể sử dụng ko như chuyecircn gia con người

Hạn chế của caacutec hệ chuyecircn gia

Nhược điểm lớn nhất của hệ chuyecircn gia lagrave những yacute kiến chuyecircn mocircn thường rất khoacute matilde hoacutea vagrave giải neacuten

Hệ chuyecircn gia khocircng coacute khả năng tự học tự cập nhật kiến thức mới như caacutec chuyecircn gia magrave cần phải được matilde hoacutea lại khi noacute được cập nhật

Hệ chuyecircn gia khocircng thể nhận ra được vấn đề khocircng nằm trong miền kiến thức của hệ thống

Chương 8 Tri thức vagrave tiếp nhận

1 Bao gồm caacutec vấn đề

Dữ liệu thực tế đo lường hoặc quan saacutet coacute hoặc khocircng coacute bối cảnh

Thocircng tin dữ liệu được tổng hợp một caacutech hữu iacutech để giải quyết những khoacute khăn trong việc đưa ra quyết định

Tri thức bao gồm caacutec ứng dụng quy tắc thocircng tin hướng dẫn của người ra quyết định

2 Những caacutei nhigraven về tri thức

Đại diện lagravem thế nagraveo để diễn tả tri thức viacute dụ như một quyển saacutech khocircng phải lagrave tri thức nhưng noacute lại lagrave một đại diện của tri thức

Sản xuất tri thức lagrave một tập hơp của hagraveng tồn kho coacute thể được sản xuất cũng như mua lại

Tri thức lagrave 1 trong 6 trạng thaacutei của hệ thống

1Dữ liệu 2Thocircng tin 3Cấu truacutec thocircng tin 4Sự thấu hiểu 5Yacute kiến 6 Quyết định

3 Caacutec loại tri thức Phổ biến mocirc tả dữ liệu thocircng tin thủ tục mọi thứ lagravem như thế nagraveo lập luận chiacutenh saacutech hoặc caacutec quy tắc

4 Thu thập Tri thức hệ chuyecircn gia Hầu hết caacutec phương phaacutep đều bắt đầu với mocirc higravenh của caacutec taacutec vụ trong đoacute

hệ chuyecircn gia được xacircy dựng Trong đoacute mocirc tả về caacutec lĩnh vực được tạo ra Caacutec kỹ sư sử dụng caacutec mocirc higravenh giả thuyết vagrave nhận thức về quaacute trigravenh phacircn

tiacutech để gợi ra caacutech giải quyết vấn đề về tri thức từ caacutec chuyecircn gia

5 Caacutec chiều của thu thập tri thức KE- driven caacutec kỹ sư trao đổi trực tiếp với caacutec chuyecircn gia Expert-driven Caacutec chuyecircn gia trực tiếp đưa chuyecircn mocircn của họ vagraveo hệ

thống maacutey tiacutenh Machine-driven Sử dụng caacutec cocircng cụ suy luận để triacutech xuất tri thức từ một

tập caacutec viacute dụ

6 Kỹ thuật thu thập tri thức Trao đổi gồm 2 loại cơ bản lagrave coacute cấu truacutec(coacute kịch bản) vagrave khocircng coacute cấu

truacutec( đối thoại trực tiếp) Giao thức phacircn tiacutech bằng lời Khi caacutec chuyecircn gia thực hiện một cocircng việc

của họ thigrave một bản ghi về cocircng việc đoacute được thực hiện Caacutec kỹ sư sẽ xacircy dựng mocirc higravenh cho những gigrave được ghi lại trong bản ghi

Phương phaacutep sagraveng lọc caacutec chuyecircn gia so saacutenh caacutec nhoacutem liecircn tiếp trong ba đối tượng vagrave cho biết tại sao nhoacutem thứ hai lại khaacutec nhoacutem thứ ba

7 Thu thập tri thức từ nhiều nguồn Thu thập tri thức từ nhiều nguồn lagrave cần thiết để coacute được đầy đủ caacutec tri thức

cho một vấn đề quan điểm yacute kiến traacutei ngược nhau thường phaacutet sinh Phương phaacutep đồng thuận sẽ giuacutep giải quyết được vấn đề macircu thuẫn Kỹ thuật phacircn tiacutech Meta lagrave kỹ thuật được aacutep dụng trong caacutec trường hợp

khaacutec Caacutech tiếp cận bằng định lượng đogravei hỏi caacutec kỹ sư cần cacircn nhắc yếu tố đầu vagraveo của caacutec chuyecircn gia khaacutec nhau

8 Xaacutec nhận hợp lệ vagrave kiểm tra tri thức Một khi thu thập tri thức noacute phải được đaacutenh giaacute về khả năng sử dụng vagrave độ

chiacutenh xaacutec Hai vấn đề cụ thể lagrave hiệu lực của những kiến thức vagrave kiểm tra việc xacircy dựng cơ sở của tri thức

Cần xaacutec nhận xem liệu hệ thống coacute thể hoạt động ở mức độ tối thiểu khocircng

Xaacutec minh liecircn quan đến việc so saacutenh từng chi tiết kỹ thuật của hệ thống những gigrave đatilde được thực hiện cuối cugraveng

9 Một số caacutec biện phaacutep xaacutec nhận Độ chiacutenh xaacutec Khả năng thiacutech nghi Mức độ đầy đủ Bề rộng Độ sacircu Hiệu lực Tổng quan Chiacutenh xaacutec Hiện thực Độ tin cậy Tiacutenh hữu dụng Mức độ

Chương 9 Học maacutey

1 Logic mờ vagrave ngocircn ngữ mờ(Fuzzy Logic and Linguistic Ambiguity)

Ngocircn ngữ tự nhiecircn gồm những khaacutei niệm mơ hồ vagrave khocircng chiacutenh xaacutectruyền tải ngữ nghĩa thocircng qua tiacutenh xấp xỉkhocircng rotilde ragraveng

Những xấp xỉ nagravey giuacutep con người coacute thể truyền tải hết được yacute nghĩa nhưng maacutey thigrave khocircng hiểu

Lagravem sao biểu diễn caacutec tri thức sử dụng caacutec khaacutei niệm khocircng rotilde ragraveng(mờ) hoặc khocircng chiacutenh xaacutec

2 Khaacutei niệm cơ bản của logic mờ tập mờ lagrave những tập hợp khocircng coacute một giới hạn rotilde Mỗi phần tử của noacute chỉ

chứa một mức độ hagravem liecircn thuộc của từng phần tử Vigrave vậy tập mờ khocircng giống như tập cổ điển Tập mờ coacute thể kết hợp với nhau qua những luật mờ magrave đặc trưng cho những hagravenh động trạng thaacutei vagrave thuộc tiacutenh của logic mờ được tận dụng khi thực hiện một bộ điều khiển mờ

Logic mờ dựa trecircn yacute tưởng mỗi phần tử thuộc vagraveo một tập hợp ở một mức độ nagraveo đấy

Locircgic mờ cho pheacutep độ liecircn thuộc (microA )coacute giaacute trị trong khoảng (01) Locircgic mờ coacute thể được coi lagrave mặt ứng dụng của lyacute thuyết tập mờ để xử lyacute caacutec

giaacute trị trong thế giới thực cho caacutec bagravei toaacuten phức tạp

3 So saacutenh tiacutenh đuacuteng đắn logic mờ vagrave xaacutec suất Xaacutec suất thigrave đề cập đến khả năng xảy ra một biến cố hay một điều gigrave đoacute Logic mờ đề cập đến cấp độ magrave đặc tiacutenh ở hiện tại

o viacute dụ1 người coacute chiều cao 6 feet thigrave coacute cấp độ lagrave 05 về chiều cao

4 Ưu điểm của logic mờ Caacutech tiếp cận rất tự nhiecircnkhocircng phức tạp Coacute thể mocirc higravenh hoacutea caacutec hagravem phi tuyến tugravey yacute phức tạp

Coacute thể tận dụng được kinh nghiệm từ những chuyecircn gia hagraveng đầu trong mọi lĩnh vực

Logic mờ được xacircy dựng dựa trecircn ngocircn ngữ tự nhiecircnNền tảng của logic mờ lagrave dựa trecircn cơ sở giao tiếp của con người

5 Nhược điểm của logic mờ Trong 1 hệ thống phức tạpsử dụng logic mờ coacute thể trở thagravenh trở ngại cho

việc xaacutec thực độ tin cậy của hệ thống Cơ chế lập luận mờ khocircng thể học hỏi từ những lỗi sai

6 Mạng noron nhacircn tạo(ANN) Mạng noron nhacircn tạo lagrave một mocirc phỏng xử lyacute thocircng tinđược nghiecircn cứu ra

từ hệ thống thần kinh của sinh vậtgiống như bộ natildeo để xử lyacute thocircng tin ANNs lagrave chương trigravenh dựa trecircn maacutey tiacutenh đơn giản coacute chức năng lagrave một mocirc

higravenh bagravei toaacuten khocircng gian dựa trecircn thử nghiệm vagrave baacuteo lỗi

7 Học từ kinh nghiệm Tiến trigravenh Một mẫu dữ liệu được biểu diễn như một mạng lưới noronANN ldquodự

đoaacutenrdquo 1 đầu radự đoaacuten được so saacutenh với giaacute trị thực tế hoặc giaacute trị chiacutenh xaacutecNếu đoaacuten được chiacutenh xaacutec thigrave khocircng coacute hagravenh động nagraveo được thực hiện

Nếu dự đoaacuten sai ANN kiểm tra lại vagrave xaacutec định lại thocircng số để điều chỉnh Một mẫu dữ liệu khaacutec được biểu diễn vagrave quaacute trigravenh nagravey được lặp lại

8 Nguyecircn tắc cơ bản của cocircng nghệ nơron Caacutec yếu tố xử lyacute cơ bản trong hệ thống thần kinh của con người lagrave tế bagraveo

thần kinhMạng lưới của tế bagraveo nagravey lagrave liecircn kết với nhau nhận được thocircng tin từ caacutec cảm biến trong mắt taihellip

Thocircng tin nhận được bởi tế bagraveo thần kinh hoặc lagrave sẽ kiacutech thiacutech noacute(sẽ được chuyển qua 1 thocircng điệp dọc theo mạng lưới) hoặc lagrave sẽ ngăn cản noacute(ngăn cản dograveng thocircng tin)

Độ nhạy coacute thể thay đổi qua thời gian hoặc sau khi coacute được kinh nghiệm

9 Cấu truacutec mạng Một ANN gồm 3 lớp cơ bản

Lớp đầu vagraveo nhận dữ liệu Lớp becircn trong hoặc lagrave lớp ẩn xử lyacute dữ liệu Lớp đầu ra chuyển tiếp kết quả cuối cugraveng của mạng

10Mạng nơ ron Thường coacute nhiều đầu vagraveo mỗi đầu vagraveo với mức ảnh hưởng vagrave tầm quan

trọng riecircng của noacute Một đầu vagraveo quan trọng coacute thể được sử dụng để khuếch đại đầu ra caacutec hagravem trạng thaacutei tổng hợp caacutec trọng số của caacutec yếu tố

đầuvagraveo khaacutec nhauvagraveo một giaacute trị duy nhất Caacutec hagravem chuyển giao xử lyacute caacutec giaacute trị trạng thaacutei vagrave tạo đầu ra

11Huấn luyện mạng nơ ron Trong mocirc higravenh coacute giaacutem saacutetANN được đến so saacutenh dự đoaacuten của chiacutenh

noacute với thocircng tin phản hồi coacute chứa caacutec kết quả mong muốn ANN sẽ phải tigravem caacutech thay đổi caacutec tham số becircn trong củamigravenh (caacutec trọng số vagrave caacutec ngưỡng) để tạo necircn một aacutenh xạ coacute khả năng aacutenh xạcaacutec đầu vagraveo thagravenh caacutec đầu ra mong muốn Sự thay đổi nagravey được tiến hagravenh nhờ việc so saacutenh giữa đầu ra thực sự vagrave đầu ra mong muốn

Trong mocirc higravenh khocircng coacute giaacutem saacutetANN nhận được dữ liệu vagraveo nhưng khocircng phải coacute bất kỳ thocircng tin phản hồi về kết quả mong muốn

Phần lớn caacutec ứng dụng nằm trong vugraveng của caacutec bagravei toaacuten ước lượng như mocirc higravenh hoacuteathống kecirc neacuten lọc phacircn cụm

12Lợi iacutech Liecircn kết với mạng noron Traacutenh caacutech lập trigravenh tường minh Giảm nhu cầu của chuyecircn gia ANNs thigrave thiacutech nghi với caacutec yếu tố đầu vagraveo thay đổi Khocircng cần thiết cho cơ sở tri thức tinh chế ANNs coacute tiacutenh động vagrave cải thiện với việc sử dụng Coacute khả năng xử lyacute dữ liệu khocircng chiacutenh xaacutec hoặc khocircng đầy đủ Cho pheacutep tổng quaacutet hoacutea từ thocircng tin cụ thể Cho pheacutep thu thập cảm giaacutec thocircng thường vagraveo miền giải quyết vấn đề

13Hạn chế của việc liecircn kết với mạng noron ANNs khocircng thể giải thiacutech được suy luận Bản chất hộp đen thường khiến cho vấn đề traacutech nhiệm vagrave độ tin cậy phaacutet

sinh lagrave khoacute khăn Lặp đi lặp lại quaacute trigravenh huấn luyện rất tốn thời gian Nguồn lực caacutec nhagrave phacircn tiacutech vagrave thiết kế coacute tay nghề cao vẫn lagrave đaacuteng lo

ngại Cocircng nghệ ANN thuacutec đẩy hạn chế của phần cứng hiện tại ANN yecircu cầu phải coacute sự tin tưởng ở đầu ra

14Giới thiệu về thuật toaacuten di truyền Cũng như mạng lưới thần kinh caacutec thuật toaacuten di truyền được dựa trecircn lyacute

thuyết sinh học Thuật toaacuten di truyền tigravem thấy nguồn gốc của chuacuteng trong caacutec lyacute thuyết

tiến hoacutea của chọn lọc tự nhiecircn vagrave thiacutech ứng với biến đổi khiacute hậu Kết quả thuật toaacuten di truyền lagrave từ giao phối 2 caacute thể trong quần thế để tạo

ra con caacutei đocirci khi tốt hơn so với bậc cha mẹ của chuacuteng 15Caacutec thagravenh phần cơ bản của thuật toaacuten di truyền

Toaacuten tử chọn lọc Caacutec caacute thể tốt được chọn lọc để đưa vagraveo thế hệ sau Sự chọn lọc nagravey căn cứ vagraveo độ thiacutech nghi với mocirci trường của mỗi caacute thể

Toaacuten tử lai gheacutep (crossover) Hai caacute thể cha vagrave mẹ trao đổi caacutec gen với nhau để tạo ra caacute thể con

Toaacuten tử đột biến (mutation) Một caacute thể thay đổi một số gen để biến đổi thagravenh một caacute thể mớiTất cả caacutec toaacuten tử trecircn khi thực hiện đều mang tiacutenh ngẫu nhiecircn

16Quaacute trigravenh cơ bản của một thuật toaacuten di truyền Khởi tạo

Đaacutenh giaacute quần thể

Lựa chọn NST thiacutech hợp nhất vagrave loại bỏ NST yếu nhất

Quy trigravenh giao nhau vagrave cải thiện quần thể

đột biến tiến trigravenh để khaacutem phaacute ra NST mới

17Ưu nhược điểm của việc kết hợp với thuật toaacuten di truyền Kiacutech thước quần thể lagrave 1 yếu tố quan trọng trong tốc độ của việc tigravem

kiếmnhưng noacute tương đối dễ dagraveng để dự đoaacuten tốc độ nagravey Giao nhau hoặc đột biến lagrave khocircng necircn đc sử dụng quaacute thường xuyecircn Luocircn coacute được iacutet nhất 1 giải phaacutep hợp lyacute Necircn coacute thể aacutep dụng chuacuteng cho caacutec vấn đề magrave chuacuteng ta khocircng coacute hướng

về caacutech giải quyết Sức mạnh của thuật toaacuten xuất phaacutet từ khaacutei niệm đơn giảnkhocircng phải từ

một thủ tục thuật toaacuten phức tạp 18Tương lai của học maacutey

Mạng lưới thần kinh nhacircn tạo vượt quaacute năng lực của con người trong caacutec trường hợp bị cocirc lập

Về mặt lyacute thuyếtmột maacutey tiacutenh coacute thể xử lyacute dũ liệu nhanh hơn hagraveng triệu lần so với 1 con người

May mắn thay cho chuacuteng tacon người tốt hơn nhiều khi magrave coacute được dữ liệumaacutey tiacutenh khocircng coacute 1 số thứ như lagrave 5 giaacutec quan

CHƯƠNG 10 KHO DỮ LIỆU

1 Kho dữ liệu Kho dữ liệu lagrave tuyển tập caacutec cơ sở dữ liệu tiacutech hợp hướng chủ đề được

thiết kế để trợ giuacutep cho một hệ hỗ trợ quyết định

Theo John Ladley Cocircng nghệ kho dữ liệu lagrave tập caacutec phương phaacutep kỹ thuật vagrave caacutec cocircng cụ coacute thể kết hợp hỗ trợ nhau để cung cấp thocircng tin cho người sử dụng trecircn cơ sở tiacutech hợp từ nhiều nguồn dữ liệu nhiều mocirci trường khaacutec nhau

Kho dữ liệu thường rất lớn tới hagraveng trăm GB hay thậm chiacute hagraveng Terabyte

2 Kho dữ liệu vận hagravenh (ODS) Một kho dữ liệu vận hagravenh Aacutep dụng kỹ thuật kho dữ liệu vagraveo caacutec hệ xử

lyacute giao taacutec lưu trữ dữ liệu cho một ứng dụng đặc thugrave Noacute đưa vagraveo kho dữ liệu một dograveng caacutec dữ liệu thocirc được thiết kế

3 So saacutenh

Kho dữ liệu vận hagravenh Kho dữ liệu

Dữ liệu theo chủ đề Dữ liệu theo chủ đề

Dữ liệu tiacutech hợp Dữ liệu tiacutech hợp

Dữ liệu thay đổi Dữ liệu khocircng thay đổi

Dữ liệu được cập nhật khi thay đổi

Dữ liệu giữ nguyecircn

Chỉ coacute dữ liệu hiện tạiDữliệu hiện tại vagrave dữ liệu lịch sử

Chu kỳ lagravem tươi dữ liệu ngắn Chu kỳ lagravem tươi dữ liệu dagravei

Chỉ coacute dữ liệu chi tiết Dữ liệu chi tiết vagrave dữ liệu tổng kết

Dugraveng cho caacutec quyết định ngắn hạn

Dugraveng cho hoạch định dagravei hạn

4 Kho dữ liệu cục bộ (Data Mart - DM)

Kho dữ liệu cục bộ lagrave CSDL coacute những đặc điểm giống với kho dữ liệu nhưng với quy mocirc nhỏ hơn vagrave lưu trữ dữ liệu về một lĩnh vực một chuyecircn ngagravenh

Data mart phụ thuộc Chứa những dữ liệu được lấy từ DW vagrave những dữ liệu nagravey sẽ được triacutech lọc vagrave tinh chế tiacutech hợp lại ở mức cao hơn để phục vụ một chủ đề nhất định của Datamart

Data mart độc lập Khocircng giống như Datamart phụ thuộc Data mart độc lập được xacircy dựng trước DW vagrave dữ liệu được trực tiếp lấy từ caacutec nguồn khaacutec nhau

5 Siecircu dữ liệu Metadata lagrave dữ liệu để mocirc tả dữ liệu Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột

một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi Metadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu

6 Mocirci trường kho dữ liệu Hệ thống của tổ chức vagrave kho cung cấp dữ liệu để xacircy dựng kho dữ liệu Trong quaacute trigravenh chuyển dữ liệu từ caacutec nguồn khaacutec nhau dữ liệu coacute thể

được lagravem sạch hoặc chuyển đổi vagrave vigrave thế DW được xem như lagrave một chuẩn cho việc lưu trữ

Đồng thời siecircu dữ liệu được ghi lại Cuối cugraveng DW hoặc siecircu thị coacute thể được sử dụng để tạo ra một kho dữ

liệu ldquocaacute nhacircnrdquo 7 Caacutec đặc điểm của kho dữ liệu

Đặc điểm Mocirc tả

Hướng chủ đề - DL tổ chức theo caacutech thức người dugraveng tham chiếu

Tiacutech hợp - Dữ liệu ldquosạchrdquo loại bỏ tiacutenh thiếu nhất quaacuten

Khocircng thay đổi - DL ldquochỉ đọcrdquo người dugraveng khocircng thay đổi được

Chuỗi thời gian - DL lagrave chuỗi thời gian khocircng phải lagrave trạng thaacutei hiện tại

Được tổng kết - DL vận hagravenhthao taacutec khi cần thiết

được kết hợp lại thagravenh dạng coacute thể dugraveng được cho quyết định

Kiacutech cỡ lớn hơn - Lưu giữ theo chuỗi thời gian tức lagrave giữ lại nhiều DL

Khocircng được chuẩn hoacutea - Coacute thể dư thừa DLSiecircu dữ liệu - Dữ liệu của dữ liệu được lưu trữNguồn dữ liệu - DL vận hagravenh (caacutec hệ sẵn coacute) cugraveng

với caacutec nguồn ngoagravei 8 Kho dữ liệu hướng chủ đề

Hướng chủ để coacute nghĩa lagrave kho dữ liệu được tổ chức xung quanh caacutec chủ đề chiacutenh như khaacutech hagraveng sản phẩm sản xuất Tập trung vagraveo việc mocirc higravenh hoacutea vagrave phacircn tiacutech dữ liệu cho caacutec nhagrave ra quyết định magrave khocircng tập trung vagraveo caacutec xử lyacute thocircng thường Cung cấp cho người dugraveng một khung nhigraven toagraven vẹn đơn giản vagrave đầy đủ về caacutec sự kiện quanh caacutec chủ đề

9 Dữ liệu trong DW được tiacutech hợp Dữ liệu trong kho dữ liệu được xacircy dựng bằng caacutech tổng hợp dữ liệu từ

nhiều nguồn khaacutec nhau vagrave caacutec nguồn coacute tổ chức khaacutec nhau Cơ sở dữ liệu caacutec file excel caacutec flat file hoặc caacutec raw file Khi đưa vagraveo kho dữ liệu caacutec dữ liệu được lagravem sạch vagrave tiacutech hợp dữ liệu nhằm đảm bảo tiacutenh nhất quaacuten của dữ liệu

10Kiến truacutec kho dữ liệu Tầng cơ sở dữ liệu hoạt động Tầng truy xuất thocircng tin Tầng truy xuất dữ liệu Tầng siecircu dữ liệu Tầng quản lyacute tiến trigravenh Tầng thocircng điệp của ứng dụng Tầng vật liacute của kho dữ liệu Tầng trigravenh diễn dữ liệu

11Higravenh trạng kho dữ liệu Kho dữ liệu ảo - người dugraveng cuối coacute thể truy cập trực tiếp đến kho dữ liệu

sử dụng caacutec cocircng cụ cho pheacutep ở tầng truy xuất dữ liệu Kho dữ liệu trung tacircm-1 cơ sở dữ liệu vật lyacute chứa tất cả dữ liệu cho một

vugraveng chuyecircn dụng nagraveo đoacute

Kho dữ liệu phacircn taacuten- Thagravenh phần được phacircn taacuten qua nhiều hệ cơ sở dữ liệu vật lyacute

12METADATA- Siecircu dữ liệu Định nghĩa Siecircu dữ liệu lagrave dữ liệu về dữ liệu Lagrave 1 lưu trữ dugraveng để

Miecircu tả kho dữ liệu tổng thể Nhận dạng kiểu kho dữ liệu Quản liacute quaacute trigravenh tiacutech hợp dữ liệu Quản liacute quaacute trigravenh cập nhật kho dữ liệu Quản liacute bảo mật

Lagrave chigravea khoacutea quyết định sự thagravenh cocircng của kho dữ liệu luocircn được thay đổi vagrave cập nhật theo sự phaacutet triển của kho dữ liệu

Dugraveng để quản liacute điều khiển kho dữ liệu Sự ra đời của kho dữ liệu như 1 cấu truacutec hỗ trợ ra quyết định siecircu dữ liệu

được xem như nguồn tagravei nguyecircn dữ liệu Siecircu dữ liệu lagrave trừu tượng Chuacuteng lagrave dữ liệu bậc cao cung cấp mocirc tả ngắn

gọn caacutec dữ liệu bậc thấp hơn 13Hoạt động của Siecircu dữ liệu

Siecircu dữ liệu rất cần thiết trong việc chuyển hoacutea thocircng tin trở thagravenh tri thức Lagrave chigravea khoacutea giuacutep chuacuteng ta xử lyacute được dữ liệu thocirc Viacute dụ một dograveng dữ liệu baacuten hagraveng 1023 K596 11121 agraveNoacute sẽ khocircng coacute nghĩa gigrave cho đến khi chuacuteng ta đưa vagraveo siecircu dữ liệu (thư

mục chứa dữ liệu) agrave cửa hagraveng 1023 sản phẩm K596 vagrave số tiền baacuten được lagrave 11121 đocirc la

14Sự cần thiết phải nhất quaacuten trong kho dữ liệu Kho dữ liệu được xacircy dựng cho lợi iacutech của những nhagrave phacircn tiacutech kinh

doanh caacutec nhagrave quản trị cho tất cả caacutec khu vực chức năng Trong cơ sở dữ liệu riecircng caacutec khu vực khaacutec nhau coacute thể định nghĩa vagrave lưu

trữ dữ liệu thocircng qua phiecircn bản của chiacutenh noacute Khi dữ liệu được lấy từ những vugraveng khaacutec nhau đoacute vagrave được đặt vagraveo kho dữ

liệu Việc chuyển đổi vagrave lagravem sạch caacutec tiến trigravenh sẽ đảm bảo noacute lagrave duy nhất được tiacutech hợp tại một mức của tổ chức

15Ragrave soaacutet lại dữ liệu ndash Thực thi siecircu dữ liệu

Bất kể cấu truacutec tự nhiecircn của 1 cacircu truy vấn thế nagraveo thigrave caacutec thagravenh phần của siecircu dữ liệu rất quan trọng đối với người ra quyết định

Bảng thuộc tiacutenh khoacutea được lưu trữ bởi kho dữ liệu Tập hợp dữ liệu được lấy từ đacircu Những chuyển đổi nagraveo được thực thi với việc lagravem sạch

16Siecircu dữ liệu lagrave gigrave Metadata - lagrave thocircng tin mocirc tả nội dung của cơ sở dữ liệu (CSDL) Metadata baacuteo cho người dugraveng biết thời gian cập nhật sau cugraveng của dữ liệu

định dạng vagrave mục điacutech sử dụng của noacute Những thocircng tin nagravey coacute thể hướng dẫn người dugraveng duyệt qua CSDL vagrave

giuacutep họ hiểu được yacute nghĩa vagrave ngữ cảnh của dữ liệu Trong CSDL metadata lagrave caacutec dạng biểu diễn khaacutec nhau của caacutec đối tượng

trong CSDL Trong CSDL quan hệ metadata lagrave caacutec định nghĩa của bảng cột CSDL

view vagrave nhiều đối tượng khaacutec Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột

một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi -gtMetadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu

Bảng chuyển đổi Ghi lại những chuyển đổi đatilde được thực hiện

Lịch sử thực thi Ghi lại những dữ liệu đatilde được

phacircn tiacutech

Higravenh thaacutei kết nốiGhi lại những dữ liệu được kết nối vagrave tần suất

17Aacutenh xạ thocircng thường của siecircu dữ liệu Bản ghi aacutenh xạ chuyển đổi bao gồm

Định danh của nguồn gốc Chuyển đổi thuộc tiacutenh Chuyển đổi thuộc tiacutenh vật lyacute Matilde hoacutea tham chiếu bảng chuyển đổi Đổi tecircn Đổi khoacutea Gaacuten giaacute trị cho thuộc tiacutenh mặc định Chọn logic cho caacutec nguồn nhiều giaacute trị Đổi thuật toaacuten

18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để

phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai

lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave

tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec

Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm

Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo

19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua

caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau

SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được

Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra

một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức

Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ

Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ

Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech

CHƯƠNG 11 KHAI PHAacute DỮ LIỆU

1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn

ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993

Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng

2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd

1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều

2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP

3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn

4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng

5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server

6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo

7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động

8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời

9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều

10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện

11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech

12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP

3 Xử lyacute phacircn tiacutech trực tuyến OLAP

MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave

dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu

ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave

thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu

HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave

ROLAP4 Khai phaacute dữ liệu

Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh

khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn

Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan

5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp

6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại

Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp

Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec

Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt

Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra

Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh

vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho

Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec

Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm

Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục

Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng

gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp

Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn

Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec

Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper

Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2

Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25

Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước

Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng

Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện

trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp

Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute

độ hỗ trợ ge ngưỡng minsup

độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan

Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn

Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết

Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu

MOLAP ROLAP HOLAP

Lưu trữ dữ liệu cơ sở

Khối Bảng quan hệ Bảng quan hệ

Lưu trữ thocircng tin tổng hợp

Khối Bảng quan hệ Khối

Hiệu suất thực hiện truy vấn

Nhanh nhất Chậm nhất Nhanh

Tiecircu thụ khocircng gian lưu trữ

Nhiều Thấp Trung bigravenh

Chi phiacute bảo trigrave Cao Thấp Trung bigravenh

Page 45: De cuong(1-11)

Trong bước thu thập tri thức vấn đề quan trọng lagrave lựa chọn chuyecircn gia những người magrave sẽ đoacuteng goacutep tri thức cho hệ thống Thocircng thường trong suốt quaacute trigravenh phaacutet triển thigrave chuyecircn gia được xem như một thagravenh viecircn của đội phaacutet triển

Hiện nay coacute rất nhiều cocircng cụ để xacircy dựng một hệ chuyecircn gia Phổ biến nhất lagrave JESS CLIPS vagrave OPS5

Bước 3 Thiết kế cơ sở tri thức thiết kế hệ thốngTri thức được biểu diễn trường minh trong cơ sở tri thức

Caacutec chuyecircn gia vagrave kỹ sư tri thức sẽ đối thoại với nhau bằng caacutec kỹ thuật đối thoại Suy diễn (SD) bảng Mocirc higravenh hoacutea SD quy nạp phacircn loại

Vấn đề bagraveo trigrave vagrave phaacutet triển

Caacutec hệ chuyecircn gia đogravei hỏi phải bảo trigrave vagrave phaacutet triển nhiều hơn so với caacutec hệ thống khaacutec Phải thường xuyecircn bổ sung tri thức mới vagrave thay đổi caacutec tri thức cũ để đổi mới hệ chuyecircn gia

Thu thập vagrave khắc phục lỗi do người sử dụng phaacutet hiện để kịp thời khắc phục những sai soacutet của hệ chuyecircn gia

75 Lợi iacutech vagrave hạn chế của caacutec hệ chuyecircn gia

Một số lợi iacutech chiacutenh

Thời gian trả lời hợp lyacute bằng hoặc nhanh hơn so với chuyecircn gia (người) để đi đến cugraveng một quyết định Hệ chuyecircn gia lagrave một hệ thống thời gian thực (real time system)

Khả năng trả lời với mức độ tinh thocircng bằng hoặc cao hơn so với chuyecircn gia (người) trong cugraveng lĩnh vực

Hệ chuyecircn gia giuacutep cho hiệu quả lagravem việc tăng bằng việc sử dụng tập caacutec luật một caacutech nhanh choacuteng magrave ko bị nhầm lẫn chuyecircn gia lagrave người coacute thể quecircn đi một số tri thức cơ sở lyacute luậ nhưng HCG thigrave ko

Quyết định của một người chuyecircn gia coacute thể bị thay đổi vagrave ko coacute tiacutenh thống nhất như quyết định của một hệ chuyecircn gia tạo ra

Hệ chuyecircn gia giuacutep cho người sử dụng coacute thể trau dồi sự hiểu biết trecircn lĩnh vuej cụ thể magrave noacute giải quyết hỗ trợ người ra quyết định coacute trigravenh độ như 1 chuyecircn gia trong quaacute trigravenh gia quyết định

Kiến thức của rất nhiều chuyecircn gia về một lĩnh vực nagraveo đoacute được đưa vagraveo hệ chuyecircn gia lagravem cho CSTT cuat HCG phong phuacute vagrave rộng lớn hơn rất nhiều

HCG giải thiacutech caacutec bước suy luận một caacutech dễ hiểu nhất quaacuten luacutec nagraveo cũng coacute thể sử dụng ko như chuyecircn gia con người

Hạn chế của caacutec hệ chuyecircn gia

Nhược điểm lớn nhất của hệ chuyecircn gia lagrave những yacute kiến chuyecircn mocircn thường rất khoacute matilde hoacutea vagrave giải neacuten

Hệ chuyecircn gia khocircng coacute khả năng tự học tự cập nhật kiến thức mới như caacutec chuyecircn gia magrave cần phải được matilde hoacutea lại khi noacute được cập nhật

Hệ chuyecircn gia khocircng thể nhận ra được vấn đề khocircng nằm trong miền kiến thức của hệ thống

Chương 8 Tri thức vagrave tiếp nhận

1 Bao gồm caacutec vấn đề

Dữ liệu thực tế đo lường hoặc quan saacutet coacute hoặc khocircng coacute bối cảnh

Thocircng tin dữ liệu được tổng hợp một caacutech hữu iacutech để giải quyết những khoacute khăn trong việc đưa ra quyết định

Tri thức bao gồm caacutec ứng dụng quy tắc thocircng tin hướng dẫn của người ra quyết định

2 Những caacutei nhigraven về tri thức

Đại diện lagravem thế nagraveo để diễn tả tri thức viacute dụ như một quyển saacutech khocircng phải lagrave tri thức nhưng noacute lại lagrave một đại diện của tri thức

Sản xuất tri thức lagrave một tập hơp của hagraveng tồn kho coacute thể được sản xuất cũng như mua lại

Tri thức lagrave 1 trong 6 trạng thaacutei của hệ thống

1Dữ liệu 2Thocircng tin 3Cấu truacutec thocircng tin 4Sự thấu hiểu 5Yacute kiến 6 Quyết định

3 Caacutec loại tri thức Phổ biến mocirc tả dữ liệu thocircng tin thủ tục mọi thứ lagravem như thế nagraveo lập luận chiacutenh saacutech hoặc caacutec quy tắc

4 Thu thập Tri thức hệ chuyecircn gia Hầu hết caacutec phương phaacutep đều bắt đầu với mocirc higravenh của caacutec taacutec vụ trong đoacute

hệ chuyecircn gia được xacircy dựng Trong đoacute mocirc tả về caacutec lĩnh vực được tạo ra Caacutec kỹ sư sử dụng caacutec mocirc higravenh giả thuyết vagrave nhận thức về quaacute trigravenh phacircn

tiacutech để gợi ra caacutech giải quyết vấn đề về tri thức từ caacutec chuyecircn gia

5 Caacutec chiều của thu thập tri thức KE- driven caacutec kỹ sư trao đổi trực tiếp với caacutec chuyecircn gia Expert-driven Caacutec chuyecircn gia trực tiếp đưa chuyecircn mocircn của họ vagraveo hệ

thống maacutey tiacutenh Machine-driven Sử dụng caacutec cocircng cụ suy luận để triacutech xuất tri thức từ một

tập caacutec viacute dụ

6 Kỹ thuật thu thập tri thức Trao đổi gồm 2 loại cơ bản lagrave coacute cấu truacutec(coacute kịch bản) vagrave khocircng coacute cấu

truacutec( đối thoại trực tiếp) Giao thức phacircn tiacutech bằng lời Khi caacutec chuyecircn gia thực hiện một cocircng việc

của họ thigrave một bản ghi về cocircng việc đoacute được thực hiện Caacutec kỹ sư sẽ xacircy dựng mocirc higravenh cho những gigrave được ghi lại trong bản ghi

Phương phaacutep sagraveng lọc caacutec chuyecircn gia so saacutenh caacutec nhoacutem liecircn tiếp trong ba đối tượng vagrave cho biết tại sao nhoacutem thứ hai lại khaacutec nhoacutem thứ ba

7 Thu thập tri thức từ nhiều nguồn Thu thập tri thức từ nhiều nguồn lagrave cần thiết để coacute được đầy đủ caacutec tri thức

cho một vấn đề quan điểm yacute kiến traacutei ngược nhau thường phaacutet sinh Phương phaacutep đồng thuận sẽ giuacutep giải quyết được vấn đề macircu thuẫn Kỹ thuật phacircn tiacutech Meta lagrave kỹ thuật được aacutep dụng trong caacutec trường hợp

khaacutec Caacutech tiếp cận bằng định lượng đogravei hỏi caacutec kỹ sư cần cacircn nhắc yếu tố đầu vagraveo của caacutec chuyecircn gia khaacutec nhau

8 Xaacutec nhận hợp lệ vagrave kiểm tra tri thức Một khi thu thập tri thức noacute phải được đaacutenh giaacute về khả năng sử dụng vagrave độ

chiacutenh xaacutec Hai vấn đề cụ thể lagrave hiệu lực của những kiến thức vagrave kiểm tra việc xacircy dựng cơ sở của tri thức

Cần xaacutec nhận xem liệu hệ thống coacute thể hoạt động ở mức độ tối thiểu khocircng

Xaacutec minh liecircn quan đến việc so saacutenh từng chi tiết kỹ thuật của hệ thống những gigrave đatilde được thực hiện cuối cugraveng

9 Một số caacutec biện phaacutep xaacutec nhận Độ chiacutenh xaacutec Khả năng thiacutech nghi Mức độ đầy đủ Bề rộng Độ sacircu Hiệu lực Tổng quan Chiacutenh xaacutec Hiện thực Độ tin cậy Tiacutenh hữu dụng Mức độ

Chương 9 Học maacutey

1 Logic mờ vagrave ngocircn ngữ mờ(Fuzzy Logic and Linguistic Ambiguity)

Ngocircn ngữ tự nhiecircn gồm những khaacutei niệm mơ hồ vagrave khocircng chiacutenh xaacutectruyền tải ngữ nghĩa thocircng qua tiacutenh xấp xỉkhocircng rotilde ragraveng

Những xấp xỉ nagravey giuacutep con người coacute thể truyền tải hết được yacute nghĩa nhưng maacutey thigrave khocircng hiểu

Lagravem sao biểu diễn caacutec tri thức sử dụng caacutec khaacutei niệm khocircng rotilde ragraveng(mờ) hoặc khocircng chiacutenh xaacutec

2 Khaacutei niệm cơ bản của logic mờ tập mờ lagrave những tập hợp khocircng coacute một giới hạn rotilde Mỗi phần tử của noacute chỉ

chứa một mức độ hagravem liecircn thuộc của từng phần tử Vigrave vậy tập mờ khocircng giống như tập cổ điển Tập mờ coacute thể kết hợp với nhau qua những luật mờ magrave đặc trưng cho những hagravenh động trạng thaacutei vagrave thuộc tiacutenh của logic mờ được tận dụng khi thực hiện một bộ điều khiển mờ

Logic mờ dựa trecircn yacute tưởng mỗi phần tử thuộc vagraveo một tập hợp ở một mức độ nagraveo đấy

Locircgic mờ cho pheacutep độ liecircn thuộc (microA )coacute giaacute trị trong khoảng (01) Locircgic mờ coacute thể được coi lagrave mặt ứng dụng của lyacute thuyết tập mờ để xử lyacute caacutec

giaacute trị trong thế giới thực cho caacutec bagravei toaacuten phức tạp

3 So saacutenh tiacutenh đuacuteng đắn logic mờ vagrave xaacutec suất Xaacutec suất thigrave đề cập đến khả năng xảy ra một biến cố hay một điều gigrave đoacute Logic mờ đề cập đến cấp độ magrave đặc tiacutenh ở hiện tại

o viacute dụ1 người coacute chiều cao 6 feet thigrave coacute cấp độ lagrave 05 về chiều cao

4 Ưu điểm của logic mờ Caacutech tiếp cận rất tự nhiecircnkhocircng phức tạp Coacute thể mocirc higravenh hoacutea caacutec hagravem phi tuyến tugravey yacute phức tạp

Coacute thể tận dụng được kinh nghiệm từ những chuyecircn gia hagraveng đầu trong mọi lĩnh vực

Logic mờ được xacircy dựng dựa trecircn ngocircn ngữ tự nhiecircnNền tảng của logic mờ lagrave dựa trecircn cơ sở giao tiếp của con người

5 Nhược điểm của logic mờ Trong 1 hệ thống phức tạpsử dụng logic mờ coacute thể trở thagravenh trở ngại cho

việc xaacutec thực độ tin cậy của hệ thống Cơ chế lập luận mờ khocircng thể học hỏi từ những lỗi sai

6 Mạng noron nhacircn tạo(ANN) Mạng noron nhacircn tạo lagrave một mocirc phỏng xử lyacute thocircng tinđược nghiecircn cứu ra

từ hệ thống thần kinh của sinh vậtgiống như bộ natildeo để xử lyacute thocircng tin ANNs lagrave chương trigravenh dựa trecircn maacutey tiacutenh đơn giản coacute chức năng lagrave một mocirc

higravenh bagravei toaacuten khocircng gian dựa trecircn thử nghiệm vagrave baacuteo lỗi

7 Học từ kinh nghiệm Tiến trigravenh Một mẫu dữ liệu được biểu diễn như một mạng lưới noronANN ldquodự

đoaacutenrdquo 1 đầu radự đoaacuten được so saacutenh với giaacute trị thực tế hoặc giaacute trị chiacutenh xaacutecNếu đoaacuten được chiacutenh xaacutec thigrave khocircng coacute hagravenh động nagraveo được thực hiện

Nếu dự đoaacuten sai ANN kiểm tra lại vagrave xaacutec định lại thocircng số để điều chỉnh Một mẫu dữ liệu khaacutec được biểu diễn vagrave quaacute trigravenh nagravey được lặp lại

8 Nguyecircn tắc cơ bản của cocircng nghệ nơron Caacutec yếu tố xử lyacute cơ bản trong hệ thống thần kinh của con người lagrave tế bagraveo

thần kinhMạng lưới của tế bagraveo nagravey lagrave liecircn kết với nhau nhận được thocircng tin từ caacutec cảm biến trong mắt taihellip

Thocircng tin nhận được bởi tế bagraveo thần kinh hoặc lagrave sẽ kiacutech thiacutech noacute(sẽ được chuyển qua 1 thocircng điệp dọc theo mạng lưới) hoặc lagrave sẽ ngăn cản noacute(ngăn cản dograveng thocircng tin)

Độ nhạy coacute thể thay đổi qua thời gian hoặc sau khi coacute được kinh nghiệm

9 Cấu truacutec mạng Một ANN gồm 3 lớp cơ bản

Lớp đầu vagraveo nhận dữ liệu Lớp becircn trong hoặc lagrave lớp ẩn xử lyacute dữ liệu Lớp đầu ra chuyển tiếp kết quả cuối cugraveng của mạng

10Mạng nơ ron Thường coacute nhiều đầu vagraveo mỗi đầu vagraveo với mức ảnh hưởng vagrave tầm quan

trọng riecircng của noacute Một đầu vagraveo quan trọng coacute thể được sử dụng để khuếch đại đầu ra caacutec hagravem trạng thaacutei tổng hợp caacutec trọng số của caacutec yếu tố

đầuvagraveo khaacutec nhauvagraveo một giaacute trị duy nhất Caacutec hagravem chuyển giao xử lyacute caacutec giaacute trị trạng thaacutei vagrave tạo đầu ra

11Huấn luyện mạng nơ ron Trong mocirc higravenh coacute giaacutem saacutetANN được đến so saacutenh dự đoaacuten của chiacutenh

noacute với thocircng tin phản hồi coacute chứa caacutec kết quả mong muốn ANN sẽ phải tigravem caacutech thay đổi caacutec tham số becircn trong củamigravenh (caacutec trọng số vagrave caacutec ngưỡng) để tạo necircn một aacutenh xạ coacute khả năng aacutenh xạcaacutec đầu vagraveo thagravenh caacutec đầu ra mong muốn Sự thay đổi nagravey được tiến hagravenh nhờ việc so saacutenh giữa đầu ra thực sự vagrave đầu ra mong muốn

Trong mocirc higravenh khocircng coacute giaacutem saacutetANN nhận được dữ liệu vagraveo nhưng khocircng phải coacute bất kỳ thocircng tin phản hồi về kết quả mong muốn

Phần lớn caacutec ứng dụng nằm trong vugraveng của caacutec bagravei toaacuten ước lượng như mocirc higravenh hoacuteathống kecirc neacuten lọc phacircn cụm

12Lợi iacutech Liecircn kết với mạng noron Traacutenh caacutech lập trigravenh tường minh Giảm nhu cầu của chuyecircn gia ANNs thigrave thiacutech nghi với caacutec yếu tố đầu vagraveo thay đổi Khocircng cần thiết cho cơ sở tri thức tinh chế ANNs coacute tiacutenh động vagrave cải thiện với việc sử dụng Coacute khả năng xử lyacute dữ liệu khocircng chiacutenh xaacutec hoặc khocircng đầy đủ Cho pheacutep tổng quaacutet hoacutea từ thocircng tin cụ thể Cho pheacutep thu thập cảm giaacutec thocircng thường vagraveo miền giải quyết vấn đề

13Hạn chế của việc liecircn kết với mạng noron ANNs khocircng thể giải thiacutech được suy luận Bản chất hộp đen thường khiến cho vấn đề traacutech nhiệm vagrave độ tin cậy phaacutet

sinh lagrave khoacute khăn Lặp đi lặp lại quaacute trigravenh huấn luyện rất tốn thời gian Nguồn lực caacutec nhagrave phacircn tiacutech vagrave thiết kế coacute tay nghề cao vẫn lagrave đaacuteng lo

ngại Cocircng nghệ ANN thuacutec đẩy hạn chế của phần cứng hiện tại ANN yecircu cầu phải coacute sự tin tưởng ở đầu ra

14Giới thiệu về thuật toaacuten di truyền Cũng như mạng lưới thần kinh caacutec thuật toaacuten di truyền được dựa trecircn lyacute

thuyết sinh học Thuật toaacuten di truyền tigravem thấy nguồn gốc của chuacuteng trong caacutec lyacute thuyết

tiến hoacutea của chọn lọc tự nhiecircn vagrave thiacutech ứng với biến đổi khiacute hậu Kết quả thuật toaacuten di truyền lagrave từ giao phối 2 caacute thể trong quần thế để tạo

ra con caacutei đocirci khi tốt hơn so với bậc cha mẹ của chuacuteng 15Caacutec thagravenh phần cơ bản của thuật toaacuten di truyền

Toaacuten tử chọn lọc Caacutec caacute thể tốt được chọn lọc để đưa vagraveo thế hệ sau Sự chọn lọc nagravey căn cứ vagraveo độ thiacutech nghi với mocirci trường của mỗi caacute thể

Toaacuten tử lai gheacutep (crossover) Hai caacute thể cha vagrave mẹ trao đổi caacutec gen với nhau để tạo ra caacute thể con

Toaacuten tử đột biến (mutation) Một caacute thể thay đổi một số gen để biến đổi thagravenh một caacute thể mớiTất cả caacutec toaacuten tử trecircn khi thực hiện đều mang tiacutenh ngẫu nhiecircn

16Quaacute trigravenh cơ bản của một thuật toaacuten di truyền Khởi tạo

Đaacutenh giaacute quần thể

Lựa chọn NST thiacutech hợp nhất vagrave loại bỏ NST yếu nhất

Quy trigravenh giao nhau vagrave cải thiện quần thể

đột biến tiến trigravenh để khaacutem phaacute ra NST mới

17Ưu nhược điểm của việc kết hợp với thuật toaacuten di truyền Kiacutech thước quần thể lagrave 1 yếu tố quan trọng trong tốc độ của việc tigravem

kiếmnhưng noacute tương đối dễ dagraveng để dự đoaacuten tốc độ nagravey Giao nhau hoặc đột biến lagrave khocircng necircn đc sử dụng quaacute thường xuyecircn Luocircn coacute được iacutet nhất 1 giải phaacutep hợp lyacute Necircn coacute thể aacutep dụng chuacuteng cho caacutec vấn đề magrave chuacuteng ta khocircng coacute hướng

về caacutech giải quyết Sức mạnh của thuật toaacuten xuất phaacutet từ khaacutei niệm đơn giảnkhocircng phải từ

một thủ tục thuật toaacuten phức tạp 18Tương lai của học maacutey

Mạng lưới thần kinh nhacircn tạo vượt quaacute năng lực của con người trong caacutec trường hợp bị cocirc lập

Về mặt lyacute thuyếtmột maacutey tiacutenh coacute thể xử lyacute dũ liệu nhanh hơn hagraveng triệu lần so với 1 con người

May mắn thay cho chuacuteng tacon người tốt hơn nhiều khi magrave coacute được dữ liệumaacutey tiacutenh khocircng coacute 1 số thứ như lagrave 5 giaacutec quan

CHƯƠNG 10 KHO DỮ LIỆU

1 Kho dữ liệu Kho dữ liệu lagrave tuyển tập caacutec cơ sở dữ liệu tiacutech hợp hướng chủ đề được

thiết kế để trợ giuacutep cho một hệ hỗ trợ quyết định

Theo John Ladley Cocircng nghệ kho dữ liệu lagrave tập caacutec phương phaacutep kỹ thuật vagrave caacutec cocircng cụ coacute thể kết hợp hỗ trợ nhau để cung cấp thocircng tin cho người sử dụng trecircn cơ sở tiacutech hợp từ nhiều nguồn dữ liệu nhiều mocirci trường khaacutec nhau

Kho dữ liệu thường rất lớn tới hagraveng trăm GB hay thậm chiacute hagraveng Terabyte

2 Kho dữ liệu vận hagravenh (ODS) Một kho dữ liệu vận hagravenh Aacutep dụng kỹ thuật kho dữ liệu vagraveo caacutec hệ xử

lyacute giao taacutec lưu trữ dữ liệu cho một ứng dụng đặc thugrave Noacute đưa vagraveo kho dữ liệu một dograveng caacutec dữ liệu thocirc được thiết kế

3 So saacutenh

Kho dữ liệu vận hagravenh Kho dữ liệu

Dữ liệu theo chủ đề Dữ liệu theo chủ đề

Dữ liệu tiacutech hợp Dữ liệu tiacutech hợp

Dữ liệu thay đổi Dữ liệu khocircng thay đổi

Dữ liệu được cập nhật khi thay đổi

Dữ liệu giữ nguyecircn

Chỉ coacute dữ liệu hiện tạiDữliệu hiện tại vagrave dữ liệu lịch sử

Chu kỳ lagravem tươi dữ liệu ngắn Chu kỳ lagravem tươi dữ liệu dagravei

Chỉ coacute dữ liệu chi tiết Dữ liệu chi tiết vagrave dữ liệu tổng kết

Dugraveng cho caacutec quyết định ngắn hạn

Dugraveng cho hoạch định dagravei hạn

4 Kho dữ liệu cục bộ (Data Mart - DM)

Kho dữ liệu cục bộ lagrave CSDL coacute những đặc điểm giống với kho dữ liệu nhưng với quy mocirc nhỏ hơn vagrave lưu trữ dữ liệu về một lĩnh vực một chuyecircn ngagravenh

Data mart phụ thuộc Chứa những dữ liệu được lấy từ DW vagrave những dữ liệu nagravey sẽ được triacutech lọc vagrave tinh chế tiacutech hợp lại ở mức cao hơn để phục vụ một chủ đề nhất định của Datamart

Data mart độc lập Khocircng giống như Datamart phụ thuộc Data mart độc lập được xacircy dựng trước DW vagrave dữ liệu được trực tiếp lấy từ caacutec nguồn khaacutec nhau

5 Siecircu dữ liệu Metadata lagrave dữ liệu để mocirc tả dữ liệu Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột

một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi Metadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu

6 Mocirci trường kho dữ liệu Hệ thống của tổ chức vagrave kho cung cấp dữ liệu để xacircy dựng kho dữ liệu Trong quaacute trigravenh chuyển dữ liệu từ caacutec nguồn khaacutec nhau dữ liệu coacute thể

được lagravem sạch hoặc chuyển đổi vagrave vigrave thế DW được xem như lagrave một chuẩn cho việc lưu trữ

Đồng thời siecircu dữ liệu được ghi lại Cuối cugraveng DW hoặc siecircu thị coacute thể được sử dụng để tạo ra một kho dữ

liệu ldquocaacute nhacircnrdquo 7 Caacutec đặc điểm của kho dữ liệu

Đặc điểm Mocirc tả

Hướng chủ đề - DL tổ chức theo caacutech thức người dugraveng tham chiếu

Tiacutech hợp - Dữ liệu ldquosạchrdquo loại bỏ tiacutenh thiếu nhất quaacuten

Khocircng thay đổi - DL ldquochỉ đọcrdquo người dugraveng khocircng thay đổi được

Chuỗi thời gian - DL lagrave chuỗi thời gian khocircng phải lagrave trạng thaacutei hiện tại

Được tổng kết - DL vận hagravenhthao taacutec khi cần thiết

được kết hợp lại thagravenh dạng coacute thể dugraveng được cho quyết định

Kiacutech cỡ lớn hơn - Lưu giữ theo chuỗi thời gian tức lagrave giữ lại nhiều DL

Khocircng được chuẩn hoacutea - Coacute thể dư thừa DLSiecircu dữ liệu - Dữ liệu của dữ liệu được lưu trữNguồn dữ liệu - DL vận hagravenh (caacutec hệ sẵn coacute) cugraveng

với caacutec nguồn ngoagravei 8 Kho dữ liệu hướng chủ đề

Hướng chủ để coacute nghĩa lagrave kho dữ liệu được tổ chức xung quanh caacutec chủ đề chiacutenh như khaacutech hagraveng sản phẩm sản xuất Tập trung vagraveo việc mocirc higravenh hoacutea vagrave phacircn tiacutech dữ liệu cho caacutec nhagrave ra quyết định magrave khocircng tập trung vagraveo caacutec xử lyacute thocircng thường Cung cấp cho người dugraveng một khung nhigraven toagraven vẹn đơn giản vagrave đầy đủ về caacutec sự kiện quanh caacutec chủ đề

9 Dữ liệu trong DW được tiacutech hợp Dữ liệu trong kho dữ liệu được xacircy dựng bằng caacutech tổng hợp dữ liệu từ

nhiều nguồn khaacutec nhau vagrave caacutec nguồn coacute tổ chức khaacutec nhau Cơ sở dữ liệu caacutec file excel caacutec flat file hoặc caacutec raw file Khi đưa vagraveo kho dữ liệu caacutec dữ liệu được lagravem sạch vagrave tiacutech hợp dữ liệu nhằm đảm bảo tiacutenh nhất quaacuten của dữ liệu

10Kiến truacutec kho dữ liệu Tầng cơ sở dữ liệu hoạt động Tầng truy xuất thocircng tin Tầng truy xuất dữ liệu Tầng siecircu dữ liệu Tầng quản lyacute tiến trigravenh Tầng thocircng điệp của ứng dụng Tầng vật liacute của kho dữ liệu Tầng trigravenh diễn dữ liệu

11Higravenh trạng kho dữ liệu Kho dữ liệu ảo - người dugraveng cuối coacute thể truy cập trực tiếp đến kho dữ liệu

sử dụng caacutec cocircng cụ cho pheacutep ở tầng truy xuất dữ liệu Kho dữ liệu trung tacircm-1 cơ sở dữ liệu vật lyacute chứa tất cả dữ liệu cho một

vugraveng chuyecircn dụng nagraveo đoacute

Kho dữ liệu phacircn taacuten- Thagravenh phần được phacircn taacuten qua nhiều hệ cơ sở dữ liệu vật lyacute

12METADATA- Siecircu dữ liệu Định nghĩa Siecircu dữ liệu lagrave dữ liệu về dữ liệu Lagrave 1 lưu trữ dugraveng để

Miecircu tả kho dữ liệu tổng thể Nhận dạng kiểu kho dữ liệu Quản liacute quaacute trigravenh tiacutech hợp dữ liệu Quản liacute quaacute trigravenh cập nhật kho dữ liệu Quản liacute bảo mật

Lagrave chigravea khoacutea quyết định sự thagravenh cocircng của kho dữ liệu luocircn được thay đổi vagrave cập nhật theo sự phaacutet triển của kho dữ liệu

Dugraveng để quản liacute điều khiển kho dữ liệu Sự ra đời của kho dữ liệu như 1 cấu truacutec hỗ trợ ra quyết định siecircu dữ liệu

được xem như nguồn tagravei nguyecircn dữ liệu Siecircu dữ liệu lagrave trừu tượng Chuacuteng lagrave dữ liệu bậc cao cung cấp mocirc tả ngắn

gọn caacutec dữ liệu bậc thấp hơn 13Hoạt động của Siecircu dữ liệu

Siecircu dữ liệu rất cần thiết trong việc chuyển hoacutea thocircng tin trở thagravenh tri thức Lagrave chigravea khoacutea giuacutep chuacuteng ta xử lyacute được dữ liệu thocirc Viacute dụ một dograveng dữ liệu baacuten hagraveng 1023 K596 11121 agraveNoacute sẽ khocircng coacute nghĩa gigrave cho đến khi chuacuteng ta đưa vagraveo siecircu dữ liệu (thư

mục chứa dữ liệu) agrave cửa hagraveng 1023 sản phẩm K596 vagrave số tiền baacuten được lagrave 11121 đocirc la

14Sự cần thiết phải nhất quaacuten trong kho dữ liệu Kho dữ liệu được xacircy dựng cho lợi iacutech của những nhagrave phacircn tiacutech kinh

doanh caacutec nhagrave quản trị cho tất cả caacutec khu vực chức năng Trong cơ sở dữ liệu riecircng caacutec khu vực khaacutec nhau coacute thể định nghĩa vagrave lưu

trữ dữ liệu thocircng qua phiecircn bản của chiacutenh noacute Khi dữ liệu được lấy từ những vugraveng khaacutec nhau đoacute vagrave được đặt vagraveo kho dữ

liệu Việc chuyển đổi vagrave lagravem sạch caacutec tiến trigravenh sẽ đảm bảo noacute lagrave duy nhất được tiacutech hợp tại một mức của tổ chức

15Ragrave soaacutet lại dữ liệu ndash Thực thi siecircu dữ liệu

Bất kể cấu truacutec tự nhiecircn của 1 cacircu truy vấn thế nagraveo thigrave caacutec thagravenh phần của siecircu dữ liệu rất quan trọng đối với người ra quyết định

Bảng thuộc tiacutenh khoacutea được lưu trữ bởi kho dữ liệu Tập hợp dữ liệu được lấy từ đacircu Những chuyển đổi nagraveo được thực thi với việc lagravem sạch

16Siecircu dữ liệu lagrave gigrave Metadata - lagrave thocircng tin mocirc tả nội dung của cơ sở dữ liệu (CSDL) Metadata baacuteo cho người dugraveng biết thời gian cập nhật sau cugraveng của dữ liệu

định dạng vagrave mục điacutech sử dụng của noacute Những thocircng tin nagravey coacute thể hướng dẫn người dugraveng duyệt qua CSDL vagrave

giuacutep họ hiểu được yacute nghĩa vagrave ngữ cảnh của dữ liệu Trong CSDL metadata lagrave caacutec dạng biểu diễn khaacutec nhau của caacutec đối tượng

trong CSDL Trong CSDL quan hệ metadata lagrave caacutec định nghĩa của bảng cột CSDL

view vagrave nhiều đối tượng khaacutec Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột

một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi -gtMetadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu

Bảng chuyển đổi Ghi lại những chuyển đổi đatilde được thực hiện

Lịch sử thực thi Ghi lại những dữ liệu đatilde được

phacircn tiacutech

Higravenh thaacutei kết nốiGhi lại những dữ liệu được kết nối vagrave tần suất

17Aacutenh xạ thocircng thường của siecircu dữ liệu Bản ghi aacutenh xạ chuyển đổi bao gồm

Định danh của nguồn gốc Chuyển đổi thuộc tiacutenh Chuyển đổi thuộc tiacutenh vật lyacute Matilde hoacutea tham chiếu bảng chuyển đổi Đổi tecircn Đổi khoacutea Gaacuten giaacute trị cho thuộc tiacutenh mặc định Chọn logic cho caacutec nguồn nhiều giaacute trị Đổi thuật toaacuten

18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để

phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai

lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave

tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec

Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm

Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo

19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua

caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau

SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được

Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra

một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức

Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ

Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ

Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech

CHƯƠNG 11 KHAI PHAacute DỮ LIỆU

1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn

ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993

Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng

2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd

1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều

2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP

3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn

4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng

5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server

6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo

7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động

8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời

9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều

10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện

11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech

12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP

3 Xử lyacute phacircn tiacutech trực tuyến OLAP

MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave

dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu

ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave

thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu

HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave

ROLAP4 Khai phaacute dữ liệu

Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh

khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn

Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan

5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp

6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại

Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp

Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec

Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt

Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra

Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh

vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho

Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec

Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm

Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục

Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng

gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp

Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn

Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec

Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper

Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2

Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25

Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước

Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng

Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện

trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp

Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute

độ hỗ trợ ge ngưỡng minsup

độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan

Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn

Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết

Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu

MOLAP ROLAP HOLAP

Lưu trữ dữ liệu cơ sở

Khối Bảng quan hệ Bảng quan hệ

Lưu trữ thocircng tin tổng hợp

Khối Bảng quan hệ Khối

Hiệu suất thực hiện truy vấn

Nhanh nhất Chậm nhất Nhanh

Tiecircu thụ khocircng gian lưu trữ

Nhiều Thấp Trung bigravenh

Chi phiacute bảo trigrave Cao Thấp Trung bigravenh

Page 46: De cuong(1-11)

Hệ chuyecircn gia giuacutep cho người sử dụng coacute thể trau dồi sự hiểu biết trecircn lĩnh vuej cụ thể magrave noacute giải quyết hỗ trợ người ra quyết định coacute trigravenh độ như 1 chuyecircn gia trong quaacute trigravenh gia quyết định

Kiến thức của rất nhiều chuyecircn gia về một lĩnh vực nagraveo đoacute được đưa vagraveo hệ chuyecircn gia lagravem cho CSTT cuat HCG phong phuacute vagrave rộng lớn hơn rất nhiều

HCG giải thiacutech caacutec bước suy luận một caacutech dễ hiểu nhất quaacuten luacutec nagraveo cũng coacute thể sử dụng ko như chuyecircn gia con người

Hạn chế của caacutec hệ chuyecircn gia

Nhược điểm lớn nhất của hệ chuyecircn gia lagrave những yacute kiến chuyecircn mocircn thường rất khoacute matilde hoacutea vagrave giải neacuten

Hệ chuyecircn gia khocircng coacute khả năng tự học tự cập nhật kiến thức mới như caacutec chuyecircn gia magrave cần phải được matilde hoacutea lại khi noacute được cập nhật

Hệ chuyecircn gia khocircng thể nhận ra được vấn đề khocircng nằm trong miền kiến thức của hệ thống

Chương 8 Tri thức vagrave tiếp nhận

1 Bao gồm caacutec vấn đề

Dữ liệu thực tế đo lường hoặc quan saacutet coacute hoặc khocircng coacute bối cảnh

Thocircng tin dữ liệu được tổng hợp một caacutech hữu iacutech để giải quyết những khoacute khăn trong việc đưa ra quyết định

Tri thức bao gồm caacutec ứng dụng quy tắc thocircng tin hướng dẫn của người ra quyết định

2 Những caacutei nhigraven về tri thức

Đại diện lagravem thế nagraveo để diễn tả tri thức viacute dụ như một quyển saacutech khocircng phải lagrave tri thức nhưng noacute lại lagrave một đại diện của tri thức

Sản xuất tri thức lagrave một tập hơp của hagraveng tồn kho coacute thể được sản xuất cũng như mua lại

Tri thức lagrave 1 trong 6 trạng thaacutei của hệ thống

1Dữ liệu 2Thocircng tin 3Cấu truacutec thocircng tin 4Sự thấu hiểu 5Yacute kiến 6 Quyết định

3 Caacutec loại tri thức Phổ biến mocirc tả dữ liệu thocircng tin thủ tục mọi thứ lagravem như thế nagraveo lập luận chiacutenh saacutech hoặc caacutec quy tắc

4 Thu thập Tri thức hệ chuyecircn gia Hầu hết caacutec phương phaacutep đều bắt đầu với mocirc higravenh của caacutec taacutec vụ trong đoacute

hệ chuyecircn gia được xacircy dựng Trong đoacute mocirc tả về caacutec lĩnh vực được tạo ra Caacutec kỹ sư sử dụng caacutec mocirc higravenh giả thuyết vagrave nhận thức về quaacute trigravenh phacircn

tiacutech để gợi ra caacutech giải quyết vấn đề về tri thức từ caacutec chuyecircn gia

5 Caacutec chiều của thu thập tri thức KE- driven caacutec kỹ sư trao đổi trực tiếp với caacutec chuyecircn gia Expert-driven Caacutec chuyecircn gia trực tiếp đưa chuyecircn mocircn của họ vagraveo hệ

thống maacutey tiacutenh Machine-driven Sử dụng caacutec cocircng cụ suy luận để triacutech xuất tri thức từ một

tập caacutec viacute dụ

6 Kỹ thuật thu thập tri thức Trao đổi gồm 2 loại cơ bản lagrave coacute cấu truacutec(coacute kịch bản) vagrave khocircng coacute cấu

truacutec( đối thoại trực tiếp) Giao thức phacircn tiacutech bằng lời Khi caacutec chuyecircn gia thực hiện một cocircng việc

của họ thigrave một bản ghi về cocircng việc đoacute được thực hiện Caacutec kỹ sư sẽ xacircy dựng mocirc higravenh cho những gigrave được ghi lại trong bản ghi

Phương phaacutep sagraveng lọc caacutec chuyecircn gia so saacutenh caacutec nhoacutem liecircn tiếp trong ba đối tượng vagrave cho biết tại sao nhoacutem thứ hai lại khaacutec nhoacutem thứ ba

7 Thu thập tri thức từ nhiều nguồn Thu thập tri thức từ nhiều nguồn lagrave cần thiết để coacute được đầy đủ caacutec tri thức

cho một vấn đề quan điểm yacute kiến traacutei ngược nhau thường phaacutet sinh Phương phaacutep đồng thuận sẽ giuacutep giải quyết được vấn đề macircu thuẫn Kỹ thuật phacircn tiacutech Meta lagrave kỹ thuật được aacutep dụng trong caacutec trường hợp

khaacutec Caacutech tiếp cận bằng định lượng đogravei hỏi caacutec kỹ sư cần cacircn nhắc yếu tố đầu vagraveo của caacutec chuyecircn gia khaacutec nhau

8 Xaacutec nhận hợp lệ vagrave kiểm tra tri thức Một khi thu thập tri thức noacute phải được đaacutenh giaacute về khả năng sử dụng vagrave độ

chiacutenh xaacutec Hai vấn đề cụ thể lagrave hiệu lực của những kiến thức vagrave kiểm tra việc xacircy dựng cơ sở của tri thức

Cần xaacutec nhận xem liệu hệ thống coacute thể hoạt động ở mức độ tối thiểu khocircng

Xaacutec minh liecircn quan đến việc so saacutenh từng chi tiết kỹ thuật của hệ thống những gigrave đatilde được thực hiện cuối cugraveng

9 Một số caacutec biện phaacutep xaacutec nhận Độ chiacutenh xaacutec Khả năng thiacutech nghi Mức độ đầy đủ Bề rộng Độ sacircu Hiệu lực Tổng quan Chiacutenh xaacutec Hiện thực Độ tin cậy Tiacutenh hữu dụng Mức độ

Chương 9 Học maacutey

1 Logic mờ vagrave ngocircn ngữ mờ(Fuzzy Logic and Linguistic Ambiguity)

Ngocircn ngữ tự nhiecircn gồm những khaacutei niệm mơ hồ vagrave khocircng chiacutenh xaacutectruyền tải ngữ nghĩa thocircng qua tiacutenh xấp xỉkhocircng rotilde ragraveng

Những xấp xỉ nagravey giuacutep con người coacute thể truyền tải hết được yacute nghĩa nhưng maacutey thigrave khocircng hiểu

Lagravem sao biểu diễn caacutec tri thức sử dụng caacutec khaacutei niệm khocircng rotilde ragraveng(mờ) hoặc khocircng chiacutenh xaacutec

2 Khaacutei niệm cơ bản của logic mờ tập mờ lagrave những tập hợp khocircng coacute một giới hạn rotilde Mỗi phần tử của noacute chỉ

chứa một mức độ hagravem liecircn thuộc của từng phần tử Vigrave vậy tập mờ khocircng giống như tập cổ điển Tập mờ coacute thể kết hợp với nhau qua những luật mờ magrave đặc trưng cho những hagravenh động trạng thaacutei vagrave thuộc tiacutenh của logic mờ được tận dụng khi thực hiện một bộ điều khiển mờ

Logic mờ dựa trecircn yacute tưởng mỗi phần tử thuộc vagraveo một tập hợp ở một mức độ nagraveo đấy

Locircgic mờ cho pheacutep độ liecircn thuộc (microA )coacute giaacute trị trong khoảng (01) Locircgic mờ coacute thể được coi lagrave mặt ứng dụng của lyacute thuyết tập mờ để xử lyacute caacutec

giaacute trị trong thế giới thực cho caacutec bagravei toaacuten phức tạp

3 So saacutenh tiacutenh đuacuteng đắn logic mờ vagrave xaacutec suất Xaacutec suất thigrave đề cập đến khả năng xảy ra một biến cố hay một điều gigrave đoacute Logic mờ đề cập đến cấp độ magrave đặc tiacutenh ở hiện tại

o viacute dụ1 người coacute chiều cao 6 feet thigrave coacute cấp độ lagrave 05 về chiều cao

4 Ưu điểm của logic mờ Caacutech tiếp cận rất tự nhiecircnkhocircng phức tạp Coacute thể mocirc higravenh hoacutea caacutec hagravem phi tuyến tugravey yacute phức tạp

Coacute thể tận dụng được kinh nghiệm từ những chuyecircn gia hagraveng đầu trong mọi lĩnh vực

Logic mờ được xacircy dựng dựa trecircn ngocircn ngữ tự nhiecircnNền tảng của logic mờ lagrave dựa trecircn cơ sở giao tiếp của con người

5 Nhược điểm của logic mờ Trong 1 hệ thống phức tạpsử dụng logic mờ coacute thể trở thagravenh trở ngại cho

việc xaacutec thực độ tin cậy của hệ thống Cơ chế lập luận mờ khocircng thể học hỏi từ những lỗi sai

6 Mạng noron nhacircn tạo(ANN) Mạng noron nhacircn tạo lagrave một mocirc phỏng xử lyacute thocircng tinđược nghiecircn cứu ra

từ hệ thống thần kinh của sinh vậtgiống như bộ natildeo để xử lyacute thocircng tin ANNs lagrave chương trigravenh dựa trecircn maacutey tiacutenh đơn giản coacute chức năng lagrave một mocirc

higravenh bagravei toaacuten khocircng gian dựa trecircn thử nghiệm vagrave baacuteo lỗi

7 Học từ kinh nghiệm Tiến trigravenh Một mẫu dữ liệu được biểu diễn như một mạng lưới noronANN ldquodự

đoaacutenrdquo 1 đầu radự đoaacuten được so saacutenh với giaacute trị thực tế hoặc giaacute trị chiacutenh xaacutecNếu đoaacuten được chiacutenh xaacutec thigrave khocircng coacute hagravenh động nagraveo được thực hiện

Nếu dự đoaacuten sai ANN kiểm tra lại vagrave xaacutec định lại thocircng số để điều chỉnh Một mẫu dữ liệu khaacutec được biểu diễn vagrave quaacute trigravenh nagravey được lặp lại

8 Nguyecircn tắc cơ bản của cocircng nghệ nơron Caacutec yếu tố xử lyacute cơ bản trong hệ thống thần kinh của con người lagrave tế bagraveo

thần kinhMạng lưới của tế bagraveo nagravey lagrave liecircn kết với nhau nhận được thocircng tin từ caacutec cảm biến trong mắt taihellip

Thocircng tin nhận được bởi tế bagraveo thần kinh hoặc lagrave sẽ kiacutech thiacutech noacute(sẽ được chuyển qua 1 thocircng điệp dọc theo mạng lưới) hoặc lagrave sẽ ngăn cản noacute(ngăn cản dograveng thocircng tin)

Độ nhạy coacute thể thay đổi qua thời gian hoặc sau khi coacute được kinh nghiệm

9 Cấu truacutec mạng Một ANN gồm 3 lớp cơ bản

Lớp đầu vagraveo nhận dữ liệu Lớp becircn trong hoặc lagrave lớp ẩn xử lyacute dữ liệu Lớp đầu ra chuyển tiếp kết quả cuối cugraveng của mạng

10Mạng nơ ron Thường coacute nhiều đầu vagraveo mỗi đầu vagraveo với mức ảnh hưởng vagrave tầm quan

trọng riecircng của noacute Một đầu vagraveo quan trọng coacute thể được sử dụng để khuếch đại đầu ra caacutec hagravem trạng thaacutei tổng hợp caacutec trọng số của caacutec yếu tố

đầuvagraveo khaacutec nhauvagraveo một giaacute trị duy nhất Caacutec hagravem chuyển giao xử lyacute caacutec giaacute trị trạng thaacutei vagrave tạo đầu ra

11Huấn luyện mạng nơ ron Trong mocirc higravenh coacute giaacutem saacutetANN được đến so saacutenh dự đoaacuten của chiacutenh

noacute với thocircng tin phản hồi coacute chứa caacutec kết quả mong muốn ANN sẽ phải tigravem caacutech thay đổi caacutec tham số becircn trong củamigravenh (caacutec trọng số vagrave caacutec ngưỡng) để tạo necircn một aacutenh xạ coacute khả năng aacutenh xạcaacutec đầu vagraveo thagravenh caacutec đầu ra mong muốn Sự thay đổi nagravey được tiến hagravenh nhờ việc so saacutenh giữa đầu ra thực sự vagrave đầu ra mong muốn

Trong mocirc higravenh khocircng coacute giaacutem saacutetANN nhận được dữ liệu vagraveo nhưng khocircng phải coacute bất kỳ thocircng tin phản hồi về kết quả mong muốn

Phần lớn caacutec ứng dụng nằm trong vugraveng của caacutec bagravei toaacuten ước lượng như mocirc higravenh hoacuteathống kecirc neacuten lọc phacircn cụm

12Lợi iacutech Liecircn kết với mạng noron Traacutenh caacutech lập trigravenh tường minh Giảm nhu cầu của chuyecircn gia ANNs thigrave thiacutech nghi với caacutec yếu tố đầu vagraveo thay đổi Khocircng cần thiết cho cơ sở tri thức tinh chế ANNs coacute tiacutenh động vagrave cải thiện với việc sử dụng Coacute khả năng xử lyacute dữ liệu khocircng chiacutenh xaacutec hoặc khocircng đầy đủ Cho pheacutep tổng quaacutet hoacutea từ thocircng tin cụ thể Cho pheacutep thu thập cảm giaacutec thocircng thường vagraveo miền giải quyết vấn đề

13Hạn chế của việc liecircn kết với mạng noron ANNs khocircng thể giải thiacutech được suy luận Bản chất hộp đen thường khiến cho vấn đề traacutech nhiệm vagrave độ tin cậy phaacutet

sinh lagrave khoacute khăn Lặp đi lặp lại quaacute trigravenh huấn luyện rất tốn thời gian Nguồn lực caacutec nhagrave phacircn tiacutech vagrave thiết kế coacute tay nghề cao vẫn lagrave đaacuteng lo

ngại Cocircng nghệ ANN thuacutec đẩy hạn chế của phần cứng hiện tại ANN yecircu cầu phải coacute sự tin tưởng ở đầu ra

14Giới thiệu về thuật toaacuten di truyền Cũng như mạng lưới thần kinh caacutec thuật toaacuten di truyền được dựa trecircn lyacute

thuyết sinh học Thuật toaacuten di truyền tigravem thấy nguồn gốc của chuacuteng trong caacutec lyacute thuyết

tiến hoacutea của chọn lọc tự nhiecircn vagrave thiacutech ứng với biến đổi khiacute hậu Kết quả thuật toaacuten di truyền lagrave từ giao phối 2 caacute thể trong quần thế để tạo

ra con caacutei đocirci khi tốt hơn so với bậc cha mẹ của chuacuteng 15Caacutec thagravenh phần cơ bản của thuật toaacuten di truyền

Toaacuten tử chọn lọc Caacutec caacute thể tốt được chọn lọc để đưa vagraveo thế hệ sau Sự chọn lọc nagravey căn cứ vagraveo độ thiacutech nghi với mocirci trường của mỗi caacute thể

Toaacuten tử lai gheacutep (crossover) Hai caacute thể cha vagrave mẹ trao đổi caacutec gen với nhau để tạo ra caacute thể con

Toaacuten tử đột biến (mutation) Một caacute thể thay đổi một số gen để biến đổi thagravenh một caacute thể mớiTất cả caacutec toaacuten tử trecircn khi thực hiện đều mang tiacutenh ngẫu nhiecircn

16Quaacute trigravenh cơ bản của một thuật toaacuten di truyền Khởi tạo

Đaacutenh giaacute quần thể

Lựa chọn NST thiacutech hợp nhất vagrave loại bỏ NST yếu nhất

Quy trigravenh giao nhau vagrave cải thiện quần thể

đột biến tiến trigravenh để khaacutem phaacute ra NST mới

17Ưu nhược điểm của việc kết hợp với thuật toaacuten di truyền Kiacutech thước quần thể lagrave 1 yếu tố quan trọng trong tốc độ của việc tigravem

kiếmnhưng noacute tương đối dễ dagraveng để dự đoaacuten tốc độ nagravey Giao nhau hoặc đột biến lagrave khocircng necircn đc sử dụng quaacute thường xuyecircn Luocircn coacute được iacutet nhất 1 giải phaacutep hợp lyacute Necircn coacute thể aacutep dụng chuacuteng cho caacutec vấn đề magrave chuacuteng ta khocircng coacute hướng

về caacutech giải quyết Sức mạnh của thuật toaacuten xuất phaacutet từ khaacutei niệm đơn giảnkhocircng phải từ

một thủ tục thuật toaacuten phức tạp 18Tương lai của học maacutey

Mạng lưới thần kinh nhacircn tạo vượt quaacute năng lực của con người trong caacutec trường hợp bị cocirc lập

Về mặt lyacute thuyếtmột maacutey tiacutenh coacute thể xử lyacute dũ liệu nhanh hơn hagraveng triệu lần so với 1 con người

May mắn thay cho chuacuteng tacon người tốt hơn nhiều khi magrave coacute được dữ liệumaacutey tiacutenh khocircng coacute 1 số thứ như lagrave 5 giaacutec quan

CHƯƠNG 10 KHO DỮ LIỆU

1 Kho dữ liệu Kho dữ liệu lagrave tuyển tập caacutec cơ sở dữ liệu tiacutech hợp hướng chủ đề được

thiết kế để trợ giuacutep cho một hệ hỗ trợ quyết định

Theo John Ladley Cocircng nghệ kho dữ liệu lagrave tập caacutec phương phaacutep kỹ thuật vagrave caacutec cocircng cụ coacute thể kết hợp hỗ trợ nhau để cung cấp thocircng tin cho người sử dụng trecircn cơ sở tiacutech hợp từ nhiều nguồn dữ liệu nhiều mocirci trường khaacutec nhau

Kho dữ liệu thường rất lớn tới hagraveng trăm GB hay thậm chiacute hagraveng Terabyte

2 Kho dữ liệu vận hagravenh (ODS) Một kho dữ liệu vận hagravenh Aacutep dụng kỹ thuật kho dữ liệu vagraveo caacutec hệ xử

lyacute giao taacutec lưu trữ dữ liệu cho một ứng dụng đặc thugrave Noacute đưa vagraveo kho dữ liệu một dograveng caacutec dữ liệu thocirc được thiết kế

3 So saacutenh

Kho dữ liệu vận hagravenh Kho dữ liệu

Dữ liệu theo chủ đề Dữ liệu theo chủ đề

Dữ liệu tiacutech hợp Dữ liệu tiacutech hợp

Dữ liệu thay đổi Dữ liệu khocircng thay đổi

Dữ liệu được cập nhật khi thay đổi

Dữ liệu giữ nguyecircn

Chỉ coacute dữ liệu hiện tạiDữliệu hiện tại vagrave dữ liệu lịch sử

Chu kỳ lagravem tươi dữ liệu ngắn Chu kỳ lagravem tươi dữ liệu dagravei

Chỉ coacute dữ liệu chi tiết Dữ liệu chi tiết vagrave dữ liệu tổng kết

Dugraveng cho caacutec quyết định ngắn hạn

Dugraveng cho hoạch định dagravei hạn

4 Kho dữ liệu cục bộ (Data Mart - DM)

Kho dữ liệu cục bộ lagrave CSDL coacute những đặc điểm giống với kho dữ liệu nhưng với quy mocirc nhỏ hơn vagrave lưu trữ dữ liệu về một lĩnh vực một chuyecircn ngagravenh

Data mart phụ thuộc Chứa những dữ liệu được lấy từ DW vagrave những dữ liệu nagravey sẽ được triacutech lọc vagrave tinh chế tiacutech hợp lại ở mức cao hơn để phục vụ một chủ đề nhất định của Datamart

Data mart độc lập Khocircng giống như Datamart phụ thuộc Data mart độc lập được xacircy dựng trước DW vagrave dữ liệu được trực tiếp lấy từ caacutec nguồn khaacutec nhau

5 Siecircu dữ liệu Metadata lagrave dữ liệu để mocirc tả dữ liệu Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột

một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi Metadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu

6 Mocirci trường kho dữ liệu Hệ thống của tổ chức vagrave kho cung cấp dữ liệu để xacircy dựng kho dữ liệu Trong quaacute trigravenh chuyển dữ liệu từ caacutec nguồn khaacutec nhau dữ liệu coacute thể

được lagravem sạch hoặc chuyển đổi vagrave vigrave thế DW được xem như lagrave một chuẩn cho việc lưu trữ

Đồng thời siecircu dữ liệu được ghi lại Cuối cugraveng DW hoặc siecircu thị coacute thể được sử dụng để tạo ra một kho dữ

liệu ldquocaacute nhacircnrdquo 7 Caacutec đặc điểm của kho dữ liệu

Đặc điểm Mocirc tả

Hướng chủ đề - DL tổ chức theo caacutech thức người dugraveng tham chiếu

Tiacutech hợp - Dữ liệu ldquosạchrdquo loại bỏ tiacutenh thiếu nhất quaacuten

Khocircng thay đổi - DL ldquochỉ đọcrdquo người dugraveng khocircng thay đổi được

Chuỗi thời gian - DL lagrave chuỗi thời gian khocircng phải lagrave trạng thaacutei hiện tại

Được tổng kết - DL vận hagravenhthao taacutec khi cần thiết

được kết hợp lại thagravenh dạng coacute thể dugraveng được cho quyết định

Kiacutech cỡ lớn hơn - Lưu giữ theo chuỗi thời gian tức lagrave giữ lại nhiều DL

Khocircng được chuẩn hoacutea - Coacute thể dư thừa DLSiecircu dữ liệu - Dữ liệu của dữ liệu được lưu trữNguồn dữ liệu - DL vận hagravenh (caacutec hệ sẵn coacute) cugraveng

với caacutec nguồn ngoagravei 8 Kho dữ liệu hướng chủ đề

Hướng chủ để coacute nghĩa lagrave kho dữ liệu được tổ chức xung quanh caacutec chủ đề chiacutenh như khaacutech hagraveng sản phẩm sản xuất Tập trung vagraveo việc mocirc higravenh hoacutea vagrave phacircn tiacutech dữ liệu cho caacutec nhagrave ra quyết định magrave khocircng tập trung vagraveo caacutec xử lyacute thocircng thường Cung cấp cho người dugraveng một khung nhigraven toagraven vẹn đơn giản vagrave đầy đủ về caacutec sự kiện quanh caacutec chủ đề

9 Dữ liệu trong DW được tiacutech hợp Dữ liệu trong kho dữ liệu được xacircy dựng bằng caacutech tổng hợp dữ liệu từ

nhiều nguồn khaacutec nhau vagrave caacutec nguồn coacute tổ chức khaacutec nhau Cơ sở dữ liệu caacutec file excel caacutec flat file hoặc caacutec raw file Khi đưa vagraveo kho dữ liệu caacutec dữ liệu được lagravem sạch vagrave tiacutech hợp dữ liệu nhằm đảm bảo tiacutenh nhất quaacuten của dữ liệu

10Kiến truacutec kho dữ liệu Tầng cơ sở dữ liệu hoạt động Tầng truy xuất thocircng tin Tầng truy xuất dữ liệu Tầng siecircu dữ liệu Tầng quản lyacute tiến trigravenh Tầng thocircng điệp của ứng dụng Tầng vật liacute của kho dữ liệu Tầng trigravenh diễn dữ liệu

11Higravenh trạng kho dữ liệu Kho dữ liệu ảo - người dugraveng cuối coacute thể truy cập trực tiếp đến kho dữ liệu

sử dụng caacutec cocircng cụ cho pheacutep ở tầng truy xuất dữ liệu Kho dữ liệu trung tacircm-1 cơ sở dữ liệu vật lyacute chứa tất cả dữ liệu cho một

vugraveng chuyecircn dụng nagraveo đoacute

Kho dữ liệu phacircn taacuten- Thagravenh phần được phacircn taacuten qua nhiều hệ cơ sở dữ liệu vật lyacute

12METADATA- Siecircu dữ liệu Định nghĩa Siecircu dữ liệu lagrave dữ liệu về dữ liệu Lagrave 1 lưu trữ dugraveng để

Miecircu tả kho dữ liệu tổng thể Nhận dạng kiểu kho dữ liệu Quản liacute quaacute trigravenh tiacutech hợp dữ liệu Quản liacute quaacute trigravenh cập nhật kho dữ liệu Quản liacute bảo mật

Lagrave chigravea khoacutea quyết định sự thagravenh cocircng của kho dữ liệu luocircn được thay đổi vagrave cập nhật theo sự phaacutet triển của kho dữ liệu

Dugraveng để quản liacute điều khiển kho dữ liệu Sự ra đời của kho dữ liệu như 1 cấu truacutec hỗ trợ ra quyết định siecircu dữ liệu

được xem như nguồn tagravei nguyecircn dữ liệu Siecircu dữ liệu lagrave trừu tượng Chuacuteng lagrave dữ liệu bậc cao cung cấp mocirc tả ngắn

gọn caacutec dữ liệu bậc thấp hơn 13Hoạt động của Siecircu dữ liệu

Siecircu dữ liệu rất cần thiết trong việc chuyển hoacutea thocircng tin trở thagravenh tri thức Lagrave chigravea khoacutea giuacutep chuacuteng ta xử lyacute được dữ liệu thocirc Viacute dụ một dograveng dữ liệu baacuten hagraveng 1023 K596 11121 agraveNoacute sẽ khocircng coacute nghĩa gigrave cho đến khi chuacuteng ta đưa vagraveo siecircu dữ liệu (thư

mục chứa dữ liệu) agrave cửa hagraveng 1023 sản phẩm K596 vagrave số tiền baacuten được lagrave 11121 đocirc la

14Sự cần thiết phải nhất quaacuten trong kho dữ liệu Kho dữ liệu được xacircy dựng cho lợi iacutech của những nhagrave phacircn tiacutech kinh

doanh caacutec nhagrave quản trị cho tất cả caacutec khu vực chức năng Trong cơ sở dữ liệu riecircng caacutec khu vực khaacutec nhau coacute thể định nghĩa vagrave lưu

trữ dữ liệu thocircng qua phiecircn bản của chiacutenh noacute Khi dữ liệu được lấy từ những vugraveng khaacutec nhau đoacute vagrave được đặt vagraveo kho dữ

liệu Việc chuyển đổi vagrave lagravem sạch caacutec tiến trigravenh sẽ đảm bảo noacute lagrave duy nhất được tiacutech hợp tại một mức của tổ chức

15Ragrave soaacutet lại dữ liệu ndash Thực thi siecircu dữ liệu

Bất kể cấu truacutec tự nhiecircn của 1 cacircu truy vấn thế nagraveo thigrave caacutec thagravenh phần của siecircu dữ liệu rất quan trọng đối với người ra quyết định

Bảng thuộc tiacutenh khoacutea được lưu trữ bởi kho dữ liệu Tập hợp dữ liệu được lấy từ đacircu Những chuyển đổi nagraveo được thực thi với việc lagravem sạch

16Siecircu dữ liệu lagrave gigrave Metadata - lagrave thocircng tin mocirc tả nội dung của cơ sở dữ liệu (CSDL) Metadata baacuteo cho người dugraveng biết thời gian cập nhật sau cugraveng của dữ liệu

định dạng vagrave mục điacutech sử dụng của noacute Những thocircng tin nagravey coacute thể hướng dẫn người dugraveng duyệt qua CSDL vagrave

giuacutep họ hiểu được yacute nghĩa vagrave ngữ cảnh của dữ liệu Trong CSDL metadata lagrave caacutec dạng biểu diễn khaacutec nhau của caacutec đối tượng

trong CSDL Trong CSDL quan hệ metadata lagrave caacutec định nghĩa của bảng cột CSDL

view vagrave nhiều đối tượng khaacutec Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột

một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi -gtMetadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu

Bảng chuyển đổi Ghi lại những chuyển đổi đatilde được thực hiện

Lịch sử thực thi Ghi lại những dữ liệu đatilde được

phacircn tiacutech

Higravenh thaacutei kết nốiGhi lại những dữ liệu được kết nối vagrave tần suất

17Aacutenh xạ thocircng thường của siecircu dữ liệu Bản ghi aacutenh xạ chuyển đổi bao gồm

Định danh của nguồn gốc Chuyển đổi thuộc tiacutenh Chuyển đổi thuộc tiacutenh vật lyacute Matilde hoacutea tham chiếu bảng chuyển đổi Đổi tecircn Đổi khoacutea Gaacuten giaacute trị cho thuộc tiacutenh mặc định Chọn logic cho caacutec nguồn nhiều giaacute trị Đổi thuật toaacuten

18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để

phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai

lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave

tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec

Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm

Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo

19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua

caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau

SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được

Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra

một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức

Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ

Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ

Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech

CHƯƠNG 11 KHAI PHAacute DỮ LIỆU

1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn

ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993

Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng

2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd

1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều

2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP

3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn

4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng

5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server

6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo

7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động

8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời

9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều

10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện

11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech

12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP

3 Xử lyacute phacircn tiacutech trực tuyến OLAP

MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave

dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu

ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave

thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu

HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave

ROLAP4 Khai phaacute dữ liệu

Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh

khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn

Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan

5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp

6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại

Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp

Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec

Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt

Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra

Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh

vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho

Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec

Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm

Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục

Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng

gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp

Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn

Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec

Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper

Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2

Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25

Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước

Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng

Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện

trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp

Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute

độ hỗ trợ ge ngưỡng minsup

độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan

Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn

Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết

Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu

MOLAP ROLAP HOLAP

Lưu trữ dữ liệu cơ sở

Khối Bảng quan hệ Bảng quan hệ

Lưu trữ thocircng tin tổng hợp

Khối Bảng quan hệ Khối

Hiệu suất thực hiện truy vấn

Nhanh nhất Chậm nhất Nhanh

Tiecircu thụ khocircng gian lưu trữ

Nhiều Thấp Trung bigravenh

Chi phiacute bảo trigrave Cao Thấp Trung bigravenh

Page 47: De cuong(1-11)

Tri thức lagrave 1 trong 6 trạng thaacutei của hệ thống

1Dữ liệu 2Thocircng tin 3Cấu truacutec thocircng tin 4Sự thấu hiểu 5Yacute kiến 6 Quyết định

3 Caacutec loại tri thức Phổ biến mocirc tả dữ liệu thocircng tin thủ tục mọi thứ lagravem như thế nagraveo lập luận chiacutenh saacutech hoặc caacutec quy tắc

4 Thu thập Tri thức hệ chuyecircn gia Hầu hết caacutec phương phaacutep đều bắt đầu với mocirc higravenh của caacutec taacutec vụ trong đoacute

hệ chuyecircn gia được xacircy dựng Trong đoacute mocirc tả về caacutec lĩnh vực được tạo ra Caacutec kỹ sư sử dụng caacutec mocirc higravenh giả thuyết vagrave nhận thức về quaacute trigravenh phacircn

tiacutech để gợi ra caacutech giải quyết vấn đề về tri thức từ caacutec chuyecircn gia

5 Caacutec chiều của thu thập tri thức KE- driven caacutec kỹ sư trao đổi trực tiếp với caacutec chuyecircn gia Expert-driven Caacutec chuyecircn gia trực tiếp đưa chuyecircn mocircn của họ vagraveo hệ

thống maacutey tiacutenh Machine-driven Sử dụng caacutec cocircng cụ suy luận để triacutech xuất tri thức từ một

tập caacutec viacute dụ

6 Kỹ thuật thu thập tri thức Trao đổi gồm 2 loại cơ bản lagrave coacute cấu truacutec(coacute kịch bản) vagrave khocircng coacute cấu

truacutec( đối thoại trực tiếp) Giao thức phacircn tiacutech bằng lời Khi caacutec chuyecircn gia thực hiện một cocircng việc

của họ thigrave một bản ghi về cocircng việc đoacute được thực hiện Caacutec kỹ sư sẽ xacircy dựng mocirc higravenh cho những gigrave được ghi lại trong bản ghi

Phương phaacutep sagraveng lọc caacutec chuyecircn gia so saacutenh caacutec nhoacutem liecircn tiếp trong ba đối tượng vagrave cho biết tại sao nhoacutem thứ hai lại khaacutec nhoacutem thứ ba

7 Thu thập tri thức từ nhiều nguồn Thu thập tri thức từ nhiều nguồn lagrave cần thiết để coacute được đầy đủ caacutec tri thức

cho một vấn đề quan điểm yacute kiến traacutei ngược nhau thường phaacutet sinh Phương phaacutep đồng thuận sẽ giuacutep giải quyết được vấn đề macircu thuẫn Kỹ thuật phacircn tiacutech Meta lagrave kỹ thuật được aacutep dụng trong caacutec trường hợp

khaacutec Caacutech tiếp cận bằng định lượng đogravei hỏi caacutec kỹ sư cần cacircn nhắc yếu tố đầu vagraveo của caacutec chuyecircn gia khaacutec nhau

8 Xaacutec nhận hợp lệ vagrave kiểm tra tri thức Một khi thu thập tri thức noacute phải được đaacutenh giaacute về khả năng sử dụng vagrave độ

chiacutenh xaacutec Hai vấn đề cụ thể lagrave hiệu lực của những kiến thức vagrave kiểm tra việc xacircy dựng cơ sở của tri thức

Cần xaacutec nhận xem liệu hệ thống coacute thể hoạt động ở mức độ tối thiểu khocircng

Xaacutec minh liecircn quan đến việc so saacutenh từng chi tiết kỹ thuật của hệ thống những gigrave đatilde được thực hiện cuối cugraveng

9 Một số caacutec biện phaacutep xaacutec nhận Độ chiacutenh xaacutec Khả năng thiacutech nghi Mức độ đầy đủ Bề rộng Độ sacircu Hiệu lực Tổng quan Chiacutenh xaacutec Hiện thực Độ tin cậy Tiacutenh hữu dụng Mức độ

Chương 9 Học maacutey

1 Logic mờ vagrave ngocircn ngữ mờ(Fuzzy Logic and Linguistic Ambiguity)

Ngocircn ngữ tự nhiecircn gồm những khaacutei niệm mơ hồ vagrave khocircng chiacutenh xaacutectruyền tải ngữ nghĩa thocircng qua tiacutenh xấp xỉkhocircng rotilde ragraveng

Những xấp xỉ nagravey giuacutep con người coacute thể truyền tải hết được yacute nghĩa nhưng maacutey thigrave khocircng hiểu

Lagravem sao biểu diễn caacutec tri thức sử dụng caacutec khaacutei niệm khocircng rotilde ragraveng(mờ) hoặc khocircng chiacutenh xaacutec

2 Khaacutei niệm cơ bản của logic mờ tập mờ lagrave những tập hợp khocircng coacute một giới hạn rotilde Mỗi phần tử của noacute chỉ

chứa một mức độ hagravem liecircn thuộc của từng phần tử Vigrave vậy tập mờ khocircng giống như tập cổ điển Tập mờ coacute thể kết hợp với nhau qua những luật mờ magrave đặc trưng cho những hagravenh động trạng thaacutei vagrave thuộc tiacutenh của logic mờ được tận dụng khi thực hiện một bộ điều khiển mờ

Logic mờ dựa trecircn yacute tưởng mỗi phần tử thuộc vagraveo một tập hợp ở một mức độ nagraveo đấy

Locircgic mờ cho pheacutep độ liecircn thuộc (microA )coacute giaacute trị trong khoảng (01) Locircgic mờ coacute thể được coi lagrave mặt ứng dụng của lyacute thuyết tập mờ để xử lyacute caacutec

giaacute trị trong thế giới thực cho caacutec bagravei toaacuten phức tạp

3 So saacutenh tiacutenh đuacuteng đắn logic mờ vagrave xaacutec suất Xaacutec suất thigrave đề cập đến khả năng xảy ra một biến cố hay một điều gigrave đoacute Logic mờ đề cập đến cấp độ magrave đặc tiacutenh ở hiện tại

o viacute dụ1 người coacute chiều cao 6 feet thigrave coacute cấp độ lagrave 05 về chiều cao

4 Ưu điểm của logic mờ Caacutech tiếp cận rất tự nhiecircnkhocircng phức tạp Coacute thể mocirc higravenh hoacutea caacutec hagravem phi tuyến tugravey yacute phức tạp

Coacute thể tận dụng được kinh nghiệm từ những chuyecircn gia hagraveng đầu trong mọi lĩnh vực

Logic mờ được xacircy dựng dựa trecircn ngocircn ngữ tự nhiecircnNền tảng của logic mờ lagrave dựa trecircn cơ sở giao tiếp của con người

5 Nhược điểm của logic mờ Trong 1 hệ thống phức tạpsử dụng logic mờ coacute thể trở thagravenh trở ngại cho

việc xaacutec thực độ tin cậy của hệ thống Cơ chế lập luận mờ khocircng thể học hỏi từ những lỗi sai

6 Mạng noron nhacircn tạo(ANN) Mạng noron nhacircn tạo lagrave một mocirc phỏng xử lyacute thocircng tinđược nghiecircn cứu ra

từ hệ thống thần kinh của sinh vậtgiống như bộ natildeo để xử lyacute thocircng tin ANNs lagrave chương trigravenh dựa trecircn maacutey tiacutenh đơn giản coacute chức năng lagrave một mocirc

higravenh bagravei toaacuten khocircng gian dựa trecircn thử nghiệm vagrave baacuteo lỗi

7 Học từ kinh nghiệm Tiến trigravenh Một mẫu dữ liệu được biểu diễn như một mạng lưới noronANN ldquodự

đoaacutenrdquo 1 đầu radự đoaacuten được so saacutenh với giaacute trị thực tế hoặc giaacute trị chiacutenh xaacutecNếu đoaacuten được chiacutenh xaacutec thigrave khocircng coacute hagravenh động nagraveo được thực hiện

Nếu dự đoaacuten sai ANN kiểm tra lại vagrave xaacutec định lại thocircng số để điều chỉnh Một mẫu dữ liệu khaacutec được biểu diễn vagrave quaacute trigravenh nagravey được lặp lại

8 Nguyecircn tắc cơ bản của cocircng nghệ nơron Caacutec yếu tố xử lyacute cơ bản trong hệ thống thần kinh của con người lagrave tế bagraveo

thần kinhMạng lưới của tế bagraveo nagravey lagrave liecircn kết với nhau nhận được thocircng tin từ caacutec cảm biến trong mắt taihellip

Thocircng tin nhận được bởi tế bagraveo thần kinh hoặc lagrave sẽ kiacutech thiacutech noacute(sẽ được chuyển qua 1 thocircng điệp dọc theo mạng lưới) hoặc lagrave sẽ ngăn cản noacute(ngăn cản dograveng thocircng tin)

Độ nhạy coacute thể thay đổi qua thời gian hoặc sau khi coacute được kinh nghiệm

9 Cấu truacutec mạng Một ANN gồm 3 lớp cơ bản

Lớp đầu vagraveo nhận dữ liệu Lớp becircn trong hoặc lagrave lớp ẩn xử lyacute dữ liệu Lớp đầu ra chuyển tiếp kết quả cuối cugraveng của mạng

10Mạng nơ ron Thường coacute nhiều đầu vagraveo mỗi đầu vagraveo với mức ảnh hưởng vagrave tầm quan

trọng riecircng của noacute Một đầu vagraveo quan trọng coacute thể được sử dụng để khuếch đại đầu ra caacutec hagravem trạng thaacutei tổng hợp caacutec trọng số của caacutec yếu tố

đầuvagraveo khaacutec nhauvagraveo một giaacute trị duy nhất Caacutec hagravem chuyển giao xử lyacute caacutec giaacute trị trạng thaacutei vagrave tạo đầu ra

11Huấn luyện mạng nơ ron Trong mocirc higravenh coacute giaacutem saacutetANN được đến so saacutenh dự đoaacuten của chiacutenh

noacute với thocircng tin phản hồi coacute chứa caacutec kết quả mong muốn ANN sẽ phải tigravem caacutech thay đổi caacutec tham số becircn trong củamigravenh (caacutec trọng số vagrave caacutec ngưỡng) để tạo necircn một aacutenh xạ coacute khả năng aacutenh xạcaacutec đầu vagraveo thagravenh caacutec đầu ra mong muốn Sự thay đổi nagravey được tiến hagravenh nhờ việc so saacutenh giữa đầu ra thực sự vagrave đầu ra mong muốn

Trong mocirc higravenh khocircng coacute giaacutem saacutetANN nhận được dữ liệu vagraveo nhưng khocircng phải coacute bất kỳ thocircng tin phản hồi về kết quả mong muốn

Phần lớn caacutec ứng dụng nằm trong vugraveng của caacutec bagravei toaacuten ước lượng như mocirc higravenh hoacuteathống kecirc neacuten lọc phacircn cụm

12Lợi iacutech Liecircn kết với mạng noron Traacutenh caacutech lập trigravenh tường minh Giảm nhu cầu của chuyecircn gia ANNs thigrave thiacutech nghi với caacutec yếu tố đầu vagraveo thay đổi Khocircng cần thiết cho cơ sở tri thức tinh chế ANNs coacute tiacutenh động vagrave cải thiện với việc sử dụng Coacute khả năng xử lyacute dữ liệu khocircng chiacutenh xaacutec hoặc khocircng đầy đủ Cho pheacutep tổng quaacutet hoacutea từ thocircng tin cụ thể Cho pheacutep thu thập cảm giaacutec thocircng thường vagraveo miền giải quyết vấn đề

13Hạn chế của việc liecircn kết với mạng noron ANNs khocircng thể giải thiacutech được suy luận Bản chất hộp đen thường khiến cho vấn đề traacutech nhiệm vagrave độ tin cậy phaacutet

sinh lagrave khoacute khăn Lặp đi lặp lại quaacute trigravenh huấn luyện rất tốn thời gian Nguồn lực caacutec nhagrave phacircn tiacutech vagrave thiết kế coacute tay nghề cao vẫn lagrave đaacuteng lo

ngại Cocircng nghệ ANN thuacutec đẩy hạn chế của phần cứng hiện tại ANN yecircu cầu phải coacute sự tin tưởng ở đầu ra

14Giới thiệu về thuật toaacuten di truyền Cũng như mạng lưới thần kinh caacutec thuật toaacuten di truyền được dựa trecircn lyacute

thuyết sinh học Thuật toaacuten di truyền tigravem thấy nguồn gốc của chuacuteng trong caacutec lyacute thuyết

tiến hoacutea của chọn lọc tự nhiecircn vagrave thiacutech ứng với biến đổi khiacute hậu Kết quả thuật toaacuten di truyền lagrave từ giao phối 2 caacute thể trong quần thế để tạo

ra con caacutei đocirci khi tốt hơn so với bậc cha mẹ của chuacuteng 15Caacutec thagravenh phần cơ bản của thuật toaacuten di truyền

Toaacuten tử chọn lọc Caacutec caacute thể tốt được chọn lọc để đưa vagraveo thế hệ sau Sự chọn lọc nagravey căn cứ vagraveo độ thiacutech nghi với mocirci trường của mỗi caacute thể

Toaacuten tử lai gheacutep (crossover) Hai caacute thể cha vagrave mẹ trao đổi caacutec gen với nhau để tạo ra caacute thể con

Toaacuten tử đột biến (mutation) Một caacute thể thay đổi một số gen để biến đổi thagravenh một caacute thể mớiTất cả caacutec toaacuten tử trecircn khi thực hiện đều mang tiacutenh ngẫu nhiecircn

16Quaacute trigravenh cơ bản của một thuật toaacuten di truyền Khởi tạo

Đaacutenh giaacute quần thể

Lựa chọn NST thiacutech hợp nhất vagrave loại bỏ NST yếu nhất

Quy trigravenh giao nhau vagrave cải thiện quần thể

đột biến tiến trigravenh để khaacutem phaacute ra NST mới

17Ưu nhược điểm của việc kết hợp với thuật toaacuten di truyền Kiacutech thước quần thể lagrave 1 yếu tố quan trọng trong tốc độ của việc tigravem

kiếmnhưng noacute tương đối dễ dagraveng để dự đoaacuten tốc độ nagravey Giao nhau hoặc đột biến lagrave khocircng necircn đc sử dụng quaacute thường xuyecircn Luocircn coacute được iacutet nhất 1 giải phaacutep hợp lyacute Necircn coacute thể aacutep dụng chuacuteng cho caacutec vấn đề magrave chuacuteng ta khocircng coacute hướng

về caacutech giải quyết Sức mạnh của thuật toaacuten xuất phaacutet từ khaacutei niệm đơn giảnkhocircng phải từ

một thủ tục thuật toaacuten phức tạp 18Tương lai của học maacutey

Mạng lưới thần kinh nhacircn tạo vượt quaacute năng lực của con người trong caacutec trường hợp bị cocirc lập

Về mặt lyacute thuyếtmột maacutey tiacutenh coacute thể xử lyacute dũ liệu nhanh hơn hagraveng triệu lần so với 1 con người

May mắn thay cho chuacuteng tacon người tốt hơn nhiều khi magrave coacute được dữ liệumaacutey tiacutenh khocircng coacute 1 số thứ như lagrave 5 giaacutec quan

CHƯƠNG 10 KHO DỮ LIỆU

1 Kho dữ liệu Kho dữ liệu lagrave tuyển tập caacutec cơ sở dữ liệu tiacutech hợp hướng chủ đề được

thiết kế để trợ giuacutep cho một hệ hỗ trợ quyết định

Theo John Ladley Cocircng nghệ kho dữ liệu lagrave tập caacutec phương phaacutep kỹ thuật vagrave caacutec cocircng cụ coacute thể kết hợp hỗ trợ nhau để cung cấp thocircng tin cho người sử dụng trecircn cơ sở tiacutech hợp từ nhiều nguồn dữ liệu nhiều mocirci trường khaacutec nhau

Kho dữ liệu thường rất lớn tới hagraveng trăm GB hay thậm chiacute hagraveng Terabyte

2 Kho dữ liệu vận hagravenh (ODS) Một kho dữ liệu vận hagravenh Aacutep dụng kỹ thuật kho dữ liệu vagraveo caacutec hệ xử

lyacute giao taacutec lưu trữ dữ liệu cho một ứng dụng đặc thugrave Noacute đưa vagraveo kho dữ liệu một dograveng caacutec dữ liệu thocirc được thiết kế

3 So saacutenh

Kho dữ liệu vận hagravenh Kho dữ liệu

Dữ liệu theo chủ đề Dữ liệu theo chủ đề

Dữ liệu tiacutech hợp Dữ liệu tiacutech hợp

Dữ liệu thay đổi Dữ liệu khocircng thay đổi

Dữ liệu được cập nhật khi thay đổi

Dữ liệu giữ nguyecircn

Chỉ coacute dữ liệu hiện tạiDữliệu hiện tại vagrave dữ liệu lịch sử

Chu kỳ lagravem tươi dữ liệu ngắn Chu kỳ lagravem tươi dữ liệu dagravei

Chỉ coacute dữ liệu chi tiết Dữ liệu chi tiết vagrave dữ liệu tổng kết

Dugraveng cho caacutec quyết định ngắn hạn

Dugraveng cho hoạch định dagravei hạn

4 Kho dữ liệu cục bộ (Data Mart - DM)

Kho dữ liệu cục bộ lagrave CSDL coacute những đặc điểm giống với kho dữ liệu nhưng với quy mocirc nhỏ hơn vagrave lưu trữ dữ liệu về một lĩnh vực một chuyecircn ngagravenh

Data mart phụ thuộc Chứa những dữ liệu được lấy từ DW vagrave những dữ liệu nagravey sẽ được triacutech lọc vagrave tinh chế tiacutech hợp lại ở mức cao hơn để phục vụ một chủ đề nhất định của Datamart

Data mart độc lập Khocircng giống như Datamart phụ thuộc Data mart độc lập được xacircy dựng trước DW vagrave dữ liệu được trực tiếp lấy từ caacutec nguồn khaacutec nhau

5 Siecircu dữ liệu Metadata lagrave dữ liệu để mocirc tả dữ liệu Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột

một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi Metadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu

6 Mocirci trường kho dữ liệu Hệ thống của tổ chức vagrave kho cung cấp dữ liệu để xacircy dựng kho dữ liệu Trong quaacute trigravenh chuyển dữ liệu từ caacutec nguồn khaacutec nhau dữ liệu coacute thể

được lagravem sạch hoặc chuyển đổi vagrave vigrave thế DW được xem như lagrave một chuẩn cho việc lưu trữ

Đồng thời siecircu dữ liệu được ghi lại Cuối cugraveng DW hoặc siecircu thị coacute thể được sử dụng để tạo ra một kho dữ

liệu ldquocaacute nhacircnrdquo 7 Caacutec đặc điểm của kho dữ liệu

Đặc điểm Mocirc tả

Hướng chủ đề - DL tổ chức theo caacutech thức người dugraveng tham chiếu

Tiacutech hợp - Dữ liệu ldquosạchrdquo loại bỏ tiacutenh thiếu nhất quaacuten

Khocircng thay đổi - DL ldquochỉ đọcrdquo người dugraveng khocircng thay đổi được

Chuỗi thời gian - DL lagrave chuỗi thời gian khocircng phải lagrave trạng thaacutei hiện tại

Được tổng kết - DL vận hagravenhthao taacutec khi cần thiết

được kết hợp lại thagravenh dạng coacute thể dugraveng được cho quyết định

Kiacutech cỡ lớn hơn - Lưu giữ theo chuỗi thời gian tức lagrave giữ lại nhiều DL

Khocircng được chuẩn hoacutea - Coacute thể dư thừa DLSiecircu dữ liệu - Dữ liệu của dữ liệu được lưu trữNguồn dữ liệu - DL vận hagravenh (caacutec hệ sẵn coacute) cugraveng

với caacutec nguồn ngoagravei 8 Kho dữ liệu hướng chủ đề

Hướng chủ để coacute nghĩa lagrave kho dữ liệu được tổ chức xung quanh caacutec chủ đề chiacutenh như khaacutech hagraveng sản phẩm sản xuất Tập trung vagraveo việc mocirc higravenh hoacutea vagrave phacircn tiacutech dữ liệu cho caacutec nhagrave ra quyết định magrave khocircng tập trung vagraveo caacutec xử lyacute thocircng thường Cung cấp cho người dugraveng một khung nhigraven toagraven vẹn đơn giản vagrave đầy đủ về caacutec sự kiện quanh caacutec chủ đề

9 Dữ liệu trong DW được tiacutech hợp Dữ liệu trong kho dữ liệu được xacircy dựng bằng caacutech tổng hợp dữ liệu từ

nhiều nguồn khaacutec nhau vagrave caacutec nguồn coacute tổ chức khaacutec nhau Cơ sở dữ liệu caacutec file excel caacutec flat file hoặc caacutec raw file Khi đưa vagraveo kho dữ liệu caacutec dữ liệu được lagravem sạch vagrave tiacutech hợp dữ liệu nhằm đảm bảo tiacutenh nhất quaacuten của dữ liệu

10Kiến truacutec kho dữ liệu Tầng cơ sở dữ liệu hoạt động Tầng truy xuất thocircng tin Tầng truy xuất dữ liệu Tầng siecircu dữ liệu Tầng quản lyacute tiến trigravenh Tầng thocircng điệp của ứng dụng Tầng vật liacute của kho dữ liệu Tầng trigravenh diễn dữ liệu

11Higravenh trạng kho dữ liệu Kho dữ liệu ảo - người dugraveng cuối coacute thể truy cập trực tiếp đến kho dữ liệu

sử dụng caacutec cocircng cụ cho pheacutep ở tầng truy xuất dữ liệu Kho dữ liệu trung tacircm-1 cơ sở dữ liệu vật lyacute chứa tất cả dữ liệu cho một

vugraveng chuyecircn dụng nagraveo đoacute

Kho dữ liệu phacircn taacuten- Thagravenh phần được phacircn taacuten qua nhiều hệ cơ sở dữ liệu vật lyacute

12METADATA- Siecircu dữ liệu Định nghĩa Siecircu dữ liệu lagrave dữ liệu về dữ liệu Lagrave 1 lưu trữ dugraveng để

Miecircu tả kho dữ liệu tổng thể Nhận dạng kiểu kho dữ liệu Quản liacute quaacute trigravenh tiacutech hợp dữ liệu Quản liacute quaacute trigravenh cập nhật kho dữ liệu Quản liacute bảo mật

Lagrave chigravea khoacutea quyết định sự thagravenh cocircng của kho dữ liệu luocircn được thay đổi vagrave cập nhật theo sự phaacutet triển của kho dữ liệu

Dugraveng để quản liacute điều khiển kho dữ liệu Sự ra đời của kho dữ liệu như 1 cấu truacutec hỗ trợ ra quyết định siecircu dữ liệu

được xem như nguồn tagravei nguyecircn dữ liệu Siecircu dữ liệu lagrave trừu tượng Chuacuteng lagrave dữ liệu bậc cao cung cấp mocirc tả ngắn

gọn caacutec dữ liệu bậc thấp hơn 13Hoạt động của Siecircu dữ liệu

Siecircu dữ liệu rất cần thiết trong việc chuyển hoacutea thocircng tin trở thagravenh tri thức Lagrave chigravea khoacutea giuacutep chuacuteng ta xử lyacute được dữ liệu thocirc Viacute dụ một dograveng dữ liệu baacuten hagraveng 1023 K596 11121 agraveNoacute sẽ khocircng coacute nghĩa gigrave cho đến khi chuacuteng ta đưa vagraveo siecircu dữ liệu (thư

mục chứa dữ liệu) agrave cửa hagraveng 1023 sản phẩm K596 vagrave số tiền baacuten được lagrave 11121 đocirc la

14Sự cần thiết phải nhất quaacuten trong kho dữ liệu Kho dữ liệu được xacircy dựng cho lợi iacutech của những nhagrave phacircn tiacutech kinh

doanh caacutec nhagrave quản trị cho tất cả caacutec khu vực chức năng Trong cơ sở dữ liệu riecircng caacutec khu vực khaacutec nhau coacute thể định nghĩa vagrave lưu

trữ dữ liệu thocircng qua phiecircn bản của chiacutenh noacute Khi dữ liệu được lấy từ những vugraveng khaacutec nhau đoacute vagrave được đặt vagraveo kho dữ

liệu Việc chuyển đổi vagrave lagravem sạch caacutec tiến trigravenh sẽ đảm bảo noacute lagrave duy nhất được tiacutech hợp tại một mức của tổ chức

15Ragrave soaacutet lại dữ liệu ndash Thực thi siecircu dữ liệu

Bất kể cấu truacutec tự nhiecircn của 1 cacircu truy vấn thế nagraveo thigrave caacutec thagravenh phần của siecircu dữ liệu rất quan trọng đối với người ra quyết định

Bảng thuộc tiacutenh khoacutea được lưu trữ bởi kho dữ liệu Tập hợp dữ liệu được lấy từ đacircu Những chuyển đổi nagraveo được thực thi với việc lagravem sạch

16Siecircu dữ liệu lagrave gigrave Metadata - lagrave thocircng tin mocirc tả nội dung của cơ sở dữ liệu (CSDL) Metadata baacuteo cho người dugraveng biết thời gian cập nhật sau cugraveng của dữ liệu

định dạng vagrave mục điacutech sử dụng của noacute Những thocircng tin nagravey coacute thể hướng dẫn người dugraveng duyệt qua CSDL vagrave

giuacutep họ hiểu được yacute nghĩa vagrave ngữ cảnh của dữ liệu Trong CSDL metadata lagrave caacutec dạng biểu diễn khaacutec nhau của caacutec đối tượng

trong CSDL Trong CSDL quan hệ metadata lagrave caacutec định nghĩa của bảng cột CSDL

view vagrave nhiều đối tượng khaacutec Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột

một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi -gtMetadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu

Bảng chuyển đổi Ghi lại những chuyển đổi đatilde được thực hiện

Lịch sử thực thi Ghi lại những dữ liệu đatilde được

phacircn tiacutech

Higravenh thaacutei kết nốiGhi lại những dữ liệu được kết nối vagrave tần suất

17Aacutenh xạ thocircng thường của siecircu dữ liệu Bản ghi aacutenh xạ chuyển đổi bao gồm

Định danh của nguồn gốc Chuyển đổi thuộc tiacutenh Chuyển đổi thuộc tiacutenh vật lyacute Matilde hoacutea tham chiếu bảng chuyển đổi Đổi tecircn Đổi khoacutea Gaacuten giaacute trị cho thuộc tiacutenh mặc định Chọn logic cho caacutec nguồn nhiều giaacute trị Đổi thuật toaacuten

18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để

phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai

lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave

tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec

Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm

Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo

19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua

caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau

SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được

Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra

một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức

Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ

Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ

Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech

CHƯƠNG 11 KHAI PHAacute DỮ LIỆU

1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn

ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993

Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng

2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd

1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều

2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP

3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn

4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng

5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server

6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo

7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động

8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời

9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều

10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện

11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech

12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP

3 Xử lyacute phacircn tiacutech trực tuyến OLAP

MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave

dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu

ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave

thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu

HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave

ROLAP4 Khai phaacute dữ liệu

Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh

khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn

Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan

5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp

6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại

Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp

Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec

Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt

Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra

Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh

vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho

Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec

Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm

Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục

Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng

gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp

Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn

Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec

Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper

Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2

Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25

Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước

Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng

Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện

trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp

Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute

độ hỗ trợ ge ngưỡng minsup

độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan

Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn

Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết

Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu

MOLAP ROLAP HOLAP

Lưu trữ dữ liệu cơ sở

Khối Bảng quan hệ Bảng quan hệ

Lưu trữ thocircng tin tổng hợp

Khối Bảng quan hệ Khối

Hiệu suất thực hiện truy vấn

Nhanh nhất Chậm nhất Nhanh

Tiecircu thụ khocircng gian lưu trữ

Nhiều Thấp Trung bigravenh

Chi phiacute bảo trigrave Cao Thấp Trung bigravenh

Page 48: De cuong(1-11)

Phương phaacutep sagraveng lọc caacutec chuyecircn gia so saacutenh caacutec nhoacutem liecircn tiếp trong ba đối tượng vagrave cho biết tại sao nhoacutem thứ hai lại khaacutec nhoacutem thứ ba

7 Thu thập tri thức từ nhiều nguồn Thu thập tri thức từ nhiều nguồn lagrave cần thiết để coacute được đầy đủ caacutec tri thức

cho một vấn đề quan điểm yacute kiến traacutei ngược nhau thường phaacutet sinh Phương phaacutep đồng thuận sẽ giuacutep giải quyết được vấn đề macircu thuẫn Kỹ thuật phacircn tiacutech Meta lagrave kỹ thuật được aacutep dụng trong caacutec trường hợp

khaacutec Caacutech tiếp cận bằng định lượng đogravei hỏi caacutec kỹ sư cần cacircn nhắc yếu tố đầu vagraveo của caacutec chuyecircn gia khaacutec nhau

8 Xaacutec nhận hợp lệ vagrave kiểm tra tri thức Một khi thu thập tri thức noacute phải được đaacutenh giaacute về khả năng sử dụng vagrave độ

chiacutenh xaacutec Hai vấn đề cụ thể lagrave hiệu lực của những kiến thức vagrave kiểm tra việc xacircy dựng cơ sở của tri thức

Cần xaacutec nhận xem liệu hệ thống coacute thể hoạt động ở mức độ tối thiểu khocircng

Xaacutec minh liecircn quan đến việc so saacutenh từng chi tiết kỹ thuật của hệ thống những gigrave đatilde được thực hiện cuối cugraveng

9 Một số caacutec biện phaacutep xaacutec nhận Độ chiacutenh xaacutec Khả năng thiacutech nghi Mức độ đầy đủ Bề rộng Độ sacircu Hiệu lực Tổng quan Chiacutenh xaacutec Hiện thực Độ tin cậy Tiacutenh hữu dụng Mức độ

Chương 9 Học maacutey

1 Logic mờ vagrave ngocircn ngữ mờ(Fuzzy Logic and Linguistic Ambiguity)

Ngocircn ngữ tự nhiecircn gồm những khaacutei niệm mơ hồ vagrave khocircng chiacutenh xaacutectruyền tải ngữ nghĩa thocircng qua tiacutenh xấp xỉkhocircng rotilde ragraveng

Những xấp xỉ nagravey giuacutep con người coacute thể truyền tải hết được yacute nghĩa nhưng maacutey thigrave khocircng hiểu

Lagravem sao biểu diễn caacutec tri thức sử dụng caacutec khaacutei niệm khocircng rotilde ragraveng(mờ) hoặc khocircng chiacutenh xaacutec

2 Khaacutei niệm cơ bản của logic mờ tập mờ lagrave những tập hợp khocircng coacute một giới hạn rotilde Mỗi phần tử của noacute chỉ

chứa một mức độ hagravem liecircn thuộc của từng phần tử Vigrave vậy tập mờ khocircng giống như tập cổ điển Tập mờ coacute thể kết hợp với nhau qua những luật mờ magrave đặc trưng cho những hagravenh động trạng thaacutei vagrave thuộc tiacutenh của logic mờ được tận dụng khi thực hiện một bộ điều khiển mờ

Logic mờ dựa trecircn yacute tưởng mỗi phần tử thuộc vagraveo một tập hợp ở một mức độ nagraveo đấy

Locircgic mờ cho pheacutep độ liecircn thuộc (microA )coacute giaacute trị trong khoảng (01) Locircgic mờ coacute thể được coi lagrave mặt ứng dụng của lyacute thuyết tập mờ để xử lyacute caacutec

giaacute trị trong thế giới thực cho caacutec bagravei toaacuten phức tạp

3 So saacutenh tiacutenh đuacuteng đắn logic mờ vagrave xaacutec suất Xaacutec suất thigrave đề cập đến khả năng xảy ra một biến cố hay một điều gigrave đoacute Logic mờ đề cập đến cấp độ magrave đặc tiacutenh ở hiện tại

o viacute dụ1 người coacute chiều cao 6 feet thigrave coacute cấp độ lagrave 05 về chiều cao

4 Ưu điểm của logic mờ Caacutech tiếp cận rất tự nhiecircnkhocircng phức tạp Coacute thể mocirc higravenh hoacutea caacutec hagravem phi tuyến tugravey yacute phức tạp

Coacute thể tận dụng được kinh nghiệm từ những chuyecircn gia hagraveng đầu trong mọi lĩnh vực

Logic mờ được xacircy dựng dựa trecircn ngocircn ngữ tự nhiecircnNền tảng của logic mờ lagrave dựa trecircn cơ sở giao tiếp của con người

5 Nhược điểm của logic mờ Trong 1 hệ thống phức tạpsử dụng logic mờ coacute thể trở thagravenh trở ngại cho

việc xaacutec thực độ tin cậy của hệ thống Cơ chế lập luận mờ khocircng thể học hỏi từ những lỗi sai

6 Mạng noron nhacircn tạo(ANN) Mạng noron nhacircn tạo lagrave một mocirc phỏng xử lyacute thocircng tinđược nghiecircn cứu ra

từ hệ thống thần kinh của sinh vậtgiống như bộ natildeo để xử lyacute thocircng tin ANNs lagrave chương trigravenh dựa trecircn maacutey tiacutenh đơn giản coacute chức năng lagrave một mocirc

higravenh bagravei toaacuten khocircng gian dựa trecircn thử nghiệm vagrave baacuteo lỗi

7 Học từ kinh nghiệm Tiến trigravenh Một mẫu dữ liệu được biểu diễn như một mạng lưới noronANN ldquodự

đoaacutenrdquo 1 đầu radự đoaacuten được so saacutenh với giaacute trị thực tế hoặc giaacute trị chiacutenh xaacutecNếu đoaacuten được chiacutenh xaacutec thigrave khocircng coacute hagravenh động nagraveo được thực hiện

Nếu dự đoaacuten sai ANN kiểm tra lại vagrave xaacutec định lại thocircng số để điều chỉnh Một mẫu dữ liệu khaacutec được biểu diễn vagrave quaacute trigravenh nagravey được lặp lại

8 Nguyecircn tắc cơ bản của cocircng nghệ nơron Caacutec yếu tố xử lyacute cơ bản trong hệ thống thần kinh của con người lagrave tế bagraveo

thần kinhMạng lưới của tế bagraveo nagravey lagrave liecircn kết với nhau nhận được thocircng tin từ caacutec cảm biến trong mắt taihellip

Thocircng tin nhận được bởi tế bagraveo thần kinh hoặc lagrave sẽ kiacutech thiacutech noacute(sẽ được chuyển qua 1 thocircng điệp dọc theo mạng lưới) hoặc lagrave sẽ ngăn cản noacute(ngăn cản dograveng thocircng tin)

Độ nhạy coacute thể thay đổi qua thời gian hoặc sau khi coacute được kinh nghiệm

9 Cấu truacutec mạng Một ANN gồm 3 lớp cơ bản

Lớp đầu vagraveo nhận dữ liệu Lớp becircn trong hoặc lagrave lớp ẩn xử lyacute dữ liệu Lớp đầu ra chuyển tiếp kết quả cuối cugraveng của mạng

10Mạng nơ ron Thường coacute nhiều đầu vagraveo mỗi đầu vagraveo với mức ảnh hưởng vagrave tầm quan

trọng riecircng của noacute Một đầu vagraveo quan trọng coacute thể được sử dụng để khuếch đại đầu ra caacutec hagravem trạng thaacutei tổng hợp caacutec trọng số của caacutec yếu tố

đầuvagraveo khaacutec nhauvagraveo một giaacute trị duy nhất Caacutec hagravem chuyển giao xử lyacute caacutec giaacute trị trạng thaacutei vagrave tạo đầu ra

11Huấn luyện mạng nơ ron Trong mocirc higravenh coacute giaacutem saacutetANN được đến so saacutenh dự đoaacuten của chiacutenh

noacute với thocircng tin phản hồi coacute chứa caacutec kết quả mong muốn ANN sẽ phải tigravem caacutech thay đổi caacutec tham số becircn trong củamigravenh (caacutec trọng số vagrave caacutec ngưỡng) để tạo necircn một aacutenh xạ coacute khả năng aacutenh xạcaacutec đầu vagraveo thagravenh caacutec đầu ra mong muốn Sự thay đổi nagravey được tiến hagravenh nhờ việc so saacutenh giữa đầu ra thực sự vagrave đầu ra mong muốn

Trong mocirc higravenh khocircng coacute giaacutem saacutetANN nhận được dữ liệu vagraveo nhưng khocircng phải coacute bất kỳ thocircng tin phản hồi về kết quả mong muốn

Phần lớn caacutec ứng dụng nằm trong vugraveng của caacutec bagravei toaacuten ước lượng như mocirc higravenh hoacuteathống kecirc neacuten lọc phacircn cụm

12Lợi iacutech Liecircn kết với mạng noron Traacutenh caacutech lập trigravenh tường minh Giảm nhu cầu của chuyecircn gia ANNs thigrave thiacutech nghi với caacutec yếu tố đầu vagraveo thay đổi Khocircng cần thiết cho cơ sở tri thức tinh chế ANNs coacute tiacutenh động vagrave cải thiện với việc sử dụng Coacute khả năng xử lyacute dữ liệu khocircng chiacutenh xaacutec hoặc khocircng đầy đủ Cho pheacutep tổng quaacutet hoacutea từ thocircng tin cụ thể Cho pheacutep thu thập cảm giaacutec thocircng thường vagraveo miền giải quyết vấn đề

13Hạn chế của việc liecircn kết với mạng noron ANNs khocircng thể giải thiacutech được suy luận Bản chất hộp đen thường khiến cho vấn đề traacutech nhiệm vagrave độ tin cậy phaacutet

sinh lagrave khoacute khăn Lặp đi lặp lại quaacute trigravenh huấn luyện rất tốn thời gian Nguồn lực caacutec nhagrave phacircn tiacutech vagrave thiết kế coacute tay nghề cao vẫn lagrave đaacuteng lo

ngại Cocircng nghệ ANN thuacutec đẩy hạn chế của phần cứng hiện tại ANN yecircu cầu phải coacute sự tin tưởng ở đầu ra

14Giới thiệu về thuật toaacuten di truyền Cũng như mạng lưới thần kinh caacutec thuật toaacuten di truyền được dựa trecircn lyacute

thuyết sinh học Thuật toaacuten di truyền tigravem thấy nguồn gốc của chuacuteng trong caacutec lyacute thuyết

tiến hoacutea của chọn lọc tự nhiecircn vagrave thiacutech ứng với biến đổi khiacute hậu Kết quả thuật toaacuten di truyền lagrave từ giao phối 2 caacute thể trong quần thế để tạo

ra con caacutei đocirci khi tốt hơn so với bậc cha mẹ của chuacuteng 15Caacutec thagravenh phần cơ bản của thuật toaacuten di truyền

Toaacuten tử chọn lọc Caacutec caacute thể tốt được chọn lọc để đưa vagraveo thế hệ sau Sự chọn lọc nagravey căn cứ vagraveo độ thiacutech nghi với mocirci trường của mỗi caacute thể

Toaacuten tử lai gheacutep (crossover) Hai caacute thể cha vagrave mẹ trao đổi caacutec gen với nhau để tạo ra caacute thể con

Toaacuten tử đột biến (mutation) Một caacute thể thay đổi một số gen để biến đổi thagravenh một caacute thể mớiTất cả caacutec toaacuten tử trecircn khi thực hiện đều mang tiacutenh ngẫu nhiecircn

16Quaacute trigravenh cơ bản của một thuật toaacuten di truyền Khởi tạo

Đaacutenh giaacute quần thể

Lựa chọn NST thiacutech hợp nhất vagrave loại bỏ NST yếu nhất

Quy trigravenh giao nhau vagrave cải thiện quần thể

đột biến tiến trigravenh để khaacutem phaacute ra NST mới

17Ưu nhược điểm của việc kết hợp với thuật toaacuten di truyền Kiacutech thước quần thể lagrave 1 yếu tố quan trọng trong tốc độ của việc tigravem

kiếmnhưng noacute tương đối dễ dagraveng để dự đoaacuten tốc độ nagravey Giao nhau hoặc đột biến lagrave khocircng necircn đc sử dụng quaacute thường xuyecircn Luocircn coacute được iacutet nhất 1 giải phaacutep hợp lyacute Necircn coacute thể aacutep dụng chuacuteng cho caacutec vấn đề magrave chuacuteng ta khocircng coacute hướng

về caacutech giải quyết Sức mạnh của thuật toaacuten xuất phaacutet từ khaacutei niệm đơn giảnkhocircng phải từ

một thủ tục thuật toaacuten phức tạp 18Tương lai của học maacutey

Mạng lưới thần kinh nhacircn tạo vượt quaacute năng lực của con người trong caacutec trường hợp bị cocirc lập

Về mặt lyacute thuyếtmột maacutey tiacutenh coacute thể xử lyacute dũ liệu nhanh hơn hagraveng triệu lần so với 1 con người

May mắn thay cho chuacuteng tacon người tốt hơn nhiều khi magrave coacute được dữ liệumaacutey tiacutenh khocircng coacute 1 số thứ như lagrave 5 giaacutec quan

CHƯƠNG 10 KHO DỮ LIỆU

1 Kho dữ liệu Kho dữ liệu lagrave tuyển tập caacutec cơ sở dữ liệu tiacutech hợp hướng chủ đề được

thiết kế để trợ giuacutep cho một hệ hỗ trợ quyết định

Theo John Ladley Cocircng nghệ kho dữ liệu lagrave tập caacutec phương phaacutep kỹ thuật vagrave caacutec cocircng cụ coacute thể kết hợp hỗ trợ nhau để cung cấp thocircng tin cho người sử dụng trecircn cơ sở tiacutech hợp từ nhiều nguồn dữ liệu nhiều mocirci trường khaacutec nhau

Kho dữ liệu thường rất lớn tới hagraveng trăm GB hay thậm chiacute hagraveng Terabyte

2 Kho dữ liệu vận hagravenh (ODS) Một kho dữ liệu vận hagravenh Aacutep dụng kỹ thuật kho dữ liệu vagraveo caacutec hệ xử

lyacute giao taacutec lưu trữ dữ liệu cho một ứng dụng đặc thugrave Noacute đưa vagraveo kho dữ liệu một dograveng caacutec dữ liệu thocirc được thiết kế

3 So saacutenh

Kho dữ liệu vận hagravenh Kho dữ liệu

Dữ liệu theo chủ đề Dữ liệu theo chủ đề

Dữ liệu tiacutech hợp Dữ liệu tiacutech hợp

Dữ liệu thay đổi Dữ liệu khocircng thay đổi

Dữ liệu được cập nhật khi thay đổi

Dữ liệu giữ nguyecircn

Chỉ coacute dữ liệu hiện tạiDữliệu hiện tại vagrave dữ liệu lịch sử

Chu kỳ lagravem tươi dữ liệu ngắn Chu kỳ lagravem tươi dữ liệu dagravei

Chỉ coacute dữ liệu chi tiết Dữ liệu chi tiết vagrave dữ liệu tổng kết

Dugraveng cho caacutec quyết định ngắn hạn

Dugraveng cho hoạch định dagravei hạn

4 Kho dữ liệu cục bộ (Data Mart - DM)

Kho dữ liệu cục bộ lagrave CSDL coacute những đặc điểm giống với kho dữ liệu nhưng với quy mocirc nhỏ hơn vagrave lưu trữ dữ liệu về một lĩnh vực một chuyecircn ngagravenh

Data mart phụ thuộc Chứa những dữ liệu được lấy từ DW vagrave những dữ liệu nagravey sẽ được triacutech lọc vagrave tinh chế tiacutech hợp lại ở mức cao hơn để phục vụ một chủ đề nhất định của Datamart

Data mart độc lập Khocircng giống như Datamart phụ thuộc Data mart độc lập được xacircy dựng trước DW vagrave dữ liệu được trực tiếp lấy từ caacutec nguồn khaacutec nhau

5 Siecircu dữ liệu Metadata lagrave dữ liệu để mocirc tả dữ liệu Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột

một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi Metadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu

6 Mocirci trường kho dữ liệu Hệ thống của tổ chức vagrave kho cung cấp dữ liệu để xacircy dựng kho dữ liệu Trong quaacute trigravenh chuyển dữ liệu từ caacutec nguồn khaacutec nhau dữ liệu coacute thể

được lagravem sạch hoặc chuyển đổi vagrave vigrave thế DW được xem như lagrave một chuẩn cho việc lưu trữ

Đồng thời siecircu dữ liệu được ghi lại Cuối cugraveng DW hoặc siecircu thị coacute thể được sử dụng để tạo ra một kho dữ

liệu ldquocaacute nhacircnrdquo 7 Caacutec đặc điểm của kho dữ liệu

Đặc điểm Mocirc tả

Hướng chủ đề - DL tổ chức theo caacutech thức người dugraveng tham chiếu

Tiacutech hợp - Dữ liệu ldquosạchrdquo loại bỏ tiacutenh thiếu nhất quaacuten

Khocircng thay đổi - DL ldquochỉ đọcrdquo người dugraveng khocircng thay đổi được

Chuỗi thời gian - DL lagrave chuỗi thời gian khocircng phải lagrave trạng thaacutei hiện tại

Được tổng kết - DL vận hagravenhthao taacutec khi cần thiết

được kết hợp lại thagravenh dạng coacute thể dugraveng được cho quyết định

Kiacutech cỡ lớn hơn - Lưu giữ theo chuỗi thời gian tức lagrave giữ lại nhiều DL

Khocircng được chuẩn hoacutea - Coacute thể dư thừa DLSiecircu dữ liệu - Dữ liệu của dữ liệu được lưu trữNguồn dữ liệu - DL vận hagravenh (caacutec hệ sẵn coacute) cugraveng

với caacutec nguồn ngoagravei 8 Kho dữ liệu hướng chủ đề

Hướng chủ để coacute nghĩa lagrave kho dữ liệu được tổ chức xung quanh caacutec chủ đề chiacutenh như khaacutech hagraveng sản phẩm sản xuất Tập trung vagraveo việc mocirc higravenh hoacutea vagrave phacircn tiacutech dữ liệu cho caacutec nhagrave ra quyết định magrave khocircng tập trung vagraveo caacutec xử lyacute thocircng thường Cung cấp cho người dugraveng một khung nhigraven toagraven vẹn đơn giản vagrave đầy đủ về caacutec sự kiện quanh caacutec chủ đề

9 Dữ liệu trong DW được tiacutech hợp Dữ liệu trong kho dữ liệu được xacircy dựng bằng caacutech tổng hợp dữ liệu từ

nhiều nguồn khaacutec nhau vagrave caacutec nguồn coacute tổ chức khaacutec nhau Cơ sở dữ liệu caacutec file excel caacutec flat file hoặc caacutec raw file Khi đưa vagraveo kho dữ liệu caacutec dữ liệu được lagravem sạch vagrave tiacutech hợp dữ liệu nhằm đảm bảo tiacutenh nhất quaacuten của dữ liệu

10Kiến truacutec kho dữ liệu Tầng cơ sở dữ liệu hoạt động Tầng truy xuất thocircng tin Tầng truy xuất dữ liệu Tầng siecircu dữ liệu Tầng quản lyacute tiến trigravenh Tầng thocircng điệp của ứng dụng Tầng vật liacute của kho dữ liệu Tầng trigravenh diễn dữ liệu

11Higravenh trạng kho dữ liệu Kho dữ liệu ảo - người dugraveng cuối coacute thể truy cập trực tiếp đến kho dữ liệu

sử dụng caacutec cocircng cụ cho pheacutep ở tầng truy xuất dữ liệu Kho dữ liệu trung tacircm-1 cơ sở dữ liệu vật lyacute chứa tất cả dữ liệu cho một

vugraveng chuyecircn dụng nagraveo đoacute

Kho dữ liệu phacircn taacuten- Thagravenh phần được phacircn taacuten qua nhiều hệ cơ sở dữ liệu vật lyacute

12METADATA- Siecircu dữ liệu Định nghĩa Siecircu dữ liệu lagrave dữ liệu về dữ liệu Lagrave 1 lưu trữ dugraveng để

Miecircu tả kho dữ liệu tổng thể Nhận dạng kiểu kho dữ liệu Quản liacute quaacute trigravenh tiacutech hợp dữ liệu Quản liacute quaacute trigravenh cập nhật kho dữ liệu Quản liacute bảo mật

Lagrave chigravea khoacutea quyết định sự thagravenh cocircng của kho dữ liệu luocircn được thay đổi vagrave cập nhật theo sự phaacutet triển của kho dữ liệu

Dugraveng để quản liacute điều khiển kho dữ liệu Sự ra đời của kho dữ liệu như 1 cấu truacutec hỗ trợ ra quyết định siecircu dữ liệu

được xem như nguồn tagravei nguyecircn dữ liệu Siecircu dữ liệu lagrave trừu tượng Chuacuteng lagrave dữ liệu bậc cao cung cấp mocirc tả ngắn

gọn caacutec dữ liệu bậc thấp hơn 13Hoạt động của Siecircu dữ liệu

Siecircu dữ liệu rất cần thiết trong việc chuyển hoacutea thocircng tin trở thagravenh tri thức Lagrave chigravea khoacutea giuacutep chuacuteng ta xử lyacute được dữ liệu thocirc Viacute dụ một dograveng dữ liệu baacuten hagraveng 1023 K596 11121 agraveNoacute sẽ khocircng coacute nghĩa gigrave cho đến khi chuacuteng ta đưa vagraveo siecircu dữ liệu (thư

mục chứa dữ liệu) agrave cửa hagraveng 1023 sản phẩm K596 vagrave số tiền baacuten được lagrave 11121 đocirc la

14Sự cần thiết phải nhất quaacuten trong kho dữ liệu Kho dữ liệu được xacircy dựng cho lợi iacutech của những nhagrave phacircn tiacutech kinh

doanh caacutec nhagrave quản trị cho tất cả caacutec khu vực chức năng Trong cơ sở dữ liệu riecircng caacutec khu vực khaacutec nhau coacute thể định nghĩa vagrave lưu

trữ dữ liệu thocircng qua phiecircn bản của chiacutenh noacute Khi dữ liệu được lấy từ những vugraveng khaacutec nhau đoacute vagrave được đặt vagraveo kho dữ

liệu Việc chuyển đổi vagrave lagravem sạch caacutec tiến trigravenh sẽ đảm bảo noacute lagrave duy nhất được tiacutech hợp tại một mức của tổ chức

15Ragrave soaacutet lại dữ liệu ndash Thực thi siecircu dữ liệu

Bất kể cấu truacutec tự nhiecircn của 1 cacircu truy vấn thế nagraveo thigrave caacutec thagravenh phần của siecircu dữ liệu rất quan trọng đối với người ra quyết định

Bảng thuộc tiacutenh khoacutea được lưu trữ bởi kho dữ liệu Tập hợp dữ liệu được lấy từ đacircu Những chuyển đổi nagraveo được thực thi với việc lagravem sạch

16Siecircu dữ liệu lagrave gigrave Metadata - lagrave thocircng tin mocirc tả nội dung của cơ sở dữ liệu (CSDL) Metadata baacuteo cho người dugraveng biết thời gian cập nhật sau cugraveng của dữ liệu

định dạng vagrave mục điacutech sử dụng của noacute Những thocircng tin nagravey coacute thể hướng dẫn người dugraveng duyệt qua CSDL vagrave

giuacutep họ hiểu được yacute nghĩa vagrave ngữ cảnh của dữ liệu Trong CSDL metadata lagrave caacutec dạng biểu diễn khaacutec nhau của caacutec đối tượng

trong CSDL Trong CSDL quan hệ metadata lagrave caacutec định nghĩa của bảng cột CSDL

view vagrave nhiều đối tượng khaacutec Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột

một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi -gtMetadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu

Bảng chuyển đổi Ghi lại những chuyển đổi đatilde được thực hiện

Lịch sử thực thi Ghi lại những dữ liệu đatilde được

phacircn tiacutech

Higravenh thaacutei kết nốiGhi lại những dữ liệu được kết nối vagrave tần suất

17Aacutenh xạ thocircng thường của siecircu dữ liệu Bản ghi aacutenh xạ chuyển đổi bao gồm

Định danh của nguồn gốc Chuyển đổi thuộc tiacutenh Chuyển đổi thuộc tiacutenh vật lyacute Matilde hoacutea tham chiếu bảng chuyển đổi Đổi tecircn Đổi khoacutea Gaacuten giaacute trị cho thuộc tiacutenh mặc định Chọn logic cho caacutec nguồn nhiều giaacute trị Đổi thuật toaacuten

18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để

phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai

lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave

tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec

Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm

Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo

19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua

caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau

SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được

Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra

một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức

Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ

Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ

Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech

CHƯƠNG 11 KHAI PHAacute DỮ LIỆU

1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn

ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993

Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng

2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd

1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều

2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP

3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn

4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng

5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server

6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo

7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động

8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời

9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều

10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện

11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech

12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP

3 Xử lyacute phacircn tiacutech trực tuyến OLAP

MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave

dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu

ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave

thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu

HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave

ROLAP4 Khai phaacute dữ liệu

Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh

khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn

Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan

5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp

6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại

Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp

Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec

Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt

Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra

Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh

vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho

Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec

Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm

Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục

Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng

gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp

Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn

Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec

Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper

Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2

Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25

Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước

Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng

Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện

trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp

Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute

độ hỗ trợ ge ngưỡng minsup

độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan

Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn

Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết

Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu

MOLAP ROLAP HOLAP

Lưu trữ dữ liệu cơ sở

Khối Bảng quan hệ Bảng quan hệ

Lưu trữ thocircng tin tổng hợp

Khối Bảng quan hệ Khối

Hiệu suất thực hiện truy vấn

Nhanh nhất Chậm nhất Nhanh

Tiecircu thụ khocircng gian lưu trữ

Nhiều Thấp Trung bigravenh

Chi phiacute bảo trigrave Cao Thấp Trung bigravenh

Page 49: De cuong(1-11)

Chương 9 Học maacutey

1 Logic mờ vagrave ngocircn ngữ mờ(Fuzzy Logic and Linguistic Ambiguity)

Ngocircn ngữ tự nhiecircn gồm những khaacutei niệm mơ hồ vagrave khocircng chiacutenh xaacutectruyền tải ngữ nghĩa thocircng qua tiacutenh xấp xỉkhocircng rotilde ragraveng

Những xấp xỉ nagravey giuacutep con người coacute thể truyền tải hết được yacute nghĩa nhưng maacutey thigrave khocircng hiểu

Lagravem sao biểu diễn caacutec tri thức sử dụng caacutec khaacutei niệm khocircng rotilde ragraveng(mờ) hoặc khocircng chiacutenh xaacutec

2 Khaacutei niệm cơ bản của logic mờ tập mờ lagrave những tập hợp khocircng coacute một giới hạn rotilde Mỗi phần tử của noacute chỉ

chứa một mức độ hagravem liecircn thuộc của từng phần tử Vigrave vậy tập mờ khocircng giống như tập cổ điển Tập mờ coacute thể kết hợp với nhau qua những luật mờ magrave đặc trưng cho những hagravenh động trạng thaacutei vagrave thuộc tiacutenh của logic mờ được tận dụng khi thực hiện một bộ điều khiển mờ

Logic mờ dựa trecircn yacute tưởng mỗi phần tử thuộc vagraveo một tập hợp ở một mức độ nagraveo đấy

Locircgic mờ cho pheacutep độ liecircn thuộc (microA )coacute giaacute trị trong khoảng (01) Locircgic mờ coacute thể được coi lagrave mặt ứng dụng của lyacute thuyết tập mờ để xử lyacute caacutec

giaacute trị trong thế giới thực cho caacutec bagravei toaacuten phức tạp

3 So saacutenh tiacutenh đuacuteng đắn logic mờ vagrave xaacutec suất Xaacutec suất thigrave đề cập đến khả năng xảy ra một biến cố hay một điều gigrave đoacute Logic mờ đề cập đến cấp độ magrave đặc tiacutenh ở hiện tại

o viacute dụ1 người coacute chiều cao 6 feet thigrave coacute cấp độ lagrave 05 về chiều cao

4 Ưu điểm của logic mờ Caacutech tiếp cận rất tự nhiecircnkhocircng phức tạp Coacute thể mocirc higravenh hoacutea caacutec hagravem phi tuyến tugravey yacute phức tạp

Coacute thể tận dụng được kinh nghiệm từ những chuyecircn gia hagraveng đầu trong mọi lĩnh vực

Logic mờ được xacircy dựng dựa trecircn ngocircn ngữ tự nhiecircnNền tảng của logic mờ lagrave dựa trecircn cơ sở giao tiếp của con người

5 Nhược điểm của logic mờ Trong 1 hệ thống phức tạpsử dụng logic mờ coacute thể trở thagravenh trở ngại cho

việc xaacutec thực độ tin cậy của hệ thống Cơ chế lập luận mờ khocircng thể học hỏi từ những lỗi sai

6 Mạng noron nhacircn tạo(ANN) Mạng noron nhacircn tạo lagrave một mocirc phỏng xử lyacute thocircng tinđược nghiecircn cứu ra

từ hệ thống thần kinh của sinh vậtgiống như bộ natildeo để xử lyacute thocircng tin ANNs lagrave chương trigravenh dựa trecircn maacutey tiacutenh đơn giản coacute chức năng lagrave một mocirc

higravenh bagravei toaacuten khocircng gian dựa trecircn thử nghiệm vagrave baacuteo lỗi

7 Học từ kinh nghiệm Tiến trigravenh Một mẫu dữ liệu được biểu diễn như một mạng lưới noronANN ldquodự

đoaacutenrdquo 1 đầu radự đoaacuten được so saacutenh với giaacute trị thực tế hoặc giaacute trị chiacutenh xaacutecNếu đoaacuten được chiacutenh xaacutec thigrave khocircng coacute hagravenh động nagraveo được thực hiện

Nếu dự đoaacuten sai ANN kiểm tra lại vagrave xaacutec định lại thocircng số để điều chỉnh Một mẫu dữ liệu khaacutec được biểu diễn vagrave quaacute trigravenh nagravey được lặp lại

8 Nguyecircn tắc cơ bản của cocircng nghệ nơron Caacutec yếu tố xử lyacute cơ bản trong hệ thống thần kinh của con người lagrave tế bagraveo

thần kinhMạng lưới của tế bagraveo nagravey lagrave liecircn kết với nhau nhận được thocircng tin từ caacutec cảm biến trong mắt taihellip

Thocircng tin nhận được bởi tế bagraveo thần kinh hoặc lagrave sẽ kiacutech thiacutech noacute(sẽ được chuyển qua 1 thocircng điệp dọc theo mạng lưới) hoặc lagrave sẽ ngăn cản noacute(ngăn cản dograveng thocircng tin)

Độ nhạy coacute thể thay đổi qua thời gian hoặc sau khi coacute được kinh nghiệm

9 Cấu truacutec mạng Một ANN gồm 3 lớp cơ bản

Lớp đầu vagraveo nhận dữ liệu Lớp becircn trong hoặc lagrave lớp ẩn xử lyacute dữ liệu Lớp đầu ra chuyển tiếp kết quả cuối cugraveng của mạng

10Mạng nơ ron Thường coacute nhiều đầu vagraveo mỗi đầu vagraveo với mức ảnh hưởng vagrave tầm quan

trọng riecircng của noacute Một đầu vagraveo quan trọng coacute thể được sử dụng để khuếch đại đầu ra caacutec hagravem trạng thaacutei tổng hợp caacutec trọng số của caacutec yếu tố

đầuvagraveo khaacutec nhauvagraveo một giaacute trị duy nhất Caacutec hagravem chuyển giao xử lyacute caacutec giaacute trị trạng thaacutei vagrave tạo đầu ra

11Huấn luyện mạng nơ ron Trong mocirc higravenh coacute giaacutem saacutetANN được đến so saacutenh dự đoaacuten của chiacutenh

noacute với thocircng tin phản hồi coacute chứa caacutec kết quả mong muốn ANN sẽ phải tigravem caacutech thay đổi caacutec tham số becircn trong củamigravenh (caacutec trọng số vagrave caacutec ngưỡng) để tạo necircn một aacutenh xạ coacute khả năng aacutenh xạcaacutec đầu vagraveo thagravenh caacutec đầu ra mong muốn Sự thay đổi nagravey được tiến hagravenh nhờ việc so saacutenh giữa đầu ra thực sự vagrave đầu ra mong muốn

Trong mocirc higravenh khocircng coacute giaacutem saacutetANN nhận được dữ liệu vagraveo nhưng khocircng phải coacute bất kỳ thocircng tin phản hồi về kết quả mong muốn

Phần lớn caacutec ứng dụng nằm trong vugraveng của caacutec bagravei toaacuten ước lượng như mocirc higravenh hoacuteathống kecirc neacuten lọc phacircn cụm

12Lợi iacutech Liecircn kết với mạng noron Traacutenh caacutech lập trigravenh tường minh Giảm nhu cầu của chuyecircn gia ANNs thigrave thiacutech nghi với caacutec yếu tố đầu vagraveo thay đổi Khocircng cần thiết cho cơ sở tri thức tinh chế ANNs coacute tiacutenh động vagrave cải thiện với việc sử dụng Coacute khả năng xử lyacute dữ liệu khocircng chiacutenh xaacutec hoặc khocircng đầy đủ Cho pheacutep tổng quaacutet hoacutea từ thocircng tin cụ thể Cho pheacutep thu thập cảm giaacutec thocircng thường vagraveo miền giải quyết vấn đề

13Hạn chế của việc liecircn kết với mạng noron ANNs khocircng thể giải thiacutech được suy luận Bản chất hộp đen thường khiến cho vấn đề traacutech nhiệm vagrave độ tin cậy phaacutet

sinh lagrave khoacute khăn Lặp đi lặp lại quaacute trigravenh huấn luyện rất tốn thời gian Nguồn lực caacutec nhagrave phacircn tiacutech vagrave thiết kế coacute tay nghề cao vẫn lagrave đaacuteng lo

ngại Cocircng nghệ ANN thuacutec đẩy hạn chế của phần cứng hiện tại ANN yecircu cầu phải coacute sự tin tưởng ở đầu ra

14Giới thiệu về thuật toaacuten di truyền Cũng như mạng lưới thần kinh caacutec thuật toaacuten di truyền được dựa trecircn lyacute

thuyết sinh học Thuật toaacuten di truyền tigravem thấy nguồn gốc của chuacuteng trong caacutec lyacute thuyết

tiến hoacutea của chọn lọc tự nhiecircn vagrave thiacutech ứng với biến đổi khiacute hậu Kết quả thuật toaacuten di truyền lagrave từ giao phối 2 caacute thể trong quần thế để tạo

ra con caacutei đocirci khi tốt hơn so với bậc cha mẹ của chuacuteng 15Caacutec thagravenh phần cơ bản của thuật toaacuten di truyền

Toaacuten tử chọn lọc Caacutec caacute thể tốt được chọn lọc để đưa vagraveo thế hệ sau Sự chọn lọc nagravey căn cứ vagraveo độ thiacutech nghi với mocirci trường của mỗi caacute thể

Toaacuten tử lai gheacutep (crossover) Hai caacute thể cha vagrave mẹ trao đổi caacutec gen với nhau để tạo ra caacute thể con

Toaacuten tử đột biến (mutation) Một caacute thể thay đổi một số gen để biến đổi thagravenh một caacute thể mớiTất cả caacutec toaacuten tử trecircn khi thực hiện đều mang tiacutenh ngẫu nhiecircn

16Quaacute trigravenh cơ bản của một thuật toaacuten di truyền Khởi tạo

Đaacutenh giaacute quần thể

Lựa chọn NST thiacutech hợp nhất vagrave loại bỏ NST yếu nhất

Quy trigravenh giao nhau vagrave cải thiện quần thể

đột biến tiến trigravenh để khaacutem phaacute ra NST mới

17Ưu nhược điểm của việc kết hợp với thuật toaacuten di truyền Kiacutech thước quần thể lagrave 1 yếu tố quan trọng trong tốc độ của việc tigravem

kiếmnhưng noacute tương đối dễ dagraveng để dự đoaacuten tốc độ nagravey Giao nhau hoặc đột biến lagrave khocircng necircn đc sử dụng quaacute thường xuyecircn Luocircn coacute được iacutet nhất 1 giải phaacutep hợp lyacute Necircn coacute thể aacutep dụng chuacuteng cho caacutec vấn đề magrave chuacuteng ta khocircng coacute hướng

về caacutech giải quyết Sức mạnh của thuật toaacuten xuất phaacutet từ khaacutei niệm đơn giảnkhocircng phải từ

một thủ tục thuật toaacuten phức tạp 18Tương lai của học maacutey

Mạng lưới thần kinh nhacircn tạo vượt quaacute năng lực của con người trong caacutec trường hợp bị cocirc lập

Về mặt lyacute thuyếtmột maacutey tiacutenh coacute thể xử lyacute dũ liệu nhanh hơn hagraveng triệu lần so với 1 con người

May mắn thay cho chuacuteng tacon người tốt hơn nhiều khi magrave coacute được dữ liệumaacutey tiacutenh khocircng coacute 1 số thứ như lagrave 5 giaacutec quan

CHƯƠNG 10 KHO DỮ LIỆU

1 Kho dữ liệu Kho dữ liệu lagrave tuyển tập caacutec cơ sở dữ liệu tiacutech hợp hướng chủ đề được

thiết kế để trợ giuacutep cho một hệ hỗ trợ quyết định

Theo John Ladley Cocircng nghệ kho dữ liệu lagrave tập caacutec phương phaacutep kỹ thuật vagrave caacutec cocircng cụ coacute thể kết hợp hỗ trợ nhau để cung cấp thocircng tin cho người sử dụng trecircn cơ sở tiacutech hợp từ nhiều nguồn dữ liệu nhiều mocirci trường khaacutec nhau

Kho dữ liệu thường rất lớn tới hagraveng trăm GB hay thậm chiacute hagraveng Terabyte

2 Kho dữ liệu vận hagravenh (ODS) Một kho dữ liệu vận hagravenh Aacutep dụng kỹ thuật kho dữ liệu vagraveo caacutec hệ xử

lyacute giao taacutec lưu trữ dữ liệu cho một ứng dụng đặc thugrave Noacute đưa vagraveo kho dữ liệu một dograveng caacutec dữ liệu thocirc được thiết kế

3 So saacutenh

Kho dữ liệu vận hagravenh Kho dữ liệu

Dữ liệu theo chủ đề Dữ liệu theo chủ đề

Dữ liệu tiacutech hợp Dữ liệu tiacutech hợp

Dữ liệu thay đổi Dữ liệu khocircng thay đổi

Dữ liệu được cập nhật khi thay đổi

Dữ liệu giữ nguyecircn

Chỉ coacute dữ liệu hiện tạiDữliệu hiện tại vagrave dữ liệu lịch sử

Chu kỳ lagravem tươi dữ liệu ngắn Chu kỳ lagravem tươi dữ liệu dagravei

Chỉ coacute dữ liệu chi tiết Dữ liệu chi tiết vagrave dữ liệu tổng kết

Dugraveng cho caacutec quyết định ngắn hạn

Dugraveng cho hoạch định dagravei hạn

4 Kho dữ liệu cục bộ (Data Mart - DM)

Kho dữ liệu cục bộ lagrave CSDL coacute những đặc điểm giống với kho dữ liệu nhưng với quy mocirc nhỏ hơn vagrave lưu trữ dữ liệu về một lĩnh vực một chuyecircn ngagravenh

Data mart phụ thuộc Chứa những dữ liệu được lấy từ DW vagrave những dữ liệu nagravey sẽ được triacutech lọc vagrave tinh chế tiacutech hợp lại ở mức cao hơn để phục vụ một chủ đề nhất định của Datamart

Data mart độc lập Khocircng giống như Datamart phụ thuộc Data mart độc lập được xacircy dựng trước DW vagrave dữ liệu được trực tiếp lấy từ caacutec nguồn khaacutec nhau

5 Siecircu dữ liệu Metadata lagrave dữ liệu để mocirc tả dữ liệu Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột

một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi Metadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu

6 Mocirci trường kho dữ liệu Hệ thống của tổ chức vagrave kho cung cấp dữ liệu để xacircy dựng kho dữ liệu Trong quaacute trigravenh chuyển dữ liệu từ caacutec nguồn khaacutec nhau dữ liệu coacute thể

được lagravem sạch hoặc chuyển đổi vagrave vigrave thế DW được xem như lagrave một chuẩn cho việc lưu trữ

Đồng thời siecircu dữ liệu được ghi lại Cuối cugraveng DW hoặc siecircu thị coacute thể được sử dụng để tạo ra một kho dữ

liệu ldquocaacute nhacircnrdquo 7 Caacutec đặc điểm của kho dữ liệu

Đặc điểm Mocirc tả

Hướng chủ đề - DL tổ chức theo caacutech thức người dugraveng tham chiếu

Tiacutech hợp - Dữ liệu ldquosạchrdquo loại bỏ tiacutenh thiếu nhất quaacuten

Khocircng thay đổi - DL ldquochỉ đọcrdquo người dugraveng khocircng thay đổi được

Chuỗi thời gian - DL lagrave chuỗi thời gian khocircng phải lagrave trạng thaacutei hiện tại

Được tổng kết - DL vận hagravenhthao taacutec khi cần thiết

được kết hợp lại thagravenh dạng coacute thể dugraveng được cho quyết định

Kiacutech cỡ lớn hơn - Lưu giữ theo chuỗi thời gian tức lagrave giữ lại nhiều DL

Khocircng được chuẩn hoacutea - Coacute thể dư thừa DLSiecircu dữ liệu - Dữ liệu của dữ liệu được lưu trữNguồn dữ liệu - DL vận hagravenh (caacutec hệ sẵn coacute) cugraveng

với caacutec nguồn ngoagravei 8 Kho dữ liệu hướng chủ đề

Hướng chủ để coacute nghĩa lagrave kho dữ liệu được tổ chức xung quanh caacutec chủ đề chiacutenh như khaacutech hagraveng sản phẩm sản xuất Tập trung vagraveo việc mocirc higravenh hoacutea vagrave phacircn tiacutech dữ liệu cho caacutec nhagrave ra quyết định magrave khocircng tập trung vagraveo caacutec xử lyacute thocircng thường Cung cấp cho người dugraveng một khung nhigraven toagraven vẹn đơn giản vagrave đầy đủ về caacutec sự kiện quanh caacutec chủ đề

9 Dữ liệu trong DW được tiacutech hợp Dữ liệu trong kho dữ liệu được xacircy dựng bằng caacutech tổng hợp dữ liệu từ

nhiều nguồn khaacutec nhau vagrave caacutec nguồn coacute tổ chức khaacutec nhau Cơ sở dữ liệu caacutec file excel caacutec flat file hoặc caacutec raw file Khi đưa vagraveo kho dữ liệu caacutec dữ liệu được lagravem sạch vagrave tiacutech hợp dữ liệu nhằm đảm bảo tiacutenh nhất quaacuten của dữ liệu

10Kiến truacutec kho dữ liệu Tầng cơ sở dữ liệu hoạt động Tầng truy xuất thocircng tin Tầng truy xuất dữ liệu Tầng siecircu dữ liệu Tầng quản lyacute tiến trigravenh Tầng thocircng điệp của ứng dụng Tầng vật liacute của kho dữ liệu Tầng trigravenh diễn dữ liệu

11Higravenh trạng kho dữ liệu Kho dữ liệu ảo - người dugraveng cuối coacute thể truy cập trực tiếp đến kho dữ liệu

sử dụng caacutec cocircng cụ cho pheacutep ở tầng truy xuất dữ liệu Kho dữ liệu trung tacircm-1 cơ sở dữ liệu vật lyacute chứa tất cả dữ liệu cho một

vugraveng chuyecircn dụng nagraveo đoacute

Kho dữ liệu phacircn taacuten- Thagravenh phần được phacircn taacuten qua nhiều hệ cơ sở dữ liệu vật lyacute

12METADATA- Siecircu dữ liệu Định nghĩa Siecircu dữ liệu lagrave dữ liệu về dữ liệu Lagrave 1 lưu trữ dugraveng để

Miecircu tả kho dữ liệu tổng thể Nhận dạng kiểu kho dữ liệu Quản liacute quaacute trigravenh tiacutech hợp dữ liệu Quản liacute quaacute trigravenh cập nhật kho dữ liệu Quản liacute bảo mật

Lagrave chigravea khoacutea quyết định sự thagravenh cocircng của kho dữ liệu luocircn được thay đổi vagrave cập nhật theo sự phaacutet triển của kho dữ liệu

Dugraveng để quản liacute điều khiển kho dữ liệu Sự ra đời của kho dữ liệu như 1 cấu truacutec hỗ trợ ra quyết định siecircu dữ liệu

được xem như nguồn tagravei nguyecircn dữ liệu Siecircu dữ liệu lagrave trừu tượng Chuacuteng lagrave dữ liệu bậc cao cung cấp mocirc tả ngắn

gọn caacutec dữ liệu bậc thấp hơn 13Hoạt động của Siecircu dữ liệu

Siecircu dữ liệu rất cần thiết trong việc chuyển hoacutea thocircng tin trở thagravenh tri thức Lagrave chigravea khoacutea giuacutep chuacuteng ta xử lyacute được dữ liệu thocirc Viacute dụ một dograveng dữ liệu baacuten hagraveng 1023 K596 11121 agraveNoacute sẽ khocircng coacute nghĩa gigrave cho đến khi chuacuteng ta đưa vagraveo siecircu dữ liệu (thư

mục chứa dữ liệu) agrave cửa hagraveng 1023 sản phẩm K596 vagrave số tiền baacuten được lagrave 11121 đocirc la

14Sự cần thiết phải nhất quaacuten trong kho dữ liệu Kho dữ liệu được xacircy dựng cho lợi iacutech của những nhagrave phacircn tiacutech kinh

doanh caacutec nhagrave quản trị cho tất cả caacutec khu vực chức năng Trong cơ sở dữ liệu riecircng caacutec khu vực khaacutec nhau coacute thể định nghĩa vagrave lưu

trữ dữ liệu thocircng qua phiecircn bản của chiacutenh noacute Khi dữ liệu được lấy từ những vugraveng khaacutec nhau đoacute vagrave được đặt vagraveo kho dữ

liệu Việc chuyển đổi vagrave lagravem sạch caacutec tiến trigravenh sẽ đảm bảo noacute lagrave duy nhất được tiacutech hợp tại một mức của tổ chức

15Ragrave soaacutet lại dữ liệu ndash Thực thi siecircu dữ liệu

Bất kể cấu truacutec tự nhiecircn của 1 cacircu truy vấn thế nagraveo thigrave caacutec thagravenh phần của siecircu dữ liệu rất quan trọng đối với người ra quyết định

Bảng thuộc tiacutenh khoacutea được lưu trữ bởi kho dữ liệu Tập hợp dữ liệu được lấy từ đacircu Những chuyển đổi nagraveo được thực thi với việc lagravem sạch

16Siecircu dữ liệu lagrave gigrave Metadata - lagrave thocircng tin mocirc tả nội dung của cơ sở dữ liệu (CSDL) Metadata baacuteo cho người dugraveng biết thời gian cập nhật sau cugraveng của dữ liệu

định dạng vagrave mục điacutech sử dụng của noacute Những thocircng tin nagravey coacute thể hướng dẫn người dugraveng duyệt qua CSDL vagrave

giuacutep họ hiểu được yacute nghĩa vagrave ngữ cảnh của dữ liệu Trong CSDL metadata lagrave caacutec dạng biểu diễn khaacutec nhau của caacutec đối tượng

trong CSDL Trong CSDL quan hệ metadata lagrave caacutec định nghĩa của bảng cột CSDL

view vagrave nhiều đối tượng khaacutec Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột

một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi -gtMetadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu

Bảng chuyển đổi Ghi lại những chuyển đổi đatilde được thực hiện

Lịch sử thực thi Ghi lại những dữ liệu đatilde được

phacircn tiacutech

Higravenh thaacutei kết nốiGhi lại những dữ liệu được kết nối vagrave tần suất

17Aacutenh xạ thocircng thường của siecircu dữ liệu Bản ghi aacutenh xạ chuyển đổi bao gồm

Định danh của nguồn gốc Chuyển đổi thuộc tiacutenh Chuyển đổi thuộc tiacutenh vật lyacute Matilde hoacutea tham chiếu bảng chuyển đổi Đổi tecircn Đổi khoacutea Gaacuten giaacute trị cho thuộc tiacutenh mặc định Chọn logic cho caacutec nguồn nhiều giaacute trị Đổi thuật toaacuten

18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để

phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai

lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave

tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec

Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm

Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo

19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua

caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau

SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được

Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra

một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức

Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ

Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ

Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech

CHƯƠNG 11 KHAI PHAacute DỮ LIỆU

1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn

ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993

Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng

2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd

1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều

2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP

3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn

4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng

5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server

6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo

7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động

8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời

9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều

10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện

11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech

12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP

3 Xử lyacute phacircn tiacutech trực tuyến OLAP

MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave

dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu

ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave

thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu

HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave

ROLAP4 Khai phaacute dữ liệu

Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh

khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn

Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan

5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp

6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại

Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp

Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec

Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt

Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra

Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh

vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho

Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec

Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm

Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục

Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng

gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp

Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn

Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec

Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper

Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2

Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25

Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước

Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng

Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện

trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp

Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute

độ hỗ trợ ge ngưỡng minsup

độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan

Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn

Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết

Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu

MOLAP ROLAP HOLAP

Lưu trữ dữ liệu cơ sở

Khối Bảng quan hệ Bảng quan hệ

Lưu trữ thocircng tin tổng hợp

Khối Bảng quan hệ Khối

Hiệu suất thực hiện truy vấn

Nhanh nhất Chậm nhất Nhanh

Tiecircu thụ khocircng gian lưu trữ

Nhiều Thấp Trung bigravenh

Chi phiacute bảo trigrave Cao Thấp Trung bigravenh

Page 50: De cuong(1-11)

Coacute thể tận dụng được kinh nghiệm từ những chuyecircn gia hagraveng đầu trong mọi lĩnh vực

Logic mờ được xacircy dựng dựa trecircn ngocircn ngữ tự nhiecircnNền tảng của logic mờ lagrave dựa trecircn cơ sở giao tiếp của con người

5 Nhược điểm của logic mờ Trong 1 hệ thống phức tạpsử dụng logic mờ coacute thể trở thagravenh trở ngại cho

việc xaacutec thực độ tin cậy của hệ thống Cơ chế lập luận mờ khocircng thể học hỏi từ những lỗi sai

6 Mạng noron nhacircn tạo(ANN) Mạng noron nhacircn tạo lagrave một mocirc phỏng xử lyacute thocircng tinđược nghiecircn cứu ra

từ hệ thống thần kinh của sinh vậtgiống như bộ natildeo để xử lyacute thocircng tin ANNs lagrave chương trigravenh dựa trecircn maacutey tiacutenh đơn giản coacute chức năng lagrave một mocirc

higravenh bagravei toaacuten khocircng gian dựa trecircn thử nghiệm vagrave baacuteo lỗi

7 Học từ kinh nghiệm Tiến trigravenh Một mẫu dữ liệu được biểu diễn như một mạng lưới noronANN ldquodự

đoaacutenrdquo 1 đầu radự đoaacuten được so saacutenh với giaacute trị thực tế hoặc giaacute trị chiacutenh xaacutecNếu đoaacuten được chiacutenh xaacutec thigrave khocircng coacute hagravenh động nagraveo được thực hiện

Nếu dự đoaacuten sai ANN kiểm tra lại vagrave xaacutec định lại thocircng số để điều chỉnh Một mẫu dữ liệu khaacutec được biểu diễn vagrave quaacute trigravenh nagravey được lặp lại

8 Nguyecircn tắc cơ bản của cocircng nghệ nơron Caacutec yếu tố xử lyacute cơ bản trong hệ thống thần kinh của con người lagrave tế bagraveo

thần kinhMạng lưới của tế bagraveo nagravey lagrave liecircn kết với nhau nhận được thocircng tin từ caacutec cảm biến trong mắt taihellip

Thocircng tin nhận được bởi tế bagraveo thần kinh hoặc lagrave sẽ kiacutech thiacutech noacute(sẽ được chuyển qua 1 thocircng điệp dọc theo mạng lưới) hoặc lagrave sẽ ngăn cản noacute(ngăn cản dograveng thocircng tin)

Độ nhạy coacute thể thay đổi qua thời gian hoặc sau khi coacute được kinh nghiệm

9 Cấu truacutec mạng Một ANN gồm 3 lớp cơ bản

Lớp đầu vagraveo nhận dữ liệu Lớp becircn trong hoặc lagrave lớp ẩn xử lyacute dữ liệu Lớp đầu ra chuyển tiếp kết quả cuối cugraveng của mạng

10Mạng nơ ron Thường coacute nhiều đầu vagraveo mỗi đầu vagraveo với mức ảnh hưởng vagrave tầm quan

trọng riecircng của noacute Một đầu vagraveo quan trọng coacute thể được sử dụng để khuếch đại đầu ra caacutec hagravem trạng thaacutei tổng hợp caacutec trọng số của caacutec yếu tố

đầuvagraveo khaacutec nhauvagraveo một giaacute trị duy nhất Caacutec hagravem chuyển giao xử lyacute caacutec giaacute trị trạng thaacutei vagrave tạo đầu ra

11Huấn luyện mạng nơ ron Trong mocirc higravenh coacute giaacutem saacutetANN được đến so saacutenh dự đoaacuten của chiacutenh

noacute với thocircng tin phản hồi coacute chứa caacutec kết quả mong muốn ANN sẽ phải tigravem caacutech thay đổi caacutec tham số becircn trong củamigravenh (caacutec trọng số vagrave caacutec ngưỡng) để tạo necircn một aacutenh xạ coacute khả năng aacutenh xạcaacutec đầu vagraveo thagravenh caacutec đầu ra mong muốn Sự thay đổi nagravey được tiến hagravenh nhờ việc so saacutenh giữa đầu ra thực sự vagrave đầu ra mong muốn

Trong mocirc higravenh khocircng coacute giaacutem saacutetANN nhận được dữ liệu vagraveo nhưng khocircng phải coacute bất kỳ thocircng tin phản hồi về kết quả mong muốn

Phần lớn caacutec ứng dụng nằm trong vugraveng của caacutec bagravei toaacuten ước lượng như mocirc higravenh hoacuteathống kecirc neacuten lọc phacircn cụm

12Lợi iacutech Liecircn kết với mạng noron Traacutenh caacutech lập trigravenh tường minh Giảm nhu cầu của chuyecircn gia ANNs thigrave thiacutech nghi với caacutec yếu tố đầu vagraveo thay đổi Khocircng cần thiết cho cơ sở tri thức tinh chế ANNs coacute tiacutenh động vagrave cải thiện với việc sử dụng Coacute khả năng xử lyacute dữ liệu khocircng chiacutenh xaacutec hoặc khocircng đầy đủ Cho pheacutep tổng quaacutet hoacutea từ thocircng tin cụ thể Cho pheacutep thu thập cảm giaacutec thocircng thường vagraveo miền giải quyết vấn đề

13Hạn chế của việc liecircn kết với mạng noron ANNs khocircng thể giải thiacutech được suy luận Bản chất hộp đen thường khiến cho vấn đề traacutech nhiệm vagrave độ tin cậy phaacutet

sinh lagrave khoacute khăn Lặp đi lặp lại quaacute trigravenh huấn luyện rất tốn thời gian Nguồn lực caacutec nhagrave phacircn tiacutech vagrave thiết kế coacute tay nghề cao vẫn lagrave đaacuteng lo

ngại Cocircng nghệ ANN thuacutec đẩy hạn chế của phần cứng hiện tại ANN yecircu cầu phải coacute sự tin tưởng ở đầu ra

14Giới thiệu về thuật toaacuten di truyền Cũng như mạng lưới thần kinh caacutec thuật toaacuten di truyền được dựa trecircn lyacute

thuyết sinh học Thuật toaacuten di truyền tigravem thấy nguồn gốc của chuacuteng trong caacutec lyacute thuyết

tiến hoacutea của chọn lọc tự nhiecircn vagrave thiacutech ứng với biến đổi khiacute hậu Kết quả thuật toaacuten di truyền lagrave từ giao phối 2 caacute thể trong quần thế để tạo

ra con caacutei đocirci khi tốt hơn so với bậc cha mẹ của chuacuteng 15Caacutec thagravenh phần cơ bản của thuật toaacuten di truyền

Toaacuten tử chọn lọc Caacutec caacute thể tốt được chọn lọc để đưa vagraveo thế hệ sau Sự chọn lọc nagravey căn cứ vagraveo độ thiacutech nghi với mocirci trường của mỗi caacute thể

Toaacuten tử lai gheacutep (crossover) Hai caacute thể cha vagrave mẹ trao đổi caacutec gen với nhau để tạo ra caacute thể con

Toaacuten tử đột biến (mutation) Một caacute thể thay đổi một số gen để biến đổi thagravenh một caacute thể mớiTất cả caacutec toaacuten tử trecircn khi thực hiện đều mang tiacutenh ngẫu nhiecircn

16Quaacute trigravenh cơ bản của một thuật toaacuten di truyền Khởi tạo

Đaacutenh giaacute quần thể

Lựa chọn NST thiacutech hợp nhất vagrave loại bỏ NST yếu nhất

Quy trigravenh giao nhau vagrave cải thiện quần thể

đột biến tiến trigravenh để khaacutem phaacute ra NST mới

17Ưu nhược điểm của việc kết hợp với thuật toaacuten di truyền Kiacutech thước quần thể lagrave 1 yếu tố quan trọng trong tốc độ của việc tigravem

kiếmnhưng noacute tương đối dễ dagraveng để dự đoaacuten tốc độ nagravey Giao nhau hoặc đột biến lagrave khocircng necircn đc sử dụng quaacute thường xuyecircn Luocircn coacute được iacutet nhất 1 giải phaacutep hợp lyacute Necircn coacute thể aacutep dụng chuacuteng cho caacutec vấn đề magrave chuacuteng ta khocircng coacute hướng

về caacutech giải quyết Sức mạnh của thuật toaacuten xuất phaacutet từ khaacutei niệm đơn giảnkhocircng phải từ

một thủ tục thuật toaacuten phức tạp 18Tương lai của học maacutey

Mạng lưới thần kinh nhacircn tạo vượt quaacute năng lực của con người trong caacutec trường hợp bị cocirc lập

Về mặt lyacute thuyếtmột maacutey tiacutenh coacute thể xử lyacute dũ liệu nhanh hơn hagraveng triệu lần so với 1 con người

May mắn thay cho chuacuteng tacon người tốt hơn nhiều khi magrave coacute được dữ liệumaacutey tiacutenh khocircng coacute 1 số thứ như lagrave 5 giaacutec quan

CHƯƠNG 10 KHO DỮ LIỆU

1 Kho dữ liệu Kho dữ liệu lagrave tuyển tập caacutec cơ sở dữ liệu tiacutech hợp hướng chủ đề được

thiết kế để trợ giuacutep cho một hệ hỗ trợ quyết định

Theo John Ladley Cocircng nghệ kho dữ liệu lagrave tập caacutec phương phaacutep kỹ thuật vagrave caacutec cocircng cụ coacute thể kết hợp hỗ trợ nhau để cung cấp thocircng tin cho người sử dụng trecircn cơ sở tiacutech hợp từ nhiều nguồn dữ liệu nhiều mocirci trường khaacutec nhau

Kho dữ liệu thường rất lớn tới hagraveng trăm GB hay thậm chiacute hagraveng Terabyte

2 Kho dữ liệu vận hagravenh (ODS) Một kho dữ liệu vận hagravenh Aacutep dụng kỹ thuật kho dữ liệu vagraveo caacutec hệ xử

lyacute giao taacutec lưu trữ dữ liệu cho một ứng dụng đặc thugrave Noacute đưa vagraveo kho dữ liệu một dograveng caacutec dữ liệu thocirc được thiết kế

3 So saacutenh

Kho dữ liệu vận hagravenh Kho dữ liệu

Dữ liệu theo chủ đề Dữ liệu theo chủ đề

Dữ liệu tiacutech hợp Dữ liệu tiacutech hợp

Dữ liệu thay đổi Dữ liệu khocircng thay đổi

Dữ liệu được cập nhật khi thay đổi

Dữ liệu giữ nguyecircn

Chỉ coacute dữ liệu hiện tạiDữliệu hiện tại vagrave dữ liệu lịch sử

Chu kỳ lagravem tươi dữ liệu ngắn Chu kỳ lagravem tươi dữ liệu dagravei

Chỉ coacute dữ liệu chi tiết Dữ liệu chi tiết vagrave dữ liệu tổng kết

Dugraveng cho caacutec quyết định ngắn hạn

Dugraveng cho hoạch định dagravei hạn

4 Kho dữ liệu cục bộ (Data Mart - DM)

Kho dữ liệu cục bộ lagrave CSDL coacute những đặc điểm giống với kho dữ liệu nhưng với quy mocirc nhỏ hơn vagrave lưu trữ dữ liệu về một lĩnh vực một chuyecircn ngagravenh

Data mart phụ thuộc Chứa những dữ liệu được lấy từ DW vagrave những dữ liệu nagravey sẽ được triacutech lọc vagrave tinh chế tiacutech hợp lại ở mức cao hơn để phục vụ một chủ đề nhất định của Datamart

Data mart độc lập Khocircng giống như Datamart phụ thuộc Data mart độc lập được xacircy dựng trước DW vagrave dữ liệu được trực tiếp lấy từ caacutec nguồn khaacutec nhau

5 Siecircu dữ liệu Metadata lagrave dữ liệu để mocirc tả dữ liệu Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột

một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi Metadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu

6 Mocirci trường kho dữ liệu Hệ thống của tổ chức vagrave kho cung cấp dữ liệu để xacircy dựng kho dữ liệu Trong quaacute trigravenh chuyển dữ liệu từ caacutec nguồn khaacutec nhau dữ liệu coacute thể

được lagravem sạch hoặc chuyển đổi vagrave vigrave thế DW được xem như lagrave một chuẩn cho việc lưu trữ

Đồng thời siecircu dữ liệu được ghi lại Cuối cugraveng DW hoặc siecircu thị coacute thể được sử dụng để tạo ra một kho dữ

liệu ldquocaacute nhacircnrdquo 7 Caacutec đặc điểm của kho dữ liệu

Đặc điểm Mocirc tả

Hướng chủ đề - DL tổ chức theo caacutech thức người dugraveng tham chiếu

Tiacutech hợp - Dữ liệu ldquosạchrdquo loại bỏ tiacutenh thiếu nhất quaacuten

Khocircng thay đổi - DL ldquochỉ đọcrdquo người dugraveng khocircng thay đổi được

Chuỗi thời gian - DL lagrave chuỗi thời gian khocircng phải lagrave trạng thaacutei hiện tại

Được tổng kết - DL vận hagravenhthao taacutec khi cần thiết

được kết hợp lại thagravenh dạng coacute thể dugraveng được cho quyết định

Kiacutech cỡ lớn hơn - Lưu giữ theo chuỗi thời gian tức lagrave giữ lại nhiều DL

Khocircng được chuẩn hoacutea - Coacute thể dư thừa DLSiecircu dữ liệu - Dữ liệu của dữ liệu được lưu trữNguồn dữ liệu - DL vận hagravenh (caacutec hệ sẵn coacute) cugraveng

với caacutec nguồn ngoagravei 8 Kho dữ liệu hướng chủ đề

Hướng chủ để coacute nghĩa lagrave kho dữ liệu được tổ chức xung quanh caacutec chủ đề chiacutenh như khaacutech hagraveng sản phẩm sản xuất Tập trung vagraveo việc mocirc higravenh hoacutea vagrave phacircn tiacutech dữ liệu cho caacutec nhagrave ra quyết định magrave khocircng tập trung vagraveo caacutec xử lyacute thocircng thường Cung cấp cho người dugraveng một khung nhigraven toagraven vẹn đơn giản vagrave đầy đủ về caacutec sự kiện quanh caacutec chủ đề

9 Dữ liệu trong DW được tiacutech hợp Dữ liệu trong kho dữ liệu được xacircy dựng bằng caacutech tổng hợp dữ liệu từ

nhiều nguồn khaacutec nhau vagrave caacutec nguồn coacute tổ chức khaacutec nhau Cơ sở dữ liệu caacutec file excel caacutec flat file hoặc caacutec raw file Khi đưa vagraveo kho dữ liệu caacutec dữ liệu được lagravem sạch vagrave tiacutech hợp dữ liệu nhằm đảm bảo tiacutenh nhất quaacuten của dữ liệu

10Kiến truacutec kho dữ liệu Tầng cơ sở dữ liệu hoạt động Tầng truy xuất thocircng tin Tầng truy xuất dữ liệu Tầng siecircu dữ liệu Tầng quản lyacute tiến trigravenh Tầng thocircng điệp của ứng dụng Tầng vật liacute của kho dữ liệu Tầng trigravenh diễn dữ liệu

11Higravenh trạng kho dữ liệu Kho dữ liệu ảo - người dugraveng cuối coacute thể truy cập trực tiếp đến kho dữ liệu

sử dụng caacutec cocircng cụ cho pheacutep ở tầng truy xuất dữ liệu Kho dữ liệu trung tacircm-1 cơ sở dữ liệu vật lyacute chứa tất cả dữ liệu cho một

vugraveng chuyecircn dụng nagraveo đoacute

Kho dữ liệu phacircn taacuten- Thagravenh phần được phacircn taacuten qua nhiều hệ cơ sở dữ liệu vật lyacute

12METADATA- Siecircu dữ liệu Định nghĩa Siecircu dữ liệu lagrave dữ liệu về dữ liệu Lagrave 1 lưu trữ dugraveng để

Miecircu tả kho dữ liệu tổng thể Nhận dạng kiểu kho dữ liệu Quản liacute quaacute trigravenh tiacutech hợp dữ liệu Quản liacute quaacute trigravenh cập nhật kho dữ liệu Quản liacute bảo mật

Lagrave chigravea khoacutea quyết định sự thagravenh cocircng của kho dữ liệu luocircn được thay đổi vagrave cập nhật theo sự phaacutet triển của kho dữ liệu

Dugraveng để quản liacute điều khiển kho dữ liệu Sự ra đời của kho dữ liệu như 1 cấu truacutec hỗ trợ ra quyết định siecircu dữ liệu

được xem như nguồn tagravei nguyecircn dữ liệu Siecircu dữ liệu lagrave trừu tượng Chuacuteng lagrave dữ liệu bậc cao cung cấp mocirc tả ngắn

gọn caacutec dữ liệu bậc thấp hơn 13Hoạt động của Siecircu dữ liệu

Siecircu dữ liệu rất cần thiết trong việc chuyển hoacutea thocircng tin trở thagravenh tri thức Lagrave chigravea khoacutea giuacutep chuacuteng ta xử lyacute được dữ liệu thocirc Viacute dụ một dograveng dữ liệu baacuten hagraveng 1023 K596 11121 agraveNoacute sẽ khocircng coacute nghĩa gigrave cho đến khi chuacuteng ta đưa vagraveo siecircu dữ liệu (thư

mục chứa dữ liệu) agrave cửa hagraveng 1023 sản phẩm K596 vagrave số tiền baacuten được lagrave 11121 đocirc la

14Sự cần thiết phải nhất quaacuten trong kho dữ liệu Kho dữ liệu được xacircy dựng cho lợi iacutech của những nhagrave phacircn tiacutech kinh

doanh caacutec nhagrave quản trị cho tất cả caacutec khu vực chức năng Trong cơ sở dữ liệu riecircng caacutec khu vực khaacutec nhau coacute thể định nghĩa vagrave lưu

trữ dữ liệu thocircng qua phiecircn bản của chiacutenh noacute Khi dữ liệu được lấy từ những vugraveng khaacutec nhau đoacute vagrave được đặt vagraveo kho dữ

liệu Việc chuyển đổi vagrave lagravem sạch caacutec tiến trigravenh sẽ đảm bảo noacute lagrave duy nhất được tiacutech hợp tại một mức của tổ chức

15Ragrave soaacutet lại dữ liệu ndash Thực thi siecircu dữ liệu

Bất kể cấu truacutec tự nhiecircn của 1 cacircu truy vấn thế nagraveo thigrave caacutec thagravenh phần của siecircu dữ liệu rất quan trọng đối với người ra quyết định

Bảng thuộc tiacutenh khoacutea được lưu trữ bởi kho dữ liệu Tập hợp dữ liệu được lấy từ đacircu Những chuyển đổi nagraveo được thực thi với việc lagravem sạch

16Siecircu dữ liệu lagrave gigrave Metadata - lagrave thocircng tin mocirc tả nội dung của cơ sở dữ liệu (CSDL) Metadata baacuteo cho người dugraveng biết thời gian cập nhật sau cugraveng của dữ liệu

định dạng vagrave mục điacutech sử dụng của noacute Những thocircng tin nagravey coacute thể hướng dẫn người dugraveng duyệt qua CSDL vagrave

giuacutep họ hiểu được yacute nghĩa vagrave ngữ cảnh của dữ liệu Trong CSDL metadata lagrave caacutec dạng biểu diễn khaacutec nhau của caacutec đối tượng

trong CSDL Trong CSDL quan hệ metadata lagrave caacutec định nghĩa của bảng cột CSDL

view vagrave nhiều đối tượng khaacutec Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột

một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi -gtMetadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu

Bảng chuyển đổi Ghi lại những chuyển đổi đatilde được thực hiện

Lịch sử thực thi Ghi lại những dữ liệu đatilde được

phacircn tiacutech

Higravenh thaacutei kết nốiGhi lại những dữ liệu được kết nối vagrave tần suất

17Aacutenh xạ thocircng thường của siecircu dữ liệu Bản ghi aacutenh xạ chuyển đổi bao gồm

Định danh của nguồn gốc Chuyển đổi thuộc tiacutenh Chuyển đổi thuộc tiacutenh vật lyacute Matilde hoacutea tham chiếu bảng chuyển đổi Đổi tecircn Đổi khoacutea Gaacuten giaacute trị cho thuộc tiacutenh mặc định Chọn logic cho caacutec nguồn nhiều giaacute trị Đổi thuật toaacuten

18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để

phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai

lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave

tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec

Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm

Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo

19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua

caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau

SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được

Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra

một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức

Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ

Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ

Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech

CHƯƠNG 11 KHAI PHAacute DỮ LIỆU

1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn

ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993

Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng

2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd

1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều

2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP

3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn

4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng

5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server

6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo

7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động

8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời

9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều

10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện

11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech

12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP

3 Xử lyacute phacircn tiacutech trực tuyến OLAP

MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave

dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu

ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave

thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu

HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave

ROLAP4 Khai phaacute dữ liệu

Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh

khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn

Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan

5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp

6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại

Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp

Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec

Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt

Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra

Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh

vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho

Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec

Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm

Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục

Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng

gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp

Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn

Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec

Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper

Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2

Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25

Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước

Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng

Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện

trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp

Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute

độ hỗ trợ ge ngưỡng minsup

độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan

Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn

Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết

Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu

MOLAP ROLAP HOLAP

Lưu trữ dữ liệu cơ sở

Khối Bảng quan hệ Bảng quan hệ

Lưu trữ thocircng tin tổng hợp

Khối Bảng quan hệ Khối

Hiệu suất thực hiện truy vấn

Nhanh nhất Chậm nhất Nhanh

Tiecircu thụ khocircng gian lưu trữ

Nhiều Thấp Trung bigravenh

Chi phiacute bảo trigrave Cao Thấp Trung bigravenh

Page 51: De cuong(1-11)

Lớp đầu vagraveo nhận dữ liệu Lớp becircn trong hoặc lagrave lớp ẩn xử lyacute dữ liệu Lớp đầu ra chuyển tiếp kết quả cuối cugraveng của mạng

10Mạng nơ ron Thường coacute nhiều đầu vagraveo mỗi đầu vagraveo với mức ảnh hưởng vagrave tầm quan

trọng riecircng của noacute Một đầu vagraveo quan trọng coacute thể được sử dụng để khuếch đại đầu ra caacutec hagravem trạng thaacutei tổng hợp caacutec trọng số của caacutec yếu tố

đầuvagraveo khaacutec nhauvagraveo một giaacute trị duy nhất Caacutec hagravem chuyển giao xử lyacute caacutec giaacute trị trạng thaacutei vagrave tạo đầu ra

11Huấn luyện mạng nơ ron Trong mocirc higravenh coacute giaacutem saacutetANN được đến so saacutenh dự đoaacuten của chiacutenh

noacute với thocircng tin phản hồi coacute chứa caacutec kết quả mong muốn ANN sẽ phải tigravem caacutech thay đổi caacutec tham số becircn trong củamigravenh (caacutec trọng số vagrave caacutec ngưỡng) để tạo necircn một aacutenh xạ coacute khả năng aacutenh xạcaacutec đầu vagraveo thagravenh caacutec đầu ra mong muốn Sự thay đổi nagravey được tiến hagravenh nhờ việc so saacutenh giữa đầu ra thực sự vagrave đầu ra mong muốn

Trong mocirc higravenh khocircng coacute giaacutem saacutetANN nhận được dữ liệu vagraveo nhưng khocircng phải coacute bất kỳ thocircng tin phản hồi về kết quả mong muốn

Phần lớn caacutec ứng dụng nằm trong vugraveng của caacutec bagravei toaacuten ước lượng như mocirc higravenh hoacuteathống kecirc neacuten lọc phacircn cụm

12Lợi iacutech Liecircn kết với mạng noron Traacutenh caacutech lập trigravenh tường minh Giảm nhu cầu của chuyecircn gia ANNs thigrave thiacutech nghi với caacutec yếu tố đầu vagraveo thay đổi Khocircng cần thiết cho cơ sở tri thức tinh chế ANNs coacute tiacutenh động vagrave cải thiện với việc sử dụng Coacute khả năng xử lyacute dữ liệu khocircng chiacutenh xaacutec hoặc khocircng đầy đủ Cho pheacutep tổng quaacutet hoacutea từ thocircng tin cụ thể Cho pheacutep thu thập cảm giaacutec thocircng thường vagraveo miền giải quyết vấn đề

13Hạn chế của việc liecircn kết với mạng noron ANNs khocircng thể giải thiacutech được suy luận Bản chất hộp đen thường khiến cho vấn đề traacutech nhiệm vagrave độ tin cậy phaacutet

sinh lagrave khoacute khăn Lặp đi lặp lại quaacute trigravenh huấn luyện rất tốn thời gian Nguồn lực caacutec nhagrave phacircn tiacutech vagrave thiết kế coacute tay nghề cao vẫn lagrave đaacuteng lo

ngại Cocircng nghệ ANN thuacutec đẩy hạn chế của phần cứng hiện tại ANN yecircu cầu phải coacute sự tin tưởng ở đầu ra

14Giới thiệu về thuật toaacuten di truyền Cũng như mạng lưới thần kinh caacutec thuật toaacuten di truyền được dựa trecircn lyacute

thuyết sinh học Thuật toaacuten di truyền tigravem thấy nguồn gốc của chuacuteng trong caacutec lyacute thuyết

tiến hoacutea của chọn lọc tự nhiecircn vagrave thiacutech ứng với biến đổi khiacute hậu Kết quả thuật toaacuten di truyền lagrave từ giao phối 2 caacute thể trong quần thế để tạo

ra con caacutei đocirci khi tốt hơn so với bậc cha mẹ của chuacuteng 15Caacutec thagravenh phần cơ bản của thuật toaacuten di truyền

Toaacuten tử chọn lọc Caacutec caacute thể tốt được chọn lọc để đưa vagraveo thế hệ sau Sự chọn lọc nagravey căn cứ vagraveo độ thiacutech nghi với mocirci trường của mỗi caacute thể

Toaacuten tử lai gheacutep (crossover) Hai caacute thể cha vagrave mẹ trao đổi caacutec gen với nhau để tạo ra caacute thể con

Toaacuten tử đột biến (mutation) Một caacute thể thay đổi một số gen để biến đổi thagravenh một caacute thể mớiTất cả caacutec toaacuten tử trecircn khi thực hiện đều mang tiacutenh ngẫu nhiecircn

16Quaacute trigravenh cơ bản của một thuật toaacuten di truyền Khởi tạo

Đaacutenh giaacute quần thể

Lựa chọn NST thiacutech hợp nhất vagrave loại bỏ NST yếu nhất

Quy trigravenh giao nhau vagrave cải thiện quần thể

đột biến tiến trigravenh để khaacutem phaacute ra NST mới

17Ưu nhược điểm của việc kết hợp với thuật toaacuten di truyền Kiacutech thước quần thể lagrave 1 yếu tố quan trọng trong tốc độ của việc tigravem

kiếmnhưng noacute tương đối dễ dagraveng để dự đoaacuten tốc độ nagravey Giao nhau hoặc đột biến lagrave khocircng necircn đc sử dụng quaacute thường xuyecircn Luocircn coacute được iacutet nhất 1 giải phaacutep hợp lyacute Necircn coacute thể aacutep dụng chuacuteng cho caacutec vấn đề magrave chuacuteng ta khocircng coacute hướng

về caacutech giải quyết Sức mạnh của thuật toaacuten xuất phaacutet từ khaacutei niệm đơn giảnkhocircng phải từ

một thủ tục thuật toaacuten phức tạp 18Tương lai của học maacutey

Mạng lưới thần kinh nhacircn tạo vượt quaacute năng lực của con người trong caacutec trường hợp bị cocirc lập

Về mặt lyacute thuyếtmột maacutey tiacutenh coacute thể xử lyacute dũ liệu nhanh hơn hagraveng triệu lần so với 1 con người

May mắn thay cho chuacuteng tacon người tốt hơn nhiều khi magrave coacute được dữ liệumaacutey tiacutenh khocircng coacute 1 số thứ như lagrave 5 giaacutec quan

CHƯƠNG 10 KHO DỮ LIỆU

1 Kho dữ liệu Kho dữ liệu lagrave tuyển tập caacutec cơ sở dữ liệu tiacutech hợp hướng chủ đề được

thiết kế để trợ giuacutep cho một hệ hỗ trợ quyết định

Theo John Ladley Cocircng nghệ kho dữ liệu lagrave tập caacutec phương phaacutep kỹ thuật vagrave caacutec cocircng cụ coacute thể kết hợp hỗ trợ nhau để cung cấp thocircng tin cho người sử dụng trecircn cơ sở tiacutech hợp từ nhiều nguồn dữ liệu nhiều mocirci trường khaacutec nhau

Kho dữ liệu thường rất lớn tới hagraveng trăm GB hay thậm chiacute hagraveng Terabyte

2 Kho dữ liệu vận hagravenh (ODS) Một kho dữ liệu vận hagravenh Aacutep dụng kỹ thuật kho dữ liệu vagraveo caacutec hệ xử

lyacute giao taacutec lưu trữ dữ liệu cho một ứng dụng đặc thugrave Noacute đưa vagraveo kho dữ liệu một dograveng caacutec dữ liệu thocirc được thiết kế

3 So saacutenh

Kho dữ liệu vận hagravenh Kho dữ liệu

Dữ liệu theo chủ đề Dữ liệu theo chủ đề

Dữ liệu tiacutech hợp Dữ liệu tiacutech hợp

Dữ liệu thay đổi Dữ liệu khocircng thay đổi

Dữ liệu được cập nhật khi thay đổi

Dữ liệu giữ nguyecircn

Chỉ coacute dữ liệu hiện tạiDữliệu hiện tại vagrave dữ liệu lịch sử

Chu kỳ lagravem tươi dữ liệu ngắn Chu kỳ lagravem tươi dữ liệu dagravei

Chỉ coacute dữ liệu chi tiết Dữ liệu chi tiết vagrave dữ liệu tổng kết

Dugraveng cho caacutec quyết định ngắn hạn

Dugraveng cho hoạch định dagravei hạn

4 Kho dữ liệu cục bộ (Data Mart - DM)

Kho dữ liệu cục bộ lagrave CSDL coacute những đặc điểm giống với kho dữ liệu nhưng với quy mocirc nhỏ hơn vagrave lưu trữ dữ liệu về một lĩnh vực một chuyecircn ngagravenh

Data mart phụ thuộc Chứa những dữ liệu được lấy từ DW vagrave những dữ liệu nagravey sẽ được triacutech lọc vagrave tinh chế tiacutech hợp lại ở mức cao hơn để phục vụ một chủ đề nhất định của Datamart

Data mart độc lập Khocircng giống như Datamart phụ thuộc Data mart độc lập được xacircy dựng trước DW vagrave dữ liệu được trực tiếp lấy từ caacutec nguồn khaacutec nhau

5 Siecircu dữ liệu Metadata lagrave dữ liệu để mocirc tả dữ liệu Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột

một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi Metadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu

6 Mocirci trường kho dữ liệu Hệ thống của tổ chức vagrave kho cung cấp dữ liệu để xacircy dựng kho dữ liệu Trong quaacute trigravenh chuyển dữ liệu từ caacutec nguồn khaacutec nhau dữ liệu coacute thể

được lagravem sạch hoặc chuyển đổi vagrave vigrave thế DW được xem như lagrave một chuẩn cho việc lưu trữ

Đồng thời siecircu dữ liệu được ghi lại Cuối cugraveng DW hoặc siecircu thị coacute thể được sử dụng để tạo ra một kho dữ

liệu ldquocaacute nhacircnrdquo 7 Caacutec đặc điểm của kho dữ liệu

Đặc điểm Mocirc tả

Hướng chủ đề - DL tổ chức theo caacutech thức người dugraveng tham chiếu

Tiacutech hợp - Dữ liệu ldquosạchrdquo loại bỏ tiacutenh thiếu nhất quaacuten

Khocircng thay đổi - DL ldquochỉ đọcrdquo người dugraveng khocircng thay đổi được

Chuỗi thời gian - DL lagrave chuỗi thời gian khocircng phải lagrave trạng thaacutei hiện tại

Được tổng kết - DL vận hagravenhthao taacutec khi cần thiết

được kết hợp lại thagravenh dạng coacute thể dugraveng được cho quyết định

Kiacutech cỡ lớn hơn - Lưu giữ theo chuỗi thời gian tức lagrave giữ lại nhiều DL

Khocircng được chuẩn hoacutea - Coacute thể dư thừa DLSiecircu dữ liệu - Dữ liệu của dữ liệu được lưu trữNguồn dữ liệu - DL vận hagravenh (caacutec hệ sẵn coacute) cugraveng

với caacutec nguồn ngoagravei 8 Kho dữ liệu hướng chủ đề

Hướng chủ để coacute nghĩa lagrave kho dữ liệu được tổ chức xung quanh caacutec chủ đề chiacutenh như khaacutech hagraveng sản phẩm sản xuất Tập trung vagraveo việc mocirc higravenh hoacutea vagrave phacircn tiacutech dữ liệu cho caacutec nhagrave ra quyết định magrave khocircng tập trung vagraveo caacutec xử lyacute thocircng thường Cung cấp cho người dugraveng một khung nhigraven toagraven vẹn đơn giản vagrave đầy đủ về caacutec sự kiện quanh caacutec chủ đề

9 Dữ liệu trong DW được tiacutech hợp Dữ liệu trong kho dữ liệu được xacircy dựng bằng caacutech tổng hợp dữ liệu từ

nhiều nguồn khaacutec nhau vagrave caacutec nguồn coacute tổ chức khaacutec nhau Cơ sở dữ liệu caacutec file excel caacutec flat file hoặc caacutec raw file Khi đưa vagraveo kho dữ liệu caacutec dữ liệu được lagravem sạch vagrave tiacutech hợp dữ liệu nhằm đảm bảo tiacutenh nhất quaacuten của dữ liệu

10Kiến truacutec kho dữ liệu Tầng cơ sở dữ liệu hoạt động Tầng truy xuất thocircng tin Tầng truy xuất dữ liệu Tầng siecircu dữ liệu Tầng quản lyacute tiến trigravenh Tầng thocircng điệp của ứng dụng Tầng vật liacute của kho dữ liệu Tầng trigravenh diễn dữ liệu

11Higravenh trạng kho dữ liệu Kho dữ liệu ảo - người dugraveng cuối coacute thể truy cập trực tiếp đến kho dữ liệu

sử dụng caacutec cocircng cụ cho pheacutep ở tầng truy xuất dữ liệu Kho dữ liệu trung tacircm-1 cơ sở dữ liệu vật lyacute chứa tất cả dữ liệu cho một

vugraveng chuyecircn dụng nagraveo đoacute

Kho dữ liệu phacircn taacuten- Thagravenh phần được phacircn taacuten qua nhiều hệ cơ sở dữ liệu vật lyacute

12METADATA- Siecircu dữ liệu Định nghĩa Siecircu dữ liệu lagrave dữ liệu về dữ liệu Lagrave 1 lưu trữ dugraveng để

Miecircu tả kho dữ liệu tổng thể Nhận dạng kiểu kho dữ liệu Quản liacute quaacute trigravenh tiacutech hợp dữ liệu Quản liacute quaacute trigravenh cập nhật kho dữ liệu Quản liacute bảo mật

Lagrave chigravea khoacutea quyết định sự thagravenh cocircng của kho dữ liệu luocircn được thay đổi vagrave cập nhật theo sự phaacutet triển của kho dữ liệu

Dugraveng để quản liacute điều khiển kho dữ liệu Sự ra đời của kho dữ liệu như 1 cấu truacutec hỗ trợ ra quyết định siecircu dữ liệu

được xem như nguồn tagravei nguyecircn dữ liệu Siecircu dữ liệu lagrave trừu tượng Chuacuteng lagrave dữ liệu bậc cao cung cấp mocirc tả ngắn

gọn caacutec dữ liệu bậc thấp hơn 13Hoạt động của Siecircu dữ liệu

Siecircu dữ liệu rất cần thiết trong việc chuyển hoacutea thocircng tin trở thagravenh tri thức Lagrave chigravea khoacutea giuacutep chuacuteng ta xử lyacute được dữ liệu thocirc Viacute dụ một dograveng dữ liệu baacuten hagraveng 1023 K596 11121 agraveNoacute sẽ khocircng coacute nghĩa gigrave cho đến khi chuacuteng ta đưa vagraveo siecircu dữ liệu (thư

mục chứa dữ liệu) agrave cửa hagraveng 1023 sản phẩm K596 vagrave số tiền baacuten được lagrave 11121 đocirc la

14Sự cần thiết phải nhất quaacuten trong kho dữ liệu Kho dữ liệu được xacircy dựng cho lợi iacutech của những nhagrave phacircn tiacutech kinh

doanh caacutec nhagrave quản trị cho tất cả caacutec khu vực chức năng Trong cơ sở dữ liệu riecircng caacutec khu vực khaacutec nhau coacute thể định nghĩa vagrave lưu

trữ dữ liệu thocircng qua phiecircn bản của chiacutenh noacute Khi dữ liệu được lấy từ những vugraveng khaacutec nhau đoacute vagrave được đặt vagraveo kho dữ

liệu Việc chuyển đổi vagrave lagravem sạch caacutec tiến trigravenh sẽ đảm bảo noacute lagrave duy nhất được tiacutech hợp tại một mức của tổ chức

15Ragrave soaacutet lại dữ liệu ndash Thực thi siecircu dữ liệu

Bất kể cấu truacutec tự nhiecircn của 1 cacircu truy vấn thế nagraveo thigrave caacutec thagravenh phần của siecircu dữ liệu rất quan trọng đối với người ra quyết định

Bảng thuộc tiacutenh khoacutea được lưu trữ bởi kho dữ liệu Tập hợp dữ liệu được lấy từ đacircu Những chuyển đổi nagraveo được thực thi với việc lagravem sạch

16Siecircu dữ liệu lagrave gigrave Metadata - lagrave thocircng tin mocirc tả nội dung của cơ sở dữ liệu (CSDL) Metadata baacuteo cho người dugraveng biết thời gian cập nhật sau cugraveng của dữ liệu

định dạng vagrave mục điacutech sử dụng của noacute Những thocircng tin nagravey coacute thể hướng dẫn người dugraveng duyệt qua CSDL vagrave

giuacutep họ hiểu được yacute nghĩa vagrave ngữ cảnh của dữ liệu Trong CSDL metadata lagrave caacutec dạng biểu diễn khaacutec nhau của caacutec đối tượng

trong CSDL Trong CSDL quan hệ metadata lagrave caacutec định nghĩa của bảng cột CSDL

view vagrave nhiều đối tượng khaacutec Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột

một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi -gtMetadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu

Bảng chuyển đổi Ghi lại những chuyển đổi đatilde được thực hiện

Lịch sử thực thi Ghi lại những dữ liệu đatilde được

phacircn tiacutech

Higravenh thaacutei kết nốiGhi lại những dữ liệu được kết nối vagrave tần suất

17Aacutenh xạ thocircng thường của siecircu dữ liệu Bản ghi aacutenh xạ chuyển đổi bao gồm

Định danh của nguồn gốc Chuyển đổi thuộc tiacutenh Chuyển đổi thuộc tiacutenh vật lyacute Matilde hoacutea tham chiếu bảng chuyển đổi Đổi tecircn Đổi khoacutea Gaacuten giaacute trị cho thuộc tiacutenh mặc định Chọn logic cho caacutec nguồn nhiều giaacute trị Đổi thuật toaacuten

18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để

phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai

lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave

tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec

Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm

Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo

19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua

caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau

SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được

Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra

một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức

Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ

Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ

Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech

CHƯƠNG 11 KHAI PHAacute DỮ LIỆU

1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn

ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993

Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng

2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd

1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều

2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP

3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn

4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng

5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server

6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo

7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động

8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời

9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều

10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện

11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech

12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP

3 Xử lyacute phacircn tiacutech trực tuyến OLAP

MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave

dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu

ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave

thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu

HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave

ROLAP4 Khai phaacute dữ liệu

Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh

khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn

Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan

5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp

6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại

Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp

Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec

Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt

Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra

Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh

vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho

Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec

Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm

Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục

Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng

gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp

Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn

Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec

Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper

Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2

Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25

Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước

Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng

Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện

trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp

Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute

độ hỗ trợ ge ngưỡng minsup

độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan

Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn

Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết

Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu

MOLAP ROLAP HOLAP

Lưu trữ dữ liệu cơ sở

Khối Bảng quan hệ Bảng quan hệ

Lưu trữ thocircng tin tổng hợp

Khối Bảng quan hệ Khối

Hiệu suất thực hiện truy vấn

Nhanh nhất Chậm nhất Nhanh

Tiecircu thụ khocircng gian lưu trữ

Nhiều Thấp Trung bigravenh

Chi phiacute bảo trigrave Cao Thấp Trung bigravenh

Page 52: De cuong(1-11)

Phần lớn caacutec ứng dụng nằm trong vugraveng của caacutec bagravei toaacuten ước lượng như mocirc higravenh hoacuteathống kecirc neacuten lọc phacircn cụm

12Lợi iacutech Liecircn kết với mạng noron Traacutenh caacutech lập trigravenh tường minh Giảm nhu cầu của chuyecircn gia ANNs thigrave thiacutech nghi với caacutec yếu tố đầu vagraveo thay đổi Khocircng cần thiết cho cơ sở tri thức tinh chế ANNs coacute tiacutenh động vagrave cải thiện với việc sử dụng Coacute khả năng xử lyacute dữ liệu khocircng chiacutenh xaacutec hoặc khocircng đầy đủ Cho pheacutep tổng quaacutet hoacutea từ thocircng tin cụ thể Cho pheacutep thu thập cảm giaacutec thocircng thường vagraveo miền giải quyết vấn đề

13Hạn chế của việc liecircn kết với mạng noron ANNs khocircng thể giải thiacutech được suy luận Bản chất hộp đen thường khiến cho vấn đề traacutech nhiệm vagrave độ tin cậy phaacutet

sinh lagrave khoacute khăn Lặp đi lặp lại quaacute trigravenh huấn luyện rất tốn thời gian Nguồn lực caacutec nhagrave phacircn tiacutech vagrave thiết kế coacute tay nghề cao vẫn lagrave đaacuteng lo

ngại Cocircng nghệ ANN thuacutec đẩy hạn chế của phần cứng hiện tại ANN yecircu cầu phải coacute sự tin tưởng ở đầu ra

14Giới thiệu về thuật toaacuten di truyền Cũng như mạng lưới thần kinh caacutec thuật toaacuten di truyền được dựa trecircn lyacute

thuyết sinh học Thuật toaacuten di truyền tigravem thấy nguồn gốc của chuacuteng trong caacutec lyacute thuyết

tiến hoacutea của chọn lọc tự nhiecircn vagrave thiacutech ứng với biến đổi khiacute hậu Kết quả thuật toaacuten di truyền lagrave từ giao phối 2 caacute thể trong quần thế để tạo

ra con caacutei đocirci khi tốt hơn so với bậc cha mẹ của chuacuteng 15Caacutec thagravenh phần cơ bản của thuật toaacuten di truyền

Toaacuten tử chọn lọc Caacutec caacute thể tốt được chọn lọc để đưa vagraveo thế hệ sau Sự chọn lọc nagravey căn cứ vagraveo độ thiacutech nghi với mocirci trường của mỗi caacute thể

Toaacuten tử lai gheacutep (crossover) Hai caacute thể cha vagrave mẹ trao đổi caacutec gen với nhau để tạo ra caacute thể con

Toaacuten tử đột biến (mutation) Một caacute thể thay đổi một số gen để biến đổi thagravenh một caacute thể mớiTất cả caacutec toaacuten tử trecircn khi thực hiện đều mang tiacutenh ngẫu nhiecircn

16Quaacute trigravenh cơ bản của một thuật toaacuten di truyền Khởi tạo

Đaacutenh giaacute quần thể

Lựa chọn NST thiacutech hợp nhất vagrave loại bỏ NST yếu nhất

Quy trigravenh giao nhau vagrave cải thiện quần thể

đột biến tiến trigravenh để khaacutem phaacute ra NST mới

17Ưu nhược điểm của việc kết hợp với thuật toaacuten di truyền Kiacutech thước quần thể lagrave 1 yếu tố quan trọng trong tốc độ của việc tigravem

kiếmnhưng noacute tương đối dễ dagraveng để dự đoaacuten tốc độ nagravey Giao nhau hoặc đột biến lagrave khocircng necircn đc sử dụng quaacute thường xuyecircn Luocircn coacute được iacutet nhất 1 giải phaacutep hợp lyacute Necircn coacute thể aacutep dụng chuacuteng cho caacutec vấn đề magrave chuacuteng ta khocircng coacute hướng

về caacutech giải quyết Sức mạnh của thuật toaacuten xuất phaacutet từ khaacutei niệm đơn giảnkhocircng phải từ

một thủ tục thuật toaacuten phức tạp 18Tương lai của học maacutey

Mạng lưới thần kinh nhacircn tạo vượt quaacute năng lực của con người trong caacutec trường hợp bị cocirc lập

Về mặt lyacute thuyếtmột maacutey tiacutenh coacute thể xử lyacute dũ liệu nhanh hơn hagraveng triệu lần so với 1 con người

May mắn thay cho chuacuteng tacon người tốt hơn nhiều khi magrave coacute được dữ liệumaacutey tiacutenh khocircng coacute 1 số thứ như lagrave 5 giaacutec quan

CHƯƠNG 10 KHO DỮ LIỆU

1 Kho dữ liệu Kho dữ liệu lagrave tuyển tập caacutec cơ sở dữ liệu tiacutech hợp hướng chủ đề được

thiết kế để trợ giuacutep cho một hệ hỗ trợ quyết định

Theo John Ladley Cocircng nghệ kho dữ liệu lagrave tập caacutec phương phaacutep kỹ thuật vagrave caacutec cocircng cụ coacute thể kết hợp hỗ trợ nhau để cung cấp thocircng tin cho người sử dụng trecircn cơ sở tiacutech hợp từ nhiều nguồn dữ liệu nhiều mocirci trường khaacutec nhau

Kho dữ liệu thường rất lớn tới hagraveng trăm GB hay thậm chiacute hagraveng Terabyte

2 Kho dữ liệu vận hagravenh (ODS) Một kho dữ liệu vận hagravenh Aacutep dụng kỹ thuật kho dữ liệu vagraveo caacutec hệ xử

lyacute giao taacutec lưu trữ dữ liệu cho một ứng dụng đặc thugrave Noacute đưa vagraveo kho dữ liệu một dograveng caacutec dữ liệu thocirc được thiết kế

3 So saacutenh

Kho dữ liệu vận hagravenh Kho dữ liệu

Dữ liệu theo chủ đề Dữ liệu theo chủ đề

Dữ liệu tiacutech hợp Dữ liệu tiacutech hợp

Dữ liệu thay đổi Dữ liệu khocircng thay đổi

Dữ liệu được cập nhật khi thay đổi

Dữ liệu giữ nguyecircn

Chỉ coacute dữ liệu hiện tạiDữliệu hiện tại vagrave dữ liệu lịch sử

Chu kỳ lagravem tươi dữ liệu ngắn Chu kỳ lagravem tươi dữ liệu dagravei

Chỉ coacute dữ liệu chi tiết Dữ liệu chi tiết vagrave dữ liệu tổng kết

Dugraveng cho caacutec quyết định ngắn hạn

Dugraveng cho hoạch định dagravei hạn

4 Kho dữ liệu cục bộ (Data Mart - DM)

Kho dữ liệu cục bộ lagrave CSDL coacute những đặc điểm giống với kho dữ liệu nhưng với quy mocirc nhỏ hơn vagrave lưu trữ dữ liệu về một lĩnh vực một chuyecircn ngagravenh

Data mart phụ thuộc Chứa những dữ liệu được lấy từ DW vagrave những dữ liệu nagravey sẽ được triacutech lọc vagrave tinh chế tiacutech hợp lại ở mức cao hơn để phục vụ một chủ đề nhất định của Datamart

Data mart độc lập Khocircng giống như Datamart phụ thuộc Data mart độc lập được xacircy dựng trước DW vagrave dữ liệu được trực tiếp lấy từ caacutec nguồn khaacutec nhau

5 Siecircu dữ liệu Metadata lagrave dữ liệu để mocirc tả dữ liệu Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột

một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi Metadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu

6 Mocirci trường kho dữ liệu Hệ thống của tổ chức vagrave kho cung cấp dữ liệu để xacircy dựng kho dữ liệu Trong quaacute trigravenh chuyển dữ liệu từ caacutec nguồn khaacutec nhau dữ liệu coacute thể

được lagravem sạch hoặc chuyển đổi vagrave vigrave thế DW được xem như lagrave một chuẩn cho việc lưu trữ

Đồng thời siecircu dữ liệu được ghi lại Cuối cugraveng DW hoặc siecircu thị coacute thể được sử dụng để tạo ra một kho dữ

liệu ldquocaacute nhacircnrdquo 7 Caacutec đặc điểm của kho dữ liệu

Đặc điểm Mocirc tả

Hướng chủ đề - DL tổ chức theo caacutech thức người dugraveng tham chiếu

Tiacutech hợp - Dữ liệu ldquosạchrdquo loại bỏ tiacutenh thiếu nhất quaacuten

Khocircng thay đổi - DL ldquochỉ đọcrdquo người dugraveng khocircng thay đổi được

Chuỗi thời gian - DL lagrave chuỗi thời gian khocircng phải lagrave trạng thaacutei hiện tại

Được tổng kết - DL vận hagravenhthao taacutec khi cần thiết

được kết hợp lại thagravenh dạng coacute thể dugraveng được cho quyết định

Kiacutech cỡ lớn hơn - Lưu giữ theo chuỗi thời gian tức lagrave giữ lại nhiều DL

Khocircng được chuẩn hoacutea - Coacute thể dư thừa DLSiecircu dữ liệu - Dữ liệu của dữ liệu được lưu trữNguồn dữ liệu - DL vận hagravenh (caacutec hệ sẵn coacute) cugraveng

với caacutec nguồn ngoagravei 8 Kho dữ liệu hướng chủ đề

Hướng chủ để coacute nghĩa lagrave kho dữ liệu được tổ chức xung quanh caacutec chủ đề chiacutenh như khaacutech hagraveng sản phẩm sản xuất Tập trung vagraveo việc mocirc higravenh hoacutea vagrave phacircn tiacutech dữ liệu cho caacutec nhagrave ra quyết định magrave khocircng tập trung vagraveo caacutec xử lyacute thocircng thường Cung cấp cho người dugraveng một khung nhigraven toagraven vẹn đơn giản vagrave đầy đủ về caacutec sự kiện quanh caacutec chủ đề

9 Dữ liệu trong DW được tiacutech hợp Dữ liệu trong kho dữ liệu được xacircy dựng bằng caacutech tổng hợp dữ liệu từ

nhiều nguồn khaacutec nhau vagrave caacutec nguồn coacute tổ chức khaacutec nhau Cơ sở dữ liệu caacutec file excel caacutec flat file hoặc caacutec raw file Khi đưa vagraveo kho dữ liệu caacutec dữ liệu được lagravem sạch vagrave tiacutech hợp dữ liệu nhằm đảm bảo tiacutenh nhất quaacuten của dữ liệu

10Kiến truacutec kho dữ liệu Tầng cơ sở dữ liệu hoạt động Tầng truy xuất thocircng tin Tầng truy xuất dữ liệu Tầng siecircu dữ liệu Tầng quản lyacute tiến trigravenh Tầng thocircng điệp của ứng dụng Tầng vật liacute của kho dữ liệu Tầng trigravenh diễn dữ liệu

11Higravenh trạng kho dữ liệu Kho dữ liệu ảo - người dugraveng cuối coacute thể truy cập trực tiếp đến kho dữ liệu

sử dụng caacutec cocircng cụ cho pheacutep ở tầng truy xuất dữ liệu Kho dữ liệu trung tacircm-1 cơ sở dữ liệu vật lyacute chứa tất cả dữ liệu cho một

vugraveng chuyecircn dụng nagraveo đoacute

Kho dữ liệu phacircn taacuten- Thagravenh phần được phacircn taacuten qua nhiều hệ cơ sở dữ liệu vật lyacute

12METADATA- Siecircu dữ liệu Định nghĩa Siecircu dữ liệu lagrave dữ liệu về dữ liệu Lagrave 1 lưu trữ dugraveng để

Miecircu tả kho dữ liệu tổng thể Nhận dạng kiểu kho dữ liệu Quản liacute quaacute trigravenh tiacutech hợp dữ liệu Quản liacute quaacute trigravenh cập nhật kho dữ liệu Quản liacute bảo mật

Lagrave chigravea khoacutea quyết định sự thagravenh cocircng của kho dữ liệu luocircn được thay đổi vagrave cập nhật theo sự phaacutet triển của kho dữ liệu

Dugraveng để quản liacute điều khiển kho dữ liệu Sự ra đời của kho dữ liệu như 1 cấu truacutec hỗ trợ ra quyết định siecircu dữ liệu

được xem như nguồn tagravei nguyecircn dữ liệu Siecircu dữ liệu lagrave trừu tượng Chuacuteng lagrave dữ liệu bậc cao cung cấp mocirc tả ngắn

gọn caacutec dữ liệu bậc thấp hơn 13Hoạt động của Siecircu dữ liệu

Siecircu dữ liệu rất cần thiết trong việc chuyển hoacutea thocircng tin trở thagravenh tri thức Lagrave chigravea khoacutea giuacutep chuacuteng ta xử lyacute được dữ liệu thocirc Viacute dụ một dograveng dữ liệu baacuten hagraveng 1023 K596 11121 agraveNoacute sẽ khocircng coacute nghĩa gigrave cho đến khi chuacuteng ta đưa vagraveo siecircu dữ liệu (thư

mục chứa dữ liệu) agrave cửa hagraveng 1023 sản phẩm K596 vagrave số tiền baacuten được lagrave 11121 đocirc la

14Sự cần thiết phải nhất quaacuten trong kho dữ liệu Kho dữ liệu được xacircy dựng cho lợi iacutech của những nhagrave phacircn tiacutech kinh

doanh caacutec nhagrave quản trị cho tất cả caacutec khu vực chức năng Trong cơ sở dữ liệu riecircng caacutec khu vực khaacutec nhau coacute thể định nghĩa vagrave lưu

trữ dữ liệu thocircng qua phiecircn bản của chiacutenh noacute Khi dữ liệu được lấy từ những vugraveng khaacutec nhau đoacute vagrave được đặt vagraveo kho dữ

liệu Việc chuyển đổi vagrave lagravem sạch caacutec tiến trigravenh sẽ đảm bảo noacute lagrave duy nhất được tiacutech hợp tại một mức của tổ chức

15Ragrave soaacutet lại dữ liệu ndash Thực thi siecircu dữ liệu

Bất kể cấu truacutec tự nhiecircn của 1 cacircu truy vấn thế nagraveo thigrave caacutec thagravenh phần của siecircu dữ liệu rất quan trọng đối với người ra quyết định

Bảng thuộc tiacutenh khoacutea được lưu trữ bởi kho dữ liệu Tập hợp dữ liệu được lấy từ đacircu Những chuyển đổi nagraveo được thực thi với việc lagravem sạch

16Siecircu dữ liệu lagrave gigrave Metadata - lagrave thocircng tin mocirc tả nội dung của cơ sở dữ liệu (CSDL) Metadata baacuteo cho người dugraveng biết thời gian cập nhật sau cugraveng của dữ liệu

định dạng vagrave mục điacutech sử dụng của noacute Những thocircng tin nagravey coacute thể hướng dẫn người dugraveng duyệt qua CSDL vagrave

giuacutep họ hiểu được yacute nghĩa vagrave ngữ cảnh của dữ liệu Trong CSDL metadata lagrave caacutec dạng biểu diễn khaacutec nhau của caacutec đối tượng

trong CSDL Trong CSDL quan hệ metadata lagrave caacutec định nghĩa của bảng cột CSDL

view vagrave nhiều đối tượng khaacutec Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột

một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi -gtMetadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu

Bảng chuyển đổi Ghi lại những chuyển đổi đatilde được thực hiện

Lịch sử thực thi Ghi lại những dữ liệu đatilde được

phacircn tiacutech

Higravenh thaacutei kết nốiGhi lại những dữ liệu được kết nối vagrave tần suất

17Aacutenh xạ thocircng thường của siecircu dữ liệu Bản ghi aacutenh xạ chuyển đổi bao gồm

Định danh của nguồn gốc Chuyển đổi thuộc tiacutenh Chuyển đổi thuộc tiacutenh vật lyacute Matilde hoacutea tham chiếu bảng chuyển đổi Đổi tecircn Đổi khoacutea Gaacuten giaacute trị cho thuộc tiacutenh mặc định Chọn logic cho caacutec nguồn nhiều giaacute trị Đổi thuật toaacuten

18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để

phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai

lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave

tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec

Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm

Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo

19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua

caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau

SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được

Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra

một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức

Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ

Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ

Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech

CHƯƠNG 11 KHAI PHAacute DỮ LIỆU

1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn

ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993

Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng

2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd

1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều

2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP

3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn

4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng

5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server

6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo

7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động

8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời

9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều

10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện

11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech

12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP

3 Xử lyacute phacircn tiacutech trực tuyến OLAP

MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave

dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu

ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave

thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu

HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave

ROLAP4 Khai phaacute dữ liệu

Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh

khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn

Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan

5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp

6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại

Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp

Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec

Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt

Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra

Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh

vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho

Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec

Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm

Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục

Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng

gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp

Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn

Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec

Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper

Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2

Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25

Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước

Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng

Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện

trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp

Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute

độ hỗ trợ ge ngưỡng minsup

độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan

Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn

Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết

Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu

MOLAP ROLAP HOLAP

Lưu trữ dữ liệu cơ sở

Khối Bảng quan hệ Bảng quan hệ

Lưu trữ thocircng tin tổng hợp

Khối Bảng quan hệ Khối

Hiệu suất thực hiện truy vấn

Nhanh nhất Chậm nhất Nhanh

Tiecircu thụ khocircng gian lưu trữ

Nhiều Thấp Trung bigravenh

Chi phiacute bảo trigrave Cao Thấp Trung bigravenh

Page 53: De cuong(1-11)

Toaacuten tử đột biến (mutation) Một caacute thể thay đổi một số gen để biến đổi thagravenh một caacute thể mớiTất cả caacutec toaacuten tử trecircn khi thực hiện đều mang tiacutenh ngẫu nhiecircn

16Quaacute trigravenh cơ bản của một thuật toaacuten di truyền Khởi tạo

Đaacutenh giaacute quần thể

Lựa chọn NST thiacutech hợp nhất vagrave loại bỏ NST yếu nhất

Quy trigravenh giao nhau vagrave cải thiện quần thể

đột biến tiến trigravenh để khaacutem phaacute ra NST mới

17Ưu nhược điểm của việc kết hợp với thuật toaacuten di truyền Kiacutech thước quần thể lagrave 1 yếu tố quan trọng trong tốc độ của việc tigravem

kiếmnhưng noacute tương đối dễ dagraveng để dự đoaacuten tốc độ nagravey Giao nhau hoặc đột biến lagrave khocircng necircn đc sử dụng quaacute thường xuyecircn Luocircn coacute được iacutet nhất 1 giải phaacutep hợp lyacute Necircn coacute thể aacutep dụng chuacuteng cho caacutec vấn đề magrave chuacuteng ta khocircng coacute hướng

về caacutech giải quyết Sức mạnh của thuật toaacuten xuất phaacutet từ khaacutei niệm đơn giảnkhocircng phải từ

một thủ tục thuật toaacuten phức tạp 18Tương lai của học maacutey

Mạng lưới thần kinh nhacircn tạo vượt quaacute năng lực của con người trong caacutec trường hợp bị cocirc lập

Về mặt lyacute thuyếtmột maacutey tiacutenh coacute thể xử lyacute dũ liệu nhanh hơn hagraveng triệu lần so với 1 con người

May mắn thay cho chuacuteng tacon người tốt hơn nhiều khi magrave coacute được dữ liệumaacutey tiacutenh khocircng coacute 1 số thứ như lagrave 5 giaacutec quan

CHƯƠNG 10 KHO DỮ LIỆU

1 Kho dữ liệu Kho dữ liệu lagrave tuyển tập caacutec cơ sở dữ liệu tiacutech hợp hướng chủ đề được

thiết kế để trợ giuacutep cho một hệ hỗ trợ quyết định

Theo John Ladley Cocircng nghệ kho dữ liệu lagrave tập caacutec phương phaacutep kỹ thuật vagrave caacutec cocircng cụ coacute thể kết hợp hỗ trợ nhau để cung cấp thocircng tin cho người sử dụng trecircn cơ sở tiacutech hợp từ nhiều nguồn dữ liệu nhiều mocirci trường khaacutec nhau

Kho dữ liệu thường rất lớn tới hagraveng trăm GB hay thậm chiacute hagraveng Terabyte

2 Kho dữ liệu vận hagravenh (ODS) Một kho dữ liệu vận hagravenh Aacutep dụng kỹ thuật kho dữ liệu vagraveo caacutec hệ xử

lyacute giao taacutec lưu trữ dữ liệu cho một ứng dụng đặc thugrave Noacute đưa vagraveo kho dữ liệu một dograveng caacutec dữ liệu thocirc được thiết kế

3 So saacutenh

Kho dữ liệu vận hagravenh Kho dữ liệu

Dữ liệu theo chủ đề Dữ liệu theo chủ đề

Dữ liệu tiacutech hợp Dữ liệu tiacutech hợp

Dữ liệu thay đổi Dữ liệu khocircng thay đổi

Dữ liệu được cập nhật khi thay đổi

Dữ liệu giữ nguyecircn

Chỉ coacute dữ liệu hiện tạiDữliệu hiện tại vagrave dữ liệu lịch sử

Chu kỳ lagravem tươi dữ liệu ngắn Chu kỳ lagravem tươi dữ liệu dagravei

Chỉ coacute dữ liệu chi tiết Dữ liệu chi tiết vagrave dữ liệu tổng kết

Dugraveng cho caacutec quyết định ngắn hạn

Dugraveng cho hoạch định dagravei hạn

4 Kho dữ liệu cục bộ (Data Mart - DM)

Kho dữ liệu cục bộ lagrave CSDL coacute những đặc điểm giống với kho dữ liệu nhưng với quy mocirc nhỏ hơn vagrave lưu trữ dữ liệu về một lĩnh vực một chuyecircn ngagravenh

Data mart phụ thuộc Chứa những dữ liệu được lấy từ DW vagrave những dữ liệu nagravey sẽ được triacutech lọc vagrave tinh chế tiacutech hợp lại ở mức cao hơn để phục vụ một chủ đề nhất định của Datamart

Data mart độc lập Khocircng giống như Datamart phụ thuộc Data mart độc lập được xacircy dựng trước DW vagrave dữ liệu được trực tiếp lấy từ caacutec nguồn khaacutec nhau

5 Siecircu dữ liệu Metadata lagrave dữ liệu để mocirc tả dữ liệu Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột

một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi Metadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu

6 Mocirci trường kho dữ liệu Hệ thống của tổ chức vagrave kho cung cấp dữ liệu để xacircy dựng kho dữ liệu Trong quaacute trigravenh chuyển dữ liệu từ caacutec nguồn khaacutec nhau dữ liệu coacute thể

được lagravem sạch hoặc chuyển đổi vagrave vigrave thế DW được xem như lagrave một chuẩn cho việc lưu trữ

Đồng thời siecircu dữ liệu được ghi lại Cuối cugraveng DW hoặc siecircu thị coacute thể được sử dụng để tạo ra một kho dữ

liệu ldquocaacute nhacircnrdquo 7 Caacutec đặc điểm của kho dữ liệu

Đặc điểm Mocirc tả

Hướng chủ đề - DL tổ chức theo caacutech thức người dugraveng tham chiếu

Tiacutech hợp - Dữ liệu ldquosạchrdquo loại bỏ tiacutenh thiếu nhất quaacuten

Khocircng thay đổi - DL ldquochỉ đọcrdquo người dugraveng khocircng thay đổi được

Chuỗi thời gian - DL lagrave chuỗi thời gian khocircng phải lagrave trạng thaacutei hiện tại

Được tổng kết - DL vận hagravenhthao taacutec khi cần thiết

được kết hợp lại thagravenh dạng coacute thể dugraveng được cho quyết định

Kiacutech cỡ lớn hơn - Lưu giữ theo chuỗi thời gian tức lagrave giữ lại nhiều DL

Khocircng được chuẩn hoacutea - Coacute thể dư thừa DLSiecircu dữ liệu - Dữ liệu của dữ liệu được lưu trữNguồn dữ liệu - DL vận hagravenh (caacutec hệ sẵn coacute) cugraveng

với caacutec nguồn ngoagravei 8 Kho dữ liệu hướng chủ đề

Hướng chủ để coacute nghĩa lagrave kho dữ liệu được tổ chức xung quanh caacutec chủ đề chiacutenh như khaacutech hagraveng sản phẩm sản xuất Tập trung vagraveo việc mocirc higravenh hoacutea vagrave phacircn tiacutech dữ liệu cho caacutec nhagrave ra quyết định magrave khocircng tập trung vagraveo caacutec xử lyacute thocircng thường Cung cấp cho người dugraveng một khung nhigraven toagraven vẹn đơn giản vagrave đầy đủ về caacutec sự kiện quanh caacutec chủ đề

9 Dữ liệu trong DW được tiacutech hợp Dữ liệu trong kho dữ liệu được xacircy dựng bằng caacutech tổng hợp dữ liệu từ

nhiều nguồn khaacutec nhau vagrave caacutec nguồn coacute tổ chức khaacutec nhau Cơ sở dữ liệu caacutec file excel caacutec flat file hoặc caacutec raw file Khi đưa vagraveo kho dữ liệu caacutec dữ liệu được lagravem sạch vagrave tiacutech hợp dữ liệu nhằm đảm bảo tiacutenh nhất quaacuten của dữ liệu

10Kiến truacutec kho dữ liệu Tầng cơ sở dữ liệu hoạt động Tầng truy xuất thocircng tin Tầng truy xuất dữ liệu Tầng siecircu dữ liệu Tầng quản lyacute tiến trigravenh Tầng thocircng điệp của ứng dụng Tầng vật liacute của kho dữ liệu Tầng trigravenh diễn dữ liệu

11Higravenh trạng kho dữ liệu Kho dữ liệu ảo - người dugraveng cuối coacute thể truy cập trực tiếp đến kho dữ liệu

sử dụng caacutec cocircng cụ cho pheacutep ở tầng truy xuất dữ liệu Kho dữ liệu trung tacircm-1 cơ sở dữ liệu vật lyacute chứa tất cả dữ liệu cho một

vugraveng chuyecircn dụng nagraveo đoacute

Kho dữ liệu phacircn taacuten- Thagravenh phần được phacircn taacuten qua nhiều hệ cơ sở dữ liệu vật lyacute

12METADATA- Siecircu dữ liệu Định nghĩa Siecircu dữ liệu lagrave dữ liệu về dữ liệu Lagrave 1 lưu trữ dugraveng để

Miecircu tả kho dữ liệu tổng thể Nhận dạng kiểu kho dữ liệu Quản liacute quaacute trigravenh tiacutech hợp dữ liệu Quản liacute quaacute trigravenh cập nhật kho dữ liệu Quản liacute bảo mật

Lagrave chigravea khoacutea quyết định sự thagravenh cocircng của kho dữ liệu luocircn được thay đổi vagrave cập nhật theo sự phaacutet triển của kho dữ liệu

Dugraveng để quản liacute điều khiển kho dữ liệu Sự ra đời của kho dữ liệu như 1 cấu truacutec hỗ trợ ra quyết định siecircu dữ liệu

được xem như nguồn tagravei nguyecircn dữ liệu Siecircu dữ liệu lagrave trừu tượng Chuacuteng lagrave dữ liệu bậc cao cung cấp mocirc tả ngắn

gọn caacutec dữ liệu bậc thấp hơn 13Hoạt động của Siecircu dữ liệu

Siecircu dữ liệu rất cần thiết trong việc chuyển hoacutea thocircng tin trở thagravenh tri thức Lagrave chigravea khoacutea giuacutep chuacuteng ta xử lyacute được dữ liệu thocirc Viacute dụ một dograveng dữ liệu baacuten hagraveng 1023 K596 11121 agraveNoacute sẽ khocircng coacute nghĩa gigrave cho đến khi chuacuteng ta đưa vagraveo siecircu dữ liệu (thư

mục chứa dữ liệu) agrave cửa hagraveng 1023 sản phẩm K596 vagrave số tiền baacuten được lagrave 11121 đocirc la

14Sự cần thiết phải nhất quaacuten trong kho dữ liệu Kho dữ liệu được xacircy dựng cho lợi iacutech của những nhagrave phacircn tiacutech kinh

doanh caacutec nhagrave quản trị cho tất cả caacutec khu vực chức năng Trong cơ sở dữ liệu riecircng caacutec khu vực khaacutec nhau coacute thể định nghĩa vagrave lưu

trữ dữ liệu thocircng qua phiecircn bản của chiacutenh noacute Khi dữ liệu được lấy từ những vugraveng khaacutec nhau đoacute vagrave được đặt vagraveo kho dữ

liệu Việc chuyển đổi vagrave lagravem sạch caacutec tiến trigravenh sẽ đảm bảo noacute lagrave duy nhất được tiacutech hợp tại một mức của tổ chức

15Ragrave soaacutet lại dữ liệu ndash Thực thi siecircu dữ liệu

Bất kể cấu truacutec tự nhiecircn của 1 cacircu truy vấn thế nagraveo thigrave caacutec thagravenh phần của siecircu dữ liệu rất quan trọng đối với người ra quyết định

Bảng thuộc tiacutenh khoacutea được lưu trữ bởi kho dữ liệu Tập hợp dữ liệu được lấy từ đacircu Những chuyển đổi nagraveo được thực thi với việc lagravem sạch

16Siecircu dữ liệu lagrave gigrave Metadata - lagrave thocircng tin mocirc tả nội dung của cơ sở dữ liệu (CSDL) Metadata baacuteo cho người dugraveng biết thời gian cập nhật sau cugraveng của dữ liệu

định dạng vagrave mục điacutech sử dụng của noacute Những thocircng tin nagravey coacute thể hướng dẫn người dugraveng duyệt qua CSDL vagrave

giuacutep họ hiểu được yacute nghĩa vagrave ngữ cảnh của dữ liệu Trong CSDL metadata lagrave caacutec dạng biểu diễn khaacutec nhau của caacutec đối tượng

trong CSDL Trong CSDL quan hệ metadata lagrave caacutec định nghĩa của bảng cột CSDL

view vagrave nhiều đối tượng khaacutec Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột

một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi -gtMetadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu

Bảng chuyển đổi Ghi lại những chuyển đổi đatilde được thực hiện

Lịch sử thực thi Ghi lại những dữ liệu đatilde được

phacircn tiacutech

Higravenh thaacutei kết nốiGhi lại những dữ liệu được kết nối vagrave tần suất

17Aacutenh xạ thocircng thường của siecircu dữ liệu Bản ghi aacutenh xạ chuyển đổi bao gồm

Định danh của nguồn gốc Chuyển đổi thuộc tiacutenh Chuyển đổi thuộc tiacutenh vật lyacute Matilde hoacutea tham chiếu bảng chuyển đổi Đổi tecircn Đổi khoacutea Gaacuten giaacute trị cho thuộc tiacutenh mặc định Chọn logic cho caacutec nguồn nhiều giaacute trị Đổi thuật toaacuten

18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để

phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai

lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave

tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec

Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm

Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo

19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua

caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau

SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được

Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra

một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức

Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ

Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ

Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech

CHƯƠNG 11 KHAI PHAacute DỮ LIỆU

1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn

ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993

Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng

2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd

1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều

2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP

3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn

4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng

5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server

6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo

7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động

8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời

9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều

10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện

11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech

12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP

3 Xử lyacute phacircn tiacutech trực tuyến OLAP

MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave

dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu

ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave

thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu

HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave

ROLAP4 Khai phaacute dữ liệu

Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh

khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn

Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan

5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp

6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại

Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp

Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec

Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt

Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra

Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh

vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho

Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec

Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm

Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục

Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng

gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp

Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn

Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec

Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper

Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2

Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25

Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước

Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng

Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện

trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp

Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute

độ hỗ trợ ge ngưỡng minsup

độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan

Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn

Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết

Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu

MOLAP ROLAP HOLAP

Lưu trữ dữ liệu cơ sở

Khối Bảng quan hệ Bảng quan hệ

Lưu trữ thocircng tin tổng hợp

Khối Bảng quan hệ Khối

Hiệu suất thực hiện truy vấn

Nhanh nhất Chậm nhất Nhanh

Tiecircu thụ khocircng gian lưu trữ

Nhiều Thấp Trung bigravenh

Chi phiacute bảo trigrave Cao Thấp Trung bigravenh

Page 54: De cuong(1-11)

Theo John Ladley Cocircng nghệ kho dữ liệu lagrave tập caacutec phương phaacutep kỹ thuật vagrave caacutec cocircng cụ coacute thể kết hợp hỗ trợ nhau để cung cấp thocircng tin cho người sử dụng trecircn cơ sở tiacutech hợp từ nhiều nguồn dữ liệu nhiều mocirci trường khaacutec nhau

Kho dữ liệu thường rất lớn tới hagraveng trăm GB hay thậm chiacute hagraveng Terabyte

2 Kho dữ liệu vận hagravenh (ODS) Một kho dữ liệu vận hagravenh Aacutep dụng kỹ thuật kho dữ liệu vagraveo caacutec hệ xử

lyacute giao taacutec lưu trữ dữ liệu cho một ứng dụng đặc thugrave Noacute đưa vagraveo kho dữ liệu một dograveng caacutec dữ liệu thocirc được thiết kế

3 So saacutenh

Kho dữ liệu vận hagravenh Kho dữ liệu

Dữ liệu theo chủ đề Dữ liệu theo chủ đề

Dữ liệu tiacutech hợp Dữ liệu tiacutech hợp

Dữ liệu thay đổi Dữ liệu khocircng thay đổi

Dữ liệu được cập nhật khi thay đổi

Dữ liệu giữ nguyecircn

Chỉ coacute dữ liệu hiện tạiDữliệu hiện tại vagrave dữ liệu lịch sử

Chu kỳ lagravem tươi dữ liệu ngắn Chu kỳ lagravem tươi dữ liệu dagravei

Chỉ coacute dữ liệu chi tiết Dữ liệu chi tiết vagrave dữ liệu tổng kết

Dugraveng cho caacutec quyết định ngắn hạn

Dugraveng cho hoạch định dagravei hạn

4 Kho dữ liệu cục bộ (Data Mart - DM)

Kho dữ liệu cục bộ lagrave CSDL coacute những đặc điểm giống với kho dữ liệu nhưng với quy mocirc nhỏ hơn vagrave lưu trữ dữ liệu về một lĩnh vực một chuyecircn ngagravenh

Data mart phụ thuộc Chứa những dữ liệu được lấy từ DW vagrave những dữ liệu nagravey sẽ được triacutech lọc vagrave tinh chế tiacutech hợp lại ở mức cao hơn để phục vụ một chủ đề nhất định của Datamart

Data mart độc lập Khocircng giống như Datamart phụ thuộc Data mart độc lập được xacircy dựng trước DW vagrave dữ liệu được trực tiếp lấy từ caacutec nguồn khaacutec nhau

5 Siecircu dữ liệu Metadata lagrave dữ liệu để mocirc tả dữ liệu Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột

một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi Metadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu

6 Mocirci trường kho dữ liệu Hệ thống của tổ chức vagrave kho cung cấp dữ liệu để xacircy dựng kho dữ liệu Trong quaacute trigravenh chuyển dữ liệu từ caacutec nguồn khaacutec nhau dữ liệu coacute thể

được lagravem sạch hoặc chuyển đổi vagrave vigrave thế DW được xem như lagrave một chuẩn cho việc lưu trữ

Đồng thời siecircu dữ liệu được ghi lại Cuối cugraveng DW hoặc siecircu thị coacute thể được sử dụng để tạo ra một kho dữ

liệu ldquocaacute nhacircnrdquo 7 Caacutec đặc điểm của kho dữ liệu

Đặc điểm Mocirc tả

Hướng chủ đề - DL tổ chức theo caacutech thức người dugraveng tham chiếu

Tiacutech hợp - Dữ liệu ldquosạchrdquo loại bỏ tiacutenh thiếu nhất quaacuten

Khocircng thay đổi - DL ldquochỉ đọcrdquo người dugraveng khocircng thay đổi được

Chuỗi thời gian - DL lagrave chuỗi thời gian khocircng phải lagrave trạng thaacutei hiện tại

Được tổng kết - DL vận hagravenhthao taacutec khi cần thiết

được kết hợp lại thagravenh dạng coacute thể dugraveng được cho quyết định

Kiacutech cỡ lớn hơn - Lưu giữ theo chuỗi thời gian tức lagrave giữ lại nhiều DL

Khocircng được chuẩn hoacutea - Coacute thể dư thừa DLSiecircu dữ liệu - Dữ liệu của dữ liệu được lưu trữNguồn dữ liệu - DL vận hagravenh (caacutec hệ sẵn coacute) cugraveng

với caacutec nguồn ngoagravei 8 Kho dữ liệu hướng chủ đề

Hướng chủ để coacute nghĩa lagrave kho dữ liệu được tổ chức xung quanh caacutec chủ đề chiacutenh như khaacutech hagraveng sản phẩm sản xuất Tập trung vagraveo việc mocirc higravenh hoacutea vagrave phacircn tiacutech dữ liệu cho caacutec nhagrave ra quyết định magrave khocircng tập trung vagraveo caacutec xử lyacute thocircng thường Cung cấp cho người dugraveng một khung nhigraven toagraven vẹn đơn giản vagrave đầy đủ về caacutec sự kiện quanh caacutec chủ đề

9 Dữ liệu trong DW được tiacutech hợp Dữ liệu trong kho dữ liệu được xacircy dựng bằng caacutech tổng hợp dữ liệu từ

nhiều nguồn khaacutec nhau vagrave caacutec nguồn coacute tổ chức khaacutec nhau Cơ sở dữ liệu caacutec file excel caacutec flat file hoặc caacutec raw file Khi đưa vagraveo kho dữ liệu caacutec dữ liệu được lagravem sạch vagrave tiacutech hợp dữ liệu nhằm đảm bảo tiacutenh nhất quaacuten của dữ liệu

10Kiến truacutec kho dữ liệu Tầng cơ sở dữ liệu hoạt động Tầng truy xuất thocircng tin Tầng truy xuất dữ liệu Tầng siecircu dữ liệu Tầng quản lyacute tiến trigravenh Tầng thocircng điệp của ứng dụng Tầng vật liacute của kho dữ liệu Tầng trigravenh diễn dữ liệu

11Higravenh trạng kho dữ liệu Kho dữ liệu ảo - người dugraveng cuối coacute thể truy cập trực tiếp đến kho dữ liệu

sử dụng caacutec cocircng cụ cho pheacutep ở tầng truy xuất dữ liệu Kho dữ liệu trung tacircm-1 cơ sở dữ liệu vật lyacute chứa tất cả dữ liệu cho một

vugraveng chuyecircn dụng nagraveo đoacute

Kho dữ liệu phacircn taacuten- Thagravenh phần được phacircn taacuten qua nhiều hệ cơ sở dữ liệu vật lyacute

12METADATA- Siecircu dữ liệu Định nghĩa Siecircu dữ liệu lagrave dữ liệu về dữ liệu Lagrave 1 lưu trữ dugraveng để

Miecircu tả kho dữ liệu tổng thể Nhận dạng kiểu kho dữ liệu Quản liacute quaacute trigravenh tiacutech hợp dữ liệu Quản liacute quaacute trigravenh cập nhật kho dữ liệu Quản liacute bảo mật

Lagrave chigravea khoacutea quyết định sự thagravenh cocircng của kho dữ liệu luocircn được thay đổi vagrave cập nhật theo sự phaacutet triển của kho dữ liệu

Dugraveng để quản liacute điều khiển kho dữ liệu Sự ra đời của kho dữ liệu như 1 cấu truacutec hỗ trợ ra quyết định siecircu dữ liệu

được xem như nguồn tagravei nguyecircn dữ liệu Siecircu dữ liệu lagrave trừu tượng Chuacuteng lagrave dữ liệu bậc cao cung cấp mocirc tả ngắn

gọn caacutec dữ liệu bậc thấp hơn 13Hoạt động của Siecircu dữ liệu

Siecircu dữ liệu rất cần thiết trong việc chuyển hoacutea thocircng tin trở thagravenh tri thức Lagrave chigravea khoacutea giuacutep chuacuteng ta xử lyacute được dữ liệu thocirc Viacute dụ một dograveng dữ liệu baacuten hagraveng 1023 K596 11121 agraveNoacute sẽ khocircng coacute nghĩa gigrave cho đến khi chuacuteng ta đưa vagraveo siecircu dữ liệu (thư

mục chứa dữ liệu) agrave cửa hagraveng 1023 sản phẩm K596 vagrave số tiền baacuten được lagrave 11121 đocirc la

14Sự cần thiết phải nhất quaacuten trong kho dữ liệu Kho dữ liệu được xacircy dựng cho lợi iacutech của những nhagrave phacircn tiacutech kinh

doanh caacutec nhagrave quản trị cho tất cả caacutec khu vực chức năng Trong cơ sở dữ liệu riecircng caacutec khu vực khaacutec nhau coacute thể định nghĩa vagrave lưu

trữ dữ liệu thocircng qua phiecircn bản của chiacutenh noacute Khi dữ liệu được lấy từ những vugraveng khaacutec nhau đoacute vagrave được đặt vagraveo kho dữ

liệu Việc chuyển đổi vagrave lagravem sạch caacutec tiến trigravenh sẽ đảm bảo noacute lagrave duy nhất được tiacutech hợp tại một mức của tổ chức

15Ragrave soaacutet lại dữ liệu ndash Thực thi siecircu dữ liệu

Bất kể cấu truacutec tự nhiecircn của 1 cacircu truy vấn thế nagraveo thigrave caacutec thagravenh phần của siecircu dữ liệu rất quan trọng đối với người ra quyết định

Bảng thuộc tiacutenh khoacutea được lưu trữ bởi kho dữ liệu Tập hợp dữ liệu được lấy từ đacircu Những chuyển đổi nagraveo được thực thi với việc lagravem sạch

16Siecircu dữ liệu lagrave gigrave Metadata - lagrave thocircng tin mocirc tả nội dung của cơ sở dữ liệu (CSDL) Metadata baacuteo cho người dugraveng biết thời gian cập nhật sau cugraveng của dữ liệu

định dạng vagrave mục điacutech sử dụng của noacute Những thocircng tin nagravey coacute thể hướng dẫn người dugraveng duyệt qua CSDL vagrave

giuacutep họ hiểu được yacute nghĩa vagrave ngữ cảnh của dữ liệu Trong CSDL metadata lagrave caacutec dạng biểu diễn khaacutec nhau của caacutec đối tượng

trong CSDL Trong CSDL quan hệ metadata lagrave caacutec định nghĩa của bảng cột CSDL

view vagrave nhiều đối tượng khaacutec Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột

một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi -gtMetadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu

Bảng chuyển đổi Ghi lại những chuyển đổi đatilde được thực hiện

Lịch sử thực thi Ghi lại những dữ liệu đatilde được

phacircn tiacutech

Higravenh thaacutei kết nốiGhi lại những dữ liệu được kết nối vagrave tần suất

17Aacutenh xạ thocircng thường của siecircu dữ liệu Bản ghi aacutenh xạ chuyển đổi bao gồm

Định danh của nguồn gốc Chuyển đổi thuộc tiacutenh Chuyển đổi thuộc tiacutenh vật lyacute Matilde hoacutea tham chiếu bảng chuyển đổi Đổi tecircn Đổi khoacutea Gaacuten giaacute trị cho thuộc tiacutenh mặc định Chọn logic cho caacutec nguồn nhiều giaacute trị Đổi thuật toaacuten

18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để

phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai

lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave

tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec

Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm

Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo

19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua

caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau

SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được

Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra

một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức

Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ

Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ

Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech

CHƯƠNG 11 KHAI PHAacute DỮ LIỆU

1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn

ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993

Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng

2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd

1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều

2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP

3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn

4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng

5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server

6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo

7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động

8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời

9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều

10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện

11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech

12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP

3 Xử lyacute phacircn tiacutech trực tuyến OLAP

MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave

dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu

ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave

thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu

HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave

ROLAP4 Khai phaacute dữ liệu

Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh

khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn

Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan

5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp

6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại

Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp

Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec

Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt

Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra

Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh

vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho

Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec

Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm

Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục

Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng

gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp

Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn

Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec

Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper

Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2

Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25

Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước

Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng

Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện

trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp

Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute

độ hỗ trợ ge ngưỡng minsup

độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan

Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn

Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết

Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu

MOLAP ROLAP HOLAP

Lưu trữ dữ liệu cơ sở

Khối Bảng quan hệ Bảng quan hệ

Lưu trữ thocircng tin tổng hợp

Khối Bảng quan hệ Khối

Hiệu suất thực hiện truy vấn

Nhanh nhất Chậm nhất Nhanh

Tiecircu thụ khocircng gian lưu trữ

Nhiều Thấp Trung bigravenh

Chi phiacute bảo trigrave Cao Thấp Trung bigravenh

Page 55: De cuong(1-11)

Kho dữ liệu cục bộ lagrave CSDL coacute những đặc điểm giống với kho dữ liệu nhưng với quy mocirc nhỏ hơn vagrave lưu trữ dữ liệu về một lĩnh vực một chuyecircn ngagravenh

Data mart phụ thuộc Chứa những dữ liệu được lấy từ DW vagrave những dữ liệu nagravey sẽ được triacutech lọc vagrave tinh chế tiacutech hợp lại ở mức cao hơn để phục vụ một chủ đề nhất định của Datamart

Data mart độc lập Khocircng giống như Datamart phụ thuộc Data mart độc lập được xacircy dựng trước DW vagrave dữ liệu được trực tiếp lấy từ caacutec nguồn khaacutec nhau

5 Siecircu dữ liệu Metadata lagrave dữ liệu để mocirc tả dữ liệu Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột

một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi Metadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu

6 Mocirci trường kho dữ liệu Hệ thống của tổ chức vagrave kho cung cấp dữ liệu để xacircy dựng kho dữ liệu Trong quaacute trigravenh chuyển dữ liệu từ caacutec nguồn khaacutec nhau dữ liệu coacute thể

được lagravem sạch hoặc chuyển đổi vagrave vigrave thế DW được xem như lagrave một chuẩn cho việc lưu trữ

Đồng thời siecircu dữ liệu được ghi lại Cuối cugraveng DW hoặc siecircu thị coacute thể được sử dụng để tạo ra một kho dữ

liệu ldquocaacute nhacircnrdquo 7 Caacutec đặc điểm của kho dữ liệu

Đặc điểm Mocirc tả

Hướng chủ đề - DL tổ chức theo caacutech thức người dugraveng tham chiếu

Tiacutech hợp - Dữ liệu ldquosạchrdquo loại bỏ tiacutenh thiếu nhất quaacuten

Khocircng thay đổi - DL ldquochỉ đọcrdquo người dugraveng khocircng thay đổi được

Chuỗi thời gian - DL lagrave chuỗi thời gian khocircng phải lagrave trạng thaacutei hiện tại

Được tổng kết - DL vận hagravenhthao taacutec khi cần thiết

được kết hợp lại thagravenh dạng coacute thể dugraveng được cho quyết định

Kiacutech cỡ lớn hơn - Lưu giữ theo chuỗi thời gian tức lagrave giữ lại nhiều DL

Khocircng được chuẩn hoacutea - Coacute thể dư thừa DLSiecircu dữ liệu - Dữ liệu của dữ liệu được lưu trữNguồn dữ liệu - DL vận hagravenh (caacutec hệ sẵn coacute) cugraveng

với caacutec nguồn ngoagravei 8 Kho dữ liệu hướng chủ đề

Hướng chủ để coacute nghĩa lagrave kho dữ liệu được tổ chức xung quanh caacutec chủ đề chiacutenh như khaacutech hagraveng sản phẩm sản xuất Tập trung vagraveo việc mocirc higravenh hoacutea vagrave phacircn tiacutech dữ liệu cho caacutec nhagrave ra quyết định magrave khocircng tập trung vagraveo caacutec xử lyacute thocircng thường Cung cấp cho người dugraveng một khung nhigraven toagraven vẹn đơn giản vagrave đầy đủ về caacutec sự kiện quanh caacutec chủ đề

9 Dữ liệu trong DW được tiacutech hợp Dữ liệu trong kho dữ liệu được xacircy dựng bằng caacutech tổng hợp dữ liệu từ

nhiều nguồn khaacutec nhau vagrave caacutec nguồn coacute tổ chức khaacutec nhau Cơ sở dữ liệu caacutec file excel caacutec flat file hoặc caacutec raw file Khi đưa vagraveo kho dữ liệu caacutec dữ liệu được lagravem sạch vagrave tiacutech hợp dữ liệu nhằm đảm bảo tiacutenh nhất quaacuten của dữ liệu

10Kiến truacutec kho dữ liệu Tầng cơ sở dữ liệu hoạt động Tầng truy xuất thocircng tin Tầng truy xuất dữ liệu Tầng siecircu dữ liệu Tầng quản lyacute tiến trigravenh Tầng thocircng điệp của ứng dụng Tầng vật liacute của kho dữ liệu Tầng trigravenh diễn dữ liệu

11Higravenh trạng kho dữ liệu Kho dữ liệu ảo - người dugraveng cuối coacute thể truy cập trực tiếp đến kho dữ liệu

sử dụng caacutec cocircng cụ cho pheacutep ở tầng truy xuất dữ liệu Kho dữ liệu trung tacircm-1 cơ sở dữ liệu vật lyacute chứa tất cả dữ liệu cho một

vugraveng chuyecircn dụng nagraveo đoacute

Kho dữ liệu phacircn taacuten- Thagravenh phần được phacircn taacuten qua nhiều hệ cơ sở dữ liệu vật lyacute

12METADATA- Siecircu dữ liệu Định nghĩa Siecircu dữ liệu lagrave dữ liệu về dữ liệu Lagrave 1 lưu trữ dugraveng để

Miecircu tả kho dữ liệu tổng thể Nhận dạng kiểu kho dữ liệu Quản liacute quaacute trigravenh tiacutech hợp dữ liệu Quản liacute quaacute trigravenh cập nhật kho dữ liệu Quản liacute bảo mật

Lagrave chigravea khoacutea quyết định sự thagravenh cocircng của kho dữ liệu luocircn được thay đổi vagrave cập nhật theo sự phaacutet triển của kho dữ liệu

Dugraveng để quản liacute điều khiển kho dữ liệu Sự ra đời của kho dữ liệu như 1 cấu truacutec hỗ trợ ra quyết định siecircu dữ liệu

được xem như nguồn tagravei nguyecircn dữ liệu Siecircu dữ liệu lagrave trừu tượng Chuacuteng lagrave dữ liệu bậc cao cung cấp mocirc tả ngắn

gọn caacutec dữ liệu bậc thấp hơn 13Hoạt động của Siecircu dữ liệu

Siecircu dữ liệu rất cần thiết trong việc chuyển hoacutea thocircng tin trở thagravenh tri thức Lagrave chigravea khoacutea giuacutep chuacuteng ta xử lyacute được dữ liệu thocirc Viacute dụ một dograveng dữ liệu baacuten hagraveng 1023 K596 11121 agraveNoacute sẽ khocircng coacute nghĩa gigrave cho đến khi chuacuteng ta đưa vagraveo siecircu dữ liệu (thư

mục chứa dữ liệu) agrave cửa hagraveng 1023 sản phẩm K596 vagrave số tiền baacuten được lagrave 11121 đocirc la

14Sự cần thiết phải nhất quaacuten trong kho dữ liệu Kho dữ liệu được xacircy dựng cho lợi iacutech của những nhagrave phacircn tiacutech kinh

doanh caacutec nhagrave quản trị cho tất cả caacutec khu vực chức năng Trong cơ sở dữ liệu riecircng caacutec khu vực khaacutec nhau coacute thể định nghĩa vagrave lưu

trữ dữ liệu thocircng qua phiecircn bản của chiacutenh noacute Khi dữ liệu được lấy từ những vugraveng khaacutec nhau đoacute vagrave được đặt vagraveo kho dữ

liệu Việc chuyển đổi vagrave lagravem sạch caacutec tiến trigravenh sẽ đảm bảo noacute lagrave duy nhất được tiacutech hợp tại một mức của tổ chức

15Ragrave soaacutet lại dữ liệu ndash Thực thi siecircu dữ liệu

Bất kể cấu truacutec tự nhiecircn của 1 cacircu truy vấn thế nagraveo thigrave caacutec thagravenh phần của siecircu dữ liệu rất quan trọng đối với người ra quyết định

Bảng thuộc tiacutenh khoacutea được lưu trữ bởi kho dữ liệu Tập hợp dữ liệu được lấy từ đacircu Những chuyển đổi nagraveo được thực thi với việc lagravem sạch

16Siecircu dữ liệu lagrave gigrave Metadata - lagrave thocircng tin mocirc tả nội dung của cơ sở dữ liệu (CSDL) Metadata baacuteo cho người dugraveng biết thời gian cập nhật sau cugraveng của dữ liệu

định dạng vagrave mục điacutech sử dụng của noacute Những thocircng tin nagravey coacute thể hướng dẫn người dugraveng duyệt qua CSDL vagrave

giuacutep họ hiểu được yacute nghĩa vagrave ngữ cảnh của dữ liệu Trong CSDL metadata lagrave caacutec dạng biểu diễn khaacutec nhau của caacutec đối tượng

trong CSDL Trong CSDL quan hệ metadata lagrave caacutec định nghĩa của bảng cột CSDL

view vagrave nhiều đối tượng khaacutec Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột

một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi -gtMetadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu

Bảng chuyển đổi Ghi lại những chuyển đổi đatilde được thực hiện

Lịch sử thực thi Ghi lại những dữ liệu đatilde được

phacircn tiacutech

Higravenh thaacutei kết nốiGhi lại những dữ liệu được kết nối vagrave tần suất

17Aacutenh xạ thocircng thường của siecircu dữ liệu Bản ghi aacutenh xạ chuyển đổi bao gồm

Định danh của nguồn gốc Chuyển đổi thuộc tiacutenh Chuyển đổi thuộc tiacutenh vật lyacute Matilde hoacutea tham chiếu bảng chuyển đổi Đổi tecircn Đổi khoacutea Gaacuten giaacute trị cho thuộc tiacutenh mặc định Chọn logic cho caacutec nguồn nhiều giaacute trị Đổi thuật toaacuten

18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để

phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai

lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave

tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec

Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm

Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo

19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua

caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau

SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được

Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra

một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức

Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ

Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ

Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech

CHƯƠNG 11 KHAI PHAacute DỮ LIỆU

1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn

ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993

Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng

2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd

1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều

2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP

3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn

4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng

5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server

6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo

7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động

8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời

9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều

10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện

11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech

12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP

3 Xử lyacute phacircn tiacutech trực tuyến OLAP

MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave

dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu

ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave

thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu

HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave

ROLAP4 Khai phaacute dữ liệu

Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh

khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn

Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan

5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp

6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại

Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp

Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec

Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt

Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra

Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh

vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho

Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec

Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm

Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục

Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng

gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp

Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn

Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec

Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper

Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2

Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25

Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước

Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng

Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện

trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp

Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute

độ hỗ trợ ge ngưỡng minsup

độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan

Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn

Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết

Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu

MOLAP ROLAP HOLAP

Lưu trữ dữ liệu cơ sở

Khối Bảng quan hệ Bảng quan hệ

Lưu trữ thocircng tin tổng hợp

Khối Bảng quan hệ Khối

Hiệu suất thực hiện truy vấn

Nhanh nhất Chậm nhất Nhanh

Tiecircu thụ khocircng gian lưu trữ

Nhiều Thấp Trung bigravenh

Chi phiacute bảo trigrave Cao Thấp Trung bigravenh

Page 56: De cuong(1-11)

được kết hợp lại thagravenh dạng coacute thể dugraveng được cho quyết định

Kiacutech cỡ lớn hơn - Lưu giữ theo chuỗi thời gian tức lagrave giữ lại nhiều DL

Khocircng được chuẩn hoacutea - Coacute thể dư thừa DLSiecircu dữ liệu - Dữ liệu của dữ liệu được lưu trữNguồn dữ liệu - DL vận hagravenh (caacutec hệ sẵn coacute) cugraveng

với caacutec nguồn ngoagravei 8 Kho dữ liệu hướng chủ đề

Hướng chủ để coacute nghĩa lagrave kho dữ liệu được tổ chức xung quanh caacutec chủ đề chiacutenh như khaacutech hagraveng sản phẩm sản xuất Tập trung vagraveo việc mocirc higravenh hoacutea vagrave phacircn tiacutech dữ liệu cho caacutec nhagrave ra quyết định magrave khocircng tập trung vagraveo caacutec xử lyacute thocircng thường Cung cấp cho người dugraveng một khung nhigraven toagraven vẹn đơn giản vagrave đầy đủ về caacutec sự kiện quanh caacutec chủ đề

9 Dữ liệu trong DW được tiacutech hợp Dữ liệu trong kho dữ liệu được xacircy dựng bằng caacutech tổng hợp dữ liệu từ

nhiều nguồn khaacutec nhau vagrave caacutec nguồn coacute tổ chức khaacutec nhau Cơ sở dữ liệu caacutec file excel caacutec flat file hoặc caacutec raw file Khi đưa vagraveo kho dữ liệu caacutec dữ liệu được lagravem sạch vagrave tiacutech hợp dữ liệu nhằm đảm bảo tiacutenh nhất quaacuten của dữ liệu

10Kiến truacutec kho dữ liệu Tầng cơ sở dữ liệu hoạt động Tầng truy xuất thocircng tin Tầng truy xuất dữ liệu Tầng siecircu dữ liệu Tầng quản lyacute tiến trigravenh Tầng thocircng điệp của ứng dụng Tầng vật liacute của kho dữ liệu Tầng trigravenh diễn dữ liệu

11Higravenh trạng kho dữ liệu Kho dữ liệu ảo - người dugraveng cuối coacute thể truy cập trực tiếp đến kho dữ liệu

sử dụng caacutec cocircng cụ cho pheacutep ở tầng truy xuất dữ liệu Kho dữ liệu trung tacircm-1 cơ sở dữ liệu vật lyacute chứa tất cả dữ liệu cho một

vugraveng chuyecircn dụng nagraveo đoacute

Kho dữ liệu phacircn taacuten- Thagravenh phần được phacircn taacuten qua nhiều hệ cơ sở dữ liệu vật lyacute

12METADATA- Siecircu dữ liệu Định nghĩa Siecircu dữ liệu lagrave dữ liệu về dữ liệu Lagrave 1 lưu trữ dugraveng để

Miecircu tả kho dữ liệu tổng thể Nhận dạng kiểu kho dữ liệu Quản liacute quaacute trigravenh tiacutech hợp dữ liệu Quản liacute quaacute trigravenh cập nhật kho dữ liệu Quản liacute bảo mật

Lagrave chigravea khoacutea quyết định sự thagravenh cocircng của kho dữ liệu luocircn được thay đổi vagrave cập nhật theo sự phaacutet triển của kho dữ liệu

Dugraveng để quản liacute điều khiển kho dữ liệu Sự ra đời của kho dữ liệu như 1 cấu truacutec hỗ trợ ra quyết định siecircu dữ liệu

được xem như nguồn tagravei nguyecircn dữ liệu Siecircu dữ liệu lagrave trừu tượng Chuacuteng lagrave dữ liệu bậc cao cung cấp mocirc tả ngắn

gọn caacutec dữ liệu bậc thấp hơn 13Hoạt động của Siecircu dữ liệu

Siecircu dữ liệu rất cần thiết trong việc chuyển hoacutea thocircng tin trở thagravenh tri thức Lagrave chigravea khoacutea giuacutep chuacuteng ta xử lyacute được dữ liệu thocirc Viacute dụ một dograveng dữ liệu baacuten hagraveng 1023 K596 11121 agraveNoacute sẽ khocircng coacute nghĩa gigrave cho đến khi chuacuteng ta đưa vagraveo siecircu dữ liệu (thư

mục chứa dữ liệu) agrave cửa hagraveng 1023 sản phẩm K596 vagrave số tiền baacuten được lagrave 11121 đocirc la

14Sự cần thiết phải nhất quaacuten trong kho dữ liệu Kho dữ liệu được xacircy dựng cho lợi iacutech của những nhagrave phacircn tiacutech kinh

doanh caacutec nhagrave quản trị cho tất cả caacutec khu vực chức năng Trong cơ sở dữ liệu riecircng caacutec khu vực khaacutec nhau coacute thể định nghĩa vagrave lưu

trữ dữ liệu thocircng qua phiecircn bản của chiacutenh noacute Khi dữ liệu được lấy từ những vugraveng khaacutec nhau đoacute vagrave được đặt vagraveo kho dữ

liệu Việc chuyển đổi vagrave lagravem sạch caacutec tiến trigravenh sẽ đảm bảo noacute lagrave duy nhất được tiacutech hợp tại một mức của tổ chức

15Ragrave soaacutet lại dữ liệu ndash Thực thi siecircu dữ liệu

Bất kể cấu truacutec tự nhiecircn của 1 cacircu truy vấn thế nagraveo thigrave caacutec thagravenh phần của siecircu dữ liệu rất quan trọng đối với người ra quyết định

Bảng thuộc tiacutenh khoacutea được lưu trữ bởi kho dữ liệu Tập hợp dữ liệu được lấy từ đacircu Những chuyển đổi nagraveo được thực thi với việc lagravem sạch

16Siecircu dữ liệu lagrave gigrave Metadata - lagrave thocircng tin mocirc tả nội dung của cơ sở dữ liệu (CSDL) Metadata baacuteo cho người dugraveng biết thời gian cập nhật sau cugraveng của dữ liệu

định dạng vagrave mục điacutech sử dụng của noacute Những thocircng tin nagravey coacute thể hướng dẫn người dugraveng duyệt qua CSDL vagrave

giuacutep họ hiểu được yacute nghĩa vagrave ngữ cảnh của dữ liệu Trong CSDL metadata lagrave caacutec dạng biểu diễn khaacutec nhau của caacutec đối tượng

trong CSDL Trong CSDL quan hệ metadata lagrave caacutec định nghĩa của bảng cột CSDL

view vagrave nhiều đối tượng khaacutec Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột

một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi -gtMetadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu

Bảng chuyển đổi Ghi lại những chuyển đổi đatilde được thực hiện

Lịch sử thực thi Ghi lại những dữ liệu đatilde được

phacircn tiacutech

Higravenh thaacutei kết nốiGhi lại những dữ liệu được kết nối vagrave tần suất

17Aacutenh xạ thocircng thường của siecircu dữ liệu Bản ghi aacutenh xạ chuyển đổi bao gồm

Định danh của nguồn gốc Chuyển đổi thuộc tiacutenh Chuyển đổi thuộc tiacutenh vật lyacute Matilde hoacutea tham chiếu bảng chuyển đổi Đổi tecircn Đổi khoacutea Gaacuten giaacute trị cho thuộc tiacutenh mặc định Chọn logic cho caacutec nguồn nhiều giaacute trị Đổi thuật toaacuten

18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để

phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai

lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave

tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec

Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm

Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo

19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua

caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau

SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được

Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra

một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức

Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ

Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ

Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech

CHƯƠNG 11 KHAI PHAacute DỮ LIỆU

1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn

ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993

Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng

2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd

1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều

2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP

3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn

4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng

5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server

6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo

7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động

8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời

9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều

10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện

11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech

12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP

3 Xử lyacute phacircn tiacutech trực tuyến OLAP

MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave

dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu

ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave

thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu

HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave

ROLAP4 Khai phaacute dữ liệu

Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh

khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn

Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan

5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp

6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại

Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp

Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec

Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt

Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra

Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh

vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho

Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec

Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm

Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục

Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng

gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp

Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn

Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec

Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper

Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2

Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25

Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước

Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng

Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện

trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp

Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute

độ hỗ trợ ge ngưỡng minsup

độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan

Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn

Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết

Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu

MOLAP ROLAP HOLAP

Lưu trữ dữ liệu cơ sở

Khối Bảng quan hệ Bảng quan hệ

Lưu trữ thocircng tin tổng hợp

Khối Bảng quan hệ Khối

Hiệu suất thực hiện truy vấn

Nhanh nhất Chậm nhất Nhanh

Tiecircu thụ khocircng gian lưu trữ

Nhiều Thấp Trung bigravenh

Chi phiacute bảo trigrave Cao Thấp Trung bigravenh

Page 57: De cuong(1-11)

Kho dữ liệu phacircn taacuten- Thagravenh phần được phacircn taacuten qua nhiều hệ cơ sở dữ liệu vật lyacute

12METADATA- Siecircu dữ liệu Định nghĩa Siecircu dữ liệu lagrave dữ liệu về dữ liệu Lagrave 1 lưu trữ dugraveng để

Miecircu tả kho dữ liệu tổng thể Nhận dạng kiểu kho dữ liệu Quản liacute quaacute trigravenh tiacutech hợp dữ liệu Quản liacute quaacute trigravenh cập nhật kho dữ liệu Quản liacute bảo mật

Lagrave chigravea khoacutea quyết định sự thagravenh cocircng của kho dữ liệu luocircn được thay đổi vagrave cập nhật theo sự phaacutet triển của kho dữ liệu

Dugraveng để quản liacute điều khiển kho dữ liệu Sự ra đời của kho dữ liệu như 1 cấu truacutec hỗ trợ ra quyết định siecircu dữ liệu

được xem như nguồn tagravei nguyecircn dữ liệu Siecircu dữ liệu lagrave trừu tượng Chuacuteng lagrave dữ liệu bậc cao cung cấp mocirc tả ngắn

gọn caacutec dữ liệu bậc thấp hơn 13Hoạt động của Siecircu dữ liệu

Siecircu dữ liệu rất cần thiết trong việc chuyển hoacutea thocircng tin trở thagravenh tri thức Lagrave chigravea khoacutea giuacutep chuacuteng ta xử lyacute được dữ liệu thocirc Viacute dụ một dograveng dữ liệu baacuten hagraveng 1023 K596 11121 agraveNoacute sẽ khocircng coacute nghĩa gigrave cho đến khi chuacuteng ta đưa vagraveo siecircu dữ liệu (thư

mục chứa dữ liệu) agrave cửa hagraveng 1023 sản phẩm K596 vagrave số tiền baacuten được lagrave 11121 đocirc la

14Sự cần thiết phải nhất quaacuten trong kho dữ liệu Kho dữ liệu được xacircy dựng cho lợi iacutech của những nhagrave phacircn tiacutech kinh

doanh caacutec nhagrave quản trị cho tất cả caacutec khu vực chức năng Trong cơ sở dữ liệu riecircng caacutec khu vực khaacutec nhau coacute thể định nghĩa vagrave lưu

trữ dữ liệu thocircng qua phiecircn bản của chiacutenh noacute Khi dữ liệu được lấy từ những vugraveng khaacutec nhau đoacute vagrave được đặt vagraveo kho dữ

liệu Việc chuyển đổi vagrave lagravem sạch caacutec tiến trigravenh sẽ đảm bảo noacute lagrave duy nhất được tiacutech hợp tại một mức của tổ chức

15Ragrave soaacutet lại dữ liệu ndash Thực thi siecircu dữ liệu

Bất kể cấu truacutec tự nhiecircn của 1 cacircu truy vấn thế nagraveo thigrave caacutec thagravenh phần của siecircu dữ liệu rất quan trọng đối với người ra quyết định

Bảng thuộc tiacutenh khoacutea được lưu trữ bởi kho dữ liệu Tập hợp dữ liệu được lấy từ đacircu Những chuyển đổi nagraveo được thực thi với việc lagravem sạch

16Siecircu dữ liệu lagrave gigrave Metadata - lagrave thocircng tin mocirc tả nội dung của cơ sở dữ liệu (CSDL) Metadata baacuteo cho người dugraveng biết thời gian cập nhật sau cugraveng của dữ liệu

định dạng vagrave mục điacutech sử dụng của noacute Những thocircng tin nagravey coacute thể hướng dẫn người dugraveng duyệt qua CSDL vagrave

giuacutep họ hiểu được yacute nghĩa vagrave ngữ cảnh của dữ liệu Trong CSDL metadata lagrave caacutec dạng biểu diễn khaacutec nhau của caacutec đối tượng

trong CSDL Trong CSDL quan hệ metadata lagrave caacutec định nghĩa của bảng cột CSDL

view vagrave nhiều đối tượng khaacutec Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột

một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi -gtMetadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu

Bảng chuyển đổi Ghi lại những chuyển đổi đatilde được thực hiện

Lịch sử thực thi Ghi lại những dữ liệu đatilde được

phacircn tiacutech

Higravenh thaacutei kết nốiGhi lại những dữ liệu được kết nối vagrave tần suất

17Aacutenh xạ thocircng thường của siecircu dữ liệu Bản ghi aacutenh xạ chuyển đổi bao gồm

Định danh của nguồn gốc Chuyển đổi thuộc tiacutenh Chuyển đổi thuộc tiacutenh vật lyacute Matilde hoacutea tham chiếu bảng chuyển đổi Đổi tecircn Đổi khoacutea Gaacuten giaacute trị cho thuộc tiacutenh mặc định Chọn logic cho caacutec nguồn nhiều giaacute trị Đổi thuật toaacuten

18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để

phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai

lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave

tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec

Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm

Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo

19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua

caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau

SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được

Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra

một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức

Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ

Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ

Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech

CHƯƠNG 11 KHAI PHAacute DỮ LIỆU

1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn

ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993

Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng

2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd

1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều

2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP

3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn

4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng

5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server

6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo

7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động

8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời

9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều

10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện

11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech

12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP

3 Xử lyacute phacircn tiacutech trực tuyến OLAP

MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave

dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu

ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave

thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu

HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave

ROLAP4 Khai phaacute dữ liệu

Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh

khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn

Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan

5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp

6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại

Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp

Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec

Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt

Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra

Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh

vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho

Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec

Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm

Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục

Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng

gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp

Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn

Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec

Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper

Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2

Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25

Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước

Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng

Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện

trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp

Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute

độ hỗ trợ ge ngưỡng minsup

độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan

Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn

Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết

Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu

MOLAP ROLAP HOLAP

Lưu trữ dữ liệu cơ sở

Khối Bảng quan hệ Bảng quan hệ

Lưu trữ thocircng tin tổng hợp

Khối Bảng quan hệ Khối

Hiệu suất thực hiện truy vấn

Nhanh nhất Chậm nhất Nhanh

Tiecircu thụ khocircng gian lưu trữ

Nhiều Thấp Trung bigravenh

Chi phiacute bảo trigrave Cao Thấp Trung bigravenh

Page 58: De cuong(1-11)

Bất kể cấu truacutec tự nhiecircn của 1 cacircu truy vấn thế nagraveo thigrave caacutec thagravenh phần của siecircu dữ liệu rất quan trọng đối với người ra quyết định

Bảng thuộc tiacutenh khoacutea được lưu trữ bởi kho dữ liệu Tập hợp dữ liệu được lấy từ đacircu Những chuyển đổi nagraveo được thực thi với việc lagravem sạch

16Siecircu dữ liệu lagrave gigrave Metadata - lagrave thocircng tin mocirc tả nội dung của cơ sở dữ liệu (CSDL) Metadata baacuteo cho người dugraveng biết thời gian cập nhật sau cugraveng của dữ liệu

định dạng vagrave mục điacutech sử dụng của noacute Những thocircng tin nagravey coacute thể hướng dẫn người dugraveng duyệt qua CSDL vagrave

giuacutep họ hiểu được yacute nghĩa vagrave ngữ cảnh của dữ liệu Trong CSDL metadata lagrave caacutec dạng biểu diễn khaacutec nhau của caacutec đối tượng

trong CSDL Trong CSDL quan hệ metadata lagrave caacutec định nghĩa của bảng cột CSDL

view vagrave nhiều đối tượng khaacutec Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột

một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi -gtMetadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu

Bảng chuyển đổi Ghi lại những chuyển đổi đatilde được thực hiện

Lịch sử thực thi Ghi lại những dữ liệu đatilde được

phacircn tiacutech

Higravenh thaacutei kết nốiGhi lại những dữ liệu được kết nối vagrave tần suất

17Aacutenh xạ thocircng thường của siecircu dữ liệu Bản ghi aacutenh xạ chuyển đổi bao gồm

Định danh của nguồn gốc Chuyển đổi thuộc tiacutenh Chuyển đổi thuộc tiacutenh vật lyacute Matilde hoacutea tham chiếu bảng chuyển đổi Đổi tecircn Đổi khoacutea Gaacuten giaacute trị cho thuộc tiacutenh mặc định Chọn logic cho caacutec nguồn nhiều giaacute trị Đổi thuật toaacuten

18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để

phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai

lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave

tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec

Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm

Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo

19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua

caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau

SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được

Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra

một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức

Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ

Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ

Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech

CHƯƠNG 11 KHAI PHAacute DỮ LIỆU

1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn

ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993

Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng

2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd

1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều

2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP

3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn

4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng

5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server

6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo

7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động

8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời

9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều

10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện

11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech

12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP

3 Xử lyacute phacircn tiacutech trực tuyến OLAP

MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave

dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu

ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave

thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu

HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave

ROLAP4 Khai phaacute dữ liệu

Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh

khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn

Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan

5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp

6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại

Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp

Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec

Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt

Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra

Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh

vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho

Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec

Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm

Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục

Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng

gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp

Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn

Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec

Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper

Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2

Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25

Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước

Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng

Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện

trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp

Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute

độ hỗ trợ ge ngưỡng minsup

độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan

Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn

Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết

Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu

MOLAP ROLAP HOLAP

Lưu trữ dữ liệu cơ sở

Khối Bảng quan hệ Bảng quan hệ

Lưu trữ thocircng tin tổng hợp

Khối Bảng quan hệ Khối

Hiệu suất thực hiện truy vấn

Nhanh nhất Chậm nhất Nhanh

Tiecircu thụ khocircng gian lưu trữ

Nhiều Thấp Trung bigravenh

Chi phiacute bảo trigrave Cao Thấp Trung bigravenh

Page 59: De cuong(1-11)

Bảng chuyển đổi Ghi lại những chuyển đổi đatilde được thực hiện

Lịch sử thực thi Ghi lại những dữ liệu đatilde được

phacircn tiacutech

Higravenh thaacutei kết nốiGhi lại những dữ liệu được kết nối vagrave tần suất

17Aacutenh xạ thocircng thường của siecircu dữ liệu Bản ghi aacutenh xạ chuyển đổi bao gồm

Định danh của nguồn gốc Chuyển đổi thuộc tiacutenh Chuyển đổi thuộc tiacutenh vật lyacute Matilde hoacutea tham chiếu bảng chuyển đổi Đổi tecircn Đổi khoacutea Gaacuten giaacute trị cho thuộc tiacutenh mặc định Chọn logic cho caacutec nguồn nhiều giaacute trị Đổi thuật toaacuten

18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để

phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai

lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave

tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec

Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm

Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo

19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua

caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau

SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được

Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra

một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức

Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ

Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ

Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech

CHƯƠNG 11 KHAI PHAacute DỮ LIỆU

1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn

ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993

Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng

2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd

1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều

2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP

3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn

4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng

5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server

6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo

7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động

8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời

9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều

10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện

11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech

12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP

3 Xử lyacute phacircn tiacutech trực tuyến OLAP

MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave

dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu

ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave

thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu

HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave

ROLAP4 Khai phaacute dữ liệu

Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh

khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn

Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan

5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp

6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại

Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp

Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec

Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt

Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra

Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh

vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho

Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec

Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm

Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục

Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng

gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp

Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn

Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec

Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper

Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2

Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25

Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước

Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng

Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện

trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp

Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute

độ hỗ trợ ge ngưỡng minsup

độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan

Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn

Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết

Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu

MOLAP ROLAP HOLAP

Lưu trữ dữ liệu cơ sở

Khối Bảng quan hệ Bảng quan hệ

Lưu trữ thocircng tin tổng hợp

Khối Bảng quan hệ Khối

Hiệu suất thực hiện truy vấn

Nhanh nhất Chậm nhất Nhanh

Tiecircu thụ khocircng gian lưu trữ

Nhiều Thấp Trung bigravenh

Chi phiacute bảo trigrave Cao Thấp Trung bigravenh

Page 60: De cuong(1-11)

18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để

phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai

lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave

tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec

Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm

Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo

19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua

caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau

SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được

Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra

một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức

Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ

Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ

Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech

CHƯƠNG 11 KHAI PHAacute DỮ LIỆU

1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn

ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993

Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng

2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd

1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều

2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP

3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn

4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng

5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server

6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo

7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động

8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời

9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều

10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện

11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech

12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP

3 Xử lyacute phacircn tiacutech trực tuyến OLAP

MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave

dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu

ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave

thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu

HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave

ROLAP4 Khai phaacute dữ liệu

Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh

khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn

Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan

5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp

6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại

Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp

Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec

Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt

Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra

Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh

vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho

Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec

Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm

Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục

Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng

gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp

Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn

Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec

Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper

Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2

Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25

Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước

Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng

Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện

trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp

Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute

độ hỗ trợ ge ngưỡng minsup

độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan

Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn

Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết

Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu

MOLAP ROLAP HOLAP

Lưu trữ dữ liệu cơ sở

Khối Bảng quan hệ Bảng quan hệ

Lưu trữ thocircng tin tổng hợp

Khối Bảng quan hệ Khối

Hiệu suất thực hiện truy vấn

Nhanh nhất Chậm nhất Nhanh

Tiecircu thụ khocircng gian lưu trữ

Nhiều Thấp Trung bigravenh

Chi phiacute bảo trigrave Cao Thấp Trung bigravenh

Page 61: De cuong(1-11)

CHƯƠNG 11 KHAI PHAacute DỮ LIỆU

1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn

ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993

Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng

2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd

1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều

2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP

3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn

4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng

5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server

6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo

7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động

8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời

9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều

10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện

11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech

12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP

3 Xử lyacute phacircn tiacutech trực tuyến OLAP

MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave

dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu

ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave

thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu

HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave

ROLAP4 Khai phaacute dữ liệu

Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh

khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn

Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan

5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp

6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại

Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp

Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec

Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt

Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra

Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh

vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho

Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec

Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm

Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục

Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng

gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp

Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn

Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec

Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper

Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2

Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25

Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước

Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng

Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện

trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp

Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute

độ hỗ trợ ge ngưỡng minsup

độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan

Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn

Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết

Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu

MOLAP ROLAP HOLAP

Lưu trữ dữ liệu cơ sở

Khối Bảng quan hệ Bảng quan hệ

Lưu trữ thocircng tin tổng hợp

Khối Bảng quan hệ Khối

Hiệu suất thực hiện truy vấn

Nhanh nhất Chậm nhất Nhanh

Tiecircu thụ khocircng gian lưu trữ

Nhiều Thấp Trung bigravenh

Chi phiacute bảo trigrave Cao Thấp Trung bigravenh

Page 62: De cuong(1-11)

9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều

10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện

11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech

12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP

3 Xử lyacute phacircn tiacutech trực tuyến OLAP

MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave

dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu

ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave

thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu

HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave

ROLAP4 Khai phaacute dữ liệu

Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh

khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn

Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan

5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp

6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại

Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp

Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec

Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt

Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra

Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh

vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho

Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec

Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm

Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục

Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng

gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp

Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn

Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec

Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper

Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2

Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25

Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước

Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng

Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện

trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp

Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute

độ hỗ trợ ge ngưỡng minsup

độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan

Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn

Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết

Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu

MOLAP ROLAP HOLAP

Lưu trữ dữ liệu cơ sở

Khối Bảng quan hệ Bảng quan hệ

Lưu trữ thocircng tin tổng hợp

Khối Bảng quan hệ Khối

Hiệu suất thực hiện truy vấn

Nhanh nhất Chậm nhất Nhanh

Tiecircu thụ khocircng gian lưu trữ

Nhiều Thấp Trung bigravenh

Chi phiacute bảo trigrave Cao Thấp Trung bigravenh

Page 63: De cuong(1-11)

khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn

Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan

5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp

6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại

Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp

Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec

Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt

Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra

Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh

vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho

Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec

Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm

Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục

Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng

gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp

Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn

Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec

Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper

Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2

Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25

Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước

Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng

Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện

trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp

Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute

độ hỗ trợ ge ngưỡng minsup

độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan

Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn

Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết

Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu

MOLAP ROLAP HOLAP

Lưu trữ dữ liệu cơ sở

Khối Bảng quan hệ Bảng quan hệ

Lưu trữ thocircng tin tổng hợp

Khối Bảng quan hệ Khối

Hiệu suất thực hiện truy vấn

Nhanh nhất Chậm nhất Nhanh

Tiecircu thụ khocircng gian lưu trữ

Nhiều Thấp Trung bigravenh

Chi phiacute bảo trigrave Cao Thấp Trung bigravenh

Page 64: De cuong(1-11)

Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng

gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp

Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn

Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec

Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper

Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2

Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25

Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước

Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng

Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện

trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp

Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute

độ hỗ trợ ge ngưỡng minsup

độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan

Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn

Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết

Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu

MOLAP ROLAP HOLAP

Lưu trữ dữ liệu cơ sở

Khối Bảng quan hệ Bảng quan hệ

Lưu trữ thocircng tin tổng hợp

Khối Bảng quan hệ Khối

Hiệu suất thực hiện truy vấn

Nhanh nhất Chậm nhất Nhanh

Tiecircu thụ khocircng gian lưu trữ

Nhiều Thấp Trung bigravenh

Chi phiacute bảo trigrave Cao Thấp Trung bigravenh

Page 65: De cuong(1-11)

độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan

Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn

Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết

Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu

MOLAP ROLAP HOLAP

Lưu trữ dữ liệu cơ sở

Khối Bảng quan hệ Bảng quan hệ

Lưu trữ thocircng tin tổng hợp

Khối Bảng quan hệ Khối

Hiệu suất thực hiện truy vấn

Nhanh nhất Chậm nhất Nhanh

Tiecircu thụ khocircng gian lưu trữ

Nhiều Thấp Trung bigravenh

Chi phiacute bảo trigrave Cao Thấp Trung bigravenh

Page 66: De cuong(1-11)