De cuong(1-11)
Transcript of De cuong(1-11)
Chương 1Định nghĩa Hệ trợ giuacutep quyết định1Định nghĩa hệ hỗ trợ quyết địnhCoacute nhiều định nghĩa khaacutec nhau về một hệ DSS nhưng tất cả đều coacute 3 điểm chung (1) Được aacutep dụng cho caacutec bagravei toaacuten khocircng coacute cấu truacutecbaacuten cấu truacutec (2) Chỉ hỗ trợ chứ khocircng thay thế quaacute trigravenh ra quyết định (3) luocircn được đặt dưới sự giaacutem saacutet của con người
Caacutec đặc trưng của hệ trợ giuacutep quyết định Được sử dụng trong ngữ cảnh quyết định phihoặc nửa cấu truacutec Thiecircn về hỗ trợ chứ khocircng thay thế người ra quyết định Hỗ trợ tất cả caacutec pha của quaacute trigravenh ra quyết định Chuacute trọng tới hiệu quả của quaacute trigravenh hơn lagrave hiệu suất Luocircn đạt dưới sự kiểm soaacutet của người dugraveng DSS Sử dụng caacutec dữ liệu vagrave mocirc higravenh của bagravei toaacuten đặt ra Lagravem cho quaacute trigravenh học từ quaacute khứ của người ra quyết định trở necircn dẽ ragraveng hơn Tương taacutec một caacutech thacircn thiện với người dugraveng Thocircng thường được phaacutet triển bởi quaacute trigravenh lặp vagrave tiến hoacutea Coacute khả năng hố trợ nhiều quyết định độc lập hoặc phụ thuộc lẫn nhau Hố trợ việc ra quyết định của nhoacutem hoặc caacute nhacircn
2 Khả năng của hệ trợ giuacutep quyết định Caacutec hệ DSS được kỳ vọng lagrave sẽ mở rộng khả năng của người ra quyết định trong
việc xử lyacute thocircng tin Caacutec hệ DSS sẽ giải caacutec phần việc tốn keacutem thời gian của bagravei toaacuten để tiết kiệm
thời gian cho người dugraveng Việc sử dụng caacutec DSS coacute thể cung cấp cho người dugraveng caacutec lựa chọn magrave người
dugraveng coacute thể khocircng quan saacutet được Tuy nhiecircn caacutec hệ nagravey luocircn bị giới hạn bởi caacutec tri thức được cung cấp Mỗi DSS đều coacute số lương tiến trigravenh lập luận giới hạn Vagrave cần nhấn mạnh rằng khocircng tồn tại một ldquoDSS vạn năngrdquo
3Thagravenh phần của DSS Người ta phacircn lọai caacutec thagravenh phần của DSS thagravenh 7 nhoacutem phụ thuộc vagraveo ảnh
hưởng của chuacuteng tới quyết định như thế nagraveo Caacutech tiếp cận khaacutec hướng vagraveo ngocircn ngữ xử lyacute dữ liệu magrave DSS cung cấp Trecircn cơ sở đoacute caacutec thagravenh phần cơ bản của một DSS coacute thể gồm
1 Hệ thống quản lyacute dữ liệu gồm một cơ sở dữ liệu chứa caacutec dữ liệu cần thiết của tigravenh huống vagrave được quản lyacute bởi một hệ quản trị cơ sở dữ liệuPhacircn hệ nagravey coacute thể được kết nối với nhagrave kho dữ liệu của tổ chứcndash lagrave kho chứa dữ liệu của tổ chức coacute liecircn đới đến vấn đề ra quyết định
2 Hệ thống quản lyacute mocirc higravenh cograven được gọi lagrave hệ quản trị cơ sở mocirc higravenh (MBMS) lagrave goacutei phần mềm gồm caacutec thagravenh phần về thống kecirc tagravei chaacutenh khoa học quản lyacute hay caacutec phương phaacutep định lượng nhằm trang bị cho hệ
thống năng lực phacircn tiacutech cũng coacute thể coacute caacutec ngocircn ngữ mocirc higravenh hoacutea ở đacircy Thagravenh phần nagravey coacute thể kết nối với caacutec kho chứa mocirc higravenh của tổ chức hay ở becircn ngoagravei nagraveo khaacutec
3 Một cocircng cụ tri thức coacute thể hỗ trợ caacutec phacircn hệ khaacutec hay hoạt động độc lập nhằm đưa ra tiacutenh thocircng minh của quyết định đưa ra Noacute cũng coacute thể được kết nối với caacutec kho kiến thức khaacutec của tổ chức
4Giao diện người dugraveng giuacutep người sử dụng giao tiếp với vagrave ra lệnh cho hệ thống Caacutec thagravenh phần vừa kể trecircn tạo necircn HHTQĐ coacute thể kết nối với intranetextranet của tổ chức hay kết nối trực tiếp với Internet
5Chiacutenh caacutec người dugraveng
4Dữ liệu vagrave mocirc higravenh quản lyacute Mối quan tacircm ngagravey cagraveng tăng về giaacute trị dữ liệu đối với một tổ chức chỉ ra rằng
chất lượng vagrave cấu truacutec của CSDL lagrave yếu tố cơ bản xaacutec định sự thagravenh cocircng của DSS
CSDL sẽ tổ chức dữ liệu dưới dạng phacircn cấp logic dưa trecircn mức độ mịn hoacutea dữ liệu
Sự phacircn cấp chứa 4 thagravenh phần tử cơ bản 1CSDL 2 Tập tin 3Bản ghi 4Dữ liệu
Hệ thống quản lyacute CSDL Dữ liệu trong mỗi file coacute cấu truacutec giống nhau (bản ghi) caacutec files coacute thể hoagraven
togravean khaacutec nhau DBMS giữ vai trograve quan trọng trong việc tổ chức files vagrave CSDL DBMS coacute 2 traacutech nhiệm chiacutenh
1 Phối hợp caacutec cocircng việc liecircm quan tới lưu trữ vagrave truy cập thocircng tin2 Duy trigrave sự phụ thuộc logic giữa dữ liệu trong CSDL của DSS vagrave ứng dụng
DSS Caacutec hagravem chức năng trong DBMS
Định nghĩa dữ liệu - cung cấp ngocircn ngữ định nghĩa dữ liệu vagrave cho pheacutep tương quan dữ liệuThao taacutec dữ liệu - cung cấp một ngocircn ngữ truy vấn cho pheacutep nắm bắt vagrave khai thaacutec dữ liệuToagraven vẹn dữ liệu - cho pheacutep người sử dụng để mocirc tả caacutec quy tắc duy trigrave tiacutenh toagraven vẹn vagrave kiểm tra caacutec lỗi
Cơ sở mocirc higravenh Mocirc higravenh lagrave sự đơn giản hoacutea của sự kiện nagraveo đoacute được xacircy dựng để nghiecircn cứu
sự kiện
Cơ sở mocirc higravenh lagrave một biến thể của CSDL Noacute lưu trữ vagrave tổ chức caacutec mocirc higravenh khaacutec nhau magrave DSS sử dụng khi phacircn tiacutech chuacuteng
MBMS lagrave biến thể của DBMS Cơ sở mocirc higravenh chiacutenh lagrave caacutei thể hiện sự khaacutec biệt của một DSS với caacutec hệ
thống thocircng tin khaacutec Tổng quan chức năng của MBMS
Modeling language ndash Cho pheacutep tạo lập caacutec mocirc higravenh quyết định vagrave cung cấp cơ chế liecircn kết nhiều mocirc higravenh để tạo mocirc higravenh phức tạp hơn Model library ndash Lưu trữ vagrave quản lyacute tất cả caacutec mocirc higravenh cung cấp một catalog cugraveng với mocirc tả Model manipulation ndash Cho pheacutep quản lyacute vagrave xử lyacute cơ sở mocirc higravenh với caacutec chức năng (run store query etc) tương tự như caacutec chức năng trong một DBMS
5Cơ sở tri thức của DSS Mọi quyết định đuacuteng đắn đều đogravei hỏi quaacute trigravenh lập luận vagrave quaacute trigravenh nagravey lại
đogravei hỏi thocircng tin Cơ sở tri thức lagrave nơi lưu trữ tất cả caacutec thocircng tin dạng nagravey trong DSS Tri thức coacute thể đơn giản chỉ lagrave caacutec thocircng tin thocirc caacutec quy tắc caacutec heuristics
caacutec ragraveng buộc hoặc kết quả của quaacute khứ Tri thức nagravey khaacutec với thocircng tin cả trong CSDL vagrave cơ sở mocirc higravenh ở chỗ noacute
mang đặc trưng của bagravei toaacuten Nội dung kiến thức cơ sở
Tri thức trong cơ sở tri thức coacute thể được phacircn lagravem 2 loại Facts thể hiện điều chuacuteng ta coi lagrave đuacuteng tại thời điểm cho trước Hypotheses thể hiện caacutec quy tắc hoặc caacutec quan hệ magrave chuacuteng ta tin lagrave tồn tại giữa caacutec facts
Kiến thức thu nhận vagrave truy hồi Một hoặc một vagravei người sẽ thu thập thocircng tin cho cơ sở tri thức Đacircy lagrave những
người được đagraveo tạo đặc biệt về caacutec kỹ thuật để thu thập thocircng tin từ caacutec chuyecircn gia lĩnh vực
Mocirc tơ suy diễn (inference engine) lagrave một phần của cơ sở tri thức Noacute aacutep dụng caacutec quy tắc để lấy ra thocircng tin dưới dạng magrave người dugraveng mong muốn
6Giao diện người dugraveng Giao diecircn người dugraveng lagrave một thagravenh phần được thiết kế để cho pheacutep người
dugraveng truy cập tới caacutec thagravenh phần becircn trong của hệ thống
Thocircng thường giao diện cagraveng gần gũi thigrave cagraveng iacutet đogravei hỏi việc huấn luyện người dugraveng Hatildey suy nghĩ xem coacute bao nhiecircu chương trigravenh Windows dugraveng cugraveng cấu truacutec menu như Microsoft Word
Caacutec chức năng chiacutenh của một giao diện của DSS Communication language vagrave Presentation language
Communication language ndash Cho pheacutep tương taacutec với DSS theo nhiều caacutech xaacutec định caacutec dạng input cung cấp caacutec hỗ trợ cho người dugraveng thu giữ caacutec hội thoại đatilde qua để cải thiện caacutec tương taacutec trong tương lai
Presentation language ndash Cung cấp khả năng thể hiện dữ liệu theo nhiều caacutech cho pheacutep sinh caacutec baacuteo caacuteo chi tiết cung cấp nhiều khung nhigraven khaacutec nhau về dữ liệu
7Vai trograve người dugraveng Trong một DSS người dugraveng cũng lagrave một thagravenh phần của hệ thống giống như
hardware vagrave software User roles Người dugraveng được phacircn thagravenh 5 lớp (decision maker
intermediary maintainer operator and feeder) Patterns of DSS use Lagrave sự phacircn loại tiến theo của caacutec user roles khaacutec nhau
thagravenh 1 trong 4 basic patterns of use Slide tiếp theo sẽ mocirc tả caacutec patterns nagravey
8Caacutec mocirc higravenh sử dụng DSS Subscription mode _nhagrave sản xuất quyết định nhận caacutec baacuteo caacuteo thường
xuyecircn theo dự kiến Terminal mode_ nhagrave sản xuất quyết định tương taacutec trực tiếp với DSS Clerk mode - nhagrave sản xuất quyết định sử dụng hệ thống trực tiếpnhưng
khocircng trực tuyến Đầu ra phản hồi coacute thể mất một thời gian Intermediary mode - nhagrave sản xuất quyết định tương taacutec thocircng qua việc sử
dụng mộthoặc nhiều mocirc higravenh trung gian9Danh mục vagrave lớp của DSSCoacute nhiều phương phaacutep để cố gắng phacircn loại caacutec DSSs
Data-centric and model-centric Formal and ad hoc systems Directed versus nondirected DSSs Procedural and nonprocedural systems Hypertext systems Spreadsheet systems Individual and group DSSs
Caacutec đặc trưng thống nhất của mỗi lược đồ cụ thể giữ vai trograve quan trọng trong việc xaacutec định caacutech tiếp cận tốt nhất để thiết kế một hệ thống mới
Chương 2Quyết định vagrave quyết định của nhagrave sản xuất10Quaacute trigravenh ra quyết định
Quaacute trigravenh ra quyết định gồm coacute 3 giai đoạn (Simon 1977)bull Tigravem hiểu bagravei toaacuten dẫn đến quyết định
+Xaacutec định mục tiecircu tổ chức+Tigravem kiếm vagrave tập hợp dữ liệu+Nhận diện xaacutec định chủ thể bagravei toaacuten+phacircn loại vagrave phaacutet biểu vấn đề
bull Thiết kế (design) phacircn tiacutech vagrave xacircy dựng caacutec diễn trigravenh hagravenh động+Thiết lập mocirc higravenh+Lập bảng tiecircu chuẩn chọn lựa+Tigravem kiếm caacutec phương aacuten+Tiecircn đoaacuten vagrave đo lường caacutec kết cục
bull Chọn lựa (choice) chọn một diễn trigravenh trong tập diễn trigravenh+Giải phaacutep cho mocirc higravenh+Phacircn tiacutech độ nhạy+Chọn (caacutec) phương aacuten tốt nhất+Hoạch định việc hiện thực
tiếp theo giai đoạn chọn lựa lagrave giai đoạn hiện thực (implementation)11Người ra quyết định
Người ra quyết định (decision maker) giữ một vai trograve tacircm thần phacircn liệt vigrave vừa được coi lagrave một bước trong quaacute trigravenh vagrave cũng lại lagrave người tham gia
Phacircn lớp người ra quyết định-Quyết định caacute nhacircn coacute thể lagrave 1 người hoặc một hệ thống maacutey tiacutenh đơn lẻ-Nhiều người ra quyecirct định coacute thể lagrave
+Nhoacutem (group)trong đoacute mọi thagravenh viecircn đều coacute tiếng noacutei trong việc ra quyết định
+Đội(team) Caacutec thagravenh viecircn hỗ trợ một người ra quyết định duy nhất+Tổ chứcTrong đoacute cần sự thỏa thuận chung
12Caacutec kiểu ra quyết định Style lagrave caacutech magrave người quản lyacute ra quyết định
Hiệu lực của mỗi style riecircng biệt phụ thuộc vagraveo ngữ cảnh bagravei toaacuten nhận thức của người ra quyết định vagrave tập caacutec giaacute trị caacute nhacircn của bản thacircn họ
Độ phức tạp của caacutec điều đoacute liecircn kết lại với nhau trong việc higravenh thagravenh decision style
Caacutec kiểu ra quyết định Directive ndash kết hợp đogravei hỏi về cấu truacutec bagravei toaacuten cao với mức độ nhập nhằng thấp
Thocircng thường đacircy lagrave caacutec quyết định coacute bản chất kỹ thuật vagrave đogravei hỏi iacutet thocircng tin Analytical ndash Mức độ nhập nhằng lớn hơn vagrave đogravei hỏi nhiều thocircng tin hơn Conceptual ndash Mức độ nhập nhằng cao vagrave thường gần gũi với caacutech ra quyết định
của con người Behavioral ndash đogravei hỏi lượng dữ liệu nhỏ vagrave thể hiện caacutei nhigraven ngắn hạn Thường
xảy ra xung đột necircn phải dựa vagraveo sự đồng thuận Caacutec kiểu ra quyết định trong thiết kế hệ trợ giuacutep quyecirct định
Những cản trở lớn chiacutenh lagrave phản ứng của người ra quyết định trước aacutep lực vagrave phương phaacutep dugraveng để giải bagravei toaacuten
Viacute dụ đối với những người khocircng chịu được aacutep lực trong dạng directive thigrave giao diện cần cho pheacutep người ra quyết định kiểm soất được hệ thống với khocircng coacute quaacute nhiều dữ liệu đầu vagraveo
Đối với kiểu analytic DSS cần cho pheacutep truy cập tới nhiều nguồn dữ liệu magrave người ra quyết định sẽ phacircn tiacutech
13Khoacute khăn khi xacircy dựng DSS
- Thocircng tin mocirc higravenh cấu truacutec -gt iacutet thocircng tin
- Khả năng của con người (khả năng hiểu biết) chỉ xử lyacute được từ 5-gt9 quaacute trigravenh thocircng tin khaacutec nhau
- Khocircng chắc chắn ( mức độ hoagraven thagravenh vagrave tiacutenh chiacutenh xaacutec)
- Coacute nhiều lựa chọn vagrave đa mục tiecircu
Chương 3Quyết định trong tổ chức
14Tổ chức lagrave gigrave Tổ chức Lagrave 1 hệ thống thống nhất caacutec nguồn tagravei nguyecircnĐược cấu thagravenh bởi caacutec
hệ thống nhỏ hơn ragraveng buộc với nhau bởi caacutec mục tiecircu đề ra
Tổng thể 1 tổ chức sẽ mạnh mẽ hơn rất nhiều so với tất cả caacutec thagravenh phần của noacute cộng lại
Mối liecircn hệ của caacutec quyecirct định Mục điacutech chiacutenh của caacutec tổ chức lagrave đưa ra caacutec quyết định trong mocirci trường kinh doanh Caacutec Quyết định phải phugrave hợp với giới hạncaacutec chiacutenh saacutech caacutec thủ tục vagrave lĩnh vực hoạt động Noacute khocircng phụ thuộc vagraveo người đưa ra quyết định lagrave ai Đoacute coacute thể lagrave 1 caacute nhacircn1 nhoacutem hay thậm chiacute DSSs
Độ đo của quyết địnhNăm khiacutea cạnh ảnh hưởng tới Quyết định
Kết cấu nhoacutem (Group Structure) Vai trograve trong nhoacutem(Group Roles) Quaacute trigravenh lagravem việc(Group Processes) Taacutec phong(Group Style) Quy tăc nhoacutem(Group Norm)
Kết cấu nhoacutem Trong 1 nhoacutem chuẩn caacutec thagravenh viecircn coacute traacutech nhiệm vagrave thẩm quyền ra quyết định như nhau Vai trograve trong nhoacutemTrong nhoacutem caacutec thagravenh viecircn đều coacute vai trograve riecircng vagrave
lagrave 1 phần quan trong trong cả tiến trigravenh Quaacute trigravenh lagravem việcQuaacute trigravenh dugraveng người trong nhoacutem ảnh hưởng tới loại
quyết định gacircy hiệu quả vagrave ảnh hưởng tới cả tiến trigravenh Taacutec phong Coacute phải taacutec phong của người ra quyết định coacute ảnh hưởng tới
chất lượng quyết định cuối khocircng Quy tắc nhoacutemQuy tắc nhoacutem lagrave cực kỳ quan trọng trong việc xaacutec định
hagravenh vi caacutec thagravenh viecircn nhoacutem trong caacutec tigravenh huống xatilde hội Phacircn cấp quyết định trong tổ chức3 cấp
Chiến lược Ban latildenh đạo cấp cao hoặc nhagrave quản lyacute Caacutec quyết định mang tiacutenh lacircu dagravei nhất
Chiến thuật Quản lyacute tầm trung Thực thi caacutec quyết định chiến lược đề ra
Thực hiện
Caacute nhacircn chuyecircn ngagravenh Tự đưa ra caacutec quyết định từng ngagravey
15Năng lực của hệ HTQD
1 HHTQĐ cơ bản hỗ trợ caacutec nhagrave ra quyết định trong caacutec tigravenh huống nửa cấu truacutec vagrave phi cấu truacutec bằng caacutech kết hợp phaacuten xử của con người vagrave xử lyacute thocircng tin bằng maacutey tiacutenh Caacutec bagravei toaacuten như vậy khocircng thểkhocircng thuận tiện giải quyết được chỉ bằng caacutec cocircng cụ maacutey tiacutenh hoacutea hay caacutec phương phaacutep định lượng 2 Phugrave hợp cho caacutec cấp quản lyacute khaacutec nhau từ cao đến thấp 3 Phugrave hợp cho caacute nhacircn lẫn nhoacutem Caacutec bagravei toaacuten iacutet coacute tiacutenh cấu truacutec thường liecircn đới đến nhiều caacute nhacircn ở caacutec đơn vị chức năng hay mức tổ chức khaacutec nhau cũng như ở caacutec tổ chức khaacutec 4 Hỗ trợ cho caacutec quyết định tuần tự liecircn thuộc được đưa ra một lần vagravei lần hay lặp lại 5 Hỗ trợ cho caacutec giai đoạn của quaacute trigravenh ra quyết định tigravem hiểu thiết kế lựa chọn vagrave hiện thực 6 Phugrave hợp cho một số caacutec phong caacutech vagrave quaacute trigravenh ra quyết định 7 Coacute thể tiến hoacutea theo thời gian Người dugraveng coacute thể thecircm bỏ kết hợp thay đổi caacutec phần tử cơ bản của hệ thống 8 Dễ dugraveng vagrave thacircn thiện với người dugraveng 9 Nhằm vagraveo nacircng cao tiacutenh hiệu dụng của quyết định (chiacutenh xaacutec thời gian tiacutenh chất lượng) thay vigrave lagrave tiacutenh hiệu quả (giaacute phiacute của việc ra quyết định) 10 Người ra quyết định kiểm soaacutet toagraven bộ caacutec bước của quaacute trigravenh ra quyết định HHTQĐ chỉ trợ giuacutep khocircng thay thế người ra quyết định 11 Người dugraveng cuối cugraveng coacute thể tự kiến tạo vagrave sửa đổi caacutec hệ thống nhỏ vagrave đơn giản 12 Thường dugraveng mocirc higravenh để phacircn tiacutech caacutec tigravenh huống ra quyết định 13 Cung ứng caacutec truy đạt dữ liệu từ nhiều nguồn dạng thức vagrave kiểu khaacutec nhau 14 Coacute thể dugraveng như một cocircng cụ độc lập hay kết hợp với caacutec HHTQĐứng dụng khaacutec dugraveng đơn lẻ hay trecircn một mạng lưới maacutey tiacutenh (intranet extranet) bất kỳ với cocircng nghệ WEB
16Văn hoacutea tổ chứcVăn hoacutea của tổ chức lagrave tập hợp của rất nhiều thứ (lograveng tin biểu tượng đặc trưng regraven luyện) được phaacutet triển qua thời gian dagravei
Noacute gacircy ra ảnh hưởng mạnh mẽ cograven hơn cả những hoạt động của tổ chức đoacute 10 đặc điểm văn hoacutea của tổ chức
Điều khiển Hệ thống khen thưởng Sự đồng nhất Chịu đựng xung đột Mocirc higravenh giao tiếp Hỗ trợ quản lyacute Sự hogravea nhập Định hướng Chịu đựng rủi ro Caacute nhacircn khởi xướng
Mối quan hệ của văn hoacutea với hiệu năng lagravem việc1 tổ chức thagravenh cocircng phải coacute xu hướng hogravea hợp giữa văn hoacutea với mocirci trường trong vagrave ngoagravei tổ chức
Phugrave hợp trong nội bộ cho thấy một sự kết hợp giữa văn hoacutea của tổ chức với những cocircng nghệ của chiacutenh noacute
Phugrave hợp với becircn ngoagravei cho thấy một nền văn hoacutea phugrave hợp với chiến lược thị trường
Văn hoacutea vagrave sự thay đổi 1 tổ chức magrave khocircng biết thay đổi văn hoacutea sẽ khocircng thể giữ được vị triacute của migravenh trecircn thị trường Caacutec cocircng ty xuất sắc luocircn biết caacutech tiacutech cực tiếp cận khaacutech hagraveng động viecircn đầu tư
17Quyền lực vagrave chiacutenh trịQuyền lực vagrave chiacutenh trị luocircn đi liền với nhau
aQuyền lựclagrave khả năng ảnh hưởng đến việc phacircn phối caacutec nguồn lực trong tổ chứcGồm 5 yếu tố cơ bản
Phacircn quyền Uy quyền Quyền lực caacute nhacircn Sức ảnh hưởng Chiacutenh trị
Một vagravei thagravenh phần của quyền lực ra quyết định Quyết định việc nagraveo coacute sẵn
Quyết định sản phẩm nagraveo được sản xuất Quyết định đầu tư vagraveo đacircu Quyền đặt vagrave quản lyacute quản lyacute giaacute Thanh toaacuten vagrave khấu trừ tiền latildei
bChiacutenh trị Yếu tố cốt lotildei trong quaacute trigravenh higravenh thagravenh chiến lược ra quyết định Chiacutenh trị liecircn quan tới việc ra quyết định thocircng qua đagravem phaacutenảnh hưởngvagrave higravenh
thagravenh sự nhất triacute Trong nhiều trường hợp noacute coacute thể cho ta sự linh hoạt hơn
18Hệ trợ giuacutep quyết định trong tổ chức DSS của 1 tổ chức hỗ trợ cocircng nghệ tập trung vagraveo caacutec quyết định ảnh hưởng tới
rất nhiều người 1 hệ thống DSS hiện đại coacute thể chấp nhận nhiều quyết định vượt qua những giới
hạn phacircn cấp truyền thống aCaacutec hoạt động gần DSS
Giải quyết caacutec nhiệm vụ đặc biệt Thu thập thocircng tin Liecircn lạc qua caacutec chi nhaacutenh Động thaacutei chiacutenh trị
Phacircn loại tư duy chiến lược cho DSS Sắp xếp quyết địnhXếp hạng quyết định sao cho thứ tự đứng trước thigrave được
ưu tiecircn trước Chia sẻ thocircng tinCaacutec quyecirct định coacute thể độc lập nhưng người ra quyết định
phải chia sẻ caacutec thocircng tin liecircn quan Lựa chọn đagravem phaacutenVagravei quyết định coacute thể xaacutec lập thocircng qua đagravem phaacuten vagrave kết
quả được lagravem đồng thờiKhocircng phải cocircng nghệ tự noacute coacute thể đưa ra quyết định magrave noacute nằm ở trigravenh độ cocircng nghệ hỗ trợ caacutec chiến lược quyết định quyền lực vagrave chiacutenh trị cugraveng phối hợp với nhau
Chương 4Mocirc higravenh hoacutea quaacute trigravenh ra quyết định
(Cấu truacutec của hệ HTQD)19Vấn đề Mocirc higravenh
bull Lagrave phần tử chủ chốt trong hầu hết hệ hỗ trợ quyết định vagrave lagrave điều kiện cần trong hệ hỗ trợ quyết định dựa vagraveo mocirc higravenh (model-based DSS)
bull Coacute nhiều lớp mocirc higravenh kegravem theo lagrave caacutec kỹ thuật xử lyacute thao taacutec mocirc higravenh đặc thugrave tương ứng
bull Caacutec vấn đề chiacutenh nhận diện bagravei toaacuten vagrave phacircn tiacutech mocirci trường nhận diện biến số dự baacuteo đa mocirc higravenh caacutec phạm trugrave mocirc higravenh quản lyacute mocirc higravenh vagrave mocirc higravenh hoacutea dựa vagraveo kiến thức
bull Mocirc higravenh hoacutea lagrave taacutec vụ khocircng đơn giản Người xacircy dựng mocirc higravenh phải cacircn bằng giữa tiacutenh đơn giản của mocirc higravenh với caacutec yecircu cầu biểu diễn để mocirc higravenh coacute thể nắm bắt đủ thực tại cần thiết cho người ra quyết định
bull Mocirc phỏng lagrave kỹ thuật mocirc higravenh hoacutea thocircng dụng dugraveng để tigravem hiểu vấn đề tuy khocircng nhất thiết phải tigravem ra được caacutec giải phaacutep biến thể mở rộng quaacute trigravenh ra quyết định của tổ chức vagrave cho pheacutep tổ chức xem xeacutet taacutec độngảnh hưởng của caacutec chọn lựa tương lai
bull Mocirc phỏng tiết kiệm rất nhiều chi phiacute vagrave thời gian ndash rất dễ thay đổi mocirc higravenh hoạt động của một hệ thống vật lyacute bằng mocirc higravenh hoacutea maacutey tiacutenh
bull Mocirc higravenh coacute thể được phaacutet triển vagrave cagravei đặt bằng một số caacutec ngocircn ngữ lập trinh (thế hệ 3 4 ) vagrave hệ thống phần mềm khaacutec nhau
Mocirc higravenh tĩnh vagrave động
bull Mocirc higravenh tĩnh thể hiện bức tranh tại thời điểm của tigravenh huống Caacutec khiacutea cạnh của bagravei toaacuten được xeacutet một thời kỳ nhất định trong một khung thời gian nhất định (coacute thể ldquocuốnrdquo về tương lai) Caacutec tigravenh huống được giả sử lagrave sẽ lập lại với tập caacutec điều kiện đồng nhất
1048713 Giả định coacute được tiacutenh ổn định của dữ liệu 1048713 Mocirc phỏng quaacute trigravenh dạng tĩnh - lagravem việc trecircn caacutec trạng thaacutei ổn định để tigravem ra caacutec
thocircng số tối ưu ndash thường được dugraveng như cocircng cụ chủ yếu để thiết kế quaacute trigravenh 1048713 vd quyết định sản xuấtmua 1 sản phẩm baacuteo caacuteo thu nhập hagraveng quyacutenăm bull Mocirc higravenh động biểu diễn caacutec kịch bản thay đổi theo thời gian 1048713 Phụ thuộc thời gian caacutec trạng thaacutei thay đổi theo thời gian 1048713 Thường dugraveng để tạo sinh vagrave biểu diễn caacutec xu hướng vagrave khuocircn mẫu theo thời gian 1048713 Mocirc phỏng động thể hiện caacutec diễn tiến khi caacutec điều kiện theo thời gian khaacutec với caacutec
trạng thaacutei ổn định ndash thường được dugraveng để thiết kế việc kiểm soaacutet caacutec hệ thống 1048713 VD dự baacuteo lời-lỗ trong 5 năm với caacutec nhập lượng như giaacute phiacute số lượng thay đổi
theo từng năm
Mocirc higravenh chắc chắn tương đối dễ phaacutet triển giải quyết vagrave coacute thể sinh ra caacutec giải phaacutep tối ưu 1048713 Caacutec bagravei toaacuten coacute một số lớnvocirc hạn caacutec giải phaacutep khả thi đặc biệt quan trọng 1048713 Caacutec mocirc higravenh tagravei chaacutenh được xacircy dựng trong điều kiện chắc chắn
Mocirc higravenh bất địnhbằng caacutech thu thập thecircm thocircng tin cố gắng đưa bagravei toaacuten trở về dạng chắc chắn hay dạng
rủi ro Mocirc higravenh rủi ro caacutec quyết định kinh doanh được đưa ra dưới caacutec rủi ro giả định
1048713 Đocirci khi biết được xaacutec suất của caacutec sự kiện xảy ra trong tương lai 1048713 Caacutec trường hợp khaacutec (bất định) ước lượng caacutec rủi ro vagrave giả sử caacutec tigravenh huống rủi ro
xảy ra 20Mocirc higravenh hoacutea
MOcirc HIgraveNH HOacuteA BẰNG BẢNG TIacuteNH bull Bảng tiacutenh phần mềm mạnh linh hoạt vagrave dễ dugraveng cho pheacutep tạo sinh caacutec ứng dụng trong kinh doanh kỹ thuật toaacuten vagrave khoa học với tập caacutec hagravem mạnh về tagravei chaacutenh thống kecirc toaacuten bull Kegravem theo lagrave caacutec thagravenh phần cộng thecircm (add-ins) giuacutep xacircy dựng vagrave giải caacutec lớp mocirc higravenh đặc thugrave bull Lagrave cocircng cụ mocirc higravenh hoacutea thocircng dụng nhất của người dugraveng cuối cugraveng bull Coacute caacutec chức năng về phacircn tiacutech ldquowhat-ifrdquo dograve tigravem mục tiecircu quản lyacute dữ liệu vagrave lập trigravenh (dạng macro) bull Coacute khả năng đọc ghi caacutec cấu truacutec tập tin thocircng dụng để giao tiếp được với caacutec CSDL vagrave cocircng cụ khaacutec bull Coacute thể xacircy dựng mocirc higravenh tĩnh vagrave động bull Dugraveng trecircn maacutey tiacutenh caacute nhacircn vagrave maacutey tiacutenh lớn
bull Cơ sở để xacircy dựng caacutec bảng tiacutenh đa chiều vagrave caacutec cocircng cụ xử lyacute phacircn tiacutech trực tuyến (OLAP) MOcirc HIgraveNH HOacuteA BẰNG PHAcircN TIacuteCH QUYẾT ĐỊNH bull Tiếp cận mocirc higravenh hoacutea caacutec tigravenh huống quyết định coacute một số hữu hạnkhocircng quaacute nhiều caacutec phương aacuten ndash mỗi phương aacuten được trigravenh ra dưới dạng bảng hay đồ thị - caacutec kết quả tương ứng (dự baacuteo được kegravem xaacutec suất) theo mục tiecircu bagravei toaacuten ndash từ đoacute chọn phương aacuten tốt nhất bull Đơn mục tiecircu bảng quyết định hay cacircy quyết định bull Đa mục tiecircu AHP (analytic hierarchy process) khaacutec
MOcirc HIgraveNH HOacuteA BẰNG QUY HOẠCH TOAacuteN
bull Quy hoạch toaacuten học (mathematical programming) lagrave họ caacutec cocircng cụ giải quyết caacutec bagravei toaacuten quản lyacute theo đoacute người ra quyết định phải cấp phaacutet caacutec tagravei nguyecircn khan hiếm cho caacutec hoạt động cạnh tranh nhau (caacutec phương aacuten) nhằm tối ưu hoacutea mục tiecircu coacute khả năng đo lường được bull Caacutec mocirc higravenh quy hoạch tuyến tiacutenh (linear programming) thocircng dụng nhất trong quy hoạch toaacuten coacute nhiều ứng dụng trong thực tế được dugraveng nhiều trong caacutec hệ hỗ trợ quyết định bull Bagravei toaacuten quy hoạch tuyến tiacutenh 1048713 Caacutec biến quyết định (cần tigravem giaacute trị) 1048713 Hagravem mục tiecircu (hagravem toaacuten học dạng tuyến tiacutenh xaacutec định quan hệ giữa biến quyết định vagrave mục tiecircu đo lường mức độ đạt đạt mục tiecircu vagrave cần được tối ưu hoacutea) 1048713 Caacutec hệ số của hagravem mục tiecircu (cho biết mức đoacuteng goacutep vagraveo mục tiecircu của 1 đơn vị biến quyết định) 1048713 Ragraveng buộc (biểu thức tuyến tiacutenh cho biết giới hạn tagravei nguyecircn vagravehay caacutec quan hệ giữa caacutec biến số) 1048713 Dung lượng (mocirc tả cận trecircn vagrave dưới của caacutec biến vagrave ragraveng buộc) 1048713 Hệ số (cocircng nghệ) vagraveo-ra (cho biết mức độ sử dụng tagravei nguyecircn của biến quyết định) bull Đặc điểm của bagravei toaacuten quy hoạch tuyến tiacutenh 1048713 Tagravei nguyecircn kinh tế của bagravei toaacuten lagrave coacute hạn vagrave sẵn sagraveng 1048713 Coacute nhiều caacutech (gt2 caacutech) sử dụng tagravei nguyecircn được gọi lagrave giải phaacutep hay chương trigravenh 1048713 Mỗi hoạt động dugraveng tagravei nguyecircn đều sinh ra kết quả dưới dạng mục tiecircu đatilde phaacutet biểu trước 1048713 Việc cấp phaacutet nằm trong caacutec ragraveng buộc cho trước bull Giả định của bagravei toaacuten quy hoạch tuyến tiacutenh 1048713 Caacutec kết quả của caacutec cấp phaacutet coacute thể đem so saacutenh với nhau coacute thể đo lường bằng một đơn vị chung
1048713 Caacutec cấp phaacutet độc lập với nhau về mặt kết quả 1048713 Kết quả cuối cugraveng lagrave tổng của caacutec kết quả từ caacutec hoạt động riecircng rẽ khaacutec nhau 1048713 Dữ liệu coacute tiacutenh chắc chắn 1048713 Tagravei nguyecircn được dugraveng một caacutech kinh tế nhất 1048713 Thường coacute một số lớn caacutec giải phaacutep với kết quả khaacutec nhau 1048713 Trong số caacutec giải phaacutep coacute thể coacute 1 giải phaacutep tốt nhất ndash mức độ đạt được mục tiecircu cao nhất ndash gọi lagrave giải phaacutep tối ưu được tigravem ra bằng một giải thuật đặc biệt MOcirc HIgraveNH HOacuteA BẰNG HEURISTIC bull Việc tigravem giải phaacutep tối ưu của một số bagravei toaacuten quyết định phức tạp coacute thể tốn nhiều thời gian chi phiacute hay khocircng thể tigravem ra được Cograven nếu dugraveng tiếp cận mocirc phỏng cũng coacute thể keacuteo dagravei phức tạp khocircng thiacutech hợp hay thậm chiacute khocircng chiacutenh xaacutec
bull Lagrave một tiếp cận giuacutep tigravem ra caacutec giải phaacutep khả thithỏa matildenđủ tốt cho caacutec bagravei toaacuten phức tạp Coacute thể coacute giải phaacutep đủ tốt (90-999 giaacute trị của lời giải tối ưu) nhanh choacuteng vagrave đỡ tốn keacutem hơn bằng caacutech dugraveng heuristics bull Quaacute trigravenh heuristic lagrave datildey caacutec bước xacircy dựng caacutec quy luật giải quyết vấn đề thocircng qua việc tigravem kiếm caacutec con đường hứa hẹn nhất dẫn đến lời giải tigravem kiếm caacutech thức thu thập vagrave phacircn giải thocircng tin theo quaacute trigravenh giải vagrave phaacutet triền caacutec phương phaacutep dẫn đến một giải thuật tiacutenh toaacuten hay một lời giải tổng quaacutet đatilde coacute bull Aacutep dụng chủ yếu cho bagravei toaacuten cấu truacutec yếu cũng dugraveng để tigravem ra giải phaacutep chấp nhận được cho bagravei toaacuten cấu truacutec chặt bull Khocircng đủ tổng quaacutet như caacutec giải thuật thường chỉ dugraveng cho tigravenh huống đặc thugrave đang xeacutet bull Coacute thể dẫn đến một giải phaacutep dở - caacutec thủ tục từng bước giải quyết vấn đề khocircng đảm bảo tigravem ra giải phaacutep tối ưu bull Heuristic coacute thể lagrave định lượng vigrave vậy coacute thể đoacuteng vai trograve quan trọng trong cơ sở mocirc higravenh của hệ hỗ trợ quyết định bull Heuristic coacute thể lagrave định tiacutenh vigrave vậy coacute thể đoacuteng vai trograve quan trọng trong cung ứng kiến thức cho hệ chuyecircn gia bull Quaacute trigravenh heuristic liecircn quan đến tigravem kiếm học tập ước lượng phacircn xử vagrave lặp lại caacutec hoạt động nagravey dọc theo tiến trigravenh bull Kiến thức thu được dugrave thagravenh cocircng hay thất bại trong quaacute trigravenh đều được phản hồi vagrave sửa đổi chiacutenh quaacute trigravenh nhờ đoacute coacute thể định nghĩa lại mục tiecircu hay bagravei toaacuten 1048713 Giải thuật di truyền bắt đầu bằng tập caacutec giải phaacutep được sinh ngẫu nhiecircn taacutei kết hợp caacutec cặp giải phaacutep một caacutech ngẫu nhiecircn bull Tigravenh huống necircn dugraveng heuristics 1048713 Dữ liệu đầu vagraveo khocircng chiacutenh xaacutec hay coacute giới hạn 1048713 Thực tế quaacute phức tạp đến nỗi khocircng dugraveng được caacutec mocirc higravenh tối ưu 1048713 Chưa coacute được giải thuật chiacutenh xaacutec vagrave đủ tin cậy 1048713 Bagravei toaacuten phức tạp necircn sẽ khocircng kinh tế nếu dugraveng tối ưu hay mocirc phỏng hoặc tốn quaacute nhiều thời gian tiacutenh toaacuten 1048713 Coacute thể cải thiện tiacutenh hiệu quả của quaacute trigravenh tối ưu (tức coacute thể sinh ra caacutec giải phaacutep ban đầu tương đối tốt) 1048713 Liecircn quan đến xử lyacute kyacute hiệu chứ khocircng phải xử lyacute kyacute số (như hệ chuyecircn gia) 1048713 Cần coacute quyết định nhanh vagrave caacutec xử lyacute dựa vagraveo maacutey tiacutenh đều khocircng khả thi (một số heuristic khocircng cần đến maacutey tiacutenh) bull Thuận lợi 1048713 Dễ hiểu dễ giải thiacutech vagrave dễ cagravei đặt 1048713 Nacircng cao tiacutenh saacuteng tạo vagrave năng lực heuristic cho caacutec vấn đề khaacutec 1048713 Tiết kiệm thời gian xaacutec lập vấn đề 1048713 Tiết kiệm yecircu cầu về bộ chứa vagrave xử lyacute maacutey tiacutenh
1048713 Tiết kiệm thời gian tiacutenh toaacuten vagrave do vậy tiết kiệm thời gian thực trong ra quyết định Một số vấn đề phức tạp đến nỗi chỉ coacute thể giải được bằng heuristics 1048713 Thường sinh ra nhiều giải phaacutep chấp nhận được 1048713 Thường coacute thể phaacutet biểu lyacute thuyết hay đo lường thực nghiệm về chất lượng của giải phaacutep (tức giaacute trị mục tiecircu của giải phaacutep gần với giaacute trị tồi ưu đến mức nagraveo dugrave giaacute trị tối ưu chưa biết được) 1048713 Coacute thể kết hợp tiacutenh thocircng minh vagraveo để hướng dẫn pheacutep tigravem kiếm (tigravem kiếm tabu) Năng lực thocircng minh đoacute coacute thể lagrave đặc thugrave theo bagravei toaacuten hoặc dựa trecircn yacute kiến chuyecircn gia được cấy trong hệ chuyecircn gia hoặc cơ chế tigravem kiếm 1048713 Coacute thể dugraveng heuristic hiệu quả vagraveo caacutec mocirc higravenh coacute thể giải bằng quy hoạch toaacuten học Đocirci khi heuristic lagrave phương phaacutep được ưa thiacutech hơn khi khaacutec giải phaacutep heuristics được dugraveng như giải phaacutep ban đầu cho caacutec phương phaacutep quy hoạch toaacuten học bull Hạn chế 1048713 Khocircng đảm bảo coacute được giải phaacutep tối ưu 1048713 Caacutec quy luật coacute rất nhiều ngoại lệ 1048713 Caacutec lựa chọn quyết định tuần tự coacute thể khocircng tiecircn đoaacuten được caacutec kết cục tương lai của mỗi chọn lựa 1048713 Sự liecircn thuộc giữa caacutec phần trong hệ thống đocirci khi coacute thể gacircy ra caacutec ảnh hưởng lớn lao lecircn toagraven hệ thống bull Phacircn loại caacutec giải thuật heuristic 1048713 Heuristic xacircy dựng xacircy dựng giải phaacutep khả thi bằng caacutech cộng thecircm từng thagravenh phần một VD bagravei toaacuten người baacuten hagraveng ndash luocircn gheacute thagravenh phố chưa viếng thăm kế tiếp gần nhất
1048713 Heuristic cải tiến bắt đầu bằng một giải phaacutep khả thi vagrave cố gắng cải tiến liecircn tục trecircn đoacute VD trecircn thử hoaacuten đổi 2 thagravenh phố 1048713 Quy hoạch toaacuten aacutep dụng vagraveo caacutec mocirc higravenh chứa iacutet ragraveng buộc nhằm coacute được thocircng tin về thỏa hiệp tốt nhất với mocirc higravenh nguyecircn gốc Thường được dugraveng trong tối ưu hoacutea nguyecircn (integer optimization) 1048713 Chia giai đoạn giải quyết một vấn đề theo từng giai đoạn VD ở PampG trecircn đacircy bagravei toaacuten phacircn phối được giải quyết trước sau đoacute dugraveng giải quyết bagravei toaacuten chiến lược sản phẩm 1048713 Phacircn ratilde chia bagravei toaacuten thagravenh caacutec phần nhỏ hơn coacute thể giải quyết được sau đoacute kết hợp caacutec giải phaacutep đoacute lại VD chia latildenh thổ baacuten hagraveng thagravenh 4 vugraveng khaacutec nhau giải quyết cho từng vugraveng sau đoacute kết nối caacutec giải phaacutep
21Mocirc phỏngbull Giả định caacutec đặc điểm của thực tạibull Lagrave kỹ thuật tiến triển caacutec thực nghiệm (như phacircn tiacutech ldquowhat-ifrdquo) - bằng maacutey tiacutenh -trecircn một mocirc higravenh của hệ thocircng tin quản lyacute
bull Khocircng thực sự lagrave một mocirc higravenh vigrave khocircng biểu diễn thực tại magrave lagrave cố gắng bắtchước thực tạibull Một trong những phương phaacutep thocircng dụng nhất trong HHTQĐbull HHTQĐ lagravem việc với caacutec bagravei toaacuten phi cấu truacutec vagrave cấu truacutec yếu tigravenh huống thực tếphức tạp ndash khocircng dễ biểu diễn bằng mocirc higravenh tối ưu hay caacutec dạng mocirc higravenh khaacutecnhưng lại thường coacute thể xử lyacute được bằng mocirc phỏngbull Đặc điểm1048713 Iacutet đưa ra caacutec đơn giản hoacutea về thực tại hơn caacutec mocirc higravenh khaacutec1048713 Do triển khai caacutec thực nghiệm necircn noacute coacute thể kiểm thử caacutec giaacute trị cụ thể của caacutecbiến quyết địnhbiến khocircng kiểm soaacutet được của mocirc higravenh vagrave xem xeacutet ảnh hưởnglecircn caacutec biến kết quả1048713 Phương phaacutep coacute tiacutenh mocirc tả (như vậy khaacutec với phương phaacutep danh định)1048713 Khocircng tự động tigravem kiếm giải phaacutep tối ưu ndash noacute mocirc tảtiecircn đoaacuten caacutec đặc tiacutenh của hệthống đatilde cho dưới caacutec điều kiện khaacutec nhau từ đoacute coacute thể chọn ra phương aacuten tốtnhất1048713 Quaacute trigravenh mocirc phỏng thường lặp lại một thực nghiệm nhiều lần để coacute được ướclượng về hiệu ứng tổng quaacutet của một số hagravenh động nhất định1048713 Mocirc phỏng maacutey tiacutenh thiacutech hợp cho hầu hết caacutec tigravenh huống mặc dugrave cũng coacute một sốmocirc phỏng thủ cocircng thagravenh cocircng1048713 Thường chỉ được dugraveng khi bagravei toaacuten quaacute phức tạp khocircng thể xem xeacutet bằng caacutec kỹthuật tối ưu dạng số Tiacutenh phức tạp theo nghĩa bagravei toaacuten khocircng thể cocircng thức hoacuteacho tối ưu (do khocircng thotildea caacutec giả định) hoặc cocircng thức quaacute lớn quaacute nhiều tươngtaacutec giữa caacutec biến hoặc về bản chất bagravei toaacuten lagrave bất định hay rủi roPhương phaacutep mocirc phỏng thiết lập mocirc higravenh của hệ thống thực vagrave tiến hagravenh caacutec thựcnghiệm lặp lại trecircn mocirc higravenh
bull Thuận lợi1048713 Lyacute thuyết tương đối trực tiếp hiệu ứng dagravei hạn của nhiều chiacutenh saacutech -gt neacuten thờigian lớn1048713 Do tiacutenh chất mocirc tả (khaacutec với danh định)1048713 Coacute thể thấy được nhanh choacuteng coacute thể đặt ra caacutec cacircu hỏi ldquowhat-ifrdquo coacute thể dugravengtiếp cận thử-vagrave-sai vagraveo giải quyết vấn đề một caacutech nhanh choacuteng rẻ chiacutenh xaacutec iacutetrủi ro hơn1048713 Thử nghiệm được biến quyết định phần nagraveo của mocirci trường thực sự quan trọngvới caacutec phương aacuten khaacutec nhau1048713 Yecircu cầu kiến thức riecircng biệt về bagravei toaacuten vigrave thế buộc người xacircy dựng mocirc higravenh phảilagravem việc thường xuyecircn với nhagrave quản lyacute ndash đối tượng mong muốn của HHTQĐ để
từ đoacute bản chất bagravei toaacuten vagrave caacutec quyết định được hiểu tốt hơn1048713 Mocirc higravenh được xacircy dựng từ viễn cảnhcaacutech nhigraven của nhagrave quản lyacute1048713 Mocirc higravenh chỉ cho một bagravei toaacuten riecircng biệt thường khocircng thể dugraveng giải caacutec bagravei toaacutenkhaacutec Như vậy mỗi thagravenh phần của mocirc higravenh ứng với một phần của hệ thống thựcdo đoacute sẽ khocircng yecircu cầu nhagrave quản lyacute phải tổng quaacutet hoacutea caacutec hiểu biết của migravenh1048713 Phổ bagravei toaacuten giải được rất rộng tồn kho nhacircn sự hoạch định chiến lược 1048713 Coacute thể chứa caacutec phức tạp thực sự của bagravei toaacuten khocircng cần caacutec đơn giản hoacutea (TDdugraveng caacutec phacircn phối xaacutec suất thực thay vigrave phacircn phối lyacute thuyết xấp xỉ)1048713 Coacute thể tự động sinh ra nhiều đo lường hiệu năng quan trọng1048713 Thường lagrave phương phaacutep duy nhất của HHTQĐ coacute thể xử lyacute caacutec bagravei toaacuten tương đốiphi cấu truacutec1048713 Coacute một số caacutec goacutei phần mềm mocirc phỏng (Monte Carlo) tương đối dễ dugravengbull Điểm yếu1048713 Tuy thường tigravem được caacutec phương aacuten đủ tốt nhưng khocircng đảm bảo lời giải tối ưu1048713 Quaacute trigravenh xacircy dựng mocirc higravenh thường dagravei vagrave tốn keacutem1048713 Giải phaacutep vagrave suy diễn từ nghiecircn cứu mocirc phỏng thường khocircng thể chuyển sang bagraveitoaacuten khaacutec vigrave mocirc higravenh kết hợp caacutec yếu tố đặc thugrave1048713 Đocirci khi do mocirc higravenh quaacute dễ giải thiacutech cho nhagrave quản lyacute necircn caacutec phương phaacutep phacircntiacutech thường xem nhẹ1048713 Phần mềm mocirc phỏng đocirci khi yecircu cầu caacutec kỹ năng đặc biệt do độ phức tạp củaphương phaacutep giải higravenh thứcbull Caacutec loại mocirc phỏng1048713 Mocirc phỏng xaacutec suất một hay nhiều biến độc lập mang tiacutenh xaacutec suất với 2 loạiphacircn phối ndash thường dugraveng kỹ thuật Monte Carlo1048713 Phacircn phối rời rạc tigravenh huống coacute một số giới hạn caacutec biến cố (biến) với hữu hạncaacutec giaacute trị cho mỗi biến cố (biến)1048713 Phacircn phối liecircn tục tigravenh huống coacute số lượng khocircng giới hạn caacutec biến cố tuacircn theocaacutec hagravem mật độ xaacutec suất như phacircn phối chuẩn1048713 Mocirc phỏng độc lậpphụ thuộc theo thời gian1048713 Độc lập khocircng cần thiết phải biết chiacutenh xaacutec thời điểm xảy ra biến cố (nhu cầutiecircu thụ lượng sản phẩm trong ngagravey khocircng biết chiacutenh xaacutec thời điểm tiecircu thụ)1048713 Phụ thuộc cần biết chiacutenh xaacutec thời điểm xảy ra sự kiện (bagravei toaacuten hagraveng đợi)1048713 Mocirc phỏng tương taacutec trực quan1048713 Mocirc phỏng hướng đối tượng dugraveng tiếp cận hướng đối tượng để xacircy dựng mocirc higravenhmocirc phỏng Chuacute yacute ngocircn ngữ mocirc higravenh hoacutea nhất thể UML (unified modelinglanguage) kể cả khi mocirc phỏng caacutec hệ thời gian thựcMOcirc HIgraveNH HOacuteA ĐA CHIỀU ndash XỬ LYacute PHAcircN TIacuteCH TRỰC TUYẾNbull Người ra quyết định thường phải xem xeacutet nhiều chiều của dữ liệu (TD caacutec chiềucủa dữ liệu baacuten hagraveng lagrave sản phẩm vugraveng thời gian người baacuten ) dữ liệu cần đượcphacircn tiacutech trực tiếp bằng caacutec cocircng cụ chuẩn hay phacircn tiacutech tự động bằng caacutec
phương phaacutep khai mỏ dữ liệu (data mining)bull Hầu hết caacutec hệ thống phacircn tiacutech đa chiều được nhuacuteng trong caacutec hệ xử lyacute phacircn tiacutechtrực tuyến (HXLPTTT ndash online analytic processing - OLAP)bull Mục tiecircu của XLPTTT nắm bắt cấu truacutec của dữ liệu thực để hỗ trợ ra quyết địnhbull Trong HHTQĐ coacute sự gắn nối tự nhiecircn giữa mocirc higravenh hoacutea dữ liệu mocirc higravenh hoacutea kyacutehiệu vagrave caacutec khiacutea cạnh của phacircn tiacutech ldquowhat-ifrdquobull Caacutec baacuteo caacuteo của HXLPTTT đều coacute tiacutenh tương taacutec dễ khai thaacutec sử dụng đặc biệtphugrave hợp cho caacutec baacuteo caacuteo về chỉ số hiệu năng chủ yếu (key performance indicators- KPI) baacuteo caacuteo về đo lường hiệu năng kinh doanh bull Thế hệ hiện tại của HXLPTTT vagrave hệ khai mỏ dữ liệu (data mining) tiacutech hợp caacutecđặc tiacutenh của hệ thocircng tin latildenh đạo (executive information system ndashEIS- nhiềucaacutech nhigraven dữ liệu chi tiết hoacutea theo nhu cầu) vagrave caacutec hệ đồ họa khaacutec ndash thường coacutegiao diện người dugraveng dạng kiểu WEBbull Caacutec hệ thống như trecircn cograven được gọi lagrave caacutec cocircng cụ triacute tuệ kinh doanh (businessintelligence - BI) vigrave coacute caacutec đặc trưng về mocirc higravenh hoacutea vagrave tối ưu hoacutea nhưng lạitrong suốt đối với ngươigrave dugravengbull Hiện caacutec cocircng cụ được đưa ra bởi caacutec nhagrave cung cấp về CSDL về hoạch định tagraveinguyecircn tổ chức (ERP) về nhagrave kho dữ liệu (data warehouse) về HXLPTTT MOcirc HIgraveNH HOacuteA VAgrave MOcirc PHỎNG TƯƠNG TAacuteC TRỰC QUANbull Iacutech lợi Người ra quyết định tham gia vagraveo quaacute trigravenh phaacutet triển mocirc higravenh vagrave thựcnghiệm mocirc phỏng vigrave vậy sẽ tin tưởng khi sử dụng mocirc higravenhbull Mocirc higravenh hoacutea tương taacutec trực quan (visual interactive modeling - VIM) dugraveng caacutecbiểu diễn đồ họa maacutey tiacutenh để trigravenh bagravey caacutec ảnh hưởng của caacutec quyết định quản lyacutekhaacutec nhau ở một thời điểm (tĩnh) hay tiến triển theo thời gian (động với kỹ thuậthoạt higravenh)bull Mocirc phỏng tương taacutec trực quan (visual interactive simulation - VIS) cho pheacutepngười dugraveng theo dotildei tiến trigravenh xacircy dựng vagrave sử dụng khai thaacutec mocirc higravenh mocirc phỏngdưới dạng hoạt higravenhbull Mocirc higravenh hoacutea tương taacutec trực quan coacute thể kết hợp với tiếp cận triacute tuệ nhacircn tạo đểđưa ra caacutec khả năng mới thay đổi từ xacircy dựng hệ thống dạng đồ họa đến tigravem hiểuvề động học của hệ thốngbull Cần đến caacutec hệ thống maacutey tiacutenh xử lyacute song song tốc độ cao để xacircy dựng caacutec mocircphỏng - phức tạp quy mocirc lớn dạng hoạt higravenh - mang tiacutenh khả thi ở thời gian thực
22Caacutec dạng hệ thống hỗ trợ ra quyết địnhHệ hỗ trợ quyết định nhoacutemRa quyết định nhoacutem giao tiếp vagrave cộng taacutec- Caacutec đặc điểm của cocircng việc nhoacutem+ Một nhoacutem thực hiện một nhiệm vụ thỉnh thoảng ra quyết định thỉnh thoảngkhocircng ra quyết định+ Caacutec thagravenh viecircn trong nhoacutem coacute thể ở những nơi khaacutec nhau
+ Caacutec thagravenh viecircn trong nhoacutem coacute thể lagravem việc ở những thời gian khaacutec nhau+ Caacutec thagravenh viecircn trong nhoacutem coacute thể lagravem việc cugraveng nhau hoặc ở caacutec tổ chức khaacutecnhau+ Nhoacutem coacute thể vĩnh viễn hoặc tạm thời+ Nhoacutem coacute thể ở bất kỳ mức quản lyacute nagraveo hoặc mức thời gian nagraveo+ Coacute sự điều phối (quaacute trigravenh vagrave nhiệm vụ đạt được) hoặc macircu thuẩn trongnhoacutem+ Coacute sự đạt được hoặcvagrave mất maacutet năng suất trong tổ chức+ Nhiệm vụ phải hoagraven thagravenh rất nhanh+ Khocircng thể hoặc quaacute đắt cho tất cả caacutec thagravenh viecircn trong nhoacutem cugraveng hợp ở mộtnơi+ Một số dữ liệu thocircng tin hoặc kiến thức cần thiết nằm ở nhiều nơi một sốkhaacutec ở ngoagravei tổ chức+ Chuyecircn mocircn của caacutec thagravenh viecircn khocircng coacute trong nhoacutem lagrave cần thiết- Caacutec hoạt động vagrave caacutec quaacute trigravenh miecircu tả caacutec cuộc họp+ Cuộc họp lagrave hoạt động chung liecircn quan bởi một nhoacutem người coacute địa vị bằngnhau hoặc gần bằng nhau+ Kết quả của cuộc họp phụ thuộc một phần vagraveo kiến thức yacute kiến caacutec đaacutenh giaacutecủa caacutec thagravenh viecircn+ Kết quả của cuộc họp cũng phụ thuộc vagraveo sự kết hợp của nhoacutem vagrave phụ thuộcvagraveo quaacute trigravenh ra quyết định được sử dụng bởi nhoacutem đoacute+ Giải quyết caacutec yacute kiến khaacutec nhau bởi người coacute quyền hạn hoặc thương lượnghoặc phacircn xửHỗ trợ giao tiếp- Giao tiếp lagrave thagravenh phần quan trọng cho hỗ trợ quyết định Khocircng coacute giao tiếp thigravekhocircng coacute cộng taacutec Những người ra quyết định caacute nhacircn phải giao tiếp với caacutecđồng nghiệp chuyecircn gia cơ quan chiacutenh phủ khaacutech hagraveng đối taacutec kinh doanh hellipHọ cũng cần dữ liệu vagrave thocircng tin (vagrave kiến thức) từ nhiều nơi trecircn thế giới Caacutecnhoacutem ra quyết định phải giao tiếp cộng taacutec vagrave thương lượng trong cocircng việcHầu hết caacutec tổ chức sẽ nhanh trở thagravenh khocircng coacute chức năng nếu khocircng coacute caacutec hệthống giao tiếp Thương mại điện tử coacute thể hiệu quả chỉ qua caacutec kỹ thuật giao tiếphiện đại- Caacutec kỹ thuật thocircng tin hiện đại cung cấp caacutec phương tiện hỗ trợ giao tiếp rẻnhanh coacute khả năng coacute thể tin cậy Nền tảng hỗ trợ giao tiếp lagrave caacutec hệ thống maacuteytiacutenh mạng+ Bắt đầu bằng điện baacuteo điện thoại radio vagrave ti vi+ Trong 100 năm chuacuteng ta phaacutet triển maacutey fax thư điện tử chương trigravenh chatnhoacutem tin tức hệ thống hội nghị truyền higravenh Hầu hết caacutec kỹ thuật nagravey đềuhoạt động trecircn internet+ Sự phaacutet triển giao tiếp sau cugraveng lagrave hệ thống họp điện tử caacutec dịch vụ vagrave hệ
thống hội nghị điện tử thường sử dụng internet để kết nối caacutec người ra quyếtđịnh- Caacutec thuận lợi aacutep dụng caacutec phương phaacutep giao tiếp cải tiến trong caacutec tổ chức+ Cải tiến năng suất của nhacircn viecircn+ Liecircn quan đến nhiều người ra quyết định chiacutenh+ Khocircng quan tacircm nhiều đến đường biecircn giới địa lyacute+ Tạo nền văn hoacutea hợp taacutec nhất quaacuten+ Cải tiến chất lượng cuộc sống của nhacircn viecircnHỗ trợ cộng taacutec Maacutey tiacutenh hỗ trợ cộng taacutec- Khung thời giannơi chốn+ Sự hiệu quả của kỹ thuật tiacutenh toaacuten cộng taacutec phụ thuộc vagraveo vị triacute của caacutec thagravenhviecircn trong nhoacutem vagrave phụ thuộc vagraveo thời gian chia sẽ thocircng tin gởi vagrave nhận+ Chia sự giao tiếp thagravenh bốn ocirc vagrave tổ chức bốn ocirc dọc theo 2 chiều thời gian vagravenơi chốn1048713 Thời gian Khi gởi vagrave nhận thocircng tin hầu như đồng thời giao tiếp lagrave đồngthời Viacute dụ Điện thoại ti vi vagrave caacutec cuộc họp gặp mặt nhau Giao tiếp bấtđồng bộ xảy ra khi người nhận nhận thocircng tin ở thời điểm khaacutec thời điểmgởi thocircng tin đoacute1048713 Nơi chốn Người gởi vagrave người nhận coacute thể ở cugraveng phograveng hoặc khocircng+ Bốn ocirc lagrave1048713 Cugraveng thời giancugraveng nơi chốn Caacutec thagravenh viecircn gặp mặt nhau cugraveng một luacutecgiống như phograveng quyết định hoặc gặp mặt truyền thống1048713 Cugraveng thời giankhaacutec nơi chốn Caacutec thagravenh viecircn ở caacutec nơi khaacutec nhau nhưnggiao tiếp cugraveng nhau Viacute dụ hội nghị truyền higravenh (videoconferencing)1048713 Khaacutec thời giancugraveng nơi chốn Nhiều người lagravem việc theo ca Ca nagravey để lạithocircng tin cho ca khaacutec1048713 Khaacutec thời giankhaacutec nơi chốn Caacutec thagravenh viecircn ở caacutec nơi khaacutec nhau Caacutecthagravenh viecircn nagravey gởi vagrave nhận thocircng tin ở những lần khaacutec nhau
23Thực thi hệ DSSHệ thống hỗ trợ quản lyacute (MSS) khocircng phải luacutec nagraveo cũng luocircn thagravenh cocircng Nhiều trường hợpthất bại của ES khocircng hoagraven toagraven lagrave lyacute do kỹ thuật Thực thi hệ thống lagrave một quaacute trigravenh liecircn tụcnhằm đảm bảo cho tổ chức chuẩn bị tiếp nhận một hệ thống mới vagrave đưa hệ thống vagraveo sử dụngthagravenh cocircngThực hiện cocircng nghệ hệ thống hỗ trợ quản lyacute lagrave việc phức tạp vigrave caacutec hệ thống nagravey khocircng đơnthuần lagrave hệ thống thocircng tin chỉ thu thập thao taacutec vagrave phacircn phối thocircng tin Magrave xa hơn chuacuteng
liecircn quan tới caacutec cocircng việc coacute thể lagravem thay đổi đaacuteng kể caacutech thức hoạt động của tổ chức Tuyvậy đa số caacutec yếu tố thực thi đều liecircn quan tới hệ thống thocircng tinThực thi MSS lagrave quaacute trigravenh liecircn tục diễn ra trong suốt thời gian phaacutet triển hệ thống từ đề xuấtban đầu đến nghiecircn cứu khả thi thiết kế vagrave phacircn tiacutech hệ thống lập trigravenh huấn luyện chuyểnđổi vagrave lắp đặt Caacutec chuyecircn gia hệ thống thocircng tin thường gọi thực thi lagrave giai đoạn cuối trongvograveng đời hệ thống Định nghĩa thực thi MSS phức tạp hơn vigrave bản chất lặp của sự phaacutet triểncaacutec hệ thống
THỰC THI KHOcircNG HOAgraveN CHỈNHCaacutec quyết định về tiacutenh khả thi thường coacute giả định về lợi iacutech đạt được khi kế hoạch thực thiđược thực hiện hoagraven toagraven Trong thực tế thường chỉ thực hiện 90 thậm chiacute 70 phần trăm sovới phacircn tiacutech khả thi Lyacute do lagrave sự thay đổi tại một nơi trong hệ thống coacute thể ảnh hưởng vagrave coacutethể taacutec động tiecircu cực đến chỗ khaacutec Do vậy cấp quản lyacute coacute thể bỏ những phần trong dự aacuten coacutethể gacircy ra taacutec động xấu Do đoacute dự aacuten sẽ thực hiện iacutet hơn 100 so với dự aacuten kế hoạch Caacutec lyacutedo khaacutec coacute thể lagrave do khấu trừ ngacircn saacutech hoặc vượt chi phiacuteĐAacuteNH GIAacute SỰ THAgraveNH COcircNG CỦA THỰC THI HỆ THỐNGPhải coacute caacutec chỉ số đo lường thigrave mới coacute thể đaacutenh giaacute sự thagravenh cocircng khi thực thi một hệ thốngDickson va Powers (1973) đề ra 5 tiecircu chuẩn độc lậpbull Tỷ lệ thời gian thực hiện dự aacuten với thời gian ước lượngbull Tỷ lệ chi phiacute thực tế vagrave ngacircn saacutech thực hiệnbull Thaacutei độ của cấp quản lyacute đối với hệ thốngbull Nhu cầu thocircng tin của caacutec nhagrave quản lyacute được đaacutep ứng như thế nagraveo qua hệ thốngbull Taacutec động của dự aacuten đối với những hoạt động maacutey tiacutenh trong cocircng tyCaacutec đo lường khaacutec để đaacutenh giaacute thagravenh cocircng của hệ hỗ trợ quản lyacute (MSS)bull Sự sử dụng hệ thống (dự định dugraveng hoặc thực sự dugraveng)bull Thỏa matilden của người dugravengbull Thaacutei độ taacuten thagravenhbull Mức độ hệ thống hoagraven thagravenh caacutec mục tiecircu ban đầubull Phần thưởng đối với tổ chức (giảm chi phiacute tăng doanh thuhellip)bull Tỷ số lợi iacutech chi phiacute
bull Mức độ thể chế hoacutea của MSS trong tổ chứcDo bởi tiacutenh đa dạng của DSS necircn việc đaacutenh giaacute sự thagravenh cocircng của hệ nagravey cũng khoacute khăn tuynhiecircn cũng coacute thể coacute một số yếu tố giuacutep cho DSS thagravenh cocircng như sự tham gia người dugravenghuấn luyện người dugraveng hỗ trợ quản lyacute cấp cao nguồn thocircng tin đặc điểm của những nhiệmvụ coacute liecircn quan (cấu truacutec bất định độ khoacute phụ thuộc)
Chương5Nhoacutem hỗ trợ quyết định vagrave nhoacutemcocircng nghệ phần mềm
51Nhoacutem tạo quyết định
MDM-Holsapple đatilde gợi yacute chuacuteng ta sử dụng giới hạn người tạo quyết định
Một nhoacutem lagrave kết cấu MDM nơi magrave nhiều người ra quyết định hoagraven toagraven tương taacutec
Một đội lagrave kết cấu MDM nơi caacutec thagravenh viecircn tư vấn cho người đưa ra quyết định nhưng khocircng tương taacutec
Một Ủy ban lagrave kết cấu MDM với một người tạo quyết định duy nhất vagrave sự tương taacutec giữa caacutec thagravenh viecircn
Mạng thocircng tin
Mạng lưới baacutenh xe mỗi người tham gia coacute thể giao tiếp với người đưa ra quyết định ở trung tacircm nhưng khocircng phải với người tham gia khaacutecCấu truacutec nagravey lagrave khocircng thỏa matilden tất cả những người tham gia ngoại trừ người ra quyết định
Mạng dacircy chuyền Tham gia chuyển tiếp thocircng tin chỉ để noacute luocircn liền kề nhau trong chuỗi
Thagravenh viecircn cuối cugraveng ko được đaacutep ứng
Mạng vograveng trograven Tương tự như chuỗi nhưng kết thuacutec được kết nối
Mạng kết nối hoagraven toagraven khocircng coacute hạn chế về giao tiếp vagrave tương taacutec giữa caacutec thagravenh viecircnNoacutei chungnoacute đaacutep ứng hầu hết caacutec kết nối của người tham gia nhưng truyền đạt thocircng tin mất nhiều thời gian vagrave coacute nhiều cơ hội xảy ra lỗi
Nhoacutem hagravenh vi vagrave chuẩn mực
MDMs thiết lập caacutec chỉ tiecircu hướng dẫn quaacute trigravenh ra quyết định
Một chuẩn mực quy định cụ thể những gigrave thagravenh viecircn trong nhoacutem dự kiến sẽ lagravem trong những hoagraven cảnh nhất định
Quy tắc gửi coacute thể được thocircng qua viacute dụ đaacutenh giaacute ngang hagraveng hoặc xử phạt
Lagravem thế nagraveo để đưa ra quyết định
Việc chọn lựa magrave trong đoacute việc sử dụng cấu truacutec MDM phải được dựa trecircn một số yếu tố liecircn quan với bối cảnh quyết định
Viacute dụmột cấu truacutec riecircng lẻ sẽ lagravem việc nơi magrave quyết định được cấu truacutec cao vagrave thocircng tin lagrave coacute sẵn
Một ủy ban cơ cấu sẽ lagrave sự lựa chọn khi người ra quyết định khocircng thể đưa ra quyết định một migravenh
52Caacutec vấn đề thường gặp trong nhoacutem
Kiacutech thước Noacutei chung sự nhất triacute vagrave gắn kết giữa caacutec thagravenh viecircn tỉ lệ nghịch với phạm vi nhoacutem Trong nhoacutem lớn rất dễ higravenh thagravenh caacutec nhoacutem nhỏ vagrave hoạt động rời rạc
Tư duy tập thể Trong nhoacutem lớn mọi người coacute xu hướng suy nghĩ đểđạtđược sự nhất triacute necircn khocircng phaacutet huy được sự saacuteng tạo
Caacutec vấn đề về xatilde hội
Xung đột Trong 1 nhoacutem ai cũng muốn migravenh lagrave giỏi nhất necircn dễ dẫn đến xung đột
Ẩn danh(Giấu tecircn) Đacircy lagrave phương phaacutep được sử dụng để kiểm soaacutet xung đột Cho caacutec thagravenh viecircn tham gia ẩn danh
Vấn đề giới tiacutenh Nam vagrave nữ thường coacute những thế mạnh khaacutec nhau điều nagravey coacute thể lagrave sức mạnh trong 1 thiết lập MDM
Đagravem phaacuten vagrave quyết định
Một quyết định coacute thể liecircn quan đến nhiều quan điểm khaacutec nhau vigrave thế cần phải coacute sự đagravem phaacuten
Caacutec thiết kế của cơ chế hỗ trợ cho MDM phải phugrave hợp với caacutec hoạt độngđagravemphaacuten
Những hoạt động nagravey bao gồm việc thu nhận yacute kiến của caacutec thagravenh viecircn 1 caacutech cocircng bằng
53Cocircng nghệ hỗ trợ MDM
Organizational DSSndash 1 hệ thống cung cấp caacutec quyết định hỗ trợ
Group Support Systemndash Cocircng nghệ sử dụng sự hỗ trợ của nhiều becircn tham gia
Group DSS ndash Lagrave 1 hệ thống được thiết kế đặc biệt để hỗ trợ cho MDM
DSS ndash Lagrave 1 hệ thống dưới sự kiểm soaacutet của 1 người quyết định hệ thống nagravey cung cấp 1 bộ cocircng cụ giuacutep phacircn tiacutech hoagraven cảnh đểđưa ra quyết định vagrave nacircng cao hiệu quả của quyết địnhđoacute
53Cocircng nghệ hỗ trợ MDM
Organizational DSSndash 1 hệ thống cung cấp caacutec quyết định hỗ trợ
Group Support Systemndash Cocircng nghệ sử dụng sự hỗ trợ của nhiều becircn tham gia
Group DSS ndash Lagrave 1 hệ thống được thiết kế đặc biệt để hỗ trợ cho MDM
DSS ndash Lagrave 1 hệ thống dưới sự kiểm soaacutet của 1 người quyết định hệ thống nagravey cung cấp 1 bộ cocircng cụ giuacutep phacircn tiacutech hoagraven cảnh đểđưa ra quyết định vagrave nacircng cao hiệu quả của quyết địnhđoacute
Mục tiecircu của cocircng nghệ hỗ trợ MDM
Quy trigravenh hỗ trợ tập trung vagraveo quaacute trigravenh tạo điều kiện thuận lợi cho sự tương taacutec
Cơ chế cấu truacutec quaacute trigravenh chi phối caacutec hoạt động truyền thocircng
Nhiệm vụ hỗ trợ cocircng việc coacute thể chọn lựa tổ chức hoặc lấy thocircng tin
Nhiệm vụ cấu truacutec cocircng việc cho pheacutep truy cập đến kỹ thuật lọc kết hợp phacircn tiacutech kiến thức liecircn quan đến cocircng việc
Caacutec lớp loại cocircng nghệ hỗ trợ MDM
Phacircn loại theo đặc điểm do DeSanctis vagrave Gallupe đưa ra đề xuất một chương trigravenh ba cấp dựa trecircn caacutec tiacutenh năng được cung cấp
Hệ thống cấp 1 Mục điacutech chiacutenh lagrave tạo điều kiện thocircng tin liecircn lạc giữa caacutec thagravenh viecircn
Hệ thống cấp 2 Thiết kế để giảm thiểu rủi ro
Hệ thống cấp 3 Giuacutep điều chỉnh xử lyacute quyết định
Phacircn loại theo cocircng nghệ -Kraemer vagrave King tập trung vagraveo cocircng nghệ aacutep dụng
Cocircng nghệ bảng mạch điện tử
Hội nghị trực tuyến
Mạng lưới tập đoagraven
Trung tacircm thocircng tin
Mocirci trường cộng taacutec
Phograveng quyết định
Nhoacutem phần mềm
Phần mềm được thiết kế để hỗ trợ sự hợp taacutec bao gồm việc thu huacutet vagrave lưu trữ thocircng tin
Caacutec tổ chức dẫn đầu thị trường hiện tại lagrave Lotus Notes and Domino Microsoft Exchange Novell GroupWise and Oracle Office
Caacutec cocircng cụ trong một bộ phần mềm bao gồm người quản lyacute hội nghị (Lotus Sametime) vagrave trao đổi thocircng điệp (Lotus Notes Mail)
Xếp hạng phần mềm cho nhoacutem
Ellis vv đề xuất một hệ thống xếp hạng dựa vagraveo kiểu sự hỗ trợ noacute Cung cấp
Hệ thocircng điệp
Hệ thống hội thảo truyền higravenh
Hệ thống cộng taacutec soạn thảo
Nhoacutem phacircn phối giải phaacutep phần mền
Hệ thống phối hợp
Hệ thống thocircng minh đại diện
Lực lượng điều khiển phaacutet triển phần mềm cho nhoacutem
Một số nhacircn tố chiacutenh bao gồm
Tăng năng suất
Giảm số lượng caacutec cuộc họp
Tăng cường tự động hoacutea caacutec quy trigravenh lagravem việc thường xuyecircn
Cần phối hợp toagraven cầu tốt hơn
Tiacutenh sẵn sagraveng của những mạng lan rộng
Coleman vagrave Khanna liệt kecirc 10 nhacircn tố khaacutec
54Quản lyacute hoạt động MDM (Mobile Device Management - Quản lyacute thiết bị di động)
Một số phương phaacutep phối hợp phổ biến hơnMDM lagrave
Kỹ thuật nhoacutem định danh
Kỹ thuật Delphi
Sự phacircn xử
Hệ thocircng tin dựa trecircn vấn đề
Nemawashi
Kỹ thuật nhoacutem định danh
1-Mỗi người tham gia viết ra những yacute tưởng về những gigrave necircn quyết định
2-Lần lượt mỗi người tham gia trigravenh bagravey yacute tưởng của migravenh được ghi lại trecircn bảng Khocircng thảo luận ở đacircy
3-Sau khi tất cả caacutec yacute tưởng được trigravenh bagravey caacutec đại biểu coacute thể chất vấn những người khaacutec
4-Mỗi người tham gia bỏ phiếu cho mỗi yacute tưởng
Kỹ thuật Delphi
Về cơ bản tương tự như kỹ thuật nhoacutem định danh ngoại trừ những người khocircng bao giờ tham gia cuộc họp
Một cocircng cụ khảo saacutet được sử dụng để thu thập đầu vagraveo ban đầu từ caacutec thagravenh viecircn
Một cuộc khảo saacutet thứ hai được gửi đi với một bản toacutem tắt caacutec kết quả chung
Những bước lặp lại cho đến khi đạt được một sự đồng thuận hoặc nhigraven nhận của đa số
Sự phacircn xử(Arbitration )
Thiacutech hợp nhất khi caacutec thagravenh viecircn của MDM đại diện cho caacutec yếu tố đối lập
Những người tham gia đồng yacute rằng nếu lựa chọn thay thế hai becircn thỏa thuận khocircng được tigravem thấy thigrave một trọng tagravei viecircn becircn ngoagravei sẽ tham gia
Trọng tagravei sau đoacute lựa chọn thay thế ocircng hoặc xeacutet thấy thiacutech hợp nhất
Hệ thống thocircng tin dựa trecircn vấn đề (IBIS)
Lagrave một phương phaacutep lập luận cấu truacutec
Một đại diện cho IBIS lagrave một đồ thị với caacutec nuacutet vagrave caacutec liecircn kết
IBIS bắt đầu với lựa chọn của một nuacutet vấn đề gốc sau đoacute caacutec nuacutet vị triacute khaacutec nhau được liecircn kết với nuacutet gốc
Caacutec nuacutet vị triacute nagravey sau đoacute được đaacutenh giaacute dựa trecircn những lập luận gắn liền với chuacuteng
Nemawashi (được sử dụng rộng ratildei tại Nhật Bản)
1-Một hoặc nhiều thagravenh viecircn của MDM được chỉ định lagrave điều phối viecircnCaacutec điều phối viecircn sau đoacute chọn người tham gia cograven lại
2-Điều phối viecircn xacircy dựng một tổng hợp caacutec sự lựa chọn vagrave sau đoacute caacutec chuyecircn gia đaacutenh giaacute caacutec lựa chọn
3-Điều phối viecircn lựa chọn một sự lựa chọn dựa trecircn kết quả ở trecircn(ở 2)
4-Sự thay thế được luacircn chuyển điều phối viecircn tigravem kiếm sự đồng thuận thocircng qua sự thuyết phục vagrave đagravem phaacuten
5-Nếu đạt được sự đồng thuận điều phối viecircn cho lưu thocircng một tagravei liệu magrave mỗi thagravenh viecircn MDM để lại dấu hiệu trecircn đoacute
55Nơi lagravem việc ảo
Nhiều tổ chức trecircn toagraven thế giới kinh doanh bất động sản cho cocircng nghệ hợp taacutec
Cocircng việc được trở thagravenh một điều bạn lagravem hơn lagrave một nơi bạn đi
Những thay đổi lớn nhất mang lại bởi nơi lagravem việc ảo coacute thể lagrave về văn hoaacute hay xatilde hội hơn lagrave về cocircng nghệ
Chương 6 Hệ thống thocircng tin điều hagravenh
61 Yacute nghĩa của EIS- Hệ thống thocircng tin điều hagravenh
- EIS lagrave một dạng đặc biệt của DSS được thiết kế để hỗ trợ ra quyết định ở cấp cao nhất của một tổ chức
- Lagrave một hệ thống thocircng tin hỗ trợ nhu cầu lập kế hoạch vagrave đaacutenh giaacute của caacutec nhagrave quản lyacute điều hagravenh
- EIS coacute thể giuacutep một CEO coacute được bức tranh tổng thể chiacutenh xaacutec nhất về caacutec hoạt động vagrave một bản toacutem tắt những gigrave magrave đối thủ cạnh tranh đang lagravem
- Caacutec hệ thống nagravey noacutei chung hoạt động dễ dagraveng vagrave trigravenh bagravey thocircng tin theo những caacutech dễ hiểu để việc tiếp thu được nhanh choacuteng (biểu đồ đồ thịhellip)
(Tagravei liệu thecircm EIS lagrave những loại hệ thống lagrave rất phức tạp trong tự nhiecircn Coacute thể noacutei hệ thống nagravey cũng cung cấp cho caacutec nhagrave quản lyacute với caacutec thiết bị coacute khả năng ra quyết định bằng caacutech sử dụng của noacute Hệ thống nagravey hoạt động trong điều kiện như vậy quan trọng như trong caacutec hệ thống khaacutec khocircng hỗ trợ Khả năng lưu trữ dữ liệu nặng lagravem cho noacute lyacute tưởng để được thocircng qua khocircng chỉ bởi caacutec doanh nghiệp lớn magrave cograven bởi caacutec doanh nghiệp nhỏ hơn Nhigraven chung hệ thống nagravey lagrave dagravenh cho caacutec nhacircn viecircn cấp cao hỗ trợ thagravenh thạo trong việc đưa ra caacutec quyết định quan trọng)
Caacutec phiecircn EIS tiecircu biểu- Phiecircn lagravem việc coacute thể bắt đầu với một baacuteo caacuteo về tigravenh higravenh tagravei chiacutenh vagrave kinh
doanh của một cocircng ty caacutec chỉ số hoạt động quan trọng được hiển thị rotilde ragraveng- EIS sẽ cho pheacutep caacutec giaacutem đốc điều hagravenh coacute thể đi sacircu vagraveo dữ liệu từ những con
số bất kỳ magrave noacute hỗ trợ- Việc điều hagravenh coacute thể lựa chọn một mức độ chi tiết ( VD danh số baacuten hagraveng) nếu
như cần điều tra thecircm- Lagrave một phương phaacutep tiếp cận coacute thể giuacutep việc ra quyết định tốt hơn
Những điều magrave EIS ko coacute- EIS khocircng phải lagrave sự thay thế cho caacutec hệ thống dựa trecircn caacutec maacutey tiacutenh khaacutec EIS
thực sự chỉ cung cấp dữ liệu cho caacutec hệ thống nagravey- Noacute khocircng thể biến caacutec bộ hệ điều hagravenh của maacutey tiacutenh thagravenh những ldquochuyecircn viecircn
giỏirdquo- Coacute thể được viacute một caacutech cao hơn như lagrave một trợ lyacute đaacuteng tin cậy coacute thể được gọi
đến bất khi nagraveo vagrave mỗi khi cần thiết
Tagravei liệu thecircm Sự khaacutec nhau giữa EIS vagrave DSS+ EIS thiết kế để hỗ trợ những người điều hagravenh cấp cao giuacutep họ khaacutem phaacute caacutec vấn đề vagrave caacutec cơ hội DSS hỗ trợ những nười phacircn tiacutech cố gắng trả lời cacircu hỏi caacutei gigrave coacute thể lagravem cugraveng với một cơ hội hoặc một vấn đề
Chiều EIS DSSNhững người sử dụng thocircng thường
Duyệt dữ liệu đi xuống truy xuất trạng thaacutei
Hỗ trợ phacircn tiacutech vagrave quyết định
Sự thuacutec đẩy Tiacutenh thiacutech hợp Tiacutenh hiệu quảỨng dụng Queacutet mocirci trường đaacutenh giaacute
hiệu suất nhận dạng caacutec vấn đề vagrave caacutec cơ hội
Caacutec quyết định quản lyacute trecircn caacutec lĩnh vực đa dạng
Hỗ trợ quyết định Caacutec chiacutenh saacutech caacutec quyết định khocircng coacute cấu truacutec ở mức cao vagrave hỗ trợ giaacuten tiếp
Hỗ trợ caacutec quyết định lặp lại caacutec quyết định khocircng thể đoaacuten trước ra quyết định khocircng coacute cấu truacutec vagrave baacuten cấu truacutec
Loại thocircng tin Caacutec thocircng tin tin tức thocircng tin becircn ngoagravei về khaacutech hagraveng đối thủ cạnh tranh mocirci trường caacutec baacuteo caacuteo theo yecircu cầu vagrave định thời về caacutec hoạt động becircn trong
Caacutec thocircng tin hỗ trợ caacutec tigravenh huống đặc biệt
Sử dụng coacute nguyecircn tắc
Dograve theo vết vagrave điều khiển nhận dạng cơ hội
Hoạch định tổ chức phacircn nhoacutem vagrave điều khiển
Khả năng phugrave hợp với những người sử dụng caacute nhacircn
Thiết kế loại ra quyết định cho mỗi người điều hagravenh caacute nhacircn bằng nhiều lựa chọn đầu ra
Cho pheacutep caacutec đaacutenh giaacute caacute nhacircn caacutec khả năng what-if lựa chọn loại hộp hội thoại
Đồ họa Phải coacute Lagrave một phần quan trọng của nhiều DSS
Thacircn thiện người sử dụng
Phải coacute Phải coacute nếu khocircng coacute người sử dụng trung gian
Xử lyacute thocircng tin Lọc neacuten thocircng tin dograve theo vết dữ liệu vagrave thocircng tin quan trọng
EIS kiacutech thiacutech caacutec cacircu hỏi caacutec cacircu trả lời bằng caacutech sử dụng DSS vagrave phản hồi lại EIS
Hỗ trợ caacutec thocircng tin chi tiết
Truy xuất thường xuyecircn caacutec mức chi tiết của bất kỳ thocircng tin tổng hợp nagraveo (duyệt dữ
Coacute thể coacute trong DSS nhưng khocircng thường
liệu chi tiết)Cơ sở mocirc higravenh Caacutec chức năng coacute sẵn bị hạn
chếLagrave điểm cốt lotildei của DSS
Cấu truacutec Theo người baacuten sản phẩm hoặc theo caacutec chuyecircn gia hệ thống thocircng tin
Theo người sử dụng hoặc caacute nhacircn hoặc caacutec chuyecircn gia từ caacutec trung tacircm thocircng tin hoặc phograveng ban hệ thống thocircng tin
Phần cứng Mainframe caacutec trạm RISC mạng LANs hoặc caacutec hệ thống phacircn bố
Mainframe caacutec trạm RISC caacutec maacutey PC hoặc caacutec hệ thống phacircn bố
Bản chất caacutec goacutei phần mềm
Truy xuất tương taacutec dễ dagraveng đến nhiều cơ sở dữ liệu truy xuất trực tuyến caacutec khả năng DBMS phức tạp caacutec liecircn kết phức tạp
Caacutec khả năng tiacutenh toaacuten lớn caacutec ngocircn ngữ mocirc higravenh mocirc phỏng ứng dụng vagrave caacutec bộ tạo DSS
Bản chất caacutec thocircng tin
Trigravenh bagravey thocircng tin được phaacutet sinh trước về quaacute khứ vagrave hiện tại tạo caacutec thocircng tin mới về quaacute khứ hiện tại tương lai
Tạo thocircng tin mới về quaacute khứ hiện tại tương lai
62 Lịch sử EIS- EIS xuất hiện lần đầu tiecircn tại MIT vagraveo những năm 1970
- Những EIS đầu tiecircn được phaacutet triển bởi caacutec doanh ngiệp lớn sẵn sagraveng chấp nhận rủi ro để đạt được lợi thế cạnh tranh
- Vagraveo những năm 1980 caacutec nhagrave cung cấp đatilde phaacutet triển một số cơ sở khaacutech hagraveng rộng vagrave cocircng nghệ EIS được tiếp tục phaacutet triển cho đến ngagravey nay
(Tagravei liệu thecircm Sử dụng DSSEIS cho phaacutet triển bền vững + Một số nghiecircn cứu đatilde được tiến hagravenh để kiểm tra việc thực hiện của EIS trong khu vực cocircng cộng vagrave chiacutenh phủ caacutec nước tổ chức kể từ khi chuacuteng được phaacutet triển theo định hướng lợi nhuận cho caacutec cocircng ty tư nhacircn (Hasan vagrave Hasan năm 1997) Theo một nghiecircn cứu tiến hagravenh tại Mỹ ở hơn 300 cocircng ty kết quả cho thấy sự khaacutec biệt của EIS giữa tư nhacircn vagrave chiacutenh phủ một số kết quả thuacute vị được phaacutet hiệnViacute dụ khoacute khăn hơn để chuyển tiền từ một tagravei khoản khaacutec trong một EIS của chiacutenh phủ cũng lagrave khoacute khăn hơn để biện giải thiacutech cho những chi phiacute phaacutet triển EIS của chiacutenh phủ Một nghiecircn cứu khaacutec được tiến hagravenh ở Australia
cho thấy rằng EIS cung cấp cho quản lyacute một higravenh ảnh chiacutenh xaacutec hơn về tổ chức thực hiện vagrave cung cấp hỗ trợ cho caacutec lợi iacutech chiến lược cải thiện khocircng chỉ cho caacutec nhagrave quản lyacute nhưng cograven cho phần cograven lại của tổ chức Dựa trecircn caacutec hệ thống được thiết kế cho caacutec cocircng ty tư nhacircn với một caacutech rotilde ragravengxaacutec định mục tiecircu EIS lagrave thiacutech hợp cho caacutec tổ chức cocircng cộng hiện đại nhưng cần phải được linh hoạt hơn vagrave kết thagravenh chugravem một phạm vi rộng hơn khả năng vagrave phương tiện hơn so với khu vực tư nhacircn ban đầu theo định hướng sản phẩm (Hasan vagrave Hasan năm 1997) Điều nagravey coacute thể lagrave do thực tế rằng caacutec hoạt động khu vực cocircng lagrave bắt buộc coacute taacutec động rộng phải đaacutep ứng sự mong đợi duy nhất cocircng cộng thường coacute mục tiecircu mơ hồ vagrave macircu thuẫn iacutet quyền tự chủ vagrave kiểm soaacutet việc ra quyết định vagrave nhacircn viecircn lagrave khoacute khăn hơn (Watson vagrave Carte2000) + Toacutem lại EIS lagrave một khaacutei niệm thagravenh cocircng noacute phaacutet triển qua nhiều năm tuy nhiecircn EIS khắc phục khiếm khuyết của migravenh bằng caacutech tiến hagravenh nghiecircn cứu liecircn tục)
63 Tại sao những người điều hagravenh hagraveng đầu lại khaacutec nhau- Họ lagrave những doanh nghiệp theo định hướng coacute suy nghĩ
- Coacute một khoảng khocircng gian rộng để kiểm soaacutet
- Họ chịu traacutech nhiệm cho việc thiết lập chiacutenh saacutech
- Họ đại diện cho tổ chức mocirci trường becircn ngoagravei
- Hagravenh động của họ tạo ra những kết quả đaacuteng kể về tagravei chiacutenh vagrave con người
Tần số caacutec hoạt động điều hagravenh- Xử lyacute xaacuteo trộn 42
- Hoạt động kinh doanh 32
- Phacircn bổ nguồn lực 17
- Đagravem phaacuten 3
- Những điều khaacutec 6
Handling Disturbances 42
Entrepreneurial Activites 32
Resource Allocation 17
Negotiation 3
Other 6
Những thocircng tin điều hagravenh cần thiết- Quản lyacute xaacuteo trộn coacute thể yecircu cầu sự chuacute yacute xung quanh đồng hồ
- Hoạt động kinh doanh yecircu cầu điều hagravenh để dự đoaacuten những thay đổi trong mocirci trường
- Nhiệm vụ phacircn bổ tagravei nguyecircn yecircu cầu lựa chọn người quản lyacute vagrave caacutec nguồn lực hạn chế được triển khai
- Đagravem phaacuten yecircu cầu cập nhật thocircng tin từng phuacutet để coacute thể xacircy dựng được sự đồng thuận
Caacutec loại thocircng tin điều hagravenh- Hệ thống kế toaacuten coacute liecircn quan đến việc tiacutenh toaacuten thu nhập hoạt động cho caacutec lĩnh
vực cụ thể lagrave quan trọng hơn so với caacutec hệ thống kế toaacuten truyền thocircng- Thocircng tin về thị trường khaacutech hagraveng cung cấp giaacute trị trong việc quyết định chiến
lược- Caacutec thocircng tin cần thiết thường được truyền đi trecircn một số hệ thống maacutey tiacutenh vagrave
nằm trong toagraven tổ chức- Caacutec thocircng tin được sử dụng thường lagrave ngắn hạn vagrave dễ thay đổi
Phương thức để xaacutec định thocircng tin cần thiết
Rockart xaacutec định được năm phương thức cơ bản để xaacutec định thocircng tin cần thiết
- Phương thức dựa trecircn kết quả- Phương thức rỗng- Phương thức chỉ số khoacutea- Phương thức tổng hợp nghiecircn cứu- Phương thức dựa vagraveo nhacircn tố then chốt dẫn đến thagravenh cocircng
64 Thagravenh phần EIS
- Sản phẩm EIS đầu tiecircn được phaacutet triển để sử dụng trecircn maacutey tiacutenh cấu higravenh cao nhưng caacutec sản phẩm hiện nay nhằm mục tiecircu lagrave nền tảng ClientServer
- Những nền tảng linh hoạt hơn coacute thể thiacutech ứng với thay đổi trong tổ chức vagrave cocircng nghệ
- Sử dụng dữ liệu thời gian thực dẫn đến quyết định nhanh hơn nhiều thocircng tin hơn
Thagravenh phần phần cứng- Một EIS khocircng đogravei hỏi coacute phần cứng cụ thể hoặc duy nhất nagraveo- Chigravea khoacutea của vấn đề lagrave để đảm bảo rằng caacutec thagravenh phần của EIS tối ưu hoacutea vagrave
phugrave hợp với tagravei nguyecircn maacutey tiacutenh của tổ chức- Hệ thống nagravey phải được cấu higravenh để caacutec nguồn tagravei nguyecircn phugrave hợp với những
người điều hagravenh chuacuteng
Thagravenh phần phần mềm- Traacutei ngược với phần cứng phần mềm thường được chuyecircn mocircn hoacutea cao cho caacutec
bagravei toaacuten về miền- Sự chuyecircn mocircn hoacutea nagravey thường đạt được bằng caacutech sử dụng thagravenh phần off-the-
shelf cho toagraven bộ EIS vagrave caacutec mocirc-đun tugravey chỉnh để đaacutep ứng nhu cầu cụ thể- Lotus Notes lagrave một viacute dụ điển higravenh Noacute coacute thể được sử dụng một migravenh hoặc coacute
thể phục vụ becircn thứ ba mocirc-đun plug-in
Cocircng nghệ EIS hiện nay
Dobrzeniecki đề xuấtphacircn loạitừng cấptheo bachức năng- Loại 1 sản phẩm bao gồmmột bộ đầy đủcaacutec ứng dụngtừ mộtnhagrave cung cấp- Loại 2 sản phẩm đượcthựchiệnở phần đầu củacaacutecsản phẩmDSS đượcphaacutet triển
bởicugravengmộtnhagrave cung cấp- Loại 3 sản phẩmkết hợp với nhautheo bất kỳ số lượngthuộc sở hữu củacocircng ty
65 Xacircy dựng EIS
- Xacircy dựngmộtEISgiống nhưxacircydựngmột số hệ thống khaacutec củamocirc higravenh hệ thống thocircng tin
- Việcphaacutet triểncấu truacutecnecircn được theo dotildeitừ quaacute trigravenh thiết kế đến quaacute trigravenhthực hiện
- Tuy nhiecircn một dự aacuten phaacutet triển EIScoacute xu hướnglagrave thống nhấtvagraveyecircu cầu hỗ trợ caacutec nhagrave quản lyacute latildenh đạo
- Xacircy dựng một EIScoacute thểphaacutet hiện ra đượccaacutectigravenh huống khoacute khănmagravemột nhagrave phaacutet triển chưabao giờ gặp phải
Mocirc higravenh EIS
Khung phaacutet triển một EIS
- Watson et al đề nghị xacircy dựngkhung với ba thagravenh phần+ Caacutech tiếp cận tập trung vagraveo yếu tốcon người vagrave dữ liệu coacute liecircn quan đến EIS+ Quaacute trigravenh phaacutet triển cần sự linh hoạt vagrave tương taacutec+ Người sử dụng - hệ thống hộp thoại bao gồm một ngocircn ngữ hagravenh động để xử lyacute caacutec lệnh
Lợi iacutech của EIS- Dễ duy trigrave caacutec mục tiecircu coacute tổ chức- Dễ truy xuất thocircng tin- Cho pheacutep người sử dụng nacircng cao hiệu suất hơn
- Tăng chất lượng ra quyết định- Cung cấp sự cải tiến cạnh tranh- Tiết kiệm thời gian của người sử dụng- Tăng khả năng vagrave chất lượng giao tiếp- Cung cấp khả năng điều khiển tốt hơn trong tổ chức- Cho pheacutep tham gia caacutec vấn đề vagrave caacutec cơ hội- Cho pheacutep hoạch định- Cho pheacutep tigravem kiếm nguyecircn nhacircn của một vấn đề- Thảo matilden caacutec yecircu cầu của người điều hagravenh
Hạn chế của EIS vagrave 1 số sai lầm cần traacutenh
- Chi phiacute một cuộc khảo saacutetnăm1991 chothấychi phiacute phaacutet triểntrungbigravenh365000USDvớichi phiacute vận hagravenhhagraveng năm lagrave$200000 (EIS)
- Cocircng nghệ hạn chếEIScần phảiđượctiacutech hợp hoagraven toagravenvagraveokiếntruacuteccủadoanh nghiệphiện tại do đoacute noacutelagrave một thaacutech thứclớn đối vớithiết kế
- Hạn chế tổ chức cơ cấu tổ chứccoacute thể khocircng phugrave hợp
Sự hạn chế về tổ chức- Chương trigravenh nghị sự vagrave thời gian chệch EIS mocirc tả một phần việc thực hiện một
chương trigravenh nghị sự vagrave coacute thể dễ dagraveng đạt được sự tin cậy một caacutech chắc chắn- Đồng bộ hoacutea việc quản lyacute sự tin cậy đuacuteng luacutec đặc biệt baacuteo caacuteo EIS coacute thể phaacute
vỡ sự ổn định thiết lập caacutec chu trigravenh baacuteo caacuteo một caacutech tốt nhất- Sự bất ổn EIS phản ứng nhanh coacute thể gacircy ra việc taacutec động trở lại một caacutech
nhanh choacuteng dẫn đến sự thiếu ổn định trong tổ chức
Sự thất bại lagrave thay thế khocircng thể chấp nhận được- Một số yếu tố lagravem EIS thất bại
+ Thiếu sự hỗ trợ về mặt quản lyacute+ Vấn đề chiacutenh trị+ Thất bại của nhagrave phaacutet triển+ Lỗi về cocircng nghệ+ Giaacute cả+ Thời gian
66 Ra quyết định điều hagravenh trong tương lai vagrave EIS
- Coacute một vagravei điều kiện sẽ được hợp nhất cho việc chuyển đổi cocircng nghệ Trong đoacute một vagravei điều kiện coacute thể dễ dự đoaacuten Hai điều kiện magrave ta coacute thể thấy lagrave+ Phaacutet triển cocircng nghệ maacutey tiacutenh trong việc điều hagravenh sẽ tạo ra sự chuyển đổi được chấp nhận một caacutech dễ dagraveng hơn+ Mở rộng traacutech nhiệm điều hagravenh sẽ mở rộng nhu cầu thocircng tin
Tương lai của EIS- EIS thocircng minh Những tiến bộ trong cocircng nghệ AI sẽ được triển khai trong caacutec
EIS- EIS đa phương tiện Cơ sở dữ liệu đa phương tiện sẽ cho pheacutep tiacutech hợp văn bản
giọng noacutei vagrave higravenh ảnh trong tương lai- EIS thocircng tin Tương lai EIS sẽ mở rộng hơn trong việc sử dụng dữ liệu becircn
ngoagravei doanh nghiệp- EIS kết nối Giao tiếp với băng thocircng rộng cho pheacutep kết nối liecircn thocircng lớn hơn
Chương 7 HỆ CHUYEcircN GIA VAgrave TRIacute TUỆ NHAcircN TẠO
71 Caacutec khaacutei niệm
72 Triacute thocircng minh của triacute tuệ nhacircn tạo
73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia
74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia
75 Lợi iacutech vagrave hạn chế của hệ chuyecircn gia
71 Caacutec khaacutei niệm
Chuyecircn mocircn (Expertise) sự hiểu biết rộng trong 1 lĩnh vực hẹp
Hệ chuyecircn gia (Expert Systems)1 chương trigravenh maacutey tiacutenh sử dụng 1 tập caacutec luật dựa trecircn tri thức của con người để giải quyết caacutec vấn đề đogravei hogravei phải coacute sự chuyecircn mocircn
Một số hệ chuyecircn gia nổi tiếng
DENDRAL (Standford 1960s Edward Feigenbaum)
MYCIN (Standford1970s Edward Shortliffe)
PROSPECTOR (MIT 1979)
Triacute tuệ nhacircn tạo (Artificial Intelligence ndash AI)
Triacute tuệ nhacircn tạo một bộ phacircn của ngagravenh khoa học maacutey tiacutenh quan tacircm đến việc thiết kế caacutec hệ thống maacutey tiacutenh thocircng minh đoacute lagrave caacutec hệ thống đưa ra caacutec đặc điểm magrave từ đoacute chuacuteng ta liecircn hệ với sự thocircng minh trong hagravenh động của con người (Barr vagrave Feigenbaum 1981)
Mục điacutech của AI
Mục điacutech khoa học xaacutec định caacutec gợi yacute để giải thiacutech caacutec loại khaacutec nhau của triacute tuệ thực
Mục điacutech kỹ thuật giải quyết caacutec vấn đề trong thế giới thực
Triacute tuệ nhacircn tạo kế thừa nhiều yacute tưởng quan điểm kỹ thuật từ caacutec ngagravenh khoa học khaacutec
- Triết học
- Logic Toaacuten học
- Tiacutenh toaacuten
- Khoa học tacircm lyacute Khoa học nhận thức
- Sinh học Thần kinh học
- Tiến hoacutea
Caacutec lĩnh vực ứng dụng trong Triacute tuệ nhacircn tạo
Mạng nơ ron thần kinh (Neural Networks)
Tiacutenh toaacuten sự tiến hoacutea
(Evolutionary Computation)
Hệ chuyecircn gia (Expert Systems)
Kỹ thuật xử lyacute tiếng noacutei (Speech Processing)
Kỹ thuật xử lyacute ngocircn ngữ tự nhiecircn
(Natural Language Processing)
Lập kế hoạch (Planning)
Robot (Robotics)
Khoa học higravenh ảnh (Vision)
Caacutec kỹ thuật thocircng dụng dugraveng trong AI
Biểu diễn(Representation)
Học (Learning)
Caacutec luật (Rules)
Tigravem kiếm (Search)
72 Triacute thocircng minh của triacute tuệ nhacircn tạo
Con người suy diễn như thế nagraveo
Phacircn loại (Categorization)
Caacutec quy tắc cụ thể
Heuristics
Kinh nghiệm trước đoacute
Dự tiacutenh trước
Maacutey tiacutenh suy diễn như thế nagraveo
Lập luận dựa trecircn luật IF-THEN mocirc tả tri thức được matilde hoacutea dưới dạng caacutec luật
Caacutec khung (Frames) lagrave caacutec đại diện mocirc tả caacutec tigravenh huống giống nhau lagrave điển higravenh của một vagravei phacircn loại
Lập luận dựa trecircn caacutec trường hợp mocirc phỏng giải phaacutep trước đoacute cho một vấn đề hiện tại
Nhận dạng mẫu phaacutet hiện acircm thanh higravenh dạng hoặc caacutec chuỗi dagravei
Caacutec dạng khaacutec của Triacute tuệ nhacircn tạo
Học maacutey- mạng nơron vagrave giải thuật di truyền
Lập trigravenh tự động ndash lagrave những kỹ thuật tạo ra caacutec chương trigravenh để lagravem 1 nhiệm vụ riecircng biệt (cho pheacutep những người khocircng phải lagrave người lập trigravenh coacute thể lập trigravenh được)
Cuộc sống nhacircn tạo ndash nỗ lực để taacutei tạo caacutec hiện tượng sinh học trong caacutec hệ thống dựa trecircn maacutey tiacutenh
73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia(Expert Systems- ES)
Theo Jackson (1999) Một hệ chuyecircn gia lagrave một chương trigravenh maacutey tiacutenh mocirc tả vagrave suy diễn với tri thức của một vagravei lĩnh vực để giải quyết vấn đề hay đưa ra caacutec lời khuyecircn
Cấu truacutec cơ bản của ES được dựa theo cấu truacutec chung của DSS Sự khaacutec biệt chiacutenh giữa ES vagraveDSS lagrave hệ ES thu thập caacutec kiến thức từ những
chuyecircn gia trong lĩnh vực quan tacircmĐặc trưng của hệ chuyecircn gia Hiệu quả cao Thời gian trả lời thỏa đaacuteng Độ tin cậy cao Dễ hiểu
Giao diện người dugraveng trong ES
Thiết kế giao diện người dugraveng tập trung vagraveo caacutec yếu tố như dễ dagraveng sử dụngcoacute độ tin cậy cao giảm tải những khoacute khăn khi sử dụng
Thiết kế necircn coacute một số tương taacutec (đầu vagraveo kiểm soaacutet vagrave truy vấn)
Cấu tạo giao diện người dugraveng gồm coacute magraven higravenh cảm ứng bagraven phiacutem buacutet saacuteng lệnh thoại caacutec phiacutem chuyecircn dụng
Cơ sở tri thức (Knowledge Base)
Chứa đựng caacutec tri thức cụ thể miền thu được từ caacutec chuyecircn gia miền
Coacute thể chứa caacutec mocirc tả caacutec hagravenh vi giải quyết vấn đề caacutec ragraveng buộc caacutec heuristics
Thagravenh cocircng của một ES dựa trecircn tiacutenh đầy đủ vagrave tiacutenh chiacutenh xaacutec của cơ sở tri thức
Mocirc tơ suy diễn (Inference Engine)
Ở đacircy tri thức được đặt để sử dụng tạo ra caacutec giải phaacutep để giải quyết vấn đề
Mocirc tơ nagravey coacute khả năng thực hiện diễn dịch hoặc suy diễn dựa trecircn caacutec luật hay caacutec caacutec sự kiện
Đồng thời cũng coacute khả năng sử dụng caacutec suy diễn mờ hay khocircng chiacutenh xaacutec dựa trecircn xaacutec suất hay aacutenh xạ mẫu
Vograveng điều khiển suy diễn
1 Aacutenh xạ caacutec luật với caacutec sự kiện đatilde được cho
2 Chọn luật để thực hiện
3 Thực hiện luật bằng caacutech thecircm caacutec sự kiện được suy diễn ra vagraveo bộ nhớ lagravem việc
Chuỗi suy diễn (Chaining)
Suy diễn tiến (forward chaining) maacutey suy diễn bắt đầu từ dữ liệu ban đầu vagrave thực hiện việc suy luận để đưa ra caacutec kết luận cuối cugraveng
Suy diễn lugravei (backward chaining) maacutey suy diễn bắt đầu từ dữ liệu điacutech vagrave tigravem ra tri thức hỗ trợ cho dữ liệu điacutech đoacute
Viacute dụ suy diễn lugravei
R1 Nếu coacute A vagrave B thigrave suy ra coacute D
R2 Nếu coacute B thigrave suy ra coacute C
R3 Nếu coacute C vagrave D thigrave suy ra coacute E
Ta coacute E ta xem trong 3 luật R1 R2 R3 luật nagraveo coacute E ta thấy R3 chứa E đồng thời chứa C vagrave D Xeacutet tiếp trong 2 luật R1 R2 luật nagraveo chứa C vagrave D R2 chứa C R3 chứa D Từ đoacute ta coacute được caacutec tri thức hỗ trợ suy diễn vagrave kết luận lagrave nếu coacute A vagrave B thigrave sẽ coacute E Hay nếu A vagrave B đuacuteng thigrave sẽ coacute E
Viacute dụ suy diễn tiến
Giả sử coacute tập chứa 3 luật sau
R1 Nếu coacute A vagrave B thigrave suy ra coacute D
R2 Nếu coacute B thigrave suy ra coacute C
R3 Nếu coacute C vagrave D thigrave suy ra coacute E
Nếu ta coacute A vagrave B thigrave chuacuteng ta suy ra được D từ R1 vagrave suy ra C từ R2 Với D vagrave C đatilde được suy ra ở trecircn giờ chuacuteng ta suy ra được E từ R3
Viacute dụ thực tế
Giả sử muốn biết magraveu của một con vật nuocirci tecircn lagrave Fred biết rằng noacute kecircu ộp ộp vagrave ăn ruồi
Coacute tập 4 luật ban đầu như sau
R1 Nếu X kecircu ộp ộp vagrave ăn ruồi thigrave X lagrave con ếch
R2 Nếu X kecircu chiecircm chiếp vagrave biết hoacutet thigrave X lagrave con chim
R3 Nếu X lagrave con ếch thigrave X coacute magraveu xanh
R4 Nếu X lagrave con chim thigrave X coacute magraveu vagraveng
74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia
Expert system shells lagrave một tập caacutec goacutei phần mềm vagrave caacutec cocircng cụ dugraveng để phaacutet triển caacutec hệ chuyecircn gia
Những Expert system shells đầu tiecircn thường rất rườm ragrave Mặc dugrave vậy noacute vẫn giuacutep cho người sử dụng sẽ khocircng phải bắt đầu lại từ đầu khi xacircy dựng một hệ chuyecircn gia mới
Những shell hiện đại bao gồm hai mocirc-đun chiacutenh lagrave cocircng cụ xacircy dựng một tập quy tắc vagrave mocirc tơ suy diễn
Xacircy dựng hệ chuyecircn gia
Bước 1 xacircy dựng mocirc higravenh bagravei toaacuten xaacutec định vấn đề nhiệm vụ magrave hệ thống sẽ thực hiện Caacutec dạng bagravei toaacuten cần hệ chuyecircn gia
Bagravei toaacuten diễn giải (InterPretation)
Bagravei toaacuten dự baacuteo (Prediction)
Bagravei toaacuten chuẩn đoaacuten (Diagnose)
Bagravei toaacuten gỡ rối (Debugging)
Bagravei toaacuten thiết kế
Tương tự như một dự aacuten phần mềm để xacircy dựng một hệ chuyecircn gia cần phải coacute caacutec yếu tố về nhacircn lực tagravei nguyecircn vagrave thời gian Những yếu tố nagravey ảnh hưởng đến giaacute thah của một hệ chuyecircn giaTrong phần nagravey cacircu hỏi thường được đặt ra lagrave tại sao cần phải xacircy dựng một hệ chuyecircn giaTrước khi bắt đầu phải xaacute định rotilde bagravei toaacuten đạt ra lagrave jiAi lagrave chuyecircn giaAi lagrave người sử dụng
1 Diễn giải (InterPretation) Nghiecircn cứu 1 vấn đề -gt Dựa trecircn những biểu hiện thuộc tiacutenh đặc trưng becircn ngoagravei -gt Tư vấn
(hoặc đưa ra kết luận hay mocirc tả dễ hiểu từ tập dữ liệu thocirc)
2 Bagravei toaacuten dự baacuteo (Prediction) Coacute thể dự đoaacuten được hagravenh vi kết quả dựa trecircn caacutec hiện tượng -gt dự baacuteo
VD Dự baacuteo thời tiết động đấthellip
3 Bagravei toaacuten chẩn đoaacuten (Diagnoss) Xaacutec định caacutec lỗi caacutec bộ phận hỏng hoacutec của hệ thống dựa trecircn caacutec dữ liệu quan saacutet được
4 Bagravei toaacuten gỡ rối (Debugging) Mocirc tả caacutec phương phaacutep khắc phục hệ thống khi gặp sự cố
5 Bagravei toaacuten thiết kế Lựa chọn cấu higravenh caacutec đối tượng nhằm thoả matilden một số ragraveng buộc nagraveo đoacute
6 Giảng dạy Phần mềm dạy học coacute thể chuẩn đoaacuten vagrave sủa lỗi của học sinh trong quaacute trigravenh học tập
Để xaacutec định đuacuteng bagravei toaacuten magrave chuacuteng ta cần giải quyết thigrave phải trả lời đc một số cacircu hỏi
- cần hệ chuyecircn gia
Bước 2 thu thập tri thức lựa chọn cocircng cụ vagrave aacutep dụng
Trong bước thu thập tri thức vấn đề quan trọng lagrave lựa chọn chuyecircn gia những người magrave sẽ đoacuteng goacutep tri thức cho hệ thống Thocircng thường trong suốt quaacute trigravenh phaacutet triển thigrave chuyecircn gia được xem như một thagravenh viecircn của đội phaacutet triển
Hiện nay coacute rất nhiều cocircng cụ để xacircy dựng một hệ chuyecircn gia Phổ biến nhất lagrave JESS CLIPS vagrave OPS5
Bước 3 Thiết kế cơ sở tri thức thiết kế hệ thốngTri thức được biểu diễn trường minh trong cơ sở tri thức
Caacutec chuyecircn gia vagrave kỹ sư tri thức sẽ đối thoại với nhau bằng caacutec kỹ thuật đối thoại Suy diễn (SD) bảng Mocirc higravenh hoacutea SD quy nạp phacircn loại
Vấn đề bagraveo trigrave vagrave phaacutet triển
Caacutec hệ chuyecircn gia đogravei hỏi phải bảo trigrave vagrave phaacutet triển nhiều hơn so với caacutec hệ thống khaacutec Phải thường xuyecircn bổ sung tri thức mới vagrave thay đổi caacutec tri thức cũ để đổi mới hệ chuyecircn gia
Thu thập vagrave khắc phục lỗi do người sử dụng phaacutet hiện để kịp thời khắc phục những sai soacutet của hệ chuyecircn gia
75 Lợi iacutech vagrave hạn chế của caacutec hệ chuyecircn gia
Một số lợi iacutech chiacutenh
Thời gian trả lời hợp lyacute bằng hoặc nhanh hơn so với chuyecircn gia (người) để đi đến cugraveng một quyết định Hệ chuyecircn gia lagrave một hệ thống thời gian thực (real time system)
Khả năng trả lời với mức độ tinh thocircng bằng hoặc cao hơn so với chuyecircn gia (người) trong cugraveng lĩnh vực
Hệ chuyecircn gia giuacutep cho hiệu quả lagravem việc tăng bằng việc sử dụng tập caacutec luật một caacutech nhanh choacuteng magrave ko bị nhầm lẫn chuyecircn gia lagrave người coacute thể quecircn đi một số tri thức cơ sở lyacute luậ nhưng HCG thigrave ko
Quyết định của một người chuyecircn gia coacute thể bị thay đổi vagrave ko coacute tiacutenh thống nhất như quyết định của một hệ chuyecircn gia tạo ra
Hệ chuyecircn gia giuacutep cho người sử dụng coacute thể trau dồi sự hiểu biết trecircn lĩnh vuej cụ thể magrave noacute giải quyết hỗ trợ người ra quyết định coacute trigravenh độ như 1 chuyecircn gia trong quaacute trigravenh gia quyết định
Kiến thức của rất nhiều chuyecircn gia về một lĩnh vực nagraveo đoacute được đưa vagraveo hệ chuyecircn gia lagravem cho CSTT cuat HCG phong phuacute vagrave rộng lớn hơn rất nhiều
HCG giải thiacutech caacutec bước suy luận một caacutech dễ hiểu nhất quaacuten luacutec nagraveo cũng coacute thể sử dụng ko như chuyecircn gia con người
Hạn chế của caacutec hệ chuyecircn gia
Nhược điểm lớn nhất của hệ chuyecircn gia lagrave những yacute kiến chuyecircn mocircn thường rất khoacute matilde hoacutea vagrave giải neacuten
Hệ chuyecircn gia khocircng coacute khả năng tự học tự cập nhật kiến thức mới như caacutec chuyecircn gia magrave cần phải được matilde hoacutea lại khi noacute được cập nhật
Hệ chuyecircn gia khocircng thể nhận ra được vấn đề khocircng nằm trong miền kiến thức của hệ thống
Chương 8 Tri thức vagrave tiếp nhận
1 Bao gồm caacutec vấn đề
Dữ liệu thực tế đo lường hoặc quan saacutet coacute hoặc khocircng coacute bối cảnh
Thocircng tin dữ liệu được tổng hợp một caacutech hữu iacutech để giải quyết những khoacute khăn trong việc đưa ra quyết định
Tri thức bao gồm caacutec ứng dụng quy tắc thocircng tin hướng dẫn của người ra quyết định
2 Những caacutei nhigraven về tri thức
Đại diện lagravem thế nagraveo để diễn tả tri thức viacute dụ như một quyển saacutech khocircng phải lagrave tri thức nhưng noacute lại lagrave một đại diện của tri thức
Sản xuất tri thức lagrave một tập hơp của hagraveng tồn kho coacute thể được sản xuất cũng như mua lại
Tri thức lagrave 1 trong 6 trạng thaacutei của hệ thống
1Dữ liệu 2Thocircng tin 3Cấu truacutec thocircng tin 4Sự thấu hiểu 5Yacute kiến 6 Quyết định
3 Caacutec loại tri thức Phổ biến mocirc tả dữ liệu thocircng tin thủ tục mọi thứ lagravem như thế nagraveo lập luận chiacutenh saacutech hoặc caacutec quy tắc
4 Thu thập Tri thức hệ chuyecircn gia Hầu hết caacutec phương phaacutep đều bắt đầu với mocirc higravenh của caacutec taacutec vụ trong đoacute
hệ chuyecircn gia được xacircy dựng Trong đoacute mocirc tả về caacutec lĩnh vực được tạo ra Caacutec kỹ sư sử dụng caacutec mocirc higravenh giả thuyết vagrave nhận thức về quaacute trigravenh phacircn
tiacutech để gợi ra caacutech giải quyết vấn đề về tri thức từ caacutec chuyecircn gia
5 Caacutec chiều của thu thập tri thức KE- driven caacutec kỹ sư trao đổi trực tiếp với caacutec chuyecircn gia Expert-driven Caacutec chuyecircn gia trực tiếp đưa chuyecircn mocircn của họ vagraveo hệ
thống maacutey tiacutenh Machine-driven Sử dụng caacutec cocircng cụ suy luận để triacutech xuất tri thức từ một
tập caacutec viacute dụ
6 Kỹ thuật thu thập tri thức Trao đổi gồm 2 loại cơ bản lagrave coacute cấu truacutec(coacute kịch bản) vagrave khocircng coacute cấu
truacutec( đối thoại trực tiếp) Giao thức phacircn tiacutech bằng lời Khi caacutec chuyecircn gia thực hiện một cocircng việc
của họ thigrave một bản ghi về cocircng việc đoacute được thực hiện Caacutec kỹ sư sẽ xacircy dựng mocirc higravenh cho những gigrave được ghi lại trong bản ghi
Phương phaacutep sagraveng lọc caacutec chuyecircn gia so saacutenh caacutec nhoacutem liecircn tiếp trong ba đối tượng vagrave cho biết tại sao nhoacutem thứ hai lại khaacutec nhoacutem thứ ba
7 Thu thập tri thức từ nhiều nguồn Thu thập tri thức từ nhiều nguồn lagrave cần thiết để coacute được đầy đủ caacutec tri thức
cho một vấn đề quan điểm yacute kiến traacutei ngược nhau thường phaacutet sinh Phương phaacutep đồng thuận sẽ giuacutep giải quyết được vấn đề macircu thuẫn Kỹ thuật phacircn tiacutech Meta lagrave kỹ thuật được aacutep dụng trong caacutec trường hợp
khaacutec Caacutech tiếp cận bằng định lượng đogravei hỏi caacutec kỹ sư cần cacircn nhắc yếu tố đầu vagraveo của caacutec chuyecircn gia khaacutec nhau
8 Xaacutec nhận hợp lệ vagrave kiểm tra tri thức Một khi thu thập tri thức noacute phải được đaacutenh giaacute về khả năng sử dụng vagrave độ
chiacutenh xaacutec Hai vấn đề cụ thể lagrave hiệu lực của những kiến thức vagrave kiểm tra việc xacircy dựng cơ sở của tri thức
Cần xaacutec nhận xem liệu hệ thống coacute thể hoạt động ở mức độ tối thiểu khocircng
Xaacutec minh liecircn quan đến việc so saacutenh từng chi tiết kỹ thuật của hệ thống những gigrave đatilde được thực hiện cuối cugraveng
9 Một số caacutec biện phaacutep xaacutec nhận Độ chiacutenh xaacutec Khả năng thiacutech nghi Mức độ đầy đủ Bề rộng Độ sacircu Hiệu lực Tổng quan Chiacutenh xaacutec Hiện thực Độ tin cậy Tiacutenh hữu dụng Mức độ
Chương 9 Học maacutey
1 Logic mờ vagrave ngocircn ngữ mờ(Fuzzy Logic and Linguistic Ambiguity)
Ngocircn ngữ tự nhiecircn gồm những khaacutei niệm mơ hồ vagrave khocircng chiacutenh xaacutectruyền tải ngữ nghĩa thocircng qua tiacutenh xấp xỉkhocircng rotilde ragraveng
Những xấp xỉ nagravey giuacutep con người coacute thể truyền tải hết được yacute nghĩa nhưng maacutey thigrave khocircng hiểu
Lagravem sao biểu diễn caacutec tri thức sử dụng caacutec khaacutei niệm khocircng rotilde ragraveng(mờ) hoặc khocircng chiacutenh xaacutec
2 Khaacutei niệm cơ bản của logic mờ tập mờ lagrave những tập hợp khocircng coacute một giới hạn rotilde Mỗi phần tử của noacute chỉ
chứa một mức độ hagravem liecircn thuộc của từng phần tử Vigrave vậy tập mờ khocircng giống như tập cổ điển Tập mờ coacute thể kết hợp với nhau qua những luật mờ magrave đặc trưng cho những hagravenh động trạng thaacutei vagrave thuộc tiacutenh của logic mờ được tận dụng khi thực hiện một bộ điều khiển mờ
Logic mờ dựa trecircn yacute tưởng mỗi phần tử thuộc vagraveo một tập hợp ở một mức độ nagraveo đấy
Locircgic mờ cho pheacutep độ liecircn thuộc (microA )coacute giaacute trị trong khoảng (01) Locircgic mờ coacute thể được coi lagrave mặt ứng dụng của lyacute thuyết tập mờ để xử lyacute caacutec
giaacute trị trong thế giới thực cho caacutec bagravei toaacuten phức tạp
3 So saacutenh tiacutenh đuacuteng đắn logic mờ vagrave xaacutec suất Xaacutec suất thigrave đề cập đến khả năng xảy ra một biến cố hay một điều gigrave đoacute Logic mờ đề cập đến cấp độ magrave đặc tiacutenh ở hiện tại
o viacute dụ1 người coacute chiều cao 6 feet thigrave coacute cấp độ lagrave 05 về chiều cao
4 Ưu điểm của logic mờ Caacutech tiếp cận rất tự nhiecircnkhocircng phức tạp Coacute thể mocirc higravenh hoacutea caacutec hagravem phi tuyến tugravey yacute phức tạp
Coacute thể tận dụng được kinh nghiệm từ những chuyecircn gia hagraveng đầu trong mọi lĩnh vực
Logic mờ được xacircy dựng dựa trecircn ngocircn ngữ tự nhiecircnNền tảng của logic mờ lagrave dựa trecircn cơ sở giao tiếp của con người
5 Nhược điểm của logic mờ Trong 1 hệ thống phức tạpsử dụng logic mờ coacute thể trở thagravenh trở ngại cho
việc xaacutec thực độ tin cậy của hệ thống Cơ chế lập luận mờ khocircng thể học hỏi từ những lỗi sai
6 Mạng noron nhacircn tạo(ANN) Mạng noron nhacircn tạo lagrave một mocirc phỏng xử lyacute thocircng tinđược nghiecircn cứu ra
từ hệ thống thần kinh của sinh vậtgiống như bộ natildeo để xử lyacute thocircng tin ANNs lagrave chương trigravenh dựa trecircn maacutey tiacutenh đơn giản coacute chức năng lagrave một mocirc
higravenh bagravei toaacuten khocircng gian dựa trecircn thử nghiệm vagrave baacuteo lỗi
7 Học từ kinh nghiệm Tiến trigravenh Một mẫu dữ liệu được biểu diễn như một mạng lưới noronANN ldquodự
đoaacutenrdquo 1 đầu radự đoaacuten được so saacutenh với giaacute trị thực tế hoặc giaacute trị chiacutenh xaacutecNếu đoaacuten được chiacutenh xaacutec thigrave khocircng coacute hagravenh động nagraveo được thực hiện
Nếu dự đoaacuten sai ANN kiểm tra lại vagrave xaacutec định lại thocircng số để điều chỉnh Một mẫu dữ liệu khaacutec được biểu diễn vagrave quaacute trigravenh nagravey được lặp lại
8 Nguyecircn tắc cơ bản của cocircng nghệ nơron Caacutec yếu tố xử lyacute cơ bản trong hệ thống thần kinh của con người lagrave tế bagraveo
thần kinhMạng lưới của tế bagraveo nagravey lagrave liecircn kết với nhau nhận được thocircng tin từ caacutec cảm biến trong mắt taihellip
Thocircng tin nhận được bởi tế bagraveo thần kinh hoặc lagrave sẽ kiacutech thiacutech noacute(sẽ được chuyển qua 1 thocircng điệp dọc theo mạng lưới) hoặc lagrave sẽ ngăn cản noacute(ngăn cản dograveng thocircng tin)
Độ nhạy coacute thể thay đổi qua thời gian hoặc sau khi coacute được kinh nghiệm
9 Cấu truacutec mạng Một ANN gồm 3 lớp cơ bản
Lớp đầu vagraveo nhận dữ liệu Lớp becircn trong hoặc lagrave lớp ẩn xử lyacute dữ liệu Lớp đầu ra chuyển tiếp kết quả cuối cugraveng của mạng
10Mạng nơ ron Thường coacute nhiều đầu vagraveo mỗi đầu vagraveo với mức ảnh hưởng vagrave tầm quan
trọng riecircng của noacute Một đầu vagraveo quan trọng coacute thể được sử dụng để khuếch đại đầu ra caacutec hagravem trạng thaacutei tổng hợp caacutec trọng số của caacutec yếu tố
đầuvagraveo khaacutec nhauvagraveo một giaacute trị duy nhất Caacutec hagravem chuyển giao xử lyacute caacutec giaacute trị trạng thaacutei vagrave tạo đầu ra
11Huấn luyện mạng nơ ron Trong mocirc higravenh coacute giaacutem saacutetANN được đến so saacutenh dự đoaacuten của chiacutenh
noacute với thocircng tin phản hồi coacute chứa caacutec kết quả mong muốn ANN sẽ phải tigravem caacutech thay đổi caacutec tham số becircn trong củamigravenh (caacutec trọng số vagrave caacutec ngưỡng) để tạo necircn một aacutenh xạ coacute khả năng aacutenh xạcaacutec đầu vagraveo thagravenh caacutec đầu ra mong muốn Sự thay đổi nagravey được tiến hagravenh nhờ việc so saacutenh giữa đầu ra thực sự vagrave đầu ra mong muốn
Trong mocirc higravenh khocircng coacute giaacutem saacutetANN nhận được dữ liệu vagraveo nhưng khocircng phải coacute bất kỳ thocircng tin phản hồi về kết quả mong muốn
Phần lớn caacutec ứng dụng nằm trong vugraveng của caacutec bagravei toaacuten ước lượng như mocirc higravenh hoacuteathống kecirc neacuten lọc phacircn cụm
12Lợi iacutech Liecircn kết với mạng noron Traacutenh caacutech lập trigravenh tường minh Giảm nhu cầu của chuyecircn gia ANNs thigrave thiacutech nghi với caacutec yếu tố đầu vagraveo thay đổi Khocircng cần thiết cho cơ sở tri thức tinh chế ANNs coacute tiacutenh động vagrave cải thiện với việc sử dụng Coacute khả năng xử lyacute dữ liệu khocircng chiacutenh xaacutec hoặc khocircng đầy đủ Cho pheacutep tổng quaacutet hoacutea từ thocircng tin cụ thể Cho pheacutep thu thập cảm giaacutec thocircng thường vagraveo miền giải quyết vấn đề
13Hạn chế của việc liecircn kết với mạng noron ANNs khocircng thể giải thiacutech được suy luận Bản chất hộp đen thường khiến cho vấn đề traacutech nhiệm vagrave độ tin cậy phaacutet
sinh lagrave khoacute khăn Lặp đi lặp lại quaacute trigravenh huấn luyện rất tốn thời gian Nguồn lực caacutec nhagrave phacircn tiacutech vagrave thiết kế coacute tay nghề cao vẫn lagrave đaacuteng lo
ngại Cocircng nghệ ANN thuacutec đẩy hạn chế của phần cứng hiện tại ANN yecircu cầu phải coacute sự tin tưởng ở đầu ra
14Giới thiệu về thuật toaacuten di truyền Cũng như mạng lưới thần kinh caacutec thuật toaacuten di truyền được dựa trecircn lyacute
thuyết sinh học Thuật toaacuten di truyền tigravem thấy nguồn gốc của chuacuteng trong caacutec lyacute thuyết
tiến hoacutea của chọn lọc tự nhiecircn vagrave thiacutech ứng với biến đổi khiacute hậu Kết quả thuật toaacuten di truyền lagrave từ giao phối 2 caacute thể trong quần thế để tạo
ra con caacutei đocirci khi tốt hơn so với bậc cha mẹ của chuacuteng 15Caacutec thagravenh phần cơ bản của thuật toaacuten di truyền
Toaacuten tử chọn lọc Caacutec caacute thể tốt được chọn lọc để đưa vagraveo thế hệ sau Sự chọn lọc nagravey căn cứ vagraveo độ thiacutech nghi với mocirci trường của mỗi caacute thể
Toaacuten tử lai gheacutep (crossover) Hai caacute thể cha vagrave mẹ trao đổi caacutec gen với nhau để tạo ra caacute thể con
Toaacuten tử đột biến (mutation) Một caacute thể thay đổi một số gen để biến đổi thagravenh một caacute thể mớiTất cả caacutec toaacuten tử trecircn khi thực hiện đều mang tiacutenh ngẫu nhiecircn
16Quaacute trigravenh cơ bản của một thuật toaacuten di truyền Khởi tạo
Đaacutenh giaacute quần thể
Lựa chọn NST thiacutech hợp nhất vagrave loại bỏ NST yếu nhất
Quy trigravenh giao nhau vagrave cải thiện quần thể
đột biến tiến trigravenh để khaacutem phaacute ra NST mới
17Ưu nhược điểm của việc kết hợp với thuật toaacuten di truyền Kiacutech thước quần thể lagrave 1 yếu tố quan trọng trong tốc độ của việc tigravem
kiếmnhưng noacute tương đối dễ dagraveng để dự đoaacuten tốc độ nagravey Giao nhau hoặc đột biến lagrave khocircng necircn đc sử dụng quaacute thường xuyecircn Luocircn coacute được iacutet nhất 1 giải phaacutep hợp lyacute Necircn coacute thể aacutep dụng chuacuteng cho caacutec vấn đề magrave chuacuteng ta khocircng coacute hướng
về caacutech giải quyết Sức mạnh của thuật toaacuten xuất phaacutet từ khaacutei niệm đơn giảnkhocircng phải từ
một thủ tục thuật toaacuten phức tạp 18Tương lai của học maacutey
Mạng lưới thần kinh nhacircn tạo vượt quaacute năng lực của con người trong caacutec trường hợp bị cocirc lập
Về mặt lyacute thuyếtmột maacutey tiacutenh coacute thể xử lyacute dũ liệu nhanh hơn hagraveng triệu lần so với 1 con người
May mắn thay cho chuacuteng tacon người tốt hơn nhiều khi magrave coacute được dữ liệumaacutey tiacutenh khocircng coacute 1 số thứ như lagrave 5 giaacutec quan
CHƯƠNG 10 KHO DỮ LIỆU
1 Kho dữ liệu Kho dữ liệu lagrave tuyển tập caacutec cơ sở dữ liệu tiacutech hợp hướng chủ đề được
thiết kế để trợ giuacutep cho một hệ hỗ trợ quyết định
Theo John Ladley Cocircng nghệ kho dữ liệu lagrave tập caacutec phương phaacutep kỹ thuật vagrave caacutec cocircng cụ coacute thể kết hợp hỗ trợ nhau để cung cấp thocircng tin cho người sử dụng trecircn cơ sở tiacutech hợp từ nhiều nguồn dữ liệu nhiều mocirci trường khaacutec nhau
Kho dữ liệu thường rất lớn tới hagraveng trăm GB hay thậm chiacute hagraveng Terabyte
2 Kho dữ liệu vận hagravenh (ODS) Một kho dữ liệu vận hagravenh Aacutep dụng kỹ thuật kho dữ liệu vagraveo caacutec hệ xử
lyacute giao taacutec lưu trữ dữ liệu cho một ứng dụng đặc thugrave Noacute đưa vagraveo kho dữ liệu một dograveng caacutec dữ liệu thocirc được thiết kế
3 So saacutenh
Kho dữ liệu vận hagravenh Kho dữ liệu
Dữ liệu theo chủ đề Dữ liệu theo chủ đề
Dữ liệu tiacutech hợp Dữ liệu tiacutech hợp
Dữ liệu thay đổi Dữ liệu khocircng thay đổi
Dữ liệu được cập nhật khi thay đổi
Dữ liệu giữ nguyecircn
Chỉ coacute dữ liệu hiện tạiDữliệu hiện tại vagrave dữ liệu lịch sử
Chu kỳ lagravem tươi dữ liệu ngắn Chu kỳ lagravem tươi dữ liệu dagravei
Chỉ coacute dữ liệu chi tiết Dữ liệu chi tiết vagrave dữ liệu tổng kết
Dugraveng cho caacutec quyết định ngắn hạn
Dugraveng cho hoạch định dagravei hạn
4 Kho dữ liệu cục bộ (Data Mart - DM)
Kho dữ liệu cục bộ lagrave CSDL coacute những đặc điểm giống với kho dữ liệu nhưng với quy mocirc nhỏ hơn vagrave lưu trữ dữ liệu về một lĩnh vực một chuyecircn ngagravenh
Data mart phụ thuộc Chứa những dữ liệu được lấy từ DW vagrave những dữ liệu nagravey sẽ được triacutech lọc vagrave tinh chế tiacutech hợp lại ở mức cao hơn để phục vụ một chủ đề nhất định của Datamart
Data mart độc lập Khocircng giống như Datamart phụ thuộc Data mart độc lập được xacircy dựng trước DW vagrave dữ liệu được trực tiếp lấy từ caacutec nguồn khaacutec nhau
5 Siecircu dữ liệu Metadata lagrave dữ liệu để mocirc tả dữ liệu Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột
một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi Metadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu
6 Mocirci trường kho dữ liệu Hệ thống của tổ chức vagrave kho cung cấp dữ liệu để xacircy dựng kho dữ liệu Trong quaacute trigravenh chuyển dữ liệu từ caacutec nguồn khaacutec nhau dữ liệu coacute thể
được lagravem sạch hoặc chuyển đổi vagrave vigrave thế DW được xem như lagrave một chuẩn cho việc lưu trữ
Đồng thời siecircu dữ liệu được ghi lại Cuối cugraveng DW hoặc siecircu thị coacute thể được sử dụng để tạo ra một kho dữ
liệu ldquocaacute nhacircnrdquo 7 Caacutec đặc điểm của kho dữ liệu
Đặc điểm Mocirc tả
Hướng chủ đề - DL tổ chức theo caacutech thức người dugraveng tham chiếu
Tiacutech hợp - Dữ liệu ldquosạchrdquo loại bỏ tiacutenh thiếu nhất quaacuten
Khocircng thay đổi - DL ldquochỉ đọcrdquo người dugraveng khocircng thay đổi được
Chuỗi thời gian - DL lagrave chuỗi thời gian khocircng phải lagrave trạng thaacutei hiện tại
Được tổng kết - DL vận hagravenhthao taacutec khi cần thiết
được kết hợp lại thagravenh dạng coacute thể dugraveng được cho quyết định
Kiacutech cỡ lớn hơn - Lưu giữ theo chuỗi thời gian tức lagrave giữ lại nhiều DL
Khocircng được chuẩn hoacutea - Coacute thể dư thừa DLSiecircu dữ liệu - Dữ liệu của dữ liệu được lưu trữNguồn dữ liệu - DL vận hagravenh (caacutec hệ sẵn coacute) cugraveng
với caacutec nguồn ngoagravei 8 Kho dữ liệu hướng chủ đề
Hướng chủ để coacute nghĩa lagrave kho dữ liệu được tổ chức xung quanh caacutec chủ đề chiacutenh như khaacutech hagraveng sản phẩm sản xuất Tập trung vagraveo việc mocirc higravenh hoacutea vagrave phacircn tiacutech dữ liệu cho caacutec nhagrave ra quyết định magrave khocircng tập trung vagraveo caacutec xử lyacute thocircng thường Cung cấp cho người dugraveng một khung nhigraven toagraven vẹn đơn giản vagrave đầy đủ về caacutec sự kiện quanh caacutec chủ đề
9 Dữ liệu trong DW được tiacutech hợp Dữ liệu trong kho dữ liệu được xacircy dựng bằng caacutech tổng hợp dữ liệu từ
nhiều nguồn khaacutec nhau vagrave caacutec nguồn coacute tổ chức khaacutec nhau Cơ sở dữ liệu caacutec file excel caacutec flat file hoặc caacutec raw file Khi đưa vagraveo kho dữ liệu caacutec dữ liệu được lagravem sạch vagrave tiacutech hợp dữ liệu nhằm đảm bảo tiacutenh nhất quaacuten của dữ liệu
10Kiến truacutec kho dữ liệu Tầng cơ sở dữ liệu hoạt động Tầng truy xuất thocircng tin Tầng truy xuất dữ liệu Tầng siecircu dữ liệu Tầng quản lyacute tiến trigravenh Tầng thocircng điệp của ứng dụng Tầng vật liacute của kho dữ liệu Tầng trigravenh diễn dữ liệu
11Higravenh trạng kho dữ liệu Kho dữ liệu ảo - người dugraveng cuối coacute thể truy cập trực tiếp đến kho dữ liệu
sử dụng caacutec cocircng cụ cho pheacutep ở tầng truy xuất dữ liệu Kho dữ liệu trung tacircm-1 cơ sở dữ liệu vật lyacute chứa tất cả dữ liệu cho một
vugraveng chuyecircn dụng nagraveo đoacute
Kho dữ liệu phacircn taacuten- Thagravenh phần được phacircn taacuten qua nhiều hệ cơ sở dữ liệu vật lyacute
12METADATA- Siecircu dữ liệu Định nghĩa Siecircu dữ liệu lagrave dữ liệu về dữ liệu Lagrave 1 lưu trữ dugraveng để
Miecircu tả kho dữ liệu tổng thể Nhận dạng kiểu kho dữ liệu Quản liacute quaacute trigravenh tiacutech hợp dữ liệu Quản liacute quaacute trigravenh cập nhật kho dữ liệu Quản liacute bảo mật
Lagrave chigravea khoacutea quyết định sự thagravenh cocircng của kho dữ liệu luocircn được thay đổi vagrave cập nhật theo sự phaacutet triển của kho dữ liệu
Dugraveng để quản liacute điều khiển kho dữ liệu Sự ra đời của kho dữ liệu như 1 cấu truacutec hỗ trợ ra quyết định siecircu dữ liệu
được xem như nguồn tagravei nguyecircn dữ liệu Siecircu dữ liệu lagrave trừu tượng Chuacuteng lagrave dữ liệu bậc cao cung cấp mocirc tả ngắn
gọn caacutec dữ liệu bậc thấp hơn 13Hoạt động của Siecircu dữ liệu
Siecircu dữ liệu rất cần thiết trong việc chuyển hoacutea thocircng tin trở thagravenh tri thức Lagrave chigravea khoacutea giuacutep chuacuteng ta xử lyacute được dữ liệu thocirc Viacute dụ một dograveng dữ liệu baacuten hagraveng 1023 K596 11121 agraveNoacute sẽ khocircng coacute nghĩa gigrave cho đến khi chuacuteng ta đưa vagraveo siecircu dữ liệu (thư
mục chứa dữ liệu) agrave cửa hagraveng 1023 sản phẩm K596 vagrave số tiền baacuten được lagrave 11121 đocirc la
14Sự cần thiết phải nhất quaacuten trong kho dữ liệu Kho dữ liệu được xacircy dựng cho lợi iacutech của những nhagrave phacircn tiacutech kinh
doanh caacutec nhagrave quản trị cho tất cả caacutec khu vực chức năng Trong cơ sở dữ liệu riecircng caacutec khu vực khaacutec nhau coacute thể định nghĩa vagrave lưu
trữ dữ liệu thocircng qua phiecircn bản của chiacutenh noacute Khi dữ liệu được lấy từ những vugraveng khaacutec nhau đoacute vagrave được đặt vagraveo kho dữ
liệu Việc chuyển đổi vagrave lagravem sạch caacutec tiến trigravenh sẽ đảm bảo noacute lagrave duy nhất được tiacutech hợp tại một mức của tổ chức
15Ragrave soaacutet lại dữ liệu ndash Thực thi siecircu dữ liệu
Bất kể cấu truacutec tự nhiecircn của 1 cacircu truy vấn thế nagraveo thigrave caacutec thagravenh phần của siecircu dữ liệu rất quan trọng đối với người ra quyết định
Bảng thuộc tiacutenh khoacutea được lưu trữ bởi kho dữ liệu Tập hợp dữ liệu được lấy từ đacircu Những chuyển đổi nagraveo được thực thi với việc lagravem sạch
16Siecircu dữ liệu lagrave gigrave Metadata - lagrave thocircng tin mocirc tả nội dung của cơ sở dữ liệu (CSDL) Metadata baacuteo cho người dugraveng biết thời gian cập nhật sau cugraveng của dữ liệu
định dạng vagrave mục điacutech sử dụng của noacute Những thocircng tin nagravey coacute thể hướng dẫn người dugraveng duyệt qua CSDL vagrave
giuacutep họ hiểu được yacute nghĩa vagrave ngữ cảnh của dữ liệu Trong CSDL metadata lagrave caacutec dạng biểu diễn khaacutec nhau của caacutec đối tượng
trong CSDL Trong CSDL quan hệ metadata lagrave caacutec định nghĩa của bảng cột CSDL
view vagrave nhiều đối tượng khaacutec Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột
một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi -gtMetadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu
Bảng chuyển đổi Ghi lại những chuyển đổi đatilde được thực hiện
Lịch sử thực thi Ghi lại những dữ liệu đatilde được
phacircn tiacutech
Higravenh thaacutei kết nốiGhi lại những dữ liệu được kết nối vagrave tần suất
17Aacutenh xạ thocircng thường của siecircu dữ liệu Bản ghi aacutenh xạ chuyển đổi bao gồm
Định danh của nguồn gốc Chuyển đổi thuộc tiacutenh Chuyển đổi thuộc tiacutenh vật lyacute Matilde hoacutea tham chiếu bảng chuyển đổi Đổi tecircn Đổi khoacutea Gaacuten giaacute trị cho thuộc tiacutenh mặc định Chọn logic cho caacutec nguồn nhiều giaacute trị Đổi thuật toaacuten
18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để
phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai
lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave
tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec
Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm
Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo
19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua
caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau
SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được
Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra
một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức
Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ
Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ
Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech
CHƯƠNG 11 KHAI PHAacute DỮ LIỆU
1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn
ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993
Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng
2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd
1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều
2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP
3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn
4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng
5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server
6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo
7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động
8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời
9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều
10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện
11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech
12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP
3 Xử lyacute phacircn tiacutech trực tuyến OLAP
MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave
dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu
ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave
thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu
HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave
ROLAP4 Khai phaacute dữ liệu
Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh
khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn
Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan
5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp
6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại
Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp
Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec
Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt
Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra
Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh
vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho
Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec
Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm
Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục
Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng
gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp
Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn
Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec
Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper
Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2
Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25
Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước
Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng
Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện
trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp
Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute
độ hỗ trợ ge ngưỡng minsup
độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan
Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn
Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết
Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu
MOLAP ROLAP HOLAP
Lưu trữ dữ liệu cơ sở
Khối Bảng quan hệ Bảng quan hệ
Lưu trữ thocircng tin tổng hợp
Khối Bảng quan hệ Khối
Hiệu suất thực hiện truy vấn
Nhanh nhất Chậm nhất Nhanh
Tiecircu thụ khocircng gian lưu trữ
Nhiều Thấp Trung bigravenh
Chi phiacute bảo trigrave Cao Thấp Trung bigravenh
thống năng lực phacircn tiacutech cũng coacute thể coacute caacutec ngocircn ngữ mocirc higravenh hoacutea ở đacircy Thagravenh phần nagravey coacute thể kết nối với caacutec kho chứa mocirc higravenh của tổ chức hay ở becircn ngoagravei nagraveo khaacutec
3 Một cocircng cụ tri thức coacute thể hỗ trợ caacutec phacircn hệ khaacutec hay hoạt động độc lập nhằm đưa ra tiacutenh thocircng minh của quyết định đưa ra Noacute cũng coacute thể được kết nối với caacutec kho kiến thức khaacutec của tổ chức
4Giao diện người dugraveng giuacutep người sử dụng giao tiếp với vagrave ra lệnh cho hệ thống Caacutec thagravenh phần vừa kể trecircn tạo necircn HHTQĐ coacute thể kết nối với intranetextranet của tổ chức hay kết nối trực tiếp với Internet
5Chiacutenh caacutec người dugraveng
4Dữ liệu vagrave mocirc higravenh quản lyacute Mối quan tacircm ngagravey cagraveng tăng về giaacute trị dữ liệu đối với một tổ chức chỉ ra rằng
chất lượng vagrave cấu truacutec của CSDL lagrave yếu tố cơ bản xaacutec định sự thagravenh cocircng của DSS
CSDL sẽ tổ chức dữ liệu dưới dạng phacircn cấp logic dưa trecircn mức độ mịn hoacutea dữ liệu
Sự phacircn cấp chứa 4 thagravenh phần tử cơ bản 1CSDL 2 Tập tin 3Bản ghi 4Dữ liệu
Hệ thống quản lyacute CSDL Dữ liệu trong mỗi file coacute cấu truacutec giống nhau (bản ghi) caacutec files coacute thể hoagraven
togravean khaacutec nhau DBMS giữ vai trograve quan trọng trong việc tổ chức files vagrave CSDL DBMS coacute 2 traacutech nhiệm chiacutenh
1 Phối hợp caacutec cocircng việc liecircm quan tới lưu trữ vagrave truy cập thocircng tin2 Duy trigrave sự phụ thuộc logic giữa dữ liệu trong CSDL của DSS vagrave ứng dụng
DSS Caacutec hagravem chức năng trong DBMS
Định nghĩa dữ liệu - cung cấp ngocircn ngữ định nghĩa dữ liệu vagrave cho pheacutep tương quan dữ liệuThao taacutec dữ liệu - cung cấp một ngocircn ngữ truy vấn cho pheacutep nắm bắt vagrave khai thaacutec dữ liệuToagraven vẹn dữ liệu - cho pheacutep người sử dụng để mocirc tả caacutec quy tắc duy trigrave tiacutenh toagraven vẹn vagrave kiểm tra caacutec lỗi
Cơ sở mocirc higravenh Mocirc higravenh lagrave sự đơn giản hoacutea của sự kiện nagraveo đoacute được xacircy dựng để nghiecircn cứu
sự kiện
Cơ sở mocirc higravenh lagrave một biến thể của CSDL Noacute lưu trữ vagrave tổ chức caacutec mocirc higravenh khaacutec nhau magrave DSS sử dụng khi phacircn tiacutech chuacuteng
MBMS lagrave biến thể của DBMS Cơ sở mocirc higravenh chiacutenh lagrave caacutei thể hiện sự khaacutec biệt của một DSS với caacutec hệ
thống thocircng tin khaacutec Tổng quan chức năng của MBMS
Modeling language ndash Cho pheacutep tạo lập caacutec mocirc higravenh quyết định vagrave cung cấp cơ chế liecircn kết nhiều mocirc higravenh để tạo mocirc higravenh phức tạp hơn Model library ndash Lưu trữ vagrave quản lyacute tất cả caacutec mocirc higravenh cung cấp một catalog cugraveng với mocirc tả Model manipulation ndash Cho pheacutep quản lyacute vagrave xử lyacute cơ sở mocirc higravenh với caacutec chức năng (run store query etc) tương tự như caacutec chức năng trong một DBMS
5Cơ sở tri thức của DSS Mọi quyết định đuacuteng đắn đều đogravei hỏi quaacute trigravenh lập luận vagrave quaacute trigravenh nagravey lại
đogravei hỏi thocircng tin Cơ sở tri thức lagrave nơi lưu trữ tất cả caacutec thocircng tin dạng nagravey trong DSS Tri thức coacute thể đơn giản chỉ lagrave caacutec thocircng tin thocirc caacutec quy tắc caacutec heuristics
caacutec ragraveng buộc hoặc kết quả của quaacute khứ Tri thức nagravey khaacutec với thocircng tin cả trong CSDL vagrave cơ sở mocirc higravenh ở chỗ noacute
mang đặc trưng của bagravei toaacuten Nội dung kiến thức cơ sở
Tri thức trong cơ sở tri thức coacute thể được phacircn lagravem 2 loại Facts thể hiện điều chuacuteng ta coi lagrave đuacuteng tại thời điểm cho trước Hypotheses thể hiện caacutec quy tắc hoặc caacutec quan hệ magrave chuacuteng ta tin lagrave tồn tại giữa caacutec facts
Kiến thức thu nhận vagrave truy hồi Một hoặc một vagravei người sẽ thu thập thocircng tin cho cơ sở tri thức Đacircy lagrave những
người được đagraveo tạo đặc biệt về caacutec kỹ thuật để thu thập thocircng tin từ caacutec chuyecircn gia lĩnh vực
Mocirc tơ suy diễn (inference engine) lagrave một phần của cơ sở tri thức Noacute aacutep dụng caacutec quy tắc để lấy ra thocircng tin dưới dạng magrave người dugraveng mong muốn
6Giao diện người dugraveng Giao diecircn người dugraveng lagrave một thagravenh phần được thiết kế để cho pheacutep người
dugraveng truy cập tới caacutec thagravenh phần becircn trong của hệ thống
Thocircng thường giao diện cagraveng gần gũi thigrave cagraveng iacutet đogravei hỏi việc huấn luyện người dugraveng Hatildey suy nghĩ xem coacute bao nhiecircu chương trigravenh Windows dugraveng cugraveng cấu truacutec menu như Microsoft Word
Caacutec chức năng chiacutenh của một giao diện của DSS Communication language vagrave Presentation language
Communication language ndash Cho pheacutep tương taacutec với DSS theo nhiều caacutech xaacutec định caacutec dạng input cung cấp caacutec hỗ trợ cho người dugraveng thu giữ caacutec hội thoại đatilde qua để cải thiện caacutec tương taacutec trong tương lai
Presentation language ndash Cung cấp khả năng thể hiện dữ liệu theo nhiều caacutech cho pheacutep sinh caacutec baacuteo caacuteo chi tiết cung cấp nhiều khung nhigraven khaacutec nhau về dữ liệu
7Vai trograve người dugraveng Trong một DSS người dugraveng cũng lagrave một thagravenh phần của hệ thống giống như
hardware vagrave software User roles Người dugraveng được phacircn thagravenh 5 lớp (decision maker
intermediary maintainer operator and feeder) Patterns of DSS use Lagrave sự phacircn loại tiến theo của caacutec user roles khaacutec nhau
thagravenh 1 trong 4 basic patterns of use Slide tiếp theo sẽ mocirc tả caacutec patterns nagravey
8Caacutec mocirc higravenh sử dụng DSS Subscription mode _nhagrave sản xuất quyết định nhận caacutec baacuteo caacuteo thường
xuyecircn theo dự kiến Terminal mode_ nhagrave sản xuất quyết định tương taacutec trực tiếp với DSS Clerk mode - nhagrave sản xuất quyết định sử dụng hệ thống trực tiếpnhưng
khocircng trực tuyến Đầu ra phản hồi coacute thể mất một thời gian Intermediary mode - nhagrave sản xuất quyết định tương taacutec thocircng qua việc sử
dụng mộthoặc nhiều mocirc higravenh trung gian9Danh mục vagrave lớp của DSSCoacute nhiều phương phaacutep để cố gắng phacircn loại caacutec DSSs
Data-centric and model-centric Formal and ad hoc systems Directed versus nondirected DSSs Procedural and nonprocedural systems Hypertext systems Spreadsheet systems Individual and group DSSs
Caacutec đặc trưng thống nhất của mỗi lược đồ cụ thể giữ vai trograve quan trọng trong việc xaacutec định caacutech tiếp cận tốt nhất để thiết kế một hệ thống mới
Chương 2Quyết định vagrave quyết định của nhagrave sản xuất10Quaacute trigravenh ra quyết định
Quaacute trigravenh ra quyết định gồm coacute 3 giai đoạn (Simon 1977)bull Tigravem hiểu bagravei toaacuten dẫn đến quyết định
+Xaacutec định mục tiecircu tổ chức+Tigravem kiếm vagrave tập hợp dữ liệu+Nhận diện xaacutec định chủ thể bagravei toaacuten+phacircn loại vagrave phaacutet biểu vấn đề
bull Thiết kế (design) phacircn tiacutech vagrave xacircy dựng caacutec diễn trigravenh hagravenh động+Thiết lập mocirc higravenh+Lập bảng tiecircu chuẩn chọn lựa+Tigravem kiếm caacutec phương aacuten+Tiecircn đoaacuten vagrave đo lường caacutec kết cục
bull Chọn lựa (choice) chọn một diễn trigravenh trong tập diễn trigravenh+Giải phaacutep cho mocirc higravenh+Phacircn tiacutech độ nhạy+Chọn (caacutec) phương aacuten tốt nhất+Hoạch định việc hiện thực
tiếp theo giai đoạn chọn lựa lagrave giai đoạn hiện thực (implementation)11Người ra quyết định
Người ra quyết định (decision maker) giữ một vai trograve tacircm thần phacircn liệt vigrave vừa được coi lagrave một bước trong quaacute trigravenh vagrave cũng lại lagrave người tham gia
Phacircn lớp người ra quyết định-Quyết định caacute nhacircn coacute thể lagrave 1 người hoặc một hệ thống maacutey tiacutenh đơn lẻ-Nhiều người ra quyecirct định coacute thể lagrave
+Nhoacutem (group)trong đoacute mọi thagravenh viecircn đều coacute tiếng noacutei trong việc ra quyết định
+Đội(team) Caacutec thagravenh viecircn hỗ trợ một người ra quyết định duy nhất+Tổ chứcTrong đoacute cần sự thỏa thuận chung
12Caacutec kiểu ra quyết định Style lagrave caacutech magrave người quản lyacute ra quyết định
Hiệu lực của mỗi style riecircng biệt phụ thuộc vagraveo ngữ cảnh bagravei toaacuten nhận thức của người ra quyết định vagrave tập caacutec giaacute trị caacute nhacircn của bản thacircn họ
Độ phức tạp của caacutec điều đoacute liecircn kết lại với nhau trong việc higravenh thagravenh decision style
Caacutec kiểu ra quyết định Directive ndash kết hợp đogravei hỏi về cấu truacutec bagravei toaacuten cao với mức độ nhập nhằng thấp
Thocircng thường đacircy lagrave caacutec quyết định coacute bản chất kỹ thuật vagrave đogravei hỏi iacutet thocircng tin Analytical ndash Mức độ nhập nhằng lớn hơn vagrave đogravei hỏi nhiều thocircng tin hơn Conceptual ndash Mức độ nhập nhằng cao vagrave thường gần gũi với caacutech ra quyết định
của con người Behavioral ndash đogravei hỏi lượng dữ liệu nhỏ vagrave thể hiện caacutei nhigraven ngắn hạn Thường
xảy ra xung đột necircn phải dựa vagraveo sự đồng thuận Caacutec kiểu ra quyết định trong thiết kế hệ trợ giuacutep quyecirct định
Những cản trở lớn chiacutenh lagrave phản ứng của người ra quyết định trước aacutep lực vagrave phương phaacutep dugraveng để giải bagravei toaacuten
Viacute dụ đối với những người khocircng chịu được aacutep lực trong dạng directive thigrave giao diện cần cho pheacutep người ra quyết định kiểm soất được hệ thống với khocircng coacute quaacute nhiều dữ liệu đầu vagraveo
Đối với kiểu analytic DSS cần cho pheacutep truy cập tới nhiều nguồn dữ liệu magrave người ra quyết định sẽ phacircn tiacutech
13Khoacute khăn khi xacircy dựng DSS
- Thocircng tin mocirc higravenh cấu truacutec -gt iacutet thocircng tin
- Khả năng của con người (khả năng hiểu biết) chỉ xử lyacute được từ 5-gt9 quaacute trigravenh thocircng tin khaacutec nhau
- Khocircng chắc chắn ( mức độ hoagraven thagravenh vagrave tiacutenh chiacutenh xaacutec)
- Coacute nhiều lựa chọn vagrave đa mục tiecircu
Chương 3Quyết định trong tổ chức
14Tổ chức lagrave gigrave Tổ chức Lagrave 1 hệ thống thống nhất caacutec nguồn tagravei nguyecircnĐược cấu thagravenh bởi caacutec
hệ thống nhỏ hơn ragraveng buộc với nhau bởi caacutec mục tiecircu đề ra
Tổng thể 1 tổ chức sẽ mạnh mẽ hơn rất nhiều so với tất cả caacutec thagravenh phần của noacute cộng lại
Mối liecircn hệ của caacutec quyecirct định Mục điacutech chiacutenh của caacutec tổ chức lagrave đưa ra caacutec quyết định trong mocirci trường kinh doanh Caacutec Quyết định phải phugrave hợp với giới hạncaacutec chiacutenh saacutech caacutec thủ tục vagrave lĩnh vực hoạt động Noacute khocircng phụ thuộc vagraveo người đưa ra quyết định lagrave ai Đoacute coacute thể lagrave 1 caacute nhacircn1 nhoacutem hay thậm chiacute DSSs
Độ đo của quyết địnhNăm khiacutea cạnh ảnh hưởng tới Quyết định
Kết cấu nhoacutem (Group Structure) Vai trograve trong nhoacutem(Group Roles) Quaacute trigravenh lagravem việc(Group Processes) Taacutec phong(Group Style) Quy tăc nhoacutem(Group Norm)
Kết cấu nhoacutem Trong 1 nhoacutem chuẩn caacutec thagravenh viecircn coacute traacutech nhiệm vagrave thẩm quyền ra quyết định như nhau Vai trograve trong nhoacutemTrong nhoacutem caacutec thagravenh viecircn đều coacute vai trograve riecircng vagrave
lagrave 1 phần quan trong trong cả tiến trigravenh Quaacute trigravenh lagravem việcQuaacute trigravenh dugraveng người trong nhoacutem ảnh hưởng tới loại
quyết định gacircy hiệu quả vagrave ảnh hưởng tới cả tiến trigravenh Taacutec phong Coacute phải taacutec phong của người ra quyết định coacute ảnh hưởng tới
chất lượng quyết định cuối khocircng Quy tắc nhoacutemQuy tắc nhoacutem lagrave cực kỳ quan trọng trong việc xaacutec định
hagravenh vi caacutec thagravenh viecircn nhoacutem trong caacutec tigravenh huống xatilde hội Phacircn cấp quyết định trong tổ chức3 cấp
Chiến lược Ban latildenh đạo cấp cao hoặc nhagrave quản lyacute Caacutec quyết định mang tiacutenh lacircu dagravei nhất
Chiến thuật Quản lyacute tầm trung Thực thi caacutec quyết định chiến lược đề ra
Thực hiện
Caacute nhacircn chuyecircn ngagravenh Tự đưa ra caacutec quyết định từng ngagravey
15Năng lực của hệ HTQD
1 HHTQĐ cơ bản hỗ trợ caacutec nhagrave ra quyết định trong caacutec tigravenh huống nửa cấu truacutec vagrave phi cấu truacutec bằng caacutech kết hợp phaacuten xử của con người vagrave xử lyacute thocircng tin bằng maacutey tiacutenh Caacutec bagravei toaacuten như vậy khocircng thểkhocircng thuận tiện giải quyết được chỉ bằng caacutec cocircng cụ maacutey tiacutenh hoacutea hay caacutec phương phaacutep định lượng 2 Phugrave hợp cho caacutec cấp quản lyacute khaacutec nhau từ cao đến thấp 3 Phugrave hợp cho caacute nhacircn lẫn nhoacutem Caacutec bagravei toaacuten iacutet coacute tiacutenh cấu truacutec thường liecircn đới đến nhiều caacute nhacircn ở caacutec đơn vị chức năng hay mức tổ chức khaacutec nhau cũng như ở caacutec tổ chức khaacutec 4 Hỗ trợ cho caacutec quyết định tuần tự liecircn thuộc được đưa ra một lần vagravei lần hay lặp lại 5 Hỗ trợ cho caacutec giai đoạn của quaacute trigravenh ra quyết định tigravem hiểu thiết kế lựa chọn vagrave hiện thực 6 Phugrave hợp cho một số caacutec phong caacutech vagrave quaacute trigravenh ra quyết định 7 Coacute thể tiến hoacutea theo thời gian Người dugraveng coacute thể thecircm bỏ kết hợp thay đổi caacutec phần tử cơ bản của hệ thống 8 Dễ dugraveng vagrave thacircn thiện với người dugraveng 9 Nhằm vagraveo nacircng cao tiacutenh hiệu dụng của quyết định (chiacutenh xaacutec thời gian tiacutenh chất lượng) thay vigrave lagrave tiacutenh hiệu quả (giaacute phiacute của việc ra quyết định) 10 Người ra quyết định kiểm soaacutet toagraven bộ caacutec bước của quaacute trigravenh ra quyết định HHTQĐ chỉ trợ giuacutep khocircng thay thế người ra quyết định 11 Người dugraveng cuối cugraveng coacute thể tự kiến tạo vagrave sửa đổi caacutec hệ thống nhỏ vagrave đơn giản 12 Thường dugraveng mocirc higravenh để phacircn tiacutech caacutec tigravenh huống ra quyết định 13 Cung ứng caacutec truy đạt dữ liệu từ nhiều nguồn dạng thức vagrave kiểu khaacutec nhau 14 Coacute thể dugraveng như một cocircng cụ độc lập hay kết hợp với caacutec HHTQĐứng dụng khaacutec dugraveng đơn lẻ hay trecircn một mạng lưới maacutey tiacutenh (intranet extranet) bất kỳ với cocircng nghệ WEB
16Văn hoacutea tổ chứcVăn hoacutea của tổ chức lagrave tập hợp của rất nhiều thứ (lograveng tin biểu tượng đặc trưng regraven luyện) được phaacutet triển qua thời gian dagravei
Noacute gacircy ra ảnh hưởng mạnh mẽ cograven hơn cả những hoạt động của tổ chức đoacute 10 đặc điểm văn hoacutea của tổ chức
Điều khiển Hệ thống khen thưởng Sự đồng nhất Chịu đựng xung đột Mocirc higravenh giao tiếp Hỗ trợ quản lyacute Sự hogravea nhập Định hướng Chịu đựng rủi ro Caacute nhacircn khởi xướng
Mối quan hệ của văn hoacutea với hiệu năng lagravem việc1 tổ chức thagravenh cocircng phải coacute xu hướng hogravea hợp giữa văn hoacutea với mocirci trường trong vagrave ngoagravei tổ chức
Phugrave hợp trong nội bộ cho thấy một sự kết hợp giữa văn hoacutea của tổ chức với những cocircng nghệ của chiacutenh noacute
Phugrave hợp với becircn ngoagravei cho thấy một nền văn hoacutea phugrave hợp với chiến lược thị trường
Văn hoacutea vagrave sự thay đổi 1 tổ chức magrave khocircng biết thay đổi văn hoacutea sẽ khocircng thể giữ được vị triacute của migravenh trecircn thị trường Caacutec cocircng ty xuất sắc luocircn biết caacutech tiacutech cực tiếp cận khaacutech hagraveng động viecircn đầu tư
17Quyền lực vagrave chiacutenh trịQuyền lực vagrave chiacutenh trị luocircn đi liền với nhau
aQuyền lựclagrave khả năng ảnh hưởng đến việc phacircn phối caacutec nguồn lực trong tổ chứcGồm 5 yếu tố cơ bản
Phacircn quyền Uy quyền Quyền lực caacute nhacircn Sức ảnh hưởng Chiacutenh trị
Một vagravei thagravenh phần của quyền lực ra quyết định Quyết định việc nagraveo coacute sẵn
Quyết định sản phẩm nagraveo được sản xuất Quyết định đầu tư vagraveo đacircu Quyền đặt vagrave quản lyacute quản lyacute giaacute Thanh toaacuten vagrave khấu trừ tiền latildei
bChiacutenh trị Yếu tố cốt lotildei trong quaacute trigravenh higravenh thagravenh chiến lược ra quyết định Chiacutenh trị liecircn quan tới việc ra quyết định thocircng qua đagravem phaacutenảnh hưởngvagrave higravenh
thagravenh sự nhất triacute Trong nhiều trường hợp noacute coacute thể cho ta sự linh hoạt hơn
18Hệ trợ giuacutep quyết định trong tổ chức DSS của 1 tổ chức hỗ trợ cocircng nghệ tập trung vagraveo caacutec quyết định ảnh hưởng tới
rất nhiều người 1 hệ thống DSS hiện đại coacute thể chấp nhận nhiều quyết định vượt qua những giới
hạn phacircn cấp truyền thống aCaacutec hoạt động gần DSS
Giải quyết caacutec nhiệm vụ đặc biệt Thu thập thocircng tin Liecircn lạc qua caacutec chi nhaacutenh Động thaacutei chiacutenh trị
Phacircn loại tư duy chiến lược cho DSS Sắp xếp quyết địnhXếp hạng quyết định sao cho thứ tự đứng trước thigrave được
ưu tiecircn trước Chia sẻ thocircng tinCaacutec quyecirct định coacute thể độc lập nhưng người ra quyết định
phải chia sẻ caacutec thocircng tin liecircn quan Lựa chọn đagravem phaacutenVagravei quyết định coacute thể xaacutec lập thocircng qua đagravem phaacuten vagrave kết
quả được lagravem đồng thờiKhocircng phải cocircng nghệ tự noacute coacute thể đưa ra quyết định magrave noacute nằm ở trigravenh độ cocircng nghệ hỗ trợ caacutec chiến lược quyết định quyền lực vagrave chiacutenh trị cugraveng phối hợp với nhau
Chương 4Mocirc higravenh hoacutea quaacute trigravenh ra quyết định
(Cấu truacutec của hệ HTQD)19Vấn đề Mocirc higravenh
bull Lagrave phần tử chủ chốt trong hầu hết hệ hỗ trợ quyết định vagrave lagrave điều kiện cần trong hệ hỗ trợ quyết định dựa vagraveo mocirc higravenh (model-based DSS)
bull Coacute nhiều lớp mocirc higravenh kegravem theo lagrave caacutec kỹ thuật xử lyacute thao taacutec mocirc higravenh đặc thugrave tương ứng
bull Caacutec vấn đề chiacutenh nhận diện bagravei toaacuten vagrave phacircn tiacutech mocirci trường nhận diện biến số dự baacuteo đa mocirc higravenh caacutec phạm trugrave mocirc higravenh quản lyacute mocirc higravenh vagrave mocirc higravenh hoacutea dựa vagraveo kiến thức
bull Mocirc higravenh hoacutea lagrave taacutec vụ khocircng đơn giản Người xacircy dựng mocirc higravenh phải cacircn bằng giữa tiacutenh đơn giản của mocirc higravenh với caacutec yecircu cầu biểu diễn để mocirc higravenh coacute thể nắm bắt đủ thực tại cần thiết cho người ra quyết định
bull Mocirc phỏng lagrave kỹ thuật mocirc higravenh hoacutea thocircng dụng dugraveng để tigravem hiểu vấn đề tuy khocircng nhất thiết phải tigravem ra được caacutec giải phaacutep biến thể mở rộng quaacute trigravenh ra quyết định của tổ chức vagrave cho pheacutep tổ chức xem xeacutet taacutec độngảnh hưởng của caacutec chọn lựa tương lai
bull Mocirc phỏng tiết kiệm rất nhiều chi phiacute vagrave thời gian ndash rất dễ thay đổi mocirc higravenh hoạt động của một hệ thống vật lyacute bằng mocirc higravenh hoacutea maacutey tiacutenh
bull Mocirc higravenh coacute thể được phaacutet triển vagrave cagravei đặt bằng một số caacutec ngocircn ngữ lập trinh (thế hệ 3 4 ) vagrave hệ thống phần mềm khaacutec nhau
Mocirc higravenh tĩnh vagrave động
bull Mocirc higravenh tĩnh thể hiện bức tranh tại thời điểm của tigravenh huống Caacutec khiacutea cạnh của bagravei toaacuten được xeacutet một thời kỳ nhất định trong một khung thời gian nhất định (coacute thể ldquocuốnrdquo về tương lai) Caacutec tigravenh huống được giả sử lagrave sẽ lập lại với tập caacutec điều kiện đồng nhất
1048713 Giả định coacute được tiacutenh ổn định của dữ liệu 1048713 Mocirc phỏng quaacute trigravenh dạng tĩnh - lagravem việc trecircn caacutec trạng thaacutei ổn định để tigravem ra caacutec
thocircng số tối ưu ndash thường được dugraveng như cocircng cụ chủ yếu để thiết kế quaacute trigravenh 1048713 vd quyết định sản xuấtmua 1 sản phẩm baacuteo caacuteo thu nhập hagraveng quyacutenăm bull Mocirc higravenh động biểu diễn caacutec kịch bản thay đổi theo thời gian 1048713 Phụ thuộc thời gian caacutec trạng thaacutei thay đổi theo thời gian 1048713 Thường dugraveng để tạo sinh vagrave biểu diễn caacutec xu hướng vagrave khuocircn mẫu theo thời gian 1048713 Mocirc phỏng động thể hiện caacutec diễn tiến khi caacutec điều kiện theo thời gian khaacutec với caacutec
trạng thaacutei ổn định ndash thường được dugraveng để thiết kế việc kiểm soaacutet caacutec hệ thống 1048713 VD dự baacuteo lời-lỗ trong 5 năm với caacutec nhập lượng như giaacute phiacute số lượng thay đổi
theo từng năm
Mocirc higravenh chắc chắn tương đối dễ phaacutet triển giải quyết vagrave coacute thể sinh ra caacutec giải phaacutep tối ưu 1048713 Caacutec bagravei toaacuten coacute một số lớnvocirc hạn caacutec giải phaacutep khả thi đặc biệt quan trọng 1048713 Caacutec mocirc higravenh tagravei chaacutenh được xacircy dựng trong điều kiện chắc chắn
Mocirc higravenh bất địnhbằng caacutech thu thập thecircm thocircng tin cố gắng đưa bagravei toaacuten trở về dạng chắc chắn hay dạng
rủi ro Mocirc higravenh rủi ro caacutec quyết định kinh doanh được đưa ra dưới caacutec rủi ro giả định
1048713 Đocirci khi biết được xaacutec suất của caacutec sự kiện xảy ra trong tương lai 1048713 Caacutec trường hợp khaacutec (bất định) ước lượng caacutec rủi ro vagrave giả sử caacutec tigravenh huống rủi ro
xảy ra 20Mocirc higravenh hoacutea
MOcirc HIgraveNH HOacuteA BẰNG BẢNG TIacuteNH bull Bảng tiacutenh phần mềm mạnh linh hoạt vagrave dễ dugraveng cho pheacutep tạo sinh caacutec ứng dụng trong kinh doanh kỹ thuật toaacuten vagrave khoa học với tập caacutec hagravem mạnh về tagravei chaacutenh thống kecirc toaacuten bull Kegravem theo lagrave caacutec thagravenh phần cộng thecircm (add-ins) giuacutep xacircy dựng vagrave giải caacutec lớp mocirc higravenh đặc thugrave bull Lagrave cocircng cụ mocirc higravenh hoacutea thocircng dụng nhất của người dugraveng cuối cugraveng bull Coacute caacutec chức năng về phacircn tiacutech ldquowhat-ifrdquo dograve tigravem mục tiecircu quản lyacute dữ liệu vagrave lập trigravenh (dạng macro) bull Coacute khả năng đọc ghi caacutec cấu truacutec tập tin thocircng dụng để giao tiếp được với caacutec CSDL vagrave cocircng cụ khaacutec bull Coacute thể xacircy dựng mocirc higravenh tĩnh vagrave động bull Dugraveng trecircn maacutey tiacutenh caacute nhacircn vagrave maacutey tiacutenh lớn
bull Cơ sở để xacircy dựng caacutec bảng tiacutenh đa chiều vagrave caacutec cocircng cụ xử lyacute phacircn tiacutech trực tuyến (OLAP) MOcirc HIgraveNH HOacuteA BẰNG PHAcircN TIacuteCH QUYẾT ĐỊNH bull Tiếp cận mocirc higravenh hoacutea caacutec tigravenh huống quyết định coacute một số hữu hạnkhocircng quaacute nhiều caacutec phương aacuten ndash mỗi phương aacuten được trigravenh ra dưới dạng bảng hay đồ thị - caacutec kết quả tương ứng (dự baacuteo được kegravem xaacutec suất) theo mục tiecircu bagravei toaacuten ndash từ đoacute chọn phương aacuten tốt nhất bull Đơn mục tiecircu bảng quyết định hay cacircy quyết định bull Đa mục tiecircu AHP (analytic hierarchy process) khaacutec
MOcirc HIgraveNH HOacuteA BẰNG QUY HOẠCH TOAacuteN
bull Quy hoạch toaacuten học (mathematical programming) lagrave họ caacutec cocircng cụ giải quyết caacutec bagravei toaacuten quản lyacute theo đoacute người ra quyết định phải cấp phaacutet caacutec tagravei nguyecircn khan hiếm cho caacutec hoạt động cạnh tranh nhau (caacutec phương aacuten) nhằm tối ưu hoacutea mục tiecircu coacute khả năng đo lường được bull Caacutec mocirc higravenh quy hoạch tuyến tiacutenh (linear programming) thocircng dụng nhất trong quy hoạch toaacuten coacute nhiều ứng dụng trong thực tế được dugraveng nhiều trong caacutec hệ hỗ trợ quyết định bull Bagravei toaacuten quy hoạch tuyến tiacutenh 1048713 Caacutec biến quyết định (cần tigravem giaacute trị) 1048713 Hagravem mục tiecircu (hagravem toaacuten học dạng tuyến tiacutenh xaacutec định quan hệ giữa biến quyết định vagrave mục tiecircu đo lường mức độ đạt đạt mục tiecircu vagrave cần được tối ưu hoacutea) 1048713 Caacutec hệ số của hagravem mục tiecircu (cho biết mức đoacuteng goacutep vagraveo mục tiecircu của 1 đơn vị biến quyết định) 1048713 Ragraveng buộc (biểu thức tuyến tiacutenh cho biết giới hạn tagravei nguyecircn vagravehay caacutec quan hệ giữa caacutec biến số) 1048713 Dung lượng (mocirc tả cận trecircn vagrave dưới của caacutec biến vagrave ragraveng buộc) 1048713 Hệ số (cocircng nghệ) vagraveo-ra (cho biết mức độ sử dụng tagravei nguyecircn của biến quyết định) bull Đặc điểm của bagravei toaacuten quy hoạch tuyến tiacutenh 1048713 Tagravei nguyecircn kinh tế của bagravei toaacuten lagrave coacute hạn vagrave sẵn sagraveng 1048713 Coacute nhiều caacutech (gt2 caacutech) sử dụng tagravei nguyecircn được gọi lagrave giải phaacutep hay chương trigravenh 1048713 Mỗi hoạt động dugraveng tagravei nguyecircn đều sinh ra kết quả dưới dạng mục tiecircu đatilde phaacutet biểu trước 1048713 Việc cấp phaacutet nằm trong caacutec ragraveng buộc cho trước bull Giả định của bagravei toaacuten quy hoạch tuyến tiacutenh 1048713 Caacutec kết quả của caacutec cấp phaacutet coacute thể đem so saacutenh với nhau coacute thể đo lường bằng một đơn vị chung
1048713 Caacutec cấp phaacutet độc lập với nhau về mặt kết quả 1048713 Kết quả cuối cugraveng lagrave tổng của caacutec kết quả từ caacutec hoạt động riecircng rẽ khaacutec nhau 1048713 Dữ liệu coacute tiacutenh chắc chắn 1048713 Tagravei nguyecircn được dugraveng một caacutech kinh tế nhất 1048713 Thường coacute một số lớn caacutec giải phaacutep với kết quả khaacutec nhau 1048713 Trong số caacutec giải phaacutep coacute thể coacute 1 giải phaacutep tốt nhất ndash mức độ đạt được mục tiecircu cao nhất ndash gọi lagrave giải phaacutep tối ưu được tigravem ra bằng một giải thuật đặc biệt MOcirc HIgraveNH HOacuteA BẰNG HEURISTIC bull Việc tigravem giải phaacutep tối ưu của một số bagravei toaacuten quyết định phức tạp coacute thể tốn nhiều thời gian chi phiacute hay khocircng thể tigravem ra được Cograven nếu dugraveng tiếp cận mocirc phỏng cũng coacute thể keacuteo dagravei phức tạp khocircng thiacutech hợp hay thậm chiacute khocircng chiacutenh xaacutec
bull Lagrave một tiếp cận giuacutep tigravem ra caacutec giải phaacutep khả thithỏa matildenđủ tốt cho caacutec bagravei toaacuten phức tạp Coacute thể coacute giải phaacutep đủ tốt (90-999 giaacute trị của lời giải tối ưu) nhanh choacuteng vagrave đỡ tốn keacutem hơn bằng caacutech dugraveng heuristics bull Quaacute trigravenh heuristic lagrave datildey caacutec bước xacircy dựng caacutec quy luật giải quyết vấn đề thocircng qua việc tigravem kiếm caacutec con đường hứa hẹn nhất dẫn đến lời giải tigravem kiếm caacutech thức thu thập vagrave phacircn giải thocircng tin theo quaacute trigravenh giải vagrave phaacutet triền caacutec phương phaacutep dẫn đến một giải thuật tiacutenh toaacuten hay một lời giải tổng quaacutet đatilde coacute bull Aacutep dụng chủ yếu cho bagravei toaacuten cấu truacutec yếu cũng dugraveng để tigravem ra giải phaacutep chấp nhận được cho bagravei toaacuten cấu truacutec chặt bull Khocircng đủ tổng quaacutet như caacutec giải thuật thường chỉ dugraveng cho tigravenh huống đặc thugrave đang xeacutet bull Coacute thể dẫn đến một giải phaacutep dở - caacutec thủ tục từng bước giải quyết vấn đề khocircng đảm bảo tigravem ra giải phaacutep tối ưu bull Heuristic coacute thể lagrave định lượng vigrave vậy coacute thể đoacuteng vai trograve quan trọng trong cơ sở mocirc higravenh của hệ hỗ trợ quyết định bull Heuristic coacute thể lagrave định tiacutenh vigrave vậy coacute thể đoacuteng vai trograve quan trọng trong cung ứng kiến thức cho hệ chuyecircn gia bull Quaacute trigravenh heuristic liecircn quan đến tigravem kiếm học tập ước lượng phacircn xử vagrave lặp lại caacutec hoạt động nagravey dọc theo tiến trigravenh bull Kiến thức thu được dugrave thagravenh cocircng hay thất bại trong quaacute trigravenh đều được phản hồi vagrave sửa đổi chiacutenh quaacute trigravenh nhờ đoacute coacute thể định nghĩa lại mục tiecircu hay bagravei toaacuten 1048713 Giải thuật di truyền bắt đầu bằng tập caacutec giải phaacutep được sinh ngẫu nhiecircn taacutei kết hợp caacutec cặp giải phaacutep một caacutech ngẫu nhiecircn bull Tigravenh huống necircn dugraveng heuristics 1048713 Dữ liệu đầu vagraveo khocircng chiacutenh xaacutec hay coacute giới hạn 1048713 Thực tế quaacute phức tạp đến nỗi khocircng dugraveng được caacutec mocirc higravenh tối ưu 1048713 Chưa coacute được giải thuật chiacutenh xaacutec vagrave đủ tin cậy 1048713 Bagravei toaacuten phức tạp necircn sẽ khocircng kinh tế nếu dugraveng tối ưu hay mocirc phỏng hoặc tốn quaacute nhiều thời gian tiacutenh toaacuten 1048713 Coacute thể cải thiện tiacutenh hiệu quả của quaacute trigravenh tối ưu (tức coacute thể sinh ra caacutec giải phaacutep ban đầu tương đối tốt) 1048713 Liecircn quan đến xử lyacute kyacute hiệu chứ khocircng phải xử lyacute kyacute số (như hệ chuyecircn gia) 1048713 Cần coacute quyết định nhanh vagrave caacutec xử lyacute dựa vagraveo maacutey tiacutenh đều khocircng khả thi (một số heuristic khocircng cần đến maacutey tiacutenh) bull Thuận lợi 1048713 Dễ hiểu dễ giải thiacutech vagrave dễ cagravei đặt 1048713 Nacircng cao tiacutenh saacuteng tạo vagrave năng lực heuristic cho caacutec vấn đề khaacutec 1048713 Tiết kiệm thời gian xaacutec lập vấn đề 1048713 Tiết kiệm yecircu cầu về bộ chứa vagrave xử lyacute maacutey tiacutenh
1048713 Tiết kiệm thời gian tiacutenh toaacuten vagrave do vậy tiết kiệm thời gian thực trong ra quyết định Một số vấn đề phức tạp đến nỗi chỉ coacute thể giải được bằng heuristics 1048713 Thường sinh ra nhiều giải phaacutep chấp nhận được 1048713 Thường coacute thể phaacutet biểu lyacute thuyết hay đo lường thực nghiệm về chất lượng của giải phaacutep (tức giaacute trị mục tiecircu của giải phaacutep gần với giaacute trị tồi ưu đến mức nagraveo dugrave giaacute trị tối ưu chưa biết được) 1048713 Coacute thể kết hợp tiacutenh thocircng minh vagraveo để hướng dẫn pheacutep tigravem kiếm (tigravem kiếm tabu) Năng lực thocircng minh đoacute coacute thể lagrave đặc thugrave theo bagravei toaacuten hoặc dựa trecircn yacute kiến chuyecircn gia được cấy trong hệ chuyecircn gia hoặc cơ chế tigravem kiếm 1048713 Coacute thể dugraveng heuristic hiệu quả vagraveo caacutec mocirc higravenh coacute thể giải bằng quy hoạch toaacuten học Đocirci khi heuristic lagrave phương phaacutep được ưa thiacutech hơn khi khaacutec giải phaacutep heuristics được dugraveng như giải phaacutep ban đầu cho caacutec phương phaacutep quy hoạch toaacuten học bull Hạn chế 1048713 Khocircng đảm bảo coacute được giải phaacutep tối ưu 1048713 Caacutec quy luật coacute rất nhiều ngoại lệ 1048713 Caacutec lựa chọn quyết định tuần tự coacute thể khocircng tiecircn đoaacuten được caacutec kết cục tương lai của mỗi chọn lựa 1048713 Sự liecircn thuộc giữa caacutec phần trong hệ thống đocirci khi coacute thể gacircy ra caacutec ảnh hưởng lớn lao lecircn toagraven hệ thống bull Phacircn loại caacutec giải thuật heuristic 1048713 Heuristic xacircy dựng xacircy dựng giải phaacutep khả thi bằng caacutech cộng thecircm từng thagravenh phần một VD bagravei toaacuten người baacuten hagraveng ndash luocircn gheacute thagravenh phố chưa viếng thăm kế tiếp gần nhất
1048713 Heuristic cải tiến bắt đầu bằng một giải phaacutep khả thi vagrave cố gắng cải tiến liecircn tục trecircn đoacute VD trecircn thử hoaacuten đổi 2 thagravenh phố 1048713 Quy hoạch toaacuten aacutep dụng vagraveo caacutec mocirc higravenh chứa iacutet ragraveng buộc nhằm coacute được thocircng tin về thỏa hiệp tốt nhất với mocirc higravenh nguyecircn gốc Thường được dugraveng trong tối ưu hoacutea nguyecircn (integer optimization) 1048713 Chia giai đoạn giải quyết một vấn đề theo từng giai đoạn VD ở PampG trecircn đacircy bagravei toaacuten phacircn phối được giải quyết trước sau đoacute dugraveng giải quyết bagravei toaacuten chiến lược sản phẩm 1048713 Phacircn ratilde chia bagravei toaacuten thagravenh caacutec phần nhỏ hơn coacute thể giải quyết được sau đoacute kết hợp caacutec giải phaacutep đoacute lại VD chia latildenh thổ baacuten hagraveng thagravenh 4 vugraveng khaacutec nhau giải quyết cho từng vugraveng sau đoacute kết nối caacutec giải phaacutep
21Mocirc phỏngbull Giả định caacutec đặc điểm của thực tạibull Lagrave kỹ thuật tiến triển caacutec thực nghiệm (như phacircn tiacutech ldquowhat-ifrdquo) - bằng maacutey tiacutenh -trecircn một mocirc higravenh của hệ thocircng tin quản lyacute
bull Khocircng thực sự lagrave một mocirc higravenh vigrave khocircng biểu diễn thực tại magrave lagrave cố gắng bắtchước thực tạibull Một trong những phương phaacutep thocircng dụng nhất trong HHTQĐbull HHTQĐ lagravem việc với caacutec bagravei toaacuten phi cấu truacutec vagrave cấu truacutec yếu tigravenh huống thực tếphức tạp ndash khocircng dễ biểu diễn bằng mocirc higravenh tối ưu hay caacutec dạng mocirc higravenh khaacutecnhưng lại thường coacute thể xử lyacute được bằng mocirc phỏngbull Đặc điểm1048713 Iacutet đưa ra caacutec đơn giản hoacutea về thực tại hơn caacutec mocirc higravenh khaacutec1048713 Do triển khai caacutec thực nghiệm necircn noacute coacute thể kiểm thử caacutec giaacute trị cụ thể của caacutecbiến quyết địnhbiến khocircng kiểm soaacutet được của mocirc higravenh vagrave xem xeacutet ảnh hưởnglecircn caacutec biến kết quả1048713 Phương phaacutep coacute tiacutenh mocirc tả (như vậy khaacutec với phương phaacutep danh định)1048713 Khocircng tự động tigravem kiếm giải phaacutep tối ưu ndash noacute mocirc tảtiecircn đoaacuten caacutec đặc tiacutenh của hệthống đatilde cho dưới caacutec điều kiện khaacutec nhau từ đoacute coacute thể chọn ra phương aacuten tốtnhất1048713 Quaacute trigravenh mocirc phỏng thường lặp lại một thực nghiệm nhiều lần để coacute được ướclượng về hiệu ứng tổng quaacutet của một số hagravenh động nhất định1048713 Mocirc phỏng maacutey tiacutenh thiacutech hợp cho hầu hết caacutec tigravenh huống mặc dugrave cũng coacute một sốmocirc phỏng thủ cocircng thagravenh cocircng1048713 Thường chỉ được dugraveng khi bagravei toaacuten quaacute phức tạp khocircng thể xem xeacutet bằng caacutec kỹthuật tối ưu dạng số Tiacutenh phức tạp theo nghĩa bagravei toaacuten khocircng thể cocircng thức hoacuteacho tối ưu (do khocircng thotildea caacutec giả định) hoặc cocircng thức quaacute lớn quaacute nhiều tươngtaacutec giữa caacutec biến hoặc về bản chất bagravei toaacuten lagrave bất định hay rủi roPhương phaacutep mocirc phỏng thiết lập mocirc higravenh của hệ thống thực vagrave tiến hagravenh caacutec thựcnghiệm lặp lại trecircn mocirc higravenh
bull Thuận lợi1048713 Lyacute thuyết tương đối trực tiếp hiệu ứng dagravei hạn của nhiều chiacutenh saacutech -gt neacuten thờigian lớn1048713 Do tiacutenh chất mocirc tả (khaacutec với danh định)1048713 Coacute thể thấy được nhanh choacuteng coacute thể đặt ra caacutec cacircu hỏi ldquowhat-ifrdquo coacute thể dugravengtiếp cận thử-vagrave-sai vagraveo giải quyết vấn đề một caacutech nhanh choacuteng rẻ chiacutenh xaacutec iacutetrủi ro hơn1048713 Thử nghiệm được biến quyết định phần nagraveo của mocirci trường thực sự quan trọngvới caacutec phương aacuten khaacutec nhau1048713 Yecircu cầu kiến thức riecircng biệt về bagravei toaacuten vigrave thế buộc người xacircy dựng mocirc higravenh phảilagravem việc thường xuyecircn với nhagrave quản lyacute ndash đối tượng mong muốn của HHTQĐ để
từ đoacute bản chất bagravei toaacuten vagrave caacutec quyết định được hiểu tốt hơn1048713 Mocirc higravenh được xacircy dựng từ viễn cảnhcaacutech nhigraven của nhagrave quản lyacute1048713 Mocirc higravenh chỉ cho một bagravei toaacuten riecircng biệt thường khocircng thể dugraveng giải caacutec bagravei toaacutenkhaacutec Như vậy mỗi thagravenh phần của mocirc higravenh ứng với một phần của hệ thống thựcdo đoacute sẽ khocircng yecircu cầu nhagrave quản lyacute phải tổng quaacutet hoacutea caacutec hiểu biết của migravenh1048713 Phổ bagravei toaacuten giải được rất rộng tồn kho nhacircn sự hoạch định chiến lược 1048713 Coacute thể chứa caacutec phức tạp thực sự của bagravei toaacuten khocircng cần caacutec đơn giản hoacutea (TDdugraveng caacutec phacircn phối xaacutec suất thực thay vigrave phacircn phối lyacute thuyết xấp xỉ)1048713 Coacute thể tự động sinh ra nhiều đo lường hiệu năng quan trọng1048713 Thường lagrave phương phaacutep duy nhất của HHTQĐ coacute thể xử lyacute caacutec bagravei toaacuten tương đốiphi cấu truacutec1048713 Coacute một số caacutec goacutei phần mềm mocirc phỏng (Monte Carlo) tương đối dễ dugravengbull Điểm yếu1048713 Tuy thường tigravem được caacutec phương aacuten đủ tốt nhưng khocircng đảm bảo lời giải tối ưu1048713 Quaacute trigravenh xacircy dựng mocirc higravenh thường dagravei vagrave tốn keacutem1048713 Giải phaacutep vagrave suy diễn từ nghiecircn cứu mocirc phỏng thường khocircng thể chuyển sang bagraveitoaacuten khaacutec vigrave mocirc higravenh kết hợp caacutec yếu tố đặc thugrave1048713 Đocirci khi do mocirc higravenh quaacute dễ giải thiacutech cho nhagrave quản lyacute necircn caacutec phương phaacutep phacircntiacutech thường xem nhẹ1048713 Phần mềm mocirc phỏng đocirci khi yecircu cầu caacutec kỹ năng đặc biệt do độ phức tạp củaphương phaacutep giải higravenh thứcbull Caacutec loại mocirc phỏng1048713 Mocirc phỏng xaacutec suất một hay nhiều biến độc lập mang tiacutenh xaacutec suất với 2 loạiphacircn phối ndash thường dugraveng kỹ thuật Monte Carlo1048713 Phacircn phối rời rạc tigravenh huống coacute một số giới hạn caacutec biến cố (biến) với hữu hạncaacutec giaacute trị cho mỗi biến cố (biến)1048713 Phacircn phối liecircn tục tigravenh huống coacute số lượng khocircng giới hạn caacutec biến cố tuacircn theocaacutec hagravem mật độ xaacutec suất như phacircn phối chuẩn1048713 Mocirc phỏng độc lậpphụ thuộc theo thời gian1048713 Độc lập khocircng cần thiết phải biết chiacutenh xaacutec thời điểm xảy ra biến cố (nhu cầutiecircu thụ lượng sản phẩm trong ngagravey khocircng biết chiacutenh xaacutec thời điểm tiecircu thụ)1048713 Phụ thuộc cần biết chiacutenh xaacutec thời điểm xảy ra sự kiện (bagravei toaacuten hagraveng đợi)1048713 Mocirc phỏng tương taacutec trực quan1048713 Mocirc phỏng hướng đối tượng dugraveng tiếp cận hướng đối tượng để xacircy dựng mocirc higravenhmocirc phỏng Chuacute yacute ngocircn ngữ mocirc higravenh hoacutea nhất thể UML (unified modelinglanguage) kể cả khi mocirc phỏng caacutec hệ thời gian thựcMOcirc HIgraveNH HOacuteA ĐA CHIỀU ndash XỬ LYacute PHAcircN TIacuteCH TRỰC TUYẾNbull Người ra quyết định thường phải xem xeacutet nhiều chiều của dữ liệu (TD caacutec chiềucủa dữ liệu baacuten hagraveng lagrave sản phẩm vugraveng thời gian người baacuten ) dữ liệu cần đượcphacircn tiacutech trực tiếp bằng caacutec cocircng cụ chuẩn hay phacircn tiacutech tự động bằng caacutec
phương phaacutep khai mỏ dữ liệu (data mining)bull Hầu hết caacutec hệ thống phacircn tiacutech đa chiều được nhuacuteng trong caacutec hệ xử lyacute phacircn tiacutechtrực tuyến (HXLPTTT ndash online analytic processing - OLAP)bull Mục tiecircu của XLPTTT nắm bắt cấu truacutec của dữ liệu thực để hỗ trợ ra quyết địnhbull Trong HHTQĐ coacute sự gắn nối tự nhiecircn giữa mocirc higravenh hoacutea dữ liệu mocirc higravenh hoacutea kyacutehiệu vagrave caacutec khiacutea cạnh của phacircn tiacutech ldquowhat-ifrdquobull Caacutec baacuteo caacuteo của HXLPTTT đều coacute tiacutenh tương taacutec dễ khai thaacutec sử dụng đặc biệtphugrave hợp cho caacutec baacuteo caacuteo về chỉ số hiệu năng chủ yếu (key performance indicators- KPI) baacuteo caacuteo về đo lường hiệu năng kinh doanh bull Thế hệ hiện tại của HXLPTTT vagrave hệ khai mỏ dữ liệu (data mining) tiacutech hợp caacutecđặc tiacutenh của hệ thocircng tin latildenh đạo (executive information system ndashEIS- nhiềucaacutech nhigraven dữ liệu chi tiết hoacutea theo nhu cầu) vagrave caacutec hệ đồ họa khaacutec ndash thường coacutegiao diện người dugraveng dạng kiểu WEBbull Caacutec hệ thống như trecircn cograven được gọi lagrave caacutec cocircng cụ triacute tuệ kinh doanh (businessintelligence - BI) vigrave coacute caacutec đặc trưng về mocirc higravenh hoacutea vagrave tối ưu hoacutea nhưng lạitrong suốt đối với ngươigrave dugravengbull Hiện caacutec cocircng cụ được đưa ra bởi caacutec nhagrave cung cấp về CSDL về hoạch định tagraveinguyecircn tổ chức (ERP) về nhagrave kho dữ liệu (data warehouse) về HXLPTTT MOcirc HIgraveNH HOacuteA VAgrave MOcirc PHỎNG TƯƠNG TAacuteC TRỰC QUANbull Iacutech lợi Người ra quyết định tham gia vagraveo quaacute trigravenh phaacutet triển mocirc higravenh vagrave thựcnghiệm mocirc phỏng vigrave vậy sẽ tin tưởng khi sử dụng mocirc higravenhbull Mocirc higravenh hoacutea tương taacutec trực quan (visual interactive modeling - VIM) dugraveng caacutecbiểu diễn đồ họa maacutey tiacutenh để trigravenh bagravey caacutec ảnh hưởng của caacutec quyết định quản lyacutekhaacutec nhau ở một thời điểm (tĩnh) hay tiến triển theo thời gian (động với kỹ thuậthoạt higravenh)bull Mocirc phỏng tương taacutec trực quan (visual interactive simulation - VIS) cho pheacutepngười dugraveng theo dotildei tiến trigravenh xacircy dựng vagrave sử dụng khai thaacutec mocirc higravenh mocirc phỏngdưới dạng hoạt higravenhbull Mocirc higravenh hoacutea tương taacutec trực quan coacute thể kết hợp với tiếp cận triacute tuệ nhacircn tạo đểđưa ra caacutec khả năng mới thay đổi từ xacircy dựng hệ thống dạng đồ họa đến tigravem hiểuvề động học của hệ thốngbull Cần đến caacutec hệ thống maacutey tiacutenh xử lyacute song song tốc độ cao để xacircy dựng caacutec mocircphỏng - phức tạp quy mocirc lớn dạng hoạt higravenh - mang tiacutenh khả thi ở thời gian thực
22Caacutec dạng hệ thống hỗ trợ ra quyết địnhHệ hỗ trợ quyết định nhoacutemRa quyết định nhoacutem giao tiếp vagrave cộng taacutec- Caacutec đặc điểm của cocircng việc nhoacutem+ Một nhoacutem thực hiện một nhiệm vụ thỉnh thoảng ra quyết định thỉnh thoảngkhocircng ra quyết định+ Caacutec thagravenh viecircn trong nhoacutem coacute thể ở những nơi khaacutec nhau
+ Caacutec thagravenh viecircn trong nhoacutem coacute thể lagravem việc ở những thời gian khaacutec nhau+ Caacutec thagravenh viecircn trong nhoacutem coacute thể lagravem việc cugraveng nhau hoặc ở caacutec tổ chức khaacutecnhau+ Nhoacutem coacute thể vĩnh viễn hoặc tạm thời+ Nhoacutem coacute thể ở bất kỳ mức quản lyacute nagraveo hoặc mức thời gian nagraveo+ Coacute sự điều phối (quaacute trigravenh vagrave nhiệm vụ đạt được) hoặc macircu thuẩn trongnhoacutem+ Coacute sự đạt được hoặcvagrave mất maacutet năng suất trong tổ chức+ Nhiệm vụ phải hoagraven thagravenh rất nhanh+ Khocircng thể hoặc quaacute đắt cho tất cả caacutec thagravenh viecircn trong nhoacutem cugraveng hợp ở mộtnơi+ Một số dữ liệu thocircng tin hoặc kiến thức cần thiết nằm ở nhiều nơi một sốkhaacutec ở ngoagravei tổ chức+ Chuyecircn mocircn của caacutec thagravenh viecircn khocircng coacute trong nhoacutem lagrave cần thiết- Caacutec hoạt động vagrave caacutec quaacute trigravenh miecircu tả caacutec cuộc họp+ Cuộc họp lagrave hoạt động chung liecircn quan bởi một nhoacutem người coacute địa vị bằngnhau hoặc gần bằng nhau+ Kết quả của cuộc họp phụ thuộc một phần vagraveo kiến thức yacute kiến caacutec đaacutenh giaacutecủa caacutec thagravenh viecircn+ Kết quả của cuộc họp cũng phụ thuộc vagraveo sự kết hợp của nhoacutem vagrave phụ thuộcvagraveo quaacute trigravenh ra quyết định được sử dụng bởi nhoacutem đoacute+ Giải quyết caacutec yacute kiến khaacutec nhau bởi người coacute quyền hạn hoặc thương lượnghoặc phacircn xửHỗ trợ giao tiếp- Giao tiếp lagrave thagravenh phần quan trọng cho hỗ trợ quyết định Khocircng coacute giao tiếp thigravekhocircng coacute cộng taacutec Những người ra quyết định caacute nhacircn phải giao tiếp với caacutecđồng nghiệp chuyecircn gia cơ quan chiacutenh phủ khaacutech hagraveng đối taacutec kinh doanh hellipHọ cũng cần dữ liệu vagrave thocircng tin (vagrave kiến thức) từ nhiều nơi trecircn thế giới Caacutecnhoacutem ra quyết định phải giao tiếp cộng taacutec vagrave thương lượng trong cocircng việcHầu hết caacutec tổ chức sẽ nhanh trở thagravenh khocircng coacute chức năng nếu khocircng coacute caacutec hệthống giao tiếp Thương mại điện tử coacute thể hiệu quả chỉ qua caacutec kỹ thuật giao tiếphiện đại- Caacutec kỹ thuật thocircng tin hiện đại cung cấp caacutec phương tiện hỗ trợ giao tiếp rẻnhanh coacute khả năng coacute thể tin cậy Nền tảng hỗ trợ giao tiếp lagrave caacutec hệ thống maacuteytiacutenh mạng+ Bắt đầu bằng điện baacuteo điện thoại radio vagrave ti vi+ Trong 100 năm chuacuteng ta phaacutet triển maacutey fax thư điện tử chương trigravenh chatnhoacutem tin tức hệ thống hội nghị truyền higravenh Hầu hết caacutec kỹ thuật nagravey đềuhoạt động trecircn internet+ Sự phaacutet triển giao tiếp sau cugraveng lagrave hệ thống họp điện tử caacutec dịch vụ vagrave hệ
thống hội nghị điện tử thường sử dụng internet để kết nối caacutec người ra quyếtđịnh- Caacutec thuận lợi aacutep dụng caacutec phương phaacutep giao tiếp cải tiến trong caacutec tổ chức+ Cải tiến năng suất của nhacircn viecircn+ Liecircn quan đến nhiều người ra quyết định chiacutenh+ Khocircng quan tacircm nhiều đến đường biecircn giới địa lyacute+ Tạo nền văn hoacutea hợp taacutec nhất quaacuten+ Cải tiến chất lượng cuộc sống của nhacircn viecircnHỗ trợ cộng taacutec Maacutey tiacutenh hỗ trợ cộng taacutec- Khung thời giannơi chốn+ Sự hiệu quả của kỹ thuật tiacutenh toaacuten cộng taacutec phụ thuộc vagraveo vị triacute của caacutec thagravenhviecircn trong nhoacutem vagrave phụ thuộc vagraveo thời gian chia sẽ thocircng tin gởi vagrave nhận+ Chia sự giao tiếp thagravenh bốn ocirc vagrave tổ chức bốn ocirc dọc theo 2 chiều thời gian vagravenơi chốn1048713 Thời gian Khi gởi vagrave nhận thocircng tin hầu như đồng thời giao tiếp lagrave đồngthời Viacute dụ Điện thoại ti vi vagrave caacutec cuộc họp gặp mặt nhau Giao tiếp bấtđồng bộ xảy ra khi người nhận nhận thocircng tin ở thời điểm khaacutec thời điểmgởi thocircng tin đoacute1048713 Nơi chốn Người gởi vagrave người nhận coacute thể ở cugraveng phograveng hoặc khocircng+ Bốn ocirc lagrave1048713 Cugraveng thời giancugraveng nơi chốn Caacutec thagravenh viecircn gặp mặt nhau cugraveng một luacutecgiống như phograveng quyết định hoặc gặp mặt truyền thống1048713 Cugraveng thời giankhaacutec nơi chốn Caacutec thagravenh viecircn ở caacutec nơi khaacutec nhau nhưnggiao tiếp cugraveng nhau Viacute dụ hội nghị truyền higravenh (videoconferencing)1048713 Khaacutec thời giancugraveng nơi chốn Nhiều người lagravem việc theo ca Ca nagravey để lạithocircng tin cho ca khaacutec1048713 Khaacutec thời giankhaacutec nơi chốn Caacutec thagravenh viecircn ở caacutec nơi khaacutec nhau Caacutecthagravenh viecircn nagravey gởi vagrave nhận thocircng tin ở những lần khaacutec nhau
23Thực thi hệ DSSHệ thống hỗ trợ quản lyacute (MSS) khocircng phải luacutec nagraveo cũng luocircn thagravenh cocircng Nhiều trường hợpthất bại của ES khocircng hoagraven toagraven lagrave lyacute do kỹ thuật Thực thi hệ thống lagrave một quaacute trigravenh liecircn tụcnhằm đảm bảo cho tổ chức chuẩn bị tiếp nhận một hệ thống mới vagrave đưa hệ thống vagraveo sử dụngthagravenh cocircngThực hiện cocircng nghệ hệ thống hỗ trợ quản lyacute lagrave việc phức tạp vigrave caacutec hệ thống nagravey khocircng đơnthuần lagrave hệ thống thocircng tin chỉ thu thập thao taacutec vagrave phacircn phối thocircng tin Magrave xa hơn chuacuteng
liecircn quan tới caacutec cocircng việc coacute thể lagravem thay đổi đaacuteng kể caacutech thức hoạt động của tổ chức Tuyvậy đa số caacutec yếu tố thực thi đều liecircn quan tới hệ thống thocircng tinThực thi MSS lagrave quaacute trigravenh liecircn tục diễn ra trong suốt thời gian phaacutet triển hệ thống từ đề xuấtban đầu đến nghiecircn cứu khả thi thiết kế vagrave phacircn tiacutech hệ thống lập trigravenh huấn luyện chuyểnđổi vagrave lắp đặt Caacutec chuyecircn gia hệ thống thocircng tin thường gọi thực thi lagrave giai đoạn cuối trongvograveng đời hệ thống Định nghĩa thực thi MSS phức tạp hơn vigrave bản chất lặp của sự phaacutet triểncaacutec hệ thống
THỰC THI KHOcircNG HOAgraveN CHỈNHCaacutec quyết định về tiacutenh khả thi thường coacute giả định về lợi iacutech đạt được khi kế hoạch thực thiđược thực hiện hoagraven toagraven Trong thực tế thường chỉ thực hiện 90 thậm chiacute 70 phần trăm sovới phacircn tiacutech khả thi Lyacute do lagrave sự thay đổi tại một nơi trong hệ thống coacute thể ảnh hưởng vagrave coacutethể taacutec động tiecircu cực đến chỗ khaacutec Do vậy cấp quản lyacute coacute thể bỏ những phần trong dự aacuten coacutethể gacircy ra taacutec động xấu Do đoacute dự aacuten sẽ thực hiện iacutet hơn 100 so với dự aacuten kế hoạch Caacutec lyacutedo khaacutec coacute thể lagrave do khấu trừ ngacircn saacutech hoặc vượt chi phiacuteĐAacuteNH GIAacute SỰ THAgraveNH COcircNG CỦA THỰC THI HỆ THỐNGPhải coacute caacutec chỉ số đo lường thigrave mới coacute thể đaacutenh giaacute sự thagravenh cocircng khi thực thi một hệ thốngDickson va Powers (1973) đề ra 5 tiecircu chuẩn độc lậpbull Tỷ lệ thời gian thực hiện dự aacuten với thời gian ước lượngbull Tỷ lệ chi phiacute thực tế vagrave ngacircn saacutech thực hiệnbull Thaacutei độ của cấp quản lyacute đối với hệ thốngbull Nhu cầu thocircng tin của caacutec nhagrave quản lyacute được đaacutep ứng như thế nagraveo qua hệ thốngbull Taacutec động của dự aacuten đối với những hoạt động maacutey tiacutenh trong cocircng tyCaacutec đo lường khaacutec để đaacutenh giaacute thagravenh cocircng của hệ hỗ trợ quản lyacute (MSS)bull Sự sử dụng hệ thống (dự định dugraveng hoặc thực sự dugraveng)bull Thỏa matilden của người dugravengbull Thaacutei độ taacuten thagravenhbull Mức độ hệ thống hoagraven thagravenh caacutec mục tiecircu ban đầubull Phần thưởng đối với tổ chức (giảm chi phiacute tăng doanh thuhellip)bull Tỷ số lợi iacutech chi phiacute
bull Mức độ thể chế hoacutea của MSS trong tổ chứcDo bởi tiacutenh đa dạng của DSS necircn việc đaacutenh giaacute sự thagravenh cocircng của hệ nagravey cũng khoacute khăn tuynhiecircn cũng coacute thể coacute một số yếu tố giuacutep cho DSS thagravenh cocircng như sự tham gia người dugravenghuấn luyện người dugraveng hỗ trợ quản lyacute cấp cao nguồn thocircng tin đặc điểm của những nhiệmvụ coacute liecircn quan (cấu truacutec bất định độ khoacute phụ thuộc)
Chương5Nhoacutem hỗ trợ quyết định vagrave nhoacutemcocircng nghệ phần mềm
51Nhoacutem tạo quyết định
MDM-Holsapple đatilde gợi yacute chuacuteng ta sử dụng giới hạn người tạo quyết định
Một nhoacutem lagrave kết cấu MDM nơi magrave nhiều người ra quyết định hoagraven toagraven tương taacutec
Một đội lagrave kết cấu MDM nơi caacutec thagravenh viecircn tư vấn cho người đưa ra quyết định nhưng khocircng tương taacutec
Một Ủy ban lagrave kết cấu MDM với một người tạo quyết định duy nhất vagrave sự tương taacutec giữa caacutec thagravenh viecircn
Mạng thocircng tin
Mạng lưới baacutenh xe mỗi người tham gia coacute thể giao tiếp với người đưa ra quyết định ở trung tacircm nhưng khocircng phải với người tham gia khaacutecCấu truacutec nagravey lagrave khocircng thỏa matilden tất cả những người tham gia ngoại trừ người ra quyết định
Mạng dacircy chuyền Tham gia chuyển tiếp thocircng tin chỉ để noacute luocircn liền kề nhau trong chuỗi
Thagravenh viecircn cuối cugraveng ko được đaacutep ứng
Mạng vograveng trograven Tương tự như chuỗi nhưng kết thuacutec được kết nối
Mạng kết nối hoagraven toagraven khocircng coacute hạn chế về giao tiếp vagrave tương taacutec giữa caacutec thagravenh viecircnNoacutei chungnoacute đaacutep ứng hầu hết caacutec kết nối của người tham gia nhưng truyền đạt thocircng tin mất nhiều thời gian vagrave coacute nhiều cơ hội xảy ra lỗi
Nhoacutem hagravenh vi vagrave chuẩn mực
MDMs thiết lập caacutec chỉ tiecircu hướng dẫn quaacute trigravenh ra quyết định
Một chuẩn mực quy định cụ thể những gigrave thagravenh viecircn trong nhoacutem dự kiến sẽ lagravem trong những hoagraven cảnh nhất định
Quy tắc gửi coacute thể được thocircng qua viacute dụ đaacutenh giaacute ngang hagraveng hoặc xử phạt
Lagravem thế nagraveo để đưa ra quyết định
Việc chọn lựa magrave trong đoacute việc sử dụng cấu truacutec MDM phải được dựa trecircn một số yếu tố liecircn quan với bối cảnh quyết định
Viacute dụmột cấu truacutec riecircng lẻ sẽ lagravem việc nơi magrave quyết định được cấu truacutec cao vagrave thocircng tin lagrave coacute sẵn
Một ủy ban cơ cấu sẽ lagrave sự lựa chọn khi người ra quyết định khocircng thể đưa ra quyết định một migravenh
52Caacutec vấn đề thường gặp trong nhoacutem
Kiacutech thước Noacutei chung sự nhất triacute vagrave gắn kết giữa caacutec thagravenh viecircn tỉ lệ nghịch với phạm vi nhoacutem Trong nhoacutem lớn rất dễ higravenh thagravenh caacutec nhoacutem nhỏ vagrave hoạt động rời rạc
Tư duy tập thể Trong nhoacutem lớn mọi người coacute xu hướng suy nghĩ đểđạtđược sự nhất triacute necircn khocircng phaacutet huy được sự saacuteng tạo
Caacutec vấn đề về xatilde hội
Xung đột Trong 1 nhoacutem ai cũng muốn migravenh lagrave giỏi nhất necircn dễ dẫn đến xung đột
Ẩn danh(Giấu tecircn) Đacircy lagrave phương phaacutep được sử dụng để kiểm soaacutet xung đột Cho caacutec thagravenh viecircn tham gia ẩn danh
Vấn đề giới tiacutenh Nam vagrave nữ thường coacute những thế mạnh khaacutec nhau điều nagravey coacute thể lagrave sức mạnh trong 1 thiết lập MDM
Đagravem phaacuten vagrave quyết định
Một quyết định coacute thể liecircn quan đến nhiều quan điểm khaacutec nhau vigrave thế cần phải coacute sự đagravem phaacuten
Caacutec thiết kế của cơ chế hỗ trợ cho MDM phải phugrave hợp với caacutec hoạt độngđagravemphaacuten
Những hoạt động nagravey bao gồm việc thu nhận yacute kiến của caacutec thagravenh viecircn 1 caacutech cocircng bằng
53Cocircng nghệ hỗ trợ MDM
Organizational DSSndash 1 hệ thống cung cấp caacutec quyết định hỗ trợ
Group Support Systemndash Cocircng nghệ sử dụng sự hỗ trợ của nhiều becircn tham gia
Group DSS ndash Lagrave 1 hệ thống được thiết kế đặc biệt để hỗ trợ cho MDM
DSS ndash Lagrave 1 hệ thống dưới sự kiểm soaacutet của 1 người quyết định hệ thống nagravey cung cấp 1 bộ cocircng cụ giuacutep phacircn tiacutech hoagraven cảnh đểđưa ra quyết định vagrave nacircng cao hiệu quả của quyết địnhđoacute
53Cocircng nghệ hỗ trợ MDM
Organizational DSSndash 1 hệ thống cung cấp caacutec quyết định hỗ trợ
Group Support Systemndash Cocircng nghệ sử dụng sự hỗ trợ của nhiều becircn tham gia
Group DSS ndash Lagrave 1 hệ thống được thiết kế đặc biệt để hỗ trợ cho MDM
DSS ndash Lagrave 1 hệ thống dưới sự kiểm soaacutet của 1 người quyết định hệ thống nagravey cung cấp 1 bộ cocircng cụ giuacutep phacircn tiacutech hoagraven cảnh đểđưa ra quyết định vagrave nacircng cao hiệu quả của quyết địnhđoacute
Mục tiecircu của cocircng nghệ hỗ trợ MDM
Quy trigravenh hỗ trợ tập trung vagraveo quaacute trigravenh tạo điều kiện thuận lợi cho sự tương taacutec
Cơ chế cấu truacutec quaacute trigravenh chi phối caacutec hoạt động truyền thocircng
Nhiệm vụ hỗ trợ cocircng việc coacute thể chọn lựa tổ chức hoặc lấy thocircng tin
Nhiệm vụ cấu truacutec cocircng việc cho pheacutep truy cập đến kỹ thuật lọc kết hợp phacircn tiacutech kiến thức liecircn quan đến cocircng việc
Caacutec lớp loại cocircng nghệ hỗ trợ MDM
Phacircn loại theo đặc điểm do DeSanctis vagrave Gallupe đưa ra đề xuất một chương trigravenh ba cấp dựa trecircn caacutec tiacutenh năng được cung cấp
Hệ thống cấp 1 Mục điacutech chiacutenh lagrave tạo điều kiện thocircng tin liecircn lạc giữa caacutec thagravenh viecircn
Hệ thống cấp 2 Thiết kế để giảm thiểu rủi ro
Hệ thống cấp 3 Giuacutep điều chỉnh xử lyacute quyết định
Phacircn loại theo cocircng nghệ -Kraemer vagrave King tập trung vagraveo cocircng nghệ aacutep dụng
Cocircng nghệ bảng mạch điện tử
Hội nghị trực tuyến
Mạng lưới tập đoagraven
Trung tacircm thocircng tin
Mocirci trường cộng taacutec
Phograveng quyết định
Nhoacutem phần mềm
Phần mềm được thiết kế để hỗ trợ sự hợp taacutec bao gồm việc thu huacutet vagrave lưu trữ thocircng tin
Caacutec tổ chức dẫn đầu thị trường hiện tại lagrave Lotus Notes and Domino Microsoft Exchange Novell GroupWise and Oracle Office
Caacutec cocircng cụ trong một bộ phần mềm bao gồm người quản lyacute hội nghị (Lotus Sametime) vagrave trao đổi thocircng điệp (Lotus Notes Mail)
Xếp hạng phần mềm cho nhoacutem
Ellis vv đề xuất một hệ thống xếp hạng dựa vagraveo kiểu sự hỗ trợ noacute Cung cấp
Hệ thocircng điệp
Hệ thống hội thảo truyền higravenh
Hệ thống cộng taacutec soạn thảo
Nhoacutem phacircn phối giải phaacutep phần mền
Hệ thống phối hợp
Hệ thống thocircng minh đại diện
Lực lượng điều khiển phaacutet triển phần mềm cho nhoacutem
Một số nhacircn tố chiacutenh bao gồm
Tăng năng suất
Giảm số lượng caacutec cuộc họp
Tăng cường tự động hoacutea caacutec quy trigravenh lagravem việc thường xuyecircn
Cần phối hợp toagraven cầu tốt hơn
Tiacutenh sẵn sagraveng của những mạng lan rộng
Coleman vagrave Khanna liệt kecirc 10 nhacircn tố khaacutec
54Quản lyacute hoạt động MDM (Mobile Device Management - Quản lyacute thiết bị di động)
Một số phương phaacutep phối hợp phổ biến hơnMDM lagrave
Kỹ thuật nhoacutem định danh
Kỹ thuật Delphi
Sự phacircn xử
Hệ thocircng tin dựa trecircn vấn đề
Nemawashi
Kỹ thuật nhoacutem định danh
1-Mỗi người tham gia viết ra những yacute tưởng về những gigrave necircn quyết định
2-Lần lượt mỗi người tham gia trigravenh bagravey yacute tưởng của migravenh được ghi lại trecircn bảng Khocircng thảo luận ở đacircy
3-Sau khi tất cả caacutec yacute tưởng được trigravenh bagravey caacutec đại biểu coacute thể chất vấn những người khaacutec
4-Mỗi người tham gia bỏ phiếu cho mỗi yacute tưởng
Kỹ thuật Delphi
Về cơ bản tương tự như kỹ thuật nhoacutem định danh ngoại trừ những người khocircng bao giờ tham gia cuộc họp
Một cocircng cụ khảo saacutet được sử dụng để thu thập đầu vagraveo ban đầu từ caacutec thagravenh viecircn
Một cuộc khảo saacutet thứ hai được gửi đi với một bản toacutem tắt caacutec kết quả chung
Những bước lặp lại cho đến khi đạt được một sự đồng thuận hoặc nhigraven nhận của đa số
Sự phacircn xử(Arbitration )
Thiacutech hợp nhất khi caacutec thagravenh viecircn của MDM đại diện cho caacutec yếu tố đối lập
Những người tham gia đồng yacute rằng nếu lựa chọn thay thế hai becircn thỏa thuận khocircng được tigravem thấy thigrave một trọng tagravei viecircn becircn ngoagravei sẽ tham gia
Trọng tagravei sau đoacute lựa chọn thay thế ocircng hoặc xeacutet thấy thiacutech hợp nhất
Hệ thống thocircng tin dựa trecircn vấn đề (IBIS)
Lagrave một phương phaacutep lập luận cấu truacutec
Một đại diện cho IBIS lagrave một đồ thị với caacutec nuacutet vagrave caacutec liecircn kết
IBIS bắt đầu với lựa chọn của một nuacutet vấn đề gốc sau đoacute caacutec nuacutet vị triacute khaacutec nhau được liecircn kết với nuacutet gốc
Caacutec nuacutet vị triacute nagravey sau đoacute được đaacutenh giaacute dựa trecircn những lập luận gắn liền với chuacuteng
Nemawashi (được sử dụng rộng ratildei tại Nhật Bản)
1-Một hoặc nhiều thagravenh viecircn của MDM được chỉ định lagrave điều phối viecircnCaacutec điều phối viecircn sau đoacute chọn người tham gia cograven lại
2-Điều phối viecircn xacircy dựng một tổng hợp caacutec sự lựa chọn vagrave sau đoacute caacutec chuyecircn gia đaacutenh giaacute caacutec lựa chọn
3-Điều phối viecircn lựa chọn một sự lựa chọn dựa trecircn kết quả ở trecircn(ở 2)
4-Sự thay thế được luacircn chuyển điều phối viecircn tigravem kiếm sự đồng thuận thocircng qua sự thuyết phục vagrave đagravem phaacuten
5-Nếu đạt được sự đồng thuận điều phối viecircn cho lưu thocircng một tagravei liệu magrave mỗi thagravenh viecircn MDM để lại dấu hiệu trecircn đoacute
55Nơi lagravem việc ảo
Nhiều tổ chức trecircn toagraven thế giới kinh doanh bất động sản cho cocircng nghệ hợp taacutec
Cocircng việc được trở thagravenh một điều bạn lagravem hơn lagrave một nơi bạn đi
Những thay đổi lớn nhất mang lại bởi nơi lagravem việc ảo coacute thể lagrave về văn hoaacute hay xatilde hội hơn lagrave về cocircng nghệ
Chương 6 Hệ thống thocircng tin điều hagravenh
61 Yacute nghĩa của EIS- Hệ thống thocircng tin điều hagravenh
- EIS lagrave một dạng đặc biệt của DSS được thiết kế để hỗ trợ ra quyết định ở cấp cao nhất của một tổ chức
- Lagrave một hệ thống thocircng tin hỗ trợ nhu cầu lập kế hoạch vagrave đaacutenh giaacute của caacutec nhagrave quản lyacute điều hagravenh
- EIS coacute thể giuacutep một CEO coacute được bức tranh tổng thể chiacutenh xaacutec nhất về caacutec hoạt động vagrave một bản toacutem tắt những gigrave magrave đối thủ cạnh tranh đang lagravem
- Caacutec hệ thống nagravey noacutei chung hoạt động dễ dagraveng vagrave trigravenh bagravey thocircng tin theo những caacutech dễ hiểu để việc tiếp thu được nhanh choacuteng (biểu đồ đồ thịhellip)
(Tagravei liệu thecircm EIS lagrave những loại hệ thống lagrave rất phức tạp trong tự nhiecircn Coacute thể noacutei hệ thống nagravey cũng cung cấp cho caacutec nhagrave quản lyacute với caacutec thiết bị coacute khả năng ra quyết định bằng caacutech sử dụng của noacute Hệ thống nagravey hoạt động trong điều kiện như vậy quan trọng như trong caacutec hệ thống khaacutec khocircng hỗ trợ Khả năng lưu trữ dữ liệu nặng lagravem cho noacute lyacute tưởng để được thocircng qua khocircng chỉ bởi caacutec doanh nghiệp lớn magrave cograven bởi caacutec doanh nghiệp nhỏ hơn Nhigraven chung hệ thống nagravey lagrave dagravenh cho caacutec nhacircn viecircn cấp cao hỗ trợ thagravenh thạo trong việc đưa ra caacutec quyết định quan trọng)
Caacutec phiecircn EIS tiecircu biểu- Phiecircn lagravem việc coacute thể bắt đầu với một baacuteo caacuteo về tigravenh higravenh tagravei chiacutenh vagrave kinh
doanh của một cocircng ty caacutec chỉ số hoạt động quan trọng được hiển thị rotilde ragraveng- EIS sẽ cho pheacutep caacutec giaacutem đốc điều hagravenh coacute thể đi sacircu vagraveo dữ liệu từ những con
số bất kỳ magrave noacute hỗ trợ- Việc điều hagravenh coacute thể lựa chọn một mức độ chi tiết ( VD danh số baacuten hagraveng) nếu
như cần điều tra thecircm- Lagrave một phương phaacutep tiếp cận coacute thể giuacutep việc ra quyết định tốt hơn
Những điều magrave EIS ko coacute- EIS khocircng phải lagrave sự thay thế cho caacutec hệ thống dựa trecircn caacutec maacutey tiacutenh khaacutec EIS
thực sự chỉ cung cấp dữ liệu cho caacutec hệ thống nagravey- Noacute khocircng thể biến caacutec bộ hệ điều hagravenh của maacutey tiacutenh thagravenh những ldquochuyecircn viecircn
giỏirdquo- Coacute thể được viacute một caacutech cao hơn như lagrave một trợ lyacute đaacuteng tin cậy coacute thể được gọi
đến bất khi nagraveo vagrave mỗi khi cần thiết
Tagravei liệu thecircm Sự khaacutec nhau giữa EIS vagrave DSS+ EIS thiết kế để hỗ trợ những người điều hagravenh cấp cao giuacutep họ khaacutem phaacute caacutec vấn đề vagrave caacutec cơ hội DSS hỗ trợ những nười phacircn tiacutech cố gắng trả lời cacircu hỏi caacutei gigrave coacute thể lagravem cugraveng với một cơ hội hoặc một vấn đề
Chiều EIS DSSNhững người sử dụng thocircng thường
Duyệt dữ liệu đi xuống truy xuất trạng thaacutei
Hỗ trợ phacircn tiacutech vagrave quyết định
Sự thuacutec đẩy Tiacutenh thiacutech hợp Tiacutenh hiệu quảỨng dụng Queacutet mocirci trường đaacutenh giaacute
hiệu suất nhận dạng caacutec vấn đề vagrave caacutec cơ hội
Caacutec quyết định quản lyacute trecircn caacutec lĩnh vực đa dạng
Hỗ trợ quyết định Caacutec chiacutenh saacutech caacutec quyết định khocircng coacute cấu truacutec ở mức cao vagrave hỗ trợ giaacuten tiếp
Hỗ trợ caacutec quyết định lặp lại caacutec quyết định khocircng thể đoaacuten trước ra quyết định khocircng coacute cấu truacutec vagrave baacuten cấu truacutec
Loại thocircng tin Caacutec thocircng tin tin tức thocircng tin becircn ngoagravei về khaacutech hagraveng đối thủ cạnh tranh mocirci trường caacutec baacuteo caacuteo theo yecircu cầu vagrave định thời về caacutec hoạt động becircn trong
Caacutec thocircng tin hỗ trợ caacutec tigravenh huống đặc biệt
Sử dụng coacute nguyecircn tắc
Dograve theo vết vagrave điều khiển nhận dạng cơ hội
Hoạch định tổ chức phacircn nhoacutem vagrave điều khiển
Khả năng phugrave hợp với những người sử dụng caacute nhacircn
Thiết kế loại ra quyết định cho mỗi người điều hagravenh caacute nhacircn bằng nhiều lựa chọn đầu ra
Cho pheacutep caacutec đaacutenh giaacute caacute nhacircn caacutec khả năng what-if lựa chọn loại hộp hội thoại
Đồ họa Phải coacute Lagrave một phần quan trọng của nhiều DSS
Thacircn thiện người sử dụng
Phải coacute Phải coacute nếu khocircng coacute người sử dụng trung gian
Xử lyacute thocircng tin Lọc neacuten thocircng tin dograve theo vết dữ liệu vagrave thocircng tin quan trọng
EIS kiacutech thiacutech caacutec cacircu hỏi caacutec cacircu trả lời bằng caacutech sử dụng DSS vagrave phản hồi lại EIS
Hỗ trợ caacutec thocircng tin chi tiết
Truy xuất thường xuyecircn caacutec mức chi tiết của bất kỳ thocircng tin tổng hợp nagraveo (duyệt dữ
Coacute thể coacute trong DSS nhưng khocircng thường
liệu chi tiết)Cơ sở mocirc higravenh Caacutec chức năng coacute sẵn bị hạn
chếLagrave điểm cốt lotildei của DSS
Cấu truacutec Theo người baacuten sản phẩm hoặc theo caacutec chuyecircn gia hệ thống thocircng tin
Theo người sử dụng hoặc caacute nhacircn hoặc caacutec chuyecircn gia từ caacutec trung tacircm thocircng tin hoặc phograveng ban hệ thống thocircng tin
Phần cứng Mainframe caacutec trạm RISC mạng LANs hoặc caacutec hệ thống phacircn bố
Mainframe caacutec trạm RISC caacutec maacutey PC hoặc caacutec hệ thống phacircn bố
Bản chất caacutec goacutei phần mềm
Truy xuất tương taacutec dễ dagraveng đến nhiều cơ sở dữ liệu truy xuất trực tuyến caacutec khả năng DBMS phức tạp caacutec liecircn kết phức tạp
Caacutec khả năng tiacutenh toaacuten lớn caacutec ngocircn ngữ mocirc higravenh mocirc phỏng ứng dụng vagrave caacutec bộ tạo DSS
Bản chất caacutec thocircng tin
Trigravenh bagravey thocircng tin được phaacutet sinh trước về quaacute khứ vagrave hiện tại tạo caacutec thocircng tin mới về quaacute khứ hiện tại tương lai
Tạo thocircng tin mới về quaacute khứ hiện tại tương lai
62 Lịch sử EIS- EIS xuất hiện lần đầu tiecircn tại MIT vagraveo những năm 1970
- Những EIS đầu tiecircn được phaacutet triển bởi caacutec doanh ngiệp lớn sẵn sagraveng chấp nhận rủi ro để đạt được lợi thế cạnh tranh
- Vagraveo những năm 1980 caacutec nhagrave cung cấp đatilde phaacutet triển một số cơ sở khaacutech hagraveng rộng vagrave cocircng nghệ EIS được tiếp tục phaacutet triển cho đến ngagravey nay
(Tagravei liệu thecircm Sử dụng DSSEIS cho phaacutet triển bền vững + Một số nghiecircn cứu đatilde được tiến hagravenh để kiểm tra việc thực hiện của EIS trong khu vực cocircng cộng vagrave chiacutenh phủ caacutec nước tổ chức kể từ khi chuacuteng được phaacutet triển theo định hướng lợi nhuận cho caacutec cocircng ty tư nhacircn (Hasan vagrave Hasan năm 1997) Theo một nghiecircn cứu tiến hagravenh tại Mỹ ở hơn 300 cocircng ty kết quả cho thấy sự khaacutec biệt của EIS giữa tư nhacircn vagrave chiacutenh phủ một số kết quả thuacute vị được phaacutet hiệnViacute dụ khoacute khăn hơn để chuyển tiền từ một tagravei khoản khaacutec trong một EIS của chiacutenh phủ cũng lagrave khoacute khăn hơn để biện giải thiacutech cho những chi phiacute phaacutet triển EIS của chiacutenh phủ Một nghiecircn cứu khaacutec được tiến hagravenh ở Australia
cho thấy rằng EIS cung cấp cho quản lyacute một higravenh ảnh chiacutenh xaacutec hơn về tổ chức thực hiện vagrave cung cấp hỗ trợ cho caacutec lợi iacutech chiến lược cải thiện khocircng chỉ cho caacutec nhagrave quản lyacute nhưng cograven cho phần cograven lại của tổ chức Dựa trecircn caacutec hệ thống được thiết kế cho caacutec cocircng ty tư nhacircn với một caacutech rotilde ragravengxaacutec định mục tiecircu EIS lagrave thiacutech hợp cho caacutec tổ chức cocircng cộng hiện đại nhưng cần phải được linh hoạt hơn vagrave kết thagravenh chugravem một phạm vi rộng hơn khả năng vagrave phương tiện hơn so với khu vực tư nhacircn ban đầu theo định hướng sản phẩm (Hasan vagrave Hasan năm 1997) Điều nagravey coacute thể lagrave do thực tế rằng caacutec hoạt động khu vực cocircng lagrave bắt buộc coacute taacutec động rộng phải đaacutep ứng sự mong đợi duy nhất cocircng cộng thường coacute mục tiecircu mơ hồ vagrave macircu thuẫn iacutet quyền tự chủ vagrave kiểm soaacutet việc ra quyết định vagrave nhacircn viecircn lagrave khoacute khăn hơn (Watson vagrave Carte2000) + Toacutem lại EIS lagrave một khaacutei niệm thagravenh cocircng noacute phaacutet triển qua nhiều năm tuy nhiecircn EIS khắc phục khiếm khuyết của migravenh bằng caacutech tiến hagravenh nghiecircn cứu liecircn tục)
63 Tại sao những người điều hagravenh hagraveng đầu lại khaacutec nhau- Họ lagrave những doanh nghiệp theo định hướng coacute suy nghĩ
- Coacute một khoảng khocircng gian rộng để kiểm soaacutet
- Họ chịu traacutech nhiệm cho việc thiết lập chiacutenh saacutech
- Họ đại diện cho tổ chức mocirci trường becircn ngoagravei
- Hagravenh động của họ tạo ra những kết quả đaacuteng kể về tagravei chiacutenh vagrave con người
Tần số caacutec hoạt động điều hagravenh- Xử lyacute xaacuteo trộn 42
- Hoạt động kinh doanh 32
- Phacircn bổ nguồn lực 17
- Đagravem phaacuten 3
- Những điều khaacutec 6
Handling Disturbances 42
Entrepreneurial Activites 32
Resource Allocation 17
Negotiation 3
Other 6
Những thocircng tin điều hagravenh cần thiết- Quản lyacute xaacuteo trộn coacute thể yecircu cầu sự chuacute yacute xung quanh đồng hồ
- Hoạt động kinh doanh yecircu cầu điều hagravenh để dự đoaacuten những thay đổi trong mocirci trường
- Nhiệm vụ phacircn bổ tagravei nguyecircn yecircu cầu lựa chọn người quản lyacute vagrave caacutec nguồn lực hạn chế được triển khai
- Đagravem phaacuten yecircu cầu cập nhật thocircng tin từng phuacutet để coacute thể xacircy dựng được sự đồng thuận
Caacutec loại thocircng tin điều hagravenh- Hệ thống kế toaacuten coacute liecircn quan đến việc tiacutenh toaacuten thu nhập hoạt động cho caacutec lĩnh
vực cụ thể lagrave quan trọng hơn so với caacutec hệ thống kế toaacuten truyền thocircng- Thocircng tin về thị trường khaacutech hagraveng cung cấp giaacute trị trong việc quyết định chiến
lược- Caacutec thocircng tin cần thiết thường được truyền đi trecircn một số hệ thống maacutey tiacutenh vagrave
nằm trong toagraven tổ chức- Caacutec thocircng tin được sử dụng thường lagrave ngắn hạn vagrave dễ thay đổi
Phương thức để xaacutec định thocircng tin cần thiết
Rockart xaacutec định được năm phương thức cơ bản để xaacutec định thocircng tin cần thiết
- Phương thức dựa trecircn kết quả- Phương thức rỗng- Phương thức chỉ số khoacutea- Phương thức tổng hợp nghiecircn cứu- Phương thức dựa vagraveo nhacircn tố then chốt dẫn đến thagravenh cocircng
64 Thagravenh phần EIS
- Sản phẩm EIS đầu tiecircn được phaacutet triển để sử dụng trecircn maacutey tiacutenh cấu higravenh cao nhưng caacutec sản phẩm hiện nay nhằm mục tiecircu lagrave nền tảng ClientServer
- Những nền tảng linh hoạt hơn coacute thể thiacutech ứng với thay đổi trong tổ chức vagrave cocircng nghệ
- Sử dụng dữ liệu thời gian thực dẫn đến quyết định nhanh hơn nhiều thocircng tin hơn
Thagravenh phần phần cứng- Một EIS khocircng đogravei hỏi coacute phần cứng cụ thể hoặc duy nhất nagraveo- Chigravea khoacutea của vấn đề lagrave để đảm bảo rằng caacutec thagravenh phần của EIS tối ưu hoacutea vagrave
phugrave hợp với tagravei nguyecircn maacutey tiacutenh của tổ chức- Hệ thống nagravey phải được cấu higravenh để caacutec nguồn tagravei nguyecircn phugrave hợp với những
người điều hagravenh chuacuteng
Thagravenh phần phần mềm- Traacutei ngược với phần cứng phần mềm thường được chuyecircn mocircn hoacutea cao cho caacutec
bagravei toaacuten về miền- Sự chuyecircn mocircn hoacutea nagravey thường đạt được bằng caacutech sử dụng thagravenh phần off-the-
shelf cho toagraven bộ EIS vagrave caacutec mocirc-đun tugravey chỉnh để đaacutep ứng nhu cầu cụ thể- Lotus Notes lagrave một viacute dụ điển higravenh Noacute coacute thể được sử dụng một migravenh hoặc coacute
thể phục vụ becircn thứ ba mocirc-đun plug-in
Cocircng nghệ EIS hiện nay
Dobrzeniecki đề xuấtphacircn loạitừng cấptheo bachức năng- Loại 1 sản phẩm bao gồmmột bộ đầy đủcaacutec ứng dụngtừ mộtnhagrave cung cấp- Loại 2 sản phẩm đượcthựchiệnở phần đầu củacaacutecsản phẩmDSS đượcphaacutet triển
bởicugravengmộtnhagrave cung cấp- Loại 3 sản phẩmkết hợp với nhautheo bất kỳ số lượngthuộc sở hữu củacocircng ty
65 Xacircy dựng EIS
- Xacircy dựngmộtEISgiống nhưxacircydựngmột số hệ thống khaacutec củamocirc higravenh hệ thống thocircng tin
- Việcphaacutet triểncấu truacutecnecircn được theo dotildeitừ quaacute trigravenh thiết kế đến quaacute trigravenhthực hiện
- Tuy nhiecircn một dự aacuten phaacutet triển EIScoacute xu hướnglagrave thống nhấtvagraveyecircu cầu hỗ trợ caacutec nhagrave quản lyacute latildenh đạo
- Xacircy dựng một EIScoacute thểphaacutet hiện ra đượccaacutectigravenh huống khoacute khănmagravemột nhagrave phaacutet triển chưabao giờ gặp phải
Mocirc higravenh EIS
Khung phaacutet triển một EIS
- Watson et al đề nghị xacircy dựngkhung với ba thagravenh phần+ Caacutech tiếp cận tập trung vagraveo yếu tốcon người vagrave dữ liệu coacute liecircn quan đến EIS+ Quaacute trigravenh phaacutet triển cần sự linh hoạt vagrave tương taacutec+ Người sử dụng - hệ thống hộp thoại bao gồm một ngocircn ngữ hagravenh động để xử lyacute caacutec lệnh
Lợi iacutech của EIS- Dễ duy trigrave caacutec mục tiecircu coacute tổ chức- Dễ truy xuất thocircng tin- Cho pheacutep người sử dụng nacircng cao hiệu suất hơn
- Tăng chất lượng ra quyết định- Cung cấp sự cải tiến cạnh tranh- Tiết kiệm thời gian của người sử dụng- Tăng khả năng vagrave chất lượng giao tiếp- Cung cấp khả năng điều khiển tốt hơn trong tổ chức- Cho pheacutep tham gia caacutec vấn đề vagrave caacutec cơ hội- Cho pheacutep hoạch định- Cho pheacutep tigravem kiếm nguyecircn nhacircn của một vấn đề- Thảo matilden caacutec yecircu cầu của người điều hagravenh
Hạn chế của EIS vagrave 1 số sai lầm cần traacutenh
- Chi phiacute một cuộc khảo saacutetnăm1991 chothấychi phiacute phaacutet triểntrungbigravenh365000USDvớichi phiacute vận hagravenhhagraveng năm lagrave$200000 (EIS)
- Cocircng nghệ hạn chếEIScần phảiđượctiacutech hợp hoagraven toagravenvagraveokiếntruacuteccủadoanh nghiệphiện tại do đoacute noacutelagrave một thaacutech thứclớn đối vớithiết kế
- Hạn chế tổ chức cơ cấu tổ chứccoacute thể khocircng phugrave hợp
Sự hạn chế về tổ chức- Chương trigravenh nghị sự vagrave thời gian chệch EIS mocirc tả một phần việc thực hiện một
chương trigravenh nghị sự vagrave coacute thể dễ dagraveng đạt được sự tin cậy một caacutech chắc chắn- Đồng bộ hoacutea việc quản lyacute sự tin cậy đuacuteng luacutec đặc biệt baacuteo caacuteo EIS coacute thể phaacute
vỡ sự ổn định thiết lập caacutec chu trigravenh baacuteo caacuteo một caacutech tốt nhất- Sự bất ổn EIS phản ứng nhanh coacute thể gacircy ra việc taacutec động trở lại một caacutech
nhanh choacuteng dẫn đến sự thiếu ổn định trong tổ chức
Sự thất bại lagrave thay thế khocircng thể chấp nhận được- Một số yếu tố lagravem EIS thất bại
+ Thiếu sự hỗ trợ về mặt quản lyacute+ Vấn đề chiacutenh trị+ Thất bại của nhagrave phaacutet triển+ Lỗi về cocircng nghệ+ Giaacute cả+ Thời gian
66 Ra quyết định điều hagravenh trong tương lai vagrave EIS
- Coacute một vagravei điều kiện sẽ được hợp nhất cho việc chuyển đổi cocircng nghệ Trong đoacute một vagravei điều kiện coacute thể dễ dự đoaacuten Hai điều kiện magrave ta coacute thể thấy lagrave+ Phaacutet triển cocircng nghệ maacutey tiacutenh trong việc điều hagravenh sẽ tạo ra sự chuyển đổi được chấp nhận một caacutech dễ dagraveng hơn+ Mở rộng traacutech nhiệm điều hagravenh sẽ mở rộng nhu cầu thocircng tin
Tương lai của EIS- EIS thocircng minh Những tiến bộ trong cocircng nghệ AI sẽ được triển khai trong caacutec
EIS- EIS đa phương tiện Cơ sở dữ liệu đa phương tiện sẽ cho pheacutep tiacutech hợp văn bản
giọng noacutei vagrave higravenh ảnh trong tương lai- EIS thocircng tin Tương lai EIS sẽ mở rộng hơn trong việc sử dụng dữ liệu becircn
ngoagravei doanh nghiệp- EIS kết nối Giao tiếp với băng thocircng rộng cho pheacutep kết nối liecircn thocircng lớn hơn
Chương 7 HỆ CHUYEcircN GIA VAgrave TRIacute TUỆ NHAcircN TẠO
71 Caacutec khaacutei niệm
72 Triacute thocircng minh của triacute tuệ nhacircn tạo
73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia
74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia
75 Lợi iacutech vagrave hạn chế của hệ chuyecircn gia
71 Caacutec khaacutei niệm
Chuyecircn mocircn (Expertise) sự hiểu biết rộng trong 1 lĩnh vực hẹp
Hệ chuyecircn gia (Expert Systems)1 chương trigravenh maacutey tiacutenh sử dụng 1 tập caacutec luật dựa trecircn tri thức của con người để giải quyết caacutec vấn đề đogravei hogravei phải coacute sự chuyecircn mocircn
Một số hệ chuyecircn gia nổi tiếng
DENDRAL (Standford 1960s Edward Feigenbaum)
MYCIN (Standford1970s Edward Shortliffe)
PROSPECTOR (MIT 1979)
Triacute tuệ nhacircn tạo (Artificial Intelligence ndash AI)
Triacute tuệ nhacircn tạo một bộ phacircn của ngagravenh khoa học maacutey tiacutenh quan tacircm đến việc thiết kế caacutec hệ thống maacutey tiacutenh thocircng minh đoacute lagrave caacutec hệ thống đưa ra caacutec đặc điểm magrave từ đoacute chuacuteng ta liecircn hệ với sự thocircng minh trong hagravenh động của con người (Barr vagrave Feigenbaum 1981)
Mục điacutech của AI
Mục điacutech khoa học xaacutec định caacutec gợi yacute để giải thiacutech caacutec loại khaacutec nhau của triacute tuệ thực
Mục điacutech kỹ thuật giải quyết caacutec vấn đề trong thế giới thực
Triacute tuệ nhacircn tạo kế thừa nhiều yacute tưởng quan điểm kỹ thuật từ caacutec ngagravenh khoa học khaacutec
- Triết học
- Logic Toaacuten học
- Tiacutenh toaacuten
- Khoa học tacircm lyacute Khoa học nhận thức
- Sinh học Thần kinh học
- Tiến hoacutea
Caacutec lĩnh vực ứng dụng trong Triacute tuệ nhacircn tạo
Mạng nơ ron thần kinh (Neural Networks)
Tiacutenh toaacuten sự tiến hoacutea
(Evolutionary Computation)
Hệ chuyecircn gia (Expert Systems)
Kỹ thuật xử lyacute tiếng noacutei (Speech Processing)
Kỹ thuật xử lyacute ngocircn ngữ tự nhiecircn
(Natural Language Processing)
Lập kế hoạch (Planning)
Robot (Robotics)
Khoa học higravenh ảnh (Vision)
Caacutec kỹ thuật thocircng dụng dugraveng trong AI
Biểu diễn(Representation)
Học (Learning)
Caacutec luật (Rules)
Tigravem kiếm (Search)
72 Triacute thocircng minh của triacute tuệ nhacircn tạo
Con người suy diễn như thế nagraveo
Phacircn loại (Categorization)
Caacutec quy tắc cụ thể
Heuristics
Kinh nghiệm trước đoacute
Dự tiacutenh trước
Maacutey tiacutenh suy diễn như thế nagraveo
Lập luận dựa trecircn luật IF-THEN mocirc tả tri thức được matilde hoacutea dưới dạng caacutec luật
Caacutec khung (Frames) lagrave caacutec đại diện mocirc tả caacutec tigravenh huống giống nhau lagrave điển higravenh của một vagravei phacircn loại
Lập luận dựa trecircn caacutec trường hợp mocirc phỏng giải phaacutep trước đoacute cho một vấn đề hiện tại
Nhận dạng mẫu phaacutet hiện acircm thanh higravenh dạng hoặc caacutec chuỗi dagravei
Caacutec dạng khaacutec của Triacute tuệ nhacircn tạo
Học maacutey- mạng nơron vagrave giải thuật di truyền
Lập trigravenh tự động ndash lagrave những kỹ thuật tạo ra caacutec chương trigravenh để lagravem 1 nhiệm vụ riecircng biệt (cho pheacutep những người khocircng phải lagrave người lập trigravenh coacute thể lập trigravenh được)
Cuộc sống nhacircn tạo ndash nỗ lực để taacutei tạo caacutec hiện tượng sinh học trong caacutec hệ thống dựa trecircn maacutey tiacutenh
73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia(Expert Systems- ES)
Theo Jackson (1999) Một hệ chuyecircn gia lagrave một chương trigravenh maacutey tiacutenh mocirc tả vagrave suy diễn với tri thức của một vagravei lĩnh vực để giải quyết vấn đề hay đưa ra caacutec lời khuyecircn
Cấu truacutec cơ bản của ES được dựa theo cấu truacutec chung của DSS Sự khaacutec biệt chiacutenh giữa ES vagraveDSS lagrave hệ ES thu thập caacutec kiến thức từ những
chuyecircn gia trong lĩnh vực quan tacircmĐặc trưng của hệ chuyecircn gia Hiệu quả cao Thời gian trả lời thỏa đaacuteng Độ tin cậy cao Dễ hiểu
Giao diện người dugraveng trong ES
Thiết kế giao diện người dugraveng tập trung vagraveo caacutec yếu tố như dễ dagraveng sử dụngcoacute độ tin cậy cao giảm tải những khoacute khăn khi sử dụng
Thiết kế necircn coacute một số tương taacutec (đầu vagraveo kiểm soaacutet vagrave truy vấn)
Cấu tạo giao diện người dugraveng gồm coacute magraven higravenh cảm ứng bagraven phiacutem buacutet saacuteng lệnh thoại caacutec phiacutem chuyecircn dụng
Cơ sở tri thức (Knowledge Base)
Chứa đựng caacutec tri thức cụ thể miền thu được từ caacutec chuyecircn gia miền
Coacute thể chứa caacutec mocirc tả caacutec hagravenh vi giải quyết vấn đề caacutec ragraveng buộc caacutec heuristics
Thagravenh cocircng của một ES dựa trecircn tiacutenh đầy đủ vagrave tiacutenh chiacutenh xaacutec của cơ sở tri thức
Mocirc tơ suy diễn (Inference Engine)
Ở đacircy tri thức được đặt để sử dụng tạo ra caacutec giải phaacutep để giải quyết vấn đề
Mocirc tơ nagravey coacute khả năng thực hiện diễn dịch hoặc suy diễn dựa trecircn caacutec luật hay caacutec caacutec sự kiện
Đồng thời cũng coacute khả năng sử dụng caacutec suy diễn mờ hay khocircng chiacutenh xaacutec dựa trecircn xaacutec suất hay aacutenh xạ mẫu
Vograveng điều khiển suy diễn
1 Aacutenh xạ caacutec luật với caacutec sự kiện đatilde được cho
2 Chọn luật để thực hiện
3 Thực hiện luật bằng caacutech thecircm caacutec sự kiện được suy diễn ra vagraveo bộ nhớ lagravem việc
Chuỗi suy diễn (Chaining)
Suy diễn tiến (forward chaining) maacutey suy diễn bắt đầu từ dữ liệu ban đầu vagrave thực hiện việc suy luận để đưa ra caacutec kết luận cuối cugraveng
Suy diễn lugravei (backward chaining) maacutey suy diễn bắt đầu từ dữ liệu điacutech vagrave tigravem ra tri thức hỗ trợ cho dữ liệu điacutech đoacute
Viacute dụ suy diễn lugravei
R1 Nếu coacute A vagrave B thigrave suy ra coacute D
R2 Nếu coacute B thigrave suy ra coacute C
R3 Nếu coacute C vagrave D thigrave suy ra coacute E
Ta coacute E ta xem trong 3 luật R1 R2 R3 luật nagraveo coacute E ta thấy R3 chứa E đồng thời chứa C vagrave D Xeacutet tiếp trong 2 luật R1 R2 luật nagraveo chứa C vagrave D R2 chứa C R3 chứa D Từ đoacute ta coacute được caacutec tri thức hỗ trợ suy diễn vagrave kết luận lagrave nếu coacute A vagrave B thigrave sẽ coacute E Hay nếu A vagrave B đuacuteng thigrave sẽ coacute E
Viacute dụ suy diễn tiến
Giả sử coacute tập chứa 3 luật sau
R1 Nếu coacute A vagrave B thigrave suy ra coacute D
R2 Nếu coacute B thigrave suy ra coacute C
R3 Nếu coacute C vagrave D thigrave suy ra coacute E
Nếu ta coacute A vagrave B thigrave chuacuteng ta suy ra được D từ R1 vagrave suy ra C từ R2 Với D vagrave C đatilde được suy ra ở trecircn giờ chuacuteng ta suy ra được E từ R3
Viacute dụ thực tế
Giả sử muốn biết magraveu của một con vật nuocirci tecircn lagrave Fred biết rằng noacute kecircu ộp ộp vagrave ăn ruồi
Coacute tập 4 luật ban đầu như sau
R1 Nếu X kecircu ộp ộp vagrave ăn ruồi thigrave X lagrave con ếch
R2 Nếu X kecircu chiecircm chiếp vagrave biết hoacutet thigrave X lagrave con chim
R3 Nếu X lagrave con ếch thigrave X coacute magraveu xanh
R4 Nếu X lagrave con chim thigrave X coacute magraveu vagraveng
74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia
Expert system shells lagrave một tập caacutec goacutei phần mềm vagrave caacutec cocircng cụ dugraveng để phaacutet triển caacutec hệ chuyecircn gia
Những Expert system shells đầu tiecircn thường rất rườm ragrave Mặc dugrave vậy noacute vẫn giuacutep cho người sử dụng sẽ khocircng phải bắt đầu lại từ đầu khi xacircy dựng một hệ chuyecircn gia mới
Những shell hiện đại bao gồm hai mocirc-đun chiacutenh lagrave cocircng cụ xacircy dựng một tập quy tắc vagrave mocirc tơ suy diễn
Xacircy dựng hệ chuyecircn gia
Bước 1 xacircy dựng mocirc higravenh bagravei toaacuten xaacutec định vấn đề nhiệm vụ magrave hệ thống sẽ thực hiện Caacutec dạng bagravei toaacuten cần hệ chuyecircn gia
Bagravei toaacuten diễn giải (InterPretation)
Bagravei toaacuten dự baacuteo (Prediction)
Bagravei toaacuten chuẩn đoaacuten (Diagnose)
Bagravei toaacuten gỡ rối (Debugging)
Bagravei toaacuten thiết kế
Tương tự như một dự aacuten phần mềm để xacircy dựng một hệ chuyecircn gia cần phải coacute caacutec yếu tố về nhacircn lực tagravei nguyecircn vagrave thời gian Những yếu tố nagravey ảnh hưởng đến giaacute thah của một hệ chuyecircn giaTrong phần nagravey cacircu hỏi thường được đặt ra lagrave tại sao cần phải xacircy dựng một hệ chuyecircn giaTrước khi bắt đầu phải xaacute định rotilde bagravei toaacuten đạt ra lagrave jiAi lagrave chuyecircn giaAi lagrave người sử dụng
1 Diễn giải (InterPretation) Nghiecircn cứu 1 vấn đề -gt Dựa trecircn những biểu hiện thuộc tiacutenh đặc trưng becircn ngoagravei -gt Tư vấn
(hoặc đưa ra kết luận hay mocirc tả dễ hiểu từ tập dữ liệu thocirc)
2 Bagravei toaacuten dự baacuteo (Prediction) Coacute thể dự đoaacuten được hagravenh vi kết quả dựa trecircn caacutec hiện tượng -gt dự baacuteo
VD Dự baacuteo thời tiết động đấthellip
3 Bagravei toaacuten chẩn đoaacuten (Diagnoss) Xaacutec định caacutec lỗi caacutec bộ phận hỏng hoacutec của hệ thống dựa trecircn caacutec dữ liệu quan saacutet được
4 Bagravei toaacuten gỡ rối (Debugging) Mocirc tả caacutec phương phaacutep khắc phục hệ thống khi gặp sự cố
5 Bagravei toaacuten thiết kế Lựa chọn cấu higravenh caacutec đối tượng nhằm thoả matilden một số ragraveng buộc nagraveo đoacute
6 Giảng dạy Phần mềm dạy học coacute thể chuẩn đoaacuten vagrave sủa lỗi của học sinh trong quaacute trigravenh học tập
Để xaacutec định đuacuteng bagravei toaacuten magrave chuacuteng ta cần giải quyết thigrave phải trả lời đc một số cacircu hỏi
- cần hệ chuyecircn gia
Bước 2 thu thập tri thức lựa chọn cocircng cụ vagrave aacutep dụng
Trong bước thu thập tri thức vấn đề quan trọng lagrave lựa chọn chuyecircn gia những người magrave sẽ đoacuteng goacutep tri thức cho hệ thống Thocircng thường trong suốt quaacute trigravenh phaacutet triển thigrave chuyecircn gia được xem như một thagravenh viecircn của đội phaacutet triển
Hiện nay coacute rất nhiều cocircng cụ để xacircy dựng một hệ chuyecircn gia Phổ biến nhất lagrave JESS CLIPS vagrave OPS5
Bước 3 Thiết kế cơ sở tri thức thiết kế hệ thốngTri thức được biểu diễn trường minh trong cơ sở tri thức
Caacutec chuyecircn gia vagrave kỹ sư tri thức sẽ đối thoại với nhau bằng caacutec kỹ thuật đối thoại Suy diễn (SD) bảng Mocirc higravenh hoacutea SD quy nạp phacircn loại
Vấn đề bagraveo trigrave vagrave phaacutet triển
Caacutec hệ chuyecircn gia đogravei hỏi phải bảo trigrave vagrave phaacutet triển nhiều hơn so với caacutec hệ thống khaacutec Phải thường xuyecircn bổ sung tri thức mới vagrave thay đổi caacutec tri thức cũ để đổi mới hệ chuyecircn gia
Thu thập vagrave khắc phục lỗi do người sử dụng phaacutet hiện để kịp thời khắc phục những sai soacutet của hệ chuyecircn gia
75 Lợi iacutech vagrave hạn chế của caacutec hệ chuyecircn gia
Một số lợi iacutech chiacutenh
Thời gian trả lời hợp lyacute bằng hoặc nhanh hơn so với chuyecircn gia (người) để đi đến cugraveng một quyết định Hệ chuyecircn gia lagrave một hệ thống thời gian thực (real time system)
Khả năng trả lời với mức độ tinh thocircng bằng hoặc cao hơn so với chuyecircn gia (người) trong cugraveng lĩnh vực
Hệ chuyecircn gia giuacutep cho hiệu quả lagravem việc tăng bằng việc sử dụng tập caacutec luật một caacutech nhanh choacuteng magrave ko bị nhầm lẫn chuyecircn gia lagrave người coacute thể quecircn đi một số tri thức cơ sở lyacute luậ nhưng HCG thigrave ko
Quyết định của một người chuyecircn gia coacute thể bị thay đổi vagrave ko coacute tiacutenh thống nhất như quyết định của một hệ chuyecircn gia tạo ra
Hệ chuyecircn gia giuacutep cho người sử dụng coacute thể trau dồi sự hiểu biết trecircn lĩnh vuej cụ thể magrave noacute giải quyết hỗ trợ người ra quyết định coacute trigravenh độ như 1 chuyecircn gia trong quaacute trigravenh gia quyết định
Kiến thức của rất nhiều chuyecircn gia về một lĩnh vực nagraveo đoacute được đưa vagraveo hệ chuyecircn gia lagravem cho CSTT cuat HCG phong phuacute vagrave rộng lớn hơn rất nhiều
HCG giải thiacutech caacutec bước suy luận một caacutech dễ hiểu nhất quaacuten luacutec nagraveo cũng coacute thể sử dụng ko như chuyecircn gia con người
Hạn chế của caacutec hệ chuyecircn gia
Nhược điểm lớn nhất của hệ chuyecircn gia lagrave những yacute kiến chuyecircn mocircn thường rất khoacute matilde hoacutea vagrave giải neacuten
Hệ chuyecircn gia khocircng coacute khả năng tự học tự cập nhật kiến thức mới như caacutec chuyecircn gia magrave cần phải được matilde hoacutea lại khi noacute được cập nhật
Hệ chuyecircn gia khocircng thể nhận ra được vấn đề khocircng nằm trong miền kiến thức của hệ thống
Chương 8 Tri thức vagrave tiếp nhận
1 Bao gồm caacutec vấn đề
Dữ liệu thực tế đo lường hoặc quan saacutet coacute hoặc khocircng coacute bối cảnh
Thocircng tin dữ liệu được tổng hợp một caacutech hữu iacutech để giải quyết những khoacute khăn trong việc đưa ra quyết định
Tri thức bao gồm caacutec ứng dụng quy tắc thocircng tin hướng dẫn của người ra quyết định
2 Những caacutei nhigraven về tri thức
Đại diện lagravem thế nagraveo để diễn tả tri thức viacute dụ như một quyển saacutech khocircng phải lagrave tri thức nhưng noacute lại lagrave một đại diện của tri thức
Sản xuất tri thức lagrave một tập hơp của hagraveng tồn kho coacute thể được sản xuất cũng như mua lại
Tri thức lagrave 1 trong 6 trạng thaacutei của hệ thống
1Dữ liệu 2Thocircng tin 3Cấu truacutec thocircng tin 4Sự thấu hiểu 5Yacute kiến 6 Quyết định
3 Caacutec loại tri thức Phổ biến mocirc tả dữ liệu thocircng tin thủ tục mọi thứ lagravem như thế nagraveo lập luận chiacutenh saacutech hoặc caacutec quy tắc
4 Thu thập Tri thức hệ chuyecircn gia Hầu hết caacutec phương phaacutep đều bắt đầu với mocirc higravenh của caacutec taacutec vụ trong đoacute
hệ chuyecircn gia được xacircy dựng Trong đoacute mocirc tả về caacutec lĩnh vực được tạo ra Caacutec kỹ sư sử dụng caacutec mocirc higravenh giả thuyết vagrave nhận thức về quaacute trigravenh phacircn
tiacutech để gợi ra caacutech giải quyết vấn đề về tri thức từ caacutec chuyecircn gia
5 Caacutec chiều của thu thập tri thức KE- driven caacutec kỹ sư trao đổi trực tiếp với caacutec chuyecircn gia Expert-driven Caacutec chuyecircn gia trực tiếp đưa chuyecircn mocircn của họ vagraveo hệ
thống maacutey tiacutenh Machine-driven Sử dụng caacutec cocircng cụ suy luận để triacutech xuất tri thức từ một
tập caacutec viacute dụ
6 Kỹ thuật thu thập tri thức Trao đổi gồm 2 loại cơ bản lagrave coacute cấu truacutec(coacute kịch bản) vagrave khocircng coacute cấu
truacutec( đối thoại trực tiếp) Giao thức phacircn tiacutech bằng lời Khi caacutec chuyecircn gia thực hiện một cocircng việc
của họ thigrave một bản ghi về cocircng việc đoacute được thực hiện Caacutec kỹ sư sẽ xacircy dựng mocirc higravenh cho những gigrave được ghi lại trong bản ghi
Phương phaacutep sagraveng lọc caacutec chuyecircn gia so saacutenh caacutec nhoacutem liecircn tiếp trong ba đối tượng vagrave cho biết tại sao nhoacutem thứ hai lại khaacutec nhoacutem thứ ba
7 Thu thập tri thức từ nhiều nguồn Thu thập tri thức từ nhiều nguồn lagrave cần thiết để coacute được đầy đủ caacutec tri thức
cho một vấn đề quan điểm yacute kiến traacutei ngược nhau thường phaacutet sinh Phương phaacutep đồng thuận sẽ giuacutep giải quyết được vấn đề macircu thuẫn Kỹ thuật phacircn tiacutech Meta lagrave kỹ thuật được aacutep dụng trong caacutec trường hợp
khaacutec Caacutech tiếp cận bằng định lượng đogravei hỏi caacutec kỹ sư cần cacircn nhắc yếu tố đầu vagraveo của caacutec chuyecircn gia khaacutec nhau
8 Xaacutec nhận hợp lệ vagrave kiểm tra tri thức Một khi thu thập tri thức noacute phải được đaacutenh giaacute về khả năng sử dụng vagrave độ
chiacutenh xaacutec Hai vấn đề cụ thể lagrave hiệu lực của những kiến thức vagrave kiểm tra việc xacircy dựng cơ sở của tri thức
Cần xaacutec nhận xem liệu hệ thống coacute thể hoạt động ở mức độ tối thiểu khocircng
Xaacutec minh liecircn quan đến việc so saacutenh từng chi tiết kỹ thuật của hệ thống những gigrave đatilde được thực hiện cuối cugraveng
9 Một số caacutec biện phaacutep xaacutec nhận Độ chiacutenh xaacutec Khả năng thiacutech nghi Mức độ đầy đủ Bề rộng Độ sacircu Hiệu lực Tổng quan Chiacutenh xaacutec Hiện thực Độ tin cậy Tiacutenh hữu dụng Mức độ
Chương 9 Học maacutey
1 Logic mờ vagrave ngocircn ngữ mờ(Fuzzy Logic and Linguistic Ambiguity)
Ngocircn ngữ tự nhiecircn gồm những khaacutei niệm mơ hồ vagrave khocircng chiacutenh xaacutectruyền tải ngữ nghĩa thocircng qua tiacutenh xấp xỉkhocircng rotilde ragraveng
Những xấp xỉ nagravey giuacutep con người coacute thể truyền tải hết được yacute nghĩa nhưng maacutey thigrave khocircng hiểu
Lagravem sao biểu diễn caacutec tri thức sử dụng caacutec khaacutei niệm khocircng rotilde ragraveng(mờ) hoặc khocircng chiacutenh xaacutec
2 Khaacutei niệm cơ bản của logic mờ tập mờ lagrave những tập hợp khocircng coacute một giới hạn rotilde Mỗi phần tử của noacute chỉ
chứa một mức độ hagravem liecircn thuộc của từng phần tử Vigrave vậy tập mờ khocircng giống như tập cổ điển Tập mờ coacute thể kết hợp với nhau qua những luật mờ magrave đặc trưng cho những hagravenh động trạng thaacutei vagrave thuộc tiacutenh của logic mờ được tận dụng khi thực hiện một bộ điều khiển mờ
Logic mờ dựa trecircn yacute tưởng mỗi phần tử thuộc vagraveo một tập hợp ở một mức độ nagraveo đấy
Locircgic mờ cho pheacutep độ liecircn thuộc (microA )coacute giaacute trị trong khoảng (01) Locircgic mờ coacute thể được coi lagrave mặt ứng dụng của lyacute thuyết tập mờ để xử lyacute caacutec
giaacute trị trong thế giới thực cho caacutec bagravei toaacuten phức tạp
3 So saacutenh tiacutenh đuacuteng đắn logic mờ vagrave xaacutec suất Xaacutec suất thigrave đề cập đến khả năng xảy ra một biến cố hay một điều gigrave đoacute Logic mờ đề cập đến cấp độ magrave đặc tiacutenh ở hiện tại
o viacute dụ1 người coacute chiều cao 6 feet thigrave coacute cấp độ lagrave 05 về chiều cao
4 Ưu điểm của logic mờ Caacutech tiếp cận rất tự nhiecircnkhocircng phức tạp Coacute thể mocirc higravenh hoacutea caacutec hagravem phi tuyến tugravey yacute phức tạp
Coacute thể tận dụng được kinh nghiệm từ những chuyecircn gia hagraveng đầu trong mọi lĩnh vực
Logic mờ được xacircy dựng dựa trecircn ngocircn ngữ tự nhiecircnNền tảng của logic mờ lagrave dựa trecircn cơ sở giao tiếp của con người
5 Nhược điểm của logic mờ Trong 1 hệ thống phức tạpsử dụng logic mờ coacute thể trở thagravenh trở ngại cho
việc xaacutec thực độ tin cậy của hệ thống Cơ chế lập luận mờ khocircng thể học hỏi từ những lỗi sai
6 Mạng noron nhacircn tạo(ANN) Mạng noron nhacircn tạo lagrave một mocirc phỏng xử lyacute thocircng tinđược nghiecircn cứu ra
từ hệ thống thần kinh của sinh vậtgiống như bộ natildeo để xử lyacute thocircng tin ANNs lagrave chương trigravenh dựa trecircn maacutey tiacutenh đơn giản coacute chức năng lagrave một mocirc
higravenh bagravei toaacuten khocircng gian dựa trecircn thử nghiệm vagrave baacuteo lỗi
7 Học từ kinh nghiệm Tiến trigravenh Một mẫu dữ liệu được biểu diễn như một mạng lưới noronANN ldquodự
đoaacutenrdquo 1 đầu radự đoaacuten được so saacutenh với giaacute trị thực tế hoặc giaacute trị chiacutenh xaacutecNếu đoaacuten được chiacutenh xaacutec thigrave khocircng coacute hagravenh động nagraveo được thực hiện
Nếu dự đoaacuten sai ANN kiểm tra lại vagrave xaacutec định lại thocircng số để điều chỉnh Một mẫu dữ liệu khaacutec được biểu diễn vagrave quaacute trigravenh nagravey được lặp lại
8 Nguyecircn tắc cơ bản của cocircng nghệ nơron Caacutec yếu tố xử lyacute cơ bản trong hệ thống thần kinh của con người lagrave tế bagraveo
thần kinhMạng lưới của tế bagraveo nagravey lagrave liecircn kết với nhau nhận được thocircng tin từ caacutec cảm biến trong mắt taihellip
Thocircng tin nhận được bởi tế bagraveo thần kinh hoặc lagrave sẽ kiacutech thiacutech noacute(sẽ được chuyển qua 1 thocircng điệp dọc theo mạng lưới) hoặc lagrave sẽ ngăn cản noacute(ngăn cản dograveng thocircng tin)
Độ nhạy coacute thể thay đổi qua thời gian hoặc sau khi coacute được kinh nghiệm
9 Cấu truacutec mạng Một ANN gồm 3 lớp cơ bản
Lớp đầu vagraveo nhận dữ liệu Lớp becircn trong hoặc lagrave lớp ẩn xử lyacute dữ liệu Lớp đầu ra chuyển tiếp kết quả cuối cugraveng của mạng
10Mạng nơ ron Thường coacute nhiều đầu vagraveo mỗi đầu vagraveo với mức ảnh hưởng vagrave tầm quan
trọng riecircng của noacute Một đầu vagraveo quan trọng coacute thể được sử dụng để khuếch đại đầu ra caacutec hagravem trạng thaacutei tổng hợp caacutec trọng số của caacutec yếu tố
đầuvagraveo khaacutec nhauvagraveo một giaacute trị duy nhất Caacutec hagravem chuyển giao xử lyacute caacutec giaacute trị trạng thaacutei vagrave tạo đầu ra
11Huấn luyện mạng nơ ron Trong mocirc higravenh coacute giaacutem saacutetANN được đến so saacutenh dự đoaacuten của chiacutenh
noacute với thocircng tin phản hồi coacute chứa caacutec kết quả mong muốn ANN sẽ phải tigravem caacutech thay đổi caacutec tham số becircn trong củamigravenh (caacutec trọng số vagrave caacutec ngưỡng) để tạo necircn một aacutenh xạ coacute khả năng aacutenh xạcaacutec đầu vagraveo thagravenh caacutec đầu ra mong muốn Sự thay đổi nagravey được tiến hagravenh nhờ việc so saacutenh giữa đầu ra thực sự vagrave đầu ra mong muốn
Trong mocirc higravenh khocircng coacute giaacutem saacutetANN nhận được dữ liệu vagraveo nhưng khocircng phải coacute bất kỳ thocircng tin phản hồi về kết quả mong muốn
Phần lớn caacutec ứng dụng nằm trong vugraveng của caacutec bagravei toaacuten ước lượng như mocirc higravenh hoacuteathống kecirc neacuten lọc phacircn cụm
12Lợi iacutech Liecircn kết với mạng noron Traacutenh caacutech lập trigravenh tường minh Giảm nhu cầu của chuyecircn gia ANNs thigrave thiacutech nghi với caacutec yếu tố đầu vagraveo thay đổi Khocircng cần thiết cho cơ sở tri thức tinh chế ANNs coacute tiacutenh động vagrave cải thiện với việc sử dụng Coacute khả năng xử lyacute dữ liệu khocircng chiacutenh xaacutec hoặc khocircng đầy đủ Cho pheacutep tổng quaacutet hoacutea từ thocircng tin cụ thể Cho pheacutep thu thập cảm giaacutec thocircng thường vagraveo miền giải quyết vấn đề
13Hạn chế của việc liecircn kết với mạng noron ANNs khocircng thể giải thiacutech được suy luận Bản chất hộp đen thường khiến cho vấn đề traacutech nhiệm vagrave độ tin cậy phaacutet
sinh lagrave khoacute khăn Lặp đi lặp lại quaacute trigravenh huấn luyện rất tốn thời gian Nguồn lực caacutec nhagrave phacircn tiacutech vagrave thiết kế coacute tay nghề cao vẫn lagrave đaacuteng lo
ngại Cocircng nghệ ANN thuacutec đẩy hạn chế của phần cứng hiện tại ANN yecircu cầu phải coacute sự tin tưởng ở đầu ra
14Giới thiệu về thuật toaacuten di truyền Cũng như mạng lưới thần kinh caacutec thuật toaacuten di truyền được dựa trecircn lyacute
thuyết sinh học Thuật toaacuten di truyền tigravem thấy nguồn gốc của chuacuteng trong caacutec lyacute thuyết
tiến hoacutea của chọn lọc tự nhiecircn vagrave thiacutech ứng với biến đổi khiacute hậu Kết quả thuật toaacuten di truyền lagrave từ giao phối 2 caacute thể trong quần thế để tạo
ra con caacutei đocirci khi tốt hơn so với bậc cha mẹ của chuacuteng 15Caacutec thagravenh phần cơ bản của thuật toaacuten di truyền
Toaacuten tử chọn lọc Caacutec caacute thể tốt được chọn lọc để đưa vagraveo thế hệ sau Sự chọn lọc nagravey căn cứ vagraveo độ thiacutech nghi với mocirci trường của mỗi caacute thể
Toaacuten tử lai gheacutep (crossover) Hai caacute thể cha vagrave mẹ trao đổi caacutec gen với nhau để tạo ra caacute thể con
Toaacuten tử đột biến (mutation) Một caacute thể thay đổi một số gen để biến đổi thagravenh một caacute thể mớiTất cả caacutec toaacuten tử trecircn khi thực hiện đều mang tiacutenh ngẫu nhiecircn
16Quaacute trigravenh cơ bản của một thuật toaacuten di truyền Khởi tạo
Đaacutenh giaacute quần thể
Lựa chọn NST thiacutech hợp nhất vagrave loại bỏ NST yếu nhất
Quy trigravenh giao nhau vagrave cải thiện quần thể
đột biến tiến trigravenh để khaacutem phaacute ra NST mới
17Ưu nhược điểm của việc kết hợp với thuật toaacuten di truyền Kiacutech thước quần thể lagrave 1 yếu tố quan trọng trong tốc độ của việc tigravem
kiếmnhưng noacute tương đối dễ dagraveng để dự đoaacuten tốc độ nagravey Giao nhau hoặc đột biến lagrave khocircng necircn đc sử dụng quaacute thường xuyecircn Luocircn coacute được iacutet nhất 1 giải phaacutep hợp lyacute Necircn coacute thể aacutep dụng chuacuteng cho caacutec vấn đề magrave chuacuteng ta khocircng coacute hướng
về caacutech giải quyết Sức mạnh của thuật toaacuten xuất phaacutet từ khaacutei niệm đơn giảnkhocircng phải từ
một thủ tục thuật toaacuten phức tạp 18Tương lai của học maacutey
Mạng lưới thần kinh nhacircn tạo vượt quaacute năng lực của con người trong caacutec trường hợp bị cocirc lập
Về mặt lyacute thuyếtmột maacutey tiacutenh coacute thể xử lyacute dũ liệu nhanh hơn hagraveng triệu lần so với 1 con người
May mắn thay cho chuacuteng tacon người tốt hơn nhiều khi magrave coacute được dữ liệumaacutey tiacutenh khocircng coacute 1 số thứ như lagrave 5 giaacutec quan
CHƯƠNG 10 KHO DỮ LIỆU
1 Kho dữ liệu Kho dữ liệu lagrave tuyển tập caacutec cơ sở dữ liệu tiacutech hợp hướng chủ đề được
thiết kế để trợ giuacutep cho một hệ hỗ trợ quyết định
Theo John Ladley Cocircng nghệ kho dữ liệu lagrave tập caacutec phương phaacutep kỹ thuật vagrave caacutec cocircng cụ coacute thể kết hợp hỗ trợ nhau để cung cấp thocircng tin cho người sử dụng trecircn cơ sở tiacutech hợp từ nhiều nguồn dữ liệu nhiều mocirci trường khaacutec nhau
Kho dữ liệu thường rất lớn tới hagraveng trăm GB hay thậm chiacute hagraveng Terabyte
2 Kho dữ liệu vận hagravenh (ODS) Một kho dữ liệu vận hagravenh Aacutep dụng kỹ thuật kho dữ liệu vagraveo caacutec hệ xử
lyacute giao taacutec lưu trữ dữ liệu cho một ứng dụng đặc thugrave Noacute đưa vagraveo kho dữ liệu một dograveng caacutec dữ liệu thocirc được thiết kế
3 So saacutenh
Kho dữ liệu vận hagravenh Kho dữ liệu
Dữ liệu theo chủ đề Dữ liệu theo chủ đề
Dữ liệu tiacutech hợp Dữ liệu tiacutech hợp
Dữ liệu thay đổi Dữ liệu khocircng thay đổi
Dữ liệu được cập nhật khi thay đổi
Dữ liệu giữ nguyecircn
Chỉ coacute dữ liệu hiện tạiDữliệu hiện tại vagrave dữ liệu lịch sử
Chu kỳ lagravem tươi dữ liệu ngắn Chu kỳ lagravem tươi dữ liệu dagravei
Chỉ coacute dữ liệu chi tiết Dữ liệu chi tiết vagrave dữ liệu tổng kết
Dugraveng cho caacutec quyết định ngắn hạn
Dugraveng cho hoạch định dagravei hạn
4 Kho dữ liệu cục bộ (Data Mart - DM)
Kho dữ liệu cục bộ lagrave CSDL coacute những đặc điểm giống với kho dữ liệu nhưng với quy mocirc nhỏ hơn vagrave lưu trữ dữ liệu về một lĩnh vực một chuyecircn ngagravenh
Data mart phụ thuộc Chứa những dữ liệu được lấy từ DW vagrave những dữ liệu nagravey sẽ được triacutech lọc vagrave tinh chế tiacutech hợp lại ở mức cao hơn để phục vụ một chủ đề nhất định của Datamart
Data mart độc lập Khocircng giống như Datamart phụ thuộc Data mart độc lập được xacircy dựng trước DW vagrave dữ liệu được trực tiếp lấy từ caacutec nguồn khaacutec nhau
5 Siecircu dữ liệu Metadata lagrave dữ liệu để mocirc tả dữ liệu Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột
một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi Metadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu
6 Mocirci trường kho dữ liệu Hệ thống của tổ chức vagrave kho cung cấp dữ liệu để xacircy dựng kho dữ liệu Trong quaacute trigravenh chuyển dữ liệu từ caacutec nguồn khaacutec nhau dữ liệu coacute thể
được lagravem sạch hoặc chuyển đổi vagrave vigrave thế DW được xem như lagrave một chuẩn cho việc lưu trữ
Đồng thời siecircu dữ liệu được ghi lại Cuối cugraveng DW hoặc siecircu thị coacute thể được sử dụng để tạo ra một kho dữ
liệu ldquocaacute nhacircnrdquo 7 Caacutec đặc điểm của kho dữ liệu
Đặc điểm Mocirc tả
Hướng chủ đề - DL tổ chức theo caacutech thức người dugraveng tham chiếu
Tiacutech hợp - Dữ liệu ldquosạchrdquo loại bỏ tiacutenh thiếu nhất quaacuten
Khocircng thay đổi - DL ldquochỉ đọcrdquo người dugraveng khocircng thay đổi được
Chuỗi thời gian - DL lagrave chuỗi thời gian khocircng phải lagrave trạng thaacutei hiện tại
Được tổng kết - DL vận hagravenhthao taacutec khi cần thiết
được kết hợp lại thagravenh dạng coacute thể dugraveng được cho quyết định
Kiacutech cỡ lớn hơn - Lưu giữ theo chuỗi thời gian tức lagrave giữ lại nhiều DL
Khocircng được chuẩn hoacutea - Coacute thể dư thừa DLSiecircu dữ liệu - Dữ liệu của dữ liệu được lưu trữNguồn dữ liệu - DL vận hagravenh (caacutec hệ sẵn coacute) cugraveng
với caacutec nguồn ngoagravei 8 Kho dữ liệu hướng chủ đề
Hướng chủ để coacute nghĩa lagrave kho dữ liệu được tổ chức xung quanh caacutec chủ đề chiacutenh như khaacutech hagraveng sản phẩm sản xuất Tập trung vagraveo việc mocirc higravenh hoacutea vagrave phacircn tiacutech dữ liệu cho caacutec nhagrave ra quyết định magrave khocircng tập trung vagraveo caacutec xử lyacute thocircng thường Cung cấp cho người dugraveng một khung nhigraven toagraven vẹn đơn giản vagrave đầy đủ về caacutec sự kiện quanh caacutec chủ đề
9 Dữ liệu trong DW được tiacutech hợp Dữ liệu trong kho dữ liệu được xacircy dựng bằng caacutech tổng hợp dữ liệu từ
nhiều nguồn khaacutec nhau vagrave caacutec nguồn coacute tổ chức khaacutec nhau Cơ sở dữ liệu caacutec file excel caacutec flat file hoặc caacutec raw file Khi đưa vagraveo kho dữ liệu caacutec dữ liệu được lagravem sạch vagrave tiacutech hợp dữ liệu nhằm đảm bảo tiacutenh nhất quaacuten của dữ liệu
10Kiến truacutec kho dữ liệu Tầng cơ sở dữ liệu hoạt động Tầng truy xuất thocircng tin Tầng truy xuất dữ liệu Tầng siecircu dữ liệu Tầng quản lyacute tiến trigravenh Tầng thocircng điệp của ứng dụng Tầng vật liacute của kho dữ liệu Tầng trigravenh diễn dữ liệu
11Higravenh trạng kho dữ liệu Kho dữ liệu ảo - người dugraveng cuối coacute thể truy cập trực tiếp đến kho dữ liệu
sử dụng caacutec cocircng cụ cho pheacutep ở tầng truy xuất dữ liệu Kho dữ liệu trung tacircm-1 cơ sở dữ liệu vật lyacute chứa tất cả dữ liệu cho một
vugraveng chuyecircn dụng nagraveo đoacute
Kho dữ liệu phacircn taacuten- Thagravenh phần được phacircn taacuten qua nhiều hệ cơ sở dữ liệu vật lyacute
12METADATA- Siecircu dữ liệu Định nghĩa Siecircu dữ liệu lagrave dữ liệu về dữ liệu Lagrave 1 lưu trữ dugraveng để
Miecircu tả kho dữ liệu tổng thể Nhận dạng kiểu kho dữ liệu Quản liacute quaacute trigravenh tiacutech hợp dữ liệu Quản liacute quaacute trigravenh cập nhật kho dữ liệu Quản liacute bảo mật
Lagrave chigravea khoacutea quyết định sự thagravenh cocircng của kho dữ liệu luocircn được thay đổi vagrave cập nhật theo sự phaacutet triển của kho dữ liệu
Dugraveng để quản liacute điều khiển kho dữ liệu Sự ra đời của kho dữ liệu như 1 cấu truacutec hỗ trợ ra quyết định siecircu dữ liệu
được xem như nguồn tagravei nguyecircn dữ liệu Siecircu dữ liệu lagrave trừu tượng Chuacuteng lagrave dữ liệu bậc cao cung cấp mocirc tả ngắn
gọn caacutec dữ liệu bậc thấp hơn 13Hoạt động của Siecircu dữ liệu
Siecircu dữ liệu rất cần thiết trong việc chuyển hoacutea thocircng tin trở thagravenh tri thức Lagrave chigravea khoacutea giuacutep chuacuteng ta xử lyacute được dữ liệu thocirc Viacute dụ một dograveng dữ liệu baacuten hagraveng 1023 K596 11121 agraveNoacute sẽ khocircng coacute nghĩa gigrave cho đến khi chuacuteng ta đưa vagraveo siecircu dữ liệu (thư
mục chứa dữ liệu) agrave cửa hagraveng 1023 sản phẩm K596 vagrave số tiền baacuten được lagrave 11121 đocirc la
14Sự cần thiết phải nhất quaacuten trong kho dữ liệu Kho dữ liệu được xacircy dựng cho lợi iacutech của những nhagrave phacircn tiacutech kinh
doanh caacutec nhagrave quản trị cho tất cả caacutec khu vực chức năng Trong cơ sở dữ liệu riecircng caacutec khu vực khaacutec nhau coacute thể định nghĩa vagrave lưu
trữ dữ liệu thocircng qua phiecircn bản của chiacutenh noacute Khi dữ liệu được lấy từ những vugraveng khaacutec nhau đoacute vagrave được đặt vagraveo kho dữ
liệu Việc chuyển đổi vagrave lagravem sạch caacutec tiến trigravenh sẽ đảm bảo noacute lagrave duy nhất được tiacutech hợp tại một mức của tổ chức
15Ragrave soaacutet lại dữ liệu ndash Thực thi siecircu dữ liệu
Bất kể cấu truacutec tự nhiecircn của 1 cacircu truy vấn thế nagraveo thigrave caacutec thagravenh phần của siecircu dữ liệu rất quan trọng đối với người ra quyết định
Bảng thuộc tiacutenh khoacutea được lưu trữ bởi kho dữ liệu Tập hợp dữ liệu được lấy từ đacircu Những chuyển đổi nagraveo được thực thi với việc lagravem sạch
16Siecircu dữ liệu lagrave gigrave Metadata - lagrave thocircng tin mocirc tả nội dung của cơ sở dữ liệu (CSDL) Metadata baacuteo cho người dugraveng biết thời gian cập nhật sau cugraveng của dữ liệu
định dạng vagrave mục điacutech sử dụng của noacute Những thocircng tin nagravey coacute thể hướng dẫn người dugraveng duyệt qua CSDL vagrave
giuacutep họ hiểu được yacute nghĩa vagrave ngữ cảnh của dữ liệu Trong CSDL metadata lagrave caacutec dạng biểu diễn khaacutec nhau của caacutec đối tượng
trong CSDL Trong CSDL quan hệ metadata lagrave caacutec định nghĩa của bảng cột CSDL
view vagrave nhiều đối tượng khaacutec Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột
một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi -gtMetadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu
Bảng chuyển đổi Ghi lại những chuyển đổi đatilde được thực hiện
Lịch sử thực thi Ghi lại những dữ liệu đatilde được
phacircn tiacutech
Higravenh thaacutei kết nốiGhi lại những dữ liệu được kết nối vagrave tần suất
17Aacutenh xạ thocircng thường của siecircu dữ liệu Bản ghi aacutenh xạ chuyển đổi bao gồm
Định danh của nguồn gốc Chuyển đổi thuộc tiacutenh Chuyển đổi thuộc tiacutenh vật lyacute Matilde hoacutea tham chiếu bảng chuyển đổi Đổi tecircn Đổi khoacutea Gaacuten giaacute trị cho thuộc tiacutenh mặc định Chọn logic cho caacutec nguồn nhiều giaacute trị Đổi thuật toaacuten
18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để
phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai
lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave
tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec
Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm
Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo
19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua
caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau
SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được
Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra
một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức
Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ
Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ
Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech
CHƯƠNG 11 KHAI PHAacute DỮ LIỆU
1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn
ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993
Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng
2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd
1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều
2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP
3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn
4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng
5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server
6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo
7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động
8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời
9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều
10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện
11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech
12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP
3 Xử lyacute phacircn tiacutech trực tuyến OLAP
MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave
dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu
ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave
thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu
HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave
ROLAP4 Khai phaacute dữ liệu
Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh
khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn
Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan
5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp
6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại
Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp
Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec
Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt
Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra
Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh
vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho
Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec
Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm
Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục
Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng
gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp
Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn
Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec
Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper
Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2
Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25
Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước
Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng
Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện
trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp
Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute
độ hỗ trợ ge ngưỡng minsup
độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan
Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn
Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết
Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu
MOLAP ROLAP HOLAP
Lưu trữ dữ liệu cơ sở
Khối Bảng quan hệ Bảng quan hệ
Lưu trữ thocircng tin tổng hợp
Khối Bảng quan hệ Khối
Hiệu suất thực hiện truy vấn
Nhanh nhất Chậm nhất Nhanh
Tiecircu thụ khocircng gian lưu trữ
Nhiều Thấp Trung bigravenh
Chi phiacute bảo trigrave Cao Thấp Trung bigravenh
Cơ sở mocirc higravenh lagrave một biến thể của CSDL Noacute lưu trữ vagrave tổ chức caacutec mocirc higravenh khaacutec nhau magrave DSS sử dụng khi phacircn tiacutech chuacuteng
MBMS lagrave biến thể của DBMS Cơ sở mocirc higravenh chiacutenh lagrave caacutei thể hiện sự khaacutec biệt của một DSS với caacutec hệ
thống thocircng tin khaacutec Tổng quan chức năng của MBMS
Modeling language ndash Cho pheacutep tạo lập caacutec mocirc higravenh quyết định vagrave cung cấp cơ chế liecircn kết nhiều mocirc higravenh để tạo mocirc higravenh phức tạp hơn Model library ndash Lưu trữ vagrave quản lyacute tất cả caacutec mocirc higravenh cung cấp một catalog cugraveng với mocirc tả Model manipulation ndash Cho pheacutep quản lyacute vagrave xử lyacute cơ sở mocirc higravenh với caacutec chức năng (run store query etc) tương tự như caacutec chức năng trong một DBMS
5Cơ sở tri thức của DSS Mọi quyết định đuacuteng đắn đều đogravei hỏi quaacute trigravenh lập luận vagrave quaacute trigravenh nagravey lại
đogravei hỏi thocircng tin Cơ sở tri thức lagrave nơi lưu trữ tất cả caacutec thocircng tin dạng nagravey trong DSS Tri thức coacute thể đơn giản chỉ lagrave caacutec thocircng tin thocirc caacutec quy tắc caacutec heuristics
caacutec ragraveng buộc hoặc kết quả của quaacute khứ Tri thức nagravey khaacutec với thocircng tin cả trong CSDL vagrave cơ sở mocirc higravenh ở chỗ noacute
mang đặc trưng của bagravei toaacuten Nội dung kiến thức cơ sở
Tri thức trong cơ sở tri thức coacute thể được phacircn lagravem 2 loại Facts thể hiện điều chuacuteng ta coi lagrave đuacuteng tại thời điểm cho trước Hypotheses thể hiện caacutec quy tắc hoặc caacutec quan hệ magrave chuacuteng ta tin lagrave tồn tại giữa caacutec facts
Kiến thức thu nhận vagrave truy hồi Một hoặc một vagravei người sẽ thu thập thocircng tin cho cơ sở tri thức Đacircy lagrave những
người được đagraveo tạo đặc biệt về caacutec kỹ thuật để thu thập thocircng tin từ caacutec chuyecircn gia lĩnh vực
Mocirc tơ suy diễn (inference engine) lagrave một phần của cơ sở tri thức Noacute aacutep dụng caacutec quy tắc để lấy ra thocircng tin dưới dạng magrave người dugraveng mong muốn
6Giao diện người dugraveng Giao diecircn người dugraveng lagrave một thagravenh phần được thiết kế để cho pheacutep người
dugraveng truy cập tới caacutec thagravenh phần becircn trong của hệ thống
Thocircng thường giao diện cagraveng gần gũi thigrave cagraveng iacutet đogravei hỏi việc huấn luyện người dugraveng Hatildey suy nghĩ xem coacute bao nhiecircu chương trigravenh Windows dugraveng cugraveng cấu truacutec menu như Microsoft Word
Caacutec chức năng chiacutenh của một giao diện của DSS Communication language vagrave Presentation language
Communication language ndash Cho pheacutep tương taacutec với DSS theo nhiều caacutech xaacutec định caacutec dạng input cung cấp caacutec hỗ trợ cho người dugraveng thu giữ caacutec hội thoại đatilde qua để cải thiện caacutec tương taacutec trong tương lai
Presentation language ndash Cung cấp khả năng thể hiện dữ liệu theo nhiều caacutech cho pheacutep sinh caacutec baacuteo caacuteo chi tiết cung cấp nhiều khung nhigraven khaacutec nhau về dữ liệu
7Vai trograve người dugraveng Trong một DSS người dugraveng cũng lagrave một thagravenh phần của hệ thống giống như
hardware vagrave software User roles Người dugraveng được phacircn thagravenh 5 lớp (decision maker
intermediary maintainer operator and feeder) Patterns of DSS use Lagrave sự phacircn loại tiến theo của caacutec user roles khaacutec nhau
thagravenh 1 trong 4 basic patterns of use Slide tiếp theo sẽ mocirc tả caacutec patterns nagravey
8Caacutec mocirc higravenh sử dụng DSS Subscription mode _nhagrave sản xuất quyết định nhận caacutec baacuteo caacuteo thường
xuyecircn theo dự kiến Terminal mode_ nhagrave sản xuất quyết định tương taacutec trực tiếp với DSS Clerk mode - nhagrave sản xuất quyết định sử dụng hệ thống trực tiếpnhưng
khocircng trực tuyến Đầu ra phản hồi coacute thể mất một thời gian Intermediary mode - nhagrave sản xuất quyết định tương taacutec thocircng qua việc sử
dụng mộthoặc nhiều mocirc higravenh trung gian9Danh mục vagrave lớp của DSSCoacute nhiều phương phaacutep để cố gắng phacircn loại caacutec DSSs
Data-centric and model-centric Formal and ad hoc systems Directed versus nondirected DSSs Procedural and nonprocedural systems Hypertext systems Spreadsheet systems Individual and group DSSs
Caacutec đặc trưng thống nhất của mỗi lược đồ cụ thể giữ vai trograve quan trọng trong việc xaacutec định caacutech tiếp cận tốt nhất để thiết kế một hệ thống mới
Chương 2Quyết định vagrave quyết định của nhagrave sản xuất10Quaacute trigravenh ra quyết định
Quaacute trigravenh ra quyết định gồm coacute 3 giai đoạn (Simon 1977)bull Tigravem hiểu bagravei toaacuten dẫn đến quyết định
+Xaacutec định mục tiecircu tổ chức+Tigravem kiếm vagrave tập hợp dữ liệu+Nhận diện xaacutec định chủ thể bagravei toaacuten+phacircn loại vagrave phaacutet biểu vấn đề
bull Thiết kế (design) phacircn tiacutech vagrave xacircy dựng caacutec diễn trigravenh hagravenh động+Thiết lập mocirc higravenh+Lập bảng tiecircu chuẩn chọn lựa+Tigravem kiếm caacutec phương aacuten+Tiecircn đoaacuten vagrave đo lường caacutec kết cục
bull Chọn lựa (choice) chọn một diễn trigravenh trong tập diễn trigravenh+Giải phaacutep cho mocirc higravenh+Phacircn tiacutech độ nhạy+Chọn (caacutec) phương aacuten tốt nhất+Hoạch định việc hiện thực
tiếp theo giai đoạn chọn lựa lagrave giai đoạn hiện thực (implementation)11Người ra quyết định
Người ra quyết định (decision maker) giữ một vai trograve tacircm thần phacircn liệt vigrave vừa được coi lagrave một bước trong quaacute trigravenh vagrave cũng lại lagrave người tham gia
Phacircn lớp người ra quyết định-Quyết định caacute nhacircn coacute thể lagrave 1 người hoặc một hệ thống maacutey tiacutenh đơn lẻ-Nhiều người ra quyecirct định coacute thể lagrave
+Nhoacutem (group)trong đoacute mọi thagravenh viecircn đều coacute tiếng noacutei trong việc ra quyết định
+Đội(team) Caacutec thagravenh viecircn hỗ trợ một người ra quyết định duy nhất+Tổ chứcTrong đoacute cần sự thỏa thuận chung
12Caacutec kiểu ra quyết định Style lagrave caacutech magrave người quản lyacute ra quyết định
Hiệu lực của mỗi style riecircng biệt phụ thuộc vagraveo ngữ cảnh bagravei toaacuten nhận thức của người ra quyết định vagrave tập caacutec giaacute trị caacute nhacircn của bản thacircn họ
Độ phức tạp của caacutec điều đoacute liecircn kết lại với nhau trong việc higravenh thagravenh decision style
Caacutec kiểu ra quyết định Directive ndash kết hợp đogravei hỏi về cấu truacutec bagravei toaacuten cao với mức độ nhập nhằng thấp
Thocircng thường đacircy lagrave caacutec quyết định coacute bản chất kỹ thuật vagrave đogravei hỏi iacutet thocircng tin Analytical ndash Mức độ nhập nhằng lớn hơn vagrave đogravei hỏi nhiều thocircng tin hơn Conceptual ndash Mức độ nhập nhằng cao vagrave thường gần gũi với caacutech ra quyết định
của con người Behavioral ndash đogravei hỏi lượng dữ liệu nhỏ vagrave thể hiện caacutei nhigraven ngắn hạn Thường
xảy ra xung đột necircn phải dựa vagraveo sự đồng thuận Caacutec kiểu ra quyết định trong thiết kế hệ trợ giuacutep quyecirct định
Những cản trở lớn chiacutenh lagrave phản ứng của người ra quyết định trước aacutep lực vagrave phương phaacutep dugraveng để giải bagravei toaacuten
Viacute dụ đối với những người khocircng chịu được aacutep lực trong dạng directive thigrave giao diện cần cho pheacutep người ra quyết định kiểm soất được hệ thống với khocircng coacute quaacute nhiều dữ liệu đầu vagraveo
Đối với kiểu analytic DSS cần cho pheacutep truy cập tới nhiều nguồn dữ liệu magrave người ra quyết định sẽ phacircn tiacutech
13Khoacute khăn khi xacircy dựng DSS
- Thocircng tin mocirc higravenh cấu truacutec -gt iacutet thocircng tin
- Khả năng của con người (khả năng hiểu biết) chỉ xử lyacute được từ 5-gt9 quaacute trigravenh thocircng tin khaacutec nhau
- Khocircng chắc chắn ( mức độ hoagraven thagravenh vagrave tiacutenh chiacutenh xaacutec)
- Coacute nhiều lựa chọn vagrave đa mục tiecircu
Chương 3Quyết định trong tổ chức
14Tổ chức lagrave gigrave Tổ chức Lagrave 1 hệ thống thống nhất caacutec nguồn tagravei nguyecircnĐược cấu thagravenh bởi caacutec
hệ thống nhỏ hơn ragraveng buộc với nhau bởi caacutec mục tiecircu đề ra
Tổng thể 1 tổ chức sẽ mạnh mẽ hơn rất nhiều so với tất cả caacutec thagravenh phần của noacute cộng lại
Mối liecircn hệ của caacutec quyecirct định Mục điacutech chiacutenh của caacutec tổ chức lagrave đưa ra caacutec quyết định trong mocirci trường kinh doanh Caacutec Quyết định phải phugrave hợp với giới hạncaacutec chiacutenh saacutech caacutec thủ tục vagrave lĩnh vực hoạt động Noacute khocircng phụ thuộc vagraveo người đưa ra quyết định lagrave ai Đoacute coacute thể lagrave 1 caacute nhacircn1 nhoacutem hay thậm chiacute DSSs
Độ đo của quyết địnhNăm khiacutea cạnh ảnh hưởng tới Quyết định
Kết cấu nhoacutem (Group Structure) Vai trograve trong nhoacutem(Group Roles) Quaacute trigravenh lagravem việc(Group Processes) Taacutec phong(Group Style) Quy tăc nhoacutem(Group Norm)
Kết cấu nhoacutem Trong 1 nhoacutem chuẩn caacutec thagravenh viecircn coacute traacutech nhiệm vagrave thẩm quyền ra quyết định như nhau Vai trograve trong nhoacutemTrong nhoacutem caacutec thagravenh viecircn đều coacute vai trograve riecircng vagrave
lagrave 1 phần quan trong trong cả tiến trigravenh Quaacute trigravenh lagravem việcQuaacute trigravenh dugraveng người trong nhoacutem ảnh hưởng tới loại
quyết định gacircy hiệu quả vagrave ảnh hưởng tới cả tiến trigravenh Taacutec phong Coacute phải taacutec phong của người ra quyết định coacute ảnh hưởng tới
chất lượng quyết định cuối khocircng Quy tắc nhoacutemQuy tắc nhoacutem lagrave cực kỳ quan trọng trong việc xaacutec định
hagravenh vi caacutec thagravenh viecircn nhoacutem trong caacutec tigravenh huống xatilde hội Phacircn cấp quyết định trong tổ chức3 cấp
Chiến lược Ban latildenh đạo cấp cao hoặc nhagrave quản lyacute Caacutec quyết định mang tiacutenh lacircu dagravei nhất
Chiến thuật Quản lyacute tầm trung Thực thi caacutec quyết định chiến lược đề ra
Thực hiện
Caacute nhacircn chuyecircn ngagravenh Tự đưa ra caacutec quyết định từng ngagravey
15Năng lực của hệ HTQD
1 HHTQĐ cơ bản hỗ trợ caacutec nhagrave ra quyết định trong caacutec tigravenh huống nửa cấu truacutec vagrave phi cấu truacutec bằng caacutech kết hợp phaacuten xử của con người vagrave xử lyacute thocircng tin bằng maacutey tiacutenh Caacutec bagravei toaacuten như vậy khocircng thểkhocircng thuận tiện giải quyết được chỉ bằng caacutec cocircng cụ maacutey tiacutenh hoacutea hay caacutec phương phaacutep định lượng 2 Phugrave hợp cho caacutec cấp quản lyacute khaacutec nhau từ cao đến thấp 3 Phugrave hợp cho caacute nhacircn lẫn nhoacutem Caacutec bagravei toaacuten iacutet coacute tiacutenh cấu truacutec thường liecircn đới đến nhiều caacute nhacircn ở caacutec đơn vị chức năng hay mức tổ chức khaacutec nhau cũng như ở caacutec tổ chức khaacutec 4 Hỗ trợ cho caacutec quyết định tuần tự liecircn thuộc được đưa ra một lần vagravei lần hay lặp lại 5 Hỗ trợ cho caacutec giai đoạn của quaacute trigravenh ra quyết định tigravem hiểu thiết kế lựa chọn vagrave hiện thực 6 Phugrave hợp cho một số caacutec phong caacutech vagrave quaacute trigravenh ra quyết định 7 Coacute thể tiến hoacutea theo thời gian Người dugraveng coacute thể thecircm bỏ kết hợp thay đổi caacutec phần tử cơ bản của hệ thống 8 Dễ dugraveng vagrave thacircn thiện với người dugraveng 9 Nhằm vagraveo nacircng cao tiacutenh hiệu dụng của quyết định (chiacutenh xaacutec thời gian tiacutenh chất lượng) thay vigrave lagrave tiacutenh hiệu quả (giaacute phiacute của việc ra quyết định) 10 Người ra quyết định kiểm soaacutet toagraven bộ caacutec bước của quaacute trigravenh ra quyết định HHTQĐ chỉ trợ giuacutep khocircng thay thế người ra quyết định 11 Người dugraveng cuối cugraveng coacute thể tự kiến tạo vagrave sửa đổi caacutec hệ thống nhỏ vagrave đơn giản 12 Thường dugraveng mocirc higravenh để phacircn tiacutech caacutec tigravenh huống ra quyết định 13 Cung ứng caacutec truy đạt dữ liệu từ nhiều nguồn dạng thức vagrave kiểu khaacutec nhau 14 Coacute thể dugraveng như một cocircng cụ độc lập hay kết hợp với caacutec HHTQĐứng dụng khaacutec dugraveng đơn lẻ hay trecircn một mạng lưới maacutey tiacutenh (intranet extranet) bất kỳ với cocircng nghệ WEB
16Văn hoacutea tổ chứcVăn hoacutea của tổ chức lagrave tập hợp của rất nhiều thứ (lograveng tin biểu tượng đặc trưng regraven luyện) được phaacutet triển qua thời gian dagravei
Noacute gacircy ra ảnh hưởng mạnh mẽ cograven hơn cả những hoạt động của tổ chức đoacute 10 đặc điểm văn hoacutea của tổ chức
Điều khiển Hệ thống khen thưởng Sự đồng nhất Chịu đựng xung đột Mocirc higravenh giao tiếp Hỗ trợ quản lyacute Sự hogravea nhập Định hướng Chịu đựng rủi ro Caacute nhacircn khởi xướng
Mối quan hệ của văn hoacutea với hiệu năng lagravem việc1 tổ chức thagravenh cocircng phải coacute xu hướng hogravea hợp giữa văn hoacutea với mocirci trường trong vagrave ngoagravei tổ chức
Phugrave hợp trong nội bộ cho thấy một sự kết hợp giữa văn hoacutea của tổ chức với những cocircng nghệ của chiacutenh noacute
Phugrave hợp với becircn ngoagravei cho thấy một nền văn hoacutea phugrave hợp với chiến lược thị trường
Văn hoacutea vagrave sự thay đổi 1 tổ chức magrave khocircng biết thay đổi văn hoacutea sẽ khocircng thể giữ được vị triacute của migravenh trecircn thị trường Caacutec cocircng ty xuất sắc luocircn biết caacutech tiacutech cực tiếp cận khaacutech hagraveng động viecircn đầu tư
17Quyền lực vagrave chiacutenh trịQuyền lực vagrave chiacutenh trị luocircn đi liền với nhau
aQuyền lựclagrave khả năng ảnh hưởng đến việc phacircn phối caacutec nguồn lực trong tổ chứcGồm 5 yếu tố cơ bản
Phacircn quyền Uy quyền Quyền lực caacute nhacircn Sức ảnh hưởng Chiacutenh trị
Một vagravei thagravenh phần của quyền lực ra quyết định Quyết định việc nagraveo coacute sẵn
Quyết định sản phẩm nagraveo được sản xuất Quyết định đầu tư vagraveo đacircu Quyền đặt vagrave quản lyacute quản lyacute giaacute Thanh toaacuten vagrave khấu trừ tiền latildei
bChiacutenh trị Yếu tố cốt lotildei trong quaacute trigravenh higravenh thagravenh chiến lược ra quyết định Chiacutenh trị liecircn quan tới việc ra quyết định thocircng qua đagravem phaacutenảnh hưởngvagrave higravenh
thagravenh sự nhất triacute Trong nhiều trường hợp noacute coacute thể cho ta sự linh hoạt hơn
18Hệ trợ giuacutep quyết định trong tổ chức DSS của 1 tổ chức hỗ trợ cocircng nghệ tập trung vagraveo caacutec quyết định ảnh hưởng tới
rất nhiều người 1 hệ thống DSS hiện đại coacute thể chấp nhận nhiều quyết định vượt qua những giới
hạn phacircn cấp truyền thống aCaacutec hoạt động gần DSS
Giải quyết caacutec nhiệm vụ đặc biệt Thu thập thocircng tin Liecircn lạc qua caacutec chi nhaacutenh Động thaacutei chiacutenh trị
Phacircn loại tư duy chiến lược cho DSS Sắp xếp quyết địnhXếp hạng quyết định sao cho thứ tự đứng trước thigrave được
ưu tiecircn trước Chia sẻ thocircng tinCaacutec quyecirct định coacute thể độc lập nhưng người ra quyết định
phải chia sẻ caacutec thocircng tin liecircn quan Lựa chọn đagravem phaacutenVagravei quyết định coacute thể xaacutec lập thocircng qua đagravem phaacuten vagrave kết
quả được lagravem đồng thờiKhocircng phải cocircng nghệ tự noacute coacute thể đưa ra quyết định magrave noacute nằm ở trigravenh độ cocircng nghệ hỗ trợ caacutec chiến lược quyết định quyền lực vagrave chiacutenh trị cugraveng phối hợp với nhau
Chương 4Mocirc higravenh hoacutea quaacute trigravenh ra quyết định
(Cấu truacutec của hệ HTQD)19Vấn đề Mocirc higravenh
bull Lagrave phần tử chủ chốt trong hầu hết hệ hỗ trợ quyết định vagrave lagrave điều kiện cần trong hệ hỗ trợ quyết định dựa vagraveo mocirc higravenh (model-based DSS)
bull Coacute nhiều lớp mocirc higravenh kegravem theo lagrave caacutec kỹ thuật xử lyacute thao taacutec mocirc higravenh đặc thugrave tương ứng
bull Caacutec vấn đề chiacutenh nhận diện bagravei toaacuten vagrave phacircn tiacutech mocirci trường nhận diện biến số dự baacuteo đa mocirc higravenh caacutec phạm trugrave mocirc higravenh quản lyacute mocirc higravenh vagrave mocirc higravenh hoacutea dựa vagraveo kiến thức
bull Mocirc higravenh hoacutea lagrave taacutec vụ khocircng đơn giản Người xacircy dựng mocirc higravenh phải cacircn bằng giữa tiacutenh đơn giản của mocirc higravenh với caacutec yecircu cầu biểu diễn để mocirc higravenh coacute thể nắm bắt đủ thực tại cần thiết cho người ra quyết định
bull Mocirc phỏng lagrave kỹ thuật mocirc higravenh hoacutea thocircng dụng dugraveng để tigravem hiểu vấn đề tuy khocircng nhất thiết phải tigravem ra được caacutec giải phaacutep biến thể mở rộng quaacute trigravenh ra quyết định của tổ chức vagrave cho pheacutep tổ chức xem xeacutet taacutec độngảnh hưởng của caacutec chọn lựa tương lai
bull Mocirc phỏng tiết kiệm rất nhiều chi phiacute vagrave thời gian ndash rất dễ thay đổi mocirc higravenh hoạt động của một hệ thống vật lyacute bằng mocirc higravenh hoacutea maacutey tiacutenh
bull Mocirc higravenh coacute thể được phaacutet triển vagrave cagravei đặt bằng một số caacutec ngocircn ngữ lập trinh (thế hệ 3 4 ) vagrave hệ thống phần mềm khaacutec nhau
Mocirc higravenh tĩnh vagrave động
bull Mocirc higravenh tĩnh thể hiện bức tranh tại thời điểm của tigravenh huống Caacutec khiacutea cạnh của bagravei toaacuten được xeacutet một thời kỳ nhất định trong một khung thời gian nhất định (coacute thể ldquocuốnrdquo về tương lai) Caacutec tigravenh huống được giả sử lagrave sẽ lập lại với tập caacutec điều kiện đồng nhất
1048713 Giả định coacute được tiacutenh ổn định của dữ liệu 1048713 Mocirc phỏng quaacute trigravenh dạng tĩnh - lagravem việc trecircn caacutec trạng thaacutei ổn định để tigravem ra caacutec
thocircng số tối ưu ndash thường được dugraveng như cocircng cụ chủ yếu để thiết kế quaacute trigravenh 1048713 vd quyết định sản xuấtmua 1 sản phẩm baacuteo caacuteo thu nhập hagraveng quyacutenăm bull Mocirc higravenh động biểu diễn caacutec kịch bản thay đổi theo thời gian 1048713 Phụ thuộc thời gian caacutec trạng thaacutei thay đổi theo thời gian 1048713 Thường dugraveng để tạo sinh vagrave biểu diễn caacutec xu hướng vagrave khuocircn mẫu theo thời gian 1048713 Mocirc phỏng động thể hiện caacutec diễn tiến khi caacutec điều kiện theo thời gian khaacutec với caacutec
trạng thaacutei ổn định ndash thường được dugraveng để thiết kế việc kiểm soaacutet caacutec hệ thống 1048713 VD dự baacuteo lời-lỗ trong 5 năm với caacutec nhập lượng như giaacute phiacute số lượng thay đổi
theo từng năm
Mocirc higravenh chắc chắn tương đối dễ phaacutet triển giải quyết vagrave coacute thể sinh ra caacutec giải phaacutep tối ưu 1048713 Caacutec bagravei toaacuten coacute một số lớnvocirc hạn caacutec giải phaacutep khả thi đặc biệt quan trọng 1048713 Caacutec mocirc higravenh tagravei chaacutenh được xacircy dựng trong điều kiện chắc chắn
Mocirc higravenh bất địnhbằng caacutech thu thập thecircm thocircng tin cố gắng đưa bagravei toaacuten trở về dạng chắc chắn hay dạng
rủi ro Mocirc higravenh rủi ro caacutec quyết định kinh doanh được đưa ra dưới caacutec rủi ro giả định
1048713 Đocirci khi biết được xaacutec suất của caacutec sự kiện xảy ra trong tương lai 1048713 Caacutec trường hợp khaacutec (bất định) ước lượng caacutec rủi ro vagrave giả sử caacutec tigravenh huống rủi ro
xảy ra 20Mocirc higravenh hoacutea
MOcirc HIgraveNH HOacuteA BẰNG BẢNG TIacuteNH bull Bảng tiacutenh phần mềm mạnh linh hoạt vagrave dễ dugraveng cho pheacutep tạo sinh caacutec ứng dụng trong kinh doanh kỹ thuật toaacuten vagrave khoa học với tập caacutec hagravem mạnh về tagravei chaacutenh thống kecirc toaacuten bull Kegravem theo lagrave caacutec thagravenh phần cộng thecircm (add-ins) giuacutep xacircy dựng vagrave giải caacutec lớp mocirc higravenh đặc thugrave bull Lagrave cocircng cụ mocirc higravenh hoacutea thocircng dụng nhất của người dugraveng cuối cugraveng bull Coacute caacutec chức năng về phacircn tiacutech ldquowhat-ifrdquo dograve tigravem mục tiecircu quản lyacute dữ liệu vagrave lập trigravenh (dạng macro) bull Coacute khả năng đọc ghi caacutec cấu truacutec tập tin thocircng dụng để giao tiếp được với caacutec CSDL vagrave cocircng cụ khaacutec bull Coacute thể xacircy dựng mocirc higravenh tĩnh vagrave động bull Dugraveng trecircn maacutey tiacutenh caacute nhacircn vagrave maacutey tiacutenh lớn
bull Cơ sở để xacircy dựng caacutec bảng tiacutenh đa chiều vagrave caacutec cocircng cụ xử lyacute phacircn tiacutech trực tuyến (OLAP) MOcirc HIgraveNH HOacuteA BẰNG PHAcircN TIacuteCH QUYẾT ĐỊNH bull Tiếp cận mocirc higravenh hoacutea caacutec tigravenh huống quyết định coacute một số hữu hạnkhocircng quaacute nhiều caacutec phương aacuten ndash mỗi phương aacuten được trigravenh ra dưới dạng bảng hay đồ thị - caacutec kết quả tương ứng (dự baacuteo được kegravem xaacutec suất) theo mục tiecircu bagravei toaacuten ndash từ đoacute chọn phương aacuten tốt nhất bull Đơn mục tiecircu bảng quyết định hay cacircy quyết định bull Đa mục tiecircu AHP (analytic hierarchy process) khaacutec
MOcirc HIgraveNH HOacuteA BẰNG QUY HOẠCH TOAacuteN
bull Quy hoạch toaacuten học (mathematical programming) lagrave họ caacutec cocircng cụ giải quyết caacutec bagravei toaacuten quản lyacute theo đoacute người ra quyết định phải cấp phaacutet caacutec tagravei nguyecircn khan hiếm cho caacutec hoạt động cạnh tranh nhau (caacutec phương aacuten) nhằm tối ưu hoacutea mục tiecircu coacute khả năng đo lường được bull Caacutec mocirc higravenh quy hoạch tuyến tiacutenh (linear programming) thocircng dụng nhất trong quy hoạch toaacuten coacute nhiều ứng dụng trong thực tế được dugraveng nhiều trong caacutec hệ hỗ trợ quyết định bull Bagravei toaacuten quy hoạch tuyến tiacutenh 1048713 Caacutec biến quyết định (cần tigravem giaacute trị) 1048713 Hagravem mục tiecircu (hagravem toaacuten học dạng tuyến tiacutenh xaacutec định quan hệ giữa biến quyết định vagrave mục tiecircu đo lường mức độ đạt đạt mục tiecircu vagrave cần được tối ưu hoacutea) 1048713 Caacutec hệ số của hagravem mục tiecircu (cho biết mức đoacuteng goacutep vagraveo mục tiecircu của 1 đơn vị biến quyết định) 1048713 Ragraveng buộc (biểu thức tuyến tiacutenh cho biết giới hạn tagravei nguyecircn vagravehay caacutec quan hệ giữa caacutec biến số) 1048713 Dung lượng (mocirc tả cận trecircn vagrave dưới của caacutec biến vagrave ragraveng buộc) 1048713 Hệ số (cocircng nghệ) vagraveo-ra (cho biết mức độ sử dụng tagravei nguyecircn của biến quyết định) bull Đặc điểm của bagravei toaacuten quy hoạch tuyến tiacutenh 1048713 Tagravei nguyecircn kinh tế của bagravei toaacuten lagrave coacute hạn vagrave sẵn sagraveng 1048713 Coacute nhiều caacutech (gt2 caacutech) sử dụng tagravei nguyecircn được gọi lagrave giải phaacutep hay chương trigravenh 1048713 Mỗi hoạt động dugraveng tagravei nguyecircn đều sinh ra kết quả dưới dạng mục tiecircu đatilde phaacutet biểu trước 1048713 Việc cấp phaacutet nằm trong caacutec ragraveng buộc cho trước bull Giả định của bagravei toaacuten quy hoạch tuyến tiacutenh 1048713 Caacutec kết quả của caacutec cấp phaacutet coacute thể đem so saacutenh với nhau coacute thể đo lường bằng một đơn vị chung
1048713 Caacutec cấp phaacutet độc lập với nhau về mặt kết quả 1048713 Kết quả cuối cugraveng lagrave tổng của caacutec kết quả từ caacutec hoạt động riecircng rẽ khaacutec nhau 1048713 Dữ liệu coacute tiacutenh chắc chắn 1048713 Tagravei nguyecircn được dugraveng một caacutech kinh tế nhất 1048713 Thường coacute một số lớn caacutec giải phaacutep với kết quả khaacutec nhau 1048713 Trong số caacutec giải phaacutep coacute thể coacute 1 giải phaacutep tốt nhất ndash mức độ đạt được mục tiecircu cao nhất ndash gọi lagrave giải phaacutep tối ưu được tigravem ra bằng một giải thuật đặc biệt MOcirc HIgraveNH HOacuteA BẰNG HEURISTIC bull Việc tigravem giải phaacutep tối ưu của một số bagravei toaacuten quyết định phức tạp coacute thể tốn nhiều thời gian chi phiacute hay khocircng thể tigravem ra được Cograven nếu dugraveng tiếp cận mocirc phỏng cũng coacute thể keacuteo dagravei phức tạp khocircng thiacutech hợp hay thậm chiacute khocircng chiacutenh xaacutec
bull Lagrave một tiếp cận giuacutep tigravem ra caacutec giải phaacutep khả thithỏa matildenđủ tốt cho caacutec bagravei toaacuten phức tạp Coacute thể coacute giải phaacutep đủ tốt (90-999 giaacute trị của lời giải tối ưu) nhanh choacuteng vagrave đỡ tốn keacutem hơn bằng caacutech dugraveng heuristics bull Quaacute trigravenh heuristic lagrave datildey caacutec bước xacircy dựng caacutec quy luật giải quyết vấn đề thocircng qua việc tigravem kiếm caacutec con đường hứa hẹn nhất dẫn đến lời giải tigravem kiếm caacutech thức thu thập vagrave phacircn giải thocircng tin theo quaacute trigravenh giải vagrave phaacutet triền caacutec phương phaacutep dẫn đến một giải thuật tiacutenh toaacuten hay một lời giải tổng quaacutet đatilde coacute bull Aacutep dụng chủ yếu cho bagravei toaacuten cấu truacutec yếu cũng dugraveng để tigravem ra giải phaacutep chấp nhận được cho bagravei toaacuten cấu truacutec chặt bull Khocircng đủ tổng quaacutet như caacutec giải thuật thường chỉ dugraveng cho tigravenh huống đặc thugrave đang xeacutet bull Coacute thể dẫn đến một giải phaacutep dở - caacutec thủ tục từng bước giải quyết vấn đề khocircng đảm bảo tigravem ra giải phaacutep tối ưu bull Heuristic coacute thể lagrave định lượng vigrave vậy coacute thể đoacuteng vai trograve quan trọng trong cơ sở mocirc higravenh của hệ hỗ trợ quyết định bull Heuristic coacute thể lagrave định tiacutenh vigrave vậy coacute thể đoacuteng vai trograve quan trọng trong cung ứng kiến thức cho hệ chuyecircn gia bull Quaacute trigravenh heuristic liecircn quan đến tigravem kiếm học tập ước lượng phacircn xử vagrave lặp lại caacutec hoạt động nagravey dọc theo tiến trigravenh bull Kiến thức thu được dugrave thagravenh cocircng hay thất bại trong quaacute trigravenh đều được phản hồi vagrave sửa đổi chiacutenh quaacute trigravenh nhờ đoacute coacute thể định nghĩa lại mục tiecircu hay bagravei toaacuten 1048713 Giải thuật di truyền bắt đầu bằng tập caacutec giải phaacutep được sinh ngẫu nhiecircn taacutei kết hợp caacutec cặp giải phaacutep một caacutech ngẫu nhiecircn bull Tigravenh huống necircn dugraveng heuristics 1048713 Dữ liệu đầu vagraveo khocircng chiacutenh xaacutec hay coacute giới hạn 1048713 Thực tế quaacute phức tạp đến nỗi khocircng dugraveng được caacutec mocirc higravenh tối ưu 1048713 Chưa coacute được giải thuật chiacutenh xaacutec vagrave đủ tin cậy 1048713 Bagravei toaacuten phức tạp necircn sẽ khocircng kinh tế nếu dugraveng tối ưu hay mocirc phỏng hoặc tốn quaacute nhiều thời gian tiacutenh toaacuten 1048713 Coacute thể cải thiện tiacutenh hiệu quả của quaacute trigravenh tối ưu (tức coacute thể sinh ra caacutec giải phaacutep ban đầu tương đối tốt) 1048713 Liecircn quan đến xử lyacute kyacute hiệu chứ khocircng phải xử lyacute kyacute số (như hệ chuyecircn gia) 1048713 Cần coacute quyết định nhanh vagrave caacutec xử lyacute dựa vagraveo maacutey tiacutenh đều khocircng khả thi (một số heuristic khocircng cần đến maacutey tiacutenh) bull Thuận lợi 1048713 Dễ hiểu dễ giải thiacutech vagrave dễ cagravei đặt 1048713 Nacircng cao tiacutenh saacuteng tạo vagrave năng lực heuristic cho caacutec vấn đề khaacutec 1048713 Tiết kiệm thời gian xaacutec lập vấn đề 1048713 Tiết kiệm yecircu cầu về bộ chứa vagrave xử lyacute maacutey tiacutenh
1048713 Tiết kiệm thời gian tiacutenh toaacuten vagrave do vậy tiết kiệm thời gian thực trong ra quyết định Một số vấn đề phức tạp đến nỗi chỉ coacute thể giải được bằng heuristics 1048713 Thường sinh ra nhiều giải phaacutep chấp nhận được 1048713 Thường coacute thể phaacutet biểu lyacute thuyết hay đo lường thực nghiệm về chất lượng của giải phaacutep (tức giaacute trị mục tiecircu của giải phaacutep gần với giaacute trị tồi ưu đến mức nagraveo dugrave giaacute trị tối ưu chưa biết được) 1048713 Coacute thể kết hợp tiacutenh thocircng minh vagraveo để hướng dẫn pheacutep tigravem kiếm (tigravem kiếm tabu) Năng lực thocircng minh đoacute coacute thể lagrave đặc thugrave theo bagravei toaacuten hoặc dựa trecircn yacute kiến chuyecircn gia được cấy trong hệ chuyecircn gia hoặc cơ chế tigravem kiếm 1048713 Coacute thể dugraveng heuristic hiệu quả vagraveo caacutec mocirc higravenh coacute thể giải bằng quy hoạch toaacuten học Đocirci khi heuristic lagrave phương phaacutep được ưa thiacutech hơn khi khaacutec giải phaacutep heuristics được dugraveng như giải phaacutep ban đầu cho caacutec phương phaacutep quy hoạch toaacuten học bull Hạn chế 1048713 Khocircng đảm bảo coacute được giải phaacutep tối ưu 1048713 Caacutec quy luật coacute rất nhiều ngoại lệ 1048713 Caacutec lựa chọn quyết định tuần tự coacute thể khocircng tiecircn đoaacuten được caacutec kết cục tương lai của mỗi chọn lựa 1048713 Sự liecircn thuộc giữa caacutec phần trong hệ thống đocirci khi coacute thể gacircy ra caacutec ảnh hưởng lớn lao lecircn toagraven hệ thống bull Phacircn loại caacutec giải thuật heuristic 1048713 Heuristic xacircy dựng xacircy dựng giải phaacutep khả thi bằng caacutech cộng thecircm từng thagravenh phần một VD bagravei toaacuten người baacuten hagraveng ndash luocircn gheacute thagravenh phố chưa viếng thăm kế tiếp gần nhất
1048713 Heuristic cải tiến bắt đầu bằng một giải phaacutep khả thi vagrave cố gắng cải tiến liecircn tục trecircn đoacute VD trecircn thử hoaacuten đổi 2 thagravenh phố 1048713 Quy hoạch toaacuten aacutep dụng vagraveo caacutec mocirc higravenh chứa iacutet ragraveng buộc nhằm coacute được thocircng tin về thỏa hiệp tốt nhất với mocirc higravenh nguyecircn gốc Thường được dugraveng trong tối ưu hoacutea nguyecircn (integer optimization) 1048713 Chia giai đoạn giải quyết một vấn đề theo từng giai đoạn VD ở PampG trecircn đacircy bagravei toaacuten phacircn phối được giải quyết trước sau đoacute dugraveng giải quyết bagravei toaacuten chiến lược sản phẩm 1048713 Phacircn ratilde chia bagravei toaacuten thagravenh caacutec phần nhỏ hơn coacute thể giải quyết được sau đoacute kết hợp caacutec giải phaacutep đoacute lại VD chia latildenh thổ baacuten hagraveng thagravenh 4 vugraveng khaacutec nhau giải quyết cho từng vugraveng sau đoacute kết nối caacutec giải phaacutep
21Mocirc phỏngbull Giả định caacutec đặc điểm của thực tạibull Lagrave kỹ thuật tiến triển caacutec thực nghiệm (như phacircn tiacutech ldquowhat-ifrdquo) - bằng maacutey tiacutenh -trecircn một mocirc higravenh của hệ thocircng tin quản lyacute
bull Khocircng thực sự lagrave một mocirc higravenh vigrave khocircng biểu diễn thực tại magrave lagrave cố gắng bắtchước thực tạibull Một trong những phương phaacutep thocircng dụng nhất trong HHTQĐbull HHTQĐ lagravem việc với caacutec bagravei toaacuten phi cấu truacutec vagrave cấu truacutec yếu tigravenh huống thực tếphức tạp ndash khocircng dễ biểu diễn bằng mocirc higravenh tối ưu hay caacutec dạng mocirc higravenh khaacutecnhưng lại thường coacute thể xử lyacute được bằng mocirc phỏngbull Đặc điểm1048713 Iacutet đưa ra caacutec đơn giản hoacutea về thực tại hơn caacutec mocirc higravenh khaacutec1048713 Do triển khai caacutec thực nghiệm necircn noacute coacute thể kiểm thử caacutec giaacute trị cụ thể của caacutecbiến quyết địnhbiến khocircng kiểm soaacutet được của mocirc higravenh vagrave xem xeacutet ảnh hưởnglecircn caacutec biến kết quả1048713 Phương phaacutep coacute tiacutenh mocirc tả (như vậy khaacutec với phương phaacutep danh định)1048713 Khocircng tự động tigravem kiếm giải phaacutep tối ưu ndash noacute mocirc tảtiecircn đoaacuten caacutec đặc tiacutenh của hệthống đatilde cho dưới caacutec điều kiện khaacutec nhau từ đoacute coacute thể chọn ra phương aacuten tốtnhất1048713 Quaacute trigravenh mocirc phỏng thường lặp lại một thực nghiệm nhiều lần để coacute được ướclượng về hiệu ứng tổng quaacutet của một số hagravenh động nhất định1048713 Mocirc phỏng maacutey tiacutenh thiacutech hợp cho hầu hết caacutec tigravenh huống mặc dugrave cũng coacute một sốmocirc phỏng thủ cocircng thagravenh cocircng1048713 Thường chỉ được dugraveng khi bagravei toaacuten quaacute phức tạp khocircng thể xem xeacutet bằng caacutec kỹthuật tối ưu dạng số Tiacutenh phức tạp theo nghĩa bagravei toaacuten khocircng thể cocircng thức hoacuteacho tối ưu (do khocircng thotildea caacutec giả định) hoặc cocircng thức quaacute lớn quaacute nhiều tươngtaacutec giữa caacutec biến hoặc về bản chất bagravei toaacuten lagrave bất định hay rủi roPhương phaacutep mocirc phỏng thiết lập mocirc higravenh của hệ thống thực vagrave tiến hagravenh caacutec thựcnghiệm lặp lại trecircn mocirc higravenh
bull Thuận lợi1048713 Lyacute thuyết tương đối trực tiếp hiệu ứng dagravei hạn của nhiều chiacutenh saacutech -gt neacuten thờigian lớn1048713 Do tiacutenh chất mocirc tả (khaacutec với danh định)1048713 Coacute thể thấy được nhanh choacuteng coacute thể đặt ra caacutec cacircu hỏi ldquowhat-ifrdquo coacute thể dugravengtiếp cận thử-vagrave-sai vagraveo giải quyết vấn đề một caacutech nhanh choacuteng rẻ chiacutenh xaacutec iacutetrủi ro hơn1048713 Thử nghiệm được biến quyết định phần nagraveo của mocirci trường thực sự quan trọngvới caacutec phương aacuten khaacutec nhau1048713 Yecircu cầu kiến thức riecircng biệt về bagravei toaacuten vigrave thế buộc người xacircy dựng mocirc higravenh phảilagravem việc thường xuyecircn với nhagrave quản lyacute ndash đối tượng mong muốn của HHTQĐ để
từ đoacute bản chất bagravei toaacuten vagrave caacutec quyết định được hiểu tốt hơn1048713 Mocirc higravenh được xacircy dựng từ viễn cảnhcaacutech nhigraven của nhagrave quản lyacute1048713 Mocirc higravenh chỉ cho một bagravei toaacuten riecircng biệt thường khocircng thể dugraveng giải caacutec bagravei toaacutenkhaacutec Như vậy mỗi thagravenh phần của mocirc higravenh ứng với một phần của hệ thống thựcdo đoacute sẽ khocircng yecircu cầu nhagrave quản lyacute phải tổng quaacutet hoacutea caacutec hiểu biết của migravenh1048713 Phổ bagravei toaacuten giải được rất rộng tồn kho nhacircn sự hoạch định chiến lược 1048713 Coacute thể chứa caacutec phức tạp thực sự của bagravei toaacuten khocircng cần caacutec đơn giản hoacutea (TDdugraveng caacutec phacircn phối xaacutec suất thực thay vigrave phacircn phối lyacute thuyết xấp xỉ)1048713 Coacute thể tự động sinh ra nhiều đo lường hiệu năng quan trọng1048713 Thường lagrave phương phaacutep duy nhất của HHTQĐ coacute thể xử lyacute caacutec bagravei toaacuten tương đốiphi cấu truacutec1048713 Coacute một số caacutec goacutei phần mềm mocirc phỏng (Monte Carlo) tương đối dễ dugravengbull Điểm yếu1048713 Tuy thường tigravem được caacutec phương aacuten đủ tốt nhưng khocircng đảm bảo lời giải tối ưu1048713 Quaacute trigravenh xacircy dựng mocirc higravenh thường dagravei vagrave tốn keacutem1048713 Giải phaacutep vagrave suy diễn từ nghiecircn cứu mocirc phỏng thường khocircng thể chuyển sang bagraveitoaacuten khaacutec vigrave mocirc higravenh kết hợp caacutec yếu tố đặc thugrave1048713 Đocirci khi do mocirc higravenh quaacute dễ giải thiacutech cho nhagrave quản lyacute necircn caacutec phương phaacutep phacircntiacutech thường xem nhẹ1048713 Phần mềm mocirc phỏng đocirci khi yecircu cầu caacutec kỹ năng đặc biệt do độ phức tạp củaphương phaacutep giải higravenh thứcbull Caacutec loại mocirc phỏng1048713 Mocirc phỏng xaacutec suất một hay nhiều biến độc lập mang tiacutenh xaacutec suất với 2 loạiphacircn phối ndash thường dugraveng kỹ thuật Monte Carlo1048713 Phacircn phối rời rạc tigravenh huống coacute một số giới hạn caacutec biến cố (biến) với hữu hạncaacutec giaacute trị cho mỗi biến cố (biến)1048713 Phacircn phối liecircn tục tigravenh huống coacute số lượng khocircng giới hạn caacutec biến cố tuacircn theocaacutec hagravem mật độ xaacutec suất như phacircn phối chuẩn1048713 Mocirc phỏng độc lậpphụ thuộc theo thời gian1048713 Độc lập khocircng cần thiết phải biết chiacutenh xaacutec thời điểm xảy ra biến cố (nhu cầutiecircu thụ lượng sản phẩm trong ngagravey khocircng biết chiacutenh xaacutec thời điểm tiecircu thụ)1048713 Phụ thuộc cần biết chiacutenh xaacutec thời điểm xảy ra sự kiện (bagravei toaacuten hagraveng đợi)1048713 Mocirc phỏng tương taacutec trực quan1048713 Mocirc phỏng hướng đối tượng dugraveng tiếp cận hướng đối tượng để xacircy dựng mocirc higravenhmocirc phỏng Chuacute yacute ngocircn ngữ mocirc higravenh hoacutea nhất thể UML (unified modelinglanguage) kể cả khi mocirc phỏng caacutec hệ thời gian thựcMOcirc HIgraveNH HOacuteA ĐA CHIỀU ndash XỬ LYacute PHAcircN TIacuteCH TRỰC TUYẾNbull Người ra quyết định thường phải xem xeacutet nhiều chiều của dữ liệu (TD caacutec chiềucủa dữ liệu baacuten hagraveng lagrave sản phẩm vugraveng thời gian người baacuten ) dữ liệu cần đượcphacircn tiacutech trực tiếp bằng caacutec cocircng cụ chuẩn hay phacircn tiacutech tự động bằng caacutec
phương phaacutep khai mỏ dữ liệu (data mining)bull Hầu hết caacutec hệ thống phacircn tiacutech đa chiều được nhuacuteng trong caacutec hệ xử lyacute phacircn tiacutechtrực tuyến (HXLPTTT ndash online analytic processing - OLAP)bull Mục tiecircu của XLPTTT nắm bắt cấu truacutec của dữ liệu thực để hỗ trợ ra quyết địnhbull Trong HHTQĐ coacute sự gắn nối tự nhiecircn giữa mocirc higravenh hoacutea dữ liệu mocirc higravenh hoacutea kyacutehiệu vagrave caacutec khiacutea cạnh của phacircn tiacutech ldquowhat-ifrdquobull Caacutec baacuteo caacuteo của HXLPTTT đều coacute tiacutenh tương taacutec dễ khai thaacutec sử dụng đặc biệtphugrave hợp cho caacutec baacuteo caacuteo về chỉ số hiệu năng chủ yếu (key performance indicators- KPI) baacuteo caacuteo về đo lường hiệu năng kinh doanh bull Thế hệ hiện tại của HXLPTTT vagrave hệ khai mỏ dữ liệu (data mining) tiacutech hợp caacutecđặc tiacutenh của hệ thocircng tin latildenh đạo (executive information system ndashEIS- nhiềucaacutech nhigraven dữ liệu chi tiết hoacutea theo nhu cầu) vagrave caacutec hệ đồ họa khaacutec ndash thường coacutegiao diện người dugraveng dạng kiểu WEBbull Caacutec hệ thống như trecircn cograven được gọi lagrave caacutec cocircng cụ triacute tuệ kinh doanh (businessintelligence - BI) vigrave coacute caacutec đặc trưng về mocirc higravenh hoacutea vagrave tối ưu hoacutea nhưng lạitrong suốt đối với ngươigrave dugravengbull Hiện caacutec cocircng cụ được đưa ra bởi caacutec nhagrave cung cấp về CSDL về hoạch định tagraveinguyecircn tổ chức (ERP) về nhagrave kho dữ liệu (data warehouse) về HXLPTTT MOcirc HIgraveNH HOacuteA VAgrave MOcirc PHỎNG TƯƠNG TAacuteC TRỰC QUANbull Iacutech lợi Người ra quyết định tham gia vagraveo quaacute trigravenh phaacutet triển mocirc higravenh vagrave thựcnghiệm mocirc phỏng vigrave vậy sẽ tin tưởng khi sử dụng mocirc higravenhbull Mocirc higravenh hoacutea tương taacutec trực quan (visual interactive modeling - VIM) dugraveng caacutecbiểu diễn đồ họa maacutey tiacutenh để trigravenh bagravey caacutec ảnh hưởng của caacutec quyết định quản lyacutekhaacutec nhau ở một thời điểm (tĩnh) hay tiến triển theo thời gian (động với kỹ thuậthoạt higravenh)bull Mocirc phỏng tương taacutec trực quan (visual interactive simulation - VIS) cho pheacutepngười dugraveng theo dotildei tiến trigravenh xacircy dựng vagrave sử dụng khai thaacutec mocirc higravenh mocirc phỏngdưới dạng hoạt higravenhbull Mocirc higravenh hoacutea tương taacutec trực quan coacute thể kết hợp với tiếp cận triacute tuệ nhacircn tạo đểđưa ra caacutec khả năng mới thay đổi từ xacircy dựng hệ thống dạng đồ họa đến tigravem hiểuvề động học của hệ thốngbull Cần đến caacutec hệ thống maacutey tiacutenh xử lyacute song song tốc độ cao để xacircy dựng caacutec mocircphỏng - phức tạp quy mocirc lớn dạng hoạt higravenh - mang tiacutenh khả thi ở thời gian thực
22Caacutec dạng hệ thống hỗ trợ ra quyết địnhHệ hỗ trợ quyết định nhoacutemRa quyết định nhoacutem giao tiếp vagrave cộng taacutec- Caacutec đặc điểm của cocircng việc nhoacutem+ Một nhoacutem thực hiện một nhiệm vụ thỉnh thoảng ra quyết định thỉnh thoảngkhocircng ra quyết định+ Caacutec thagravenh viecircn trong nhoacutem coacute thể ở những nơi khaacutec nhau
+ Caacutec thagravenh viecircn trong nhoacutem coacute thể lagravem việc ở những thời gian khaacutec nhau+ Caacutec thagravenh viecircn trong nhoacutem coacute thể lagravem việc cugraveng nhau hoặc ở caacutec tổ chức khaacutecnhau+ Nhoacutem coacute thể vĩnh viễn hoặc tạm thời+ Nhoacutem coacute thể ở bất kỳ mức quản lyacute nagraveo hoặc mức thời gian nagraveo+ Coacute sự điều phối (quaacute trigravenh vagrave nhiệm vụ đạt được) hoặc macircu thuẩn trongnhoacutem+ Coacute sự đạt được hoặcvagrave mất maacutet năng suất trong tổ chức+ Nhiệm vụ phải hoagraven thagravenh rất nhanh+ Khocircng thể hoặc quaacute đắt cho tất cả caacutec thagravenh viecircn trong nhoacutem cugraveng hợp ở mộtnơi+ Một số dữ liệu thocircng tin hoặc kiến thức cần thiết nằm ở nhiều nơi một sốkhaacutec ở ngoagravei tổ chức+ Chuyecircn mocircn của caacutec thagravenh viecircn khocircng coacute trong nhoacutem lagrave cần thiết- Caacutec hoạt động vagrave caacutec quaacute trigravenh miecircu tả caacutec cuộc họp+ Cuộc họp lagrave hoạt động chung liecircn quan bởi một nhoacutem người coacute địa vị bằngnhau hoặc gần bằng nhau+ Kết quả của cuộc họp phụ thuộc một phần vagraveo kiến thức yacute kiến caacutec đaacutenh giaacutecủa caacutec thagravenh viecircn+ Kết quả của cuộc họp cũng phụ thuộc vagraveo sự kết hợp của nhoacutem vagrave phụ thuộcvagraveo quaacute trigravenh ra quyết định được sử dụng bởi nhoacutem đoacute+ Giải quyết caacutec yacute kiến khaacutec nhau bởi người coacute quyền hạn hoặc thương lượnghoặc phacircn xửHỗ trợ giao tiếp- Giao tiếp lagrave thagravenh phần quan trọng cho hỗ trợ quyết định Khocircng coacute giao tiếp thigravekhocircng coacute cộng taacutec Những người ra quyết định caacute nhacircn phải giao tiếp với caacutecđồng nghiệp chuyecircn gia cơ quan chiacutenh phủ khaacutech hagraveng đối taacutec kinh doanh hellipHọ cũng cần dữ liệu vagrave thocircng tin (vagrave kiến thức) từ nhiều nơi trecircn thế giới Caacutecnhoacutem ra quyết định phải giao tiếp cộng taacutec vagrave thương lượng trong cocircng việcHầu hết caacutec tổ chức sẽ nhanh trở thagravenh khocircng coacute chức năng nếu khocircng coacute caacutec hệthống giao tiếp Thương mại điện tử coacute thể hiệu quả chỉ qua caacutec kỹ thuật giao tiếphiện đại- Caacutec kỹ thuật thocircng tin hiện đại cung cấp caacutec phương tiện hỗ trợ giao tiếp rẻnhanh coacute khả năng coacute thể tin cậy Nền tảng hỗ trợ giao tiếp lagrave caacutec hệ thống maacuteytiacutenh mạng+ Bắt đầu bằng điện baacuteo điện thoại radio vagrave ti vi+ Trong 100 năm chuacuteng ta phaacutet triển maacutey fax thư điện tử chương trigravenh chatnhoacutem tin tức hệ thống hội nghị truyền higravenh Hầu hết caacutec kỹ thuật nagravey đềuhoạt động trecircn internet+ Sự phaacutet triển giao tiếp sau cugraveng lagrave hệ thống họp điện tử caacutec dịch vụ vagrave hệ
thống hội nghị điện tử thường sử dụng internet để kết nối caacutec người ra quyếtđịnh- Caacutec thuận lợi aacutep dụng caacutec phương phaacutep giao tiếp cải tiến trong caacutec tổ chức+ Cải tiến năng suất của nhacircn viecircn+ Liecircn quan đến nhiều người ra quyết định chiacutenh+ Khocircng quan tacircm nhiều đến đường biecircn giới địa lyacute+ Tạo nền văn hoacutea hợp taacutec nhất quaacuten+ Cải tiến chất lượng cuộc sống của nhacircn viecircnHỗ trợ cộng taacutec Maacutey tiacutenh hỗ trợ cộng taacutec- Khung thời giannơi chốn+ Sự hiệu quả của kỹ thuật tiacutenh toaacuten cộng taacutec phụ thuộc vagraveo vị triacute của caacutec thagravenhviecircn trong nhoacutem vagrave phụ thuộc vagraveo thời gian chia sẽ thocircng tin gởi vagrave nhận+ Chia sự giao tiếp thagravenh bốn ocirc vagrave tổ chức bốn ocirc dọc theo 2 chiều thời gian vagravenơi chốn1048713 Thời gian Khi gởi vagrave nhận thocircng tin hầu như đồng thời giao tiếp lagrave đồngthời Viacute dụ Điện thoại ti vi vagrave caacutec cuộc họp gặp mặt nhau Giao tiếp bấtđồng bộ xảy ra khi người nhận nhận thocircng tin ở thời điểm khaacutec thời điểmgởi thocircng tin đoacute1048713 Nơi chốn Người gởi vagrave người nhận coacute thể ở cugraveng phograveng hoặc khocircng+ Bốn ocirc lagrave1048713 Cugraveng thời giancugraveng nơi chốn Caacutec thagravenh viecircn gặp mặt nhau cugraveng một luacutecgiống như phograveng quyết định hoặc gặp mặt truyền thống1048713 Cugraveng thời giankhaacutec nơi chốn Caacutec thagravenh viecircn ở caacutec nơi khaacutec nhau nhưnggiao tiếp cugraveng nhau Viacute dụ hội nghị truyền higravenh (videoconferencing)1048713 Khaacutec thời giancugraveng nơi chốn Nhiều người lagravem việc theo ca Ca nagravey để lạithocircng tin cho ca khaacutec1048713 Khaacutec thời giankhaacutec nơi chốn Caacutec thagravenh viecircn ở caacutec nơi khaacutec nhau Caacutecthagravenh viecircn nagravey gởi vagrave nhận thocircng tin ở những lần khaacutec nhau
23Thực thi hệ DSSHệ thống hỗ trợ quản lyacute (MSS) khocircng phải luacutec nagraveo cũng luocircn thagravenh cocircng Nhiều trường hợpthất bại của ES khocircng hoagraven toagraven lagrave lyacute do kỹ thuật Thực thi hệ thống lagrave một quaacute trigravenh liecircn tụcnhằm đảm bảo cho tổ chức chuẩn bị tiếp nhận một hệ thống mới vagrave đưa hệ thống vagraveo sử dụngthagravenh cocircngThực hiện cocircng nghệ hệ thống hỗ trợ quản lyacute lagrave việc phức tạp vigrave caacutec hệ thống nagravey khocircng đơnthuần lagrave hệ thống thocircng tin chỉ thu thập thao taacutec vagrave phacircn phối thocircng tin Magrave xa hơn chuacuteng
liecircn quan tới caacutec cocircng việc coacute thể lagravem thay đổi đaacuteng kể caacutech thức hoạt động của tổ chức Tuyvậy đa số caacutec yếu tố thực thi đều liecircn quan tới hệ thống thocircng tinThực thi MSS lagrave quaacute trigravenh liecircn tục diễn ra trong suốt thời gian phaacutet triển hệ thống từ đề xuấtban đầu đến nghiecircn cứu khả thi thiết kế vagrave phacircn tiacutech hệ thống lập trigravenh huấn luyện chuyểnđổi vagrave lắp đặt Caacutec chuyecircn gia hệ thống thocircng tin thường gọi thực thi lagrave giai đoạn cuối trongvograveng đời hệ thống Định nghĩa thực thi MSS phức tạp hơn vigrave bản chất lặp của sự phaacutet triểncaacutec hệ thống
THỰC THI KHOcircNG HOAgraveN CHỈNHCaacutec quyết định về tiacutenh khả thi thường coacute giả định về lợi iacutech đạt được khi kế hoạch thực thiđược thực hiện hoagraven toagraven Trong thực tế thường chỉ thực hiện 90 thậm chiacute 70 phần trăm sovới phacircn tiacutech khả thi Lyacute do lagrave sự thay đổi tại một nơi trong hệ thống coacute thể ảnh hưởng vagrave coacutethể taacutec động tiecircu cực đến chỗ khaacutec Do vậy cấp quản lyacute coacute thể bỏ những phần trong dự aacuten coacutethể gacircy ra taacutec động xấu Do đoacute dự aacuten sẽ thực hiện iacutet hơn 100 so với dự aacuten kế hoạch Caacutec lyacutedo khaacutec coacute thể lagrave do khấu trừ ngacircn saacutech hoặc vượt chi phiacuteĐAacuteNH GIAacute SỰ THAgraveNH COcircNG CỦA THỰC THI HỆ THỐNGPhải coacute caacutec chỉ số đo lường thigrave mới coacute thể đaacutenh giaacute sự thagravenh cocircng khi thực thi một hệ thốngDickson va Powers (1973) đề ra 5 tiecircu chuẩn độc lậpbull Tỷ lệ thời gian thực hiện dự aacuten với thời gian ước lượngbull Tỷ lệ chi phiacute thực tế vagrave ngacircn saacutech thực hiệnbull Thaacutei độ của cấp quản lyacute đối với hệ thốngbull Nhu cầu thocircng tin của caacutec nhagrave quản lyacute được đaacutep ứng như thế nagraveo qua hệ thốngbull Taacutec động của dự aacuten đối với những hoạt động maacutey tiacutenh trong cocircng tyCaacutec đo lường khaacutec để đaacutenh giaacute thagravenh cocircng của hệ hỗ trợ quản lyacute (MSS)bull Sự sử dụng hệ thống (dự định dugraveng hoặc thực sự dugraveng)bull Thỏa matilden của người dugravengbull Thaacutei độ taacuten thagravenhbull Mức độ hệ thống hoagraven thagravenh caacutec mục tiecircu ban đầubull Phần thưởng đối với tổ chức (giảm chi phiacute tăng doanh thuhellip)bull Tỷ số lợi iacutech chi phiacute
bull Mức độ thể chế hoacutea của MSS trong tổ chứcDo bởi tiacutenh đa dạng của DSS necircn việc đaacutenh giaacute sự thagravenh cocircng của hệ nagravey cũng khoacute khăn tuynhiecircn cũng coacute thể coacute một số yếu tố giuacutep cho DSS thagravenh cocircng như sự tham gia người dugravenghuấn luyện người dugraveng hỗ trợ quản lyacute cấp cao nguồn thocircng tin đặc điểm của những nhiệmvụ coacute liecircn quan (cấu truacutec bất định độ khoacute phụ thuộc)
Chương5Nhoacutem hỗ trợ quyết định vagrave nhoacutemcocircng nghệ phần mềm
51Nhoacutem tạo quyết định
MDM-Holsapple đatilde gợi yacute chuacuteng ta sử dụng giới hạn người tạo quyết định
Một nhoacutem lagrave kết cấu MDM nơi magrave nhiều người ra quyết định hoagraven toagraven tương taacutec
Một đội lagrave kết cấu MDM nơi caacutec thagravenh viecircn tư vấn cho người đưa ra quyết định nhưng khocircng tương taacutec
Một Ủy ban lagrave kết cấu MDM với một người tạo quyết định duy nhất vagrave sự tương taacutec giữa caacutec thagravenh viecircn
Mạng thocircng tin
Mạng lưới baacutenh xe mỗi người tham gia coacute thể giao tiếp với người đưa ra quyết định ở trung tacircm nhưng khocircng phải với người tham gia khaacutecCấu truacutec nagravey lagrave khocircng thỏa matilden tất cả những người tham gia ngoại trừ người ra quyết định
Mạng dacircy chuyền Tham gia chuyển tiếp thocircng tin chỉ để noacute luocircn liền kề nhau trong chuỗi
Thagravenh viecircn cuối cugraveng ko được đaacutep ứng
Mạng vograveng trograven Tương tự như chuỗi nhưng kết thuacutec được kết nối
Mạng kết nối hoagraven toagraven khocircng coacute hạn chế về giao tiếp vagrave tương taacutec giữa caacutec thagravenh viecircnNoacutei chungnoacute đaacutep ứng hầu hết caacutec kết nối của người tham gia nhưng truyền đạt thocircng tin mất nhiều thời gian vagrave coacute nhiều cơ hội xảy ra lỗi
Nhoacutem hagravenh vi vagrave chuẩn mực
MDMs thiết lập caacutec chỉ tiecircu hướng dẫn quaacute trigravenh ra quyết định
Một chuẩn mực quy định cụ thể những gigrave thagravenh viecircn trong nhoacutem dự kiến sẽ lagravem trong những hoagraven cảnh nhất định
Quy tắc gửi coacute thể được thocircng qua viacute dụ đaacutenh giaacute ngang hagraveng hoặc xử phạt
Lagravem thế nagraveo để đưa ra quyết định
Việc chọn lựa magrave trong đoacute việc sử dụng cấu truacutec MDM phải được dựa trecircn một số yếu tố liecircn quan với bối cảnh quyết định
Viacute dụmột cấu truacutec riecircng lẻ sẽ lagravem việc nơi magrave quyết định được cấu truacutec cao vagrave thocircng tin lagrave coacute sẵn
Một ủy ban cơ cấu sẽ lagrave sự lựa chọn khi người ra quyết định khocircng thể đưa ra quyết định một migravenh
52Caacutec vấn đề thường gặp trong nhoacutem
Kiacutech thước Noacutei chung sự nhất triacute vagrave gắn kết giữa caacutec thagravenh viecircn tỉ lệ nghịch với phạm vi nhoacutem Trong nhoacutem lớn rất dễ higravenh thagravenh caacutec nhoacutem nhỏ vagrave hoạt động rời rạc
Tư duy tập thể Trong nhoacutem lớn mọi người coacute xu hướng suy nghĩ đểđạtđược sự nhất triacute necircn khocircng phaacutet huy được sự saacuteng tạo
Caacutec vấn đề về xatilde hội
Xung đột Trong 1 nhoacutem ai cũng muốn migravenh lagrave giỏi nhất necircn dễ dẫn đến xung đột
Ẩn danh(Giấu tecircn) Đacircy lagrave phương phaacutep được sử dụng để kiểm soaacutet xung đột Cho caacutec thagravenh viecircn tham gia ẩn danh
Vấn đề giới tiacutenh Nam vagrave nữ thường coacute những thế mạnh khaacutec nhau điều nagravey coacute thể lagrave sức mạnh trong 1 thiết lập MDM
Đagravem phaacuten vagrave quyết định
Một quyết định coacute thể liecircn quan đến nhiều quan điểm khaacutec nhau vigrave thế cần phải coacute sự đagravem phaacuten
Caacutec thiết kế của cơ chế hỗ trợ cho MDM phải phugrave hợp với caacutec hoạt độngđagravemphaacuten
Những hoạt động nagravey bao gồm việc thu nhận yacute kiến của caacutec thagravenh viecircn 1 caacutech cocircng bằng
53Cocircng nghệ hỗ trợ MDM
Organizational DSSndash 1 hệ thống cung cấp caacutec quyết định hỗ trợ
Group Support Systemndash Cocircng nghệ sử dụng sự hỗ trợ của nhiều becircn tham gia
Group DSS ndash Lagrave 1 hệ thống được thiết kế đặc biệt để hỗ trợ cho MDM
DSS ndash Lagrave 1 hệ thống dưới sự kiểm soaacutet của 1 người quyết định hệ thống nagravey cung cấp 1 bộ cocircng cụ giuacutep phacircn tiacutech hoagraven cảnh đểđưa ra quyết định vagrave nacircng cao hiệu quả của quyết địnhđoacute
53Cocircng nghệ hỗ trợ MDM
Organizational DSSndash 1 hệ thống cung cấp caacutec quyết định hỗ trợ
Group Support Systemndash Cocircng nghệ sử dụng sự hỗ trợ của nhiều becircn tham gia
Group DSS ndash Lagrave 1 hệ thống được thiết kế đặc biệt để hỗ trợ cho MDM
DSS ndash Lagrave 1 hệ thống dưới sự kiểm soaacutet của 1 người quyết định hệ thống nagravey cung cấp 1 bộ cocircng cụ giuacutep phacircn tiacutech hoagraven cảnh đểđưa ra quyết định vagrave nacircng cao hiệu quả của quyết địnhđoacute
Mục tiecircu của cocircng nghệ hỗ trợ MDM
Quy trigravenh hỗ trợ tập trung vagraveo quaacute trigravenh tạo điều kiện thuận lợi cho sự tương taacutec
Cơ chế cấu truacutec quaacute trigravenh chi phối caacutec hoạt động truyền thocircng
Nhiệm vụ hỗ trợ cocircng việc coacute thể chọn lựa tổ chức hoặc lấy thocircng tin
Nhiệm vụ cấu truacutec cocircng việc cho pheacutep truy cập đến kỹ thuật lọc kết hợp phacircn tiacutech kiến thức liecircn quan đến cocircng việc
Caacutec lớp loại cocircng nghệ hỗ trợ MDM
Phacircn loại theo đặc điểm do DeSanctis vagrave Gallupe đưa ra đề xuất một chương trigravenh ba cấp dựa trecircn caacutec tiacutenh năng được cung cấp
Hệ thống cấp 1 Mục điacutech chiacutenh lagrave tạo điều kiện thocircng tin liecircn lạc giữa caacutec thagravenh viecircn
Hệ thống cấp 2 Thiết kế để giảm thiểu rủi ro
Hệ thống cấp 3 Giuacutep điều chỉnh xử lyacute quyết định
Phacircn loại theo cocircng nghệ -Kraemer vagrave King tập trung vagraveo cocircng nghệ aacutep dụng
Cocircng nghệ bảng mạch điện tử
Hội nghị trực tuyến
Mạng lưới tập đoagraven
Trung tacircm thocircng tin
Mocirci trường cộng taacutec
Phograveng quyết định
Nhoacutem phần mềm
Phần mềm được thiết kế để hỗ trợ sự hợp taacutec bao gồm việc thu huacutet vagrave lưu trữ thocircng tin
Caacutec tổ chức dẫn đầu thị trường hiện tại lagrave Lotus Notes and Domino Microsoft Exchange Novell GroupWise and Oracle Office
Caacutec cocircng cụ trong một bộ phần mềm bao gồm người quản lyacute hội nghị (Lotus Sametime) vagrave trao đổi thocircng điệp (Lotus Notes Mail)
Xếp hạng phần mềm cho nhoacutem
Ellis vv đề xuất một hệ thống xếp hạng dựa vagraveo kiểu sự hỗ trợ noacute Cung cấp
Hệ thocircng điệp
Hệ thống hội thảo truyền higravenh
Hệ thống cộng taacutec soạn thảo
Nhoacutem phacircn phối giải phaacutep phần mền
Hệ thống phối hợp
Hệ thống thocircng minh đại diện
Lực lượng điều khiển phaacutet triển phần mềm cho nhoacutem
Một số nhacircn tố chiacutenh bao gồm
Tăng năng suất
Giảm số lượng caacutec cuộc họp
Tăng cường tự động hoacutea caacutec quy trigravenh lagravem việc thường xuyecircn
Cần phối hợp toagraven cầu tốt hơn
Tiacutenh sẵn sagraveng của những mạng lan rộng
Coleman vagrave Khanna liệt kecirc 10 nhacircn tố khaacutec
54Quản lyacute hoạt động MDM (Mobile Device Management - Quản lyacute thiết bị di động)
Một số phương phaacutep phối hợp phổ biến hơnMDM lagrave
Kỹ thuật nhoacutem định danh
Kỹ thuật Delphi
Sự phacircn xử
Hệ thocircng tin dựa trecircn vấn đề
Nemawashi
Kỹ thuật nhoacutem định danh
1-Mỗi người tham gia viết ra những yacute tưởng về những gigrave necircn quyết định
2-Lần lượt mỗi người tham gia trigravenh bagravey yacute tưởng của migravenh được ghi lại trecircn bảng Khocircng thảo luận ở đacircy
3-Sau khi tất cả caacutec yacute tưởng được trigravenh bagravey caacutec đại biểu coacute thể chất vấn những người khaacutec
4-Mỗi người tham gia bỏ phiếu cho mỗi yacute tưởng
Kỹ thuật Delphi
Về cơ bản tương tự như kỹ thuật nhoacutem định danh ngoại trừ những người khocircng bao giờ tham gia cuộc họp
Một cocircng cụ khảo saacutet được sử dụng để thu thập đầu vagraveo ban đầu từ caacutec thagravenh viecircn
Một cuộc khảo saacutet thứ hai được gửi đi với một bản toacutem tắt caacutec kết quả chung
Những bước lặp lại cho đến khi đạt được một sự đồng thuận hoặc nhigraven nhận của đa số
Sự phacircn xử(Arbitration )
Thiacutech hợp nhất khi caacutec thagravenh viecircn của MDM đại diện cho caacutec yếu tố đối lập
Những người tham gia đồng yacute rằng nếu lựa chọn thay thế hai becircn thỏa thuận khocircng được tigravem thấy thigrave một trọng tagravei viecircn becircn ngoagravei sẽ tham gia
Trọng tagravei sau đoacute lựa chọn thay thế ocircng hoặc xeacutet thấy thiacutech hợp nhất
Hệ thống thocircng tin dựa trecircn vấn đề (IBIS)
Lagrave một phương phaacutep lập luận cấu truacutec
Một đại diện cho IBIS lagrave một đồ thị với caacutec nuacutet vagrave caacutec liecircn kết
IBIS bắt đầu với lựa chọn của một nuacutet vấn đề gốc sau đoacute caacutec nuacutet vị triacute khaacutec nhau được liecircn kết với nuacutet gốc
Caacutec nuacutet vị triacute nagravey sau đoacute được đaacutenh giaacute dựa trecircn những lập luận gắn liền với chuacuteng
Nemawashi (được sử dụng rộng ratildei tại Nhật Bản)
1-Một hoặc nhiều thagravenh viecircn của MDM được chỉ định lagrave điều phối viecircnCaacutec điều phối viecircn sau đoacute chọn người tham gia cograven lại
2-Điều phối viecircn xacircy dựng một tổng hợp caacutec sự lựa chọn vagrave sau đoacute caacutec chuyecircn gia đaacutenh giaacute caacutec lựa chọn
3-Điều phối viecircn lựa chọn một sự lựa chọn dựa trecircn kết quả ở trecircn(ở 2)
4-Sự thay thế được luacircn chuyển điều phối viecircn tigravem kiếm sự đồng thuận thocircng qua sự thuyết phục vagrave đagravem phaacuten
5-Nếu đạt được sự đồng thuận điều phối viecircn cho lưu thocircng một tagravei liệu magrave mỗi thagravenh viecircn MDM để lại dấu hiệu trecircn đoacute
55Nơi lagravem việc ảo
Nhiều tổ chức trecircn toagraven thế giới kinh doanh bất động sản cho cocircng nghệ hợp taacutec
Cocircng việc được trở thagravenh một điều bạn lagravem hơn lagrave một nơi bạn đi
Những thay đổi lớn nhất mang lại bởi nơi lagravem việc ảo coacute thể lagrave về văn hoaacute hay xatilde hội hơn lagrave về cocircng nghệ
Chương 6 Hệ thống thocircng tin điều hagravenh
61 Yacute nghĩa của EIS- Hệ thống thocircng tin điều hagravenh
- EIS lagrave một dạng đặc biệt của DSS được thiết kế để hỗ trợ ra quyết định ở cấp cao nhất của một tổ chức
- Lagrave một hệ thống thocircng tin hỗ trợ nhu cầu lập kế hoạch vagrave đaacutenh giaacute của caacutec nhagrave quản lyacute điều hagravenh
- EIS coacute thể giuacutep một CEO coacute được bức tranh tổng thể chiacutenh xaacutec nhất về caacutec hoạt động vagrave một bản toacutem tắt những gigrave magrave đối thủ cạnh tranh đang lagravem
- Caacutec hệ thống nagravey noacutei chung hoạt động dễ dagraveng vagrave trigravenh bagravey thocircng tin theo những caacutech dễ hiểu để việc tiếp thu được nhanh choacuteng (biểu đồ đồ thịhellip)
(Tagravei liệu thecircm EIS lagrave những loại hệ thống lagrave rất phức tạp trong tự nhiecircn Coacute thể noacutei hệ thống nagravey cũng cung cấp cho caacutec nhagrave quản lyacute với caacutec thiết bị coacute khả năng ra quyết định bằng caacutech sử dụng của noacute Hệ thống nagravey hoạt động trong điều kiện như vậy quan trọng như trong caacutec hệ thống khaacutec khocircng hỗ trợ Khả năng lưu trữ dữ liệu nặng lagravem cho noacute lyacute tưởng để được thocircng qua khocircng chỉ bởi caacutec doanh nghiệp lớn magrave cograven bởi caacutec doanh nghiệp nhỏ hơn Nhigraven chung hệ thống nagravey lagrave dagravenh cho caacutec nhacircn viecircn cấp cao hỗ trợ thagravenh thạo trong việc đưa ra caacutec quyết định quan trọng)
Caacutec phiecircn EIS tiecircu biểu- Phiecircn lagravem việc coacute thể bắt đầu với một baacuteo caacuteo về tigravenh higravenh tagravei chiacutenh vagrave kinh
doanh của một cocircng ty caacutec chỉ số hoạt động quan trọng được hiển thị rotilde ragraveng- EIS sẽ cho pheacutep caacutec giaacutem đốc điều hagravenh coacute thể đi sacircu vagraveo dữ liệu từ những con
số bất kỳ magrave noacute hỗ trợ- Việc điều hagravenh coacute thể lựa chọn một mức độ chi tiết ( VD danh số baacuten hagraveng) nếu
như cần điều tra thecircm- Lagrave một phương phaacutep tiếp cận coacute thể giuacutep việc ra quyết định tốt hơn
Những điều magrave EIS ko coacute- EIS khocircng phải lagrave sự thay thế cho caacutec hệ thống dựa trecircn caacutec maacutey tiacutenh khaacutec EIS
thực sự chỉ cung cấp dữ liệu cho caacutec hệ thống nagravey- Noacute khocircng thể biến caacutec bộ hệ điều hagravenh của maacutey tiacutenh thagravenh những ldquochuyecircn viecircn
giỏirdquo- Coacute thể được viacute một caacutech cao hơn như lagrave một trợ lyacute đaacuteng tin cậy coacute thể được gọi
đến bất khi nagraveo vagrave mỗi khi cần thiết
Tagravei liệu thecircm Sự khaacutec nhau giữa EIS vagrave DSS+ EIS thiết kế để hỗ trợ những người điều hagravenh cấp cao giuacutep họ khaacutem phaacute caacutec vấn đề vagrave caacutec cơ hội DSS hỗ trợ những nười phacircn tiacutech cố gắng trả lời cacircu hỏi caacutei gigrave coacute thể lagravem cugraveng với một cơ hội hoặc một vấn đề
Chiều EIS DSSNhững người sử dụng thocircng thường
Duyệt dữ liệu đi xuống truy xuất trạng thaacutei
Hỗ trợ phacircn tiacutech vagrave quyết định
Sự thuacutec đẩy Tiacutenh thiacutech hợp Tiacutenh hiệu quảỨng dụng Queacutet mocirci trường đaacutenh giaacute
hiệu suất nhận dạng caacutec vấn đề vagrave caacutec cơ hội
Caacutec quyết định quản lyacute trecircn caacutec lĩnh vực đa dạng
Hỗ trợ quyết định Caacutec chiacutenh saacutech caacutec quyết định khocircng coacute cấu truacutec ở mức cao vagrave hỗ trợ giaacuten tiếp
Hỗ trợ caacutec quyết định lặp lại caacutec quyết định khocircng thể đoaacuten trước ra quyết định khocircng coacute cấu truacutec vagrave baacuten cấu truacutec
Loại thocircng tin Caacutec thocircng tin tin tức thocircng tin becircn ngoagravei về khaacutech hagraveng đối thủ cạnh tranh mocirci trường caacutec baacuteo caacuteo theo yecircu cầu vagrave định thời về caacutec hoạt động becircn trong
Caacutec thocircng tin hỗ trợ caacutec tigravenh huống đặc biệt
Sử dụng coacute nguyecircn tắc
Dograve theo vết vagrave điều khiển nhận dạng cơ hội
Hoạch định tổ chức phacircn nhoacutem vagrave điều khiển
Khả năng phugrave hợp với những người sử dụng caacute nhacircn
Thiết kế loại ra quyết định cho mỗi người điều hagravenh caacute nhacircn bằng nhiều lựa chọn đầu ra
Cho pheacutep caacutec đaacutenh giaacute caacute nhacircn caacutec khả năng what-if lựa chọn loại hộp hội thoại
Đồ họa Phải coacute Lagrave một phần quan trọng của nhiều DSS
Thacircn thiện người sử dụng
Phải coacute Phải coacute nếu khocircng coacute người sử dụng trung gian
Xử lyacute thocircng tin Lọc neacuten thocircng tin dograve theo vết dữ liệu vagrave thocircng tin quan trọng
EIS kiacutech thiacutech caacutec cacircu hỏi caacutec cacircu trả lời bằng caacutech sử dụng DSS vagrave phản hồi lại EIS
Hỗ trợ caacutec thocircng tin chi tiết
Truy xuất thường xuyecircn caacutec mức chi tiết của bất kỳ thocircng tin tổng hợp nagraveo (duyệt dữ
Coacute thể coacute trong DSS nhưng khocircng thường
liệu chi tiết)Cơ sở mocirc higravenh Caacutec chức năng coacute sẵn bị hạn
chếLagrave điểm cốt lotildei của DSS
Cấu truacutec Theo người baacuten sản phẩm hoặc theo caacutec chuyecircn gia hệ thống thocircng tin
Theo người sử dụng hoặc caacute nhacircn hoặc caacutec chuyecircn gia từ caacutec trung tacircm thocircng tin hoặc phograveng ban hệ thống thocircng tin
Phần cứng Mainframe caacutec trạm RISC mạng LANs hoặc caacutec hệ thống phacircn bố
Mainframe caacutec trạm RISC caacutec maacutey PC hoặc caacutec hệ thống phacircn bố
Bản chất caacutec goacutei phần mềm
Truy xuất tương taacutec dễ dagraveng đến nhiều cơ sở dữ liệu truy xuất trực tuyến caacutec khả năng DBMS phức tạp caacutec liecircn kết phức tạp
Caacutec khả năng tiacutenh toaacuten lớn caacutec ngocircn ngữ mocirc higravenh mocirc phỏng ứng dụng vagrave caacutec bộ tạo DSS
Bản chất caacutec thocircng tin
Trigravenh bagravey thocircng tin được phaacutet sinh trước về quaacute khứ vagrave hiện tại tạo caacutec thocircng tin mới về quaacute khứ hiện tại tương lai
Tạo thocircng tin mới về quaacute khứ hiện tại tương lai
62 Lịch sử EIS- EIS xuất hiện lần đầu tiecircn tại MIT vagraveo những năm 1970
- Những EIS đầu tiecircn được phaacutet triển bởi caacutec doanh ngiệp lớn sẵn sagraveng chấp nhận rủi ro để đạt được lợi thế cạnh tranh
- Vagraveo những năm 1980 caacutec nhagrave cung cấp đatilde phaacutet triển một số cơ sở khaacutech hagraveng rộng vagrave cocircng nghệ EIS được tiếp tục phaacutet triển cho đến ngagravey nay
(Tagravei liệu thecircm Sử dụng DSSEIS cho phaacutet triển bền vững + Một số nghiecircn cứu đatilde được tiến hagravenh để kiểm tra việc thực hiện của EIS trong khu vực cocircng cộng vagrave chiacutenh phủ caacutec nước tổ chức kể từ khi chuacuteng được phaacutet triển theo định hướng lợi nhuận cho caacutec cocircng ty tư nhacircn (Hasan vagrave Hasan năm 1997) Theo một nghiecircn cứu tiến hagravenh tại Mỹ ở hơn 300 cocircng ty kết quả cho thấy sự khaacutec biệt của EIS giữa tư nhacircn vagrave chiacutenh phủ một số kết quả thuacute vị được phaacutet hiệnViacute dụ khoacute khăn hơn để chuyển tiền từ một tagravei khoản khaacutec trong một EIS của chiacutenh phủ cũng lagrave khoacute khăn hơn để biện giải thiacutech cho những chi phiacute phaacutet triển EIS của chiacutenh phủ Một nghiecircn cứu khaacutec được tiến hagravenh ở Australia
cho thấy rằng EIS cung cấp cho quản lyacute một higravenh ảnh chiacutenh xaacutec hơn về tổ chức thực hiện vagrave cung cấp hỗ trợ cho caacutec lợi iacutech chiến lược cải thiện khocircng chỉ cho caacutec nhagrave quản lyacute nhưng cograven cho phần cograven lại của tổ chức Dựa trecircn caacutec hệ thống được thiết kế cho caacutec cocircng ty tư nhacircn với một caacutech rotilde ragravengxaacutec định mục tiecircu EIS lagrave thiacutech hợp cho caacutec tổ chức cocircng cộng hiện đại nhưng cần phải được linh hoạt hơn vagrave kết thagravenh chugravem một phạm vi rộng hơn khả năng vagrave phương tiện hơn so với khu vực tư nhacircn ban đầu theo định hướng sản phẩm (Hasan vagrave Hasan năm 1997) Điều nagravey coacute thể lagrave do thực tế rằng caacutec hoạt động khu vực cocircng lagrave bắt buộc coacute taacutec động rộng phải đaacutep ứng sự mong đợi duy nhất cocircng cộng thường coacute mục tiecircu mơ hồ vagrave macircu thuẫn iacutet quyền tự chủ vagrave kiểm soaacutet việc ra quyết định vagrave nhacircn viecircn lagrave khoacute khăn hơn (Watson vagrave Carte2000) + Toacutem lại EIS lagrave một khaacutei niệm thagravenh cocircng noacute phaacutet triển qua nhiều năm tuy nhiecircn EIS khắc phục khiếm khuyết của migravenh bằng caacutech tiến hagravenh nghiecircn cứu liecircn tục)
63 Tại sao những người điều hagravenh hagraveng đầu lại khaacutec nhau- Họ lagrave những doanh nghiệp theo định hướng coacute suy nghĩ
- Coacute một khoảng khocircng gian rộng để kiểm soaacutet
- Họ chịu traacutech nhiệm cho việc thiết lập chiacutenh saacutech
- Họ đại diện cho tổ chức mocirci trường becircn ngoagravei
- Hagravenh động của họ tạo ra những kết quả đaacuteng kể về tagravei chiacutenh vagrave con người
Tần số caacutec hoạt động điều hagravenh- Xử lyacute xaacuteo trộn 42
- Hoạt động kinh doanh 32
- Phacircn bổ nguồn lực 17
- Đagravem phaacuten 3
- Những điều khaacutec 6
Handling Disturbances 42
Entrepreneurial Activites 32
Resource Allocation 17
Negotiation 3
Other 6
Những thocircng tin điều hagravenh cần thiết- Quản lyacute xaacuteo trộn coacute thể yecircu cầu sự chuacute yacute xung quanh đồng hồ
- Hoạt động kinh doanh yecircu cầu điều hagravenh để dự đoaacuten những thay đổi trong mocirci trường
- Nhiệm vụ phacircn bổ tagravei nguyecircn yecircu cầu lựa chọn người quản lyacute vagrave caacutec nguồn lực hạn chế được triển khai
- Đagravem phaacuten yecircu cầu cập nhật thocircng tin từng phuacutet để coacute thể xacircy dựng được sự đồng thuận
Caacutec loại thocircng tin điều hagravenh- Hệ thống kế toaacuten coacute liecircn quan đến việc tiacutenh toaacuten thu nhập hoạt động cho caacutec lĩnh
vực cụ thể lagrave quan trọng hơn so với caacutec hệ thống kế toaacuten truyền thocircng- Thocircng tin về thị trường khaacutech hagraveng cung cấp giaacute trị trong việc quyết định chiến
lược- Caacutec thocircng tin cần thiết thường được truyền đi trecircn một số hệ thống maacutey tiacutenh vagrave
nằm trong toagraven tổ chức- Caacutec thocircng tin được sử dụng thường lagrave ngắn hạn vagrave dễ thay đổi
Phương thức để xaacutec định thocircng tin cần thiết
Rockart xaacutec định được năm phương thức cơ bản để xaacutec định thocircng tin cần thiết
- Phương thức dựa trecircn kết quả- Phương thức rỗng- Phương thức chỉ số khoacutea- Phương thức tổng hợp nghiecircn cứu- Phương thức dựa vagraveo nhacircn tố then chốt dẫn đến thagravenh cocircng
64 Thagravenh phần EIS
- Sản phẩm EIS đầu tiecircn được phaacutet triển để sử dụng trecircn maacutey tiacutenh cấu higravenh cao nhưng caacutec sản phẩm hiện nay nhằm mục tiecircu lagrave nền tảng ClientServer
- Những nền tảng linh hoạt hơn coacute thể thiacutech ứng với thay đổi trong tổ chức vagrave cocircng nghệ
- Sử dụng dữ liệu thời gian thực dẫn đến quyết định nhanh hơn nhiều thocircng tin hơn
Thagravenh phần phần cứng- Một EIS khocircng đogravei hỏi coacute phần cứng cụ thể hoặc duy nhất nagraveo- Chigravea khoacutea của vấn đề lagrave để đảm bảo rằng caacutec thagravenh phần của EIS tối ưu hoacutea vagrave
phugrave hợp với tagravei nguyecircn maacutey tiacutenh của tổ chức- Hệ thống nagravey phải được cấu higravenh để caacutec nguồn tagravei nguyecircn phugrave hợp với những
người điều hagravenh chuacuteng
Thagravenh phần phần mềm- Traacutei ngược với phần cứng phần mềm thường được chuyecircn mocircn hoacutea cao cho caacutec
bagravei toaacuten về miền- Sự chuyecircn mocircn hoacutea nagravey thường đạt được bằng caacutech sử dụng thagravenh phần off-the-
shelf cho toagraven bộ EIS vagrave caacutec mocirc-đun tugravey chỉnh để đaacutep ứng nhu cầu cụ thể- Lotus Notes lagrave một viacute dụ điển higravenh Noacute coacute thể được sử dụng một migravenh hoặc coacute
thể phục vụ becircn thứ ba mocirc-đun plug-in
Cocircng nghệ EIS hiện nay
Dobrzeniecki đề xuấtphacircn loạitừng cấptheo bachức năng- Loại 1 sản phẩm bao gồmmột bộ đầy đủcaacutec ứng dụngtừ mộtnhagrave cung cấp- Loại 2 sản phẩm đượcthựchiệnở phần đầu củacaacutecsản phẩmDSS đượcphaacutet triển
bởicugravengmộtnhagrave cung cấp- Loại 3 sản phẩmkết hợp với nhautheo bất kỳ số lượngthuộc sở hữu củacocircng ty
65 Xacircy dựng EIS
- Xacircy dựngmộtEISgiống nhưxacircydựngmột số hệ thống khaacutec củamocirc higravenh hệ thống thocircng tin
- Việcphaacutet triểncấu truacutecnecircn được theo dotildeitừ quaacute trigravenh thiết kế đến quaacute trigravenhthực hiện
- Tuy nhiecircn một dự aacuten phaacutet triển EIScoacute xu hướnglagrave thống nhấtvagraveyecircu cầu hỗ trợ caacutec nhagrave quản lyacute latildenh đạo
- Xacircy dựng một EIScoacute thểphaacutet hiện ra đượccaacutectigravenh huống khoacute khănmagravemột nhagrave phaacutet triển chưabao giờ gặp phải
Mocirc higravenh EIS
Khung phaacutet triển một EIS
- Watson et al đề nghị xacircy dựngkhung với ba thagravenh phần+ Caacutech tiếp cận tập trung vagraveo yếu tốcon người vagrave dữ liệu coacute liecircn quan đến EIS+ Quaacute trigravenh phaacutet triển cần sự linh hoạt vagrave tương taacutec+ Người sử dụng - hệ thống hộp thoại bao gồm một ngocircn ngữ hagravenh động để xử lyacute caacutec lệnh
Lợi iacutech của EIS- Dễ duy trigrave caacutec mục tiecircu coacute tổ chức- Dễ truy xuất thocircng tin- Cho pheacutep người sử dụng nacircng cao hiệu suất hơn
- Tăng chất lượng ra quyết định- Cung cấp sự cải tiến cạnh tranh- Tiết kiệm thời gian của người sử dụng- Tăng khả năng vagrave chất lượng giao tiếp- Cung cấp khả năng điều khiển tốt hơn trong tổ chức- Cho pheacutep tham gia caacutec vấn đề vagrave caacutec cơ hội- Cho pheacutep hoạch định- Cho pheacutep tigravem kiếm nguyecircn nhacircn của một vấn đề- Thảo matilden caacutec yecircu cầu của người điều hagravenh
Hạn chế của EIS vagrave 1 số sai lầm cần traacutenh
- Chi phiacute một cuộc khảo saacutetnăm1991 chothấychi phiacute phaacutet triểntrungbigravenh365000USDvớichi phiacute vận hagravenhhagraveng năm lagrave$200000 (EIS)
- Cocircng nghệ hạn chếEIScần phảiđượctiacutech hợp hoagraven toagravenvagraveokiếntruacuteccủadoanh nghiệphiện tại do đoacute noacutelagrave một thaacutech thứclớn đối vớithiết kế
- Hạn chế tổ chức cơ cấu tổ chứccoacute thể khocircng phugrave hợp
Sự hạn chế về tổ chức- Chương trigravenh nghị sự vagrave thời gian chệch EIS mocirc tả một phần việc thực hiện một
chương trigravenh nghị sự vagrave coacute thể dễ dagraveng đạt được sự tin cậy một caacutech chắc chắn- Đồng bộ hoacutea việc quản lyacute sự tin cậy đuacuteng luacutec đặc biệt baacuteo caacuteo EIS coacute thể phaacute
vỡ sự ổn định thiết lập caacutec chu trigravenh baacuteo caacuteo một caacutech tốt nhất- Sự bất ổn EIS phản ứng nhanh coacute thể gacircy ra việc taacutec động trở lại một caacutech
nhanh choacuteng dẫn đến sự thiếu ổn định trong tổ chức
Sự thất bại lagrave thay thế khocircng thể chấp nhận được- Một số yếu tố lagravem EIS thất bại
+ Thiếu sự hỗ trợ về mặt quản lyacute+ Vấn đề chiacutenh trị+ Thất bại của nhagrave phaacutet triển+ Lỗi về cocircng nghệ+ Giaacute cả+ Thời gian
66 Ra quyết định điều hagravenh trong tương lai vagrave EIS
- Coacute một vagravei điều kiện sẽ được hợp nhất cho việc chuyển đổi cocircng nghệ Trong đoacute một vagravei điều kiện coacute thể dễ dự đoaacuten Hai điều kiện magrave ta coacute thể thấy lagrave+ Phaacutet triển cocircng nghệ maacutey tiacutenh trong việc điều hagravenh sẽ tạo ra sự chuyển đổi được chấp nhận một caacutech dễ dagraveng hơn+ Mở rộng traacutech nhiệm điều hagravenh sẽ mở rộng nhu cầu thocircng tin
Tương lai của EIS- EIS thocircng minh Những tiến bộ trong cocircng nghệ AI sẽ được triển khai trong caacutec
EIS- EIS đa phương tiện Cơ sở dữ liệu đa phương tiện sẽ cho pheacutep tiacutech hợp văn bản
giọng noacutei vagrave higravenh ảnh trong tương lai- EIS thocircng tin Tương lai EIS sẽ mở rộng hơn trong việc sử dụng dữ liệu becircn
ngoagravei doanh nghiệp- EIS kết nối Giao tiếp với băng thocircng rộng cho pheacutep kết nối liecircn thocircng lớn hơn
Chương 7 HỆ CHUYEcircN GIA VAgrave TRIacute TUỆ NHAcircN TẠO
71 Caacutec khaacutei niệm
72 Triacute thocircng minh của triacute tuệ nhacircn tạo
73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia
74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia
75 Lợi iacutech vagrave hạn chế của hệ chuyecircn gia
71 Caacutec khaacutei niệm
Chuyecircn mocircn (Expertise) sự hiểu biết rộng trong 1 lĩnh vực hẹp
Hệ chuyecircn gia (Expert Systems)1 chương trigravenh maacutey tiacutenh sử dụng 1 tập caacutec luật dựa trecircn tri thức của con người để giải quyết caacutec vấn đề đogravei hogravei phải coacute sự chuyecircn mocircn
Một số hệ chuyecircn gia nổi tiếng
DENDRAL (Standford 1960s Edward Feigenbaum)
MYCIN (Standford1970s Edward Shortliffe)
PROSPECTOR (MIT 1979)
Triacute tuệ nhacircn tạo (Artificial Intelligence ndash AI)
Triacute tuệ nhacircn tạo một bộ phacircn của ngagravenh khoa học maacutey tiacutenh quan tacircm đến việc thiết kế caacutec hệ thống maacutey tiacutenh thocircng minh đoacute lagrave caacutec hệ thống đưa ra caacutec đặc điểm magrave từ đoacute chuacuteng ta liecircn hệ với sự thocircng minh trong hagravenh động của con người (Barr vagrave Feigenbaum 1981)
Mục điacutech của AI
Mục điacutech khoa học xaacutec định caacutec gợi yacute để giải thiacutech caacutec loại khaacutec nhau của triacute tuệ thực
Mục điacutech kỹ thuật giải quyết caacutec vấn đề trong thế giới thực
Triacute tuệ nhacircn tạo kế thừa nhiều yacute tưởng quan điểm kỹ thuật từ caacutec ngagravenh khoa học khaacutec
- Triết học
- Logic Toaacuten học
- Tiacutenh toaacuten
- Khoa học tacircm lyacute Khoa học nhận thức
- Sinh học Thần kinh học
- Tiến hoacutea
Caacutec lĩnh vực ứng dụng trong Triacute tuệ nhacircn tạo
Mạng nơ ron thần kinh (Neural Networks)
Tiacutenh toaacuten sự tiến hoacutea
(Evolutionary Computation)
Hệ chuyecircn gia (Expert Systems)
Kỹ thuật xử lyacute tiếng noacutei (Speech Processing)
Kỹ thuật xử lyacute ngocircn ngữ tự nhiecircn
(Natural Language Processing)
Lập kế hoạch (Planning)
Robot (Robotics)
Khoa học higravenh ảnh (Vision)
Caacutec kỹ thuật thocircng dụng dugraveng trong AI
Biểu diễn(Representation)
Học (Learning)
Caacutec luật (Rules)
Tigravem kiếm (Search)
72 Triacute thocircng minh của triacute tuệ nhacircn tạo
Con người suy diễn như thế nagraveo
Phacircn loại (Categorization)
Caacutec quy tắc cụ thể
Heuristics
Kinh nghiệm trước đoacute
Dự tiacutenh trước
Maacutey tiacutenh suy diễn như thế nagraveo
Lập luận dựa trecircn luật IF-THEN mocirc tả tri thức được matilde hoacutea dưới dạng caacutec luật
Caacutec khung (Frames) lagrave caacutec đại diện mocirc tả caacutec tigravenh huống giống nhau lagrave điển higravenh của một vagravei phacircn loại
Lập luận dựa trecircn caacutec trường hợp mocirc phỏng giải phaacutep trước đoacute cho một vấn đề hiện tại
Nhận dạng mẫu phaacutet hiện acircm thanh higravenh dạng hoặc caacutec chuỗi dagravei
Caacutec dạng khaacutec của Triacute tuệ nhacircn tạo
Học maacutey- mạng nơron vagrave giải thuật di truyền
Lập trigravenh tự động ndash lagrave những kỹ thuật tạo ra caacutec chương trigravenh để lagravem 1 nhiệm vụ riecircng biệt (cho pheacutep những người khocircng phải lagrave người lập trigravenh coacute thể lập trigravenh được)
Cuộc sống nhacircn tạo ndash nỗ lực để taacutei tạo caacutec hiện tượng sinh học trong caacutec hệ thống dựa trecircn maacutey tiacutenh
73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia(Expert Systems- ES)
Theo Jackson (1999) Một hệ chuyecircn gia lagrave một chương trigravenh maacutey tiacutenh mocirc tả vagrave suy diễn với tri thức của một vagravei lĩnh vực để giải quyết vấn đề hay đưa ra caacutec lời khuyecircn
Cấu truacutec cơ bản của ES được dựa theo cấu truacutec chung của DSS Sự khaacutec biệt chiacutenh giữa ES vagraveDSS lagrave hệ ES thu thập caacutec kiến thức từ những
chuyecircn gia trong lĩnh vực quan tacircmĐặc trưng của hệ chuyecircn gia Hiệu quả cao Thời gian trả lời thỏa đaacuteng Độ tin cậy cao Dễ hiểu
Giao diện người dugraveng trong ES
Thiết kế giao diện người dugraveng tập trung vagraveo caacutec yếu tố như dễ dagraveng sử dụngcoacute độ tin cậy cao giảm tải những khoacute khăn khi sử dụng
Thiết kế necircn coacute một số tương taacutec (đầu vagraveo kiểm soaacutet vagrave truy vấn)
Cấu tạo giao diện người dugraveng gồm coacute magraven higravenh cảm ứng bagraven phiacutem buacutet saacuteng lệnh thoại caacutec phiacutem chuyecircn dụng
Cơ sở tri thức (Knowledge Base)
Chứa đựng caacutec tri thức cụ thể miền thu được từ caacutec chuyecircn gia miền
Coacute thể chứa caacutec mocirc tả caacutec hagravenh vi giải quyết vấn đề caacutec ragraveng buộc caacutec heuristics
Thagravenh cocircng của một ES dựa trecircn tiacutenh đầy đủ vagrave tiacutenh chiacutenh xaacutec của cơ sở tri thức
Mocirc tơ suy diễn (Inference Engine)
Ở đacircy tri thức được đặt để sử dụng tạo ra caacutec giải phaacutep để giải quyết vấn đề
Mocirc tơ nagravey coacute khả năng thực hiện diễn dịch hoặc suy diễn dựa trecircn caacutec luật hay caacutec caacutec sự kiện
Đồng thời cũng coacute khả năng sử dụng caacutec suy diễn mờ hay khocircng chiacutenh xaacutec dựa trecircn xaacutec suất hay aacutenh xạ mẫu
Vograveng điều khiển suy diễn
1 Aacutenh xạ caacutec luật với caacutec sự kiện đatilde được cho
2 Chọn luật để thực hiện
3 Thực hiện luật bằng caacutech thecircm caacutec sự kiện được suy diễn ra vagraveo bộ nhớ lagravem việc
Chuỗi suy diễn (Chaining)
Suy diễn tiến (forward chaining) maacutey suy diễn bắt đầu từ dữ liệu ban đầu vagrave thực hiện việc suy luận để đưa ra caacutec kết luận cuối cugraveng
Suy diễn lugravei (backward chaining) maacutey suy diễn bắt đầu từ dữ liệu điacutech vagrave tigravem ra tri thức hỗ trợ cho dữ liệu điacutech đoacute
Viacute dụ suy diễn lugravei
R1 Nếu coacute A vagrave B thigrave suy ra coacute D
R2 Nếu coacute B thigrave suy ra coacute C
R3 Nếu coacute C vagrave D thigrave suy ra coacute E
Ta coacute E ta xem trong 3 luật R1 R2 R3 luật nagraveo coacute E ta thấy R3 chứa E đồng thời chứa C vagrave D Xeacutet tiếp trong 2 luật R1 R2 luật nagraveo chứa C vagrave D R2 chứa C R3 chứa D Từ đoacute ta coacute được caacutec tri thức hỗ trợ suy diễn vagrave kết luận lagrave nếu coacute A vagrave B thigrave sẽ coacute E Hay nếu A vagrave B đuacuteng thigrave sẽ coacute E
Viacute dụ suy diễn tiến
Giả sử coacute tập chứa 3 luật sau
R1 Nếu coacute A vagrave B thigrave suy ra coacute D
R2 Nếu coacute B thigrave suy ra coacute C
R3 Nếu coacute C vagrave D thigrave suy ra coacute E
Nếu ta coacute A vagrave B thigrave chuacuteng ta suy ra được D từ R1 vagrave suy ra C từ R2 Với D vagrave C đatilde được suy ra ở trecircn giờ chuacuteng ta suy ra được E từ R3
Viacute dụ thực tế
Giả sử muốn biết magraveu của một con vật nuocirci tecircn lagrave Fred biết rằng noacute kecircu ộp ộp vagrave ăn ruồi
Coacute tập 4 luật ban đầu như sau
R1 Nếu X kecircu ộp ộp vagrave ăn ruồi thigrave X lagrave con ếch
R2 Nếu X kecircu chiecircm chiếp vagrave biết hoacutet thigrave X lagrave con chim
R3 Nếu X lagrave con ếch thigrave X coacute magraveu xanh
R4 Nếu X lagrave con chim thigrave X coacute magraveu vagraveng
74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia
Expert system shells lagrave một tập caacutec goacutei phần mềm vagrave caacutec cocircng cụ dugraveng để phaacutet triển caacutec hệ chuyecircn gia
Những Expert system shells đầu tiecircn thường rất rườm ragrave Mặc dugrave vậy noacute vẫn giuacutep cho người sử dụng sẽ khocircng phải bắt đầu lại từ đầu khi xacircy dựng một hệ chuyecircn gia mới
Những shell hiện đại bao gồm hai mocirc-đun chiacutenh lagrave cocircng cụ xacircy dựng một tập quy tắc vagrave mocirc tơ suy diễn
Xacircy dựng hệ chuyecircn gia
Bước 1 xacircy dựng mocirc higravenh bagravei toaacuten xaacutec định vấn đề nhiệm vụ magrave hệ thống sẽ thực hiện Caacutec dạng bagravei toaacuten cần hệ chuyecircn gia
Bagravei toaacuten diễn giải (InterPretation)
Bagravei toaacuten dự baacuteo (Prediction)
Bagravei toaacuten chuẩn đoaacuten (Diagnose)
Bagravei toaacuten gỡ rối (Debugging)
Bagravei toaacuten thiết kế
Tương tự như một dự aacuten phần mềm để xacircy dựng một hệ chuyecircn gia cần phải coacute caacutec yếu tố về nhacircn lực tagravei nguyecircn vagrave thời gian Những yếu tố nagravey ảnh hưởng đến giaacute thah của một hệ chuyecircn giaTrong phần nagravey cacircu hỏi thường được đặt ra lagrave tại sao cần phải xacircy dựng một hệ chuyecircn giaTrước khi bắt đầu phải xaacute định rotilde bagravei toaacuten đạt ra lagrave jiAi lagrave chuyecircn giaAi lagrave người sử dụng
1 Diễn giải (InterPretation) Nghiecircn cứu 1 vấn đề -gt Dựa trecircn những biểu hiện thuộc tiacutenh đặc trưng becircn ngoagravei -gt Tư vấn
(hoặc đưa ra kết luận hay mocirc tả dễ hiểu từ tập dữ liệu thocirc)
2 Bagravei toaacuten dự baacuteo (Prediction) Coacute thể dự đoaacuten được hagravenh vi kết quả dựa trecircn caacutec hiện tượng -gt dự baacuteo
VD Dự baacuteo thời tiết động đấthellip
3 Bagravei toaacuten chẩn đoaacuten (Diagnoss) Xaacutec định caacutec lỗi caacutec bộ phận hỏng hoacutec của hệ thống dựa trecircn caacutec dữ liệu quan saacutet được
4 Bagravei toaacuten gỡ rối (Debugging) Mocirc tả caacutec phương phaacutep khắc phục hệ thống khi gặp sự cố
5 Bagravei toaacuten thiết kế Lựa chọn cấu higravenh caacutec đối tượng nhằm thoả matilden một số ragraveng buộc nagraveo đoacute
6 Giảng dạy Phần mềm dạy học coacute thể chuẩn đoaacuten vagrave sủa lỗi của học sinh trong quaacute trigravenh học tập
Để xaacutec định đuacuteng bagravei toaacuten magrave chuacuteng ta cần giải quyết thigrave phải trả lời đc một số cacircu hỏi
- cần hệ chuyecircn gia
Bước 2 thu thập tri thức lựa chọn cocircng cụ vagrave aacutep dụng
Trong bước thu thập tri thức vấn đề quan trọng lagrave lựa chọn chuyecircn gia những người magrave sẽ đoacuteng goacutep tri thức cho hệ thống Thocircng thường trong suốt quaacute trigravenh phaacutet triển thigrave chuyecircn gia được xem như một thagravenh viecircn của đội phaacutet triển
Hiện nay coacute rất nhiều cocircng cụ để xacircy dựng một hệ chuyecircn gia Phổ biến nhất lagrave JESS CLIPS vagrave OPS5
Bước 3 Thiết kế cơ sở tri thức thiết kế hệ thốngTri thức được biểu diễn trường minh trong cơ sở tri thức
Caacutec chuyecircn gia vagrave kỹ sư tri thức sẽ đối thoại với nhau bằng caacutec kỹ thuật đối thoại Suy diễn (SD) bảng Mocirc higravenh hoacutea SD quy nạp phacircn loại
Vấn đề bagraveo trigrave vagrave phaacutet triển
Caacutec hệ chuyecircn gia đogravei hỏi phải bảo trigrave vagrave phaacutet triển nhiều hơn so với caacutec hệ thống khaacutec Phải thường xuyecircn bổ sung tri thức mới vagrave thay đổi caacutec tri thức cũ để đổi mới hệ chuyecircn gia
Thu thập vagrave khắc phục lỗi do người sử dụng phaacutet hiện để kịp thời khắc phục những sai soacutet của hệ chuyecircn gia
75 Lợi iacutech vagrave hạn chế của caacutec hệ chuyecircn gia
Một số lợi iacutech chiacutenh
Thời gian trả lời hợp lyacute bằng hoặc nhanh hơn so với chuyecircn gia (người) để đi đến cugraveng một quyết định Hệ chuyecircn gia lagrave một hệ thống thời gian thực (real time system)
Khả năng trả lời với mức độ tinh thocircng bằng hoặc cao hơn so với chuyecircn gia (người) trong cugraveng lĩnh vực
Hệ chuyecircn gia giuacutep cho hiệu quả lagravem việc tăng bằng việc sử dụng tập caacutec luật một caacutech nhanh choacuteng magrave ko bị nhầm lẫn chuyecircn gia lagrave người coacute thể quecircn đi một số tri thức cơ sở lyacute luậ nhưng HCG thigrave ko
Quyết định của một người chuyecircn gia coacute thể bị thay đổi vagrave ko coacute tiacutenh thống nhất như quyết định của một hệ chuyecircn gia tạo ra
Hệ chuyecircn gia giuacutep cho người sử dụng coacute thể trau dồi sự hiểu biết trecircn lĩnh vuej cụ thể magrave noacute giải quyết hỗ trợ người ra quyết định coacute trigravenh độ như 1 chuyecircn gia trong quaacute trigravenh gia quyết định
Kiến thức của rất nhiều chuyecircn gia về một lĩnh vực nagraveo đoacute được đưa vagraveo hệ chuyecircn gia lagravem cho CSTT cuat HCG phong phuacute vagrave rộng lớn hơn rất nhiều
HCG giải thiacutech caacutec bước suy luận một caacutech dễ hiểu nhất quaacuten luacutec nagraveo cũng coacute thể sử dụng ko như chuyecircn gia con người
Hạn chế của caacutec hệ chuyecircn gia
Nhược điểm lớn nhất của hệ chuyecircn gia lagrave những yacute kiến chuyecircn mocircn thường rất khoacute matilde hoacutea vagrave giải neacuten
Hệ chuyecircn gia khocircng coacute khả năng tự học tự cập nhật kiến thức mới như caacutec chuyecircn gia magrave cần phải được matilde hoacutea lại khi noacute được cập nhật
Hệ chuyecircn gia khocircng thể nhận ra được vấn đề khocircng nằm trong miền kiến thức của hệ thống
Chương 8 Tri thức vagrave tiếp nhận
1 Bao gồm caacutec vấn đề
Dữ liệu thực tế đo lường hoặc quan saacutet coacute hoặc khocircng coacute bối cảnh
Thocircng tin dữ liệu được tổng hợp một caacutech hữu iacutech để giải quyết những khoacute khăn trong việc đưa ra quyết định
Tri thức bao gồm caacutec ứng dụng quy tắc thocircng tin hướng dẫn của người ra quyết định
2 Những caacutei nhigraven về tri thức
Đại diện lagravem thế nagraveo để diễn tả tri thức viacute dụ như một quyển saacutech khocircng phải lagrave tri thức nhưng noacute lại lagrave một đại diện của tri thức
Sản xuất tri thức lagrave một tập hơp của hagraveng tồn kho coacute thể được sản xuất cũng như mua lại
Tri thức lagrave 1 trong 6 trạng thaacutei của hệ thống
1Dữ liệu 2Thocircng tin 3Cấu truacutec thocircng tin 4Sự thấu hiểu 5Yacute kiến 6 Quyết định
3 Caacutec loại tri thức Phổ biến mocirc tả dữ liệu thocircng tin thủ tục mọi thứ lagravem như thế nagraveo lập luận chiacutenh saacutech hoặc caacutec quy tắc
4 Thu thập Tri thức hệ chuyecircn gia Hầu hết caacutec phương phaacutep đều bắt đầu với mocirc higravenh của caacutec taacutec vụ trong đoacute
hệ chuyecircn gia được xacircy dựng Trong đoacute mocirc tả về caacutec lĩnh vực được tạo ra Caacutec kỹ sư sử dụng caacutec mocirc higravenh giả thuyết vagrave nhận thức về quaacute trigravenh phacircn
tiacutech để gợi ra caacutech giải quyết vấn đề về tri thức từ caacutec chuyecircn gia
5 Caacutec chiều của thu thập tri thức KE- driven caacutec kỹ sư trao đổi trực tiếp với caacutec chuyecircn gia Expert-driven Caacutec chuyecircn gia trực tiếp đưa chuyecircn mocircn của họ vagraveo hệ
thống maacutey tiacutenh Machine-driven Sử dụng caacutec cocircng cụ suy luận để triacutech xuất tri thức từ một
tập caacutec viacute dụ
6 Kỹ thuật thu thập tri thức Trao đổi gồm 2 loại cơ bản lagrave coacute cấu truacutec(coacute kịch bản) vagrave khocircng coacute cấu
truacutec( đối thoại trực tiếp) Giao thức phacircn tiacutech bằng lời Khi caacutec chuyecircn gia thực hiện một cocircng việc
của họ thigrave một bản ghi về cocircng việc đoacute được thực hiện Caacutec kỹ sư sẽ xacircy dựng mocirc higravenh cho những gigrave được ghi lại trong bản ghi
Phương phaacutep sagraveng lọc caacutec chuyecircn gia so saacutenh caacutec nhoacutem liecircn tiếp trong ba đối tượng vagrave cho biết tại sao nhoacutem thứ hai lại khaacutec nhoacutem thứ ba
7 Thu thập tri thức từ nhiều nguồn Thu thập tri thức từ nhiều nguồn lagrave cần thiết để coacute được đầy đủ caacutec tri thức
cho một vấn đề quan điểm yacute kiến traacutei ngược nhau thường phaacutet sinh Phương phaacutep đồng thuận sẽ giuacutep giải quyết được vấn đề macircu thuẫn Kỹ thuật phacircn tiacutech Meta lagrave kỹ thuật được aacutep dụng trong caacutec trường hợp
khaacutec Caacutech tiếp cận bằng định lượng đogravei hỏi caacutec kỹ sư cần cacircn nhắc yếu tố đầu vagraveo của caacutec chuyecircn gia khaacutec nhau
8 Xaacutec nhận hợp lệ vagrave kiểm tra tri thức Một khi thu thập tri thức noacute phải được đaacutenh giaacute về khả năng sử dụng vagrave độ
chiacutenh xaacutec Hai vấn đề cụ thể lagrave hiệu lực của những kiến thức vagrave kiểm tra việc xacircy dựng cơ sở của tri thức
Cần xaacutec nhận xem liệu hệ thống coacute thể hoạt động ở mức độ tối thiểu khocircng
Xaacutec minh liecircn quan đến việc so saacutenh từng chi tiết kỹ thuật của hệ thống những gigrave đatilde được thực hiện cuối cugraveng
9 Một số caacutec biện phaacutep xaacutec nhận Độ chiacutenh xaacutec Khả năng thiacutech nghi Mức độ đầy đủ Bề rộng Độ sacircu Hiệu lực Tổng quan Chiacutenh xaacutec Hiện thực Độ tin cậy Tiacutenh hữu dụng Mức độ
Chương 9 Học maacutey
1 Logic mờ vagrave ngocircn ngữ mờ(Fuzzy Logic and Linguistic Ambiguity)
Ngocircn ngữ tự nhiecircn gồm những khaacutei niệm mơ hồ vagrave khocircng chiacutenh xaacutectruyền tải ngữ nghĩa thocircng qua tiacutenh xấp xỉkhocircng rotilde ragraveng
Những xấp xỉ nagravey giuacutep con người coacute thể truyền tải hết được yacute nghĩa nhưng maacutey thigrave khocircng hiểu
Lagravem sao biểu diễn caacutec tri thức sử dụng caacutec khaacutei niệm khocircng rotilde ragraveng(mờ) hoặc khocircng chiacutenh xaacutec
2 Khaacutei niệm cơ bản của logic mờ tập mờ lagrave những tập hợp khocircng coacute một giới hạn rotilde Mỗi phần tử của noacute chỉ
chứa một mức độ hagravem liecircn thuộc của từng phần tử Vigrave vậy tập mờ khocircng giống như tập cổ điển Tập mờ coacute thể kết hợp với nhau qua những luật mờ magrave đặc trưng cho những hagravenh động trạng thaacutei vagrave thuộc tiacutenh của logic mờ được tận dụng khi thực hiện một bộ điều khiển mờ
Logic mờ dựa trecircn yacute tưởng mỗi phần tử thuộc vagraveo một tập hợp ở một mức độ nagraveo đấy
Locircgic mờ cho pheacutep độ liecircn thuộc (microA )coacute giaacute trị trong khoảng (01) Locircgic mờ coacute thể được coi lagrave mặt ứng dụng của lyacute thuyết tập mờ để xử lyacute caacutec
giaacute trị trong thế giới thực cho caacutec bagravei toaacuten phức tạp
3 So saacutenh tiacutenh đuacuteng đắn logic mờ vagrave xaacutec suất Xaacutec suất thigrave đề cập đến khả năng xảy ra một biến cố hay một điều gigrave đoacute Logic mờ đề cập đến cấp độ magrave đặc tiacutenh ở hiện tại
o viacute dụ1 người coacute chiều cao 6 feet thigrave coacute cấp độ lagrave 05 về chiều cao
4 Ưu điểm của logic mờ Caacutech tiếp cận rất tự nhiecircnkhocircng phức tạp Coacute thể mocirc higravenh hoacutea caacutec hagravem phi tuyến tugravey yacute phức tạp
Coacute thể tận dụng được kinh nghiệm từ những chuyecircn gia hagraveng đầu trong mọi lĩnh vực
Logic mờ được xacircy dựng dựa trecircn ngocircn ngữ tự nhiecircnNền tảng của logic mờ lagrave dựa trecircn cơ sở giao tiếp của con người
5 Nhược điểm của logic mờ Trong 1 hệ thống phức tạpsử dụng logic mờ coacute thể trở thagravenh trở ngại cho
việc xaacutec thực độ tin cậy của hệ thống Cơ chế lập luận mờ khocircng thể học hỏi từ những lỗi sai
6 Mạng noron nhacircn tạo(ANN) Mạng noron nhacircn tạo lagrave một mocirc phỏng xử lyacute thocircng tinđược nghiecircn cứu ra
từ hệ thống thần kinh của sinh vậtgiống như bộ natildeo để xử lyacute thocircng tin ANNs lagrave chương trigravenh dựa trecircn maacutey tiacutenh đơn giản coacute chức năng lagrave một mocirc
higravenh bagravei toaacuten khocircng gian dựa trecircn thử nghiệm vagrave baacuteo lỗi
7 Học từ kinh nghiệm Tiến trigravenh Một mẫu dữ liệu được biểu diễn như một mạng lưới noronANN ldquodự
đoaacutenrdquo 1 đầu radự đoaacuten được so saacutenh với giaacute trị thực tế hoặc giaacute trị chiacutenh xaacutecNếu đoaacuten được chiacutenh xaacutec thigrave khocircng coacute hagravenh động nagraveo được thực hiện
Nếu dự đoaacuten sai ANN kiểm tra lại vagrave xaacutec định lại thocircng số để điều chỉnh Một mẫu dữ liệu khaacutec được biểu diễn vagrave quaacute trigravenh nagravey được lặp lại
8 Nguyecircn tắc cơ bản của cocircng nghệ nơron Caacutec yếu tố xử lyacute cơ bản trong hệ thống thần kinh của con người lagrave tế bagraveo
thần kinhMạng lưới của tế bagraveo nagravey lagrave liecircn kết với nhau nhận được thocircng tin từ caacutec cảm biến trong mắt taihellip
Thocircng tin nhận được bởi tế bagraveo thần kinh hoặc lagrave sẽ kiacutech thiacutech noacute(sẽ được chuyển qua 1 thocircng điệp dọc theo mạng lưới) hoặc lagrave sẽ ngăn cản noacute(ngăn cản dograveng thocircng tin)
Độ nhạy coacute thể thay đổi qua thời gian hoặc sau khi coacute được kinh nghiệm
9 Cấu truacutec mạng Một ANN gồm 3 lớp cơ bản
Lớp đầu vagraveo nhận dữ liệu Lớp becircn trong hoặc lagrave lớp ẩn xử lyacute dữ liệu Lớp đầu ra chuyển tiếp kết quả cuối cugraveng của mạng
10Mạng nơ ron Thường coacute nhiều đầu vagraveo mỗi đầu vagraveo với mức ảnh hưởng vagrave tầm quan
trọng riecircng của noacute Một đầu vagraveo quan trọng coacute thể được sử dụng để khuếch đại đầu ra caacutec hagravem trạng thaacutei tổng hợp caacutec trọng số của caacutec yếu tố
đầuvagraveo khaacutec nhauvagraveo một giaacute trị duy nhất Caacutec hagravem chuyển giao xử lyacute caacutec giaacute trị trạng thaacutei vagrave tạo đầu ra
11Huấn luyện mạng nơ ron Trong mocirc higravenh coacute giaacutem saacutetANN được đến so saacutenh dự đoaacuten của chiacutenh
noacute với thocircng tin phản hồi coacute chứa caacutec kết quả mong muốn ANN sẽ phải tigravem caacutech thay đổi caacutec tham số becircn trong củamigravenh (caacutec trọng số vagrave caacutec ngưỡng) để tạo necircn một aacutenh xạ coacute khả năng aacutenh xạcaacutec đầu vagraveo thagravenh caacutec đầu ra mong muốn Sự thay đổi nagravey được tiến hagravenh nhờ việc so saacutenh giữa đầu ra thực sự vagrave đầu ra mong muốn
Trong mocirc higravenh khocircng coacute giaacutem saacutetANN nhận được dữ liệu vagraveo nhưng khocircng phải coacute bất kỳ thocircng tin phản hồi về kết quả mong muốn
Phần lớn caacutec ứng dụng nằm trong vugraveng của caacutec bagravei toaacuten ước lượng như mocirc higravenh hoacuteathống kecirc neacuten lọc phacircn cụm
12Lợi iacutech Liecircn kết với mạng noron Traacutenh caacutech lập trigravenh tường minh Giảm nhu cầu của chuyecircn gia ANNs thigrave thiacutech nghi với caacutec yếu tố đầu vagraveo thay đổi Khocircng cần thiết cho cơ sở tri thức tinh chế ANNs coacute tiacutenh động vagrave cải thiện với việc sử dụng Coacute khả năng xử lyacute dữ liệu khocircng chiacutenh xaacutec hoặc khocircng đầy đủ Cho pheacutep tổng quaacutet hoacutea từ thocircng tin cụ thể Cho pheacutep thu thập cảm giaacutec thocircng thường vagraveo miền giải quyết vấn đề
13Hạn chế của việc liecircn kết với mạng noron ANNs khocircng thể giải thiacutech được suy luận Bản chất hộp đen thường khiến cho vấn đề traacutech nhiệm vagrave độ tin cậy phaacutet
sinh lagrave khoacute khăn Lặp đi lặp lại quaacute trigravenh huấn luyện rất tốn thời gian Nguồn lực caacutec nhagrave phacircn tiacutech vagrave thiết kế coacute tay nghề cao vẫn lagrave đaacuteng lo
ngại Cocircng nghệ ANN thuacutec đẩy hạn chế của phần cứng hiện tại ANN yecircu cầu phải coacute sự tin tưởng ở đầu ra
14Giới thiệu về thuật toaacuten di truyền Cũng như mạng lưới thần kinh caacutec thuật toaacuten di truyền được dựa trecircn lyacute
thuyết sinh học Thuật toaacuten di truyền tigravem thấy nguồn gốc của chuacuteng trong caacutec lyacute thuyết
tiến hoacutea của chọn lọc tự nhiecircn vagrave thiacutech ứng với biến đổi khiacute hậu Kết quả thuật toaacuten di truyền lagrave từ giao phối 2 caacute thể trong quần thế để tạo
ra con caacutei đocirci khi tốt hơn so với bậc cha mẹ của chuacuteng 15Caacutec thagravenh phần cơ bản của thuật toaacuten di truyền
Toaacuten tử chọn lọc Caacutec caacute thể tốt được chọn lọc để đưa vagraveo thế hệ sau Sự chọn lọc nagravey căn cứ vagraveo độ thiacutech nghi với mocirci trường của mỗi caacute thể
Toaacuten tử lai gheacutep (crossover) Hai caacute thể cha vagrave mẹ trao đổi caacutec gen với nhau để tạo ra caacute thể con
Toaacuten tử đột biến (mutation) Một caacute thể thay đổi một số gen để biến đổi thagravenh một caacute thể mớiTất cả caacutec toaacuten tử trecircn khi thực hiện đều mang tiacutenh ngẫu nhiecircn
16Quaacute trigravenh cơ bản của một thuật toaacuten di truyền Khởi tạo
Đaacutenh giaacute quần thể
Lựa chọn NST thiacutech hợp nhất vagrave loại bỏ NST yếu nhất
Quy trigravenh giao nhau vagrave cải thiện quần thể
đột biến tiến trigravenh để khaacutem phaacute ra NST mới
17Ưu nhược điểm của việc kết hợp với thuật toaacuten di truyền Kiacutech thước quần thể lagrave 1 yếu tố quan trọng trong tốc độ của việc tigravem
kiếmnhưng noacute tương đối dễ dagraveng để dự đoaacuten tốc độ nagravey Giao nhau hoặc đột biến lagrave khocircng necircn đc sử dụng quaacute thường xuyecircn Luocircn coacute được iacutet nhất 1 giải phaacutep hợp lyacute Necircn coacute thể aacutep dụng chuacuteng cho caacutec vấn đề magrave chuacuteng ta khocircng coacute hướng
về caacutech giải quyết Sức mạnh của thuật toaacuten xuất phaacutet từ khaacutei niệm đơn giảnkhocircng phải từ
một thủ tục thuật toaacuten phức tạp 18Tương lai của học maacutey
Mạng lưới thần kinh nhacircn tạo vượt quaacute năng lực của con người trong caacutec trường hợp bị cocirc lập
Về mặt lyacute thuyếtmột maacutey tiacutenh coacute thể xử lyacute dũ liệu nhanh hơn hagraveng triệu lần so với 1 con người
May mắn thay cho chuacuteng tacon người tốt hơn nhiều khi magrave coacute được dữ liệumaacutey tiacutenh khocircng coacute 1 số thứ như lagrave 5 giaacutec quan
CHƯƠNG 10 KHO DỮ LIỆU
1 Kho dữ liệu Kho dữ liệu lagrave tuyển tập caacutec cơ sở dữ liệu tiacutech hợp hướng chủ đề được
thiết kế để trợ giuacutep cho một hệ hỗ trợ quyết định
Theo John Ladley Cocircng nghệ kho dữ liệu lagrave tập caacutec phương phaacutep kỹ thuật vagrave caacutec cocircng cụ coacute thể kết hợp hỗ trợ nhau để cung cấp thocircng tin cho người sử dụng trecircn cơ sở tiacutech hợp từ nhiều nguồn dữ liệu nhiều mocirci trường khaacutec nhau
Kho dữ liệu thường rất lớn tới hagraveng trăm GB hay thậm chiacute hagraveng Terabyte
2 Kho dữ liệu vận hagravenh (ODS) Một kho dữ liệu vận hagravenh Aacutep dụng kỹ thuật kho dữ liệu vagraveo caacutec hệ xử
lyacute giao taacutec lưu trữ dữ liệu cho một ứng dụng đặc thugrave Noacute đưa vagraveo kho dữ liệu một dograveng caacutec dữ liệu thocirc được thiết kế
3 So saacutenh
Kho dữ liệu vận hagravenh Kho dữ liệu
Dữ liệu theo chủ đề Dữ liệu theo chủ đề
Dữ liệu tiacutech hợp Dữ liệu tiacutech hợp
Dữ liệu thay đổi Dữ liệu khocircng thay đổi
Dữ liệu được cập nhật khi thay đổi
Dữ liệu giữ nguyecircn
Chỉ coacute dữ liệu hiện tạiDữliệu hiện tại vagrave dữ liệu lịch sử
Chu kỳ lagravem tươi dữ liệu ngắn Chu kỳ lagravem tươi dữ liệu dagravei
Chỉ coacute dữ liệu chi tiết Dữ liệu chi tiết vagrave dữ liệu tổng kết
Dugraveng cho caacutec quyết định ngắn hạn
Dugraveng cho hoạch định dagravei hạn
4 Kho dữ liệu cục bộ (Data Mart - DM)
Kho dữ liệu cục bộ lagrave CSDL coacute những đặc điểm giống với kho dữ liệu nhưng với quy mocirc nhỏ hơn vagrave lưu trữ dữ liệu về một lĩnh vực một chuyecircn ngagravenh
Data mart phụ thuộc Chứa những dữ liệu được lấy từ DW vagrave những dữ liệu nagravey sẽ được triacutech lọc vagrave tinh chế tiacutech hợp lại ở mức cao hơn để phục vụ một chủ đề nhất định của Datamart
Data mart độc lập Khocircng giống như Datamart phụ thuộc Data mart độc lập được xacircy dựng trước DW vagrave dữ liệu được trực tiếp lấy từ caacutec nguồn khaacutec nhau
5 Siecircu dữ liệu Metadata lagrave dữ liệu để mocirc tả dữ liệu Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột
một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi Metadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu
6 Mocirci trường kho dữ liệu Hệ thống của tổ chức vagrave kho cung cấp dữ liệu để xacircy dựng kho dữ liệu Trong quaacute trigravenh chuyển dữ liệu từ caacutec nguồn khaacutec nhau dữ liệu coacute thể
được lagravem sạch hoặc chuyển đổi vagrave vigrave thế DW được xem như lagrave một chuẩn cho việc lưu trữ
Đồng thời siecircu dữ liệu được ghi lại Cuối cugraveng DW hoặc siecircu thị coacute thể được sử dụng để tạo ra một kho dữ
liệu ldquocaacute nhacircnrdquo 7 Caacutec đặc điểm của kho dữ liệu
Đặc điểm Mocirc tả
Hướng chủ đề - DL tổ chức theo caacutech thức người dugraveng tham chiếu
Tiacutech hợp - Dữ liệu ldquosạchrdquo loại bỏ tiacutenh thiếu nhất quaacuten
Khocircng thay đổi - DL ldquochỉ đọcrdquo người dugraveng khocircng thay đổi được
Chuỗi thời gian - DL lagrave chuỗi thời gian khocircng phải lagrave trạng thaacutei hiện tại
Được tổng kết - DL vận hagravenhthao taacutec khi cần thiết
được kết hợp lại thagravenh dạng coacute thể dugraveng được cho quyết định
Kiacutech cỡ lớn hơn - Lưu giữ theo chuỗi thời gian tức lagrave giữ lại nhiều DL
Khocircng được chuẩn hoacutea - Coacute thể dư thừa DLSiecircu dữ liệu - Dữ liệu của dữ liệu được lưu trữNguồn dữ liệu - DL vận hagravenh (caacutec hệ sẵn coacute) cugraveng
với caacutec nguồn ngoagravei 8 Kho dữ liệu hướng chủ đề
Hướng chủ để coacute nghĩa lagrave kho dữ liệu được tổ chức xung quanh caacutec chủ đề chiacutenh như khaacutech hagraveng sản phẩm sản xuất Tập trung vagraveo việc mocirc higravenh hoacutea vagrave phacircn tiacutech dữ liệu cho caacutec nhagrave ra quyết định magrave khocircng tập trung vagraveo caacutec xử lyacute thocircng thường Cung cấp cho người dugraveng một khung nhigraven toagraven vẹn đơn giản vagrave đầy đủ về caacutec sự kiện quanh caacutec chủ đề
9 Dữ liệu trong DW được tiacutech hợp Dữ liệu trong kho dữ liệu được xacircy dựng bằng caacutech tổng hợp dữ liệu từ
nhiều nguồn khaacutec nhau vagrave caacutec nguồn coacute tổ chức khaacutec nhau Cơ sở dữ liệu caacutec file excel caacutec flat file hoặc caacutec raw file Khi đưa vagraveo kho dữ liệu caacutec dữ liệu được lagravem sạch vagrave tiacutech hợp dữ liệu nhằm đảm bảo tiacutenh nhất quaacuten của dữ liệu
10Kiến truacutec kho dữ liệu Tầng cơ sở dữ liệu hoạt động Tầng truy xuất thocircng tin Tầng truy xuất dữ liệu Tầng siecircu dữ liệu Tầng quản lyacute tiến trigravenh Tầng thocircng điệp của ứng dụng Tầng vật liacute của kho dữ liệu Tầng trigravenh diễn dữ liệu
11Higravenh trạng kho dữ liệu Kho dữ liệu ảo - người dugraveng cuối coacute thể truy cập trực tiếp đến kho dữ liệu
sử dụng caacutec cocircng cụ cho pheacutep ở tầng truy xuất dữ liệu Kho dữ liệu trung tacircm-1 cơ sở dữ liệu vật lyacute chứa tất cả dữ liệu cho một
vugraveng chuyecircn dụng nagraveo đoacute
Kho dữ liệu phacircn taacuten- Thagravenh phần được phacircn taacuten qua nhiều hệ cơ sở dữ liệu vật lyacute
12METADATA- Siecircu dữ liệu Định nghĩa Siecircu dữ liệu lagrave dữ liệu về dữ liệu Lagrave 1 lưu trữ dugraveng để
Miecircu tả kho dữ liệu tổng thể Nhận dạng kiểu kho dữ liệu Quản liacute quaacute trigravenh tiacutech hợp dữ liệu Quản liacute quaacute trigravenh cập nhật kho dữ liệu Quản liacute bảo mật
Lagrave chigravea khoacutea quyết định sự thagravenh cocircng của kho dữ liệu luocircn được thay đổi vagrave cập nhật theo sự phaacutet triển của kho dữ liệu
Dugraveng để quản liacute điều khiển kho dữ liệu Sự ra đời của kho dữ liệu như 1 cấu truacutec hỗ trợ ra quyết định siecircu dữ liệu
được xem như nguồn tagravei nguyecircn dữ liệu Siecircu dữ liệu lagrave trừu tượng Chuacuteng lagrave dữ liệu bậc cao cung cấp mocirc tả ngắn
gọn caacutec dữ liệu bậc thấp hơn 13Hoạt động của Siecircu dữ liệu
Siecircu dữ liệu rất cần thiết trong việc chuyển hoacutea thocircng tin trở thagravenh tri thức Lagrave chigravea khoacutea giuacutep chuacuteng ta xử lyacute được dữ liệu thocirc Viacute dụ một dograveng dữ liệu baacuten hagraveng 1023 K596 11121 agraveNoacute sẽ khocircng coacute nghĩa gigrave cho đến khi chuacuteng ta đưa vagraveo siecircu dữ liệu (thư
mục chứa dữ liệu) agrave cửa hagraveng 1023 sản phẩm K596 vagrave số tiền baacuten được lagrave 11121 đocirc la
14Sự cần thiết phải nhất quaacuten trong kho dữ liệu Kho dữ liệu được xacircy dựng cho lợi iacutech của những nhagrave phacircn tiacutech kinh
doanh caacutec nhagrave quản trị cho tất cả caacutec khu vực chức năng Trong cơ sở dữ liệu riecircng caacutec khu vực khaacutec nhau coacute thể định nghĩa vagrave lưu
trữ dữ liệu thocircng qua phiecircn bản của chiacutenh noacute Khi dữ liệu được lấy từ những vugraveng khaacutec nhau đoacute vagrave được đặt vagraveo kho dữ
liệu Việc chuyển đổi vagrave lagravem sạch caacutec tiến trigravenh sẽ đảm bảo noacute lagrave duy nhất được tiacutech hợp tại một mức của tổ chức
15Ragrave soaacutet lại dữ liệu ndash Thực thi siecircu dữ liệu
Bất kể cấu truacutec tự nhiecircn của 1 cacircu truy vấn thế nagraveo thigrave caacutec thagravenh phần của siecircu dữ liệu rất quan trọng đối với người ra quyết định
Bảng thuộc tiacutenh khoacutea được lưu trữ bởi kho dữ liệu Tập hợp dữ liệu được lấy từ đacircu Những chuyển đổi nagraveo được thực thi với việc lagravem sạch
16Siecircu dữ liệu lagrave gigrave Metadata - lagrave thocircng tin mocirc tả nội dung của cơ sở dữ liệu (CSDL) Metadata baacuteo cho người dugraveng biết thời gian cập nhật sau cugraveng của dữ liệu
định dạng vagrave mục điacutech sử dụng của noacute Những thocircng tin nagravey coacute thể hướng dẫn người dugraveng duyệt qua CSDL vagrave
giuacutep họ hiểu được yacute nghĩa vagrave ngữ cảnh của dữ liệu Trong CSDL metadata lagrave caacutec dạng biểu diễn khaacutec nhau của caacutec đối tượng
trong CSDL Trong CSDL quan hệ metadata lagrave caacutec định nghĩa của bảng cột CSDL
view vagrave nhiều đối tượng khaacutec Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột
một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi -gtMetadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu
Bảng chuyển đổi Ghi lại những chuyển đổi đatilde được thực hiện
Lịch sử thực thi Ghi lại những dữ liệu đatilde được
phacircn tiacutech
Higravenh thaacutei kết nốiGhi lại những dữ liệu được kết nối vagrave tần suất
17Aacutenh xạ thocircng thường của siecircu dữ liệu Bản ghi aacutenh xạ chuyển đổi bao gồm
Định danh của nguồn gốc Chuyển đổi thuộc tiacutenh Chuyển đổi thuộc tiacutenh vật lyacute Matilde hoacutea tham chiếu bảng chuyển đổi Đổi tecircn Đổi khoacutea Gaacuten giaacute trị cho thuộc tiacutenh mặc định Chọn logic cho caacutec nguồn nhiều giaacute trị Đổi thuật toaacuten
18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để
phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai
lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave
tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec
Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm
Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo
19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua
caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau
SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được
Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra
một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức
Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ
Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ
Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech
CHƯƠNG 11 KHAI PHAacute DỮ LIỆU
1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn
ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993
Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng
2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd
1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều
2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP
3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn
4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng
5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server
6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo
7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động
8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời
9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều
10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện
11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech
12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP
3 Xử lyacute phacircn tiacutech trực tuyến OLAP
MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave
dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu
ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave
thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu
HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave
ROLAP4 Khai phaacute dữ liệu
Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh
khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn
Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan
5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp
6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại
Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp
Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec
Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt
Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra
Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh
vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho
Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec
Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm
Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục
Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng
gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp
Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn
Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec
Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper
Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2
Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25
Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước
Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng
Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện
trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp
Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute
độ hỗ trợ ge ngưỡng minsup
độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan
Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn
Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết
Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu
MOLAP ROLAP HOLAP
Lưu trữ dữ liệu cơ sở
Khối Bảng quan hệ Bảng quan hệ
Lưu trữ thocircng tin tổng hợp
Khối Bảng quan hệ Khối
Hiệu suất thực hiện truy vấn
Nhanh nhất Chậm nhất Nhanh
Tiecircu thụ khocircng gian lưu trữ
Nhiều Thấp Trung bigravenh
Chi phiacute bảo trigrave Cao Thấp Trung bigravenh
Thocircng thường giao diện cagraveng gần gũi thigrave cagraveng iacutet đogravei hỏi việc huấn luyện người dugraveng Hatildey suy nghĩ xem coacute bao nhiecircu chương trigravenh Windows dugraveng cugraveng cấu truacutec menu như Microsoft Word
Caacutec chức năng chiacutenh của một giao diện của DSS Communication language vagrave Presentation language
Communication language ndash Cho pheacutep tương taacutec với DSS theo nhiều caacutech xaacutec định caacutec dạng input cung cấp caacutec hỗ trợ cho người dugraveng thu giữ caacutec hội thoại đatilde qua để cải thiện caacutec tương taacutec trong tương lai
Presentation language ndash Cung cấp khả năng thể hiện dữ liệu theo nhiều caacutech cho pheacutep sinh caacutec baacuteo caacuteo chi tiết cung cấp nhiều khung nhigraven khaacutec nhau về dữ liệu
7Vai trograve người dugraveng Trong một DSS người dugraveng cũng lagrave một thagravenh phần của hệ thống giống như
hardware vagrave software User roles Người dugraveng được phacircn thagravenh 5 lớp (decision maker
intermediary maintainer operator and feeder) Patterns of DSS use Lagrave sự phacircn loại tiến theo của caacutec user roles khaacutec nhau
thagravenh 1 trong 4 basic patterns of use Slide tiếp theo sẽ mocirc tả caacutec patterns nagravey
8Caacutec mocirc higravenh sử dụng DSS Subscription mode _nhagrave sản xuất quyết định nhận caacutec baacuteo caacuteo thường
xuyecircn theo dự kiến Terminal mode_ nhagrave sản xuất quyết định tương taacutec trực tiếp với DSS Clerk mode - nhagrave sản xuất quyết định sử dụng hệ thống trực tiếpnhưng
khocircng trực tuyến Đầu ra phản hồi coacute thể mất một thời gian Intermediary mode - nhagrave sản xuất quyết định tương taacutec thocircng qua việc sử
dụng mộthoặc nhiều mocirc higravenh trung gian9Danh mục vagrave lớp của DSSCoacute nhiều phương phaacutep để cố gắng phacircn loại caacutec DSSs
Data-centric and model-centric Formal and ad hoc systems Directed versus nondirected DSSs Procedural and nonprocedural systems Hypertext systems Spreadsheet systems Individual and group DSSs
Caacutec đặc trưng thống nhất của mỗi lược đồ cụ thể giữ vai trograve quan trọng trong việc xaacutec định caacutech tiếp cận tốt nhất để thiết kế một hệ thống mới
Chương 2Quyết định vagrave quyết định của nhagrave sản xuất10Quaacute trigravenh ra quyết định
Quaacute trigravenh ra quyết định gồm coacute 3 giai đoạn (Simon 1977)bull Tigravem hiểu bagravei toaacuten dẫn đến quyết định
+Xaacutec định mục tiecircu tổ chức+Tigravem kiếm vagrave tập hợp dữ liệu+Nhận diện xaacutec định chủ thể bagravei toaacuten+phacircn loại vagrave phaacutet biểu vấn đề
bull Thiết kế (design) phacircn tiacutech vagrave xacircy dựng caacutec diễn trigravenh hagravenh động+Thiết lập mocirc higravenh+Lập bảng tiecircu chuẩn chọn lựa+Tigravem kiếm caacutec phương aacuten+Tiecircn đoaacuten vagrave đo lường caacutec kết cục
bull Chọn lựa (choice) chọn một diễn trigravenh trong tập diễn trigravenh+Giải phaacutep cho mocirc higravenh+Phacircn tiacutech độ nhạy+Chọn (caacutec) phương aacuten tốt nhất+Hoạch định việc hiện thực
tiếp theo giai đoạn chọn lựa lagrave giai đoạn hiện thực (implementation)11Người ra quyết định
Người ra quyết định (decision maker) giữ một vai trograve tacircm thần phacircn liệt vigrave vừa được coi lagrave một bước trong quaacute trigravenh vagrave cũng lại lagrave người tham gia
Phacircn lớp người ra quyết định-Quyết định caacute nhacircn coacute thể lagrave 1 người hoặc một hệ thống maacutey tiacutenh đơn lẻ-Nhiều người ra quyecirct định coacute thể lagrave
+Nhoacutem (group)trong đoacute mọi thagravenh viecircn đều coacute tiếng noacutei trong việc ra quyết định
+Đội(team) Caacutec thagravenh viecircn hỗ trợ một người ra quyết định duy nhất+Tổ chứcTrong đoacute cần sự thỏa thuận chung
12Caacutec kiểu ra quyết định Style lagrave caacutech magrave người quản lyacute ra quyết định
Hiệu lực của mỗi style riecircng biệt phụ thuộc vagraveo ngữ cảnh bagravei toaacuten nhận thức của người ra quyết định vagrave tập caacutec giaacute trị caacute nhacircn của bản thacircn họ
Độ phức tạp của caacutec điều đoacute liecircn kết lại với nhau trong việc higravenh thagravenh decision style
Caacutec kiểu ra quyết định Directive ndash kết hợp đogravei hỏi về cấu truacutec bagravei toaacuten cao với mức độ nhập nhằng thấp
Thocircng thường đacircy lagrave caacutec quyết định coacute bản chất kỹ thuật vagrave đogravei hỏi iacutet thocircng tin Analytical ndash Mức độ nhập nhằng lớn hơn vagrave đogravei hỏi nhiều thocircng tin hơn Conceptual ndash Mức độ nhập nhằng cao vagrave thường gần gũi với caacutech ra quyết định
của con người Behavioral ndash đogravei hỏi lượng dữ liệu nhỏ vagrave thể hiện caacutei nhigraven ngắn hạn Thường
xảy ra xung đột necircn phải dựa vagraveo sự đồng thuận Caacutec kiểu ra quyết định trong thiết kế hệ trợ giuacutep quyecirct định
Những cản trở lớn chiacutenh lagrave phản ứng của người ra quyết định trước aacutep lực vagrave phương phaacutep dugraveng để giải bagravei toaacuten
Viacute dụ đối với những người khocircng chịu được aacutep lực trong dạng directive thigrave giao diện cần cho pheacutep người ra quyết định kiểm soất được hệ thống với khocircng coacute quaacute nhiều dữ liệu đầu vagraveo
Đối với kiểu analytic DSS cần cho pheacutep truy cập tới nhiều nguồn dữ liệu magrave người ra quyết định sẽ phacircn tiacutech
13Khoacute khăn khi xacircy dựng DSS
- Thocircng tin mocirc higravenh cấu truacutec -gt iacutet thocircng tin
- Khả năng của con người (khả năng hiểu biết) chỉ xử lyacute được từ 5-gt9 quaacute trigravenh thocircng tin khaacutec nhau
- Khocircng chắc chắn ( mức độ hoagraven thagravenh vagrave tiacutenh chiacutenh xaacutec)
- Coacute nhiều lựa chọn vagrave đa mục tiecircu
Chương 3Quyết định trong tổ chức
14Tổ chức lagrave gigrave Tổ chức Lagrave 1 hệ thống thống nhất caacutec nguồn tagravei nguyecircnĐược cấu thagravenh bởi caacutec
hệ thống nhỏ hơn ragraveng buộc với nhau bởi caacutec mục tiecircu đề ra
Tổng thể 1 tổ chức sẽ mạnh mẽ hơn rất nhiều so với tất cả caacutec thagravenh phần của noacute cộng lại
Mối liecircn hệ của caacutec quyecirct định Mục điacutech chiacutenh của caacutec tổ chức lagrave đưa ra caacutec quyết định trong mocirci trường kinh doanh Caacutec Quyết định phải phugrave hợp với giới hạncaacutec chiacutenh saacutech caacutec thủ tục vagrave lĩnh vực hoạt động Noacute khocircng phụ thuộc vagraveo người đưa ra quyết định lagrave ai Đoacute coacute thể lagrave 1 caacute nhacircn1 nhoacutem hay thậm chiacute DSSs
Độ đo của quyết địnhNăm khiacutea cạnh ảnh hưởng tới Quyết định
Kết cấu nhoacutem (Group Structure) Vai trograve trong nhoacutem(Group Roles) Quaacute trigravenh lagravem việc(Group Processes) Taacutec phong(Group Style) Quy tăc nhoacutem(Group Norm)
Kết cấu nhoacutem Trong 1 nhoacutem chuẩn caacutec thagravenh viecircn coacute traacutech nhiệm vagrave thẩm quyền ra quyết định như nhau Vai trograve trong nhoacutemTrong nhoacutem caacutec thagravenh viecircn đều coacute vai trograve riecircng vagrave
lagrave 1 phần quan trong trong cả tiến trigravenh Quaacute trigravenh lagravem việcQuaacute trigravenh dugraveng người trong nhoacutem ảnh hưởng tới loại
quyết định gacircy hiệu quả vagrave ảnh hưởng tới cả tiến trigravenh Taacutec phong Coacute phải taacutec phong của người ra quyết định coacute ảnh hưởng tới
chất lượng quyết định cuối khocircng Quy tắc nhoacutemQuy tắc nhoacutem lagrave cực kỳ quan trọng trong việc xaacutec định
hagravenh vi caacutec thagravenh viecircn nhoacutem trong caacutec tigravenh huống xatilde hội Phacircn cấp quyết định trong tổ chức3 cấp
Chiến lược Ban latildenh đạo cấp cao hoặc nhagrave quản lyacute Caacutec quyết định mang tiacutenh lacircu dagravei nhất
Chiến thuật Quản lyacute tầm trung Thực thi caacutec quyết định chiến lược đề ra
Thực hiện
Caacute nhacircn chuyecircn ngagravenh Tự đưa ra caacutec quyết định từng ngagravey
15Năng lực của hệ HTQD
1 HHTQĐ cơ bản hỗ trợ caacutec nhagrave ra quyết định trong caacutec tigravenh huống nửa cấu truacutec vagrave phi cấu truacutec bằng caacutech kết hợp phaacuten xử của con người vagrave xử lyacute thocircng tin bằng maacutey tiacutenh Caacutec bagravei toaacuten như vậy khocircng thểkhocircng thuận tiện giải quyết được chỉ bằng caacutec cocircng cụ maacutey tiacutenh hoacutea hay caacutec phương phaacutep định lượng 2 Phugrave hợp cho caacutec cấp quản lyacute khaacutec nhau từ cao đến thấp 3 Phugrave hợp cho caacute nhacircn lẫn nhoacutem Caacutec bagravei toaacuten iacutet coacute tiacutenh cấu truacutec thường liecircn đới đến nhiều caacute nhacircn ở caacutec đơn vị chức năng hay mức tổ chức khaacutec nhau cũng như ở caacutec tổ chức khaacutec 4 Hỗ trợ cho caacutec quyết định tuần tự liecircn thuộc được đưa ra một lần vagravei lần hay lặp lại 5 Hỗ trợ cho caacutec giai đoạn của quaacute trigravenh ra quyết định tigravem hiểu thiết kế lựa chọn vagrave hiện thực 6 Phugrave hợp cho một số caacutec phong caacutech vagrave quaacute trigravenh ra quyết định 7 Coacute thể tiến hoacutea theo thời gian Người dugraveng coacute thể thecircm bỏ kết hợp thay đổi caacutec phần tử cơ bản của hệ thống 8 Dễ dugraveng vagrave thacircn thiện với người dugraveng 9 Nhằm vagraveo nacircng cao tiacutenh hiệu dụng của quyết định (chiacutenh xaacutec thời gian tiacutenh chất lượng) thay vigrave lagrave tiacutenh hiệu quả (giaacute phiacute của việc ra quyết định) 10 Người ra quyết định kiểm soaacutet toagraven bộ caacutec bước của quaacute trigravenh ra quyết định HHTQĐ chỉ trợ giuacutep khocircng thay thế người ra quyết định 11 Người dugraveng cuối cugraveng coacute thể tự kiến tạo vagrave sửa đổi caacutec hệ thống nhỏ vagrave đơn giản 12 Thường dugraveng mocirc higravenh để phacircn tiacutech caacutec tigravenh huống ra quyết định 13 Cung ứng caacutec truy đạt dữ liệu từ nhiều nguồn dạng thức vagrave kiểu khaacutec nhau 14 Coacute thể dugraveng như một cocircng cụ độc lập hay kết hợp với caacutec HHTQĐứng dụng khaacutec dugraveng đơn lẻ hay trecircn một mạng lưới maacutey tiacutenh (intranet extranet) bất kỳ với cocircng nghệ WEB
16Văn hoacutea tổ chứcVăn hoacutea của tổ chức lagrave tập hợp của rất nhiều thứ (lograveng tin biểu tượng đặc trưng regraven luyện) được phaacutet triển qua thời gian dagravei
Noacute gacircy ra ảnh hưởng mạnh mẽ cograven hơn cả những hoạt động của tổ chức đoacute 10 đặc điểm văn hoacutea của tổ chức
Điều khiển Hệ thống khen thưởng Sự đồng nhất Chịu đựng xung đột Mocirc higravenh giao tiếp Hỗ trợ quản lyacute Sự hogravea nhập Định hướng Chịu đựng rủi ro Caacute nhacircn khởi xướng
Mối quan hệ của văn hoacutea với hiệu năng lagravem việc1 tổ chức thagravenh cocircng phải coacute xu hướng hogravea hợp giữa văn hoacutea với mocirci trường trong vagrave ngoagravei tổ chức
Phugrave hợp trong nội bộ cho thấy một sự kết hợp giữa văn hoacutea của tổ chức với những cocircng nghệ của chiacutenh noacute
Phugrave hợp với becircn ngoagravei cho thấy một nền văn hoacutea phugrave hợp với chiến lược thị trường
Văn hoacutea vagrave sự thay đổi 1 tổ chức magrave khocircng biết thay đổi văn hoacutea sẽ khocircng thể giữ được vị triacute của migravenh trecircn thị trường Caacutec cocircng ty xuất sắc luocircn biết caacutech tiacutech cực tiếp cận khaacutech hagraveng động viecircn đầu tư
17Quyền lực vagrave chiacutenh trịQuyền lực vagrave chiacutenh trị luocircn đi liền với nhau
aQuyền lựclagrave khả năng ảnh hưởng đến việc phacircn phối caacutec nguồn lực trong tổ chứcGồm 5 yếu tố cơ bản
Phacircn quyền Uy quyền Quyền lực caacute nhacircn Sức ảnh hưởng Chiacutenh trị
Một vagravei thagravenh phần của quyền lực ra quyết định Quyết định việc nagraveo coacute sẵn
Quyết định sản phẩm nagraveo được sản xuất Quyết định đầu tư vagraveo đacircu Quyền đặt vagrave quản lyacute quản lyacute giaacute Thanh toaacuten vagrave khấu trừ tiền latildei
bChiacutenh trị Yếu tố cốt lotildei trong quaacute trigravenh higravenh thagravenh chiến lược ra quyết định Chiacutenh trị liecircn quan tới việc ra quyết định thocircng qua đagravem phaacutenảnh hưởngvagrave higravenh
thagravenh sự nhất triacute Trong nhiều trường hợp noacute coacute thể cho ta sự linh hoạt hơn
18Hệ trợ giuacutep quyết định trong tổ chức DSS của 1 tổ chức hỗ trợ cocircng nghệ tập trung vagraveo caacutec quyết định ảnh hưởng tới
rất nhiều người 1 hệ thống DSS hiện đại coacute thể chấp nhận nhiều quyết định vượt qua những giới
hạn phacircn cấp truyền thống aCaacutec hoạt động gần DSS
Giải quyết caacutec nhiệm vụ đặc biệt Thu thập thocircng tin Liecircn lạc qua caacutec chi nhaacutenh Động thaacutei chiacutenh trị
Phacircn loại tư duy chiến lược cho DSS Sắp xếp quyết địnhXếp hạng quyết định sao cho thứ tự đứng trước thigrave được
ưu tiecircn trước Chia sẻ thocircng tinCaacutec quyecirct định coacute thể độc lập nhưng người ra quyết định
phải chia sẻ caacutec thocircng tin liecircn quan Lựa chọn đagravem phaacutenVagravei quyết định coacute thể xaacutec lập thocircng qua đagravem phaacuten vagrave kết
quả được lagravem đồng thờiKhocircng phải cocircng nghệ tự noacute coacute thể đưa ra quyết định magrave noacute nằm ở trigravenh độ cocircng nghệ hỗ trợ caacutec chiến lược quyết định quyền lực vagrave chiacutenh trị cugraveng phối hợp với nhau
Chương 4Mocirc higravenh hoacutea quaacute trigravenh ra quyết định
(Cấu truacutec của hệ HTQD)19Vấn đề Mocirc higravenh
bull Lagrave phần tử chủ chốt trong hầu hết hệ hỗ trợ quyết định vagrave lagrave điều kiện cần trong hệ hỗ trợ quyết định dựa vagraveo mocirc higravenh (model-based DSS)
bull Coacute nhiều lớp mocirc higravenh kegravem theo lagrave caacutec kỹ thuật xử lyacute thao taacutec mocirc higravenh đặc thugrave tương ứng
bull Caacutec vấn đề chiacutenh nhận diện bagravei toaacuten vagrave phacircn tiacutech mocirci trường nhận diện biến số dự baacuteo đa mocirc higravenh caacutec phạm trugrave mocirc higravenh quản lyacute mocirc higravenh vagrave mocirc higravenh hoacutea dựa vagraveo kiến thức
bull Mocirc higravenh hoacutea lagrave taacutec vụ khocircng đơn giản Người xacircy dựng mocirc higravenh phải cacircn bằng giữa tiacutenh đơn giản của mocirc higravenh với caacutec yecircu cầu biểu diễn để mocirc higravenh coacute thể nắm bắt đủ thực tại cần thiết cho người ra quyết định
bull Mocirc phỏng lagrave kỹ thuật mocirc higravenh hoacutea thocircng dụng dugraveng để tigravem hiểu vấn đề tuy khocircng nhất thiết phải tigravem ra được caacutec giải phaacutep biến thể mở rộng quaacute trigravenh ra quyết định của tổ chức vagrave cho pheacutep tổ chức xem xeacutet taacutec độngảnh hưởng của caacutec chọn lựa tương lai
bull Mocirc phỏng tiết kiệm rất nhiều chi phiacute vagrave thời gian ndash rất dễ thay đổi mocirc higravenh hoạt động của một hệ thống vật lyacute bằng mocirc higravenh hoacutea maacutey tiacutenh
bull Mocirc higravenh coacute thể được phaacutet triển vagrave cagravei đặt bằng một số caacutec ngocircn ngữ lập trinh (thế hệ 3 4 ) vagrave hệ thống phần mềm khaacutec nhau
Mocirc higravenh tĩnh vagrave động
bull Mocirc higravenh tĩnh thể hiện bức tranh tại thời điểm của tigravenh huống Caacutec khiacutea cạnh của bagravei toaacuten được xeacutet một thời kỳ nhất định trong một khung thời gian nhất định (coacute thể ldquocuốnrdquo về tương lai) Caacutec tigravenh huống được giả sử lagrave sẽ lập lại với tập caacutec điều kiện đồng nhất
1048713 Giả định coacute được tiacutenh ổn định của dữ liệu 1048713 Mocirc phỏng quaacute trigravenh dạng tĩnh - lagravem việc trecircn caacutec trạng thaacutei ổn định để tigravem ra caacutec
thocircng số tối ưu ndash thường được dugraveng như cocircng cụ chủ yếu để thiết kế quaacute trigravenh 1048713 vd quyết định sản xuấtmua 1 sản phẩm baacuteo caacuteo thu nhập hagraveng quyacutenăm bull Mocirc higravenh động biểu diễn caacutec kịch bản thay đổi theo thời gian 1048713 Phụ thuộc thời gian caacutec trạng thaacutei thay đổi theo thời gian 1048713 Thường dugraveng để tạo sinh vagrave biểu diễn caacutec xu hướng vagrave khuocircn mẫu theo thời gian 1048713 Mocirc phỏng động thể hiện caacutec diễn tiến khi caacutec điều kiện theo thời gian khaacutec với caacutec
trạng thaacutei ổn định ndash thường được dugraveng để thiết kế việc kiểm soaacutet caacutec hệ thống 1048713 VD dự baacuteo lời-lỗ trong 5 năm với caacutec nhập lượng như giaacute phiacute số lượng thay đổi
theo từng năm
Mocirc higravenh chắc chắn tương đối dễ phaacutet triển giải quyết vagrave coacute thể sinh ra caacutec giải phaacutep tối ưu 1048713 Caacutec bagravei toaacuten coacute một số lớnvocirc hạn caacutec giải phaacutep khả thi đặc biệt quan trọng 1048713 Caacutec mocirc higravenh tagravei chaacutenh được xacircy dựng trong điều kiện chắc chắn
Mocirc higravenh bất địnhbằng caacutech thu thập thecircm thocircng tin cố gắng đưa bagravei toaacuten trở về dạng chắc chắn hay dạng
rủi ro Mocirc higravenh rủi ro caacutec quyết định kinh doanh được đưa ra dưới caacutec rủi ro giả định
1048713 Đocirci khi biết được xaacutec suất của caacutec sự kiện xảy ra trong tương lai 1048713 Caacutec trường hợp khaacutec (bất định) ước lượng caacutec rủi ro vagrave giả sử caacutec tigravenh huống rủi ro
xảy ra 20Mocirc higravenh hoacutea
MOcirc HIgraveNH HOacuteA BẰNG BẢNG TIacuteNH bull Bảng tiacutenh phần mềm mạnh linh hoạt vagrave dễ dugraveng cho pheacutep tạo sinh caacutec ứng dụng trong kinh doanh kỹ thuật toaacuten vagrave khoa học với tập caacutec hagravem mạnh về tagravei chaacutenh thống kecirc toaacuten bull Kegravem theo lagrave caacutec thagravenh phần cộng thecircm (add-ins) giuacutep xacircy dựng vagrave giải caacutec lớp mocirc higravenh đặc thugrave bull Lagrave cocircng cụ mocirc higravenh hoacutea thocircng dụng nhất của người dugraveng cuối cugraveng bull Coacute caacutec chức năng về phacircn tiacutech ldquowhat-ifrdquo dograve tigravem mục tiecircu quản lyacute dữ liệu vagrave lập trigravenh (dạng macro) bull Coacute khả năng đọc ghi caacutec cấu truacutec tập tin thocircng dụng để giao tiếp được với caacutec CSDL vagrave cocircng cụ khaacutec bull Coacute thể xacircy dựng mocirc higravenh tĩnh vagrave động bull Dugraveng trecircn maacutey tiacutenh caacute nhacircn vagrave maacutey tiacutenh lớn
bull Cơ sở để xacircy dựng caacutec bảng tiacutenh đa chiều vagrave caacutec cocircng cụ xử lyacute phacircn tiacutech trực tuyến (OLAP) MOcirc HIgraveNH HOacuteA BẰNG PHAcircN TIacuteCH QUYẾT ĐỊNH bull Tiếp cận mocirc higravenh hoacutea caacutec tigravenh huống quyết định coacute một số hữu hạnkhocircng quaacute nhiều caacutec phương aacuten ndash mỗi phương aacuten được trigravenh ra dưới dạng bảng hay đồ thị - caacutec kết quả tương ứng (dự baacuteo được kegravem xaacutec suất) theo mục tiecircu bagravei toaacuten ndash từ đoacute chọn phương aacuten tốt nhất bull Đơn mục tiecircu bảng quyết định hay cacircy quyết định bull Đa mục tiecircu AHP (analytic hierarchy process) khaacutec
MOcirc HIgraveNH HOacuteA BẰNG QUY HOẠCH TOAacuteN
bull Quy hoạch toaacuten học (mathematical programming) lagrave họ caacutec cocircng cụ giải quyết caacutec bagravei toaacuten quản lyacute theo đoacute người ra quyết định phải cấp phaacutet caacutec tagravei nguyecircn khan hiếm cho caacutec hoạt động cạnh tranh nhau (caacutec phương aacuten) nhằm tối ưu hoacutea mục tiecircu coacute khả năng đo lường được bull Caacutec mocirc higravenh quy hoạch tuyến tiacutenh (linear programming) thocircng dụng nhất trong quy hoạch toaacuten coacute nhiều ứng dụng trong thực tế được dugraveng nhiều trong caacutec hệ hỗ trợ quyết định bull Bagravei toaacuten quy hoạch tuyến tiacutenh 1048713 Caacutec biến quyết định (cần tigravem giaacute trị) 1048713 Hagravem mục tiecircu (hagravem toaacuten học dạng tuyến tiacutenh xaacutec định quan hệ giữa biến quyết định vagrave mục tiecircu đo lường mức độ đạt đạt mục tiecircu vagrave cần được tối ưu hoacutea) 1048713 Caacutec hệ số của hagravem mục tiecircu (cho biết mức đoacuteng goacutep vagraveo mục tiecircu của 1 đơn vị biến quyết định) 1048713 Ragraveng buộc (biểu thức tuyến tiacutenh cho biết giới hạn tagravei nguyecircn vagravehay caacutec quan hệ giữa caacutec biến số) 1048713 Dung lượng (mocirc tả cận trecircn vagrave dưới của caacutec biến vagrave ragraveng buộc) 1048713 Hệ số (cocircng nghệ) vagraveo-ra (cho biết mức độ sử dụng tagravei nguyecircn của biến quyết định) bull Đặc điểm của bagravei toaacuten quy hoạch tuyến tiacutenh 1048713 Tagravei nguyecircn kinh tế của bagravei toaacuten lagrave coacute hạn vagrave sẵn sagraveng 1048713 Coacute nhiều caacutech (gt2 caacutech) sử dụng tagravei nguyecircn được gọi lagrave giải phaacutep hay chương trigravenh 1048713 Mỗi hoạt động dugraveng tagravei nguyecircn đều sinh ra kết quả dưới dạng mục tiecircu đatilde phaacutet biểu trước 1048713 Việc cấp phaacutet nằm trong caacutec ragraveng buộc cho trước bull Giả định của bagravei toaacuten quy hoạch tuyến tiacutenh 1048713 Caacutec kết quả của caacutec cấp phaacutet coacute thể đem so saacutenh với nhau coacute thể đo lường bằng một đơn vị chung
1048713 Caacutec cấp phaacutet độc lập với nhau về mặt kết quả 1048713 Kết quả cuối cugraveng lagrave tổng của caacutec kết quả từ caacutec hoạt động riecircng rẽ khaacutec nhau 1048713 Dữ liệu coacute tiacutenh chắc chắn 1048713 Tagravei nguyecircn được dugraveng một caacutech kinh tế nhất 1048713 Thường coacute một số lớn caacutec giải phaacutep với kết quả khaacutec nhau 1048713 Trong số caacutec giải phaacutep coacute thể coacute 1 giải phaacutep tốt nhất ndash mức độ đạt được mục tiecircu cao nhất ndash gọi lagrave giải phaacutep tối ưu được tigravem ra bằng một giải thuật đặc biệt MOcirc HIgraveNH HOacuteA BẰNG HEURISTIC bull Việc tigravem giải phaacutep tối ưu của một số bagravei toaacuten quyết định phức tạp coacute thể tốn nhiều thời gian chi phiacute hay khocircng thể tigravem ra được Cograven nếu dugraveng tiếp cận mocirc phỏng cũng coacute thể keacuteo dagravei phức tạp khocircng thiacutech hợp hay thậm chiacute khocircng chiacutenh xaacutec
bull Lagrave một tiếp cận giuacutep tigravem ra caacutec giải phaacutep khả thithỏa matildenđủ tốt cho caacutec bagravei toaacuten phức tạp Coacute thể coacute giải phaacutep đủ tốt (90-999 giaacute trị của lời giải tối ưu) nhanh choacuteng vagrave đỡ tốn keacutem hơn bằng caacutech dugraveng heuristics bull Quaacute trigravenh heuristic lagrave datildey caacutec bước xacircy dựng caacutec quy luật giải quyết vấn đề thocircng qua việc tigravem kiếm caacutec con đường hứa hẹn nhất dẫn đến lời giải tigravem kiếm caacutech thức thu thập vagrave phacircn giải thocircng tin theo quaacute trigravenh giải vagrave phaacutet triền caacutec phương phaacutep dẫn đến một giải thuật tiacutenh toaacuten hay một lời giải tổng quaacutet đatilde coacute bull Aacutep dụng chủ yếu cho bagravei toaacuten cấu truacutec yếu cũng dugraveng để tigravem ra giải phaacutep chấp nhận được cho bagravei toaacuten cấu truacutec chặt bull Khocircng đủ tổng quaacutet như caacutec giải thuật thường chỉ dugraveng cho tigravenh huống đặc thugrave đang xeacutet bull Coacute thể dẫn đến một giải phaacutep dở - caacutec thủ tục từng bước giải quyết vấn đề khocircng đảm bảo tigravem ra giải phaacutep tối ưu bull Heuristic coacute thể lagrave định lượng vigrave vậy coacute thể đoacuteng vai trograve quan trọng trong cơ sở mocirc higravenh của hệ hỗ trợ quyết định bull Heuristic coacute thể lagrave định tiacutenh vigrave vậy coacute thể đoacuteng vai trograve quan trọng trong cung ứng kiến thức cho hệ chuyecircn gia bull Quaacute trigravenh heuristic liecircn quan đến tigravem kiếm học tập ước lượng phacircn xử vagrave lặp lại caacutec hoạt động nagravey dọc theo tiến trigravenh bull Kiến thức thu được dugrave thagravenh cocircng hay thất bại trong quaacute trigravenh đều được phản hồi vagrave sửa đổi chiacutenh quaacute trigravenh nhờ đoacute coacute thể định nghĩa lại mục tiecircu hay bagravei toaacuten 1048713 Giải thuật di truyền bắt đầu bằng tập caacutec giải phaacutep được sinh ngẫu nhiecircn taacutei kết hợp caacutec cặp giải phaacutep một caacutech ngẫu nhiecircn bull Tigravenh huống necircn dugraveng heuristics 1048713 Dữ liệu đầu vagraveo khocircng chiacutenh xaacutec hay coacute giới hạn 1048713 Thực tế quaacute phức tạp đến nỗi khocircng dugraveng được caacutec mocirc higravenh tối ưu 1048713 Chưa coacute được giải thuật chiacutenh xaacutec vagrave đủ tin cậy 1048713 Bagravei toaacuten phức tạp necircn sẽ khocircng kinh tế nếu dugraveng tối ưu hay mocirc phỏng hoặc tốn quaacute nhiều thời gian tiacutenh toaacuten 1048713 Coacute thể cải thiện tiacutenh hiệu quả của quaacute trigravenh tối ưu (tức coacute thể sinh ra caacutec giải phaacutep ban đầu tương đối tốt) 1048713 Liecircn quan đến xử lyacute kyacute hiệu chứ khocircng phải xử lyacute kyacute số (như hệ chuyecircn gia) 1048713 Cần coacute quyết định nhanh vagrave caacutec xử lyacute dựa vagraveo maacutey tiacutenh đều khocircng khả thi (một số heuristic khocircng cần đến maacutey tiacutenh) bull Thuận lợi 1048713 Dễ hiểu dễ giải thiacutech vagrave dễ cagravei đặt 1048713 Nacircng cao tiacutenh saacuteng tạo vagrave năng lực heuristic cho caacutec vấn đề khaacutec 1048713 Tiết kiệm thời gian xaacutec lập vấn đề 1048713 Tiết kiệm yecircu cầu về bộ chứa vagrave xử lyacute maacutey tiacutenh
1048713 Tiết kiệm thời gian tiacutenh toaacuten vagrave do vậy tiết kiệm thời gian thực trong ra quyết định Một số vấn đề phức tạp đến nỗi chỉ coacute thể giải được bằng heuristics 1048713 Thường sinh ra nhiều giải phaacutep chấp nhận được 1048713 Thường coacute thể phaacutet biểu lyacute thuyết hay đo lường thực nghiệm về chất lượng của giải phaacutep (tức giaacute trị mục tiecircu của giải phaacutep gần với giaacute trị tồi ưu đến mức nagraveo dugrave giaacute trị tối ưu chưa biết được) 1048713 Coacute thể kết hợp tiacutenh thocircng minh vagraveo để hướng dẫn pheacutep tigravem kiếm (tigravem kiếm tabu) Năng lực thocircng minh đoacute coacute thể lagrave đặc thugrave theo bagravei toaacuten hoặc dựa trecircn yacute kiến chuyecircn gia được cấy trong hệ chuyecircn gia hoặc cơ chế tigravem kiếm 1048713 Coacute thể dugraveng heuristic hiệu quả vagraveo caacutec mocirc higravenh coacute thể giải bằng quy hoạch toaacuten học Đocirci khi heuristic lagrave phương phaacutep được ưa thiacutech hơn khi khaacutec giải phaacutep heuristics được dugraveng như giải phaacutep ban đầu cho caacutec phương phaacutep quy hoạch toaacuten học bull Hạn chế 1048713 Khocircng đảm bảo coacute được giải phaacutep tối ưu 1048713 Caacutec quy luật coacute rất nhiều ngoại lệ 1048713 Caacutec lựa chọn quyết định tuần tự coacute thể khocircng tiecircn đoaacuten được caacutec kết cục tương lai của mỗi chọn lựa 1048713 Sự liecircn thuộc giữa caacutec phần trong hệ thống đocirci khi coacute thể gacircy ra caacutec ảnh hưởng lớn lao lecircn toagraven hệ thống bull Phacircn loại caacutec giải thuật heuristic 1048713 Heuristic xacircy dựng xacircy dựng giải phaacutep khả thi bằng caacutech cộng thecircm từng thagravenh phần một VD bagravei toaacuten người baacuten hagraveng ndash luocircn gheacute thagravenh phố chưa viếng thăm kế tiếp gần nhất
1048713 Heuristic cải tiến bắt đầu bằng một giải phaacutep khả thi vagrave cố gắng cải tiến liecircn tục trecircn đoacute VD trecircn thử hoaacuten đổi 2 thagravenh phố 1048713 Quy hoạch toaacuten aacutep dụng vagraveo caacutec mocirc higravenh chứa iacutet ragraveng buộc nhằm coacute được thocircng tin về thỏa hiệp tốt nhất với mocirc higravenh nguyecircn gốc Thường được dugraveng trong tối ưu hoacutea nguyecircn (integer optimization) 1048713 Chia giai đoạn giải quyết một vấn đề theo từng giai đoạn VD ở PampG trecircn đacircy bagravei toaacuten phacircn phối được giải quyết trước sau đoacute dugraveng giải quyết bagravei toaacuten chiến lược sản phẩm 1048713 Phacircn ratilde chia bagravei toaacuten thagravenh caacutec phần nhỏ hơn coacute thể giải quyết được sau đoacute kết hợp caacutec giải phaacutep đoacute lại VD chia latildenh thổ baacuten hagraveng thagravenh 4 vugraveng khaacutec nhau giải quyết cho từng vugraveng sau đoacute kết nối caacutec giải phaacutep
21Mocirc phỏngbull Giả định caacutec đặc điểm của thực tạibull Lagrave kỹ thuật tiến triển caacutec thực nghiệm (như phacircn tiacutech ldquowhat-ifrdquo) - bằng maacutey tiacutenh -trecircn một mocirc higravenh của hệ thocircng tin quản lyacute
bull Khocircng thực sự lagrave một mocirc higravenh vigrave khocircng biểu diễn thực tại magrave lagrave cố gắng bắtchước thực tạibull Một trong những phương phaacutep thocircng dụng nhất trong HHTQĐbull HHTQĐ lagravem việc với caacutec bagravei toaacuten phi cấu truacutec vagrave cấu truacutec yếu tigravenh huống thực tếphức tạp ndash khocircng dễ biểu diễn bằng mocirc higravenh tối ưu hay caacutec dạng mocirc higravenh khaacutecnhưng lại thường coacute thể xử lyacute được bằng mocirc phỏngbull Đặc điểm1048713 Iacutet đưa ra caacutec đơn giản hoacutea về thực tại hơn caacutec mocirc higravenh khaacutec1048713 Do triển khai caacutec thực nghiệm necircn noacute coacute thể kiểm thử caacutec giaacute trị cụ thể của caacutecbiến quyết địnhbiến khocircng kiểm soaacutet được của mocirc higravenh vagrave xem xeacutet ảnh hưởnglecircn caacutec biến kết quả1048713 Phương phaacutep coacute tiacutenh mocirc tả (như vậy khaacutec với phương phaacutep danh định)1048713 Khocircng tự động tigravem kiếm giải phaacutep tối ưu ndash noacute mocirc tảtiecircn đoaacuten caacutec đặc tiacutenh của hệthống đatilde cho dưới caacutec điều kiện khaacutec nhau từ đoacute coacute thể chọn ra phương aacuten tốtnhất1048713 Quaacute trigravenh mocirc phỏng thường lặp lại một thực nghiệm nhiều lần để coacute được ướclượng về hiệu ứng tổng quaacutet của một số hagravenh động nhất định1048713 Mocirc phỏng maacutey tiacutenh thiacutech hợp cho hầu hết caacutec tigravenh huống mặc dugrave cũng coacute một sốmocirc phỏng thủ cocircng thagravenh cocircng1048713 Thường chỉ được dugraveng khi bagravei toaacuten quaacute phức tạp khocircng thể xem xeacutet bằng caacutec kỹthuật tối ưu dạng số Tiacutenh phức tạp theo nghĩa bagravei toaacuten khocircng thể cocircng thức hoacuteacho tối ưu (do khocircng thotildea caacutec giả định) hoặc cocircng thức quaacute lớn quaacute nhiều tươngtaacutec giữa caacutec biến hoặc về bản chất bagravei toaacuten lagrave bất định hay rủi roPhương phaacutep mocirc phỏng thiết lập mocirc higravenh của hệ thống thực vagrave tiến hagravenh caacutec thựcnghiệm lặp lại trecircn mocirc higravenh
bull Thuận lợi1048713 Lyacute thuyết tương đối trực tiếp hiệu ứng dagravei hạn của nhiều chiacutenh saacutech -gt neacuten thờigian lớn1048713 Do tiacutenh chất mocirc tả (khaacutec với danh định)1048713 Coacute thể thấy được nhanh choacuteng coacute thể đặt ra caacutec cacircu hỏi ldquowhat-ifrdquo coacute thể dugravengtiếp cận thử-vagrave-sai vagraveo giải quyết vấn đề một caacutech nhanh choacuteng rẻ chiacutenh xaacutec iacutetrủi ro hơn1048713 Thử nghiệm được biến quyết định phần nagraveo của mocirci trường thực sự quan trọngvới caacutec phương aacuten khaacutec nhau1048713 Yecircu cầu kiến thức riecircng biệt về bagravei toaacuten vigrave thế buộc người xacircy dựng mocirc higravenh phảilagravem việc thường xuyecircn với nhagrave quản lyacute ndash đối tượng mong muốn của HHTQĐ để
từ đoacute bản chất bagravei toaacuten vagrave caacutec quyết định được hiểu tốt hơn1048713 Mocirc higravenh được xacircy dựng từ viễn cảnhcaacutech nhigraven của nhagrave quản lyacute1048713 Mocirc higravenh chỉ cho một bagravei toaacuten riecircng biệt thường khocircng thể dugraveng giải caacutec bagravei toaacutenkhaacutec Như vậy mỗi thagravenh phần của mocirc higravenh ứng với một phần của hệ thống thựcdo đoacute sẽ khocircng yecircu cầu nhagrave quản lyacute phải tổng quaacutet hoacutea caacutec hiểu biết của migravenh1048713 Phổ bagravei toaacuten giải được rất rộng tồn kho nhacircn sự hoạch định chiến lược 1048713 Coacute thể chứa caacutec phức tạp thực sự của bagravei toaacuten khocircng cần caacutec đơn giản hoacutea (TDdugraveng caacutec phacircn phối xaacutec suất thực thay vigrave phacircn phối lyacute thuyết xấp xỉ)1048713 Coacute thể tự động sinh ra nhiều đo lường hiệu năng quan trọng1048713 Thường lagrave phương phaacutep duy nhất của HHTQĐ coacute thể xử lyacute caacutec bagravei toaacuten tương đốiphi cấu truacutec1048713 Coacute một số caacutec goacutei phần mềm mocirc phỏng (Monte Carlo) tương đối dễ dugravengbull Điểm yếu1048713 Tuy thường tigravem được caacutec phương aacuten đủ tốt nhưng khocircng đảm bảo lời giải tối ưu1048713 Quaacute trigravenh xacircy dựng mocirc higravenh thường dagravei vagrave tốn keacutem1048713 Giải phaacutep vagrave suy diễn từ nghiecircn cứu mocirc phỏng thường khocircng thể chuyển sang bagraveitoaacuten khaacutec vigrave mocirc higravenh kết hợp caacutec yếu tố đặc thugrave1048713 Đocirci khi do mocirc higravenh quaacute dễ giải thiacutech cho nhagrave quản lyacute necircn caacutec phương phaacutep phacircntiacutech thường xem nhẹ1048713 Phần mềm mocirc phỏng đocirci khi yecircu cầu caacutec kỹ năng đặc biệt do độ phức tạp củaphương phaacutep giải higravenh thứcbull Caacutec loại mocirc phỏng1048713 Mocirc phỏng xaacutec suất một hay nhiều biến độc lập mang tiacutenh xaacutec suất với 2 loạiphacircn phối ndash thường dugraveng kỹ thuật Monte Carlo1048713 Phacircn phối rời rạc tigravenh huống coacute một số giới hạn caacutec biến cố (biến) với hữu hạncaacutec giaacute trị cho mỗi biến cố (biến)1048713 Phacircn phối liecircn tục tigravenh huống coacute số lượng khocircng giới hạn caacutec biến cố tuacircn theocaacutec hagravem mật độ xaacutec suất như phacircn phối chuẩn1048713 Mocirc phỏng độc lậpphụ thuộc theo thời gian1048713 Độc lập khocircng cần thiết phải biết chiacutenh xaacutec thời điểm xảy ra biến cố (nhu cầutiecircu thụ lượng sản phẩm trong ngagravey khocircng biết chiacutenh xaacutec thời điểm tiecircu thụ)1048713 Phụ thuộc cần biết chiacutenh xaacutec thời điểm xảy ra sự kiện (bagravei toaacuten hagraveng đợi)1048713 Mocirc phỏng tương taacutec trực quan1048713 Mocirc phỏng hướng đối tượng dugraveng tiếp cận hướng đối tượng để xacircy dựng mocirc higravenhmocirc phỏng Chuacute yacute ngocircn ngữ mocirc higravenh hoacutea nhất thể UML (unified modelinglanguage) kể cả khi mocirc phỏng caacutec hệ thời gian thựcMOcirc HIgraveNH HOacuteA ĐA CHIỀU ndash XỬ LYacute PHAcircN TIacuteCH TRỰC TUYẾNbull Người ra quyết định thường phải xem xeacutet nhiều chiều của dữ liệu (TD caacutec chiềucủa dữ liệu baacuten hagraveng lagrave sản phẩm vugraveng thời gian người baacuten ) dữ liệu cần đượcphacircn tiacutech trực tiếp bằng caacutec cocircng cụ chuẩn hay phacircn tiacutech tự động bằng caacutec
phương phaacutep khai mỏ dữ liệu (data mining)bull Hầu hết caacutec hệ thống phacircn tiacutech đa chiều được nhuacuteng trong caacutec hệ xử lyacute phacircn tiacutechtrực tuyến (HXLPTTT ndash online analytic processing - OLAP)bull Mục tiecircu của XLPTTT nắm bắt cấu truacutec của dữ liệu thực để hỗ trợ ra quyết địnhbull Trong HHTQĐ coacute sự gắn nối tự nhiecircn giữa mocirc higravenh hoacutea dữ liệu mocirc higravenh hoacutea kyacutehiệu vagrave caacutec khiacutea cạnh của phacircn tiacutech ldquowhat-ifrdquobull Caacutec baacuteo caacuteo của HXLPTTT đều coacute tiacutenh tương taacutec dễ khai thaacutec sử dụng đặc biệtphugrave hợp cho caacutec baacuteo caacuteo về chỉ số hiệu năng chủ yếu (key performance indicators- KPI) baacuteo caacuteo về đo lường hiệu năng kinh doanh bull Thế hệ hiện tại của HXLPTTT vagrave hệ khai mỏ dữ liệu (data mining) tiacutech hợp caacutecđặc tiacutenh của hệ thocircng tin latildenh đạo (executive information system ndashEIS- nhiềucaacutech nhigraven dữ liệu chi tiết hoacutea theo nhu cầu) vagrave caacutec hệ đồ họa khaacutec ndash thường coacutegiao diện người dugraveng dạng kiểu WEBbull Caacutec hệ thống như trecircn cograven được gọi lagrave caacutec cocircng cụ triacute tuệ kinh doanh (businessintelligence - BI) vigrave coacute caacutec đặc trưng về mocirc higravenh hoacutea vagrave tối ưu hoacutea nhưng lạitrong suốt đối với ngươigrave dugravengbull Hiện caacutec cocircng cụ được đưa ra bởi caacutec nhagrave cung cấp về CSDL về hoạch định tagraveinguyecircn tổ chức (ERP) về nhagrave kho dữ liệu (data warehouse) về HXLPTTT MOcirc HIgraveNH HOacuteA VAgrave MOcirc PHỎNG TƯƠNG TAacuteC TRỰC QUANbull Iacutech lợi Người ra quyết định tham gia vagraveo quaacute trigravenh phaacutet triển mocirc higravenh vagrave thựcnghiệm mocirc phỏng vigrave vậy sẽ tin tưởng khi sử dụng mocirc higravenhbull Mocirc higravenh hoacutea tương taacutec trực quan (visual interactive modeling - VIM) dugraveng caacutecbiểu diễn đồ họa maacutey tiacutenh để trigravenh bagravey caacutec ảnh hưởng của caacutec quyết định quản lyacutekhaacutec nhau ở một thời điểm (tĩnh) hay tiến triển theo thời gian (động với kỹ thuậthoạt higravenh)bull Mocirc phỏng tương taacutec trực quan (visual interactive simulation - VIS) cho pheacutepngười dugraveng theo dotildei tiến trigravenh xacircy dựng vagrave sử dụng khai thaacutec mocirc higravenh mocirc phỏngdưới dạng hoạt higravenhbull Mocirc higravenh hoacutea tương taacutec trực quan coacute thể kết hợp với tiếp cận triacute tuệ nhacircn tạo đểđưa ra caacutec khả năng mới thay đổi từ xacircy dựng hệ thống dạng đồ họa đến tigravem hiểuvề động học của hệ thốngbull Cần đến caacutec hệ thống maacutey tiacutenh xử lyacute song song tốc độ cao để xacircy dựng caacutec mocircphỏng - phức tạp quy mocirc lớn dạng hoạt higravenh - mang tiacutenh khả thi ở thời gian thực
22Caacutec dạng hệ thống hỗ trợ ra quyết địnhHệ hỗ trợ quyết định nhoacutemRa quyết định nhoacutem giao tiếp vagrave cộng taacutec- Caacutec đặc điểm của cocircng việc nhoacutem+ Một nhoacutem thực hiện một nhiệm vụ thỉnh thoảng ra quyết định thỉnh thoảngkhocircng ra quyết định+ Caacutec thagravenh viecircn trong nhoacutem coacute thể ở những nơi khaacutec nhau
+ Caacutec thagravenh viecircn trong nhoacutem coacute thể lagravem việc ở những thời gian khaacutec nhau+ Caacutec thagravenh viecircn trong nhoacutem coacute thể lagravem việc cugraveng nhau hoặc ở caacutec tổ chức khaacutecnhau+ Nhoacutem coacute thể vĩnh viễn hoặc tạm thời+ Nhoacutem coacute thể ở bất kỳ mức quản lyacute nagraveo hoặc mức thời gian nagraveo+ Coacute sự điều phối (quaacute trigravenh vagrave nhiệm vụ đạt được) hoặc macircu thuẩn trongnhoacutem+ Coacute sự đạt được hoặcvagrave mất maacutet năng suất trong tổ chức+ Nhiệm vụ phải hoagraven thagravenh rất nhanh+ Khocircng thể hoặc quaacute đắt cho tất cả caacutec thagravenh viecircn trong nhoacutem cugraveng hợp ở mộtnơi+ Một số dữ liệu thocircng tin hoặc kiến thức cần thiết nằm ở nhiều nơi một sốkhaacutec ở ngoagravei tổ chức+ Chuyecircn mocircn của caacutec thagravenh viecircn khocircng coacute trong nhoacutem lagrave cần thiết- Caacutec hoạt động vagrave caacutec quaacute trigravenh miecircu tả caacutec cuộc họp+ Cuộc họp lagrave hoạt động chung liecircn quan bởi một nhoacutem người coacute địa vị bằngnhau hoặc gần bằng nhau+ Kết quả của cuộc họp phụ thuộc một phần vagraveo kiến thức yacute kiến caacutec đaacutenh giaacutecủa caacutec thagravenh viecircn+ Kết quả của cuộc họp cũng phụ thuộc vagraveo sự kết hợp của nhoacutem vagrave phụ thuộcvagraveo quaacute trigravenh ra quyết định được sử dụng bởi nhoacutem đoacute+ Giải quyết caacutec yacute kiến khaacutec nhau bởi người coacute quyền hạn hoặc thương lượnghoặc phacircn xửHỗ trợ giao tiếp- Giao tiếp lagrave thagravenh phần quan trọng cho hỗ trợ quyết định Khocircng coacute giao tiếp thigravekhocircng coacute cộng taacutec Những người ra quyết định caacute nhacircn phải giao tiếp với caacutecđồng nghiệp chuyecircn gia cơ quan chiacutenh phủ khaacutech hagraveng đối taacutec kinh doanh hellipHọ cũng cần dữ liệu vagrave thocircng tin (vagrave kiến thức) từ nhiều nơi trecircn thế giới Caacutecnhoacutem ra quyết định phải giao tiếp cộng taacutec vagrave thương lượng trong cocircng việcHầu hết caacutec tổ chức sẽ nhanh trở thagravenh khocircng coacute chức năng nếu khocircng coacute caacutec hệthống giao tiếp Thương mại điện tử coacute thể hiệu quả chỉ qua caacutec kỹ thuật giao tiếphiện đại- Caacutec kỹ thuật thocircng tin hiện đại cung cấp caacutec phương tiện hỗ trợ giao tiếp rẻnhanh coacute khả năng coacute thể tin cậy Nền tảng hỗ trợ giao tiếp lagrave caacutec hệ thống maacuteytiacutenh mạng+ Bắt đầu bằng điện baacuteo điện thoại radio vagrave ti vi+ Trong 100 năm chuacuteng ta phaacutet triển maacutey fax thư điện tử chương trigravenh chatnhoacutem tin tức hệ thống hội nghị truyền higravenh Hầu hết caacutec kỹ thuật nagravey đềuhoạt động trecircn internet+ Sự phaacutet triển giao tiếp sau cugraveng lagrave hệ thống họp điện tử caacutec dịch vụ vagrave hệ
thống hội nghị điện tử thường sử dụng internet để kết nối caacutec người ra quyếtđịnh- Caacutec thuận lợi aacutep dụng caacutec phương phaacutep giao tiếp cải tiến trong caacutec tổ chức+ Cải tiến năng suất của nhacircn viecircn+ Liecircn quan đến nhiều người ra quyết định chiacutenh+ Khocircng quan tacircm nhiều đến đường biecircn giới địa lyacute+ Tạo nền văn hoacutea hợp taacutec nhất quaacuten+ Cải tiến chất lượng cuộc sống của nhacircn viecircnHỗ trợ cộng taacutec Maacutey tiacutenh hỗ trợ cộng taacutec- Khung thời giannơi chốn+ Sự hiệu quả của kỹ thuật tiacutenh toaacuten cộng taacutec phụ thuộc vagraveo vị triacute của caacutec thagravenhviecircn trong nhoacutem vagrave phụ thuộc vagraveo thời gian chia sẽ thocircng tin gởi vagrave nhận+ Chia sự giao tiếp thagravenh bốn ocirc vagrave tổ chức bốn ocirc dọc theo 2 chiều thời gian vagravenơi chốn1048713 Thời gian Khi gởi vagrave nhận thocircng tin hầu như đồng thời giao tiếp lagrave đồngthời Viacute dụ Điện thoại ti vi vagrave caacutec cuộc họp gặp mặt nhau Giao tiếp bấtđồng bộ xảy ra khi người nhận nhận thocircng tin ở thời điểm khaacutec thời điểmgởi thocircng tin đoacute1048713 Nơi chốn Người gởi vagrave người nhận coacute thể ở cugraveng phograveng hoặc khocircng+ Bốn ocirc lagrave1048713 Cugraveng thời giancugraveng nơi chốn Caacutec thagravenh viecircn gặp mặt nhau cugraveng một luacutecgiống như phograveng quyết định hoặc gặp mặt truyền thống1048713 Cugraveng thời giankhaacutec nơi chốn Caacutec thagravenh viecircn ở caacutec nơi khaacutec nhau nhưnggiao tiếp cugraveng nhau Viacute dụ hội nghị truyền higravenh (videoconferencing)1048713 Khaacutec thời giancugraveng nơi chốn Nhiều người lagravem việc theo ca Ca nagravey để lạithocircng tin cho ca khaacutec1048713 Khaacutec thời giankhaacutec nơi chốn Caacutec thagravenh viecircn ở caacutec nơi khaacutec nhau Caacutecthagravenh viecircn nagravey gởi vagrave nhận thocircng tin ở những lần khaacutec nhau
23Thực thi hệ DSSHệ thống hỗ trợ quản lyacute (MSS) khocircng phải luacutec nagraveo cũng luocircn thagravenh cocircng Nhiều trường hợpthất bại của ES khocircng hoagraven toagraven lagrave lyacute do kỹ thuật Thực thi hệ thống lagrave một quaacute trigravenh liecircn tụcnhằm đảm bảo cho tổ chức chuẩn bị tiếp nhận một hệ thống mới vagrave đưa hệ thống vagraveo sử dụngthagravenh cocircngThực hiện cocircng nghệ hệ thống hỗ trợ quản lyacute lagrave việc phức tạp vigrave caacutec hệ thống nagravey khocircng đơnthuần lagrave hệ thống thocircng tin chỉ thu thập thao taacutec vagrave phacircn phối thocircng tin Magrave xa hơn chuacuteng
liecircn quan tới caacutec cocircng việc coacute thể lagravem thay đổi đaacuteng kể caacutech thức hoạt động của tổ chức Tuyvậy đa số caacutec yếu tố thực thi đều liecircn quan tới hệ thống thocircng tinThực thi MSS lagrave quaacute trigravenh liecircn tục diễn ra trong suốt thời gian phaacutet triển hệ thống từ đề xuấtban đầu đến nghiecircn cứu khả thi thiết kế vagrave phacircn tiacutech hệ thống lập trigravenh huấn luyện chuyểnđổi vagrave lắp đặt Caacutec chuyecircn gia hệ thống thocircng tin thường gọi thực thi lagrave giai đoạn cuối trongvograveng đời hệ thống Định nghĩa thực thi MSS phức tạp hơn vigrave bản chất lặp của sự phaacutet triểncaacutec hệ thống
THỰC THI KHOcircNG HOAgraveN CHỈNHCaacutec quyết định về tiacutenh khả thi thường coacute giả định về lợi iacutech đạt được khi kế hoạch thực thiđược thực hiện hoagraven toagraven Trong thực tế thường chỉ thực hiện 90 thậm chiacute 70 phần trăm sovới phacircn tiacutech khả thi Lyacute do lagrave sự thay đổi tại một nơi trong hệ thống coacute thể ảnh hưởng vagrave coacutethể taacutec động tiecircu cực đến chỗ khaacutec Do vậy cấp quản lyacute coacute thể bỏ những phần trong dự aacuten coacutethể gacircy ra taacutec động xấu Do đoacute dự aacuten sẽ thực hiện iacutet hơn 100 so với dự aacuten kế hoạch Caacutec lyacutedo khaacutec coacute thể lagrave do khấu trừ ngacircn saacutech hoặc vượt chi phiacuteĐAacuteNH GIAacute SỰ THAgraveNH COcircNG CỦA THỰC THI HỆ THỐNGPhải coacute caacutec chỉ số đo lường thigrave mới coacute thể đaacutenh giaacute sự thagravenh cocircng khi thực thi một hệ thốngDickson va Powers (1973) đề ra 5 tiecircu chuẩn độc lậpbull Tỷ lệ thời gian thực hiện dự aacuten với thời gian ước lượngbull Tỷ lệ chi phiacute thực tế vagrave ngacircn saacutech thực hiệnbull Thaacutei độ của cấp quản lyacute đối với hệ thốngbull Nhu cầu thocircng tin của caacutec nhagrave quản lyacute được đaacutep ứng như thế nagraveo qua hệ thốngbull Taacutec động của dự aacuten đối với những hoạt động maacutey tiacutenh trong cocircng tyCaacutec đo lường khaacutec để đaacutenh giaacute thagravenh cocircng của hệ hỗ trợ quản lyacute (MSS)bull Sự sử dụng hệ thống (dự định dugraveng hoặc thực sự dugraveng)bull Thỏa matilden của người dugravengbull Thaacutei độ taacuten thagravenhbull Mức độ hệ thống hoagraven thagravenh caacutec mục tiecircu ban đầubull Phần thưởng đối với tổ chức (giảm chi phiacute tăng doanh thuhellip)bull Tỷ số lợi iacutech chi phiacute
bull Mức độ thể chế hoacutea của MSS trong tổ chứcDo bởi tiacutenh đa dạng của DSS necircn việc đaacutenh giaacute sự thagravenh cocircng của hệ nagravey cũng khoacute khăn tuynhiecircn cũng coacute thể coacute một số yếu tố giuacutep cho DSS thagravenh cocircng như sự tham gia người dugravenghuấn luyện người dugraveng hỗ trợ quản lyacute cấp cao nguồn thocircng tin đặc điểm của những nhiệmvụ coacute liecircn quan (cấu truacutec bất định độ khoacute phụ thuộc)
Chương5Nhoacutem hỗ trợ quyết định vagrave nhoacutemcocircng nghệ phần mềm
51Nhoacutem tạo quyết định
MDM-Holsapple đatilde gợi yacute chuacuteng ta sử dụng giới hạn người tạo quyết định
Một nhoacutem lagrave kết cấu MDM nơi magrave nhiều người ra quyết định hoagraven toagraven tương taacutec
Một đội lagrave kết cấu MDM nơi caacutec thagravenh viecircn tư vấn cho người đưa ra quyết định nhưng khocircng tương taacutec
Một Ủy ban lagrave kết cấu MDM với một người tạo quyết định duy nhất vagrave sự tương taacutec giữa caacutec thagravenh viecircn
Mạng thocircng tin
Mạng lưới baacutenh xe mỗi người tham gia coacute thể giao tiếp với người đưa ra quyết định ở trung tacircm nhưng khocircng phải với người tham gia khaacutecCấu truacutec nagravey lagrave khocircng thỏa matilden tất cả những người tham gia ngoại trừ người ra quyết định
Mạng dacircy chuyền Tham gia chuyển tiếp thocircng tin chỉ để noacute luocircn liền kề nhau trong chuỗi
Thagravenh viecircn cuối cugraveng ko được đaacutep ứng
Mạng vograveng trograven Tương tự như chuỗi nhưng kết thuacutec được kết nối
Mạng kết nối hoagraven toagraven khocircng coacute hạn chế về giao tiếp vagrave tương taacutec giữa caacutec thagravenh viecircnNoacutei chungnoacute đaacutep ứng hầu hết caacutec kết nối của người tham gia nhưng truyền đạt thocircng tin mất nhiều thời gian vagrave coacute nhiều cơ hội xảy ra lỗi
Nhoacutem hagravenh vi vagrave chuẩn mực
MDMs thiết lập caacutec chỉ tiecircu hướng dẫn quaacute trigravenh ra quyết định
Một chuẩn mực quy định cụ thể những gigrave thagravenh viecircn trong nhoacutem dự kiến sẽ lagravem trong những hoagraven cảnh nhất định
Quy tắc gửi coacute thể được thocircng qua viacute dụ đaacutenh giaacute ngang hagraveng hoặc xử phạt
Lagravem thế nagraveo để đưa ra quyết định
Việc chọn lựa magrave trong đoacute việc sử dụng cấu truacutec MDM phải được dựa trecircn một số yếu tố liecircn quan với bối cảnh quyết định
Viacute dụmột cấu truacutec riecircng lẻ sẽ lagravem việc nơi magrave quyết định được cấu truacutec cao vagrave thocircng tin lagrave coacute sẵn
Một ủy ban cơ cấu sẽ lagrave sự lựa chọn khi người ra quyết định khocircng thể đưa ra quyết định một migravenh
52Caacutec vấn đề thường gặp trong nhoacutem
Kiacutech thước Noacutei chung sự nhất triacute vagrave gắn kết giữa caacutec thagravenh viecircn tỉ lệ nghịch với phạm vi nhoacutem Trong nhoacutem lớn rất dễ higravenh thagravenh caacutec nhoacutem nhỏ vagrave hoạt động rời rạc
Tư duy tập thể Trong nhoacutem lớn mọi người coacute xu hướng suy nghĩ đểđạtđược sự nhất triacute necircn khocircng phaacutet huy được sự saacuteng tạo
Caacutec vấn đề về xatilde hội
Xung đột Trong 1 nhoacutem ai cũng muốn migravenh lagrave giỏi nhất necircn dễ dẫn đến xung đột
Ẩn danh(Giấu tecircn) Đacircy lagrave phương phaacutep được sử dụng để kiểm soaacutet xung đột Cho caacutec thagravenh viecircn tham gia ẩn danh
Vấn đề giới tiacutenh Nam vagrave nữ thường coacute những thế mạnh khaacutec nhau điều nagravey coacute thể lagrave sức mạnh trong 1 thiết lập MDM
Đagravem phaacuten vagrave quyết định
Một quyết định coacute thể liecircn quan đến nhiều quan điểm khaacutec nhau vigrave thế cần phải coacute sự đagravem phaacuten
Caacutec thiết kế của cơ chế hỗ trợ cho MDM phải phugrave hợp với caacutec hoạt độngđagravemphaacuten
Những hoạt động nagravey bao gồm việc thu nhận yacute kiến của caacutec thagravenh viecircn 1 caacutech cocircng bằng
53Cocircng nghệ hỗ trợ MDM
Organizational DSSndash 1 hệ thống cung cấp caacutec quyết định hỗ trợ
Group Support Systemndash Cocircng nghệ sử dụng sự hỗ trợ của nhiều becircn tham gia
Group DSS ndash Lagrave 1 hệ thống được thiết kế đặc biệt để hỗ trợ cho MDM
DSS ndash Lagrave 1 hệ thống dưới sự kiểm soaacutet của 1 người quyết định hệ thống nagravey cung cấp 1 bộ cocircng cụ giuacutep phacircn tiacutech hoagraven cảnh đểđưa ra quyết định vagrave nacircng cao hiệu quả của quyết địnhđoacute
53Cocircng nghệ hỗ trợ MDM
Organizational DSSndash 1 hệ thống cung cấp caacutec quyết định hỗ trợ
Group Support Systemndash Cocircng nghệ sử dụng sự hỗ trợ của nhiều becircn tham gia
Group DSS ndash Lagrave 1 hệ thống được thiết kế đặc biệt để hỗ trợ cho MDM
DSS ndash Lagrave 1 hệ thống dưới sự kiểm soaacutet của 1 người quyết định hệ thống nagravey cung cấp 1 bộ cocircng cụ giuacutep phacircn tiacutech hoagraven cảnh đểđưa ra quyết định vagrave nacircng cao hiệu quả của quyết địnhđoacute
Mục tiecircu của cocircng nghệ hỗ trợ MDM
Quy trigravenh hỗ trợ tập trung vagraveo quaacute trigravenh tạo điều kiện thuận lợi cho sự tương taacutec
Cơ chế cấu truacutec quaacute trigravenh chi phối caacutec hoạt động truyền thocircng
Nhiệm vụ hỗ trợ cocircng việc coacute thể chọn lựa tổ chức hoặc lấy thocircng tin
Nhiệm vụ cấu truacutec cocircng việc cho pheacutep truy cập đến kỹ thuật lọc kết hợp phacircn tiacutech kiến thức liecircn quan đến cocircng việc
Caacutec lớp loại cocircng nghệ hỗ trợ MDM
Phacircn loại theo đặc điểm do DeSanctis vagrave Gallupe đưa ra đề xuất một chương trigravenh ba cấp dựa trecircn caacutec tiacutenh năng được cung cấp
Hệ thống cấp 1 Mục điacutech chiacutenh lagrave tạo điều kiện thocircng tin liecircn lạc giữa caacutec thagravenh viecircn
Hệ thống cấp 2 Thiết kế để giảm thiểu rủi ro
Hệ thống cấp 3 Giuacutep điều chỉnh xử lyacute quyết định
Phacircn loại theo cocircng nghệ -Kraemer vagrave King tập trung vagraveo cocircng nghệ aacutep dụng
Cocircng nghệ bảng mạch điện tử
Hội nghị trực tuyến
Mạng lưới tập đoagraven
Trung tacircm thocircng tin
Mocirci trường cộng taacutec
Phograveng quyết định
Nhoacutem phần mềm
Phần mềm được thiết kế để hỗ trợ sự hợp taacutec bao gồm việc thu huacutet vagrave lưu trữ thocircng tin
Caacutec tổ chức dẫn đầu thị trường hiện tại lagrave Lotus Notes and Domino Microsoft Exchange Novell GroupWise and Oracle Office
Caacutec cocircng cụ trong một bộ phần mềm bao gồm người quản lyacute hội nghị (Lotus Sametime) vagrave trao đổi thocircng điệp (Lotus Notes Mail)
Xếp hạng phần mềm cho nhoacutem
Ellis vv đề xuất một hệ thống xếp hạng dựa vagraveo kiểu sự hỗ trợ noacute Cung cấp
Hệ thocircng điệp
Hệ thống hội thảo truyền higravenh
Hệ thống cộng taacutec soạn thảo
Nhoacutem phacircn phối giải phaacutep phần mền
Hệ thống phối hợp
Hệ thống thocircng minh đại diện
Lực lượng điều khiển phaacutet triển phần mềm cho nhoacutem
Một số nhacircn tố chiacutenh bao gồm
Tăng năng suất
Giảm số lượng caacutec cuộc họp
Tăng cường tự động hoacutea caacutec quy trigravenh lagravem việc thường xuyecircn
Cần phối hợp toagraven cầu tốt hơn
Tiacutenh sẵn sagraveng của những mạng lan rộng
Coleman vagrave Khanna liệt kecirc 10 nhacircn tố khaacutec
54Quản lyacute hoạt động MDM (Mobile Device Management - Quản lyacute thiết bị di động)
Một số phương phaacutep phối hợp phổ biến hơnMDM lagrave
Kỹ thuật nhoacutem định danh
Kỹ thuật Delphi
Sự phacircn xử
Hệ thocircng tin dựa trecircn vấn đề
Nemawashi
Kỹ thuật nhoacutem định danh
1-Mỗi người tham gia viết ra những yacute tưởng về những gigrave necircn quyết định
2-Lần lượt mỗi người tham gia trigravenh bagravey yacute tưởng của migravenh được ghi lại trecircn bảng Khocircng thảo luận ở đacircy
3-Sau khi tất cả caacutec yacute tưởng được trigravenh bagravey caacutec đại biểu coacute thể chất vấn những người khaacutec
4-Mỗi người tham gia bỏ phiếu cho mỗi yacute tưởng
Kỹ thuật Delphi
Về cơ bản tương tự như kỹ thuật nhoacutem định danh ngoại trừ những người khocircng bao giờ tham gia cuộc họp
Một cocircng cụ khảo saacutet được sử dụng để thu thập đầu vagraveo ban đầu từ caacutec thagravenh viecircn
Một cuộc khảo saacutet thứ hai được gửi đi với một bản toacutem tắt caacutec kết quả chung
Những bước lặp lại cho đến khi đạt được một sự đồng thuận hoặc nhigraven nhận của đa số
Sự phacircn xử(Arbitration )
Thiacutech hợp nhất khi caacutec thagravenh viecircn của MDM đại diện cho caacutec yếu tố đối lập
Những người tham gia đồng yacute rằng nếu lựa chọn thay thế hai becircn thỏa thuận khocircng được tigravem thấy thigrave một trọng tagravei viecircn becircn ngoagravei sẽ tham gia
Trọng tagravei sau đoacute lựa chọn thay thế ocircng hoặc xeacutet thấy thiacutech hợp nhất
Hệ thống thocircng tin dựa trecircn vấn đề (IBIS)
Lagrave một phương phaacutep lập luận cấu truacutec
Một đại diện cho IBIS lagrave một đồ thị với caacutec nuacutet vagrave caacutec liecircn kết
IBIS bắt đầu với lựa chọn của một nuacutet vấn đề gốc sau đoacute caacutec nuacutet vị triacute khaacutec nhau được liecircn kết với nuacutet gốc
Caacutec nuacutet vị triacute nagravey sau đoacute được đaacutenh giaacute dựa trecircn những lập luận gắn liền với chuacuteng
Nemawashi (được sử dụng rộng ratildei tại Nhật Bản)
1-Một hoặc nhiều thagravenh viecircn của MDM được chỉ định lagrave điều phối viecircnCaacutec điều phối viecircn sau đoacute chọn người tham gia cograven lại
2-Điều phối viecircn xacircy dựng một tổng hợp caacutec sự lựa chọn vagrave sau đoacute caacutec chuyecircn gia đaacutenh giaacute caacutec lựa chọn
3-Điều phối viecircn lựa chọn một sự lựa chọn dựa trecircn kết quả ở trecircn(ở 2)
4-Sự thay thế được luacircn chuyển điều phối viecircn tigravem kiếm sự đồng thuận thocircng qua sự thuyết phục vagrave đagravem phaacuten
5-Nếu đạt được sự đồng thuận điều phối viecircn cho lưu thocircng một tagravei liệu magrave mỗi thagravenh viecircn MDM để lại dấu hiệu trecircn đoacute
55Nơi lagravem việc ảo
Nhiều tổ chức trecircn toagraven thế giới kinh doanh bất động sản cho cocircng nghệ hợp taacutec
Cocircng việc được trở thagravenh một điều bạn lagravem hơn lagrave một nơi bạn đi
Những thay đổi lớn nhất mang lại bởi nơi lagravem việc ảo coacute thể lagrave về văn hoaacute hay xatilde hội hơn lagrave về cocircng nghệ
Chương 6 Hệ thống thocircng tin điều hagravenh
61 Yacute nghĩa của EIS- Hệ thống thocircng tin điều hagravenh
- EIS lagrave một dạng đặc biệt của DSS được thiết kế để hỗ trợ ra quyết định ở cấp cao nhất của một tổ chức
- Lagrave một hệ thống thocircng tin hỗ trợ nhu cầu lập kế hoạch vagrave đaacutenh giaacute của caacutec nhagrave quản lyacute điều hagravenh
- EIS coacute thể giuacutep một CEO coacute được bức tranh tổng thể chiacutenh xaacutec nhất về caacutec hoạt động vagrave một bản toacutem tắt những gigrave magrave đối thủ cạnh tranh đang lagravem
- Caacutec hệ thống nagravey noacutei chung hoạt động dễ dagraveng vagrave trigravenh bagravey thocircng tin theo những caacutech dễ hiểu để việc tiếp thu được nhanh choacuteng (biểu đồ đồ thịhellip)
(Tagravei liệu thecircm EIS lagrave những loại hệ thống lagrave rất phức tạp trong tự nhiecircn Coacute thể noacutei hệ thống nagravey cũng cung cấp cho caacutec nhagrave quản lyacute với caacutec thiết bị coacute khả năng ra quyết định bằng caacutech sử dụng của noacute Hệ thống nagravey hoạt động trong điều kiện như vậy quan trọng như trong caacutec hệ thống khaacutec khocircng hỗ trợ Khả năng lưu trữ dữ liệu nặng lagravem cho noacute lyacute tưởng để được thocircng qua khocircng chỉ bởi caacutec doanh nghiệp lớn magrave cograven bởi caacutec doanh nghiệp nhỏ hơn Nhigraven chung hệ thống nagravey lagrave dagravenh cho caacutec nhacircn viecircn cấp cao hỗ trợ thagravenh thạo trong việc đưa ra caacutec quyết định quan trọng)
Caacutec phiecircn EIS tiecircu biểu- Phiecircn lagravem việc coacute thể bắt đầu với một baacuteo caacuteo về tigravenh higravenh tagravei chiacutenh vagrave kinh
doanh của một cocircng ty caacutec chỉ số hoạt động quan trọng được hiển thị rotilde ragraveng- EIS sẽ cho pheacutep caacutec giaacutem đốc điều hagravenh coacute thể đi sacircu vagraveo dữ liệu từ những con
số bất kỳ magrave noacute hỗ trợ- Việc điều hagravenh coacute thể lựa chọn một mức độ chi tiết ( VD danh số baacuten hagraveng) nếu
như cần điều tra thecircm- Lagrave một phương phaacutep tiếp cận coacute thể giuacutep việc ra quyết định tốt hơn
Những điều magrave EIS ko coacute- EIS khocircng phải lagrave sự thay thế cho caacutec hệ thống dựa trecircn caacutec maacutey tiacutenh khaacutec EIS
thực sự chỉ cung cấp dữ liệu cho caacutec hệ thống nagravey- Noacute khocircng thể biến caacutec bộ hệ điều hagravenh của maacutey tiacutenh thagravenh những ldquochuyecircn viecircn
giỏirdquo- Coacute thể được viacute một caacutech cao hơn như lagrave một trợ lyacute đaacuteng tin cậy coacute thể được gọi
đến bất khi nagraveo vagrave mỗi khi cần thiết
Tagravei liệu thecircm Sự khaacutec nhau giữa EIS vagrave DSS+ EIS thiết kế để hỗ trợ những người điều hagravenh cấp cao giuacutep họ khaacutem phaacute caacutec vấn đề vagrave caacutec cơ hội DSS hỗ trợ những nười phacircn tiacutech cố gắng trả lời cacircu hỏi caacutei gigrave coacute thể lagravem cugraveng với một cơ hội hoặc một vấn đề
Chiều EIS DSSNhững người sử dụng thocircng thường
Duyệt dữ liệu đi xuống truy xuất trạng thaacutei
Hỗ trợ phacircn tiacutech vagrave quyết định
Sự thuacutec đẩy Tiacutenh thiacutech hợp Tiacutenh hiệu quảỨng dụng Queacutet mocirci trường đaacutenh giaacute
hiệu suất nhận dạng caacutec vấn đề vagrave caacutec cơ hội
Caacutec quyết định quản lyacute trecircn caacutec lĩnh vực đa dạng
Hỗ trợ quyết định Caacutec chiacutenh saacutech caacutec quyết định khocircng coacute cấu truacutec ở mức cao vagrave hỗ trợ giaacuten tiếp
Hỗ trợ caacutec quyết định lặp lại caacutec quyết định khocircng thể đoaacuten trước ra quyết định khocircng coacute cấu truacutec vagrave baacuten cấu truacutec
Loại thocircng tin Caacutec thocircng tin tin tức thocircng tin becircn ngoagravei về khaacutech hagraveng đối thủ cạnh tranh mocirci trường caacutec baacuteo caacuteo theo yecircu cầu vagrave định thời về caacutec hoạt động becircn trong
Caacutec thocircng tin hỗ trợ caacutec tigravenh huống đặc biệt
Sử dụng coacute nguyecircn tắc
Dograve theo vết vagrave điều khiển nhận dạng cơ hội
Hoạch định tổ chức phacircn nhoacutem vagrave điều khiển
Khả năng phugrave hợp với những người sử dụng caacute nhacircn
Thiết kế loại ra quyết định cho mỗi người điều hagravenh caacute nhacircn bằng nhiều lựa chọn đầu ra
Cho pheacutep caacutec đaacutenh giaacute caacute nhacircn caacutec khả năng what-if lựa chọn loại hộp hội thoại
Đồ họa Phải coacute Lagrave một phần quan trọng của nhiều DSS
Thacircn thiện người sử dụng
Phải coacute Phải coacute nếu khocircng coacute người sử dụng trung gian
Xử lyacute thocircng tin Lọc neacuten thocircng tin dograve theo vết dữ liệu vagrave thocircng tin quan trọng
EIS kiacutech thiacutech caacutec cacircu hỏi caacutec cacircu trả lời bằng caacutech sử dụng DSS vagrave phản hồi lại EIS
Hỗ trợ caacutec thocircng tin chi tiết
Truy xuất thường xuyecircn caacutec mức chi tiết của bất kỳ thocircng tin tổng hợp nagraveo (duyệt dữ
Coacute thể coacute trong DSS nhưng khocircng thường
liệu chi tiết)Cơ sở mocirc higravenh Caacutec chức năng coacute sẵn bị hạn
chếLagrave điểm cốt lotildei của DSS
Cấu truacutec Theo người baacuten sản phẩm hoặc theo caacutec chuyecircn gia hệ thống thocircng tin
Theo người sử dụng hoặc caacute nhacircn hoặc caacutec chuyecircn gia từ caacutec trung tacircm thocircng tin hoặc phograveng ban hệ thống thocircng tin
Phần cứng Mainframe caacutec trạm RISC mạng LANs hoặc caacutec hệ thống phacircn bố
Mainframe caacutec trạm RISC caacutec maacutey PC hoặc caacutec hệ thống phacircn bố
Bản chất caacutec goacutei phần mềm
Truy xuất tương taacutec dễ dagraveng đến nhiều cơ sở dữ liệu truy xuất trực tuyến caacutec khả năng DBMS phức tạp caacutec liecircn kết phức tạp
Caacutec khả năng tiacutenh toaacuten lớn caacutec ngocircn ngữ mocirc higravenh mocirc phỏng ứng dụng vagrave caacutec bộ tạo DSS
Bản chất caacutec thocircng tin
Trigravenh bagravey thocircng tin được phaacutet sinh trước về quaacute khứ vagrave hiện tại tạo caacutec thocircng tin mới về quaacute khứ hiện tại tương lai
Tạo thocircng tin mới về quaacute khứ hiện tại tương lai
62 Lịch sử EIS- EIS xuất hiện lần đầu tiecircn tại MIT vagraveo những năm 1970
- Những EIS đầu tiecircn được phaacutet triển bởi caacutec doanh ngiệp lớn sẵn sagraveng chấp nhận rủi ro để đạt được lợi thế cạnh tranh
- Vagraveo những năm 1980 caacutec nhagrave cung cấp đatilde phaacutet triển một số cơ sở khaacutech hagraveng rộng vagrave cocircng nghệ EIS được tiếp tục phaacutet triển cho đến ngagravey nay
(Tagravei liệu thecircm Sử dụng DSSEIS cho phaacutet triển bền vững + Một số nghiecircn cứu đatilde được tiến hagravenh để kiểm tra việc thực hiện của EIS trong khu vực cocircng cộng vagrave chiacutenh phủ caacutec nước tổ chức kể từ khi chuacuteng được phaacutet triển theo định hướng lợi nhuận cho caacutec cocircng ty tư nhacircn (Hasan vagrave Hasan năm 1997) Theo một nghiecircn cứu tiến hagravenh tại Mỹ ở hơn 300 cocircng ty kết quả cho thấy sự khaacutec biệt của EIS giữa tư nhacircn vagrave chiacutenh phủ một số kết quả thuacute vị được phaacutet hiệnViacute dụ khoacute khăn hơn để chuyển tiền từ một tagravei khoản khaacutec trong một EIS của chiacutenh phủ cũng lagrave khoacute khăn hơn để biện giải thiacutech cho những chi phiacute phaacutet triển EIS của chiacutenh phủ Một nghiecircn cứu khaacutec được tiến hagravenh ở Australia
cho thấy rằng EIS cung cấp cho quản lyacute một higravenh ảnh chiacutenh xaacutec hơn về tổ chức thực hiện vagrave cung cấp hỗ trợ cho caacutec lợi iacutech chiến lược cải thiện khocircng chỉ cho caacutec nhagrave quản lyacute nhưng cograven cho phần cograven lại của tổ chức Dựa trecircn caacutec hệ thống được thiết kế cho caacutec cocircng ty tư nhacircn với một caacutech rotilde ragravengxaacutec định mục tiecircu EIS lagrave thiacutech hợp cho caacutec tổ chức cocircng cộng hiện đại nhưng cần phải được linh hoạt hơn vagrave kết thagravenh chugravem một phạm vi rộng hơn khả năng vagrave phương tiện hơn so với khu vực tư nhacircn ban đầu theo định hướng sản phẩm (Hasan vagrave Hasan năm 1997) Điều nagravey coacute thể lagrave do thực tế rằng caacutec hoạt động khu vực cocircng lagrave bắt buộc coacute taacutec động rộng phải đaacutep ứng sự mong đợi duy nhất cocircng cộng thường coacute mục tiecircu mơ hồ vagrave macircu thuẫn iacutet quyền tự chủ vagrave kiểm soaacutet việc ra quyết định vagrave nhacircn viecircn lagrave khoacute khăn hơn (Watson vagrave Carte2000) + Toacutem lại EIS lagrave một khaacutei niệm thagravenh cocircng noacute phaacutet triển qua nhiều năm tuy nhiecircn EIS khắc phục khiếm khuyết của migravenh bằng caacutech tiến hagravenh nghiecircn cứu liecircn tục)
63 Tại sao những người điều hagravenh hagraveng đầu lại khaacutec nhau- Họ lagrave những doanh nghiệp theo định hướng coacute suy nghĩ
- Coacute một khoảng khocircng gian rộng để kiểm soaacutet
- Họ chịu traacutech nhiệm cho việc thiết lập chiacutenh saacutech
- Họ đại diện cho tổ chức mocirci trường becircn ngoagravei
- Hagravenh động của họ tạo ra những kết quả đaacuteng kể về tagravei chiacutenh vagrave con người
Tần số caacutec hoạt động điều hagravenh- Xử lyacute xaacuteo trộn 42
- Hoạt động kinh doanh 32
- Phacircn bổ nguồn lực 17
- Đagravem phaacuten 3
- Những điều khaacutec 6
Handling Disturbances 42
Entrepreneurial Activites 32
Resource Allocation 17
Negotiation 3
Other 6
Những thocircng tin điều hagravenh cần thiết- Quản lyacute xaacuteo trộn coacute thể yecircu cầu sự chuacute yacute xung quanh đồng hồ
- Hoạt động kinh doanh yecircu cầu điều hagravenh để dự đoaacuten những thay đổi trong mocirci trường
- Nhiệm vụ phacircn bổ tagravei nguyecircn yecircu cầu lựa chọn người quản lyacute vagrave caacutec nguồn lực hạn chế được triển khai
- Đagravem phaacuten yecircu cầu cập nhật thocircng tin từng phuacutet để coacute thể xacircy dựng được sự đồng thuận
Caacutec loại thocircng tin điều hagravenh- Hệ thống kế toaacuten coacute liecircn quan đến việc tiacutenh toaacuten thu nhập hoạt động cho caacutec lĩnh
vực cụ thể lagrave quan trọng hơn so với caacutec hệ thống kế toaacuten truyền thocircng- Thocircng tin về thị trường khaacutech hagraveng cung cấp giaacute trị trong việc quyết định chiến
lược- Caacutec thocircng tin cần thiết thường được truyền đi trecircn một số hệ thống maacutey tiacutenh vagrave
nằm trong toagraven tổ chức- Caacutec thocircng tin được sử dụng thường lagrave ngắn hạn vagrave dễ thay đổi
Phương thức để xaacutec định thocircng tin cần thiết
Rockart xaacutec định được năm phương thức cơ bản để xaacutec định thocircng tin cần thiết
- Phương thức dựa trecircn kết quả- Phương thức rỗng- Phương thức chỉ số khoacutea- Phương thức tổng hợp nghiecircn cứu- Phương thức dựa vagraveo nhacircn tố then chốt dẫn đến thagravenh cocircng
64 Thagravenh phần EIS
- Sản phẩm EIS đầu tiecircn được phaacutet triển để sử dụng trecircn maacutey tiacutenh cấu higravenh cao nhưng caacutec sản phẩm hiện nay nhằm mục tiecircu lagrave nền tảng ClientServer
- Những nền tảng linh hoạt hơn coacute thể thiacutech ứng với thay đổi trong tổ chức vagrave cocircng nghệ
- Sử dụng dữ liệu thời gian thực dẫn đến quyết định nhanh hơn nhiều thocircng tin hơn
Thagravenh phần phần cứng- Một EIS khocircng đogravei hỏi coacute phần cứng cụ thể hoặc duy nhất nagraveo- Chigravea khoacutea của vấn đề lagrave để đảm bảo rằng caacutec thagravenh phần của EIS tối ưu hoacutea vagrave
phugrave hợp với tagravei nguyecircn maacutey tiacutenh của tổ chức- Hệ thống nagravey phải được cấu higravenh để caacutec nguồn tagravei nguyecircn phugrave hợp với những
người điều hagravenh chuacuteng
Thagravenh phần phần mềm- Traacutei ngược với phần cứng phần mềm thường được chuyecircn mocircn hoacutea cao cho caacutec
bagravei toaacuten về miền- Sự chuyecircn mocircn hoacutea nagravey thường đạt được bằng caacutech sử dụng thagravenh phần off-the-
shelf cho toagraven bộ EIS vagrave caacutec mocirc-đun tugravey chỉnh để đaacutep ứng nhu cầu cụ thể- Lotus Notes lagrave một viacute dụ điển higravenh Noacute coacute thể được sử dụng một migravenh hoặc coacute
thể phục vụ becircn thứ ba mocirc-đun plug-in
Cocircng nghệ EIS hiện nay
Dobrzeniecki đề xuấtphacircn loạitừng cấptheo bachức năng- Loại 1 sản phẩm bao gồmmột bộ đầy đủcaacutec ứng dụngtừ mộtnhagrave cung cấp- Loại 2 sản phẩm đượcthựchiệnở phần đầu củacaacutecsản phẩmDSS đượcphaacutet triển
bởicugravengmộtnhagrave cung cấp- Loại 3 sản phẩmkết hợp với nhautheo bất kỳ số lượngthuộc sở hữu củacocircng ty
65 Xacircy dựng EIS
- Xacircy dựngmộtEISgiống nhưxacircydựngmột số hệ thống khaacutec củamocirc higravenh hệ thống thocircng tin
- Việcphaacutet triểncấu truacutecnecircn được theo dotildeitừ quaacute trigravenh thiết kế đến quaacute trigravenhthực hiện
- Tuy nhiecircn một dự aacuten phaacutet triển EIScoacute xu hướnglagrave thống nhấtvagraveyecircu cầu hỗ trợ caacutec nhagrave quản lyacute latildenh đạo
- Xacircy dựng một EIScoacute thểphaacutet hiện ra đượccaacutectigravenh huống khoacute khănmagravemột nhagrave phaacutet triển chưabao giờ gặp phải
Mocirc higravenh EIS
Khung phaacutet triển một EIS
- Watson et al đề nghị xacircy dựngkhung với ba thagravenh phần+ Caacutech tiếp cận tập trung vagraveo yếu tốcon người vagrave dữ liệu coacute liecircn quan đến EIS+ Quaacute trigravenh phaacutet triển cần sự linh hoạt vagrave tương taacutec+ Người sử dụng - hệ thống hộp thoại bao gồm một ngocircn ngữ hagravenh động để xử lyacute caacutec lệnh
Lợi iacutech của EIS- Dễ duy trigrave caacutec mục tiecircu coacute tổ chức- Dễ truy xuất thocircng tin- Cho pheacutep người sử dụng nacircng cao hiệu suất hơn
- Tăng chất lượng ra quyết định- Cung cấp sự cải tiến cạnh tranh- Tiết kiệm thời gian của người sử dụng- Tăng khả năng vagrave chất lượng giao tiếp- Cung cấp khả năng điều khiển tốt hơn trong tổ chức- Cho pheacutep tham gia caacutec vấn đề vagrave caacutec cơ hội- Cho pheacutep hoạch định- Cho pheacutep tigravem kiếm nguyecircn nhacircn của một vấn đề- Thảo matilden caacutec yecircu cầu của người điều hagravenh
Hạn chế của EIS vagrave 1 số sai lầm cần traacutenh
- Chi phiacute một cuộc khảo saacutetnăm1991 chothấychi phiacute phaacutet triểntrungbigravenh365000USDvớichi phiacute vận hagravenhhagraveng năm lagrave$200000 (EIS)
- Cocircng nghệ hạn chếEIScần phảiđượctiacutech hợp hoagraven toagravenvagraveokiếntruacuteccủadoanh nghiệphiện tại do đoacute noacutelagrave một thaacutech thứclớn đối vớithiết kế
- Hạn chế tổ chức cơ cấu tổ chứccoacute thể khocircng phugrave hợp
Sự hạn chế về tổ chức- Chương trigravenh nghị sự vagrave thời gian chệch EIS mocirc tả một phần việc thực hiện một
chương trigravenh nghị sự vagrave coacute thể dễ dagraveng đạt được sự tin cậy một caacutech chắc chắn- Đồng bộ hoacutea việc quản lyacute sự tin cậy đuacuteng luacutec đặc biệt baacuteo caacuteo EIS coacute thể phaacute
vỡ sự ổn định thiết lập caacutec chu trigravenh baacuteo caacuteo một caacutech tốt nhất- Sự bất ổn EIS phản ứng nhanh coacute thể gacircy ra việc taacutec động trở lại một caacutech
nhanh choacuteng dẫn đến sự thiếu ổn định trong tổ chức
Sự thất bại lagrave thay thế khocircng thể chấp nhận được- Một số yếu tố lagravem EIS thất bại
+ Thiếu sự hỗ trợ về mặt quản lyacute+ Vấn đề chiacutenh trị+ Thất bại của nhagrave phaacutet triển+ Lỗi về cocircng nghệ+ Giaacute cả+ Thời gian
66 Ra quyết định điều hagravenh trong tương lai vagrave EIS
- Coacute một vagravei điều kiện sẽ được hợp nhất cho việc chuyển đổi cocircng nghệ Trong đoacute một vagravei điều kiện coacute thể dễ dự đoaacuten Hai điều kiện magrave ta coacute thể thấy lagrave+ Phaacutet triển cocircng nghệ maacutey tiacutenh trong việc điều hagravenh sẽ tạo ra sự chuyển đổi được chấp nhận một caacutech dễ dagraveng hơn+ Mở rộng traacutech nhiệm điều hagravenh sẽ mở rộng nhu cầu thocircng tin
Tương lai của EIS- EIS thocircng minh Những tiến bộ trong cocircng nghệ AI sẽ được triển khai trong caacutec
EIS- EIS đa phương tiện Cơ sở dữ liệu đa phương tiện sẽ cho pheacutep tiacutech hợp văn bản
giọng noacutei vagrave higravenh ảnh trong tương lai- EIS thocircng tin Tương lai EIS sẽ mở rộng hơn trong việc sử dụng dữ liệu becircn
ngoagravei doanh nghiệp- EIS kết nối Giao tiếp với băng thocircng rộng cho pheacutep kết nối liecircn thocircng lớn hơn
Chương 7 HỆ CHUYEcircN GIA VAgrave TRIacute TUỆ NHAcircN TẠO
71 Caacutec khaacutei niệm
72 Triacute thocircng minh của triacute tuệ nhacircn tạo
73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia
74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia
75 Lợi iacutech vagrave hạn chế của hệ chuyecircn gia
71 Caacutec khaacutei niệm
Chuyecircn mocircn (Expertise) sự hiểu biết rộng trong 1 lĩnh vực hẹp
Hệ chuyecircn gia (Expert Systems)1 chương trigravenh maacutey tiacutenh sử dụng 1 tập caacutec luật dựa trecircn tri thức của con người để giải quyết caacutec vấn đề đogravei hogravei phải coacute sự chuyecircn mocircn
Một số hệ chuyecircn gia nổi tiếng
DENDRAL (Standford 1960s Edward Feigenbaum)
MYCIN (Standford1970s Edward Shortliffe)
PROSPECTOR (MIT 1979)
Triacute tuệ nhacircn tạo (Artificial Intelligence ndash AI)
Triacute tuệ nhacircn tạo một bộ phacircn của ngagravenh khoa học maacutey tiacutenh quan tacircm đến việc thiết kế caacutec hệ thống maacutey tiacutenh thocircng minh đoacute lagrave caacutec hệ thống đưa ra caacutec đặc điểm magrave từ đoacute chuacuteng ta liecircn hệ với sự thocircng minh trong hagravenh động của con người (Barr vagrave Feigenbaum 1981)
Mục điacutech của AI
Mục điacutech khoa học xaacutec định caacutec gợi yacute để giải thiacutech caacutec loại khaacutec nhau của triacute tuệ thực
Mục điacutech kỹ thuật giải quyết caacutec vấn đề trong thế giới thực
Triacute tuệ nhacircn tạo kế thừa nhiều yacute tưởng quan điểm kỹ thuật từ caacutec ngagravenh khoa học khaacutec
- Triết học
- Logic Toaacuten học
- Tiacutenh toaacuten
- Khoa học tacircm lyacute Khoa học nhận thức
- Sinh học Thần kinh học
- Tiến hoacutea
Caacutec lĩnh vực ứng dụng trong Triacute tuệ nhacircn tạo
Mạng nơ ron thần kinh (Neural Networks)
Tiacutenh toaacuten sự tiến hoacutea
(Evolutionary Computation)
Hệ chuyecircn gia (Expert Systems)
Kỹ thuật xử lyacute tiếng noacutei (Speech Processing)
Kỹ thuật xử lyacute ngocircn ngữ tự nhiecircn
(Natural Language Processing)
Lập kế hoạch (Planning)
Robot (Robotics)
Khoa học higravenh ảnh (Vision)
Caacutec kỹ thuật thocircng dụng dugraveng trong AI
Biểu diễn(Representation)
Học (Learning)
Caacutec luật (Rules)
Tigravem kiếm (Search)
72 Triacute thocircng minh của triacute tuệ nhacircn tạo
Con người suy diễn như thế nagraveo
Phacircn loại (Categorization)
Caacutec quy tắc cụ thể
Heuristics
Kinh nghiệm trước đoacute
Dự tiacutenh trước
Maacutey tiacutenh suy diễn như thế nagraveo
Lập luận dựa trecircn luật IF-THEN mocirc tả tri thức được matilde hoacutea dưới dạng caacutec luật
Caacutec khung (Frames) lagrave caacutec đại diện mocirc tả caacutec tigravenh huống giống nhau lagrave điển higravenh của một vagravei phacircn loại
Lập luận dựa trecircn caacutec trường hợp mocirc phỏng giải phaacutep trước đoacute cho một vấn đề hiện tại
Nhận dạng mẫu phaacutet hiện acircm thanh higravenh dạng hoặc caacutec chuỗi dagravei
Caacutec dạng khaacutec của Triacute tuệ nhacircn tạo
Học maacutey- mạng nơron vagrave giải thuật di truyền
Lập trigravenh tự động ndash lagrave những kỹ thuật tạo ra caacutec chương trigravenh để lagravem 1 nhiệm vụ riecircng biệt (cho pheacutep những người khocircng phải lagrave người lập trigravenh coacute thể lập trigravenh được)
Cuộc sống nhacircn tạo ndash nỗ lực để taacutei tạo caacutec hiện tượng sinh học trong caacutec hệ thống dựa trecircn maacutey tiacutenh
73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia(Expert Systems- ES)
Theo Jackson (1999) Một hệ chuyecircn gia lagrave một chương trigravenh maacutey tiacutenh mocirc tả vagrave suy diễn với tri thức của một vagravei lĩnh vực để giải quyết vấn đề hay đưa ra caacutec lời khuyecircn
Cấu truacutec cơ bản của ES được dựa theo cấu truacutec chung của DSS Sự khaacutec biệt chiacutenh giữa ES vagraveDSS lagrave hệ ES thu thập caacutec kiến thức từ những
chuyecircn gia trong lĩnh vực quan tacircmĐặc trưng của hệ chuyecircn gia Hiệu quả cao Thời gian trả lời thỏa đaacuteng Độ tin cậy cao Dễ hiểu
Giao diện người dugraveng trong ES
Thiết kế giao diện người dugraveng tập trung vagraveo caacutec yếu tố như dễ dagraveng sử dụngcoacute độ tin cậy cao giảm tải những khoacute khăn khi sử dụng
Thiết kế necircn coacute một số tương taacutec (đầu vagraveo kiểm soaacutet vagrave truy vấn)
Cấu tạo giao diện người dugraveng gồm coacute magraven higravenh cảm ứng bagraven phiacutem buacutet saacuteng lệnh thoại caacutec phiacutem chuyecircn dụng
Cơ sở tri thức (Knowledge Base)
Chứa đựng caacutec tri thức cụ thể miền thu được từ caacutec chuyecircn gia miền
Coacute thể chứa caacutec mocirc tả caacutec hagravenh vi giải quyết vấn đề caacutec ragraveng buộc caacutec heuristics
Thagravenh cocircng của một ES dựa trecircn tiacutenh đầy đủ vagrave tiacutenh chiacutenh xaacutec của cơ sở tri thức
Mocirc tơ suy diễn (Inference Engine)
Ở đacircy tri thức được đặt để sử dụng tạo ra caacutec giải phaacutep để giải quyết vấn đề
Mocirc tơ nagravey coacute khả năng thực hiện diễn dịch hoặc suy diễn dựa trecircn caacutec luật hay caacutec caacutec sự kiện
Đồng thời cũng coacute khả năng sử dụng caacutec suy diễn mờ hay khocircng chiacutenh xaacutec dựa trecircn xaacutec suất hay aacutenh xạ mẫu
Vograveng điều khiển suy diễn
1 Aacutenh xạ caacutec luật với caacutec sự kiện đatilde được cho
2 Chọn luật để thực hiện
3 Thực hiện luật bằng caacutech thecircm caacutec sự kiện được suy diễn ra vagraveo bộ nhớ lagravem việc
Chuỗi suy diễn (Chaining)
Suy diễn tiến (forward chaining) maacutey suy diễn bắt đầu từ dữ liệu ban đầu vagrave thực hiện việc suy luận để đưa ra caacutec kết luận cuối cugraveng
Suy diễn lugravei (backward chaining) maacutey suy diễn bắt đầu từ dữ liệu điacutech vagrave tigravem ra tri thức hỗ trợ cho dữ liệu điacutech đoacute
Viacute dụ suy diễn lugravei
R1 Nếu coacute A vagrave B thigrave suy ra coacute D
R2 Nếu coacute B thigrave suy ra coacute C
R3 Nếu coacute C vagrave D thigrave suy ra coacute E
Ta coacute E ta xem trong 3 luật R1 R2 R3 luật nagraveo coacute E ta thấy R3 chứa E đồng thời chứa C vagrave D Xeacutet tiếp trong 2 luật R1 R2 luật nagraveo chứa C vagrave D R2 chứa C R3 chứa D Từ đoacute ta coacute được caacutec tri thức hỗ trợ suy diễn vagrave kết luận lagrave nếu coacute A vagrave B thigrave sẽ coacute E Hay nếu A vagrave B đuacuteng thigrave sẽ coacute E
Viacute dụ suy diễn tiến
Giả sử coacute tập chứa 3 luật sau
R1 Nếu coacute A vagrave B thigrave suy ra coacute D
R2 Nếu coacute B thigrave suy ra coacute C
R3 Nếu coacute C vagrave D thigrave suy ra coacute E
Nếu ta coacute A vagrave B thigrave chuacuteng ta suy ra được D từ R1 vagrave suy ra C từ R2 Với D vagrave C đatilde được suy ra ở trecircn giờ chuacuteng ta suy ra được E từ R3
Viacute dụ thực tế
Giả sử muốn biết magraveu của một con vật nuocirci tecircn lagrave Fred biết rằng noacute kecircu ộp ộp vagrave ăn ruồi
Coacute tập 4 luật ban đầu như sau
R1 Nếu X kecircu ộp ộp vagrave ăn ruồi thigrave X lagrave con ếch
R2 Nếu X kecircu chiecircm chiếp vagrave biết hoacutet thigrave X lagrave con chim
R3 Nếu X lagrave con ếch thigrave X coacute magraveu xanh
R4 Nếu X lagrave con chim thigrave X coacute magraveu vagraveng
74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia
Expert system shells lagrave một tập caacutec goacutei phần mềm vagrave caacutec cocircng cụ dugraveng để phaacutet triển caacutec hệ chuyecircn gia
Những Expert system shells đầu tiecircn thường rất rườm ragrave Mặc dugrave vậy noacute vẫn giuacutep cho người sử dụng sẽ khocircng phải bắt đầu lại từ đầu khi xacircy dựng một hệ chuyecircn gia mới
Những shell hiện đại bao gồm hai mocirc-đun chiacutenh lagrave cocircng cụ xacircy dựng một tập quy tắc vagrave mocirc tơ suy diễn
Xacircy dựng hệ chuyecircn gia
Bước 1 xacircy dựng mocirc higravenh bagravei toaacuten xaacutec định vấn đề nhiệm vụ magrave hệ thống sẽ thực hiện Caacutec dạng bagravei toaacuten cần hệ chuyecircn gia
Bagravei toaacuten diễn giải (InterPretation)
Bagravei toaacuten dự baacuteo (Prediction)
Bagravei toaacuten chuẩn đoaacuten (Diagnose)
Bagravei toaacuten gỡ rối (Debugging)
Bagravei toaacuten thiết kế
Tương tự như một dự aacuten phần mềm để xacircy dựng một hệ chuyecircn gia cần phải coacute caacutec yếu tố về nhacircn lực tagravei nguyecircn vagrave thời gian Những yếu tố nagravey ảnh hưởng đến giaacute thah của một hệ chuyecircn giaTrong phần nagravey cacircu hỏi thường được đặt ra lagrave tại sao cần phải xacircy dựng một hệ chuyecircn giaTrước khi bắt đầu phải xaacute định rotilde bagravei toaacuten đạt ra lagrave jiAi lagrave chuyecircn giaAi lagrave người sử dụng
1 Diễn giải (InterPretation) Nghiecircn cứu 1 vấn đề -gt Dựa trecircn những biểu hiện thuộc tiacutenh đặc trưng becircn ngoagravei -gt Tư vấn
(hoặc đưa ra kết luận hay mocirc tả dễ hiểu từ tập dữ liệu thocirc)
2 Bagravei toaacuten dự baacuteo (Prediction) Coacute thể dự đoaacuten được hagravenh vi kết quả dựa trecircn caacutec hiện tượng -gt dự baacuteo
VD Dự baacuteo thời tiết động đấthellip
3 Bagravei toaacuten chẩn đoaacuten (Diagnoss) Xaacutec định caacutec lỗi caacutec bộ phận hỏng hoacutec của hệ thống dựa trecircn caacutec dữ liệu quan saacutet được
4 Bagravei toaacuten gỡ rối (Debugging) Mocirc tả caacutec phương phaacutep khắc phục hệ thống khi gặp sự cố
5 Bagravei toaacuten thiết kế Lựa chọn cấu higravenh caacutec đối tượng nhằm thoả matilden một số ragraveng buộc nagraveo đoacute
6 Giảng dạy Phần mềm dạy học coacute thể chuẩn đoaacuten vagrave sủa lỗi của học sinh trong quaacute trigravenh học tập
Để xaacutec định đuacuteng bagravei toaacuten magrave chuacuteng ta cần giải quyết thigrave phải trả lời đc một số cacircu hỏi
- cần hệ chuyecircn gia
Bước 2 thu thập tri thức lựa chọn cocircng cụ vagrave aacutep dụng
Trong bước thu thập tri thức vấn đề quan trọng lagrave lựa chọn chuyecircn gia những người magrave sẽ đoacuteng goacutep tri thức cho hệ thống Thocircng thường trong suốt quaacute trigravenh phaacutet triển thigrave chuyecircn gia được xem như một thagravenh viecircn của đội phaacutet triển
Hiện nay coacute rất nhiều cocircng cụ để xacircy dựng một hệ chuyecircn gia Phổ biến nhất lagrave JESS CLIPS vagrave OPS5
Bước 3 Thiết kế cơ sở tri thức thiết kế hệ thốngTri thức được biểu diễn trường minh trong cơ sở tri thức
Caacutec chuyecircn gia vagrave kỹ sư tri thức sẽ đối thoại với nhau bằng caacutec kỹ thuật đối thoại Suy diễn (SD) bảng Mocirc higravenh hoacutea SD quy nạp phacircn loại
Vấn đề bagraveo trigrave vagrave phaacutet triển
Caacutec hệ chuyecircn gia đogravei hỏi phải bảo trigrave vagrave phaacutet triển nhiều hơn so với caacutec hệ thống khaacutec Phải thường xuyecircn bổ sung tri thức mới vagrave thay đổi caacutec tri thức cũ để đổi mới hệ chuyecircn gia
Thu thập vagrave khắc phục lỗi do người sử dụng phaacutet hiện để kịp thời khắc phục những sai soacutet của hệ chuyecircn gia
75 Lợi iacutech vagrave hạn chế của caacutec hệ chuyecircn gia
Một số lợi iacutech chiacutenh
Thời gian trả lời hợp lyacute bằng hoặc nhanh hơn so với chuyecircn gia (người) để đi đến cugraveng một quyết định Hệ chuyecircn gia lagrave một hệ thống thời gian thực (real time system)
Khả năng trả lời với mức độ tinh thocircng bằng hoặc cao hơn so với chuyecircn gia (người) trong cugraveng lĩnh vực
Hệ chuyecircn gia giuacutep cho hiệu quả lagravem việc tăng bằng việc sử dụng tập caacutec luật một caacutech nhanh choacuteng magrave ko bị nhầm lẫn chuyecircn gia lagrave người coacute thể quecircn đi một số tri thức cơ sở lyacute luậ nhưng HCG thigrave ko
Quyết định của một người chuyecircn gia coacute thể bị thay đổi vagrave ko coacute tiacutenh thống nhất như quyết định của một hệ chuyecircn gia tạo ra
Hệ chuyecircn gia giuacutep cho người sử dụng coacute thể trau dồi sự hiểu biết trecircn lĩnh vuej cụ thể magrave noacute giải quyết hỗ trợ người ra quyết định coacute trigravenh độ như 1 chuyecircn gia trong quaacute trigravenh gia quyết định
Kiến thức của rất nhiều chuyecircn gia về một lĩnh vực nagraveo đoacute được đưa vagraveo hệ chuyecircn gia lagravem cho CSTT cuat HCG phong phuacute vagrave rộng lớn hơn rất nhiều
HCG giải thiacutech caacutec bước suy luận một caacutech dễ hiểu nhất quaacuten luacutec nagraveo cũng coacute thể sử dụng ko như chuyecircn gia con người
Hạn chế của caacutec hệ chuyecircn gia
Nhược điểm lớn nhất của hệ chuyecircn gia lagrave những yacute kiến chuyecircn mocircn thường rất khoacute matilde hoacutea vagrave giải neacuten
Hệ chuyecircn gia khocircng coacute khả năng tự học tự cập nhật kiến thức mới như caacutec chuyecircn gia magrave cần phải được matilde hoacutea lại khi noacute được cập nhật
Hệ chuyecircn gia khocircng thể nhận ra được vấn đề khocircng nằm trong miền kiến thức của hệ thống
Chương 8 Tri thức vagrave tiếp nhận
1 Bao gồm caacutec vấn đề
Dữ liệu thực tế đo lường hoặc quan saacutet coacute hoặc khocircng coacute bối cảnh
Thocircng tin dữ liệu được tổng hợp một caacutech hữu iacutech để giải quyết những khoacute khăn trong việc đưa ra quyết định
Tri thức bao gồm caacutec ứng dụng quy tắc thocircng tin hướng dẫn của người ra quyết định
2 Những caacutei nhigraven về tri thức
Đại diện lagravem thế nagraveo để diễn tả tri thức viacute dụ như một quyển saacutech khocircng phải lagrave tri thức nhưng noacute lại lagrave một đại diện của tri thức
Sản xuất tri thức lagrave một tập hơp của hagraveng tồn kho coacute thể được sản xuất cũng như mua lại
Tri thức lagrave 1 trong 6 trạng thaacutei của hệ thống
1Dữ liệu 2Thocircng tin 3Cấu truacutec thocircng tin 4Sự thấu hiểu 5Yacute kiến 6 Quyết định
3 Caacutec loại tri thức Phổ biến mocirc tả dữ liệu thocircng tin thủ tục mọi thứ lagravem như thế nagraveo lập luận chiacutenh saacutech hoặc caacutec quy tắc
4 Thu thập Tri thức hệ chuyecircn gia Hầu hết caacutec phương phaacutep đều bắt đầu với mocirc higravenh của caacutec taacutec vụ trong đoacute
hệ chuyecircn gia được xacircy dựng Trong đoacute mocirc tả về caacutec lĩnh vực được tạo ra Caacutec kỹ sư sử dụng caacutec mocirc higravenh giả thuyết vagrave nhận thức về quaacute trigravenh phacircn
tiacutech để gợi ra caacutech giải quyết vấn đề về tri thức từ caacutec chuyecircn gia
5 Caacutec chiều của thu thập tri thức KE- driven caacutec kỹ sư trao đổi trực tiếp với caacutec chuyecircn gia Expert-driven Caacutec chuyecircn gia trực tiếp đưa chuyecircn mocircn của họ vagraveo hệ
thống maacutey tiacutenh Machine-driven Sử dụng caacutec cocircng cụ suy luận để triacutech xuất tri thức từ một
tập caacutec viacute dụ
6 Kỹ thuật thu thập tri thức Trao đổi gồm 2 loại cơ bản lagrave coacute cấu truacutec(coacute kịch bản) vagrave khocircng coacute cấu
truacutec( đối thoại trực tiếp) Giao thức phacircn tiacutech bằng lời Khi caacutec chuyecircn gia thực hiện một cocircng việc
của họ thigrave một bản ghi về cocircng việc đoacute được thực hiện Caacutec kỹ sư sẽ xacircy dựng mocirc higravenh cho những gigrave được ghi lại trong bản ghi
Phương phaacutep sagraveng lọc caacutec chuyecircn gia so saacutenh caacutec nhoacutem liecircn tiếp trong ba đối tượng vagrave cho biết tại sao nhoacutem thứ hai lại khaacutec nhoacutem thứ ba
7 Thu thập tri thức từ nhiều nguồn Thu thập tri thức từ nhiều nguồn lagrave cần thiết để coacute được đầy đủ caacutec tri thức
cho một vấn đề quan điểm yacute kiến traacutei ngược nhau thường phaacutet sinh Phương phaacutep đồng thuận sẽ giuacutep giải quyết được vấn đề macircu thuẫn Kỹ thuật phacircn tiacutech Meta lagrave kỹ thuật được aacutep dụng trong caacutec trường hợp
khaacutec Caacutech tiếp cận bằng định lượng đogravei hỏi caacutec kỹ sư cần cacircn nhắc yếu tố đầu vagraveo của caacutec chuyecircn gia khaacutec nhau
8 Xaacutec nhận hợp lệ vagrave kiểm tra tri thức Một khi thu thập tri thức noacute phải được đaacutenh giaacute về khả năng sử dụng vagrave độ
chiacutenh xaacutec Hai vấn đề cụ thể lagrave hiệu lực của những kiến thức vagrave kiểm tra việc xacircy dựng cơ sở của tri thức
Cần xaacutec nhận xem liệu hệ thống coacute thể hoạt động ở mức độ tối thiểu khocircng
Xaacutec minh liecircn quan đến việc so saacutenh từng chi tiết kỹ thuật của hệ thống những gigrave đatilde được thực hiện cuối cugraveng
9 Một số caacutec biện phaacutep xaacutec nhận Độ chiacutenh xaacutec Khả năng thiacutech nghi Mức độ đầy đủ Bề rộng Độ sacircu Hiệu lực Tổng quan Chiacutenh xaacutec Hiện thực Độ tin cậy Tiacutenh hữu dụng Mức độ
Chương 9 Học maacutey
1 Logic mờ vagrave ngocircn ngữ mờ(Fuzzy Logic and Linguistic Ambiguity)
Ngocircn ngữ tự nhiecircn gồm những khaacutei niệm mơ hồ vagrave khocircng chiacutenh xaacutectruyền tải ngữ nghĩa thocircng qua tiacutenh xấp xỉkhocircng rotilde ragraveng
Những xấp xỉ nagravey giuacutep con người coacute thể truyền tải hết được yacute nghĩa nhưng maacutey thigrave khocircng hiểu
Lagravem sao biểu diễn caacutec tri thức sử dụng caacutec khaacutei niệm khocircng rotilde ragraveng(mờ) hoặc khocircng chiacutenh xaacutec
2 Khaacutei niệm cơ bản của logic mờ tập mờ lagrave những tập hợp khocircng coacute một giới hạn rotilde Mỗi phần tử của noacute chỉ
chứa một mức độ hagravem liecircn thuộc của từng phần tử Vigrave vậy tập mờ khocircng giống như tập cổ điển Tập mờ coacute thể kết hợp với nhau qua những luật mờ magrave đặc trưng cho những hagravenh động trạng thaacutei vagrave thuộc tiacutenh của logic mờ được tận dụng khi thực hiện một bộ điều khiển mờ
Logic mờ dựa trecircn yacute tưởng mỗi phần tử thuộc vagraveo một tập hợp ở một mức độ nagraveo đấy
Locircgic mờ cho pheacutep độ liecircn thuộc (microA )coacute giaacute trị trong khoảng (01) Locircgic mờ coacute thể được coi lagrave mặt ứng dụng của lyacute thuyết tập mờ để xử lyacute caacutec
giaacute trị trong thế giới thực cho caacutec bagravei toaacuten phức tạp
3 So saacutenh tiacutenh đuacuteng đắn logic mờ vagrave xaacutec suất Xaacutec suất thigrave đề cập đến khả năng xảy ra một biến cố hay một điều gigrave đoacute Logic mờ đề cập đến cấp độ magrave đặc tiacutenh ở hiện tại
o viacute dụ1 người coacute chiều cao 6 feet thigrave coacute cấp độ lagrave 05 về chiều cao
4 Ưu điểm của logic mờ Caacutech tiếp cận rất tự nhiecircnkhocircng phức tạp Coacute thể mocirc higravenh hoacutea caacutec hagravem phi tuyến tugravey yacute phức tạp
Coacute thể tận dụng được kinh nghiệm từ những chuyecircn gia hagraveng đầu trong mọi lĩnh vực
Logic mờ được xacircy dựng dựa trecircn ngocircn ngữ tự nhiecircnNền tảng của logic mờ lagrave dựa trecircn cơ sở giao tiếp của con người
5 Nhược điểm của logic mờ Trong 1 hệ thống phức tạpsử dụng logic mờ coacute thể trở thagravenh trở ngại cho
việc xaacutec thực độ tin cậy của hệ thống Cơ chế lập luận mờ khocircng thể học hỏi từ những lỗi sai
6 Mạng noron nhacircn tạo(ANN) Mạng noron nhacircn tạo lagrave một mocirc phỏng xử lyacute thocircng tinđược nghiecircn cứu ra
từ hệ thống thần kinh của sinh vậtgiống như bộ natildeo để xử lyacute thocircng tin ANNs lagrave chương trigravenh dựa trecircn maacutey tiacutenh đơn giản coacute chức năng lagrave một mocirc
higravenh bagravei toaacuten khocircng gian dựa trecircn thử nghiệm vagrave baacuteo lỗi
7 Học từ kinh nghiệm Tiến trigravenh Một mẫu dữ liệu được biểu diễn như một mạng lưới noronANN ldquodự
đoaacutenrdquo 1 đầu radự đoaacuten được so saacutenh với giaacute trị thực tế hoặc giaacute trị chiacutenh xaacutecNếu đoaacuten được chiacutenh xaacutec thigrave khocircng coacute hagravenh động nagraveo được thực hiện
Nếu dự đoaacuten sai ANN kiểm tra lại vagrave xaacutec định lại thocircng số để điều chỉnh Một mẫu dữ liệu khaacutec được biểu diễn vagrave quaacute trigravenh nagravey được lặp lại
8 Nguyecircn tắc cơ bản của cocircng nghệ nơron Caacutec yếu tố xử lyacute cơ bản trong hệ thống thần kinh của con người lagrave tế bagraveo
thần kinhMạng lưới của tế bagraveo nagravey lagrave liecircn kết với nhau nhận được thocircng tin từ caacutec cảm biến trong mắt taihellip
Thocircng tin nhận được bởi tế bagraveo thần kinh hoặc lagrave sẽ kiacutech thiacutech noacute(sẽ được chuyển qua 1 thocircng điệp dọc theo mạng lưới) hoặc lagrave sẽ ngăn cản noacute(ngăn cản dograveng thocircng tin)
Độ nhạy coacute thể thay đổi qua thời gian hoặc sau khi coacute được kinh nghiệm
9 Cấu truacutec mạng Một ANN gồm 3 lớp cơ bản
Lớp đầu vagraveo nhận dữ liệu Lớp becircn trong hoặc lagrave lớp ẩn xử lyacute dữ liệu Lớp đầu ra chuyển tiếp kết quả cuối cugraveng của mạng
10Mạng nơ ron Thường coacute nhiều đầu vagraveo mỗi đầu vagraveo với mức ảnh hưởng vagrave tầm quan
trọng riecircng của noacute Một đầu vagraveo quan trọng coacute thể được sử dụng để khuếch đại đầu ra caacutec hagravem trạng thaacutei tổng hợp caacutec trọng số của caacutec yếu tố
đầuvagraveo khaacutec nhauvagraveo một giaacute trị duy nhất Caacutec hagravem chuyển giao xử lyacute caacutec giaacute trị trạng thaacutei vagrave tạo đầu ra
11Huấn luyện mạng nơ ron Trong mocirc higravenh coacute giaacutem saacutetANN được đến so saacutenh dự đoaacuten của chiacutenh
noacute với thocircng tin phản hồi coacute chứa caacutec kết quả mong muốn ANN sẽ phải tigravem caacutech thay đổi caacutec tham số becircn trong củamigravenh (caacutec trọng số vagrave caacutec ngưỡng) để tạo necircn một aacutenh xạ coacute khả năng aacutenh xạcaacutec đầu vagraveo thagravenh caacutec đầu ra mong muốn Sự thay đổi nagravey được tiến hagravenh nhờ việc so saacutenh giữa đầu ra thực sự vagrave đầu ra mong muốn
Trong mocirc higravenh khocircng coacute giaacutem saacutetANN nhận được dữ liệu vagraveo nhưng khocircng phải coacute bất kỳ thocircng tin phản hồi về kết quả mong muốn
Phần lớn caacutec ứng dụng nằm trong vugraveng của caacutec bagravei toaacuten ước lượng như mocirc higravenh hoacuteathống kecirc neacuten lọc phacircn cụm
12Lợi iacutech Liecircn kết với mạng noron Traacutenh caacutech lập trigravenh tường minh Giảm nhu cầu của chuyecircn gia ANNs thigrave thiacutech nghi với caacutec yếu tố đầu vagraveo thay đổi Khocircng cần thiết cho cơ sở tri thức tinh chế ANNs coacute tiacutenh động vagrave cải thiện với việc sử dụng Coacute khả năng xử lyacute dữ liệu khocircng chiacutenh xaacutec hoặc khocircng đầy đủ Cho pheacutep tổng quaacutet hoacutea từ thocircng tin cụ thể Cho pheacutep thu thập cảm giaacutec thocircng thường vagraveo miền giải quyết vấn đề
13Hạn chế của việc liecircn kết với mạng noron ANNs khocircng thể giải thiacutech được suy luận Bản chất hộp đen thường khiến cho vấn đề traacutech nhiệm vagrave độ tin cậy phaacutet
sinh lagrave khoacute khăn Lặp đi lặp lại quaacute trigravenh huấn luyện rất tốn thời gian Nguồn lực caacutec nhagrave phacircn tiacutech vagrave thiết kế coacute tay nghề cao vẫn lagrave đaacuteng lo
ngại Cocircng nghệ ANN thuacutec đẩy hạn chế của phần cứng hiện tại ANN yecircu cầu phải coacute sự tin tưởng ở đầu ra
14Giới thiệu về thuật toaacuten di truyền Cũng như mạng lưới thần kinh caacutec thuật toaacuten di truyền được dựa trecircn lyacute
thuyết sinh học Thuật toaacuten di truyền tigravem thấy nguồn gốc của chuacuteng trong caacutec lyacute thuyết
tiến hoacutea của chọn lọc tự nhiecircn vagrave thiacutech ứng với biến đổi khiacute hậu Kết quả thuật toaacuten di truyền lagrave từ giao phối 2 caacute thể trong quần thế để tạo
ra con caacutei đocirci khi tốt hơn so với bậc cha mẹ của chuacuteng 15Caacutec thagravenh phần cơ bản của thuật toaacuten di truyền
Toaacuten tử chọn lọc Caacutec caacute thể tốt được chọn lọc để đưa vagraveo thế hệ sau Sự chọn lọc nagravey căn cứ vagraveo độ thiacutech nghi với mocirci trường của mỗi caacute thể
Toaacuten tử lai gheacutep (crossover) Hai caacute thể cha vagrave mẹ trao đổi caacutec gen với nhau để tạo ra caacute thể con
Toaacuten tử đột biến (mutation) Một caacute thể thay đổi một số gen để biến đổi thagravenh một caacute thể mớiTất cả caacutec toaacuten tử trecircn khi thực hiện đều mang tiacutenh ngẫu nhiecircn
16Quaacute trigravenh cơ bản của một thuật toaacuten di truyền Khởi tạo
Đaacutenh giaacute quần thể
Lựa chọn NST thiacutech hợp nhất vagrave loại bỏ NST yếu nhất
Quy trigravenh giao nhau vagrave cải thiện quần thể
đột biến tiến trigravenh để khaacutem phaacute ra NST mới
17Ưu nhược điểm của việc kết hợp với thuật toaacuten di truyền Kiacutech thước quần thể lagrave 1 yếu tố quan trọng trong tốc độ của việc tigravem
kiếmnhưng noacute tương đối dễ dagraveng để dự đoaacuten tốc độ nagravey Giao nhau hoặc đột biến lagrave khocircng necircn đc sử dụng quaacute thường xuyecircn Luocircn coacute được iacutet nhất 1 giải phaacutep hợp lyacute Necircn coacute thể aacutep dụng chuacuteng cho caacutec vấn đề magrave chuacuteng ta khocircng coacute hướng
về caacutech giải quyết Sức mạnh của thuật toaacuten xuất phaacutet từ khaacutei niệm đơn giảnkhocircng phải từ
một thủ tục thuật toaacuten phức tạp 18Tương lai của học maacutey
Mạng lưới thần kinh nhacircn tạo vượt quaacute năng lực của con người trong caacutec trường hợp bị cocirc lập
Về mặt lyacute thuyếtmột maacutey tiacutenh coacute thể xử lyacute dũ liệu nhanh hơn hagraveng triệu lần so với 1 con người
May mắn thay cho chuacuteng tacon người tốt hơn nhiều khi magrave coacute được dữ liệumaacutey tiacutenh khocircng coacute 1 số thứ như lagrave 5 giaacutec quan
CHƯƠNG 10 KHO DỮ LIỆU
1 Kho dữ liệu Kho dữ liệu lagrave tuyển tập caacutec cơ sở dữ liệu tiacutech hợp hướng chủ đề được
thiết kế để trợ giuacutep cho một hệ hỗ trợ quyết định
Theo John Ladley Cocircng nghệ kho dữ liệu lagrave tập caacutec phương phaacutep kỹ thuật vagrave caacutec cocircng cụ coacute thể kết hợp hỗ trợ nhau để cung cấp thocircng tin cho người sử dụng trecircn cơ sở tiacutech hợp từ nhiều nguồn dữ liệu nhiều mocirci trường khaacutec nhau
Kho dữ liệu thường rất lớn tới hagraveng trăm GB hay thậm chiacute hagraveng Terabyte
2 Kho dữ liệu vận hagravenh (ODS) Một kho dữ liệu vận hagravenh Aacutep dụng kỹ thuật kho dữ liệu vagraveo caacutec hệ xử
lyacute giao taacutec lưu trữ dữ liệu cho một ứng dụng đặc thugrave Noacute đưa vagraveo kho dữ liệu một dograveng caacutec dữ liệu thocirc được thiết kế
3 So saacutenh
Kho dữ liệu vận hagravenh Kho dữ liệu
Dữ liệu theo chủ đề Dữ liệu theo chủ đề
Dữ liệu tiacutech hợp Dữ liệu tiacutech hợp
Dữ liệu thay đổi Dữ liệu khocircng thay đổi
Dữ liệu được cập nhật khi thay đổi
Dữ liệu giữ nguyecircn
Chỉ coacute dữ liệu hiện tạiDữliệu hiện tại vagrave dữ liệu lịch sử
Chu kỳ lagravem tươi dữ liệu ngắn Chu kỳ lagravem tươi dữ liệu dagravei
Chỉ coacute dữ liệu chi tiết Dữ liệu chi tiết vagrave dữ liệu tổng kết
Dugraveng cho caacutec quyết định ngắn hạn
Dugraveng cho hoạch định dagravei hạn
4 Kho dữ liệu cục bộ (Data Mart - DM)
Kho dữ liệu cục bộ lagrave CSDL coacute những đặc điểm giống với kho dữ liệu nhưng với quy mocirc nhỏ hơn vagrave lưu trữ dữ liệu về một lĩnh vực một chuyecircn ngagravenh
Data mart phụ thuộc Chứa những dữ liệu được lấy từ DW vagrave những dữ liệu nagravey sẽ được triacutech lọc vagrave tinh chế tiacutech hợp lại ở mức cao hơn để phục vụ một chủ đề nhất định của Datamart
Data mart độc lập Khocircng giống như Datamart phụ thuộc Data mart độc lập được xacircy dựng trước DW vagrave dữ liệu được trực tiếp lấy từ caacutec nguồn khaacutec nhau
5 Siecircu dữ liệu Metadata lagrave dữ liệu để mocirc tả dữ liệu Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột
một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi Metadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu
6 Mocirci trường kho dữ liệu Hệ thống của tổ chức vagrave kho cung cấp dữ liệu để xacircy dựng kho dữ liệu Trong quaacute trigravenh chuyển dữ liệu từ caacutec nguồn khaacutec nhau dữ liệu coacute thể
được lagravem sạch hoặc chuyển đổi vagrave vigrave thế DW được xem như lagrave một chuẩn cho việc lưu trữ
Đồng thời siecircu dữ liệu được ghi lại Cuối cugraveng DW hoặc siecircu thị coacute thể được sử dụng để tạo ra một kho dữ
liệu ldquocaacute nhacircnrdquo 7 Caacutec đặc điểm của kho dữ liệu
Đặc điểm Mocirc tả
Hướng chủ đề - DL tổ chức theo caacutech thức người dugraveng tham chiếu
Tiacutech hợp - Dữ liệu ldquosạchrdquo loại bỏ tiacutenh thiếu nhất quaacuten
Khocircng thay đổi - DL ldquochỉ đọcrdquo người dugraveng khocircng thay đổi được
Chuỗi thời gian - DL lagrave chuỗi thời gian khocircng phải lagrave trạng thaacutei hiện tại
Được tổng kết - DL vận hagravenhthao taacutec khi cần thiết
được kết hợp lại thagravenh dạng coacute thể dugraveng được cho quyết định
Kiacutech cỡ lớn hơn - Lưu giữ theo chuỗi thời gian tức lagrave giữ lại nhiều DL
Khocircng được chuẩn hoacutea - Coacute thể dư thừa DLSiecircu dữ liệu - Dữ liệu của dữ liệu được lưu trữNguồn dữ liệu - DL vận hagravenh (caacutec hệ sẵn coacute) cugraveng
với caacutec nguồn ngoagravei 8 Kho dữ liệu hướng chủ đề
Hướng chủ để coacute nghĩa lagrave kho dữ liệu được tổ chức xung quanh caacutec chủ đề chiacutenh như khaacutech hagraveng sản phẩm sản xuất Tập trung vagraveo việc mocirc higravenh hoacutea vagrave phacircn tiacutech dữ liệu cho caacutec nhagrave ra quyết định magrave khocircng tập trung vagraveo caacutec xử lyacute thocircng thường Cung cấp cho người dugraveng một khung nhigraven toagraven vẹn đơn giản vagrave đầy đủ về caacutec sự kiện quanh caacutec chủ đề
9 Dữ liệu trong DW được tiacutech hợp Dữ liệu trong kho dữ liệu được xacircy dựng bằng caacutech tổng hợp dữ liệu từ
nhiều nguồn khaacutec nhau vagrave caacutec nguồn coacute tổ chức khaacutec nhau Cơ sở dữ liệu caacutec file excel caacutec flat file hoặc caacutec raw file Khi đưa vagraveo kho dữ liệu caacutec dữ liệu được lagravem sạch vagrave tiacutech hợp dữ liệu nhằm đảm bảo tiacutenh nhất quaacuten của dữ liệu
10Kiến truacutec kho dữ liệu Tầng cơ sở dữ liệu hoạt động Tầng truy xuất thocircng tin Tầng truy xuất dữ liệu Tầng siecircu dữ liệu Tầng quản lyacute tiến trigravenh Tầng thocircng điệp của ứng dụng Tầng vật liacute của kho dữ liệu Tầng trigravenh diễn dữ liệu
11Higravenh trạng kho dữ liệu Kho dữ liệu ảo - người dugraveng cuối coacute thể truy cập trực tiếp đến kho dữ liệu
sử dụng caacutec cocircng cụ cho pheacutep ở tầng truy xuất dữ liệu Kho dữ liệu trung tacircm-1 cơ sở dữ liệu vật lyacute chứa tất cả dữ liệu cho một
vugraveng chuyecircn dụng nagraveo đoacute
Kho dữ liệu phacircn taacuten- Thagravenh phần được phacircn taacuten qua nhiều hệ cơ sở dữ liệu vật lyacute
12METADATA- Siecircu dữ liệu Định nghĩa Siecircu dữ liệu lagrave dữ liệu về dữ liệu Lagrave 1 lưu trữ dugraveng để
Miecircu tả kho dữ liệu tổng thể Nhận dạng kiểu kho dữ liệu Quản liacute quaacute trigravenh tiacutech hợp dữ liệu Quản liacute quaacute trigravenh cập nhật kho dữ liệu Quản liacute bảo mật
Lagrave chigravea khoacutea quyết định sự thagravenh cocircng của kho dữ liệu luocircn được thay đổi vagrave cập nhật theo sự phaacutet triển của kho dữ liệu
Dugraveng để quản liacute điều khiển kho dữ liệu Sự ra đời của kho dữ liệu như 1 cấu truacutec hỗ trợ ra quyết định siecircu dữ liệu
được xem như nguồn tagravei nguyecircn dữ liệu Siecircu dữ liệu lagrave trừu tượng Chuacuteng lagrave dữ liệu bậc cao cung cấp mocirc tả ngắn
gọn caacutec dữ liệu bậc thấp hơn 13Hoạt động của Siecircu dữ liệu
Siecircu dữ liệu rất cần thiết trong việc chuyển hoacutea thocircng tin trở thagravenh tri thức Lagrave chigravea khoacutea giuacutep chuacuteng ta xử lyacute được dữ liệu thocirc Viacute dụ một dograveng dữ liệu baacuten hagraveng 1023 K596 11121 agraveNoacute sẽ khocircng coacute nghĩa gigrave cho đến khi chuacuteng ta đưa vagraveo siecircu dữ liệu (thư
mục chứa dữ liệu) agrave cửa hagraveng 1023 sản phẩm K596 vagrave số tiền baacuten được lagrave 11121 đocirc la
14Sự cần thiết phải nhất quaacuten trong kho dữ liệu Kho dữ liệu được xacircy dựng cho lợi iacutech của những nhagrave phacircn tiacutech kinh
doanh caacutec nhagrave quản trị cho tất cả caacutec khu vực chức năng Trong cơ sở dữ liệu riecircng caacutec khu vực khaacutec nhau coacute thể định nghĩa vagrave lưu
trữ dữ liệu thocircng qua phiecircn bản của chiacutenh noacute Khi dữ liệu được lấy từ những vugraveng khaacutec nhau đoacute vagrave được đặt vagraveo kho dữ
liệu Việc chuyển đổi vagrave lagravem sạch caacutec tiến trigravenh sẽ đảm bảo noacute lagrave duy nhất được tiacutech hợp tại một mức của tổ chức
15Ragrave soaacutet lại dữ liệu ndash Thực thi siecircu dữ liệu
Bất kể cấu truacutec tự nhiecircn của 1 cacircu truy vấn thế nagraveo thigrave caacutec thagravenh phần của siecircu dữ liệu rất quan trọng đối với người ra quyết định
Bảng thuộc tiacutenh khoacutea được lưu trữ bởi kho dữ liệu Tập hợp dữ liệu được lấy từ đacircu Những chuyển đổi nagraveo được thực thi với việc lagravem sạch
16Siecircu dữ liệu lagrave gigrave Metadata - lagrave thocircng tin mocirc tả nội dung của cơ sở dữ liệu (CSDL) Metadata baacuteo cho người dugraveng biết thời gian cập nhật sau cugraveng của dữ liệu
định dạng vagrave mục điacutech sử dụng của noacute Những thocircng tin nagravey coacute thể hướng dẫn người dugraveng duyệt qua CSDL vagrave
giuacutep họ hiểu được yacute nghĩa vagrave ngữ cảnh của dữ liệu Trong CSDL metadata lagrave caacutec dạng biểu diễn khaacutec nhau của caacutec đối tượng
trong CSDL Trong CSDL quan hệ metadata lagrave caacutec định nghĩa của bảng cột CSDL
view vagrave nhiều đối tượng khaacutec Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột
một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi -gtMetadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu
Bảng chuyển đổi Ghi lại những chuyển đổi đatilde được thực hiện
Lịch sử thực thi Ghi lại những dữ liệu đatilde được
phacircn tiacutech
Higravenh thaacutei kết nốiGhi lại những dữ liệu được kết nối vagrave tần suất
17Aacutenh xạ thocircng thường của siecircu dữ liệu Bản ghi aacutenh xạ chuyển đổi bao gồm
Định danh của nguồn gốc Chuyển đổi thuộc tiacutenh Chuyển đổi thuộc tiacutenh vật lyacute Matilde hoacutea tham chiếu bảng chuyển đổi Đổi tecircn Đổi khoacutea Gaacuten giaacute trị cho thuộc tiacutenh mặc định Chọn logic cho caacutec nguồn nhiều giaacute trị Đổi thuật toaacuten
18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để
phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai
lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave
tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec
Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm
Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo
19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua
caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau
SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được
Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra
một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức
Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ
Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ
Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech
CHƯƠNG 11 KHAI PHAacute DỮ LIỆU
1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn
ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993
Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng
2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd
1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều
2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP
3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn
4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng
5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server
6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo
7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động
8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời
9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều
10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện
11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech
12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP
3 Xử lyacute phacircn tiacutech trực tuyến OLAP
MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave
dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu
ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave
thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu
HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave
ROLAP4 Khai phaacute dữ liệu
Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh
khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn
Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan
5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp
6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại
Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp
Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec
Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt
Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra
Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh
vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho
Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec
Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm
Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục
Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng
gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp
Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn
Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec
Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper
Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2
Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25
Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước
Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng
Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện
trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp
Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute
độ hỗ trợ ge ngưỡng minsup
độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan
Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn
Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết
Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu
MOLAP ROLAP HOLAP
Lưu trữ dữ liệu cơ sở
Khối Bảng quan hệ Bảng quan hệ
Lưu trữ thocircng tin tổng hợp
Khối Bảng quan hệ Khối
Hiệu suất thực hiện truy vấn
Nhanh nhất Chậm nhất Nhanh
Tiecircu thụ khocircng gian lưu trữ
Nhiều Thấp Trung bigravenh
Chi phiacute bảo trigrave Cao Thấp Trung bigravenh
Caacutec đặc trưng thống nhất của mỗi lược đồ cụ thể giữ vai trograve quan trọng trong việc xaacutec định caacutech tiếp cận tốt nhất để thiết kế một hệ thống mới
Chương 2Quyết định vagrave quyết định của nhagrave sản xuất10Quaacute trigravenh ra quyết định
Quaacute trigravenh ra quyết định gồm coacute 3 giai đoạn (Simon 1977)bull Tigravem hiểu bagravei toaacuten dẫn đến quyết định
+Xaacutec định mục tiecircu tổ chức+Tigravem kiếm vagrave tập hợp dữ liệu+Nhận diện xaacutec định chủ thể bagravei toaacuten+phacircn loại vagrave phaacutet biểu vấn đề
bull Thiết kế (design) phacircn tiacutech vagrave xacircy dựng caacutec diễn trigravenh hagravenh động+Thiết lập mocirc higravenh+Lập bảng tiecircu chuẩn chọn lựa+Tigravem kiếm caacutec phương aacuten+Tiecircn đoaacuten vagrave đo lường caacutec kết cục
bull Chọn lựa (choice) chọn một diễn trigravenh trong tập diễn trigravenh+Giải phaacutep cho mocirc higravenh+Phacircn tiacutech độ nhạy+Chọn (caacutec) phương aacuten tốt nhất+Hoạch định việc hiện thực
tiếp theo giai đoạn chọn lựa lagrave giai đoạn hiện thực (implementation)11Người ra quyết định
Người ra quyết định (decision maker) giữ một vai trograve tacircm thần phacircn liệt vigrave vừa được coi lagrave một bước trong quaacute trigravenh vagrave cũng lại lagrave người tham gia
Phacircn lớp người ra quyết định-Quyết định caacute nhacircn coacute thể lagrave 1 người hoặc một hệ thống maacutey tiacutenh đơn lẻ-Nhiều người ra quyecirct định coacute thể lagrave
+Nhoacutem (group)trong đoacute mọi thagravenh viecircn đều coacute tiếng noacutei trong việc ra quyết định
+Đội(team) Caacutec thagravenh viecircn hỗ trợ một người ra quyết định duy nhất+Tổ chứcTrong đoacute cần sự thỏa thuận chung
12Caacutec kiểu ra quyết định Style lagrave caacutech magrave người quản lyacute ra quyết định
Hiệu lực của mỗi style riecircng biệt phụ thuộc vagraveo ngữ cảnh bagravei toaacuten nhận thức của người ra quyết định vagrave tập caacutec giaacute trị caacute nhacircn của bản thacircn họ
Độ phức tạp của caacutec điều đoacute liecircn kết lại với nhau trong việc higravenh thagravenh decision style
Caacutec kiểu ra quyết định Directive ndash kết hợp đogravei hỏi về cấu truacutec bagravei toaacuten cao với mức độ nhập nhằng thấp
Thocircng thường đacircy lagrave caacutec quyết định coacute bản chất kỹ thuật vagrave đogravei hỏi iacutet thocircng tin Analytical ndash Mức độ nhập nhằng lớn hơn vagrave đogravei hỏi nhiều thocircng tin hơn Conceptual ndash Mức độ nhập nhằng cao vagrave thường gần gũi với caacutech ra quyết định
của con người Behavioral ndash đogravei hỏi lượng dữ liệu nhỏ vagrave thể hiện caacutei nhigraven ngắn hạn Thường
xảy ra xung đột necircn phải dựa vagraveo sự đồng thuận Caacutec kiểu ra quyết định trong thiết kế hệ trợ giuacutep quyecirct định
Những cản trở lớn chiacutenh lagrave phản ứng của người ra quyết định trước aacutep lực vagrave phương phaacutep dugraveng để giải bagravei toaacuten
Viacute dụ đối với những người khocircng chịu được aacutep lực trong dạng directive thigrave giao diện cần cho pheacutep người ra quyết định kiểm soất được hệ thống với khocircng coacute quaacute nhiều dữ liệu đầu vagraveo
Đối với kiểu analytic DSS cần cho pheacutep truy cập tới nhiều nguồn dữ liệu magrave người ra quyết định sẽ phacircn tiacutech
13Khoacute khăn khi xacircy dựng DSS
- Thocircng tin mocirc higravenh cấu truacutec -gt iacutet thocircng tin
- Khả năng của con người (khả năng hiểu biết) chỉ xử lyacute được từ 5-gt9 quaacute trigravenh thocircng tin khaacutec nhau
- Khocircng chắc chắn ( mức độ hoagraven thagravenh vagrave tiacutenh chiacutenh xaacutec)
- Coacute nhiều lựa chọn vagrave đa mục tiecircu
Chương 3Quyết định trong tổ chức
14Tổ chức lagrave gigrave Tổ chức Lagrave 1 hệ thống thống nhất caacutec nguồn tagravei nguyecircnĐược cấu thagravenh bởi caacutec
hệ thống nhỏ hơn ragraveng buộc với nhau bởi caacutec mục tiecircu đề ra
Tổng thể 1 tổ chức sẽ mạnh mẽ hơn rất nhiều so với tất cả caacutec thagravenh phần của noacute cộng lại
Mối liecircn hệ của caacutec quyecirct định Mục điacutech chiacutenh của caacutec tổ chức lagrave đưa ra caacutec quyết định trong mocirci trường kinh doanh Caacutec Quyết định phải phugrave hợp với giới hạncaacutec chiacutenh saacutech caacutec thủ tục vagrave lĩnh vực hoạt động Noacute khocircng phụ thuộc vagraveo người đưa ra quyết định lagrave ai Đoacute coacute thể lagrave 1 caacute nhacircn1 nhoacutem hay thậm chiacute DSSs
Độ đo của quyết địnhNăm khiacutea cạnh ảnh hưởng tới Quyết định
Kết cấu nhoacutem (Group Structure) Vai trograve trong nhoacutem(Group Roles) Quaacute trigravenh lagravem việc(Group Processes) Taacutec phong(Group Style) Quy tăc nhoacutem(Group Norm)
Kết cấu nhoacutem Trong 1 nhoacutem chuẩn caacutec thagravenh viecircn coacute traacutech nhiệm vagrave thẩm quyền ra quyết định như nhau Vai trograve trong nhoacutemTrong nhoacutem caacutec thagravenh viecircn đều coacute vai trograve riecircng vagrave
lagrave 1 phần quan trong trong cả tiến trigravenh Quaacute trigravenh lagravem việcQuaacute trigravenh dugraveng người trong nhoacutem ảnh hưởng tới loại
quyết định gacircy hiệu quả vagrave ảnh hưởng tới cả tiến trigravenh Taacutec phong Coacute phải taacutec phong của người ra quyết định coacute ảnh hưởng tới
chất lượng quyết định cuối khocircng Quy tắc nhoacutemQuy tắc nhoacutem lagrave cực kỳ quan trọng trong việc xaacutec định
hagravenh vi caacutec thagravenh viecircn nhoacutem trong caacutec tigravenh huống xatilde hội Phacircn cấp quyết định trong tổ chức3 cấp
Chiến lược Ban latildenh đạo cấp cao hoặc nhagrave quản lyacute Caacutec quyết định mang tiacutenh lacircu dagravei nhất
Chiến thuật Quản lyacute tầm trung Thực thi caacutec quyết định chiến lược đề ra
Thực hiện
Caacute nhacircn chuyecircn ngagravenh Tự đưa ra caacutec quyết định từng ngagravey
15Năng lực của hệ HTQD
1 HHTQĐ cơ bản hỗ trợ caacutec nhagrave ra quyết định trong caacutec tigravenh huống nửa cấu truacutec vagrave phi cấu truacutec bằng caacutech kết hợp phaacuten xử của con người vagrave xử lyacute thocircng tin bằng maacutey tiacutenh Caacutec bagravei toaacuten như vậy khocircng thểkhocircng thuận tiện giải quyết được chỉ bằng caacutec cocircng cụ maacutey tiacutenh hoacutea hay caacutec phương phaacutep định lượng 2 Phugrave hợp cho caacutec cấp quản lyacute khaacutec nhau từ cao đến thấp 3 Phugrave hợp cho caacute nhacircn lẫn nhoacutem Caacutec bagravei toaacuten iacutet coacute tiacutenh cấu truacutec thường liecircn đới đến nhiều caacute nhacircn ở caacutec đơn vị chức năng hay mức tổ chức khaacutec nhau cũng như ở caacutec tổ chức khaacutec 4 Hỗ trợ cho caacutec quyết định tuần tự liecircn thuộc được đưa ra một lần vagravei lần hay lặp lại 5 Hỗ trợ cho caacutec giai đoạn của quaacute trigravenh ra quyết định tigravem hiểu thiết kế lựa chọn vagrave hiện thực 6 Phugrave hợp cho một số caacutec phong caacutech vagrave quaacute trigravenh ra quyết định 7 Coacute thể tiến hoacutea theo thời gian Người dugraveng coacute thể thecircm bỏ kết hợp thay đổi caacutec phần tử cơ bản của hệ thống 8 Dễ dugraveng vagrave thacircn thiện với người dugraveng 9 Nhằm vagraveo nacircng cao tiacutenh hiệu dụng của quyết định (chiacutenh xaacutec thời gian tiacutenh chất lượng) thay vigrave lagrave tiacutenh hiệu quả (giaacute phiacute của việc ra quyết định) 10 Người ra quyết định kiểm soaacutet toagraven bộ caacutec bước của quaacute trigravenh ra quyết định HHTQĐ chỉ trợ giuacutep khocircng thay thế người ra quyết định 11 Người dugraveng cuối cugraveng coacute thể tự kiến tạo vagrave sửa đổi caacutec hệ thống nhỏ vagrave đơn giản 12 Thường dugraveng mocirc higravenh để phacircn tiacutech caacutec tigravenh huống ra quyết định 13 Cung ứng caacutec truy đạt dữ liệu từ nhiều nguồn dạng thức vagrave kiểu khaacutec nhau 14 Coacute thể dugraveng như một cocircng cụ độc lập hay kết hợp với caacutec HHTQĐứng dụng khaacutec dugraveng đơn lẻ hay trecircn một mạng lưới maacutey tiacutenh (intranet extranet) bất kỳ với cocircng nghệ WEB
16Văn hoacutea tổ chứcVăn hoacutea của tổ chức lagrave tập hợp của rất nhiều thứ (lograveng tin biểu tượng đặc trưng regraven luyện) được phaacutet triển qua thời gian dagravei
Noacute gacircy ra ảnh hưởng mạnh mẽ cograven hơn cả những hoạt động của tổ chức đoacute 10 đặc điểm văn hoacutea của tổ chức
Điều khiển Hệ thống khen thưởng Sự đồng nhất Chịu đựng xung đột Mocirc higravenh giao tiếp Hỗ trợ quản lyacute Sự hogravea nhập Định hướng Chịu đựng rủi ro Caacute nhacircn khởi xướng
Mối quan hệ của văn hoacutea với hiệu năng lagravem việc1 tổ chức thagravenh cocircng phải coacute xu hướng hogravea hợp giữa văn hoacutea với mocirci trường trong vagrave ngoagravei tổ chức
Phugrave hợp trong nội bộ cho thấy một sự kết hợp giữa văn hoacutea của tổ chức với những cocircng nghệ của chiacutenh noacute
Phugrave hợp với becircn ngoagravei cho thấy một nền văn hoacutea phugrave hợp với chiến lược thị trường
Văn hoacutea vagrave sự thay đổi 1 tổ chức magrave khocircng biết thay đổi văn hoacutea sẽ khocircng thể giữ được vị triacute của migravenh trecircn thị trường Caacutec cocircng ty xuất sắc luocircn biết caacutech tiacutech cực tiếp cận khaacutech hagraveng động viecircn đầu tư
17Quyền lực vagrave chiacutenh trịQuyền lực vagrave chiacutenh trị luocircn đi liền với nhau
aQuyền lựclagrave khả năng ảnh hưởng đến việc phacircn phối caacutec nguồn lực trong tổ chứcGồm 5 yếu tố cơ bản
Phacircn quyền Uy quyền Quyền lực caacute nhacircn Sức ảnh hưởng Chiacutenh trị
Một vagravei thagravenh phần của quyền lực ra quyết định Quyết định việc nagraveo coacute sẵn
Quyết định sản phẩm nagraveo được sản xuất Quyết định đầu tư vagraveo đacircu Quyền đặt vagrave quản lyacute quản lyacute giaacute Thanh toaacuten vagrave khấu trừ tiền latildei
bChiacutenh trị Yếu tố cốt lotildei trong quaacute trigravenh higravenh thagravenh chiến lược ra quyết định Chiacutenh trị liecircn quan tới việc ra quyết định thocircng qua đagravem phaacutenảnh hưởngvagrave higravenh
thagravenh sự nhất triacute Trong nhiều trường hợp noacute coacute thể cho ta sự linh hoạt hơn
18Hệ trợ giuacutep quyết định trong tổ chức DSS của 1 tổ chức hỗ trợ cocircng nghệ tập trung vagraveo caacutec quyết định ảnh hưởng tới
rất nhiều người 1 hệ thống DSS hiện đại coacute thể chấp nhận nhiều quyết định vượt qua những giới
hạn phacircn cấp truyền thống aCaacutec hoạt động gần DSS
Giải quyết caacutec nhiệm vụ đặc biệt Thu thập thocircng tin Liecircn lạc qua caacutec chi nhaacutenh Động thaacutei chiacutenh trị
Phacircn loại tư duy chiến lược cho DSS Sắp xếp quyết địnhXếp hạng quyết định sao cho thứ tự đứng trước thigrave được
ưu tiecircn trước Chia sẻ thocircng tinCaacutec quyecirct định coacute thể độc lập nhưng người ra quyết định
phải chia sẻ caacutec thocircng tin liecircn quan Lựa chọn đagravem phaacutenVagravei quyết định coacute thể xaacutec lập thocircng qua đagravem phaacuten vagrave kết
quả được lagravem đồng thờiKhocircng phải cocircng nghệ tự noacute coacute thể đưa ra quyết định magrave noacute nằm ở trigravenh độ cocircng nghệ hỗ trợ caacutec chiến lược quyết định quyền lực vagrave chiacutenh trị cugraveng phối hợp với nhau
Chương 4Mocirc higravenh hoacutea quaacute trigravenh ra quyết định
(Cấu truacutec của hệ HTQD)19Vấn đề Mocirc higravenh
bull Lagrave phần tử chủ chốt trong hầu hết hệ hỗ trợ quyết định vagrave lagrave điều kiện cần trong hệ hỗ trợ quyết định dựa vagraveo mocirc higravenh (model-based DSS)
bull Coacute nhiều lớp mocirc higravenh kegravem theo lagrave caacutec kỹ thuật xử lyacute thao taacutec mocirc higravenh đặc thugrave tương ứng
bull Caacutec vấn đề chiacutenh nhận diện bagravei toaacuten vagrave phacircn tiacutech mocirci trường nhận diện biến số dự baacuteo đa mocirc higravenh caacutec phạm trugrave mocirc higravenh quản lyacute mocirc higravenh vagrave mocirc higravenh hoacutea dựa vagraveo kiến thức
bull Mocirc higravenh hoacutea lagrave taacutec vụ khocircng đơn giản Người xacircy dựng mocirc higravenh phải cacircn bằng giữa tiacutenh đơn giản của mocirc higravenh với caacutec yecircu cầu biểu diễn để mocirc higravenh coacute thể nắm bắt đủ thực tại cần thiết cho người ra quyết định
bull Mocirc phỏng lagrave kỹ thuật mocirc higravenh hoacutea thocircng dụng dugraveng để tigravem hiểu vấn đề tuy khocircng nhất thiết phải tigravem ra được caacutec giải phaacutep biến thể mở rộng quaacute trigravenh ra quyết định của tổ chức vagrave cho pheacutep tổ chức xem xeacutet taacutec độngảnh hưởng của caacutec chọn lựa tương lai
bull Mocirc phỏng tiết kiệm rất nhiều chi phiacute vagrave thời gian ndash rất dễ thay đổi mocirc higravenh hoạt động của một hệ thống vật lyacute bằng mocirc higravenh hoacutea maacutey tiacutenh
bull Mocirc higravenh coacute thể được phaacutet triển vagrave cagravei đặt bằng một số caacutec ngocircn ngữ lập trinh (thế hệ 3 4 ) vagrave hệ thống phần mềm khaacutec nhau
Mocirc higravenh tĩnh vagrave động
bull Mocirc higravenh tĩnh thể hiện bức tranh tại thời điểm của tigravenh huống Caacutec khiacutea cạnh của bagravei toaacuten được xeacutet một thời kỳ nhất định trong một khung thời gian nhất định (coacute thể ldquocuốnrdquo về tương lai) Caacutec tigravenh huống được giả sử lagrave sẽ lập lại với tập caacutec điều kiện đồng nhất
1048713 Giả định coacute được tiacutenh ổn định của dữ liệu 1048713 Mocirc phỏng quaacute trigravenh dạng tĩnh - lagravem việc trecircn caacutec trạng thaacutei ổn định để tigravem ra caacutec
thocircng số tối ưu ndash thường được dugraveng như cocircng cụ chủ yếu để thiết kế quaacute trigravenh 1048713 vd quyết định sản xuấtmua 1 sản phẩm baacuteo caacuteo thu nhập hagraveng quyacutenăm bull Mocirc higravenh động biểu diễn caacutec kịch bản thay đổi theo thời gian 1048713 Phụ thuộc thời gian caacutec trạng thaacutei thay đổi theo thời gian 1048713 Thường dugraveng để tạo sinh vagrave biểu diễn caacutec xu hướng vagrave khuocircn mẫu theo thời gian 1048713 Mocirc phỏng động thể hiện caacutec diễn tiến khi caacutec điều kiện theo thời gian khaacutec với caacutec
trạng thaacutei ổn định ndash thường được dugraveng để thiết kế việc kiểm soaacutet caacutec hệ thống 1048713 VD dự baacuteo lời-lỗ trong 5 năm với caacutec nhập lượng như giaacute phiacute số lượng thay đổi
theo từng năm
Mocirc higravenh chắc chắn tương đối dễ phaacutet triển giải quyết vagrave coacute thể sinh ra caacutec giải phaacutep tối ưu 1048713 Caacutec bagravei toaacuten coacute một số lớnvocirc hạn caacutec giải phaacutep khả thi đặc biệt quan trọng 1048713 Caacutec mocirc higravenh tagravei chaacutenh được xacircy dựng trong điều kiện chắc chắn
Mocirc higravenh bất địnhbằng caacutech thu thập thecircm thocircng tin cố gắng đưa bagravei toaacuten trở về dạng chắc chắn hay dạng
rủi ro Mocirc higravenh rủi ro caacutec quyết định kinh doanh được đưa ra dưới caacutec rủi ro giả định
1048713 Đocirci khi biết được xaacutec suất của caacutec sự kiện xảy ra trong tương lai 1048713 Caacutec trường hợp khaacutec (bất định) ước lượng caacutec rủi ro vagrave giả sử caacutec tigravenh huống rủi ro
xảy ra 20Mocirc higravenh hoacutea
MOcirc HIgraveNH HOacuteA BẰNG BẢNG TIacuteNH bull Bảng tiacutenh phần mềm mạnh linh hoạt vagrave dễ dugraveng cho pheacutep tạo sinh caacutec ứng dụng trong kinh doanh kỹ thuật toaacuten vagrave khoa học với tập caacutec hagravem mạnh về tagravei chaacutenh thống kecirc toaacuten bull Kegravem theo lagrave caacutec thagravenh phần cộng thecircm (add-ins) giuacutep xacircy dựng vagrave giải caacutec lớp mocirc higravenh đặc thugrave bull Lagrave cocircng cụ mocirc higravenh hoacutea thocircng dụng nhất của người dugraveng cuối cugraveng bull Coacute caacutec chức năng về phacircn tiacutech ldquowhat-ifrdquo dograve tigravem mục tiecircu quản lyacute dữ liệu vagrave lập trigravenh (dạng macro) bull Coacute khả năng đọc ghi caacutec cấu truacutec tập tin thocircng dụng để giao tiếp được với caacutec CSDL vagrave cocircng cụ khaacutec bull Coacute thể xacircy dựng mocirc higravenh tĩnh vagrave động bull Dugraveng trecircn maacutey tiacutenh caacute nhacircn vagrave maacutey tiacutenh lớn
bull Cơ sở để xacircy dựng caacutec bảng tiacutenh đa chiều vagrave caacutec cocircng cụ xử lyacute phacircn tiacutech trực tuyến (OLAP) MOcirc HIgraveNH HOacuteA BẰNG PHAcircN TIacuteCH QUYẾT ĐỊNH bull Tiếp cận mocirc higravenh hoacutea caacutec tigravenh huống quyết định coacute một số hữu hạnkhocircng quaacute nhiều caacutec phương aacuten ndash mỗi phương aacuten được trigravenh ra dưới dạng bảng hay đồ thị - caacutec kết quả tương ứng (dự baacuteo được kegravem xaacutec suất) theo mục tiecircu bagravei toaacuten ndash từ đoacute chọn phương aacuten tốt nhất bull Đơn mục tiecircu bảng quyết định hay cacircy quyết định bull Đa mục tiecircu AHP (analytic hierarchy process) khaacutec
MOcirc HIgraveNH HOacuteA BẰNG QUY HOẠCH TOAacuteN
bull Quy hoạch toaacuten học (mathematical programming) lagrave họ caacutec cocircng cụ giải quyết caacutec bagravei toaacuten quản lyacute theo đoacute người ra quyết định phải cấp phaacutet caacutec tagravei nguyecircn khan hiếm cho caacutec hoạt động cạnh tranh nhau (caacutec phương aacuten) nhằm tối ưu hoacutea mục tiecircu coacute khả năng đo lường được bull Caacutec mocirc higravenh quy hoạch tuyến tiacutenh (linear programming) thocircng dụng nhất trong quy hoạch toaacuten coacute nhiều ứng dụng trong thực tế được dugraveng nhiều trong caacutec hệ hỗ trợ quyết định bull Bagravei toaacuten quy hoạch tuyến tiacutenh 1048713 Caacutec biến quyết định (cần tigravem giaacute trị) 1048713 Hagravem mục tiecircu (hagravem toaacuten học dạng tuyến tiacutenh xaacutec định quan hệ giữa biến quyết định vagrave mục tiecircu đo lường mức độ đạt đạt mục tiecircu vagrave cần được tối ưu hoacutea) 1048713 Caacutec hệ số của hagravem mục tiecircu (cho biết mức đoacuteng goacutep vagraveo mục tiecircu của 1 đơn vị biến quyết định) 1048713 Ragraveng buộc (biểu thức tuyến tiacutenh cho biết giới hạn tagravei nguyecircn vagravehay caacutec quan hệ giữa caacutec biến số) 1048713 Dung lượng (mocirc tả cận trecircn vagrave dưới của caacutec biến vagrave ragraveng buộc) 1048713 Hệ số (cocircng nghệ) vagraveo-ra (cho biết mức độ sử dụng tagravei nguyecircn của biến quyết định) bull Đặc điểm của bagravei toaacuten quy hoạch tuyến tiacutenh 1048713 Tagravei nguyecircn kinh tế của bagravei toaacuten lagrave coacute hạn vagrave sẵn sagraveng 1048713 Coacute nhiều caacutech (gt2 caacutech) sử dụng tagravei nguyecircn được gọi lagrave giải phaacutep hay chương trigravenh 1048713 Mỗi hoạt động dugraveng tagravei nguyecircn đều sinh ra kết quả dưới dạng mục tiecircu đatilde phaacutet biểu trước 1048713 Việc cấp phaacutet nằm trong caacutec ragraveng buộc cho trước bull Giả định của bagravei toaacuten quy hoạch tuyến tiacutenh 1048713 Caacutec kết quả của caacutec cấp phaacutet coacute thể đem so saacutenh với nhau coacute thể đo lường bằng một đơn vị chung
1048713 Caacutec cấp phaacutet độc lập với nhau về mặt kết quả 1048713 Kết quả cuối cugraveng lagrave tổng của caacutec kết quả từ caacutec hoạt động riecircng rẽ khaacutec nhau 1048713 Dữ liệu coacute tiacutenh chắc chắn 1048713 Tagravei nguyecircn được dugraveng một caacutech kinh tế nhất 1048713 Thường coacute một số lớn caacutec giải phaacutep với kết quả khaacutec nhau 1048713 Trong số caacutec giải phaacutep coacute thể coacute 1 giải phaacutep tốt nhất ndash mức độ đạt được mục tiecircu cao nhất ndash gọi lagrave giải phaacutep tối ưu được tigravem ra bằng một giải thuật đặc biệt MOcirc HIgraveNH HOacuteA BẰNG HEURISTIC bull Việc tigravem giải phaacutep tối ưu của một số bagravei toaacuten quyết định phức tạp coacute thể tốn nhiều thời gian chi phiacute hay khocircng thể tigravem ra được Cograven nếu dugraveng tiếp cận mocirc phỏng cũng coacute thể keacuteo dagravei phức tạp khocircng thiacutech hợp hay thậm chiacute khocircng chiacutenh xaacutec
bull Lagrave một tiếp cận giuacutep tigravem ra caacutec giải phaacutep khả thithỏa matildenđủ tốt cho caacutec bagravei toaacuten phức tạp Coacute thể coacute giải phaacutep đủ tốt (90-999 giaacute trị của lời giải tối ưu) nhanh choacuteng vagrave đỡ tốn keacutem hơn bằng caacutech dugraveng heuristics bull Quaacute trigravenh heuristic lagrave datildey caacutec bước xacircy dựng caacutec quy luật giải quyết vấn đề thocircng qua việc tigravem kiếm caacutec con đường hứa hẹn nhất dẫn đến lời giải tigravem kiếm caacutech thức thu thập vagrave phacircn giải thocircng tin theo quaacute trigravenh giải vagrave phaacutet triền caacutec phương phaacutep dẫn đến một giải thuật tiacutenh toaacuten hay một lời giải tổng quaacutet đatilde coacute bull Aacutep dụng chủ yếu cho bagravei toaacuten cấu truacutec yếu cũng dugraveng để tigravem ra giải phaacutep chấp nhận được cho bagravei toaacuten cấu truacutec chặt bull Khocircng đủ tổng quaacutet như caacutec giải thuật thường chỉ dugraveng cho tigravenh huống đặc thugrave đang xeacutet bull Coacute thể dẫn đến một giải phaacutep dở - caacutec thủ tục từng bước giải quyết vấn đề khocircng đảm bảo tigravem ra giải phaacutep tối ưu bull Heuristic coacute thể lagrave định lượng vigrave vậy coacute thể đoacuteng vai trograve quan trọng trong cơ sở mocirc higravenh của hệ hỗ trợ quyết định bull Heuristic coacute thể lagrave định tiacutenh vigrave vậy coacute thể đoacuteng vai trograve quan trọng trong cung ứng kiến thức cho hệ chuyecircn gia bull Quaacute trigravenh heuristic liecircn quan đến tigravem kiếm học tập ước lượng phacircn xử vagrave lặp lại caacutec hoạt động nagravey dọc theo tiến trigravenh bull Kiến thức thu được dugrave thagravenh cocircng hay thất bại trong quaacute trigravenh đều được phản hồi vagrave sửa đổi chiacutenh quaacute trigravenh nhờ đoacute coacute thể định nghĩa lại mục tiecircu hay bagravei toaacuten 1048713 Giải thuật di truyền bắt đầu bằng tập caacutec giải phaacutep được sinh ngẫu nhiecircn taacutei kết hợp caacutec cặp giải phaacutep một caacutech ngẫu nhiecircn bull Tigravenh huống necircn dugraveng heuristics 1048713 Dữ liệu đầu vagraveo khocircng chiacutenh xaacutec hay coacute giới hạn 1048713 Thực tế quaacute phức tạp đến nỗi khocircng dugraveng được caacutec mocirc higravenh tối ưu 1048713 Chưa coacute được giải thuật chiacutenh xaacutec vagrave đủ tin cậy 1048713 Bagravei toaacuten phức tạp necircn sẽ khocircng kinh tế nếu dugraveng tối ưu hay mocirc phỏng hoặc tốn quaacute nhiều thời gian tiacutenh toaacuten 1048713 Coacute thể cải thiện tiacutenh hiệu quả của quaacute trigravenh tối ưu (tức coacute thể sinh ra caacutec giải phaacutep ban đầu tương đối tốt) 1048713 Liecircn quan đến xử lyacute kyacute hiệu chứ khocircng phải xử lyacute kyacute số (như hệ chuyecircn gia) 1048713 Cần coacute quyết định nhanh vagrave caacutec xử lyacute dựa vagraveo maacutey tiacutenh đều khocircng khả thi (một số heuristic khocircng cần đến maacutey tiacutenh) bull Thuận lợi 1048713 Dễ hiểu dễ giải thiacutech vagrave dễ cagravei đặt 1048713 Nacircng cao tiacutenh saacuteng tạo vagrave năng lực heuristic cho caacutec vấn đề khaacutec 1048713 Tiết kiệm thời gian xaacutec lập vấn đề 1048713 Tiết kiệm yecircu cầu về bộ chứa vagrave xử lyacute maacutey tiacutenh
1048713 Tiết kiệm thời gian tiacutenh toaacuten vagrave do vậy tiết kiệm thời gian thực trong ra quyết định Một số vấn đề phức tạp đến nỗi chỉ coacute thể giải được bằng heuristics 1048713 Thường sinh ra nhiều giải phaacutep chấp nhận được 1048713 Thường coacute thể phaacutet biểu lyacute thuyết hay đo lường thực nghiệm về chất lượng của giải phaacutep (tức giaacute trị mục tiecircu của giải phaacutep gần với giaacute trị tồi ưu đến mức nagraveo dugrave giaacute trị tối ưu chưa biết được) 1048713 Coacute thể kết hợp tiacutenh thocircng minh vagraveo để hướng dẫn pheacutep tigravem kiếm (tigravem kiếm tabu) Năng lực thocircng minh đoacute coacute thể lagrave đặc thugrave theo bagravei toaacuten hoặc dựa trecircn yacute kiến chuyecircn gia được cấy trong hệ chuyecircn gia hoặc cơ chế tigravem kiếm 1048713 Coacute thể dugraveng heuristic hiệu quả vagraveo caacutec mocirc higravenh coacute thể giải bằng quy hoạch toaacuten học Đocirci khi heuristic lagrave phương phaacutep được ưa thiacutech hơn khi khaacutec giải phaacutep heuristics được dugraveng như giải phaacutep ban đầu cho caacutec phương phaacutep quy hoạch toaacuten học bull Hạn chế 1048713 Khocircng đảm bảo coacute được giải phaacutep tối ưu 1048713 Caacutec quy luật coacute rất nhiều ngoại lệ 1048713 Caacutec lựa chọn quyết định tuần tự coacute thể khocircng tiecircn đoaacuten được caacutec kết cục tương lai của mỗi chọn lựa 1048713 Sự liecircn thuộc giữa caacutec phần trong hệ thống đocirci khi coacute thể gacircy ra caacutec ảnh hưởng lớn lao lecircn toagraven hệ thống bull Phacircn loại caacutec giải thuật heuristic 1048713 Heuristic xacircy dựng xacircy dựng giải phaacutep khả thi bằng caacutech cộng thecircm từng thagravenh phần một VD bagravei toaacuten người baacuten hagraveng ndash luocircn gheacute thagravenh phố chưa viếng thăm kế tiếp gần nhất
1048713 Heuristic cải tiến bắt đầu bằng một giải phaacutep khả thi vagrave cố gắng cải tiến liecircn tục trecircn đoacute VD trecircn thử hoaacuten đổi 2 thagravenh phố 1048713 Quy hoạch toaacuten aacutep dụng vagraveo caacutec mocirc higravenh chứa iacutet ragraveng buộc nhằm coacute được thocircng tin về thỏa hiệp tốt nhất với mocirc higravenh nguyecircn gốc Thường được dugraveng trong tối ưu hoacutea nguyecircn (integer optimization) 1048713 Chia giai đoạn giải quyết một vấn đề theo từng giai đoạn VD ở PampG trecircn đacircy bagravei toaacuten phacircn phối được giải quyết trước sau đoacute dugraveng giải quyết bagravei toaacuten chiến lược sản phẩm 1048713 Phacircn ratilde chia bagravei toaacuten thagravenh caacutec phần nhỏ hơn coacute thể giải quyết được sau đoacute kết hợp caacutec giải phaacutep đoacute lại VD chia latildenh thổ baacuten hagraveng thagravenh 4 vugraveng khaacutec nhau giải quyết cho từng vugraveng sau đoacute kết nối caacutec giải phaacutep
21Mocirc phỏngbull Giả định caacutec đặc điểm của thực tạibull Lagrave kỹ thuật tiến triển caacutec thực nghiệm (như phacircn tiacutech ldquowhat-ifrdquo) - bằng maacutey tiacutenh -trecircn một mocirc higravenh của hệ thocircng tin quản lyacute
bull Khocircng thực sự lagrave một mocirc higravenh vigrave khocircng biểu diễn thực tại magrave lagrave cố gắng bắtchước thực tạibull Một trong những phương phaacutep thocircng dụng nhất trong HHTQĐbull HHTQĐ lagravem việc với caacutec bagravei toaacuten phi cấu truacutec vagrave cấu truacutec yếu tigravenh huống thực tếphức tạp ndash khocircng dễ biểu diễn bằng mocirc higravenh tối ưu hay caacutec dạng mocirc higravenh khaacutecnhưng lại thường coacute thể xử lyacute được bằng mocirc phỏngbull Đặc điểm1048713 Iacutet đưa ra caacutec đơn giản hoacutea về thực tại hơn caacutec mocirc higravenh khaacutec1048713 Do triển khai caacutec thực nghiệm necircn noacute coacute thể kiểm thử caacutec giaacute trị cụ thể của caacutecbiến quyết địnhbiến khocircng kiểm soaacutet được của mocirc higravenh vagrave xem xeacutet ảnh hưởnglecircn caacutec biến kết quả1048713 Phương phaacutep coacute tiacutenh mocirc tả (như vậy khaacutec với phương phaacutep danh định)1048713 Khocircng tự động tigravem kiếm giải phaacutep tối ưu ndash noacute mocirc tảtiecircn đoaacuten caacutec đặc tiacutenh của hệthống đatilde cho dưới caacutec điều kiện khaacutec nhau từ đoacute coacute thể chọn ra phương aacuten tốtnhất1048713 Quaacute trigravenh mocirc phỏng thường lặp lại một thực nghiệm nhiều lần để coacute được ướclượng về hiệu ứng tổng quaacutet của một số hagravenh động nhất định1048713 Mocirc phỏng maacutey tiacutenh thiacutech hợp cho hầu hết caacutec tigravenh huống mặc dugrave cũng coacute một sốmocirc phỏng thủ cocircng thagravenh cocircng1048713 Thường chỉ được dugraveng khi bagravei toaacuten quaacute phức tạp khocircng thể xem xeacutet bằng caacutec kỹthuật tối ưu dạng số Tiacutenh phức tạp theo nghĩa bagravei toaacuten khocircng thể cocircng thức hoacuteacho tối ưu (do khocircng thotildea caacutec giả định) hoặc cocircng thức quaacute lớn quaacute nhiều tươngtaacutec giữa caacutec biến hoặc về bản chất bagravei toaacuten lagrave bất định hay rủi roPhương phaacutep mocirc phỏng thiết lập mocirc higravenh của hệ thống thực vagrave tiến hagravenh caacutec thựcnghiệm lặp lại trecircn mocirc higravenh
bull Thuận lợi1048713 Lyacute thuyết tương đối trực tiếp hiệu ứng dagravei hạn của nhiều chiacutenh saacutech -gt neacuten thờigian lớn1048713 Do tiacutenh chất mocirc tả (khaacutec với danh định)1048713 Coacute thể thấy được nhanh choacuteng coacute thể đặt ra caacutec cacircu hỏi ldquowhat-ifrdquo coacute thể dugravengtiếp cận thử-vagrave-sai vagraveo giải quyết vấn đề một caacutech nhanh choacuteng rẻ chiacutenh xaacutec iacutetrủi ro hơn1048713 Thử nghiệm được biến quyết định phần nagraveo của mocirci trường thực sự quan trọngvới caacutec phương aacuten khaacutec nhau1048713 Yecircu cầu kiến thức riecircng biệt về bagravei toaacuten vigrave thế buộc người xacircy dựng mocirc higravenh phảilagravem việc thường xuyecircn với nhagrave quản lyacute ndash đối tượng mong muốn của HHTQĐ để
từ đoacute bản chất bagravei toaacuten vagrave caacutec quyết định được hiểu tốt hơn1048713 Mocirc higravenh được xacircy dựng từ viễn cảnhcaacutech nhigraven của nhagrave quản lyacute1048713 Mocirc higravenh chỉ cho một bagravei toaacuten riecircng biệt thường khocircng thể dugraveng giải caacutec bagravei toaacutenkhaacutec Như vậy mỗi thagravenh phần của mocirc higravenh ứng với một phần của hệ thống thựcdo đoacute sẽ khocircng yecircu cầu nhagrave quản lyacute phải tổng quaacutet hoacutea caacutec hiểu biết của migravenh1048713 Phổ bagravei toaacuten giải được rất rộng tồn kho nhacircn sự hoạch định chiến lược 1048713 Coacute thể chứa caacutec phức tạp thực sự của bagravei toaacuten khocircng cần caacutec đơn giản hoacutea (TDdugraveng caacutec phacircn phối xaacutec suất thực thay vigrave phacircn phối lyacute thuyết xấp xỉ)1048713 Coacute thể tự động sinh ra nhiều đo lường hiệu năng quan trọng1048713 Thường lagrave phương phaacutep duy nhất của HHTQĐ coacute thể xử lyacute caacutec bagravei toaacuten tương đốiphi cấu truacutec1048713 Coacute một số caacutec goacutei phần mềm mocirc phỏng (Monte Carlo) tương đối dễ dugravengbull Điểm yếu1048713 Tuy thường tigravem được caacutec phương aacuten đủ tốt nhưng khocircng đảm bảo lời giải tối ưu1048713 Quaacute trigravenh xacircy dựng mocirc higravenh thường dagravei vagrave tốn keacutem1048713 Giải phaacutep vagrave suy diễn từ nghiecircn cứu mocirc phỏng thường khocircng thể chuyển sang bagraveitoaacuten khaacutec vigrave mocirc higravenh kết hợp caacutec yếu tố đặc thugrave1048713 Đocirci khi do mocirc higravenh quaacute dễ giải thiacutech cho nhagrave quản lyacute necircn caacutec phương phaacutep phacircntiacutech thường xem nhẹ1048713 Phần mềm mocirc phỏng đocirci khi yecircu cầu caacutec kỹ năng đặc biệt do độ phức tạp củaphương phaacutep giải higravenh thứcbull Caacutec loại mocirc phỏng1048713 Mocirc phỏng xaacutec suất một hay nhiều biến độc lập mang tiacutenh xaacutec suất với 2 loạiphacircn phối ndash thường dugraveng kỹ thuật Monte Carlo1048713 Phacircn phối rời rạc tigravenh huống coacute một số giới hạn caacutec biến cố (biến) với hữu hạncaacutec giaacute trị cho mỗi biến cố (biến)1048713 Phacircn phối liecircn tục tigravenh huống coacute số lượng khocircng giới hạn caacutec biến cố tuacircn theocaacutec hagravem mật độ xaacutec suất như phacircn phối chuẩn1048713 Mocirc phỏng độc lậpphụ thuộc theo thời gian1048713 Độc lập khocircng cần thiết phải biết chiacutenh xaacutec thời điểm xảy ra biến cố (nhu cầutiecircu thụ lượng sản phẩm trong ngagravey khocircng biết chiacutenh xaacutec thời điểm tiecircu thụ)1048713 Phụ thuộc cần biết chiacutenh xaacutec thời điểm xảy ra sự kiện (bagravei toaacuten hagraveng đợi)1048713 Mocirc phỏng tương taacutec trực quan1048713 Mocirc phỏng hướng đối tượng dugraveng tiếp cận hướng đối tượng để xacircy dựng mocirc higravenhmocirc phỏng Chuacute yacute ngocircn ngữ mocirc higravenh hoacutea nhất thể UML (unified modelinglanguage) kể cả khi mocirc phỏng caacutec hệ thời gian thựcMOcirc HIgraveNH HOacuteA ĐA CHIỀU ndash XỬ LYacute PHAcircN TIacuteCH TRỰC TUYẾNbull Người ra quyết định thường phải xem xeacutet nhiều chiều của dữ liệu (TD caacutec chiềucủa dữ liệu baacuten hagraveng lagrave sản phẩm vugraveng thời gian người baacuten ) dữ liệu cần đượcphacircn tiacutech trực tiếp bằng caacutec cocircng cụ chuẩn hay phacircn tiacutech tự động bằng caacutec
phương phaacutep khai mỏ dữ liệu (data mining)bull Hầu hết caacutec hệ thống phacircn tiacutech đa chiều được nhuacuteng trong caacutec hệ xử lyacute phacircn tiacutechtrực tuyến (HXLPTTT ndash online analytic processing - OLAP)bull Mục tiecircu của XLPTTT nắm bắt cấu truacutec của dữ liệu thực để hỗ trợ ra quyết địnhbull Trong HHTQĐ coacute sự gắn nối tự nhiecircn giữa mocirc higravenh hoacutea dữ liệu mocirc higravenh hoacutea kyacutehiệu vagrave caacutec khiacutea cạnh của phacircn tiacutech ldquowhat-ifrdquobull Caacutec baacuteo caacuteo của HXLPTTT đều coacute tiacutenh tương taacutec dễ khai thaacutec sử dụng đặc biệtphugrave hợp cho caacutec baacuteo caacuteo về chỉ số hiệu năng chủ yếu (key performance indicators- KPI) baacuteo caacuteo về đo lường hiệu năng kinh doanh bull Thế hệ hiện tại của HXLPTTT vagrave hệ khai mỏ dữ liệu (data mining) tiacutech hợp caacutecđặc tiacutenh của hệ thocircng tin latildenh đạo (executive information system ndashEIS- nhiềucaacutech nhigraven dữ liệu chi tiết hoacutea theo nhu cầu) vagrave caacutec hệ đồ họa khaacutec ndash thường coacutegiao diện người dugraveng dạng kiểu WEBbull Caacutec hệ thống như trecircn cograven được gọi lagrave caacutec cocircng cụ triacute tuệ kinh doanh (businessintelligence - BI) vigrave coacute caacutec đặc trưng về mocirc higravenh hoacutea vagrave tối ưu hoacutea nhưng lạitrong suốt đối với ngươigrave dugravengbull Hiện caacutec cocircng cụ được đưa ra bởi caacutec nhagrave cung cấp về CSDL về hoạch định tagraveinguyecircn tổ chức (ERP) về nhagrave kho dữ liệu (data warehouse) về HXLPTTT MOcirc HIgraveNH HOacuteA VAgrave MOcirc PHỎNG TƯƠNG TAacuteC TRỰC QUANbull Iacutech lợi Người ra quyết định tham gia vagraveo quaacute trigravenh phaacutet triển mocirc higravenh vagrave thựcnghiệm mocirc phỏng vigrave vậy sẽ tin tưởng khi sử dụng mocirc higravenhbull Mocirc higravenh hoacutea tương taacutec trực quan (visual interactive modeling - VIM) dugraveng caacutecbiểu diễn đồ họa maacutey tiacutenh để trigravenh bagravey caacutec ảnh hưởng của caacutec quyết định quản lyacutekhaacutec nhau ở một thời điểm (tĩnh) hay tiến triển theo thời gian (động với kỹ thuậthoạt higravenh)bull Mocirc phỏng tương taacutec trực quan (visual interactive simulation - VIS) cho pheacutepngười dugraveng theo dotildei tiến trigravenh xacircy dựng vagrave sử dụng khai thaacutec mocirc higravenh mocirc phỏngdưới dạng hoạt higravenhbull Mocirc higravenh hoacutea tương taacutec trực quan coacute thể kết hợp với tiếp cận triacute tuệ nhacircn tạo đểđưa ra caacutec khả năng mới thay đổi từ xacircy dựng hệ thống dạng đồ họa đến tigravem hiểuvề động học của hệ thốngbull Cần đến caacutec hệ thống maacutey tiacutenh xử lyacute song song tốc độ cao để xacircy dựng caacutec mocircphỏng - phức tạp quy mocirc lớn dạng hoạt higravenh - mang tiacutenh khả thi ở thời gian thực
22Caacutec dạng hệ thống hỗ trợ ra quyết địnhHệ hỗ trợ quyết định nhoacutemRa quyết định nhoacutem giao tiếp vagrave cộng taacutec- Caacutec đặc điểm của cocircng việc nhoacutem+ Một nhoacutem thực hiện một nhiệm vụ thỉnh thoảng ra quyết định thỉnh thoảngkhocircng ra quyết định+ Caacutec thagravenh viecircn trong nhoacutem coacute thể ở những nơi khaacutec nhau
+ Caacutec thagravenh viecircn trong nhoacutem coacute thể lagravem việc ở những thời gian khaacutec nhau+ Caacutec thagravenh viecircn trong nhoacutem coacute thể lagravem việc cugraveng nhau hoặc ở caacutec tổ chức khaacutecnhau+ Nhoacutem coacute thể vĩnh viễn hoặc tạm thời+ Nhoacutem coacute thể ở bất kỳ mức quản lyacute nagraveo hoặc mức thời gian nagraveo+ Coacute sự điều phối (quaacute trigravenh vagrave nhiệm vụ đạt được) hoặc macircu thuẩn trongnhoacutem+ Coacute sự đạt được hoặcvagrave mất maacutet năng suất trong tổ chức+ Nhiệm vụ phải hoagraven thagravenh rất nhanh+ Khocircng thể hoặc quaacute đắt cho tất cả caacutec thagravenh viecircn trong nhoacutem cugraveng hợp ở mộtnơi+ Một số dữ liệu thocircng tin hoặc kiến thức cần thiết nằm ở nhiều nơi một sốkhaacutec ở ngoagravei tổ chức+ Chuyecircn mocircn của caacutec thagravenh viecircn khocircng coacute trong nhoacutem lagrave cần thiết- Caacutec hoạt động vagrave caacutec quaacute trigravenh miecircu tả caacutec cuộc họp+ Cuộc họp lagrave hoạt động chung liecircn quan bởi một nhoacutem người coacute địa vị bằngnhau hoặc gần bằng nhau+ Kết quả của cuộc họp phụ thuộc một phần vagraveo kiến thức yacute kiến caacutec đaacutenh giaacutecủa caacutec thagravenh viecircn+ Kết quả của cuộc họp cũng phụ thuộc vagraveo sự kết hợp của nhoacutem vagrave phụ thuộcvagraveo quaacute trigravenh ra quyết định được sử dụng bởi nhoacutem đoacute+ Giải quyết caacutec yacute kiến khaacutec nhau bởi người coacute quyền hạn hoặc thương lượnghoặc phacircn xửHỗ trợ giao tiếp- Giao tiếp lagrave thagravenh phần quan trọng cho hỗ trợ quyết định Khocircng coacute giao tiếp thigravekhocircng coacute cộng taacutec Những người ra quyết định caacute nhacircn phải giao tiếp với caacutecđồng nghiệp chuyecircn gia cơ quan chiacutenh phủ khaacutech hagraveng đối taacutec kinh doanh hellipHọ cũng cần dữ liệu vagrave thocircng tin (vagrave kiến thức) từ nhiều nơi trecircn thế giới Caacutecnhoacutem ra quyết định phải giao tiếp cộng taacutec vagrave thương lượng trong cocircng việcHầu hết caacutec tổ chức sẽ nhanh trở thagravenh khocircng coacute chức năng nếu khocircng coacute caacutec hệthống giao tiếp Thương mại điện tử coacute thể hiệu quả chỉ qua caacutec kỹ thuật giao tiếphiện đại- Caacutec kỹ thuật thocircng tin hiện đại cung cấp caacutec phương tiện hỗ trợ giao tiếp rẻnhanh coacute khả năng coacute thể tin cậy Nền tảng hỗ trợ giao tiếp lagrave caacutec hệ thống maacuteytiacutenh mạng+ Bắt đầu bằng điện baacuteo điện thoại radio vagrave ti vi+ Trong 100 năm chuacuteng ta phaacutet triển maacutey fax thư điện tử chương trigravenh chatnhoacutem tin tức hệ thống hội nghị truyền higravenh Hầu hết caacutec kỹ thuật nagravey đềuhoạt động trecircn internet+ Sự phaacutet triển giao tiếp sau cugraveng lagrave hệ thống họp điện tử caacutec dịch vụ vagrave hệ
thống hội nghị điện tử thường sử dụng internet để kết nối caacutec người ra quyếtđịnh- Caacutec thuận lợi aacutep dụng caacutec phương phaacutep giao tiếp cải tiến trong caacutec tổ chức+ Cải tiến năng suất của nhacircn viecircn+ Liecircn quan đến nhiều người ra quyết định chiacutenh+ Khocircng quan tacircm nhiều đến đường biecircn giới địa lyacute+ Tạo nền văn hoacutea hợp taacutec nhất quaacuten+ Cải tiến chất lượng cuộc sống của nhacircn viecircnHỗ trợ cộng taacutec Maacutey tiacutenh hỗ trợ cộng taacutec- Khung thời giannơi chốn+ Sự hiệu quả của kỹ thuật tiacutenh toaacuten cộng taacutec phụ thuộc vagraveo vị triacute của caacutec thagravenhviecircn trong nhoacutem vagrave phụ thuộc vagraveo thời gian chia sẽ thocircng tin gởi vagrave nhận+ Chia sự giao tiếp thagravenh bốn ocirc vagrave tổ chức bốn ocirc dọc theo 2 chiều thời gian vagravenơi chốn1048713 Thời gian Khi gởi vagrave nhận thocircng tin hầu như đồng thời giao tiếp lagrave đồngthời Viacute dụ Điện thoại ti vi vagrave caacutec cuộc họp gặp mặt nhau Giao tiếp bấtđồng bộ xảy ra khi người nhận nhận thocircng tin ở thời điểm khaacutec thời điểmgởi thocircng tin đoacute1048713 Nơi chốn Người gởi vagrave người nhận coacute thể ở cugraveng phograveng hoặc khocircng+ Bốn ocirc lagrave1048713 Cugraveng thời giancugraveng nơi chốn Caacutec thagravenh viecircn gặp mặt nhau cugraveng một luacutecgiống như phograveng quyết định hoặc gặp mặt truyền thống1048713 Cugraveng thời giankhaacutec nơi chốn Caacutec thagravenh viecircn ở caacutec nơi khaacutec nhau nhưnggiao tiếp cugraveng nhau Viacute dụ hội nghị truyền higravenh (videoconferencing)1048713 Khaacutec thời giancugraveng nơi chốn Nhiều người lagravem việc theo ca Ca nagravey để lạithocircng tin cho ca khaacutec1048713 Khaacutec thời giankhaacutec nơi chốn Caacutec thagravenh viecircn ở caacutec nơi khaacutec nhau Caacutecthagravenh viecircn nagravey gởi vagrave nhận thocircng tin ở những lần khaacutec nhau
23Thực thi hệ DSSHệ thống hỗ trợ quản lyacute (MSS) khocircng phải luacutec nagraveo cũng luocircn thagravenh cocircng Nhiều trường hợpthất bại của ES khocircng hoagraven toagraven lagrave lyacute do kỹ thuật Thực thi hệ thống lagrave một quaacute trigravenh liecircn tụcnhằm đảm bảo cho tổ chức chuẩn bị tiếp nhận một hệ thống mới vagrave đưa hệ thống vagraveo sử dụngthagravenh cocircngThực hiện cocircng nghệ hệ thống hỗ trợ quản lyacute lagrave việc phức tạp vigrave caacutec hệ thống nagravey khocircng đơnthuần lagrave hệ thống thocircng tin chỉ thu thập thao taacutec vagrave phacircn phối thocircng tin Magrave xa hơn chuacuteng
liecircn quan tới caacutec cocircng việc coacute thể lagravem thay đổi đaacuteng kể caacutech thức hoạt động của tổ chức Tuyvậy đa số caacutec yếu tố thực thi đều liecircn quan tới hệ thống thocircng tinThực thi MSS lagrave quaacute trigravenh liecircn tục diễn ra trong suốt thời gian phaacutet triển hệ thống từ đề xuấtban đầu đến nghiecircn cứu khả thi thiết kế vagrave phacircn tiacutech hệ thống lập trigravenh huấn luyện chuyểnđổi vagrave lắp đặt Caacutec chuyecircn gia hệ thống thocircng tin thường gọi thực thi lagrave giai đoạn cuối trongvograveng đời hệ thống Định nghĩa thực thi MSS phức tạp hơn vigrave bản chất lặp của sự phaacutet triểncaacutec hệ thống
THỰC THI KHOcircNG HOAgraveN CHỈNHCaacutec quyết định về tiacutenh khả thi thường coacute giả định về lợi iacutech đạt được khi kế hoạch thực thiđược thực hiện hoagraven toagraven Trong thực tế thường chỉ thực hiện 90 thậm chiacute 70 phần trăm sovới phacircn tiacutech khả thi Lyacute do lagrave sự thay đổi tại một nơi trong hệ thống coacute thể ảnh hưởng vagrave coacutethể taacutec động tiecircu cực đến chỗ khaacutec Do vậy cấp quản lyacute coacute thể bỏ những phần trong dự aacuten coacutethể gacircy ra taacutec động xấu Do đoacute dự aacuten sẽ thực hiện iacutet hơn 100 so với dự aacuten kế hoạch Caacutec lyacutedo khaacutec coacute thể lagrave do khấu trừ ngacircn saacutech hoặc vượt chi phiacuteĐAacuteNH GIAacute SỰ THAgraveNH COcircNG CỦA THỰC THI HỆ THỐNGPhải coacute caacutec chỉ số đo lường thigrave mới coacute thể đaacutenh giaacute sự thagravenh cocircng khi thực thi một hệ thốngDickson va Powers (1973) đề ra 5 tiecircu chuẩn độc lậpbull Tỷ lệ thời gian thực hiện dự aacuten với thời gian ước lượngbull Tỷ lệ chi phiacute thực tế vagrave ngacircn saacutech thực hiệnbull Thaacutei độ của cấp quản lyacute đối với hệ thốngbull Nhu cầu thocircng tin của caacutec nhagrave quản lyacute được đaacutep ứng như thế nagraveo qua hệ thốngbull Taacutec động của dự aacuten đối với những hoạt động maacutey tiacutenh trong cocircng tyCaacutec đo lường khaacutec để đaacutenh giaacute thagravenh cocircng của hệ hỗ trợ quản lyacute (MSS)bull Sự sử dụng hệ thống (dự định dugraveng hoặc thực sự dugraveng)bull Thỏa matilden của người dugravengbull Thaacutei độ taacuten thagravenhbull Mức độ hệ thống hoagraven thagravenh caacutec mục tiecircu ban đầubull Phần thưởng đối với tổ chức (giảm chi phiacute tăng doanh thuhellip)bull Tỷ số lợi iacutech chi phiacute
bull Mức độ thể chế hoacutea của MSS trong tổ chứcDo bởi tiacutenh đa dạng của DSS necircn việc đaacutenh giaacute sự thagravenh cocircng của hệ nagravey cũng khoacute khăn tuynhiecircn cũng coacute thể coacute một số yếu tố giuacutep cho DSS thagravenh cocircng như sự tham gia người dugravenghuấn luyện người dugraveng hỗ trợ quản lyacute cấp cao nguồn thocircng tin đặc điểm của những nhiệmvụ coacute liecircn quan (cấu truacutec bất định độ khoacute phụ thuộc)
Chương5Nhoacutem hỗ trợ quyết định vagrave nhoacutemcocircng nghệ phần mềm
51Nhoacutem tạo quyết định
MDM-Holsapple đatilde gợi yacute chuacuteng ta sử dụng giới hạn người tạo quyết định
Một nhoacutem lagrave kết cấu MDM nơi magrave nhiều người ra quyết định hoagraven toagraven tương taacutec
Một đội lagrave kết cấu MDM nơi caacutec thagravenh viecircn tư vấn cho người đưa ra quyết định nhưng khocircng tương taacutec
Một Ủy ban lagrave kết cấu MDM với một người tạo quyết định duy nhất vagrave sự tương taacutec giữa caacutec thagravenh viecircn
Mạng thocircng tin
Mạng lưới baacutenh xe mỗi người tham gia coacute thể giao tiếp với người đưa ra quyết định ở trung tacircm nhưng khocircng phải với người tham gia khaacutecCấu truacutec nagravey lagrave khocircng thỏa matilden tất cả những người tham gia ngoại trừ người ra quyết định
Mạng dacircy chuyền Tham gia chuyển tiếp thocircng tin chỉ để noacute luocircn liền kề nhau trong chuỗi
Thagravenh viecircn cuối cugraveng ko được đaacutep ứng
Mạng vograveng trograven Tương tự như chuỗi nhưng kết thuacutec được kết nối
Mạng kết nối hoagraven toagraven khocircng coacute hạn chế về giao tiếp vagrave tương taacutec giữa caacutec thagravenh viecircnNoacutei chungnoacute đaacutep ứng hầu hết caacutec kết nối của người tham gia nhưng truyền đạt thocircng tin mất nhiều thời gian vagrave coacute nhiều cơ hội xảy ra lỗi
Nhoacutem hagravenh vi vagrave chuẩn mực
MDMs thiết lập caacutec chỉ tiecircu hướng dẫn quaacute trigravenh ra quyết định
Một chuẩn mực quy định cụ thể những gigrave thagravenh viecircn trong nhoacutem dự kiến sẽ lagravem trong những hoagraven cảnh nhất định
Quy tắc gửi coacute thể được thocircng qua viacute dụ đaacutenh giaacute ngang hagraveng hoặc xử phạt
Lagravem thế nagraveo để đưa ra quyết định
Việc chọn lựa magrave trong đoacute việc sử dụng cấu truacutec MDM phải được dựa trecircn một số yếu tố liecircn quan với bối cảnh quyết định
Viacute dụmột cấu truacutec riecircng lẻ sẽ lagravem việc nơi magrave quyết định được cấu truacutec cao vagrave thocircng tin lagrave coacute sẵn
Một ủy ban cơ cấu sẽ lagrave sự lựa chọn khi người ra quyết định khocircng thể đưa ra quyết định một migravenh
52Caacutec vấn đề thường gặp trong nhoacutem
Kiacutech thước Noacutei chung sự nhất triacute vagrave gắn kết giữa caacutec thagravenh viecircn tỉ lệ nghịch với phạm vi nhoacutem Trong nhoacutem lớn rất dễ higravenh thagravenh caacutec nhoacutem nhỏ vagrave hoạt động rời rạc
Tư duy tập thể Trong nhoacutem lớn mọi người coacute xu hướng suy nghĩ đểđạtđược sự nhất triacute necircn khocircng phaacutet huy được sự saacuteng tạo
Caacutec vấn đề về xatilde hội
Xung đột Trong 1 nhoacutem ai cũng muốn migravenh lagrave giỏi nhất necircn dễ dẫn đến xung đột
Ẩn danh(Giấu tecircn) Đacircy lagrave phương phaacutep được sử dụng để kiểm soaacutet xung đột Cho caacutec thagravenh viecircn tham gia ẩn danh
Vấn đề giới tiacutenh Nam vagrave nữ thường coacute những thế mạnh khaacutec nhau điều nagravey coacute thể lagrave sức mạnh trong 1 thiết lập MDM
Đagravem phaacuten vagrave quyết định
Một quyết định coacute thể liecircn quan đến nhiều quan điểm khaacutec nhau vigrave thế cần phải coacute sự đagravem phaacuten
Caacutec thiết kế của cơ chế hỗ trợ cho MDM phải phugrave hợp với caacutec hoạt độngđagravemphaacuten
Những hoạt động nagravey bao gồm việc thu nhận yacute kiến của caacutec thagravenh viecircn 1 caacutech cocircng bằng
53Cocircng nghệ hỗ trợ MDM
Organizational DSSndash 1 hệ thống cung cấp caacutec quyết định hỗ trợ
Group Support Systemndash Cocircng nghệ sử dụng sự hỗ trợ của nhiều becircn tham gia
Group DSS ndash Lagrave 1 hệ thống được thiết kế đặc biệt để hỗ trợ cho MDM
DSS ndash Lagrave 1 hệ thống dưới sự kiểm soaacutet của 1 người quyết định hệ thống nagravey cung cấp 1 bộ cocircng cụ giuacutep phacircn tiacutech hoagraven cảnh đểđưa ra quyết định vagrave nacircng cao hiệu quả của quyết địnhđoacute
53Cocircng nghệ hỗ trợ MDM
Organizational DSSndash 1 hệ thống cung cấp caacutec quyết định hỗ trợ
Group Support Systemndash Cocircng nghệ sử dụng sự hỗ trợ của nhiều becircn tham gia
Group DSS ndash Lagrave 1 hệ thống được thiết kế đặc biệt để hỗ trợ cho MDM
DSS ndash Lagrave 1 hệ thống dưới sự kiểm soaacutet của 1 người quyết định hệ thống nagravey cung cấp 1 bộ cocircng cụ giuacutep phacircn tiacutech hoagraven cảnh đểđưa ra quyết định vagrave nacircng cao hiệu quả của quyết địnhđoacute
Mục tiecircu của cocircng nghệ hỗ trợ MDM
Quy trigravenh hỗ trợ tập trung vagraveo quaacute trigravenh tạo điều kiện thuận lợi cho sự tương taacutec
Cơ chế cấu truacutec quaacute trigravenh chi phối caacutec hoạt động truyền thocircng
Nhiệm vụ hỗ trợ cocircng việc coacute thể chọn lựa tổ chức hoặc lấy thocircng tin
Nhiệm vụ cấu truacutec cocircng việc cho pheacutep truy cập đến kỹ thuật lọc kết hợp phacircn tiacutech kiến thức liecircn quan đến cocircng việc
Caacutec lớp loại cocircng nghệ hỗ trợ MDM
Phacircn loại theo đặc điểm do DeSanctis vagrave Gallupe đưa ra đề xuất một chương trigravenh ba cấp dựa trecircn caacutec tiacutenh năng được cung cấp
Hệ thống cấp 1 Mục điacutech chiacutenh lagrave tạo điều kiện thocircng tin liecircn lạc giữa caacutec thagravenh viecircn
Hệ thống cấp 2 Thiết kế để giảm thiểu rủi ro
Hệ thống cấp 3 Giuacutep điều chỉnh xử lyacute quyết định
Phacircn loại theo cocircng nghệ -Kraemer vagrave King tập trung vagraveo cocircng nghệ aacutep dụng
Cocircng nghệ bảng mạch điện tử
Hội nghị trực tuyến
Mạng lưới tập đoagraven
Trung tacircm thocircng tin
Mocirci trường cộng taacutec
Phograveng quyết định
Nhoacutem phần mềm
Phần mềm được thiết kế để hỗ trợ sự hợp taacutec bao gồm việc thu huacutet vagrave lưu trữ thocircng tin
Caacutec tổ chức dẫn đầu thị trường hiện tại lagrave Lotus Notes and Domino Microsoft Exchange Novell GroupWise and Oracle Office
Caacutec cocircng cụ trong một bộ phần mềm bao gồm người quản lyacute hội nghị (Lotus Sametime) vagrave trao đổi thocircng điệp (Lotus Notes Mail)
Xếp hạng phần mềm cho nhoacutem
Ellis vv đề xuất một hệ thống xếp hạng dựa vagraveo kiểu sự hỗ trợ noacute Cung cấp
Hệ thocircng điệp
Hệ thống hội thảo truyền higravenh
Hệ thống cộng taacutec soạn thảo
Nhoacutem phacircn phối giải phaacutep phần mền
Hệ thống phối hợp
Hệ thống thocircng minh đại diện
Lực lượng điều khiển phaacutet triển phần mềm cho nhoacutem
Một số nhacircn tố chiacutenh bao gồm
Tăng năng suất
Giảm số lượng caacutec cuộc họp
Tăng cường tự động hoacutea caacutec quy trigravenh lagravem việc thường xuyecircn
Cần phối hợp toagraven cầu tốt hơn
Tiacutenh sẵn sagraveng của những mạng lan rộng
Coleman vagrave Khanna liệt kecirc 10 nhacircn tố khaacutec
54Quản lyacute hoạt động MDM (Mobile Device Management - Quản lyacute thiết bị di động)
Một số phương phaacutep phối hợp phổ biến hơnMDM lagrave
Kỹ thuật nhoacutem định danh
Kỹ thuật Delphi
Sự phacircn xử
Hệ thocircng tin dựa trecircn vấn đề
Nemawashi
Kỹ thuật nhoacutem định danh
1-Mỗi người tham gia viết ra những yacute tưởng về những gigrave necircn quyết định
2-Lần lượt mỗi người tham gia trigravenh bagravey yacute tưởng của migravenh được ghi lại trecircn bảng Khocircng thảo luận ở đacircy
3-Sau khi tất cả caacutec yacute tưởng được trigravenh bagravey caacutec đại biểu coacute thể chất vấn những người khaacutec
4-Mỗi người tham gia bỏ phiếu cho mỗi yacute tưởng
Kỹ thuật Delphi
Về cơ bản tương tự như kỹ thuật nhoacutem định danh ngoại trừ những người khocircng bao giờ tham gia cuộc họp
Một cocircng cụ khảo saacutet được sử dụng để thu thập đầu vagraveo ban đầu từ caacutec thagravenh viecircn
Một cuộc khảo saacutet thứ hai được gửi đi với một bản toacutem tắt caacutec kết quả chung
Những bước lặp lại cho đến khi đạt được một sự đồng thuận hoặc nhigraven nhận của đa số
Sự phacircn xử(Arbitration )
Thiacutech hợp nhất khi caacutec thagravenh viecircn của MDM đại diện cho caacutec yếu tố đối lập
Những người tham gia đồng yacute rằng nếu lựa chọn thay thế hai becircn thỏa thuận khocircng được tigravem thấy thigrave một trọng tagravei viecircn becircn ngoagravei sẽ tham gia
Trọng tagravei sau đoacute lựa chọn thay thế ocircng hoặc xeacutet thấy thiacutech hợp nhất
Hệ thống thocircng tin dựa trecircn vấn đề (IBIS)
Lagrave một phương phaacutep lập luận cấu truacutec
Một đại diện cho IBIS lagrave một đồ thị với caacutec nuacutet vagrave caacutec liecircn kết
IBIS bắt đầu với lựa chọn của một nuacutet vấn đề gốc sau đoacute caacutec nuacutet vị triacute khaacutec nhau được liecircn kết với nuacutet gốc
Caacutec nuacutet vị triacute nagravey sau đoacute được đaacutenh giaacute dựa trecircn những lập luận gắn liền với chuacuteng
Nemawashi (được sử dụng rộng ratildei tại Nhật Bản)
1-Một hoặc nhiều thagravenh viecircn của MDM được chỉ định lagrave điều phối viecircnCaacutec điều phối viecircn sau đoacute chọn người tham gia cograven lại
2-Điều phối viecircn xacircy dựng một tổng hợp caacutec sự lựa chọn vagrave sau đoacute caacutec chuyecircn gia đaacutenh giaacute caacutec lựa chọn
3-Điều phối viecircn lựa chọn một sự lựa chọn dựa trecircn kết quả ở trecircn(ở 2)
4-Sự thay thế được luacircn chuyển điều phối viecircn tigravem kiếm sự đồng thuận thocircng qua sự thuyết phục vagrave đagravem phaacuten
5-Nếu đạt được sự đồng thuận điều phối viecircn cho lưu thocircng một tagravei liệu magrave mỗi thagravenh viecircn MDM để lại dấu hiệu trecircn đoacute
55Nơi lagravem việc ảo
Nhiều tổ chức trecircn toagraven thế giới kinh doanh bất động sản cho cocircng nghệ hợp taacutec
Cocircng việc được trở thagravenh một điều bạn lagravem hơn lagrave một nơi bạn đi
Những thay đổi lớn nhất mang lại bởi nơi lagravem việc ảo coacute thể lagrave về văn hoaacute hay xatilde hội hơn lagrave về cocircng nghệ
Chương 6 Hệ thống thocircng tin điều hagravenh
61 Yacute nghĩa của EIS- Hệ thống thocircng tin điều hagravenh
- EIS lagrave một dạng đặc biệt của DSS được thiết kế để hỗ trợ ra quyết định ở cấp cao nhất của một tổ chức
- Lagrave một hệ thống thocircng tin hỗ trợ nhu cầu lập kế hoạch vagrave đaacutenh giaacute của caacutec nhagrave quản lyacute điều hagravenh
- EIS coacute thể giuacutep một CEO coacute được bức tranh tổng thể chiacutenh xaacutec nhất về caacutec hoạt động vagrave một bản toacutem tắt những gigrave magrave đối thủ cạnh tranh đang lagravem
- Caacutec hệ thống nagravey noacutei chung hoạt động dễ dagraveng vagrave trigravenh bagravey thocircng tin theo những caacutech dễ hiểu để việc tiếp thu được nhanh choacuteng (biểu đồ đồ thịhellip)
(Tagravei liệu thecircm EIS lagrave những loại hệ thống lagrave rất phức tạp trong tự nhiecircn Coacute thể noacutei hệ thống nagravey cũng cung cấp cho caacutec nhagrave quản lyacute với caacutec thiết bị coacute khả năng ra quyết định bằng caacutech sử dụng của noacute Hệ thống nagravey hoạt động trong điều kiện như vậy quan trọng như trong caacutec hệ thống khaacutec khocircng hỗ trợ Khả năng lưu trữ dữ liệu nặng lagravem cho noacute lyacute tưởng để được thocircng qua khocircng chỉ bởi caacutec doanh nghiệp lớn magrave cograven bởi caacutec doanh nghiệp nhỏ hơn Nhigraven chung hệ thống nagravey lagrave dagravenh cho caacutec nhacircn viecircn cấp cao hỗ trợ thagravenh thạo trong việc đưa ra caacutec quyết định quan trọng)
Caacutec phiecircn EIS tiecircu biểu- Phiecircn lagravem việc coacute thể bắt đầu với một baacuteo caacuteo về tigravenh higravenh tagravei chiacutenh vagrave kinh
doanh của một cocircng ty caacutec chỉ số hoạt động quan trọng được hiển thị rotilde ragraveng- EIS sẽ cho pheacutep caacutec giaacutem đốc điều hagravenh coacute thể đi sacircu vagraveo dữ liệu từ những con
số bất kỳ magrave noacute hỗ trợ- Việc điều hagravenh coacute thể lựa chọn một mức độ chi tiết ( VD danh số baacuten hagraveng) nếu
như cần điều tra thecircm- Lagrave một phương phaacutep tiếp cận coacute thể giuacutep việc ra quyết định tốt hơn
Những điều magrave EIS ko coacute- EIS khocircng phải lagrave sự thay thế cho caacutec hệ thống dựa trecircn caacutec maacutey tiacutenh khaacutec EIS
thực sự chỉ cung cấp dữ liệu cho caacutec hệ thống nagravey- Noacute khocircng thể biến caacutec bộ hệ điều hagravenh của maacutey tiacutenh thagravenh những ldquochuyecircn viecircn
giỏirdquo- Coacute thể được viacute một caacutech cao hơn như lagrave một trợ lyacute đaacuteng tin cậy coacute thể được gọi
đến bất khi nagraveo vagrave mỗi khi cần thiết
Tagravei liệu thecircm Sự khaacutec nhau giữa EIS vagrave DSS+ EIS thiết kế để hỗ trợ những người điều hagravenh cấp cao giuacutep họ khaacutem phaacute caacutec vấn đề vagrave caacutec cơ hội DSS hỗ trợ những nười phacircn tiacutech cố gắng trả lời cacircu hỏi caacutei gigrave coacute thể lagravem cugraveng với một cơ hội hoặc một vấn đề
Chiều EIS DSSNhững người sử dụng thocircng thường
Duyệt dữ liệu đi xuống truy xuất trạng thaacutei
Hỗ trợ phacircn tiacutech vagrave quyết định
Sự thuacutec đẩy Tiacutenh thiacutech hợp Tiacutenh hiệu quảỨng dụng Queacutet mocirci trường đaacutenh giaacute
hiệu suất nhận dạng caacutec vấn đề vagrave caacutec cơ hội
Caacutec quyết định quản lyacute trecircn caacutec lĩnh vực đa dạng
Hỗ trợ quyết định Caacutec chiacutenh saacutech caacutec quyết định khocircng coacute cấu truacutec ở mức cao vagrave hỗ trợ giaacuten tiếp
Hỗ trợ caacutec quyết định lặp lại caacutec quyết định khocircng thể đoaacuten trước ra quyết định khocircng coacute cấu truacutec vagrave baacuten cấu truacutec
Loại thocircng tin Caacutec thocircng tin tin tức thocircng tin becircn ngoagravei về khaacutech hagraveng đối thủ cạnh tranh mocirci trường caacutec baacuteo caacuteo theo yecircu cầu vagrave định thời về caacutec hoạt động becircn trong
Caacutec thocircng tin hỗ trợ caacutec tigravenh huống đặc biệt
Sử dụng coacute nguyecircn tắc
Dograve theo vết vagrave điều khiển nhận dạng cơ hội
Hoạch định tổ chức phacircn nhoacutem vagrave điều khiển
Khả năng phugrave hợp với những người sử dụng caacute nhacircn
Thiết kế loại ra quyết định cho mỗi người điều hagravenh caacute nhacircn bằng nhiều lựa chọn đầu ra
Cho pheacutep caacutec đaacutenh giaacute caacute nhacircn caacutec khả năng what-if lựa chọn loại hộp hội thoại
Đồ họa Phải coacute Lagrave một phần quan trọng của nhiều DSS
Thacircn thiện người sử dụng
Phải coacute Phải coacute nếu khocircng coacute người sử dụng trung gian
Xử lyacute thocircng tin Lọc neacuten thocircng tin dograve theo vết dữ liệu vagrave thocircng tin quan trọng
EIS kiacutech thiacutech caacutec cacircu hỏi caacutec cacircu trả lời bằng caacutech sử dụng DSS vagrave phản hồi lại EIS
Hỗ trợ caacutec thocircng tin chi tiết
Truy xuất thường xuyecircn caacutec mức chi tiết của bất kỳ thocircng tin tổng hợp nagraveo (duyệt dữ
Coacute thể coacute trong DSS nhưng khocircng thường
liệu chi tiết)Cơ sở mocirc higravenh Caacutec chức năng coacute sẵn bị hạn
chếLagrave điểm cốt lotildei của DSS
Cấu truacutec Theo người baacuten sản phẩm hoặc theo caacutec chuyecircn gia hệ thống thocircng tin
Theo người sử dụng hoặc caacute nhacircn hoặc caacutec chuyecircn gia từ caacutec trung tacircm thocircng tin hoặc phograveng ban hệ thống thocircng tin
Phần cứng Mainframe caacutec trạm RISC mạng LANs hoặc caacutec hệ thống phacircn bố
Mainframe caacutec trạm RISC caacutec maacutey PC hoặc caacutec hệ thống phacircn bố
Bản chất caacutec goacutei phần mềm
Truy xuất tương taacutec dễ dagraveng đến nhiều cơ sở dữ liệu truy xuất trực tuyến caacutec khả năng DBMS phức tạp caacutec liecircn kết phức tạp
Caacutec khả năng tiacutenh toaacuten lớn caacutec ngocircn ngữ mocirc higravenh mocirc phỏng ứng dụng vagrave caacutec bộ tạo DSS
Bản chất caacutec thocircng tin
Trigravenh bagravey thocircng tin được phaacutet sinh trước về quaacute khứ vagrave hiện tại tạo caacutec thocircng tin mới về quaacute khứ hiện tại tương lai
Tạo thocircng tin mới về quaacute khứ hiện tại tương lai
62 Lịch sử EIS- EIS xuất hiện lần đầu tiecircn tại MIT vagraveo những năm 1970
- Những EIS đầu tiecircn được phaacutet triển bởi caacutec doanh ngiệp lớn sẵn sagraveng chấp nhận rủi ro để đạt được lợi thế cạnh tranh
- Vagraveo những năm 1980 caacutec nhagrave cung cấp đatilde phaacutet triển một số cơ sở khaacutech hagraveng rộng vagrave cocircng nghệ EIS được tiếp tục phaacutet triển cho đến ngagravey nay
(Tagravei liệu thecircm Sử dụng DSSEIS cho phaacutet triển bền vững + Một số nghiecircn cứu đatilde được tiến hagravenh để kiểm tra việc thực hiện của EIS trong khu vực cocircng cộng vagrave chiacutenh phủ caacutec nước tổ chức kể từ khi chuacuteng được phaacutet triển theo định hướng lợi nhuận cho caacutec cocircng ty tư nhacircn (Hasan vagrave Hasan năm 1997) Theo một nghiecircn cứu tiến hagravenh tại Mỹ ở hơn 300 cocircng ty kết quả cho thấy sự khaacutec biệt của EIS giữa tư nhacircn vagrave chiacutenh phủ một số kết quả thuacute vị được phaacutet hiệnViacute dụ khoacute khăn hơn để chuyển tiền từ một tagravei khoản khaacutec trong một EIS của chiacutenh phủ cũng lagrave khoacute khăn hơn để biện giải thiacutech cho những chi phiacute phaacutet triển EIS của chiacutenh phủ Một nghiecircn cứu khaacutec được tiến hagravenh ở Australia
cho thấy rằng EIS cung cấp cho quản lyacute một higravenh ảnh chiacutenh xaacutec hơn về tổ chức thực hiện vagrave cung cấp hỗ trợ cho caacutec lợi iacutech chiến lược cải thiện khocircng chỉ cho caacutec nhagrave quản lyacute nhưng cograven cho phần cograven lại của tổ chức Dựa trecircn caacutec hệ thống được thiết kế cho caacutec cocircng ty tư nhacircn với một caacutech rotilde ragravengxaacutec định mục tiecircu EIS lagrave thiacutech hợp cho caacutec tổ chức cocircng cộng hiện đại nhưng cần phải được linh hoạt hơn vagrave kết thagravenh chugravem một phạm vi rộng hơn khả năng vagrave phương tiện hơn so với khu vực tư nhacircn ban đầu theo định hướng sản phẩm (Hasan vagrave Hasan năm 1997) Điều nagravey coacute thể lagrave do thực tế rằng caacutec hoạt động khu vực cocircng lagrave bắt buộc coacute taacutec động rộng phải đaacutep ứng sự mong đợi duy nhất cocircng cộng thường coacute mục tiecircu mơ hồ vagrave macircu thuẫn iacutet quyền tự chủ vagrave kiểm soaacutet việc ra quyết định vagrave nhacircn viecircn lagrave khoacute khăn hơn (Watson vagrave Carte2000) + Toacutem lại EIS lagrave một khaacutei niệm thagravenh cocircng noacute phaacutet triển qua nhiều năm tuy nhiecircn EIS khắc phục khiếm khuyết của migravenh bằng caacutech tiến hagravenh nghiecircn cứu liecircn tục)
63 Tại sao những người điều hagravenh hagraveng đầu lại khaacutec nhau- Họ lagrave những doanh nghiệp theo định hướng coacute suy nghĩ
- Coacute một khoảng khocircng gian rộng để kiểm soaacutet
- Họ chịu traacutech nhiệm cho việc thiết lập chiacutenh saacutech
- Họ đại diện cho tổ chức mocirci trường becircn ngoagravei
- Hagravenh động của họ tạo ra những kết quả đaacuteng kể về tagravei chiacutenh vagrave con người
Tần số caacutec hoạt động điều hagravenh- Xử lyacute xaacuteo trộn 42
- Hoạt động kinh doanh 32
- Phacircn bổ nguồn lực 17
- Đagravem phaacuten 3
- Những điều khaacutec 6
Handling Disturbances 42
Entrepreneurial Activites 32
Resource Allocation 17
Negotiation 3
Other 6
Những thocircng tin điều hagravenh cần thiết- Quản lyacute xaacuteo trộn coacute thể yecircu cầu sự chuacute yacute xung quanh đồng hồ
- Hoạt động kinh doanh yecircu cầu điều hagravenh để dự đoaacuten những thay đổi trong mocirci trường
- Nhiệm vụ phacircn bổ tagravei nguyecircn yecircu cầu lựa chọn người quản lyacute vagrave caacutec nguồn lực hạn chế được triển khai
- Đagravem phaacuten yecircu cầu cập nhật thocircng tin từng phuacutet để coacute thể xacircy dựng được sự đồng thuận
Caacutec loại thocircng tin điều hagravenh- Hệ thống kế toaacuten coacute liecircn quan đến việc tiacutenh toaacuten thu nhập hoạt động cho caacutec lĩnh
vực cụ thể lagrave quan trọng hơn so với caacutec hệ thống kế toaacuten truyền thocircng- Thocircng tin về thị trường khaacutech hagraveng cung cấp giaacute trị trong việc quyết định chiến
lược- Caacutec thocircng tin cần thiết thường được truyền đi trecircn một số hệ thống maacutey tiacutenh vagrave
nằm trong toagraven tổ chức- Caacutec thocircng tin được sử dụng thường lagrave ngắn hạn vagrave dễ thay đổi
Phương thức để xaacutec định thocircng tin cần thiết
Rockart xaacutec định được năm phương thức cơ bản để xaacutec định thocircng tin cần thiết
- Phương thức dựa trecircn kết quả- Phương thức rỗng- Phương thức chỉ số khoacutea- Phương thức tổng hợp nghiecircn cứu- Phương thức dựa vagraveo nhacircn tố then chốt dẫn đến thagravenh cocircng
64 Thagravenh phần EIS
- Sản phẩm EIS đầu tiecircn được phaacutet triển để sử dụng trecircn maacutey tiacutenh cấu higravenh cao nhưng caacutec sản phẩm hiện nay nhằm mục tiecircu lagrave nền tảng ClientServer
- Những nền tảng linh hoạt hơn coacute thể thiacutech ứng với thay đổi trong tổ chức vagrave cocircng nghệ
- Sử dụng dữ liệu thời gian thực dẫn đến quyết định nhanh hơn nhiều thocircng tin hơn
Thagravenh phần phần cứng- Một EIS khocircng đogravei hỏi coacute phần cứng cụ thể hoặc duy nhất nagraveo- Chigravea khoacutea của vấn đề lagrave để đảm bảo rằng caacutec thagravenh phần của EIS tối ưu hoacutea vagrave
phugrave hợp với tagravei nguyecircn maacutey tiacutenh của tổ chức- Hệ thống nagravey phải được cấu higravenh để caacutec nguồn tagravei nguyecircn phugrave hợp với những
người điều hagravenh chuacuteng
Thagravenh phần phần mềm- Traacutei ngược với phần cứng phần mềm thường được chuyecircn mocircn hoacutea cao cho caacutec
bagravei toaacuten về miền- Sự chuyecircn mocircn hoacutea nagravey thường đạt được bằng caacutech sử dụng thagravenh phần off-the-
shelf cho toagraven bộ EIS vagrave caacutec mocirc-đun tugravey chỉnh để đaacutep ứng nhu cầu cụ thể- Lotus Notes lagrave một viacute dụ điển higravenh Noacute coacute thể được sử dụng một migravenh hoặc coacute
thể phục vụ becircn thứ ba mocirc-đun plug-in
Cocircng nghệ EIS hiện nay
Dobrzeniecki đề xuấtphacircn loạitừng cấptheo bachức năng- Loại 1 sản phẩm bao gồmmột bộ đầy đủcaacutec ứng dụngtừ mộtnhagrave cung cấp- Loại 2 sản phẩm đượcthựchiệnở phần đầu củacaacutecsản phẩmDSS đượcphaacutet triển
bởicugravengmộtnhagrave cung cấp- Loại 3 sản phẩmkết hợp với nhautheo bất kỳ số lượngthuộc sở hữu củacocircng ty
65 Xacircy dựng EIS
- Xacircy dựngmộtEISgiống nhưxacircydựngmột số hệ thống khaacutec củamocirc higravenh hệ thống thocircng tin
- Việcphaacutet triểncấu truacutecnecircn được theo dotildeitừ quaacute trigravenh thiết kế đến quaacute trigravenhthực hiện
- Tuy nhiecircn một dự aacuten phaacutet triển EIScoacute xu hướnglagrave thống nhấtvagraveyecircu cầu hỗ trợ caacutec nhagrave quản lyacute latildenh đạo
- Xacircy dựng một EIScoacute thểphaacutet hiện ra đượccaacutectigravenh huống khoacute khănmagravemột nhagrave phaacutet triển chưabao giờ gặp phải
Mocirc higravenh EIS
Khung phaacutet triển một EIS
- Watson et al đề nghị xacircy dựngkhung với ba thagravenh phần+ Caacutech tiếp cận tập trung vagraveo yếu tốcon người vagrave dữ liệu coacute liecircn quan đến EIS+ Quaacute trigravenh phaacutet triển cần sự linh hoạt vagrave tương taacutec+ Người sử dụng - hệ thống hộp thoại bao gồm một ngocircn ngữ hagravenh động để xử lyacute caacutec lệnh
Lợi iacutech của EIS- Dễ duy trigrave caacutec mục tiecircu coacute tổ chức- Dễ truy xuất thocircng tin- Cho pheacutep người sử dụng nacircng cao hiệu suất hơn
- Tăng chất lượng ra quyết định- Cung cấp sự cải tiến cạnh tranh- Tiết kiệm thời gian của người sử dụng- Tăng khả năng vagrave chất lượng giao tiếp- Cung cấp khả năng điều khiển tốt hơn trong tổ chức- Cho pheacutep tham gia caacutec vấn đề vagrave caacutec cơ hội- Cho pheacutep hoạch định- Cho pheacutep tigravem kiếm nguyecircn nhacircn của một vấn đề- Thảo matilden caacutec yecircu cầu của người điều hagravenh
Hạn chế của EIS vagrave 1 số sai lầm cần traacutenh
- Chi phiacute một cuộc khảo saacutetnăm1991 chothấychi phiacute phaacutet triểntrungbigravenh365000USDvớichi phiacute vận hagravenhhagraveng năm lagrave$200000 (EIS)
- Cocircng nghệ hạn chếEIScần phảiđượctiacutech hợp hoagraven toagravenvagraveokiếntruacuteccủadoanh nghiệphiện tại do đoacute noacutelagrave một thaacutech thứclớn đối vớithiết kế
- Hạn chế tổ chức cơ cấu tổ chứccoacute thể khocircng phugrave hợp
Sự hạn chế về tổ chức- Chương trigravenh nghị sự vagrave thời gian chệch EIS mocirc tả một phần việc thực hiện một
chương trigravenh nghị sự vagrave coacute thể dễ dagraveng đạt được sự tin cậy một caacutech chắc chắn- Đồng bộ hoacutea việc quản lyacute sự tin cậy đuacuteng luacutec đặc biệt baacuteo caacuteo EIS coacute thể phaacute
vỡ sự ổn định thiết lập caacutec chu trigravenh baacuteo caacuteo một caacutech tốt nhất- Sự bất ổn EIS phản ứng nhanh coacute thể gacircy ra việc taacutec động trở lại một caacutech
nhanh choacuteng dẫn đến sự thiếu ổn định trong tổ chức
Sự thất bại lagrave thay thế khocircng thể chấp nhận được- Một số yếu tố lagravem EIS thất bại
+ Thiếu sự hỗ trợ về mặt quản lyacute+ Vấn đề chiacutenh trị+ Thất bại của nhagrave phaacutet triển+ Lỗi về cocircng nghệ+ Giaacute cả+ Thời gian
66 Ra quyết định điều hagravenh trong tương lai vagrave EIS
- Coacute một vagravei điều kiện sẽ được hợp nhất cho việc chuyển đổi cocircng nghệ Trong đoacute một vagravei điều kiện coacute thể dễ dự đoaacuten Hai điều kiện magrave ta coacute thể thấy lagrave+ Phaacutet triển cocircng nghệ maacutey tiacutenh trong việc điều hagravenh sẽ tạo ra sự chuyển đổi được chấp nhận một caacutech dễ dagraveng hơn+ Mở rộng traacutech nhiệm điều hagravenh sẽ mở rộng nhu cầu thocircng tin
Tương lai của EIS- EIS thocircng minh Những tiến bộ trong cocircng nghệ AI sẽ được triển khai trong caacutec
EIS- EIS đa phương tiện Cơ sở dữ liệu đa phương tiện sẽ cho pheacutep tiacutech hợp văn bản
giọng noacutei vagrave higravenh ảnh trong tương lai- EIS thocircng tin Tương lai EIS sẽ mở rộng hơn trong việc sử dụng dữ liệu becircn
ngoagravei doanh nghiệp- EIS kết nối Giao tiếp với băng thocircng rộng cho pheacutep kết nối liecircn thocircng lớn hơn
Chương 7 HỆ CHUYEcircN GIA VAgrave TRIacute TUỆ NHAcircN TẠO
71 Caacutec khaacutei niệm
72 Triacute thocircng minh của triacute tuệ nhacircn tạo
73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia
74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia
75 Lợi iacutech vagrave hạn chế của hệ chuyecircn gia
71 Caacutec khaacutei niệm
Chuyecircn mocircn (Expertise) sự hiểu biết rộng trong 1 lĩnh vực hẹp
Hệ chuyecircn gia (Expert Systems)1 chương trigravenh maacutey tiacutenh sử dụng 1 tập caacutec luật dựa trecircn tri thức của con người để giải quyết caacutec vấn đề đogravei hogravei phải coacute sự chuyecircn mocircn
Một số hệ chuyecircn gia nổi tiếng
DENDRAL (Standford 1960s Edward Feigenbaum)
MYCIN (Standford1970s Edward Shortliffe)
PROSPECTOR (MIT 1979)
Triacute tuệ nhacircn tạo (Artificial Intelligence ndash AI)
Triacute tuệ nhacircn tạo một bộ phacircn của ngagravenh khoa học maacutey tiacutenh quan tacircm đến việc thiết kế caacutec hệ thống maacutey tiacutenh thocircng minh đoacute lagrave caacutec hệ thống đưa ra caacutec đặc điểm magrave từ đoacute chuacuteng ta liecircn hệ với sự thocircng minh trong hagravenh động của con người (Barr vagrave Feigenbaum 1981)
Mục điacutech của AI
Mục điacutech khoa học xaacutec định caacutec gợi yacute để giải thiacutech caacutec loại khaacutec nhau của triacute tuệ thực
Mục điacutech kỹ thuật giải quyết caacutec vấn đề trong thế giới thực
Triacute tuệ nhacircn tạo kế thừa nhiều yacute tưởng quan điểm kỹ thuật từ caacutec ngagravenh khoa học khaacutec
- Triết học
- Logic Toaacuten học
- Tiacutenh toaacuten
- Khoa học tacircm lyacute Khoa học nhận thức
- Sinh học Thần kinh học
- Tiến hoacutea
Caacutec lĩnh vực ứng dụng trong Triacute tuệ nhacircn tạo
Mạng nơ ron thần kinh (Neural Networks)
Tiacutenh toaacuten sự tiến hoacutea
(Evolutionary Computation)
Hệ chuyecircn gia (Expert Systems)
Kỹ thuật xử lyacute tiếng noacutei (Speech Processing)
Kỹ thuật xử lyacute ngocircn ngữ tự nhiecircn
(Natural Language Processing)
Lập kế hoạch (Planning)
Robot (Robotics)
Khoa học higravenh ảnh (Vision)
Caacutec kỹ thuật thocircng dụng dugraveng trong AI
Biểu diễn(Representation)
Học (Learning)
Caacutec luật (Rules)
Tigravem kiếm (Search)
72 Triacute thocircng minh của triacute tuệ nhacircn tạo
Con người suy diễn như thế nagraveo
Phacircn loại (Categorization)
Caacutec quy tắc cụ thể
Heuristics
Kinh nghiệm trước đoacute
Dự tiacutenh trước
Maacutey tiacutenh suy diễn như thế nagraveo
Lập luận dựa trecircn luật IF-THEN mocirc tả tri thức được matilde hoacutea dưới dạng caacutec luật
Caacutec khung (Frames) lagrave caacutec đại diện mocirc tả caacutec tigravenh huống giống nhau lagrave điển higravenh của một vagravei phacircn loại
Lập luận dựa trecircn caacutec trường hợp mocirc phỏng giải phaacutep trước đoacute cho một vấn đề hiện tại
Nhận dạng mẫu phaacutet hiện acircm thanh higravenh dạng hoặc caacutec chuỗi dagravei
Caacutec dạng khaacutec của Triacute tuệ nhacircn tạo
Học maacutey- mạng nơron vagrave giải thuật di truyền
Lập trigravenh tự động ndash lagrave những kỹ thuật tạo ra caacutec chương trigravenh để lagravem 1 nhiệm vụ riecircng biệt (cho pheacutep những người khocircng phải lagrave người lập trigravenh coacute thể lập trigravenh được)
Cuộc sống nhacircn tạo ndash nỗ lực để taacutei tạo caacutec hiện tượng sinh học trong caacutec hệ thống dựa trecircn maacutey tiacutenh
73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia(Expert Systems- ES)
Theo Jackson (1999) Một hệ chuyecircn gia lagrave một chương trigravenh maacutey tiacutenh mocirc tả vagrave suy diễn với tri thức của một vagravei lĩnh vực để giải quyết vấn đề hay đưa ra caacutec lời khuyecircn
Cấu truacutec cơ bản của ES được dựa theo cấu truacutec chung của DSS Sự khaacutec biệt chiacutenh giữa ES vagraveDSS lagrave hệ ES thu thập caacutec kiến thức từ những
chuyecircn gia trong lĩnh vực quan tacircmĐặc trưng của hệ chuyecircn gia Hiệu quả cao Thời gian trả lời thỏa đaacuteng Độ tin cậy cao Dễ hiểu
Giao diện người dugraveng trong ES
Thiết kế giao diện người dugraveng tập trung vagraveo caacutec yếu tố như dễ dagraveng sử dụngcoacute độ tin cậy cao giảm tải những khoacute khăn khi sử dụng
Thiết kế necircn coacute một số tương taacutec (đầu vagraveo kiểm soaacutet vagrave truy vấn)
Cấu tạo giao diện người dugraveng gồm coacute magraven higravenh cảm ứng bagraven phiacutem buacutet saacuteng lệnh thoại caacutec phiacutem chuyecircn dụng
Cơ sở tri thức (Knowledge Base)
Chứa đựng caacutec tri thức cụ thể miền thu được từ caacutec chuyecircn gia miền
Coacute thể chứa caacutec mocirc tả caacutec hagravenh vi giải quyết vấn đề caacutec ragraveng buộc caacutec heuristics
Thagravenh cocircng của một ES dựa trecircn tiacutenh đầy đủ vagrave tiacutenh chiacutenh xaacutec của cơ sở tri thức
Mocirc tơ suy diễn (Inference Engine)
Ở đacircy tri thức được đặt để sử dụng tạo ra caacutec giải phaacutep để giải quyết vấn đề
Mocirc tơ nagravey coacute khả năng thực hiện diễn dịch hoặc suy diễn dựa trecircn caacutec luật hay caacutec caacutec sự kiện
Đồng thời cũng coacute khả năng sử dụng caacutec suy diễn mờ hay khocircng chiacutenh xaacutec dựa trecircn xaacutec suất hay aacutenh xạ mẫu
Vograveng điều khiển suy diễn
1 Aacutenh xạ caacutec luật với caacutec sự kiện đatilde được cho
2 Chọn luật để thực hiện
3 Thực hiện luật bằng caacutech thecircm caacutec sự kiện được suy diễn ra vagraveo bộ nhớ lagravem việc
Chuỗi suy diễn (Chaining)
Suy diễn tiến (forward chaining) maacutey suy diễn bắt đầu từ dữ liệu ban đầu vagrave thực hiện việc suy luận để đưa ra caacutec kết luận cuối cugraveng
Suy diễn lugravei (backward chaining) maacutey suy diễn bắt đầu từ dữ liệu điacutech vagrave tigravem ra tri thức hỗ trợ cho dữ liệu điacutech đoacute
Viacute dụ suy diễn lugravei
R1 Nếu coacute A vagrave B thigrave suy ra coacute D
R2 Nếu coacute B thigrave suy ra coacute C
R3 Nếu coacute C vagrave D thigrave suy ra coacute E
Ta coacute E ta xem trong 3 luật R1 R2 R3 luật nagraveo coacute E ta thấy R3 chứa E đồng thời chứa C vagrave D Xeacutet tiếp trong 2 luật R1 R2 luật nagraveo chứa C vagrave D R2 chứa C R3 chứa D Từ đoacute ta coacute được caacutec tri thức hỗ trợ suy diễn vagrave kết luận lagrave nếu coacute A vagrave B thigrave sẽ coacute E Hay nếu A vagrave B đuacuteng thigrave sẽ coacute E
Viacute dụ suy diễn tiến
Giả sử coacute tập chứa 3 luật sau
R1 Nếu coacute A vagrave B thigrave suy ra coacute D
R2 Nếu coacute B thigrave suy ra coacute C
R3 Nếu coacute C vagrave D thigrave suy ra coacute E
Nếu ta coacute A vagrave B thigrave chuacuteng ta suy ra được D từ R1 vagrave suy ra C từ R2 Với D vagrave C đatilde được suy ra ở trecircn giờ chuacuteng ta suy ra được E từ R3
Viacute dụ thực tế
Giả sử muốn biết magraveu của một con vật nuocirci tecircn lagrave Fred biết rằng noacute kecircu ộp ộp vagrave ăn ruồi
Coacute tập 4 luật ban đầu như sau
R1 Nếu X kecircu ộp ộp vagrave ăn ruồi thigrave X lagrave con ếch
R2 Nếu X kecircu chiecircm chiếp vagrave biết hoacutet thigrave X lagrave con chim
R3 Nếu X lagrave con ếch thigrave X coacute magraveu xanh
R4 Nếu X lagrave con chim thigrave X coacute magraveu vagraveng
74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia
Expert system shells lagrave một tập caacutec goacutei phần mềm vagrave caacutec cocircng cụ dugraveng để phaacutet triển caacutec hệ chuyecircn gia
Những Expert system shells đầu tiecircn thường rất rườm ragrave Mặc dugrave vậy noacute vẫn giuacutep cho người sử dụng sẽ khocircng phải bắt đầu lại từ đầu khi xacircy dựng một hệ chuyecircn gia mới
Những shell hiện đại bao gồm hai mocirc-đun chiacutenh lagrave cocircng cụ xacircy dựng một tập quy tắc vagrave mocirc tơ suy diễn
Xacircy dựng hệ chuyecircn gia
Bước 1 xacircy dựng mocirc higravenh bagravei toaacuten xaacutec định vấn đề nhiệm vụ magrave hệ thống sẽ thực hiện Caacutec dạng bagravei toaacuten cần hệ chuyecircn gia
Bagravei toaacuten diễn giải (InterPretation)
Bagravei toaacuten dự baacuteo (Prediction)
Bagravei toaacuten chuẩn đoaacuten (Diagnose)
Bagravei toaacuten gỡ rối (Debugging)
Bagravei toaacuten thiết kế
Tương tự như một dự aacuten phần mềm để xacircy dựng một hệ chuyecircn gia cần phải coacute caacutec yếu tố về nhacircn lực tagravei nguyecircn vagrave thời gian Những yếu tố nagravey ảnh hưởng đến giaacute thah của một hệ chuyecircn giaTrong phần nagravey cacircu hỏi thường được đặt ra lagrave tại sao cần phải xacircy dựng một hệ chuyecircn giaTrước khi bắt đầu phải xaacute định rotilde bagravei toaacuten đạt ra lagrave jiAi lagrave chuyecircn giaAi lagrave người sử dụng
1 Diễn giải (InterPretation) Nghiecircn cứu 1 vấn đề -gt Dựa trecircn những biểu hiện thuộc tiacutenh đặc trưng becircn ngoagravei -gt Tư vấn
(hoặc đưa ra kết luận hay mocirc tả dễ hiểu từ tập dữ liệu thocirc)
2 Bagravei toaacuten dự baacuteo (Prediction) Coacute thể dự đoaacuten được hagravenh vi kết quả dựa trecircn caacutec hiện tượng -gt dự baacuteo
VD Dự baacuteo thời tiết động đấthellip
3 Bagravei toaacuten chẩn đoaacuten (Diagnoss) Xaacutec định caacutec lỗi caacutec bộ phận hỏng hoacutec của hệ thống dựa trecircn caacutec dữ liệu quan saacutet được
4 Bagravei toaacuten gỡ rối (Debugging) Mocirc tả caacutec phương phaacutep khắc phục hệ thống khi gặp sự cố
5 Bagravei toaacuten thiết kế Lựa chọn cấu higravenh caacutec đối tượng nhằm thoả matilden một số ragraveng buộc nagraveo đoacute
6 Giảng dạy Phần mềm dạy học coacute thể chuẩn đoaacuten vagrave sủa lỗi của học sinh trong quaacute trigravenh học tập
Để xaacutec định đuacuteng bagravei toaacuten magrave chuacuteng ta cần giải quyết thigrave phải trả lời đc một số cacircu hỏi
- cần hệ chuyecircn gia
Bước 2 thu thập tri thức lựa chọn cocircng cụ vagrave aacutep dụng
Trong bước thu thập tri thức vấn đề quan trọng lagrave lựa chọn chuyecircn gia những người magrave sẽ đoacuteng goacutep tri thức cho hệ thống Thocircng thường trong suốt quaacute trigravenh phaacutet triển thigrave chuyecircn gia được xem như một thagravenh viecircn của đội phaacutet triển
Hiện nay coacute rất nhiều cocircng cụ để xacircy dựng một hệ chuyecircn gia Phổ biến nhất lagrave JESS CLIPS vagrave OPS5
Bước 3 Thiết kế cơ sở tri thức thiết kế hệ thốngTri thức được biểu diễn trường minh trong cơ sở tri thức
Caacutec chuyecircn gia vagrave kỹ sư tri thức sẽ đối thoại với nhau bằng caacutec kỹ thuật đối thoại Suy diễn (SD) bảng Mocirc higravenh hoacutea SD quy nạp phacircn loại
Vấn đề bagraveo trigrave vagrave phaacutet triển
Caacutec hệ chuyecircn gia đogravei hỏi phải bảo trigrave vagrave phaacutet triển nhiều hơn so với caacutec hệ thống khaacutec Phải thường xuyecircn bổ sung tri thức mới vagrave thay đổi caacutec tri thức cũ để đổi mới hệ chuyecircn gia
Thu thập vagrave khắc phục lỗi do người sử dụng phaacutet hiện để kịp thời khắc phục những sai soacutet của hệ chuyecircn gia
75 Lợi iacutech vagrave hạn chế của caacutec hệ chuyecircn gia
Một số lợi iacutech chiacutenh
Thời gian trả lời hợp lyacute bằng hoặc nhanh hơn so với chuyecircn gia (người) để đi đến cugraveng một quyết định Hệ chuyecircn gia lagrave một hệ thống thời gian thực (real time system)
Khả năng trả lời với mức độ tinh thocircng bằng hoặc cao hơn so với chuyecircn gia (người) trong cugraveng lĩnh vực
Hệ chuyecircn gia giuacutep cho hiệu quả lagravem việc tăng bằng việc sử dụng tập caacutec luật một caacutech nhanh choacuteng magrave ko bị nhầm lẫn chuyecircn gia lagrave người coacute thể quecircn đi một số tri thức cơ sở lyacute luậ nhưng HCG thigrave ko
Quyết định của một người chuyecircn gia coacute thể bị thay đổi vagrave ko coacute tiacutenh thống nhất như quyết định của một hệ chuyecircn gia tạo ra
Hệ chuyecircn gia giuacutep cho người sử dụng coacute thể trau dồi sự hiểu biết trecircn lĩnh vuej cụ thể magrave noacute giải quyết hỗ trợ người ra quyết định coacute trigravenh độ như 1 chuyecircn gia trong quaacute trigravenh gia quyết định
Kiến thức của rất nhiều chuyecircn gia về một lĩnh vực nagraveo đoacute được đưa vagraveo hệ chuyecircn gia lagravem cho CSTT cuat HCG phong phuacute vagrave rộng lớn hơn rất nhiều
HCG giải thiacutech caacutec bước suy luận một caacutech dễ hiểu nhất quaacuten luacutec nagraveo cũng coacute thể sử dụng ko như chuyecircn gia con người
Hạn chế của caacutec hệ chuyecircn gia
Nhược điểm lớn nhất của hệ chuyecircn gia lagrave những yacute kiến chuyecircn mocircn thường rất khoacute matilde hoacutea vagrave giải neacuten
Hệ chuyecircn gia khocircng coacute khả năng tự học tự cập nhật kiến thức mới như caacutec chuyecircn gia magrave cần phải được matilde hoacutea lại khi noacute được cập nhật
Hệ chuyecircn gia khocircng thể nhận ra được vấn đề khocircng nằm trong miền kiến thức của hệ thống
Chương 8 Tri thức vagrave tiếp nhận
1 Bao gồm caacutec vấn đề
Dữ liệu thực tế đo lường hoặc quan saacutet coacute hoặc khocircng coacute bối cảnh
Thocircng tin dữ liệu được tổng hợp một caacutech hữu iacutech để giải quyết những khoacute khăn trong việc đưa ra quyết định
Tri thức bao gồm caacutec ứng dụng quy tắc thocircng tin hướng dẫn của người ra quyết định
2 Những caacutei nhigraven về tri thức
Đại diện lagravem thế nagraveo để diễn tả tri thức viacute dụ như một quyển saacutech khocircng phải lagrave tri thức nhưng noacute lại lagrave một đại diện của tri thức
Sản xuất tri thức lagrave một tập hơp của hagraveng tồn kho coacute thể được sản xuất cũng như mua lại
Tri thức lagrave 1 trong 6 trạng thaacutei của hệ thống
1Dữ liệu 2Thocircng tin 3Cấu truacutec thocircng tin 4Sự thấu hiểu 5Yacute kiến 6 Quyết định
3 Caacutec loại tri thức Phổ biến mocirc tả dữ liệu thocircng tin thủ tục mọi thứ lagravem như thế nagraveo lập luận chiacutenh saacutech hoặc caacutec quy tắc
4 Thu thập Tri thức hệ chuyecircn gia Hầu hết caacutec phương phaacutep đều bắt đầu với mocirc higravenh của caacutec taacutec vụ trong đoacute
hệ chuyecircn gia được xacircy dựng Trong đoacute mocirc tả về caacutec lĩnh vực được tạo ra Caacutec kỹ sư sử dụng caacutec mocirc higravenh giả thuyết vagrave nhận thức về quaacute trigravenh phacircn
tiacutech để gợi ra caacutech giải quyết vấn đề về tri thức từ caacutec chuyecircn gia
5 Caacutec chiều của thu thập tri thức KE- driven caacutec kỹ sư trao đổi trực tiếp với caacutec chuyecircn gia Expert-driven Caacutec chuyecircn gia trực tiếp đưa chuyecircn mocircn của họ vagraveo hệ
thống maacutey tiacutenh Machine-driven Sử dụng caacutec cocircng cụ suy luận để triacutech xuất tri thức từ một
tập caacutec viacute dụ
6 Kỹ thuật thu thập tri thức Trao đổi gồm 2 loại cơ bản lagrave coacute cấu truacutec(coacute kịch bản) vagrave khocircng coacute cấu
truacutec( đối thoại trực tiếp) Giao thức phacircn tiacutech bằng lời Khi caacutec chuyecircn gia thực hiện một cocircng việc
của họ thigrave một bản ghi về cocircng việc đoacute được thực hiện Caacutec kỹ sư sẽ xacircy dựng mocirc higravenh cho những gigrave được ghi lại trong bản ghi
Phương phaacutep sagraveng lọc caacutec chuyecircn gia so saacutenh caacutec nhoacutem liecircn tiếp trong ba đối tượng vagrave cho biết tại sao nhoacutem thứ hai lại khaacutec nhoacutem thứ ba
7 Thu thập tri thức từ nhiều nguồn Thu thập tri thức từ nhiều nguồn lagrave cần thiết để coacute được đầy đủ caacutec tri thức
cho một vấn đề quan điểm yacute kiến traacutei ngược nhau thường phaacutet sinh Phương phaacutep đồng thuận sẽ giuacutep giải quyết được vấn đề macircu thuẫn Kỹ thuật phacircn tiacutech Meta lagrave kỹ thuật được aacutep dụng trong caacutec trường hợp
khaacutec Caacutech tiếp cận bằng định lượng đogravei hỏi caacutec kỹ sư cần cacircn nhắc yếu tố đầu vagraveo của caacutec chuyecircn gia khaacutec nhau
8 Xaacutec nhận hợp lệ vagrave kiểm tra tri thức Một khi thu thập tri thức noacute phải được đaacutenh giaacute về khả năng sử dụng vagrave độ
chiacutenh xaacutec Hai vấn đề cụ thể lagrave hiệu lực của những kiến thức vagrave kiểm tra việc xacircy dựng cơ sở của tri thức
Cần xaacutec nhận xem liệu hệ thống coacute thể hoạt động ở mức độ tối thiểu khocircng
Xaacutec minh liecircn quan đến việc so saacutenh từng chi tiết kỹ thuật của hệ thống những gigrave đatilde được thực hiện cuối cugraveng
9 Một số caacutec biện phaacutep xaacutec nhận Độ chiacutenh xaacutec Khả năng thiacutech nghi Mức độ đầy đủ Bề rộng Độ sacircu Hiệu lực Tổng quan Chiacutenh xaacutec Hiện thực Độ tin cậy Tiacutenh hữu dụng Mức độ
Chương 9 Học maacutey
1 Logic mờ vagrave ngocircn ngữ mờ(Fuzzy Logic and Linguistic Ambiguity)
Ngocircn ngữ tự nhiecircn gồm những khaacutei niệm mơ hồ vagrave khocircng chiacutenh xaacutectruyền tải ngữ nghĩa thocircng qua tiacutenh xấp xỉkhocircng rotilde ragraveng
Những xấp xỉ nagravey giuacutep con người coacute thể truyền tải hết được yacute nghĩa nhưng maacutey thigrave khocircng hiểu
Lagravem sao biểu diễn caacutec tri thức sử dụng caacutec khaacutei niệm khocircng rotilde ragraveng(mờ) hoặc khocircng chiacutenh xaacutec
2 Khaacutei niệm cơ bản của logic mờ tập mờ lagrave những tập hợp khocircng coacute một giới hạn rotilde Mỗi phần tử của noacute chỉ
chứa một mức độ hagravem liecircn thuộc của từng phần tử Vigrave vậy tập mờ khocircng giống như tập cổ điển Tập mờ coacute thể kết hợp với nhau qua những luật mờ magrave đặc trưng cho những hagravenh động trạng thaacutei vagrave thuộc tiacutenh của logic mờ được tận dụng khi thực hiện một bộ điều khiển mờ
Logic mờ dựa trecircn yacute tưởng mỗi phần tử thuộc vagraveo một tập hợp ở một mức độ nagraveo đấy
Locircgic mờ cho pheacutep độ liecircn thuộc (microA )coacute giaacute trị trong khoảng (01) Locircgic mờ coacute thể được coi lagrave mặt ứng dụng của lyacute thuyết tập mờ để xử lyacute caacutec
giaacute trị trong thế giới thực cho caacutec bagravei toaacuten phức tạp
3 So saacutenh tiacutenh đuacuteng đắn logic mờ vagrave xaacutec suất Xaacutec suất thigrave đề cập đến khả năng xảy ra một biến cố hay một điều gigrave đoacute Logic mờ đề cập đến cấp độ magrave đặc tiacutenh ở hiện tại
o viacute dụ1 người coacute chiều cao 6 feet thigrave coacute cấp độ lagrave 05 về chiều cao
4 Ưu điểm của logic mờ Caacutech tiếp cận rất tự nhiecircnkhocircng phức tạp Coacute thể mocirc higravenh hoacutea caacutec hagravem phi tuyến tugravey yacute phức tạp
Coacute thể tận dụng được kinh nghiệm từ những chuyecircn gia hagraveng đầu trong mọi lĩnh vực
Logic mờ được xacircy dựng dựa trecircn ngocircn ngữ tự nhiecircnNền tảng của logic mờ lagrave dựa trecircn cơ sở giao tiếp của con người
5 Nhược điểm của logic mờ Trong 1 hệ thống phức tạpsử dụng logic mờ coacute thể trở thagravenh trở ngại cho
việc xaacutec thực độ tin cậy của hệ thống Cơ chế lập luận mờ khocircng thể học hỏi từ những lỗi sai
6 Mạng noron nhacircn tạo(ANN) Mạng noron nhacircn tạo lagrave một mocirc phỏng xử lyacute thocircng tinđược nghiecircn cứu ra
từ hệ thống thần kinh của sinh vậtgiống như bộ natildeo để xử lyacute thocircng tin ANNs lagrave chương trigravenh dựa trecircn maacutey tiacutenh đơn giản coacute chức năng lagrave một mocirc
higravenh bagravei toaacuten khocircng gian dựa trecircn thử nghiệm vagrave baacuteo lỗi
7 Học từ kinh nghiệm Tiến trigravenh Một mẫu dữ liệu được biểu diễn như một mạng lưới noronANN ldquodự
đoaacutenrdquo 1 đầu radự đoaacuten được so saacutenh với giaacute trị thực tế hoặc giaacute trị chiacutenh xaacutecNếu đoaacuten được chiacutenh xaacutec thigrave khocircng coacute hagravenh động nagraveo được thực hiện
Nếu dự đoaacuten sai ANN kiểm tra lại vagrave xaacutec định lại thocircng số để điều chỉnh Một mẫu dữ liệu khaacutec được biểu diễn vagrave quaacute trigravenh nagravey được lặp lại
8 Nguyecircn tắc cơ bản của cocircng nghệ nơron Caacutec yếu tố xử lyacute cơ bản trong hệ thống thần kinh của con người lagrave tế bagraveo
thần kinhMạng lưới của tế bagraveo nagravey lagrave liecircn kết với nhau nhận được thocircng tin từ caacutec cảm biến trong mắt taihellip
Thocircng tin nhận được bởi tế bagraveo thần kinh hoặc lagrave sẽ kiacutech thiacutech noacute(sẽ được chuyển qua 1 thocircng điệp dọc theo mạng lưới) hoặc lagrave sẽ ngăn cản noacute(ngăn cản dograveng thocircng tin)
Độ nhạy coacute thể thay đổi qua thời gian hoặc sau khi coacute được kinh nghiệm
9 Cấu truacutec mạng Một ANN gồm 3 lớp cơ bản
Lớp đầu vagraveo nhận dữ liệu Lớp becircn trong hoặc lagrave lớp ẩn xử lyacute dữ liệu Lớp đầu ra chuyển tiếp kết quả cuối cugraveng của mạng
10Mạng nơ ron Thường coacute nhiều đầu vagraveo mỗi đầu vagraveo với mức ảnh hưởng vagrave tầm quan
trọng riecircng của noacute Một đầu vagraveo quan trọng coacute thể được sử dụng để khuếch đại đầu ra caacutec hagravem trạng thaacutei tổng hợp caacutec trọng số của caacutec yếu tố
đầuvagraveo khaacutec nhauvagraveo một giaacute trị duy nhất Caacutec hagravem chuyển giao xử lyacute caacutec giaacute trị trạng thaacutei vagrave tạo đầu ra
11Huấn luyện mạng nơ ron Trong mocirc higravenh coacute giaacutem saacutetANN được đến so saacutenh dự đoaacuten của chiacutenh
noacute với thocircng tin phản hồi coacute chứa caacutec kết quả mong muốn ANN sẽ phải tigravem caacutech thay đổi caacutec tham số becircn trong củamigravenh (caacutec trọng số vagrave caacutec ngưỡng) để tạo necircn một aacutenh xạ coacute khả năng aacutenh xạcaacutec đầu vagraveo thagravenh caacutec đầu ra mong muốn Sự thay đổi nagravey được tiến hagravenh nhờ việc so saacutenh giữa đầu ra thực sự vagrave đầu ra mong muốn
Trong mocirc higravenh khocircng coacute giaacutem saacutetANN nhận được dữ liệu vagraveo nhưng khocircng phải coacute bất kỳ thocircng tin phản hồi về kết quả mong muốn
Phần lớn caacutec ứng dụng nằm trong vugraveng của caacutec bagravei toaacuten ước lượng như mocirc higravenh hoacuteathống kecirc neacuten lọc phacircn cụm
12Lợi iacutech Liecircn kết với mạng noron Traacutenh caacutech lập trigravenh tường minh Giảm nhu cầu của chuyecircn gia ANNs thigrave thiacutech nghi với caacutec yếu tố đầu vagraveo thay đổi Khocircng cần thiết cho cơ sở tri thức tinh chế ANNs coacute tiacutenh động vagrave cải thiện với việc sử dụng Coacute khả năng xử lyacute dữ liệu khocircng chiacutenh xaacutec hoặc khocircng đầy đủ Cho pheacutep tổng quaacutet hoacutea từ thocircng tin cụ thể Cho pheacutep thu thập cảm giaacutec thocircng thường vagraveo miền giải quyết vấn đề
13Hạn chế của việc liecircn kết với mạng noron ANNs khocircng thể giải thiacutech được suy luận Bản chất hộp đen thường khiến cho vấn đề traacutech nhiệm vagrave độ tin cậy phaacutet
sinh lagrave khoacute khăn Lặp đi lặp lại quaacute trigravenh huấn luyện rất tốn thời gian Nguồn lực caacutec nhagrave phacircn tiacutech vagrave thiết kế coacute tay nghề cao vẫn lagrave đaacuteng lo
ngại Cocircng nghệ ANN thuacutec đẩy hạn chế của phần cứng hiện tại ANN yecircu cầu phải coacute sự tin tưởng ở đầu ra
14Giới thiệu về thuật toaacuten di truyền Cũng như mạng lưới thần kinh caacutec thuật toaacuten di truyền được dựa trecircn lyacute
thuyết sinh học Thuật toaacuten di truyền tigravem thấy nguồn gốc của chuacuteng trong caacutec lyacute thuyết
tiến hoacutea của chọn lọc tự nhiecircn vagrave thiacutech ứng với biến đổi khiacute hậu Kết quả thuật toaacuten di truyền lagrave từ giao phối 2 caacute thể trong quần thế để tạo
ra con caacutei đocirci khi tốt hơn so với bậc cha mẹ của chuacuteng 15Caacutec thagravenh phần cơ bản của thuật toaacuten di truyền
Toaacuten tử chọn lọc Caacutec caacute thể tốt được chọn lọc để đưa vagraveo thế hệ sau Sự chọn lọc nagravey căn cứ vagraveo độ thiacutech nghi với mocirci trường của mỗi caacute thể
Toaacuten tử lai gheacutep (crossover) Hai caacute thể cha vagrave mẹ trao đổi caacutec gen với nhau để tạo ra caacute thể con
Toaacuten tử đột biến (mutation) Một caacute thể thay đổi một số gen để biến đổi thagravenh một caacute thể mớiTất cả caacutec toaacuten tử trecircn khi thực hiện đều mang tiacutenh ngẫu nhiecircn
16Quaacute trigravenh cơ bản của một thuật toaacuten di truyền Khởi tạo
Đaacutenh giaacute quần thể
Lựa chọn NST thiacutech hợp nhất vagrave loại bỏ NST yếu nhất
Quy trigravenh giao nhau vagrave cải thiện quần thể
đột biến tiến trigravenh để khaacutem phaacute ra NST mới
17Ưu nhược điểm của việc kết hợp với thuật toaacuten di truyền Kiacutech thước quần thể lagrave 1 yếu tố quan trọng trong tốc độ của việc tigravem
kiếmnhưng noacute tương đối dễ dagraveng để dự đoaacuten tốc độ nagravey Giao nhau hoặc đột biến lagrave khocircng necircn đc sử dụng quaacute thường xuyecircn Luocircn coacute được iacutet nhất 1 giải phaacutep hợp lyacute Necircn coacute thể aacutep dụng chuacuteng cho caacutec vấn đề magrave chuacuteng ta khocircng coacute hướng
về caacutech giải quyết Sức mạnh của thuật toaacuten xuất phaacutet từ khaacutei niệm đơn giảnkhocircng phải từ
một thủ tục thuật toaacuten phức tạp 18Tương lai của học maacutey
Mạng lưới thần kinh nhacircn tạo vượt quaacute năng lực của con người trong caacutec trường hợp bị cocirc lập
Về mặt lyacute thuyếtmột maacutey tiacutenh coacute thể xử lyacute dũ liệu nhanh hơn hagraveng triệu lần so với 1 con người
May mắn thay cho chuacuteng tacon người tốt hơn nhiều khi magrave coacute được dữ liệumaacutey tiacutenh khocircng coacute 1 số thứ như lagrave 5 giaacutec quan
CHƯƠNG 10 KHO DỮ LIỆU
1 Kho dữ liệu Kho dữ liệu lagrave tuyển tập caacutec cơ sở dữ liệu tiacutech hợp hướng chủ đề được
thiết kế để trợ giuacutep cho một hệ hỗ trợ quyết định
Theo John Ladley Cocircng nghệ kho dữ liệu lagrave tập caacutec phương phaacutep kỹ thuật vagrave caacutec cocircng cụ coacute thể kết hợp hỗ trợ nhau để cung cấp thocircng tin cho người sử dụng trecircn cơ sở tiacutech hợp từ nhiều nguồn dữ liệu nhiều mocirci trường khaacutec nhau
Kho dữ liệu thường rất lớn tới hagraveng trăm GB hay thậm chiacute hagraveng Terabyte
2 Kho dữ liệu vận hagravenh (ODS) Một kho dữ liệu vận hagravenh Aacutep dụng kỹ thuật kho dữ liệu vagraveo caacutec hệ xử
lyacute giao taacutec lưu trữ dữ liệu cho một ứng dụng đặc thugrave Noacute đưa vagraveo kho dữ liệu một dograveng caacutec dữ liệu thocirc được thiết kế
3 So saacutenh
Kho dữ liệu vận hagravenh Kho dữ liệu
Dữ liệu theo chủ đề Dữ liệu theo chủ đề
Dữ liệu tiacutech hợp Dữ liệu tiacutech hợp
Dữ liệu thay đổi Dữ liệu khocircng thay đổi
Dữ liệu được cập nhật khi thay đổi
Dữ liệu giữ nguyecircn
Chỉ coacute dữ liệu hiện tạiDữliệu hiện tại vagrave dữ liệu lịch sử
Chu kỳ lagravem tươi dữ liệu ngắn Chu kỳ lagravem tươi dữ liệu dagravei
Chỉ coacute dữ liệu chi tiết Dữ liệu chi tiết vagrave dữ liệu tổng kết
Dugraveng cho caacutec quyết định ngắn hạn
Dugraveng cho hoạch định dagravei hạn
4 Kho dữ liệu cục bộ (Data Mart - DM)
Kho dữ liệu cục bộ lagrave CSDL coacute những đặc điểm giống với kho dữ liệu nhưng với quy mocirc nhỏ hơn vagrave lưu trữ dữ liệu về một lĩnh vực một chuyecircn ngagravenh
Data mart phụ thuộc Chứa những dữ liệu được lấy từ DW vagrave những dữ liệu nagravey sẽ được triacutech lọc vagrave tinh chế tiacutech hợp lại ở mức cao hơn để phục vụ một chủ đề nhất định của Datamart
Data mart độc lập Khocircng giống như Datamart phụ thuộc Data mart độc lập được xacircy dựng trước DW vagrave dữ liệu được trực tiếp lấy từ caacutec nguồn khaacutec nhau
5 Siecircu dữ liệu Metadata lagrave dữ liệu để mocirc tả dữ liệu Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột
một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi Metadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu
6 Mocirci trường kho dữ liệu Hệ thống của tổ chức vagrave kho cung cấp dữ liệu để xacircy dựng kho dữ liệu Trong quaacute trigravenh chuyển dữ liệu từ caacutec nguồn khaacutec nhau dữ liệu coacute thể
được lagravem sạch hoặc chuyển đổi vagrave vigrave thế DW được xem như lagrave một chuẩn cho việc lưu trữ
Đồng thời siecircu dữ liệu được ghi lại Cuối cugraveng DW hoặc siecircu thị coacute thể được sử dụng để tạo ra một kho dữ
liệu ldquocaacute nhacircnrdquo 7 Caacutec đặc điểm của kho dữ liệu
Đặc điểm Mocirc tả
Hướng chủ đề - DL tổ chức theo caacutech thức người dugraveng tham chiếu
Tiacutech hợp - Dữ liệu ldquosạchrdquo loại bỏ tiacutenh thiếu nhất quaacuten
Khocircng thay đổi - DL ldquochỉ đọcrdquo người dugraveng khocircng thay đổi được
Chuỗi thời gian - DL lagrave chuỗi thời gian khocircng phải lagrave trạng thaacutei hiện tại
Được tổng kết - DL vận hagravenhthao taacutec khi cần thiết
được kết hợp lại thagravenh dạng coacute thể dugraveng được cho quyết định
Kiacutech cỡ lớn hơn - Lưu giữ theo chuỗi thời gian tức lagrave giữ lại nhiều DL
Khocircng được chuẩn hoacutea - Coacute thể dư thừa DLSiecircu dữ liệu - Dữ liệu của dữ liệu được lưu trữNguồn dữ liệu - DL vận hagravenh (caacutec hệ sẵn coacute) cugraveng
với caacutec nguồn ngoagravei 8 Kho dữ liệu hướng chủ đề
Hướng chủ để coacute nghĩa lagrave kho dữ liệu được tổ chức xung quanh caacutec chủ đề chiacutenh như khaacutech hagraveng sản phẩm sản xuất Tập trung vagraveo việc mocirc higravenh hoacutea vagrave phacircn tiacutech dữ liệu cho caacutec nhagrave ra quyết định magrave khocircng tập trung vagraveo caacutec xử lyacute thocircng thường Cung cấp cho người dugraveng một khung nhigraven toagraven vẹn đơn giản vagrave đầy đủ về caacutec sự kiện quanh caacutec chủ đề
9 Dữ liệu trong DW được tiacutech hợp Dữ liệu trong kho dữ liệu được xacircy dựng bằng caacutech tổng hợp dữ liệu từ
nhiều nguồn khaacutec nhau vagrave caacutec nguồn coacute tổ chức khaacutec nhau Cơ sở dữ liệu caacutec file excel caacutec flat file hoặc caacutec raw file Khi đưa vagraveo kho dữ liệu caacutec dữ liệu được lagravem sạch vagrave tiacutech hợp dữ liệu nhằm đảm bảo tiacutenh nhất quaacuten của dữ liệu
10Kiến truacutec kho dữ liệu Tầng cơ sở dữ liệu hoạt động Tầng truy xuất thocircng tin Tầng truy xuất dữ liệu Tầng siecircu dữ liệu Tầng quản lyacute tiến trigravenh Tầng thocircng điệp của ứng dụng Tầng vật liacute của kho dữ liệu Tầng trigravenh diễn dữ liệu
11Higravenh trạng kho dữ liệu Kho dữ liệu ảo - người dugraveng cuối coacute thể truy cập trực tiếp đến kho dữ liệu
sử dụng caacutec cocircng cụ cho pheacutep ở tầng truy xuất dữ liệu Kho dữ liệu trung tacircm-1 cơ sở dữ liệu vật lyacute chứa tất cả dữ liệu cho một
vugraveng chuyecircn dụng nagraveo đoacute
Kho dữ liệu phacircn taacuten- Thagravenh phần được phacircn taacuten qua nhiều hệ cơ sở dữ liệu vật lyacute
12METADATA- Siecircu dữ liệu Định nghĩa Siecircu dữ liệu lagrave dữ liệu về dữ liệu Lagrave 1 lưu trữ dugraveng để
Miecircu tả kho dữ liệu tổng thể Nhận dạng kiểu kho dữ liệu Quản liacute quaacute trigravenh tiacutech hợp dữ liệu Quản liacute quaacute trigravenh cập nhật kho dữ liệu Quản liacute bảo mật
Lagrave chigravea khoacutea quyết định sự thagravenh cocircng của kho dữ liệu luocircn được thay đổi vagrave cập nhật theo sự phaacutet triển của kho dữ liệu
Dugraveng để quản liacute điều khiển kho dữ liệu Sự ra đời của kho dữ liệu như 1 cấu truacutec hỗ trợ ra quyết định siecircu dữ liệu
được xem như nguồn tagravei nguyecircn dữ liệu Siecircu dữ liệu lagrave trừu tượng Chuacuteng lagrave dữ liệu bậc cao cung cấp mocirc tả ngắn
gọn caacutec dữ liệu bậc thấp hơn 13Hoạt động của Siecircu dữ liệu
Siecircu dữ liệu rất cần thiết trong việc chuyển hoacutea thocircng tin trở thagravenh tri thức Lagrave chigravea khoacutea giuacutep chuacuteng ta xử lyacute được dữ liệu thocirc Viacute dụ một dograveng dữ liệu baacuten hagraveng 1023 K596 11121 agraveNoacute sẽ khocircng coacute nghĩa gigrave cho đến khi chuacuteng ta đưa vagraveo siecircu dữ liệu (thư
mục chứa dữ liệu) agrave cửa hagraveng 1023 sản phẩm K596 vagrave số tiền baacuten được lagrave 11121 đocirc la
14Sự cần thiết phải nhất quaacuten trong kho dữ liệu Kho dữ liệu được xacircy dựng cho lợi iacutech của những nhagrave phacircn tiacutech kinh
doanh caacutec nhagrave quản trị cho tất cả caacutec khu vực chức năng Trong cơ sở dữ liệu riecircng caacutec khu vực khaacutec nhau coacute thể định nghĩa vagrave lưu
trữ dữ liệu thocircng qua phiecircn bản của chiacutenh noacute Khi dữ liệu được lấy từ những vugraveng khaacutec nhau đoacute vagrave được đặt vagraveo kho dữ
liệu Việc chuyển đổi vagrave lagravem sạch caacutec tiến trigravenh sẽ đảm bảo noacute lagrave duy nhất được tiacutech hợp tại một mức của tổ chức
15Ragrave soaacutet lại dữ liệu ndash Thực thi siecircu dữ liệu
Bất kể cấu truacutec tự nhiecircn của 1 cacircu truy vấn thế nagraveo thigrave caacutec thagravenh phần của siecircu dữ liệu rất quan trọng đối với người ra quyết định
Bảng thuộc tiacutenh khoacutea được lưu trữ bởi kho dữ liệu Tập hợp dữ liệu được lấy từ đacircu Những chuyển đổi nagraveo được thực thi với việc lagravem sạch
16Siecircu dữ liệu lagrave gigrave Metadata - lagrave thocircng tin mocirc tả nội dung của cơ sở dữ liệu (CSDL) Metadata baacuteo cho người dugraveng biết thời gian cập nhật sau cugraveng của dữ liệu
định dạng vagrave mục điacutech sử dụng của noacute Những thocircng tin nagravey coacute thể hướng dẫn người dugraveng duyệt qua CSDL vagrave
giuacutep họ hiểu được yacute nghĩa vagrave ngữ cảnh của dữ liệu Trong CSDL metadata lagrave caacutec dạng biểu diễn khaacutec nhau của caacutec đối tượng
trong CSDL Trong CSDL quan hệ metadata lagrave caacutec định nghĩa của bảng cột CSDL
view vagrave nhiều đối tượng khaacutec Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột
một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi -gtMetadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu
Bảng chuyển đổi Ghi lại những chuyển đổi đatilde được thực hiện
Lịch sử thực thi Ghi lại những dữ liệu đatilde được
phacircn tiacutech
Higravenh thaacutei kết nốiGhi lại những dữ liệu được kết nối vagrave tần suất
17Aacutenh xạ thocircng thường của siecircu dữ liệu Bản ghi aacutenh xạ chuyển đổi bao gồm
Định danh của nguồn gốc Chuyển đổi thuộc tiacutenh Chuyển đổi thuộc tiacutenh vật lyacute Matilde hoacutea tham chiếu bảng chuyển đổi Đổi tecircn Đổi khoacutea Gaacuten giaacute trị cho thuộc tiacutenh mặc định Chọn logic cho caacutec nguồn nhiều giaacute trị Đổi thuật toaacuten
18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để
phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai
lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave
tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec
Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm
Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo
19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua
caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau
SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được
Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra
một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức
Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ
Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ
Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech
CHƯƠNG 11 KHAI PHAacute DỮ LIỆU
1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn
ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993
Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng
2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd
1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều
2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP
3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn
4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng
5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server
6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo
7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động
8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời
9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều
10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện
11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech
12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP
3 Xử lyacute phacircn tiacutech trực tuyến OLAP
MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave
dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu
ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave
thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu
HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave
ROLAP4 Khai phaacute dữ liệu
Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh
khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn
Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan
5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp
6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại
Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp
Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec
Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt
Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra
Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh
vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho
Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec
Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm
Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục
Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng
gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp
Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn
Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec
Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper
Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2
Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25
Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước
Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng
Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện
trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp
Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute
độ hỗ trợ ge ngưỡng minsup
độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan
Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn
Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết
Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu
MOLAP ROLAP HOLAP
Lưu trữ dữ liệu cơ sở
Khối Bảng quan hệ Bảng quan hệ
Lưu trữ thocircng tin tổng hợp
Khối Bảng quan hệ Khối
Hiệu suất thực hiện truy vấn
Nhanh nhất Chậm nhất Nhanh
Tiecircu thụ khocircng gian lưu trữ
Nhiều Thấp Trung bigravenh
Chi phiacute bảo trigrave Cao Thấp Trung bigravenh
Hiệu lực của mỗi style riecircng biệt phụ thuộc vagraveo ngữ cảnh bagravei toaacuten nhận thức của người ra quyết định vagrave tập caacutec giaacute trị caacute nhacircn của bản thacircn họ
Độ phức tạp của caacutec điều đoacute liecircn kết lại với nhau trong việc higravenh thagravenh decision style
Caacutec kiểu ra quyết định Directive ndash kết hợp đogravei hỏi về cấu truacutec bagravei toaacuten cao với mức độ nhập nhằng thấp
Thocircng thường đacircy lagrave caacutec quyết định coacute bản chất kỹ thuật vagrave đogravei hỏi iacutet thocircng tin Analytical ndash Mức độ nhập nhằng lớn hơn vagrave đogravei hỏi nhiều thocircng tin hơn Conceptual ndash Mức độ nhập nhằng cao vagrave thường gần gũi với caacutech ra quyết định
của con người Behavioral ndash đogravei hỏi lượng dữ liệu nhỏ vagrave thể hiện caacutei nhigraven ngắn hạn Thường
xảy ra xung đột necircn phải dựa vagraveo sự đồng thuận Caacutec kiểu ra quyết định trong thiết kế hệ trợ giuacutep quyecirct định
Những cản trở lớn chiacutenh lagrave phản ứng của người ra quyết định trước aacutep lực vagrave phương phaacutep dugraveng để giải bagravei toaacuten
Viacute dụ đối với những người khocircng chịu được aacutep lực trong dạng directive thigrave giao diện cần cho pheacutep người ra quyết định kiểm soất được hệ thống với khocircng coacute quaacute nhiều dữ liệu đầu vagraveo
Đối với kiểu analytic DSS cần cho pheacutep truy cập tới nhiều nguồn dữ liệu magrave người ra quyết định sẽ phacircn tiacutech
13Khoacute khăn khi xacircy dựng DSS
- Thocircng tin mocirc higravenh cấu truacutec -gt iacutet thocircng tin
- Khả năng của con người (khả năng hiểu biết) chỉ xử lyacute được từ 5-gt9 quaacute trigravenh thocircng tin khaacutec nhau
- Khocircng chắc chắn ( mức độ hoagraven thagravenh vagrave tiacutenh chiacutenh xaacutec)
- Coacute nhiều lựa chọn vagrave đa mục tiecircu
Chương 3Quyết định trong tổ chức
14Tổ chức lagrave gigrave Tổ chức Lagrave 1 hệ thống thống nhất caacutec nguồn tagravei nguyecircnĐược cấu thagravenh bởi caacutec
hệ thống nhỏ hơn ragraveng buộc với nhau bởi caacutec mục tiecircu đề ra
Tổng thể 1 tổ chức sẽ mạnh mẽ hơn rất nhiều so với tất cả caacutec thagravenh phần của noacute cộng lại
Mối liecircn hệ của caacutec quyecirct định Mục điacutech chiacutenh của caacutec tổ chức lagrave đưa ra caacutec quyết định trong mocirci trường kinh doanh Caacutec Quyết định phải phugrave hợp với giới hạncaacutec chiacutenh saacutech caacutec thủ tục vagrave lĩnh vực hoạt động Noacute khocircng phụ thuộc vagraveo người đưa ra quyết định lagrave ai Đoacute coacute thể lagrave 1 caacute nhacircn1 nhoacutem hay thậm chiacute DSSs
Độ đo của quyết địnhNăm khiacutea cạnh ảnh hưởng tới Quyết định
Kết cấu nhoacutem (Group Structure) Vai trograve trong nhoacutem(Group Roles) Quaacute trigravenh lagravem việc(Group Processes) Taacutec phong(Group Style) Quy tăc nhoacutem(Group Norm)
Kết cấu nhoacutem Trong 1 nhoacutem chuẩn caacutec thagravenh viecircn coacute traacutech nhiệm vagrave thẩm quyền ra quyết định như nhau Vai trograve trong nhoacutemTrong nhoacutem caacutec thagravenh viecircn đều coacute vai trograve riecircng vagrave
lagrave 1 phần quan trong trong cả tiến trigravenh Quaacute trigravenh lagravem việcQuaacute trigravenh dugraveng người trong nhoacutem ảnh hưởng tới loại
quyết định gacircy hiệu quả vagrave ảnh hưởng tới cả tiến trigravenh Taacutec phong Coacute phải taacutec phong của người ra quyết định coacute ảnh hưởng tới
chất lượng quyết định cuối khocircng Quy tắc nhoacutemQuy tắc nhoacutem lagrave cực kỳ quan trọng trong việc xaacutec định
hagravenh vi caacutec thagravenh viecircn nhoacutem trong caacutec tigravenh huống xatilde hội Phacircn cấp quyết định trong tổ chức3 cấp
Chiến lược Ban latildenh đạo cấp cao hoặc nhagrave quản lyacute Caacutec quyết định mang tiacutenh lacircu dagravei nhất
Chiến thuật Quản lyacute tầm trung Thực thi caacutec quyết định chiến lược đề ra
Thực hiện
Caacute nhacircn chuyecircn ngagravenh Tự đưa ra caacutec quyết định từng ngagravey
15Năng lực của hệ HTQD
1 HHTQĐ cơ bản hỗ trợ caacutec nhagrave ra quyết định trong caacutec tigravenh huống nửa cấu truacutec vagrave phi cấu truacutec bằng caacutech kết hợp phaacuten xử của con người vagrave xử lyacute thocircng tin bằng maacutey tiacutenh Caacutec bagravei toaacuten như vậy khocircng thểkhocircng thuận tiện giải quyết được chỉ bằng caacutec cocircng cụ maacutey tiacutenh hoacutea hay caacutec phương phaacutep định lượng 2 Phugrave hợp cho caacutec cấp quản lyacute khaacutec nhau từ cao đến thấp 3 Phugrave hợp cho caacute nhacircn lẫn nhoacutem Caacutec bagravei toaacuten iacutet coacute tiacutenh cấu truacutec thường liecircn đới đến nhiều caacute nhacircn ở caacutec đơn vị chức năng hay mức tổ chức khaacutec nhau cũng như ở caacutec tổ chức khaacutec 4 Hỗ trợ cho caacutec quyết định tuần tự liecircn thuộc được đưa ra một lần vagravei lần hay lặp lại 5 Hỗ trợ cho caacutec giai đoạn của quaacute trigravenh ra quyết định tigravem hiểu thiết kế lựa chọn vagrave hiện thực 6 Phugrave hợp cho một số caacutec phong caacutech vagrave quaacute trigravenh ra quyết định 7 Coacute thể tiến hoacutea theo thời gian Người dugraveng coacute thể thecircm bỏ kết hợp thay đổi caacutec phần tử cơ bản của hệ thống 8 Dễ dugraveng vagrave thacircn thiện với người dugraveng 9 Nhằm vagraveo nacircng cao tiacutenh hiệu dụng của quyết định (chiacutenh xaacutec thời gian tiacutenh chất lượng) thay vigrave lagrave tiacutenh hiệu quả (giaacute phiacute của việc ra quyết định) 10 Người ra quyết định kiểm soaacutet toagraven bộ caacutec bước của quaacute trigravenh ra quyết định HHTQĐ chỉ trợ giuacutep khocircng thay thế người ra quyết định 11 Người dugraveng cuối cugraveng coacute thể tự kiến tạo vagrave sửa đổi caacutec hệ thống nhỏ vagrave đơn giản 12 Thường dugraveng mocirc higravenh để phacircn tiacutech caacutec tigravenh huống ra quyết định 13 Cung ứng caacutec truy đạt dữ liệu từ nhiều nguồn dạng thức vagrave kiểu khaacutec nhau 14 Coacute thể dugraveng như một cocircng cụ độc lập hay kết hợp với caacutec HHTQĐứng dụng khaacutec dugraveng đơn lẻ hay trecircn một mạng lưới maacutey tiacutenh (intranet extranet) bất kỳ với cocircng nghệ WEB
16Văn hoacutea tổ chứcVăn hoacutea của tổ chức lagrave tập hợp của rất nhiều thứ (lograveng tin biểu tượng đặc trưng regraven luyện) được phaacutet triển qua thời gian dagravei
Noacute gacircy ra ảnh hưởng mạnh mẽ cograven hơn cả những hoạt động của tổ chức đoacute 10 đặc điểm văn hoacutea của tổ chức
Điều khiển Hệ thống khen thưởng Sự đồng nhất Chịu đựng xung đột Mocirc higravenh giao tiếp Hỗ trợ quản lyacute Sự hogravea nhập Định hướng Chịu đựng rủi ro Caacute nhacircn khởi xướng
Mối quan hệ của văn hoacutea với hiệu năng lagravem việc1 tổ chức thagravenh cocircng phải coacute xu hướng hogravea hợp giữa văn hoacutea với mocirci trường trong vagrave ngoagravei tổ chức
Phugrave hợp trong nội bộ cho thấy một sự kết hợp giữa văn hoacutea của tổ chức với những cocircng nghệ của chiacutenh noacute
Phugrave hợp với becircn ngoagravei cho thấy một nền văn hoacutea phugrave hợp với chiến lược thị trường
Văn hoacutea vagrave sự thay đổi 1 tổ chức magrave khocircng biết thay đổi văn hoacutea sẽ khocircng thể giữ được vị triacute của migravenh trecircn thị trường Caacutec cocircng ty xuất sắc luocircn biết caacutech tiacutech cực tiếp cận khaacutech hagraveng động viecircn đầu tư
17Quyền lực vagrave chiacutenh trịQuyền lực vagrave chiacutenh trị luocircn đi liền với nhau
aQuyền lựclagrave khả năng ảnh hưởng đến việc phacircn phối caacutec nguồn lực trong tổ chứcGồm 5 yếu tố cơ bản
Phacircn quyền Uy quyền Quyền lực caacute nhacircn Sức ảnh hưởng Chiacutenh trị
Một vagravei thagravenh phần của quyền lực ra quyết định Quyết định việc nagraveo coacute sẵn
Quyết định sản phẩm nagraveo được sản xuất Quyết định đầu tư vagraveo đacircu Quyền đặt vagrave quản lyacute quản lyacute giaacute Thanh toaacuten vagrave khấu trừ tiền latildei
bChiacutenh trị Yếu tố cốt lotildei trong quaacute trigravenh higravenh thagravenh chiến lược ra quyết định Chiacutenh trị liecircn quan tới việc ra quyết định thocircng qua đagravem phaacutenảnh hưởngvagrave higravenh
thagravenh sự nhất triacute Trong nhiều trường hợp noacute coacute thể cho ta sự linh hoạt hơn
18Hệ trợ giuacutep quyết định trong tổ chức DSS của 1 tổ chức hỗ trợ cocircng nghệ tập trung vagraveo caacutec quyết định ảnh hưởng tới
rất nhiều người 1 hệ thống DSS hiện đại coacute thể chấp nhận nhiều quyết định vượt qua những giới
hạn phacircn cấp truyền thống aCaacutec hoạt động gần DSS
Giải quyết caacutec nhiệm vụ đặc biệt Thu thập thocircng tin Liecircn lạc qua caacutec chi nhaacutenh Động thaacutei chiacutenh trị
Phacircn loại tư duy chiến lược cho DSS Sắp xếp quyết địnhXếp hạng quyết định sao cho thứ tự đứng trước thigrave được
ưu tiecircn trước Chia sẻ thocircng tinCaacutec quyecirct định coacute thể độc lập nhưng người ra quyết định
phải chia sẻ caacutec thocircng tin liecircn quan Lựa chọn đagravem phaacutenVagravei quyết định coacute thể xaacutec lập thocircng qua đagravem phaacuten vagrave kết
quả được lagravem đồng thờiKhocircng phải cocircng nghệ tự noacute coacute thể đưa ra quyết định magrave noacute nằm ở trigravenh độ cocircng nghệ hỗ trợ caacutec chiến lược quyết định quyền lực vagrave chiacutenh trị cugraveng phối hợp với nhau
Chương 4Mocirc higravenh hoacutea quaacute trigravenh ra quyết định
(Cấu truacutec của hệ HTQD)19Vấn đề Mocirc higravenh
bull Lagrave phần tử chủ chốt trong hầu hết hệ hỗ trợ quyết định vagrave lagrave điều kiện cần trong hệ hỗ trợ quyết định dựa vagraveo mocirc higravenh (model-based DSS)
bull Coacute nhiều lớp mocirc higravenh kegravem theo lagrave caacutec kỹ thuật xử lyacute thao taacutec mocirc higravenh đặc thugrave tương ứng
bull Caacutec vấn đề chiacutenh nhận diện bagravei toaacuten vagrave phacircn tiacutech mocirci trường nhận diện biến số dự baacuteo đa mocirc higravenh caacutec phạm trugrave mocirc higravenh quản lyacute mocirc higravenh vagrave mocirc higravenh hoacutea dựa vagraveo kiến thức
bull Mocirc higravenh hoacutea lagrave taacutec vụ khocircng đơn giản Người xacircy dựng mocirc higravenh phải cacircn bằng giữa tiacutenh đơn giản của mocirc higravenh với caacutec yecircu cầu biểu diễn để mocirc higravenh coacute thể nắm bắt đủ thực tại cần thiết cho người ra quyết định
bull Mocirc phỏng lagrave kỹ thuật mocirc higravenh hoacutea thocircng dụng dugraveng để tigravem hiểu vấn đề tuy khocircng nhất thiết phải tigravem ra được caacutec giải phaacutep biến thể mở rộng quaacute trigravenh ra quyết định của tổ chức vagrave cho pheacutep tổ chức xem xeacutet taacutec độngảnh hưởng của caacutec chọn lựa tương lai
bull Mocirc phỏng tiết kiệm rất nhiều chi phiacute vagrave thời gian ndash rất dễ thay đổi mocirc higravenh hoạt động của một hệ thống vật lyacute bằng mocirc higravenh hoacutea maacutey tiacutenh
bull Mocirc higravenh coacute thể được phaacutet triển vagrave cagravei đặt bằng một số caacutec ngocircn ngữ lập trinh (thế hệ 3 4 ) vagrave hệ thống phần mềm khaacutec nhau
Mocirc higravenh tĩnh vagrave động
bull Mocirc higravenh tĩnh thể hiện bức tranh tại thời điểm của tigravenh huống Caacutec khiacutea cạnh của bagravei toaacuten được xeacutet một thời kỳ nhất định trong một khung thời gian nhất định (coacute thể ldquocuốnrdquo về tương lai) Caacutec tigravenh huống được giả sử lagrave sẽ lập lại với tập caacutec điều kiện đồng nhất
1048713 Giả định coacute được tiacutenh ổn định của dữ liệu 1048713 Mocirc phỏng quaacute trigravenh dạng tĩnh - lagravem việc trecircn caacutec trạng thaacutei ổn định để tigravem ra caacutec
thocircng số tối ưu ndash thường được dugraveng như cocircng cụ chủ yếu để thiết kế quaacute trigravenh 1048713 vd quyết định sản xuấtmua 1 sản phẩm baacuteo caacuteo thu nhập hagraveng quyacutenăm bull Mocirc higravenh động biểu diễn caacutec kịch bản thay đổi theo thời gian 1048713 Phụ thuộc thời gian caacutec trạng thaacutei thay đổi theo thời gian 1048713 Thường dugraveng để tạo sinh vagrave biểu diễn caacutec xu hướng vagrave khuocircn mẫu theo thời gian 1048713 Mocirc phỏng động thể hiện caacutec diễn tiến khi caacutec điều kiện theo thời gian khaacutec với caacutec
trạng thaacutei ổn định ndash thường được dugraveng để thiết kế việc kiểm soaacutet caacutec hệ thống 1048713 VD dự baacuteo lời-lỗ trong 5 năm với caacutec nhập lượng như giaacute phiacute số lượng thay đổi
theo từng năm
Mocirc higravenh chắc chắn tương đối dễ phaacutet triển giải quyết vagrave coacute thể sinh ra caacutec giải phaacutep tối ưu 1048713 Caacutec bagravei toaacuten coacute một số lớnvocirc hạn caacutec giải phaacutep khả thi đặc biệt quan trọng 1048713 Caacutec mocirc higravenh tagravei chaacutenh được xacircy dựng trong điều kiện chắc chắn
Mocirc higravenh bất địnhbằng caacutech thu thập thecircm thocircng tin cố gắng đưa bagravei toaacuten trở về dạng chắc chắn hay dạng
rủi ro Mocirc higravenh rủi ro caacutec quyết định kinh doanh được đưa ra dưới caacutec rủi ro giả định
1048713 Đocirci khi biết được xaacutec suất của caacutec sự kiện xảy ra trong tương lai 1048713 Caacutec trường hợp khaacutec (bất định) ước lượng caacutec rủi ro vagrave giả sử caacutec tigravenh huống rủi ro
xảy ra 20Mocirc higravenh hoacutea
MOcirc HIgraveNH HOacuteA BẰNG BẢNG TIacuteNH bull Bảng tiacutenh phần mềm mạnh linh hoạt vagrave dễ dugraveng cho pheacutep tạo sinh caacutec ứng dụng trong kinh doanh kỹ thuật toaacuten vagrave khoa học với tập caacutec hagravem mạnh về tagravei chaacutenh thống kecirc toaacuten bull Kegravem theo lagrave caacutec thagravenh phần cộng thecircm (add-ins) giuacutep xacircy dựng vagrave giải caacutec lớp mocirc higravenh đặc thugrave bull Lagrave cocircng cụ mocirc higravenh hoacutea thocircng dụng nhất của người dugraveng cuối cugraveng bull Coacute caacutec chức năng về phacircn tiacutech ldquowhat-ifrdquo dograve tigravem mục tiecircu quản lyacute dữ liệu vagrave lập trigravenh (dạng macro) bull Coacute khả năng đọc ghi caacutec cấu truacutec tập tin thocircng dụng để giao tiếp được với caacutec CSDL vagrave cocircng cụ khaacutec bull Coacute thể xacircy dựng mocirc higravenh tĩnh vagrave động bull Dugraveng trecircn maacutey tiacutenh caacute nhacircn vagrave maacutey tiacutenh lớn
bull Cơ sở để xacircy dựng caacutec bảng tiacutenh đa chiều vagrave caacutec cocircng cụ xử lyacute phacircn tiacutech trực tuyến (OLAP) MOcirc HIgraveNH HOacuteA BẰNG PHAcircN TIacuteCH QUYẾT ĐỊNH bull Tiếp cận mocirc higravenh hoacutea caacutec tigravenh huống quyết định coacute một số hữu hạnkhocircng quaacute nhiều caacutec phương aacuten ndash mỗi phương aacuten được trigravenh ra dưới dạng bảng hay đồ thị - caacutec kết quả tương ứng (dự baacuteo được kegravem xaacutec suất) theo mục tiecircu bagravei toaacuten ndash từ đoacute chọn phương aacuten tốt nhất bull Đơn mục tiecircu bảng quyết định hay cacircy quyết định bull Đa mục tiecircu AHP (analytic hierarchy process) khaacutec
MOcirc HIgraveNH HOacuteA BẰNG QUY HOẠCH TOAacuteN
bull Quy hoạch toaacuten học (mathematical programming) lagrave họ caacutec cocircng cụ giải quyết caacutec bagravei toaacuten quản lyacute theo đoacute người ra quyết định phải cấp phaacutet caacutec tagravei nguyecircn khan hiếm cho caacutec hoạt động cạnh tranh nhau (caacutec phương aacuten) nhằm tối ưu hoacutea mục tiecircu coacute khả năng đo lường được bull Caacutec mocirc higravenh quy hoạch tuyến tiacutenh (linear programming) thocircng dụng nhất trong quy hoạch toaacuten coacute nhiều ứng dụng trong thực tế được dugraveng nhiều trong caacutec hệ hỗ trợ quyết định bull Bagravei toaacuten quy hoạch tuyến tiacutenh 1048713 Caacutec biến quyết định (cần tigravem giaacute trị) 1048713 Hagravem mục tiecircu (hagravem toaacuten học dạng tuyến tiacutenh xaacutec định quan hệ giữa biến quyết định vagrave mục tiecircu đo lường mức độ đạt đạt mục tiecircu vagrave cần được tối ưu hoacutea) 1048713 Caacutec hệ số của hagravem mục tiecircu (cho biết mức đoacuteng goacutep vagraveo mục tiecircu của 1 đơn vị biến quyết định) 1048713 Ragraveng buộc (biểu thức tuyến tiacutenh cho biết giới hạn tagravei nguyecircn vagravehay caacutec quan hệ giữa caacutec biến số) 1048713 Dung lượng (mocirc tả cận trecircn vagrave dưới của caacutec biến vagrave ragraveng buộc) 1048713 Hệ số (cocircng nghệ) vagraveo-ra (cho biết mức độ sử dụng tagravei nguyecircn của biến quyết định) bull Đặc điểm của bagravei toaacuten quy hoạch tuyến tiacutenh 1048713 Tagravei nguyecircn kinh tế của bagravei toaacuten lagrave coacute hạn vagrave sẵn sagraveng 1048713 Coacute nhiều caacutech (gt2 caacutech) sử dụng tagravei nguyecircn được gọi lagrave giải phaacutep hay chương trigravenh 1048713 Mỗi hoạt động dugraveng tagravei nguyecircn đều sinh ra kết quả dưới dạng mục tiecircu đatilde phaacutet biểu trước 1048713 Việc cấp phaacutet nằm trong caacutec ragraveng buộc cho trước bull Giả định của bagravei toaacuten quy hoạch tuyến tiacutenh 1048713 Caacutec kết quả của caacutec cấp phaacutet coacute thể đem so saacutenh với nhau coacute thể đo lường bằng một đơn vị chung
1048713 Caacutec cấp phaacutet độc lập với nhau về mặt kết quả 1048713 Kết quả cuối cugraveng lagrave tổng của caacutec kết quả từ caacutec hoạt động riecircng rẽ khaacutec nhau 1048713 Dữ liệu coacute tiacutenh chắc chắn 1048713 Tagravei nguyecircn được dugraveng một caacutech kinh tế nhất 1048713 Thường coacute một số lớn caacutec giải phaacutep với kết quả khaacutec nhau 1048713 Trong số caacutec giải phaacutep coacute thể coacute 1 giải phaacutep tốt nhất ndash mức độ đạt được mục tiecircu cao nhất ndash gọi lagrave giải phaacutep tối ưu được tigravem ra bằng một giải thuật đặc biệt MOcirc HIgraveNH HOacuteA BẰNG HEURISTIC bull Việc tigravem giải phaacutep tối ưu của một số bagravei toaacuten quyết định phức tạp coacute thể tốn nhiều thời gian chi phiacute hay khocircng thể tigravem ra được Cograven nếu dugraveng tiếp cận mocirc phỏng cũng coacute thể keacuteo dagravei phức tạp khocircng thiacutech hợp hay thậm chiacute khocircng chiacutenh xaacutec
bull Lagrave một tiếp cận giuacutep tigravem ra caacutec giải phaacutep khả thithỏa matildenđủ tốt cho caacutec bagravei toaacuten phức tạp Coacute thể coacute giải phaacutep đủ tốt (90-999 giaacute trị của lời giải tối ưu) nhanh choacuteng vagrave đỡ tốn keacutem hơn bằng caacutech dugraveng heuristics bull Quaacute trigravenh heuristic lagrave datildey caacutec bước xacircy dựng caacutec quy luật giải quyết vấn đề thocircng qua việc tigravem kiếm caacutec con đường hứa hẹn nhất dẫn đến lời giải tigravem kiếm caacutech thức thu thập vagrave phacircn giải thocircng tin theo quaacute trigravenh giải vagrave phaacutet triền caacutec phương phaacutep dẫn đến một giải thuật tiacutenh toaacuten hay một lời giải tổng quaacutet đatilde coacute bull Aacutep dụng chủ yếu cho bagravei toaacuten cấu truacutec yếu cũng dugraveng để tigravem ra giải phaacutep chấp nhận được cho bagravei toaacuten cấu truacutec chặt bull Khocircng đủ tổng quaacutet như caacutec giải thuật thường chỉ dugraveng cho tigravenh huống đặc thugrave đang xeacutet bull Coacute thể dẫn đến một giải phaacutep dở - caacutec thủ tục từng bước giải quyết vấn đề khocircng đảm bảo tigravem ra giải phaacutep tối ưu bull Heuristic coacute thể lagrave định lượng vigrave vậy coacute thể đoacuteng vai trograve quan trọng trong cơ sở mocirc higravenh của hệ hỗ trợ quyết định bull Heuristic coacute thể lagrave định tiacutenh vigrave vậy coacute thể đoacuteng vai trograve quan trọng trong cung ứng kiến thức cho hệ chuyecircn gia bull Quaacute trigravenh heuristic liecircn quan đến tigravem kiếm học tập ước lượng phacircn xử vagrave lặp lại caacutec hoạt động nagravey dọc theo tiến trigravenh bull Kiến thức thu được dugrave thagravenh cocircng hay thất bại trong quaacute trigravenh đều được phản hồi vagrave sửa đổi chiacutenh quaacute trigravenh nhờ đoacute coacute thể định nghĩa lại mục tiecircu hay bagravei toaacuten 1048713 Giải thuật di truyền bắt đầu bằng tập caacutec giải phaacutep được sinh ngẫu nhiecircn taacutei kết hợp caacutec cặp giải phaacutep một caacutech ngẫu nhiecircn bull Tigravenh huống necircn dugraveng heuristics 1048713 Dữ liệu đầu vagraveo khocircng chiacutenh xaacutec hay coacute giới hạn 1048713 Thực tế quaacute phức tạp đến nỗi khocircng dugraveng được caacutec mocirc higravenh tối ưu 1048713 Chưa coacute được giải thuật chiacutenh xaacutec vagrave đủ tin cậy 1048713 Bagravei toaacuten phức tạp necircn sẽ khocircng kinh tế nếu dugraveng tối ưu hay mocirc phỏng hoặc tốn quaacute nhiều thời gian tiacutenh toaacuten 1048713 Coacute thể cải thiện tiacutenh hiệu quả của quaacute trigravenh tối ưu (tức coacute thể sinh ra caacutec giải phaacutep ban đầu tương đối tốt) 1048713 Liecircn quan đến xử lyacute kyacute hiệu chứ khocircng phải xử lyacute kyacute số (như hệ chuyecircn gia) 1048713 Cần coacute quyết định nhanh vagrave caacutec xử lyacute dựa vagraveo maacutey tiacutenh đều khocircng khả thi (một số heuristic khocircng cần đến maacutey tiacutenh) bull Thuận lợi 1048713 Dễ hiểu dễ giải thiacutech vagrave dễ cagravei đặt 1048713 Nacircng cao tiacutenh saacuteng tạo vagrave năng lực heuristic cho caacutec vấn đề khaacutec 1048713 Tiết kiệm thời gian xaacutec lập vấn đề 1048713 Tiết kiệm yecircu cầu về bộ chứa vagrave xử lyacute maacutey tiacutenh
1048713 Tiết kiệm thời gian tiacutenh toaacuten vagrave do vậy tiết kiệm thời gian thực trong ra quyết định Một số vấn đề phức tạp đến nỗi chỉ coacute thể giải được bằng heuristics 1048713 Thường sinh ra nhiều giải phaacutep chấp nhận được 1048713 Thường coacute thể phaacutet biểu lyacute thuyết hay đo lường thực nghiệm về chất lượng của giải phaacutep (tức giaacute trị mục tiecircu của giải phaacutep gần với giaacute trị tồi ưu đến mức nagraveo dugrave giaacute trị tối ưu chưa biết được) 1048713 Coacute thể kết hợp tiacutenh thocircng minh vagraveo để hướng dẫn pheacutep tigravem kiếm (tigravem kiếm tabu) Năng lực thocircng minh đoacute coacute thể lagrave đặc thugrave theo bagravei toaacuten hoặc dựa trecircn yacute kiến chuyecircn gia được cấy trong hệ chuyecircn gia hoặc cơ chế tigravem kiếm 1048713 Coacute thể dugraveng heuristic hiệu quả vagraveo caacutec mocirc higravenh coacute thể giải bằng quy hoạch toaacuten học Đocirci khi heuristic lagrave phương phaacutep được ưa thiacutech hơn khi khaacutec giải phaacutep heuristics được dugraveng như giải phaacutep ban đầu cho caacutec phương phaacutep quy hoạch toaacuten học bull Hạn chế 1048713 Khocircng đảm bảo coacute được giải phaacutep tối ưu 1048713 Caacutec quy luật coacute rất nhiều ngoại lệ 1048713 Caacutec lựa chọn quyết định tuần tự coacute thể khocircng tiecircn đoaacuten được caacutec kết cục tương lai của mỗi chọn lựa 1048713 Sự liecircn thuộc giữa caacutec phần trong hệ thống đocirci khi coacute thể gacircy ra caacutec ảnh hưởng lớn lao lecircn toagraven hệ thống bull Phacircn loại caacutec giải thuật heuristic 1048713 Heuristic xacircy dựng xacircy dựng giải phaacutep khả thi bằng caacutech cộng thecircm từng thagravenh phần một VD bagravei toaacuten người baacuten hagraveng ndash luocircn gheacute thagravenh phố chưa viếng thăm kế tiếp gần nhất
1048713 Heuristic cải tiến bắt đầu bằng một giải phaacutep khả thi vagrave cố gắng cải tiến liecircn tục trecircn đoacute VD trecircn thử hoaacuten đổi 2 thagravenh phố 1048713 Quy hoạch toaacuten aacutep dụng vagraveo caacutec mocirc higravenh chứa iacutet ragraveng buộc nhằm coacute được thocircng tin về thỏa hiệp tốt nhất với mocirc higravenh nguyecircn gốc Thường được dugraveng trong tối ưu hoacutea nguyecircn (integer optimization) 1048713 Chia giai đoạn giải quyết một vấn đề theo từng giai đoạn VD ở PampG trecircn đacircy bagravei toaacuten phacircn phối được giải quyết trước sau đoacute dugraveng giải quyết bagravei toaacuten chiến lược sản phẩm 1048713 Phacircn ratilde chia bagravei toaacuten thagravenh caacutec phần nhỏ hơn coacute thể giải quyết được sau đoacute kết hợp caacutec giải phaacutep đoacute lại VD chia latildenh thổ baacuten hagraveng thagravenh 4 vugraveng khaacutec nhau giải quyết cho từng vugraveng sau đoacute kết nối caacutec giải phaacutep
21Mocirc phỏngbull Giả định caacutec đặc điểm của thực tạibull Lagrave kỹ thuật tiến triển caacutec thực nghiệm (như phacircn tiacutech ldquowhat-ifrdquo) - bằng maacutey tiacutenh -trecircn một mocirc higravenh của hệ thocircng tin quản lyacute
bull Khocircng thực sự lagrave một mocirc higravenh vigrave khocircng biểu diễn thực tại magrave lagrave cố gắng bắtchước thực tạibull Một trong những phương phaacutep thocircng dụng nhất trong HHTQĐbull HHTQĐ lagravem việc với caacutec bagravei toaacuten phi cấu truacutec vagrave cấu truacutec yếu tigravenh huống thực tếphức tạp ndash khocircng dễ biểu diễn bằng mocirc higravenh tối ưu hay caacutec dạng mocirc higravenh khaacutecnhưng lại thường coacute thể xử lyacute được bằng mocirc phỏngbull Đặc điểm1048713 Iacutet đưa ra caacutec đơn giản hoacutea về thực tại hơn caacutec mocirc higravenh khaacutec1048713 Do triển khai caacutec thực nghiệm necircn noacute coacute thể kiểm thử caacutec giaacute trị cụ thể của caacutecbiến quyết địnhbiến khocircng kiểm soaacutet được của mocirc higravenh vagrave xem xeacutet ảnh hưởnglecircn caacutec biến kết quả1048713 Phương phaacutep coacute tiacutenh mocirc tả (như vậy khaacutec với phương phaacutep danh định)1048713 Khocircng tự động tigravem kiếm giải phaacutep tối ưu ndash noacute mocirc tảtiecircn đoaacuten caacutec đặc tiacutenh của hệthống đatilde cho dưới caacutec điều kiện khaacutec nhau từ đoacute coacute thể chọn ra phương aacuten tốtnhất1048713 Quaacute trigravenh mocirc phỏng thường lặp lại một thực nghiệm nhiều lần để coacute được ướclượng về hiệu ứng tổng quaacutet của một số hagravenh động nhất định1048713 Mocirc phỏng maacutey tiacutenh thiacutech hợp cho hầu hết caacutec tigravenh huống mặc dugrave cũng coacute một sốmocirc phỏng thủ cocircng thagravenh cocircng1048713 Thường chỉ được dugraveng khi bagravei toaacuten quaacute phức tạp khocircng thể xem xeacutet bằng caacutec kỹthuật tối ưu dạng số Tiacutenh phức tạp theo nghĩa bagravei toaacuten khocircng thể cocircng thức hoacuteacho tối ưu (do khocircng thotildea caacutec giả định) hoặc cocircng thức quaacute lớn quaacute nhiều tươngtaacutec giữa caacutec biến hoặc về bản chất bagravei toaacuten lagrave bất định hay rủi roPhương phaacutep mocirc phỏng thiết lập mocirc higravenh của hệ thống thực vagrave tiến hagravenh caacutec thựcnghiệm lặp lại trecircn mocirc higravenh
bull Thuận lợi1048713 Lyacute thuyết tương đối trực tiếp hiệu ứng dagravei hạn của nhiều chiacutenh saacutech -gt neacuten thờigian lớn1048713 Do tiacutenh chất mocirc tả (khaacutec với danh định)1048713 Coacute thể thấy được nhanh choacuteng coacute thể đặt ra caacutec cacircu hỏi ldquowhat-ifrdquo coacute thể dugravengtiếp cận thử-vagrave-sai vagraveo giải quyết vấn đề một caacutech nhanh choacuteng rẻ chiacutenh xaacutec iacutetrủi ro hơn1048713 Thử nghiệm được biến quyết định phần nagraveo của mocirci trường thực sự quan trọngvới caacutec phương aacuten khaacutec nhau1048713 Yecircu cầu kiến thức riecircng biệt về bagravei toaacuten vigrave thế buộc người xacircy dựng mocirc higravenh phảilagravem việc thường xuyecircn với nhagrave quản lyacute ndash đối tượng mong muốn của HHTQĐ để
từ đoacute bản chất bagravei toaacuten vagrave caacutec quyết định được hiểu tốt hơn1048713 Mocirc higravenh được xacircy dựng từ viễn cảnhcaacutech nhigraven của nhagrave quản lyacute1048713 Mocirc higravenh chỉ cho một bagravei toaacuten riecircng biệt thường khocircng thể dugraveng giải caacutec bagravei toaacutenkhaacutec Như vậy mỗi thagravenh phần của mocirc higravenh ứng với một phần của hệ thống thựcdo đoacute sẽ khocircng yecircu cầu nhagrave quản lyacute phải tổng quaacutet hoacutea caacutec hiểu biết của migravenh1048713 Phổ bagravei toaacuten giải được rất rộng tồn kho nhacircn sự hoạch định chiến lược 1048713 Coacute thể chứa caacutec phức tạp thực sự của bagravei toaacuten khocircng cần caacutec đơn giản hoacutea (TDdugraveng caacutec phacircn phối xaacutec suất thực thay vigrave phacircn phối lyacute thuyết xấp xỉ)1048713 Coacute thể tự động sinh ra nhiều đo lường hiệu năng quan trọng1048713 Thường lagrave phương phaacutep duy nhất của HHTQĐ coacute thể xử lyacute caacutec bagravei toaacuten tương đốiphi cấu truacutec1048713 Coacute một số caacutec goacutei phần mềm mocirc phỏng (Monte Carlo) tương đối dễ dugravengbull Điểm yếu1048713 Tuy thường tigravem được caacutec phương aacuten đủ tốt nhưng khocircng đảm bảo lời giải tối ưu1048713 Quaacute trigravenh xacircy dựng mocirc higravenh thường dagravei vagrave tốn keacutem1048713 Giải phaacutep vagrave suy diễn từ nghiecircn cứu mocirc phỏng thường khocircng thể chuyển sang bagraveitoaacuten khaacutec vigrave mocirc higravenh kết hợp caacutec yếu tố đặc thugrave1048713 Đocirci khi do mocirc higravenh quaacute dễ giải thiacutech cho nhagrave quản lyacute necircn caacutec phương phaacutep phacircntiacutech thường xem nhẹ1048713 Phần mềm mocirc phỏng đocirci khi yecircu cầu caacutec kỹ năng đặc biệt do độ phức tạp củaphương phaacutep giải higravenh thứcbull Caacutec loại mocirc phỏng1048713 Mocirc phỏng xaacutec suất một hay nhiều biến độc lập mang tiacutenh xaacutec suất với 2 loạiphacircn phối ndash thường dugraveng kỹ thuật Monte Carlo1048713 Phacircn phối rời rạc tigravenh huống coacute một số giới hạn caacutec biến cố (biến) với hữu hạncaacutec giaacute trị cho mỗi biến cố (biến)1048713 Phacircn phối liecircn tục tigravenh huống coacute số lượng khocircng giới hạn caacutec biến cố tuacircn theocaacutec hagravem mật độ xaacutec suất như phacircn phối chuẩn1048713 Mocirc phỏng độc lậpphụ thuộc theo thời gian1048713 Độc lập khocircng cần thiết phải biết chiacutenh xaacutec thời điểm xảy ra biến cố (nhu cầutiecircu thụ lượng sản phẩm trong ngagravey khocircng biết chiacutenh xaacutec thời điểm tiecircu thụ)1048713 Phụ thuộc cần biết chiacutenh xaacutec thời điểm xảy ra sự kiện (bagravei toaacuten hagraveng đợi)1048713 Mocirc phỏng tương taacutec trực quan1048713 Mocirc phỏng hướng đối tượng dugraveng tiếp cận hướng đối tượng để xacircy dựng mocirc higravenhmocirc phỏng Chuacute yacute ngocircn ngữ mocirc higravenh hoacutea nhất thể UML (unified modelinglanguage) kể cả khi mocirc phỏng caacutec hệ thời gian thựcMOcirc HIgraveNH HOacuteA ĐA CHIỀU ndash XỬ LYacute PHAcircN TIacuteCH TRỰC TUYẾNbull Người ra quyết định thường phải xem xeacutet nhiều chiều của dữ liệu (TD caacutec chiềucủa dữ liệu baacuten hagraveng lagrave sản phẩm vugraveng thời gian người baacuten ) dữ liệu cần đượcphacircn tiacutech trực tiếp bằng caacutec cocircng cụ chuẩn hay phacircn tiacutech tự động bằng caacutec
phương phaacutep khai mỏ dữ liệu (data mining)bull Hầu hết caacutec hệ thống phacircn tiacutech đa chiều được nhuacuteng trong caacutec hệ xử lyacute phacircn tiacutechtrực tuyến (HXLPTTT ndash online analytic processing - OLAP)bull Mục tiecircu của XLPTTT nắm bắt cấu truacutec của dữ liệu thực để hỗ trợ ra quyết địnhbull Trong HHTQĐ coacute sự gắn nối tự nhiecircn giữa mocirc higravenh hoacutea dữ liệu mocirc higravenh hoacutea kyacutehiệu vagrave caacutec khiacutea cạnh của phacircn tiacutech ldquowhat-ifrdquobull Caacutec baacuteo caacuteo của HXLPTTT đều coacute tiacutenh tương taacutec dễ khai thaacutec sử dụng đặc biệtphugrave hợp cho caacutec baacuteo caacuteo về chỉ số hiệu năng chủ yếu (key performance indicators- KPI) baacuteo caacuteo về đo lường hiệu năng kinh doanh bull Thế hệ hiện tại của HXLPTTT vagrave hệ khai mỏ dữ liệu (data mining) tiacutech hợp caacutecđặc tiacutenh của hệ thocircng tin latildenh đạo (executive information system ndashEIS- nhiềucaacutech nhigraven dữ liệu chi tiết hoacutea theo nhu cầu) vagrave caacutec hệ đồ họa khaacutec ndash thường coacutegiao diện người dugraveng dạng kiểu WEBbull Caacutec hệ thống như trecircn cograven được gọi lagrave caacutec cocircng cụ triacute tuệ kinh doanh (businessintelligence - BI) vigrave coacute caacutec đặc trưng về mocirc higravenh hoacutea vagrave tối ưu hoacutea nhưng lạitrong suốt đối với ngươigrave dugravengbull Hiện caacutec cocircng cụ được đưa ra bởi caacutec nhagrave cung cấp về CSDL về hoạch định tagraveinguyecircn tổ chức (ERP) về nhagrave kho dữ liệu (data warehouse) về HXLPTTT MOcirc HIgraveNH HOacuteA VAgrave MOcirc PHỎNG TƯƠNG TAacuteC TRỰC QUANbull Iacutech lợi Người ra quyết định tham gia vagraveo quaacute trigravenh phaacutet triển mocirc higravenh vagrave thựcnghiệm mocirc phỏng vigrave vậy sẽ tin tưởng khi sử dụng mocirc higravenhbull Mocirc higravenh hoacutea tương taacutec trực quan (visual interactive modeling - VIM) dugraveng caacutecbiểu diễn đồ họa maacutey tiacutenh để trigravenh bagravey caacutec ảnh hưởng của caacutec quyết định quản lyacutekhaacutec nhau ở một thời điểm (tĩnh) hay tiến triển theo thời gian (động với kỹ thuậthoạt higravenh)bull Mocirc phỏng tương taacutec trực quan (visual interactive simulation - VIS) cho pheacutepngười dugraveng theo dotildei tiến trigravenh xacircy dựng vagrave sử dụng khai thaacutec mocirc higravenh mocirc phỏngdưới dạng hoạt higravenhbull Mocirc higravenh hoacutea tương taacutec trực quan coacute thể kết hợp với tiếp cận triacute tuệ nhacircn tạo đểđưa ra caacutec khả năng mới thay đổi từ xacircy dựng hệ thống dạng đồ họa đến tigravem hiểuvề động học của hệ thốngbull Cần đến caacutec hệ thống maacutey tiacutenh xử lyacute song song tốc độ cao để xacircy dựng caacutec mocircphỏng - phức tạp quy mocirc lớn dạng hoạt higravenh - mang tiacutenh khả thi ở thời gian thực
22Caacutec dạng hệ thống hỗ trợ ra quyết địnhHệ hỗ trợ quyết định nhoacutemRa quyết định nhoacutem giao tiếp vagrave cộng taacutec- Caacutec đặc điểm của cocircng việc nhoacutem+ Một nhoacutem thực hiện một nhiệm vụ thỉnh thoảng ra quyết định thỉnh thoảngkhocircng ra quyết định+ Caacutec thagravenh viecircn trong nhoacutem coacute thể ở những nơi khaacutec nhau
+ Caacutec thagravenh viecircn trong nhoacutem coacute thể lagravem việc ở những thời gian khaacutec nhau+ Caacutec thagravenh viecircn trong nhoacutem coacute thể lagravem việc cugraveng nhau hoặc ở caacutec tổ chức khaacutecnhau+ Nhoacutem coacute thể vĩnh viễn hoặc tạm thời+ Nhoacutem coacute thể ở bất kỳ mức quản lyacute nagraveo hoặc mức thời gian nagraveo+ Coacute sự điều phối (quaacute trigravenh vagrave nhiệm vụ đạt được) hoặc macircu thuẩn trongnhoacutem+ Coacute sự đạt được hoặcvagrave mất maacutet năng suất trong tổ chức+ Nhiệm vụ phải hoagraven thagravenh rất nhanh+ Khocircng thể hoặc quaacute đắt cho tất cả caacutec thagravenh viecircn trong nhoacutem cugraveng hợp ở mộtnơi+ Một số dữ liệu thocircng tin hoặc kiến thức cần thiết nằm ở nhiều nơi một sốkhaacutec ở ngoagravei tổ chức+ Chuyecircn mocircn của caacutec thagravenh viecircn khocircng coacute trong nhoacutem lagrave cần thiết- Caacutec hoạt động vagrave caacutec quaacute trigravenh miecircu tả caacutec cuộc họp+ Cuộc họp lagrave hoạt động chung liecircn quan bởi một nhoacutem người coacute địa vị bằngnhau hoặc gần bằng nhau+ Kết quả của cuộc họp phụ thuộc một phần vagraveo kiến thức yacute kiến caacutec đaacutenh giaacutecủa caacutec thagravenh viecircn+ Kết quả của cuộc họp cũng phụ thuộc vagraveo sự kết hợp của nhoacutem vagrave phụ thuộcvagraveo quaacute trigravenh ra quyết định được sử dụng bởi nhoacutem đoacute+ Giải quyết caacutec yacute kiến khaacutec nhau bởi người coacute quyền hạn hoặc thương lượnghoặc phacircn xửHỗ trợ giao tiếp- Giao tiếp lagrave thagravenh phần quan trọng cho hỗ trợ quyết định Khocircng coacute giao tiếp thigravekhocircng coacute cộng taacutec Những người ra quyết định caacute nhacircn phải giao tiếp với caacutecđồng nghiệp chuyecircn gia cơ quan chiacutenh phủ khaacutech hagraveng đối taacutec kinh doanh hellipHọ cũng cần dữ liệu vagrave thocircng tin (vagrave kiến thức) từ nhiều nơi trecircn thế giới Caacutecnhoacutem ra quyết định phải giao tiếp cộng taacutec vagrave thương lượng trong cocircng việcHầu hết caacutec tổ chức sẽ nhanh trở thagravenh khocircng coacute chức năng nếu khocircng coacute caacutec hệthống giao tiếp Thương mại điện tử coacute thể hiệu quả chỉ qua caacutec kỹ thuật giao tiếphiện đại- Caacutec kỹ thuật thocircng tin hiện đại cung cấp caacutec phương tiện hỗ trợ giao tiếp rẻnhanh coacute khả năng coacute thể tin cậy Nền tảng hỗ trợ giao tiếp lagrave caacutec hệ thống maacuteytiacutenh mạng+ Bắt đầu bằng điện baacuteo điện thoại radio vagrave ti vi+ Trong 100 năm chuacuteng ta phaacutet triển maacutey fax thư điện tử chương trigravenh chatnhoacutem tin tức hệ thống hội nghị truyền higravenh Hầu hết caacutec kỹ thuật nagravey đềuhoạt động trecircn internet+ Sự phaacutet triển giao tiếp sau cugraveng lagrave hệ thống họp điện tử caacutec dịch vụ vagrave hệ
thống hội nghị điện tử thường sử dụng internet để kết nối caacutec người ra quyếtđịnh- Caacutec thuận lợi aacutep dụng caacutec phương phaacutep giao tiếp cải tiến trong caacutec tổ chức+ Cải tiến năng suất của nhacircn viecircn+ Liecircn quan đến nhiều người ra quyết định chiacutenh+ Khocircng quan tacircm nhiều đến đường biecircn giới địa lyacute+ Tạo nền văn hoacutea hợp taacutec nhất quaacuten+ Cải tiến chất lượng cuộc sống của nhacircn viecircnHỗ trợ cộng taacutec Maacutey tiacutenh hỗ trợ cộng taacutec- Khung thời giannơi chốn+ Sự hiệu quả của kỹ thuật tiacutenh toaacuten cộng taacutec phụ thuộc vagraveo vị triacute của caacutec thagravenhviecircn trong nhoacutem vagrave phụ thuộc vagraveo thời gian chia sẽ thocircng tin gởi vagrave nhận+ Chia sự giao tiếp thagravenh bốn ocirc vagrave tổ chức bốn ocirc dọc theo 2 chiều thời gian vagravenơi chốn1048713 Thời gian Khi gởi vagrave nhận thocircng tin hầu như đồng thời giao tiếp lagrave đồngthời Viacute dụ Điện thoại ti vi vagrave caacutec cuộc họp gặp mặt nhau Giao tiếp bấtđồng bộ xảy ra khi người nhận nhận thocircng tin ở thời điểm khaacutec thời điểmgởi thocircng tin đoacute1048713 Nơi chốn Người gởi vagrave người nhận coacute thể ở cugraveng phograveng hoặc khocircng+ Bốn ocirc lagrave1048713 Cugraveng thời giancugraveng nơi chốn Caacutec thagravenh viecircn gặp mặt nhau cugraveng một luacutecgiống như phograveng quyết định hoặc gặp mặt truyền thống1048713 Cugraveng thời giankhaacutec nơi chốn Caacutec thagravenh viecircn ở caacutec nơi khaacutec nhau nhưnggiao tiếp cugraveng nhau Viacute dụ hội nghị truyền higravenh (videoconferencing)1048713 Khaacutec thời giancugraveng nơi chốn Nhiều người lagravem việc theo ca Ca nagravey để lạithocircng tin cho ca khaacutec1048713 Khaacutec thời giankhaacutec nơi chốn Caacutec thagravenh viecircn ở caacutec nơi khaacutec nhau Caacutecthagravenh viecircn nagravey gởi vagrave nhận thocircng tin ở những lần khaacutec nhau
23Thực thi hệ DSSHệ thống hỗ trợ quản lyacute (MSS) khocircng phải luacutec nagraveo cũng luocircn thagravenh cocircng Nhiều trường hợpthất bại của ES khocircng hoagraven toagraven lagrave lyacute do kỹ thuật Thực thi hệ thống lagrave một quaacute trigravenh liecircn tụcnhằm đảm bảo cho tổ chức chuẩn bị tiếp nhận một hệ thống mới vagrave đưa hệ thống vagraveo sử dụngthagravenh cocircngThực hiện cocircng nghệ hệ thống hỗ trợ quản lyacute lagrave việc phức tạp vigrave caacutec hệ thống nagravey khocircng đơnthuần lagrave hệ thống thocircng tin chỉ thu thập thao taacutec vagrave phacircn phối thocircng tin Magrave xa hơn chuacuteng
liecircn quan tới caacutec cocircng việc coacute thể lagravem thay đổi đaacuteng kể caacutech thức hoạt động của tổ chức Tuyvậy đa số caacutec yếu tố thực thi đều liecircn quan tới hệ thống thocircng tinThực thi MSS lagrave quaacute trigravenh liecircn tục diễn ra trong suốt thời gian phaacutet triển hệ thống từ đề xuấtban đầu đến nghiecircn cứu khả thi thiết kế vagrave phacircn tiacutech hệ thống lập trigravenh huấn luyện chuyểnđổi vagrave lắp đặt Caacutec chuyecircn gia hệ thống thocircng tin thường gọi thực thi lagrave giai đoạn cuối trongvograveng đời hệ thống Định nghĩa thực thi MSS phức tạp hơn vigrave bản chất lặp của sự phaacutet triểncaacutec hệ thống
THỰC THI KHOcircNG HOAgraveN CHỈNHCaacutec quyết định về tiacutenh khả thi thường coacute giả định về lợi iacutech đạt được khi kế hoạch thực thiđược thực hiện hoagraven toagraven Trong thực tế thường chỉ thực hiện 90 thậm chiacute 70 phần trăm sovới phacircn tiacutech khả thi Lyacute do lagrave sự thay đổi tại một nơi trong hệ thống coacute thể ảnh hưởng vagrave coacutethể taacutec động tiecircu cực đến chỗ khaacutec Do vậy cấp quản lyacute coacute thể bỏ những phần trong dự aacuten coacutethể gacircy ra taacutec động xấu Do đoacute dự aacuten sẽ thực hiện iacutet hơn 100 so với dự aacuten kế hoạch Caacutec lyacutedo khaacutec coacute thể lagrave do khấu trừ ngacircn saacutech hoặc vượt chi phiacuteĐAacuteNH GIAacute SỰ THAgraveNH COcircNG CỦA THỰC THI HỆ THỐNGPhải coacute caacutec chỉ số đo lường thigrave mới coacute thể đaacutenh giaacute sự thagravenh cocircng khi thực thi một hệ thốngDickson va Powers (1973) đề ra 5 tiecircu chuẩn độc lậpbull Tỷ lệ thời gian thực hiện dự aacuten với thời gian ước lượngbull Tỷ lệ chi phiacute thực tế vagrave ngacircn saacutech thực hiệnbull Thaacutei độ của cấp quản lyacute đối với hệ thốngbull Nhu cầu thocircng tin của caacutec nhagrave quản lyacute được đaacutep ứng như thế nagraveo qua hệ thốngbull Taacutec động của dự aacuten đối với những hoạt động maacutey tiacutenh trong cocircng tyCaacutec đo lường khaacutec để đaacutenh giaacute thagravenh cocircng của hệ hỗ trợ quản lyacute (MSS)bull Sự sử dụng hệ thống (dự định dugraveng hoặc thực sự dugraveng)bull Thỏa matilden của người dugravengbull Thaacutei độ taacuten thagravenhbull Mức độ hệ thống hoagraven thagravenh caacutec mục tiecircu ban đầubull Phần thưởng đối với tổ chức (giảm chi phiacute tăng doanh thuhellip)bull Tỷ số lợi iacutech chi phiacute
bull Mức độ thể chế hoacutea của MSS trong tổ chứcDo bởi tiacutenh đa dạng của DSS necircn việc đaacutenh giaacute sự thagravenh cocircng của hệ nagravey cũng khoacute khăn tuynhiecircn cũng coacute thể coacute một số yếu tố giuacutep cho DSS thagravenh cocircng như sự tham gia người dugravenghuấn luyện người dugraveng hỗ trợ quản lyacute cấp cao nguồn thocircng tin đặc điểm của những nhiệmvụ coacute liecircn quan (cấu truacutec bất định độ khoacute phụ thuộc)
Chương5Nhoacutem hỗ trợ quyết định vagrave nhoacutemcocircng nghệ phần mềm
51Nhoacutem tạo quyết định
MDM-Holsapple đatilde gợi yacute chuacuteng ta sử dụng giới hạn người tạo quyết định
Một nhoacutem lagrave kết cấu MDM nơi magrave nhiều người ra quyết định hoagraven toagraven tương taacutec
Một đội lagrave kết cấu MDM nơi caacutec thagravenh viecircn tư vấn cho người đưa ra quyết định nhưng khocircng tương taacutec
Một Ủy ban lagrave kết cấu MDM với một người tạo quyết định duy nhất vagrave sự tương taacutec giữa caacutec thagravenh viecircn
Mạng thocircng tin
Mạng lưới baacutenh xe mỗi người tham gia coacute thể giao tiếp với người đưa ra quyết định ở trung tacircm nhưng khocircng phải với người tham gia khaacutecCấu truacutec nagravey lagrave khocircng thỏa matilden tất cả những người tham gia ngoại trừ người ra quyết định
Mạng dacircy chuyền Tham gia chuyển tiếp thocircng tin chỉ để noacute luocircn liền kề nhau trong chuỗi
Thagravenh viecircn cuối cugraveng ko được đaacutep ứng
Mạng vograveng trograven Tương tự như chuỗi nhưng kết thuacutec được kết nối
Mạng kết nối hoagraven toagraven khocircng coacute hạn chế về giao tiếp vagrave tương taacutec giữa caacutec thagravenh viecircnNoacutei chungnoacute đaacutep ứng hầu hết caacutec kết nối của người tham gia nhưng truyền đạt thocircng tin mất nhiều thời gian vagrave coacute nhiều cơ hội xảy ra lỗi
Nhoacutem hagravenh vi vagrave chuẩn mực
MDMs thiết lập caacutec chỉ tiecircu hướng dẫn quaacute trigravenh ra quyết định
Một chuẩn mực quy định cụ thể những gigrave thagravenh viecircn trong nhoacutem dự kiến sẽ lagravem trong những hoagraven cảnh nhất định
Quy tắc gửi coacute thể được thocircng qua viacute dụ đaacutenh giaacute ngang hagraveng hoặc xử phạt
Lagravem thế nagraveo để đưa ra quyết định
Việc chọn lựa magrave trong đoacute việc sử dụng cấu truacutec MDM phải được dựa trecircn một số yếu tố liecircn quan với bối cảnh quyết định
Viacute dụmột cấu truacutec riecircng lẻ sẽ lagravem việc nơi magrave quyết định được cấu truacutec cao vagrave thocircng tin lagrave coacute sẵn
Một ủy ban cơ cấu sẽ lagrave sự lựa chọn khi người ra quyết định khocircng thể đưa ra quyết định một migravenh
52Caacutec vấn đề thường gặp trong nhoacutem
Kiacutech thước Noacutei chung sự nhất triacute vagrave gắn kết giữa caacutec thagravenh viecircn tỉ lệ nghịch với phạm vi nhoacutem Trong nhoacutem lớn rất dễ higravenh thagravenh caacutec nhoacutem nhỏ vagrave hoạt động rời rạc
Tư duy tập thể Trong nhoacutem lớn mọi người coacute xu hướng suy nghĩ đểđạtđược sự nhất triacute necircn khocircng phaacutet huy được sự saacuteng tạo
Caacutec vấn đề về xatilde hội
Xung đột Trong 1 nhoacutem ai cũng muốn migravenh lagrave giỏi nhất necircn dễ dẫn đến xung đột
Ẩn danh(Giấu tecircn) Đacircy lagrave phương phaacutep được sử dụng để kiểm soaacutet xung đột Cho caacutec thagravenh viecircn tham gia ẩn danh
Vấn đề giới tiacutenh Nam vagrave nữ thường coacute những thế mạnh khaacutec nhau điều nagravey coacute thể lagrave sức mạnh trong 1 thiết lập MDM
Đagravem phaacuten vagrave quyết định
Một quyết định coacute thể liecircn quan đến nhiều quan điểm khaacutec nhau vigrave thế cần phải coacute sự đagravem phaacuten
Caacutec thiết kế của cơ chế hỗ trợ cho MDM phải phugrave hợp với caacutec hoạt độngđagravemphaacuten
Những hoạt động nagravey bao gồm việc thu nhận yacute kiến của caacutec thagravenh viecircn 1 caacutech cocircng bằng
53Cocircng nghệ hỗ trợ MDM
Organizational DSSndash 1 hệ thống cung cấp caacutec quyết định hỗ trợ
Group Support Systemndash Cocircng nghệ sử dụng sự hỗ trợ của nhiều becircn tham gia
Group DSS ndash Lagrave 1 hệ thống được thiết kế đặc biệt để hỗ trợ cho MDM
DSS ndash Lagrave 1 hệ thống dưới sự kiểm soaacutet của 1 người quyết định hệ thống nagravey cung cấp 1 bộ cocircng cụ giuacutep phacircn tiacutech hoagraven cảnh đểđưa ra quyết định vagrave nacircng cao hiệu quả của quyết địnhđoacute
53Cocircng nghệ hỗ trợ MDM
Organizational DSSndash 1 hệ thống cung cấp caacutec quyết định hỗ trợ
Group Support Systemndash Cocircng nghệ sử dụng sự hỗ trợ của nhiều becircn tham gia
Group DSS ndash Lagrave 1 hệ thống được thiết kế đặc biệt để hỗ trợ cho MDM
DSS ndash Lagrave 1 hệ thống dưới sự kiểm soaacutet của 1 người quyết định hệ thống nagravey cung cấp 1 bộ cocircng cụ giuacutep phacircn tiacutech hoagraven cảnh đểđưa ra quyết định vagrave nacircng cao hiệu quả của quyết địnhđoacute
Mục tiecircu của cocircng nghệ hỗ trợ MDM
Quy trigravenh hỗ trợ tập trung vagraveo quaacute trigravenh tạo điều kiện thuận lợi cho sự tương taacutec
Cơ chế cấu truacutec quaacute trigravenh chi phối caacutec hoạt động truyền thocircng
Nhiệm vụ hỗ trợ cocircng việc coacute thể chọn lựa tổ chức hoặc lấy thocircng tin
Nhiệm vụ cấu truacutec cocircng việc cho pheacutep truy cập đến kỹ thuật lọc kết hợp phacircn tiacutech kiến thức liecircn quan đến cocircng việc
Caacutec lớp loại cocircng nghệ hỗ trợ MDM
Phacircn loại theo đặc điểm do DeSanctis vagrave Gallupe đưa ra đề xuất một chương trigravenh ba cấp dựa trecircn caacutec tiacutenh năng được cung cấp
Hệ thống cấp 1 Mục điacutech chiacutenh lagrave tạo điều kiện thocircng tin liecircn lạc giữa caacutec thagravenh viecircn
Hệ thống cấp 2 Thiết kế để giảm thiểu rủi ro
Hệ thống cấp 3 Giuacutep điều chỉnh xử lyacute quyết định
Phacircn loại theo cocircng nghệ -Kraemer vagrave King tập trung vagraveo cocircng nghệ aacutep dụng
Cocircng nghệ bảng mạch điện tử
Hội nghị trực tuyến
Mạng lưới tập đoagraven
Trung tacircm thocircng tin
Mocirci trường cộng taacutec
Phograveng quyết định
Nhoacutem phần mềm
Phần mềm được thiết kế để hỗ trợ sự hợp taacutec bao gồm việc thu huacutet vagrave lưu trữ thocircng tin
Caacutec tổ chức dẫn đầu thị trường hiện tại lagrave Lotus Notes and Domino Microsoft Exchange Novell GroupWise and Oracle Office
Caacutec cocircng cụ trong một bộ phần mềm bao gồm người quản lyacute hội nghị (Lotus Sametime) vagrave trao đổi thocircng điệp (Lotus Notes Mail)
Xếp hạng phần mềm cho nhoacutem
Ellis vv đề xuất một hệ thống xếp hạng dựa vagraveo kiểu sự hỗ trợ noacute Cung cấp
Hệ thocircng điệp
Hệ thống hội thảo truyền higravenh
Hệ thống cộng taacutec soạn thảo
Nhoacutem phacircn phối giải phaacutep phần mền
Hệ thống phối hợp
Hệ thống thocircng minh đại diện
Lực lượng điều khiển phaacutet triển phần mềm cho nhoacutem
Một số nhacircn tố chiacutenh bao gồm
Tăng năng suất
Giảm số lượng caacutec cuộc họp
Tăng cường tự động hoacutea caacutec quy trigravenh lagravem việc thường xuyecircn
Cần phối hợp toagraven cầu tốt hơn
Tiacutenh sẵn sagraveng của những mạng lan rộng
Coleman vagrave Khanna liệt kecirc 10 nhacircn tố khaacutec
54Quản lyacute hoạt động MDM (Mobile Device Management - Quản lyacute thiết bị di động)
Một số phương phaacutep phối hợp phổ biến hơnMDM lagrave
Kỹ thuật nhoacutem định danh
Kỹ thuật Delphi
Sự phacircn xử
Hệ thocircng tin dựa trecircn vấn đề
Nemawashi
Kỹ thuật nhoacutem định danh
1-Mỗi người tham gia viết ra những yacute tưởng về những gigrave necircn quyết định
2-Lần lượt mỗi người tham gia trigravenh bagravey yacute tưởng của migravenh được ghi lại trecircn bảng Khocircng thảo luận ở đacircy
3-Sau khi tất cả caacutec yacute tưởng được trigravenh bagravey caacutec đại biểu coacute thể chất vấn những người khaacutec
4-Mỗi người tham gia bỏ phiếu cho mỗi yacute tưởng
Kỹ thuật Delphi
Về cơ bản tương tự như kỹ thuật nhoacutem định danh ngoại trừ những người khocircng bao giờ tham gia cuộc họp
Một cocircng cụ khảo saacutet được sử dụng để thu thập đầu vagraveo ban đầu từ caacutec thagravenh viecircn
Một cuộc khảo saacutet thứ hai được gửi đi với một bản toacutem tắt caacutec kết quả chung
Những bước lặp lại cho đến khi đạt được một sự đồng thuận hoặc nhigraven nhận của đa số
Sự phacircn xử(Arbitration )
Thiacutech hợp nhất khi caacutec thagravenh viecircn của MDM đại diện cho caacutec yếu tố đối lập
Những người tham gia đồng yacute rằng nếu lựa chọn thay thế hai becircn thỏa thuận khocircng được tigravem thấy thigrave một trọng tagravei viecircn becircn ngoagravei sẽ tham gia
Trọng tagravei sau đoacute lựa chọn thay thế ocircng hoặc xeacutet thấy thiacutech hợp nhất
Hệ thống thocircng tin dựa trecircn vấn đề (IBIS)
Lagrave một phương phaacutep lập luận cấu truacutec
Một đại diện cho IBIS lagrave một đồ thị với caacutec nuacutet vagrave caacutec liecircn kết
IBIS bắt đầu với lựa chọn của một nuacutet vấn đề gốc sau đoacute caacutec nuacutet vị triacute khaacutec nhau được liecircn kết với nuacutet gốc
Caacutec nuacutet vị triacute nagravey sau đoacute được đaacutenh giaacute dựa trecircn những lập luận gắn liền với chuacuteng
Nemawashi (được sử dụng rộng ratildei tại Nhật Bản)
1-Một hoặc nhiều thagravenh viecircn của MDM được chỉ định lagrave điều phối viecircnCaacutec điều phối viecircn sau đoacute chọn người tham gia cograven lại
2-Điều phối viecircn xacircy dựng một tổng hợp caacutec sự lựa chọn vagrave sau đoacute caacutec chuyecircn gia đaacutenh giaacute caacutec lựa chọn
3-Điều phối viecircn lựa chọn một sự lựa chọn dựa trecircn kết quả ở trecircn(ở 2)
4-Sự thay thế được luacircn chuyển điều phối viecircn tigravem kiếm sự đồng thuận thocircng qua sự thuyết phục vagrave đagravem phaacuten
5-Nếu đạt được sự đồng thuận điều phối viecircn cho lưu thocircng một tagravei liệu magrave mỗi thagravenh viecircn MDM để lại dấu hiệu trecircn đoacute
55Nơi lagravem việc ảo
Nhiều tổ chức trecircn toagraven thế giới kinh doanh bất động sản cho cocircng nghệ hợp taacutec
Cocircng việc được trở thagravenh một điều bạn lagravem hơn lagrave một nơi bạn đi
Những thay đổi lớn nhất mang lại bởi nơi lagravem việc ảo coacute thể lagrave về văn hoaacute hay xatilde hội hơn lagrave về cocircng nghệ
Chương 6 Hệ thống thocircng tin điều hagravenh
61 Yacute nghĩa của EIS- Hệ thống thocircng tin điều hagravenh
- EIS lagrave một dạng đặc biệt của DSS được thiết kế để hỗ trợ ra quyết định ở cấp cao nhất của một tổ chức
- Lagrave một hệ thống thocircng tin hỗ trợ nhu cầu lập kế hoạch vagrave đaacutenh giaacute của caacutec nhagrave quản lyacute điều hagravenh
- EIS coacute thể giuacutep một CEO coacute được bức tranh tổng thể chiacutenh xaacutec nhất về caacutec hoạt động vagrave một bản toacutem tắt những gigrave magrave đối thủ cạnh tranh đang lagravem
- Caacutec hệ thống nagravey noacutei chung hoạt động dễ dagraveng vagrave trigravenh bagravey thocircng tin theo những caacutech dễ hiểu để việc tiếp thu được nhanh choacuteng (biểu đồ đồ thịhellip)
(Tagravei liệu thecircm EIS lagrave những loại hệ thống lagrave rất phức tạp trong tự nhiecircn Coacute thể noacutei hệ thống nagravey cũng cung cấp cho caacutec nhagrave quản lyacute với caacutec thiết bị coacute khả năng ra quyết định bằng caacutech sử dụng của noacute Hệ thống nagravey hoạt động trong điều kiện như vậy quan trọng như trong caacutec hệ thống khaacutec khocircng hỗ trợ Khả năng lưu trữ dữ liệu nặng lagravem cho noacute lyacute tưởng để được thocircng qua khocircng chỉ bởi caacutec doanh nghiệp lớn magrave cograven bởi caacutec doanh nghiệp nhỏ hơn Nhigraven chung hệ thống nagravey lagrave dagravenh cho caacutec nhacircn viecircn cấp cao hỗ trợ thagravenh thạo trong việc đưa ra caacutec quyết định quan trọng)
Caacutec phiecircn EIS tiecircu biểu- Phiecircn lagravem việc coacute thể bắt đầu với một baacuteo caacuteo về tigravenh higravenh tagravei chiacutenh vagrave kinh
doanh của một cocircng ty caacutec chỉ số hoạt động quan trọng được hiển thị rotilde ragraveng- EIS sẽ cho pheacutep caacutec giaacutem đốc điều hagravenh coacute thể đi sacircu vagraveo dữ liệu từ những con
số bất kỳ magrave noacute hỗ trợ- Việc điều hagravenh coacute thể lựa chọn một mức độ chi tiết ( VD danh số baacuten hagraveng) nếu
như cần điều tra thecircm- Lagrave một phương phaacutep tiếp cận coacute thể giuacutep việc ra quyết định tốt hơn
Những điều magrave EIS ko coacute- EIS khocircng phải lagrave sự thay thế cho caacutec hệ thống dựa trecircn caacutec maacutey tiacutenh khaacutec EIS
thực sự chỉ cung cấp dữ liệu cho caacutec hệ thống nagravey- Noacute khocircng thể biến caacutec bộ hệ điều hagravenh của maacutey tiacutenh thagravenh những ldquochuyecircn viecircn
giỏirdquo- Coacute thể được viacute một caacutech cao hơn như lagrave một trợ lyacute đaacuteng tin cậy coacute thể được gọi
đến bất khi nagraveo vagrave mỗi khi cần thiết
Tagravei liệu thecircm Sự khaacutec nhau giữa EIS vagrave DSS+ EIS thiết kế để hỗ trợ những người điều hagravenh cấp cao giuacutep họ khaacutem phaacute caacutec vấn đề vagrave caacutec cơ hội DSS hỗ trợ những nười phacircn tiacutech cố gắng trả lời cacircu hỏi caacutei gigrave coacute thể lagravem cugraveng với một cơ hội hoặc một vấn đề
Chiều EIS DSSNhững người sử dụng thocircng thường
Duyệt dữ liệu đi xuống truy xuất trạng thaacutei
Hỗ trợ phacircn tiacutech vagrave quyết định
Sự thuacutec đẩy Tiacutenh thiacutech hợp Tiacutenh hiệu quảỨng dụng Queacutet mocirci trường đaacutenh giaacute
hiệu suất nhận dạng caacutec vấn đề vagrave caacutec cơ hội
Caacutec quyết định quản lyacute trecircn caacutec lĩnh vực đa dạng
Hỗ trợ quyết định Caacutec chiacutenh saacutech caacutec quyết định khocircng coacute cấu truacutec ở mức cao vagrave hỗ trợ giaacuten tiếp
Hỗ trợ caacutec quyết định lặp lại caacutec quyết định khocircng thể đoaacuten trước ra quyết định khocircng coacute cấu truacutec vagrave baacuten cấu truacutec
Loại thocircng tin Caacutec thocircng tin tin tức thocircng tin becircn ngoagravei về khaacutech hagraveng đối thủ cạnh tranh mocirci trường caacutec baacuteo caacuteo theo yecircu cầu vagrave định thời về caacutec hoạt động becircn trong
Caacutec thocircng tin hỗ trợ caacutec tigravenh huống đặc biệt
Sử dụng coacute nguyecircn tắc
Dograve theo vết vagrave điều khiển nhận dạng cơ hội
Hoạch định tổ chức phacircn nhoacutem vagrave điều khiển
Khả năng phugrave hợp với những người sử dụng caacute nhacircn
Thiết kế loại ra quyết định cho mỗi người điều hagravenh caacute nhacircn bằng nhiều lựa chọn đầu ra
Cho pheacutep caacutec đaacutenh giaacute caacute nhacircn caacutec khả năng what-if lựa chọn loại hộp hội thoại
Đồ họa Phải coacute Lagrave một phần quan trọng của nhiều DSS
Thacircn thiện người sử dụng
Phải coacute Phải coacute nếu khocircng coacute người sử dụng trung gian
Xử lyacute thocircng tin Lọc neacuten thocircng tin dograve theo vết dữ liệu vagrave thocircng tin quan trọng
EIS kiacutech thiacutech caacutec cacircu hỏi caacutec cacircu trả lời bằng caacutech sử dụng DSS vagrave phản hồi lại EIS
Hỗ trợ caacutec thocircng tin chi tiết
Truy xuất thường xuyecircn caacutec mức chi tiết của bất kỳ thocircng tin tổng hợp nagraveo (duyệt dữ
Coacute thể coacute trong DSS nhưng khocircng thường
liệu chi tiết)Cơ sở mocirc higravenh Caacutec chức năng coacute sẵn bị hạn
chếLagrave điểm cốt lotildei của DSS
Cấu truacutec Theo người baacuten sản phẩm hoặc theo caacutec chuyecircn gia hệ thống thocircng tin
Theo người sử dụng hoặc caacute nhacircn hoặc caacutec chuyecircn gia từ caacutec trung tacircm thocircng tin hoặc phograveng ban hệ thống thocircng tin
Phần cứng Mainframe caacutec trạm RISC mạng LANs hoặc caacutec hệ thống phacircn bố
Mainframe caacutec trạm RISC caacutec maacutey PC hoặc caacutec hệ thống phacircn bố
Bản chất caacutec goacutei phần mềm
Truy xuất tương taacutec dễ dagraveng đến nhiều cơ sở dữ liệu truy xuất trực tuyến caacutec khả năng DBMS phức tạp caacutec liecircn kết phức tạp
Caacutec khả năng tiacutenh toaacuten lớn caacutec ngocircn ngữ mocirc higravenh mocirc phỏng ứng dụng vagrave caacutec bộ tạo DSS
Bản chất caacutec thocircng tin
Trigravenh bagravey thocircng tin được phaacutet sinh trước về quaacute khứ vagrave hiện tại tạo caacutec thocircng tin mới về quaacute khứ hiện tại tương lai
Tạo thocircng tin mới về quaacute khứ hiện tại tương lai
62 Lịch sử EIS- EIS xuất hiện lần đầu tiecircn tại MIT vagraveo những năm 1970
- Những EIS đầu tiecircn được phaacutet triển bởi caacutec doanh ngiệp lớn sẵn sagraveng chấp nhận rủi ro để đạt được lợi thế cạnh tranh
- Vagraveo những năm 1980 caacutec nhagrave cung cấp đatilde phaacutet triển một số cơ sở khaacutech hagraveng rộng vagrave cocircng nghệ EIS được tiếp tục phaacutet triển cho đến ngagravey nay
(Tagravei liệu thecircm Sử dụng DSSEIS cho phaacutet triển bền vững + Một số nghiecircn cứu đatilde được tiến hagravenh để kiểm tra việc thực hiện của EIS trong khu vực cocircng cộng vagrave chiacutenh phủ caacutec nước tổ chức kể từ khi chuacuteng được phaacutet triển theo định hướng lợi nhuận cho caacutec cocircng ty tư nhacircn (Hasan vagrave Hasan năm 1997) Theo một nghiecircn cứu tiến hagravenh tại Mỹ ở hơn 300 cocircng ty kết quả cho thấy sự khaacutec biệt của EIS giữa tư nhacircn vagrave chiacutenh phủ một số kết quả thuacute vị được phaacutet hiệnViacute dụ khoacute khăn hơn để chuyển tiền từ một tagravei khoản khaacutec trong một EIS của chiacutenh phủ cũng lagrave khoacute khăn hơn để biện giải thiacutech cho những chi phiacute phaacutet triển EIS của chiacutenh phủ Một nghiecircn cứu khaacutec được tiến hagravenh ở Australia
cho thấy rằng EIS cung cấp cho quản lyacute một higravenh ảnh chiacutenh xaacutec hơn về tổ chức thực hiện vagrave cung cấp hỗ trợ cho caacutec lợi iacutech chiến lược cải thiện khocircng chỉ cho caacutec nhagrave quản lyacute nhưng cograven cho phần cograven lại của tổ chức Dựa trecircn caacutec hệ thống được thiết kế cho caacutec cocircng ty tư nhacircn với một caacutech rotilde ragravengxaacutec định mục tiecircu EIS lagrave thiacutech hợp cho caacutec tổ chức cocircng cộng hiện đại nhưng cần phải được linh hoạt hơn vagrave kết thagravenh chugravem một phạm vi rộng hơn khả năng vagrave phương tiện hơn so với khu vực tư nhacircn ban đầu theo định hướng sản phẩm (Hasan vagrave Hasan năm 1997) Điều nagravey coacute thể lagrave do thực tế rằng caacutec hoạt động khu vực cocircng lagrave bắt buộc coacute taacutec động rộng phải đaacutep ứng sự mong đợi duy nhất cocircng cộng thường coacute mục tiecircu mơ hồ vagrave macircu thuẫn iacutet quyền tự chủ vagrave kiểm soaacutet việc ra quyết định vagrave nhacircn viecircn lagrave khoacute khăn hơn (Watson vagrave Carte2000) + Toacutem lại EIS lagrave một khaacutei niệm thagravenh cocircng noacute phaacutet triển qua nhiều năm tuy nhiecircn EIS khắc phục khiếm khuyết của migravenh bằng caacutech tiến hagravenh nghiecircn cứu liecircn tục)
63 Tại sao những người điều hagravenh hagraveng đầu lại khaacutec nhau- Họ lagrave những doanh nghiệp theo định hướng coacute suy nghĩ
- Coacute một khoảng khocircng gian rộng để kiểm soaacutet
- Họ chịu traacutech nhiệm cho việc thiết lập chiacutenh saacutech
- Họ đại diện cho tổ chức mocirci trường becircn ngoagravei
- Hagravenh động của họ tạo ra những kết quả đaacuteng kể về tagravei chiacutenh vagrave con người
Tần số caacutec hoạt động điều hagravenh- Xử lyacute xaacuteo trộn 42
- Hoạt động kinh doanh 32
- Phacircn bổ nguồn lực 17
- Đagravem phaacuten 3
- Những điều khaacutec 6
Handling Disturbances 42
Entrepreneurial Activites 32
Resource Allocation 17
Negotiation 3
Other 6
Những thocircng tin điều hagravenh cần thiết- Quản lyacute xaacuteo trộn coacute thể yecircu cầu sự chuacute yacute xung quanh đồng hồ
- Hoạt động kinh doanh yecircu cầu điều hagravenh để dự đoaacuten những thay đổi trong mocirci trường
- Nhiệm vụ phacircn bổ tagravei nguyecircn yecircu cầu lựa chọn người quản lyacute vagrave caacutec nguồn lực hạn chế được triển khai
- Đagravem phaacuten yecircu cầu cập nhật thocircng tin từng phuacutet để coacute thể xacircy dựng được sự đồng thuận
Caacutec loại thocircng tin điều hagravenh- Hệ thống kế toaacuten coacute liecircn quan đến việc tiacutenh toaacuten thu nhập hoạt động cho caacutec lĩnh
vực cụ thể lagrave quan trọng hơn so với caacutec hệ thống kế toaacuten truyền thocircng- Thocircng tin về thị trường khaacutech hagraveng cung cấp giaacute trị trong việc quyết định chiến
lược- Caacutec thocircng tin cần thiết thường được truyền đi trecircn một số hệ thống maacutey tiacutenh vagrave
nằm trong toagraven tổ chức- Caacutec thocircng tin được sử dụng thường lagrave ngắn hạn vagrave dễ thay đổi
Phương thức để xaacutec định thocircng tin cần thiết
Rockart xaacutec định được năm phương thức cơ bản để xaacutec định thocircng tin cần thiết
- Phương thức dựa trecircn kết quả- Phương thức rỗng- Phương thức chỉ số khoacutea- Phương thức tổng hợp nghiecircn cứu- Phương thức dựa vagraveo nhacircn tố then chốt dẫn đến thagravenh cocircng
64 Thagravenh phần EIS
- Sản phẩm EIS đầu tiecircn được phaacutet triển để sử dụng trecircn maacutey tiacutenh cấu higravenh cao nhưng caacutec sản phẩm hiện nay nhằm mục tiecircu lagrave nền tảng ClientServer
- Những nền tảng linh hoạt hơn coacute thể thiacutech ứng với thay đổi trong tổ chức vagrave cocircng nghệ
- Sử dụng dữ liệu thời gian thực dẫn đến quyết định nhanh hơn nhiều thocircng tin hơn
Thagravenh phần phần cứng- Một EIS khocircng đogravei hỏi coacute phần cứng cụ thể hoặc duy nhất nagraveo- Chigravea khoacutea của vấn đề lagrave để đảm bảo rằng caacutec thagravenh phần của EIS tối ưu hoacutea vagrave
phugrave hợp với tagravei nguyecircn maacutey tiacutenh của tổ chức- Hệ thống nagravey phải được cấu higravenh để caacutec nguồn tagravei nguyecircn phugrave hợp với những
người điều hagravenh chuacuteng
Thagravenh phần phần mềm- Traacutei ngược với phần cứng phần mềm thường được chuyecircn mocircn hoacutea cao cho caacutec
bagravei toaacuten về miền- Sự chuyecircn mocircn hoacutea nagravey thường đạt được bằng caacutech sử dụng thagravenh phần off-the-
shelf cho toagraven bộ EIS vagrave caacutec mocirc-đun tugravey chỉnh để đaacutep ứng nhu cầu cụ thể- Lotus Notes lagrave một viacute dụ điển higravenh Noacute coacute thể được sử dụng một migravenh hoặc coacute
thể phục vụ becircn thứ ba mocirc-đun plug-in
Cocircng nghệ EIS hiện nay
Dobrzeniecki đề xuấtphacircn loạitừng cấptheo bachức năng- Loại 1 sản phẩm bao gồmmột bộ đầy đủcaacutec ứng dụngtừ mộtnhagrave cung cấp- Loại 2 sản phẩm đượcthựchiệnở phần đầu củacaacutecsản phẩmDSS đượcphaacutet triển
bởicugravengmộtnhagrave cung cấp- Loại 3 sản phẩmkết hợp với nhautheo bất kỳ số lượngthuộc sở hữu củacocircng ty
65 Xacircy dựng EIS
- Xacircy dựngmộtEISgiống nhưxacircydựngmột số hệ thống khaacutec củamocirc higravenh hệ thống thocircng tin
- Việcphaacutet triểncấu truacutecnecircn được theo dotildeitừ quaacute trigravenh thiết kế đến quaacute trigravenhthực hiện
- Tuy nhiecircn một dự aacuten phaacutet triển EIScoacute xu hướnglagrave thống nhấtvagraveyecircu cầu hỗ trợ caacutec nhagrave quản lyacute latildenh đạo
- Xacircy dựng một EIScoacute thểphaacutet hiện ra đượccaacutectigravenh huống khoacute khănmagravemột nhagrave phaacutet triển chưabao giờ gặp phải
Mocirc higravenh EIS
Khung phaacutet triển một EIS
- Watson et al đề nghị xacircy dựngkhung với ba thagravenh phần+ Caacutech tiếp cận tập trung vagraveo yếu tốcon người vagrave dữ liệu coacute liecircn quan đến EIS+ Quaacute trigravenh phaacutet triển cần sự linh hoạt vagrave tương taacutec+ Người sử dụng - hệ thống hộp thoại bao gồm một ngocircn ngữ hagravenh động để xử lyacute caacutec lệnh
Lợi iacutech của EIS- Dễ duy trigrave caacutec mục tiecircu coacute tổ chức- Dễ truy xuất thocircng tin- Cho pheacutep người sử dụng nacircng cao hiệu suất hơn
- Tăng chất lượng ra quyết định- Cung cấp sự cải tiến cạnh tranh- Tiết kiệm thời gian của người sử dụng- Tăng khả năng vagrave chất lượng giao tiếp- Cung cấp khả năng điều khiển tốt hơn trong tổ chức- Cho pheacutep tham gia caacutec vấn đề vagrave caacutec cơ hội- Cho pheacutep hoạch định- Cho pheacutep tigravem kiếm nguyecircn nhacircn của một vấn đề- Thảo matilden caacutec yecircu cầu của người điều hagravenh
Hạn chế của EIS vagrave 1 số sai lầm cần traacutenh
- Chi phiacute một cuộc khảo saacutetnăm1991 chothấychi phiacute phaacutet triểntrungbigravenh365000USDvớichi phiacute vận hagravenhhagraveng năm lagrave$200000 (EIS)
- Cocircng nghệ hạn chếEIScần phảiđượctiacutech hợp hoagraven toagravenvagraveokiếntruacuteccủadoanh nghiệphiện tại do đoacute noacutelagrave một thaacutech thứclớn đối vớithiết kế
- Hạn chế tổ chức cơ cấu tổ chứccoacute thể khocircng phugrave hợp
Sự hạn chế về tổ chức- Chương trigravenh nghị sự vagrave thời gian chệch EIS mocirc tả một phần việc thực hiện một
chương trigravenh nghị sự vagrave coacute thể dễ dagraveng đạt được sự tin cậy một caacutech chắc chắn- Đồng bộ hoacutea việc quản lyacute sự tin cậy đuacuteng luacutec đặc biệt baacuteo caacuteo EIS coacute thể phaacute
vỡ sự ổn định thiết lập caacutec chu trigravenh baacuteo caacuteo một caacutech tốt nhất- Sự bất ổn EIS phản ứng nhanh coacute thể gacircy ra việc taacutec động trở lại một caacutech
nhanh choacuteng dẫn đến sự thiếu ổn định trong tổ chức
Sự thất bại lagrave thay thế khocircng thể chấp nhận được- Một số yếu tố lagravem EIS thất bại
+ Thiếu sự hỗ trợ về mặt quản lyacute+ Vấn đề chiacutenh trị+ Thất bại của nhagrave phaacutet triển+ Lỗi về cocircng nghệ+ Giaacute cả+ Thời gian
66 Ra quyết định điều hagravenh trong tương lai vagrave EIS
- Coacute một vagravei điều kiện sẽ được hợp nhất cho việc chuyển đổi cocircng nghệ Trong đoacute một vagravei điều kiện coacute thể dễ dự đoaacuten Hai điều kiện magrave ta coacute thể thấy lagrave+ Phaacutet triển cocircng nghệ maacutey tiacutenh trong việc điều hagravenh sẽ tạo ra sự chuyển đổi được chấp nhận một caacutech dễ dagraveng hơn+ Mở rộng traacutech nhiệm điều hagravenh sẽ mở rộng nhu cầu thocircng tin
Tương lai của EIS- EIS thocircng minh Những tiến bộ trong cocircng nghệ AI sẽ được triển khai trong caacutec
EIS- EIS đa phương tiện Cơ sở dữ liệu đa phương tiện sẽ cho pheacutep tiacutech hợp văn bản
giọng noacutei vagrave higravenh ảnh trong tương lai- EIS thocircng tin Tương lai EIS sẽ mở rộng hơn trong việc sử dụng dữ liệu becircn
ngoagravei doanh nghiệp- EIS kết nối Giao tiếp với băng thocircng rộng cho pheacutep kết nối liecircn thocircng lớn hơn
Chương 7 HỆ CHUYEcircN GIA VAgrave TRIacute TUỆ NHAcircN TẠO
71 Caacutec khaacutei niệm
72 Triacute thocircng minh của triacute tuệ nhacircn tạo
73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia
74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia
75 Lợi iacutech vagrave hạn chế của hệ chuyecircn gia
71 Caacutec khaacutei niệm
Chuyecircn mocircn (Expertise) sự hiểu biết rộng trong 1 lĩnh vực hẹp
Hệ chuyecircn gia (Expert Systems)1 chương trigravenh maacutey tiacutenh sử dụng 1 tập caacutec luật dựa trecircn tri thức của con người để giải quyết caacutec vấn đề đogravei hogravei phải coacute sự chuyecircn mocircn
Một số hệ chuyecircn gia nổi tiếng
DENDRAL (Standford 1960s Edward Feigenbaum)
MYCIN (Standford1970s Edward Shortliffe)
PROSPECTOR (MIT 1979)
Triacute tuệ nhacircn tạo (Artificial Intelligence ndash AI)
Triacute tuệ nhacircn tạo một bộ phacircn của ngagravenh khoa học maacutey tiacutenh quan tacircm đến việc thiết kế caacutec hệ thống maacutey tiacutenh thocircng minh đoacute lagrave caacutec hệ thống đưa ra caacutec đặc điểm magrave từ đoacute chuacuteng ta liecircn hệ với sự thocircng minh trong hagravenh động của con người (Barr vagrave Feigenbaum 1981)
Mục điacutech của AI
Mục điacutech khoa học xaacutec định caacutec gợi yacute để giải thiacutech caacutec loại khaacutec nhau của triacute tuệ thực
Mục điacutech kỹ thuật giải quyết caacutec vấn đề trong thế giới thực
Triacute tuệ nhacircn tạo kế thừa nhiều yacute tưởng quan điểm kỹ thuật từ caacutec ngagravenh khoa học khaacutec
- Triết học
- Logic Toaacuten học
- Tiacutenh toaacuten
- Khoa học tacircm lyacute Khoa học nhận thức
- Sinh học Thần kinh học
- Tiến hoacutea
Caacutec lĩnh vực ứng dụng trong Triacute tuệ nhacircn tạo
Mạng nơ ron thần kinh (Neural Networks)
Tiacutenh toaacuten sự tiến hoacutea
(Evolutionary Computation)
Hệ chuyecircn gia (Expert Systems)
Kỹ thuật xử lyacute tiếng noacutei (Speech Processing)
Kỹ thuật xử lyacute ngocircn ngữ tự nhiecircn
(Natural Language Processing)
Lập kế hoạch (Planning)
Robot (Robotics)
Khoa học higravenh ảnh (Vision)
Caacutec kỹ thuật thocircng dụng dugraveng trong AI
Biểu diễn(Representation)
Học (Learning)
Caacutec luật (Rules)
Tigravem kiếm (Search)
72 Triacute thocircng minh của triacute tuệ nhacircn tạo
Con người suy diễn như thế nagraveo
Phacircn loại (Categorization)
Caacutec quy tắc cụ thể
Heuristics
Kinh nghiệm trước đoacute
Dự tiacutenh trước
Maacutey tiacutenh suy diễn như thế nagraveo
Lập luận dựa trecircn luật IF-THEN mocirc tả tri thức được matilde hoacutea dưới dạng caacutec luật
Caacutec khung (Frames) lagrave caacutec đại diện mocirc tả caacutec tigravenh huống giống nhau lagrave điển higravenh của một vagravei phacircn loại
Lập luận dựa trecircn caacutec trường hợp mocirc phỏng giải phaacutep trước đoacute cho một vấn đề hiện tại
Nhận dạng mẫu phaacutet hiện acircm thanh higravenh dạng hoặc caacutec chuỗi dagravei
Caacutec dạng khaacutec của Triacute tuệ nhacircn tạo
Học maacutey- mạng nơron vagrave giải thuật di truyền
Lập trigravenh tự động ndash lagrave những kỹ thuật tạo ra caacutec chương trigravenh để lagravem 1 nhiệm vụ riecircng biệt (cho pheacutep những người khocircng phải lagrave người lập trigravenh coacute thể lập trigravenh được)
Cuộc sống nhacircn tạo ndash nỗ lực để taacutei tạo caacutec hiện tượng sinh học trong caacutec hệ thống dựa trecircn maacutey tiacutenh
73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia(Expert Systems- ES)
Theo Jackson (1999) Một hệ chuyecircn gia lagrave một chương trigravenh maacutey tiacutenh mocirc tả vagrave suy diễn với tri thức của một vagravei lĩnh vực để giải quyết vấn đề hay đưa ra caacutec lời khuyecircn
Cấu truacutec cơ bản của ES được dựa theo cấu truacutec chung của DSS Sự khaacutec biệt chiacutenh giữa ES vagraveDSS lagrave hệ ES thu thập caacutec kiến thức từ những
chuyecircn gia trong lĩnh vực quan tacircmĐặc trưng của hệ chuyecircn gia Hiệu quả cao Thời gian trả lời thỏa đaacuteng Độ tin cậy cao Dễ hiểu
Giao diện người dugraveng trong ES
Thiết kế giao diện người dugraveng tập trung vagraveo caacutec yếu tố như dễ dagraveng sử dụngcoacute độ tin cậy cao giảm tải những khoacute khăn khi sử dụng
Thiết kế necircn coacute một số tương taacutec (đầu vagraveo kiểm soaacutet vagrave truy vấn)
Cấu tạo giao diện người dugraveng gồm coacute magraven higravenh cảm ứng bagraven phiacutem buacutet saacuteng lệnh thoại caacutec phiacutem chuyecircn dụng
Cơ sở tri thức (Knowledge Base)
Chứa đựng caacutec tri thức cụ thể miền thu được từ caacutec chuyecircn gia miền
Coacute thể chứa caacutec mocirc tả caacutec hagravenh vi giải quyết vấn đề caacutec ragraveng buộc caacutec heuristics
Thagravenh cocircng của một ES dựa trecircn tiacutenh đầy đủ vagrave tiacutenh chiacutenh xaacutec của cơ sở tri thức
Mocirc tơ suy diễn (Inference Engine)
Ở đacircy tri thức được đặt để sử dụng tạo ra caacutec giải phaacutep để giải quyết vấn đề
Mocirc tơ nagravey coacute khả năng thực hiện diễn dịch hoặc suy diễn dựa trecircn caacutec luật hay caacutec caacutec sự kiện
Đồng thời cũng coacute khả năng sử dụng caacutec suy diễn mờ hay khocircng chiacutenh xaacutec dựa trecircn xaacutec suất hay aacutenh xạ mẫu
Vograveng điều khiển suy diễn
1 Aacutenh xạ caacutec luật với caacutec sự kiện đatilde được cho
2 Chọn luật để thực hiện
3 Thực hiện luật bằng caacutech thecircm caacutec sự kiện được suy diễn ra vagraveo bộ nhớ lagravem việc
Chuỗi suy diễn (Chaining)
Suy diễn tiến (forward chaining) maacutey suy diễn bắt đầu từ dữ liệu ban đầu vagrave thực hiện việc suy luận để đưa ra caacutec kết luận cuối cugraveng
Suy diễn lugravei (backward chaining) maacutey suy diễn bắt đầu từ dữ liệu điacutech vagrave tigravem ra tri thức hỗ trợ cho dữ liệu điacutech đoacute
Viacute dụ suy diễn lugravei
R1 Nếu coacute A vagrave B thigrave suy ra coacute D
R2 Nếu coacute B thigrave suy ra coacute C
R3 Nếu coacute C vagrave D thigrave suy ra coacute E
Ta coacute E ta xem trong 3 luật R1 R2 R3 luật nagraveo coacute E ta thấy R3 chứa E đồng thời chứa C vagrave D Xeacutet tiếp trong 2 luật R1 R2 luật nagraveo chứa C vagrave D R2 chứa C R3 chứa D Từ đoacute ta coacute được caacutec tri thức hỗ trợ suy diễn vagrave kết luận lagrave nếu coacute A vagrave B thigrave sẽ coacute E Hay nếu A vagrave B đuacuteng thigrave sẽ coacute E
Viacute dụ suy diễn tiến
Giả sử coacute tập chứa 3 luật sau
R1 Nếu coacute A vagrave B thigrave suy ra coacute D
R2 Nếu coacute B thigrave suy ra coacute C
R3 Nếu coacute C vagrave D thigrave suy ra coacute E
Nếu ta coacute A vagrave B thigrave chuacuteng ta suy ra được D từ R1 vagrave suy ra C từ R2 Với D vagrave C đatilde được suy ra ở trecircn giờ chuacuteng ta suy ra được E từ R3
Viacute dụ thực tế
Giả sử muốn biết magraveu của một con vật nuocirci tecircn lagrave Fred biết rằng noacute kecircu ộp ộp vagrave ăn ruồi
Coacute tập 4 luật ban đầu như sau
R1 Nếu X kecircu ộp ộp vagrave ăn ruồi thigrave X lagrave con ếch
R2 Nếu X kecircu chiecircm chiếp vagrave biết hoacutet thigrave X lagrave con chim
R3 Nếu X lagrave con ếch thigrave X coacute magraveu xanh
R4 Nếu X lagrave con chim thigrave X coacute magraveu vagraveng
74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia
Expert system shells lagrave một tập caacutec goacutei phần mềm vagrave caacutec cocircng cụ dugraveng để phaacutet triển caacutec hệ chuyecircn gia
Những Expert system shells đầu tiecircn thường rất rườm ragrave Mặc dugrave vậy noacute vẫn giuacutep cho người sử dụng sẽ khocircng phải bắt đầu lại từ đầu khi xacircy dựng một hệ chuyecircn gia mới
Những shell hiện đại bao gồm hai mocirc-đun chiacutenh lagrave cocircng cụ xacircy dựng một tập quy tắc vagrave mocirc tơ suy diễn
Xacircy dựng hệ chuyecircn gia
Bước 1 xacircy dựng mocirc higravenh bagravei toaacuten xaacutec định vấn đề nhiệm vụ magrave hệ thống sẽ thực hiện Caacutec dạng bagravei toaacuten cần hệ chuyecircn gia
Bagravei toaacuten diễn giải (InterPretation)
Bagravei toaacuten dự baacuteo (Prediction)
Bagravei toaacuten chuẩn đoaacuten (Diagnose)
Bagravei toaacuten gỡ rối (Debugging)
Bagravei toaacuten thiết kế
Tương tự như một dự aacuten phần mềm để xacircy dựng một hệ chuyecircn gia cần phải coacute caacutec yếu tố về nhacircn lực tagravei nguyecircn vagrave thời gian Những yếu tố nagravey ảnh hưởng đến giaacute thah của một hệ chuyecircn giaTrong phần nagravey cacircu hỏi thường được đặt ra lagrave tại sao cần phải xacircy dựng một hệ chuyecircn giaTrước khi bắt đầu phải xaacute định rotilde bagravei toaacuten đạt ra lagrave jiAi lagrave chuyecircn giaAi lagrave người sử dụng
1 Diễn giải (InterPretation) Nghiecircn cứu 1 vấn đề -gt Dựa trecircn những biểu hiện thuộc tiacutenh đặc trưng becircn ngoagravei -gt Tư vấn
(hoặc đưa ra kết luận hay mocirc tả dễ hiểu từ tập dữ liệu thocirc)
2 Bagravei toaacuten dự baacuteo (Prediction) Coacute thể dự đoaacuten được hagravenh vi kết quả dựa trecircn caacutec hiện tượng -gt dự baacuteo
VD Dự baacuteo thời tiết động đấthellip
3 Bagravei toaacuten chẩn đoaacuten (Diagnoss) Xaacutec định caacutec lỗi caacutec bộ phận hỏng hoacutec của hệ thống dựa trecircn caacutec dữ liệu quan saacutet được
4 Bagravei toaacuten gỡ rối (Debugging) Mocirc tả caacutec phương phaacutep khắc phục hệ thống khi gặp sự cố
5 Bagravei toaacuten thiết kế Lựa chọn cấu higravenh caacutec đối tượng nhằm thoả matilden một số ragraveng buộc nagraveo đoacute
6 Giảng dạy Phần mềm dạy học coacute thể chuẩn đoaacuten vagrave sủa lỗi của học sinh trong quaacute trigravenh học tập
Để xaacutec định đuacuteng bagravei toaacuten magrave chuacuteng ta cần giải quyết thigrave phải trả lời đc một số cacircu hỏi
- cần hệ chuyecircn gia
Bước 2 thu thập tri thức lựa chọn cocircng cụ vagrave aacutep dụng
Trong bước thu thập tri thức vấn đề quan trọng lagrave lựa chọn chuyecircn gia những người magrave sẽ đoacuteng goacutep tri thức cho hệ thống Thocircng thường trong suốt quaacute trigravenh phaacutet triển thigrave chuyecircn gia được xem như một thagravenh viecircn của đội phaacutet triển
Hiện nay coacute rất nhiều cocircng cụ để xacircy dựng một hệ chuyecircn gia Phổ biến nhất lagrave JESS CLIPS vagrave OPS5
Bước 3 Thiết kế cơ sở tri thức thiết kế hệ thốngTri thức được biểu diễn trường minh trong cơ sở tri thức
Caacutec chuyecircn gia vagrave kỹ sư tri thức sẽ đối thoại với nhau bằng caacutec kỹ thuật đối thoại Suy diễn (SD) bảng Mocirc higravenh hoacutea SD quy nạp phacircn loại
Vấn đề bagraveo trigrave vagrave phaacutet triển
Caacutec hệ chuyecircn gia đogravei hỏi phải bảo trigrave vagrave phaacutet triển nhiều hơn so với caacutec hệ thống khaacutec Phải thường xuyecircn bổ sung tri thức mới vagrave thay đổi caacutec tri thức cũ để đổi mới hệ chuyecircn gia
Thu thập vagrave khắc phục lỗi do người sử dụng phaacutet hiện để kịp thời khắc phục những sai soacutet của hệ chuyecircn gia
75 Lợi iacutech vagrave hạn chế của caacutec hệ chuyecircn gia
Một số lợi iacutech chiacutenh
Thời gian trả lời hợp lyacute bằng hoặc nhanh hơn so với chuyecircn gia (người) để đi đến cugraveng một quyết định Hệ chuyecircn gia lagrave một hệ thống thời gian thực (real time system)
Khả năng trả lời với mức độ tinh thocircng bằng hoặc cao hơn so với chuyecircn gia (người) trong cugraveng lĩnh vực
Hệ chuyecircn gia giuacutep cho hiệu quả lagravem việc tăng bằng việc sử dụng tập caacutec luật một caacutech nhanh choacuteng magrave ko bị nhầm lẫn chuyecircn gia lagrave người coacute thể quecircn đi một số tri thức cơ sở lyacute luậ nhưng HCG thigrave ko
Quyết định của một người chuyecircn gia coacute thể bị thay đổi vagrave ko coacute tiacutenh thống nhất như quyết định của một hệ chuyecircn gia tạo ra
Hệ chuyecircn gia giuacutep cho người sử dụng coacute thể trau dồi sự hiểu biết trecircn lĩnh vuej cụ thể magrave noacute giải quyết hỗ trợ người ra quyết định coacute trigravenh độ như 1 chuyecircn gia trong quaacute trigravenh gia quyết định
Kiến thức của rất nhiều chuyecircn gia về một lĩnh vực nagraveo đoacute được đưa vagraveo hệ chuyecircn gia lagravem cho CSTT cuat HCG phong phuacute vagrave rộng lớn hơn rất nhiều
HCG giải thiacutech caacutec bước suy luận một caacutech dễ hiểu nhất quaacuten luacutec nagraveo cũng coacute thể sử dụng ko như chuyecircn gia con người
Hạn chế của caacutec hệ chuyecircn gia
Nhược điểm lớn nhất của hệ chuyecircn gia lagrave những yacute kiến chuyecircn mocircn thường rất khoacute matilde hoacutea vagrave giải neacuten
Hệ chuyecircn gia khocircng coacute khả năng tự học tự cập nhật kiến thức mới như caacutec chuyecircn gia magrave cần phải được matilde hoacutea lại khi noacute được cập nhật
Hệ chuyecircn gia khocircng thể nhận ra được vấn đề khocircng nằm trong miền kiến thức của hệ thống
Chương 8 Tri thức vagrave tiếp nhận
1 Bao gồm caacutec vấn đề
Dữ liệu thực tế đo lường hoặc quan saacutet coacute hoặc khocircng coacute bối cảnh
Thocircng tin dữ liệu được tổng hợp một caacutech hữu iacutech để giải quyết những khoacute khăn trong việc đưa ra quyết định
Tri thức bao gồm caacutec ứng dụng quy tắc thocircng tin hướng dẫn của người ra quyết định
2 Những caacutei nhigraven về tri thức
Đại diện lagravem thế nagraveo để diễn tả tri thức viacute dụ như một quyển saacutech khocircng phải lagrave tri thức nhưng noacute lại lagrave một đại diện của tri thức
Sản xuất tri thức lagrave một tập hơp của hagraveng tồn kho coacute thể được sản xuất cũng như mua lại
Tri thức lagrave 1 trong 6 trạng thaacutei của hệ thống
1Dữ liệu 2Thocircng tin 3Cấu truacutec thocircng tin 4Sự thấu hiểu 5Yacute kiến 6 Quyết định
3 Caacutec loại tri thức Phổ biến mocirc tả dữ liệu thocircng tin thủ tục mọi thứ lagravem như thế nagraveo lập luận chiacutenh saacutech hoặc caacutec quy tắc
4 Thu thập Tri thức hệ chuyecircn gia Hầu hết caacutec phương phaacutep đều bắt đầu với mocirc higravenh của caacutec taacutec vụ trong đoacute
hệ chuyecircn gia được xacircy dựng Trong đoacute mocirc tả về caacutec lĩnh vực được tạo ra Caacutec kỹ sư sử dụng caacutec mocirc higravenh giả thuyết vagrave nhận thức về quaacute trigravenh phacircn
tiacutech để gợi ra caacutech giải quyết vấn đề về tri thức từ caacutec chuyecircn gia
5 Caacutec chiều của thu thập tri thức KE- driven caacutec kỹ sư trao đổi trực tiếp với caacutec chuyecircn gia Expert-driven Caacutec chuyecircn gia trực tiếp đưa chuyecircn mocircn của họ vagraveo hệ
thống maacutey tiacutenh Machine-driven Sử dụng caacutec cocircng cụ suy luận để triacutech xuất tri thức từ một
tập caacutec viacute dụ
6 Kỹ thuật thu thập tri thức Trao đổi gồm 2 loại cơ bản lagrave coacute cấu truacutec(coacute kịch bản) vagrave khocircng coacute cấu
truacutec( đối thoại trực tiếp) Giao thức phacircn tiacutech bằng lời Khi caacutec chuyecircn gia thực hiện một cocircng việc
của họ thigrave một bản ghi về cocircng việc đoacute được thực hiện Caacutec kỹ sư sẽ xacircy dựng mocirc higravenh cho những gigrave được ghi lại trong bản ghi
Phương phaacutep sagraveng lọc caacutec chuyecircn gia so saacutenh caacutec nhoacutem liecircn tiếp trong ba đối tượng vagrave cho biết tại sao nhoacutem thứ hai lại khaacutec nhoacutem thứ ba
7 Thu thập tri thức từ nhiều nguồn Thu thập tri thức từ nhiều nguồn lagrave cần thiết để coacute được đầy đủ caacutec tri thức
cho một vấn đề quan điểm yacute kiến traacutei ngược nhau thường phaacutet sinh Phương phaacutep đồng thuận sẽ giuacutep giải quyết được vấn đề macircu thuẫn Kỹ thuật phacircn tiacutech Meta lagrave kỹ thuật được aacutep dụng trong caacutec trường hợp
khaacutec Caacutech tiếp cận bằng định lượng đogravei hỏi caacutec kỹ sư cần cacircn nhắc yếu tố đầu vagraveo của caacutec chuyecircn gia khaacutec nhau
8 Xaacutec nhận hợp lệ vagrave kiểm tra tri thức Một khi thu thập tri thức noacute phải được đaacutenh giaacute về khả năng sử dụng vagrave độ
chiacutenh xaacutec Hai vấn đề cụ thể lagrave hiệu lực của những kiến thức vagrave kiểm tra việc xacircy dựng cơ sở của tri thức
Cần xaacutec nhận xem liệu hệ thống coacute thể hoạt động ở mức độ tối thiểu khocircng
Xaacutec minh liecircn quan đến việc so saacutenh từng chi tiết kỹ thuật của hệ thống những gigrave đatilde được thực hiện cuối cugraveng
9 Một số caacutec biện phaacutep xaacutec nhận Độ chiacutenh xaacutec Khả năng thiacutech nghi Mức độ đầy đủ Bề rộng Độ sacircu Hiệu lực Tổng quan Chiacutenh xaacutec Hiện thực Độ tin cậy Tiacutenh hữu dụng Mức độ
Chương 9 Học maacutey
1 Logic mờ vagrave ngocircn ngữ mờ(Fuzzy Logic and Linguistic Ambiguity)
Ngocircn ngữ tự nhiecircn gồm những khaacutei niệm mơ hồ vagrave khocircng chiacutenh xaacutectruyền tải ngữ nghĩa thocircng qua tiacutenh xấp xỉkhocircng rotilde ragraveng
Những xấp xỉ nagravey giuacutep con người coacute thể truyền tải hết được yacute nghĩa nhưng maacutey thigrave khocircng hiểu
Lagravem sao biểu diễn caacutec tri thức sử dụng caacutec khaacutei niệm khocircng rotilde ragraveng(mờ) hoặc khocircng chiacutenh xaacutec
2 Khaacutei niệm cơ bản của logic mờ tập mờ lagrave những tập hợp khocircng coacute một giới hạn rotilde Mỗi phần tử của noacute chỉ
chứa một mức độ hagravem liecircn thuộc của từng phần tử Vigrave vậy tập mờ khocircng giống như tập cổ điển Tập mờ coacute thể kết hợp với nhau qua những luật mờ magrave đặc trưng cho những hagravenh động trạng thaacutei vagrave thuộc tiacutenh của logic mờ được tận dụng khi thực hiện một bộ điều khiển mờ
Logic mờ dựa trecircn yacute tưởng mỗi phần tử thuộc vagraveo một tập hợp ở một mức độ nagraveo đấy
Locircgic mờ cho pheacutep độ liecircn thuộc (microA )coacute giaacute trị trong khoảng (01) Locircgic mờ coacute thể được coi lagrave mặt ứng dụng của lyacute thuyết tập mờ để xử lyacute caacutec
giaacute trị trong thế giới thực cho caacutec bagravei toaacuten phức tạp
3 So saacutenh tiacutenh đuacuteng đắn logic mờ vagrave xaacutec suất Xaacutec suất thigrave đề cập đến khả năng xảy ra một biến cố hay một điều gigrave đoacute Logic mờ đề cập đến cấp độ magrave đặc tiacutenh ở hiện tại
o viacute dụ1 người coacute chiều cao 6 feet thigrave coacute cấp độ lagrave 05 về chiều cao
4 Ưu điểm của logic mờ Caacutech tiếp cận rất tự nhiecircnkhocircng phức tạp Coacute thể mocirc higravenh hoacutea caacutec hagravem phi tuyến tugravey yacute phức tạp
Coacute thể tận dụng được kinh nghiệm từ những chuyecircn gia hagraveng đầu trong mọi lĩnh vực
Logic mờ được xacircy dựng dựa trecircn ngocircn ngữ tự nhiecircnNền tảng của logic mờ lagrave dựa trecircn cơ sở giao tiếp của con người
5 Nhược điểm của logic mờ Trong 1 hệ thống phức tạpsử dụng logic mờ coacute thể trở thagravenh trở ngại cho
việc xaacutec thực độ tin cậy của hệ thống Cơ chế lập luận mờ khocircng thể học hỏi từ những lỗi sai
6 Mạng noron nhacircn tạo(ANN) Mạng noron nhacircn tạo lagrave một mocirc phỏng xử lyacute thocircng tinđược nghiecircn cứu ra
từ hệ thống thần kinh của sinh vậtgiống như bộ natildeo để xử lyacute thocircng tin ANNs lagrave chương trigravenh dựa trecircn maacutey tiacutenh đơn giản coacute chức năng lagrave một mocirc
higravenh bagravei toaacuten khocircng gian dựa trecircn thử nghiệm vagrave baacuteo lỗi
7 Học từ kinh nghiệm Tiến trigravenh Một mẫu dữ liệu được biểu diễn như một mạng lưới noronANN ldquodự
đoaacutenrdquo 1 đầu radự đoaacuten được so saacutenh với giaacute trị thực tế hoặc giaacute trị chiacutenh xaacutecNếu đoaacuten được chiacutenh xaacutec thigrave khocircng coacute hagravenh động nagraveo được thực hiện
Nếu dự đoaacuten sai ANN kiểm tra lại vagrave xaacutec định lại thocircng số để điều chỉnh Một mẫu dữ liệu khaacutec được biểu diễn vagrave quaacute trigravenh nagravey được lặp lại
8 Nguyecircn tắc cơ bản của cocircng nghệ nơron Caacutec yếu tố xử lyacute cơ bản trong hệ thống thần kinh của con người lagrave tế bagraveo
thần kinhMạng lưới của tế bagraveo nagravey lagrave liecircn kết với nhau nhận được thocircng tin từ caacutec cảm biến trong mắt taihellip
Thocircng tin nhận được bởi tế bagraveo thần kinh hoặc lagrave sẽ kiacutech thiacutech noacute(sẽ được chuyển qua 1 thocircng điệp dọc theo mạng lưới) hoặc lagrave sẽ ngăn cản noacute(ngăn cản dograveng thocircng tin)
Độ nhạy coacute thể thay đổi qua thời gian hoặc sau khi coacute được kinh nghiệm
9 Cấu truacutec mạng Một ANN gồm 3 lớp cơ bản
Lớp đầu vagraveo nhận dữ liệu Lớp becircn trong hoặc lagrave lớp ẩn xử lyacute dữ liệu Lớp đầu ra chuyển tiếp kết quả cuối cugraveng của mạng
10Mạng nơ ron Thường coacute nhiều đầu vagraveo mỗi đầu vagraveo với mức ảnh hưởng vagrave tầm quan
trọng riecircng của noacute Một đầu vagraveo quan trọng coacute thể được sử dụng để khuếch đại đầu ra caacutec hagravem trạng thaacutei tổng hợp caacutec trọng số của caacutec yếu tố
đầuvagraveo khaacutec nhauvagraveo một giaacute trị duy nhất Caacutec hagravem chuyển giao xử lyacute caacutec giaacute trị trạng thaacutei vagrave tạo đầu ra
11Huấn luyện mạng nơ ron Trong mocirc higravenh coacute giaacutem saacutetANN được đến so saacutenh dự đoaacuten của chiacutenh
noacute với thocircng tin phản hồi coacute chứa caacutec kết quả mong muốn ANN sẽ phải tigravem caacutech thay đổi caacutec tham số becircn trong củamigravenh (caacutec trọng số vagrave caacutec ngưỡng) để tạo necircn một aacutenh xạ coacute khả năng aacutenh xạcaacutec đầu vagraveo thagravenh caacutec đầu ra mong muốn Sự thay đổi nagravey được tiến hagravenh nhờ việc so saacutenh giữa đầu ra thực sự vagrave đầu ra mong muốn
Trong mocirc higravenh khocircng coacute giaacutem saacutetANN nhận được dữ liệu vagraveo nhưng khocircng phải coacute bất kỳ thocircng tin phản hồi về kết quả mong muốn
Phần lớn caacutec ứng dụng nằm trong vugraveng của caacutec bagravei toaacuten ước lượng như mocirc higravenh hoacuteathống kecirc neacuten lọc phacircn cụm
12Lợi iacutech Liecircn kết với mạng noron Traacutenh caacutech lập trigravenh tường minh Giảm nhu cầu của chuyecircn gia ANNs thigrave thiacutech nghi với caacutec yếu tố đầu vagraveo thay đổi Khocircng cần thiết cho cơ sở tri thức tinh chế ANNs coacute tiacutenh động vagrave cải thiện với việc sử dụng Coacute khả năng xử lyacute dữ liệu khocircng chiacutenh xaacutec hoặc khocircng đầy đủ Cho pheacutep tổng quaacutet hoacutea từ thocircng tin cụ thể Cho pheacutep thu thập cảm giaacutec thocircng thường vagraveo miền giải quyết vấn đề
13Hạn chế của việc liecircn kết với mạng noron ANNs khocircng thể giải thiacutech được suy luận Bản chất hộp đen thường khiến cho vấn đề traacutech nhiệm vagrave độ tin cậy phaacutet
sinh lagrave khoacute khăn Lặp đi lặp lại quaacute trigravenh huấn luyện rất tốn thời gian Nguồn lực caacutec nhagrave phacircn tiacutech vagrave thiết kế coacute tay nghề cao vẫn lagrave đaacuteng lo
ngại Cocircng nghệ ANN thuacutec đẩy hạn chế của phần cứng hiện tại ANN yecircu cầu phải coacute sự tin tưởng ở đầu ra
14Giới thiệu về thuật toaacuten di truyền Cũng như mạng lưới thần kinh caacutec thuật toaacuten di truyền được dựa trecircn lyacute
thuyết sinh học Thuật toaacuten di truyền tigravem thấy nguồn gốc của chuacuteng trong caacutec lyacute thuyết
tiến hoacutea của chọn lọc tự nhiecircn vagrave thiacutech ứng với biến đổi khiacute hậu Kết quả thuật toaacuten di truyền lagrave từ giao phối 2 caacute thể trong quần thế để tạo
ra con caacutei đocirci khi tốt hơn so với bậc cha mẹ của chuacuteng 15Caacutec thagravenh phần cơ bản của thuật toaacuten di truyền
Toaacuten tử chọn lọc Caacutec caacute thể tốt được chọn lọc để đưa vagraveo thế hệ sau Sự chọn lọc nagravey căn cứ vagraveo độ thiacutech nghi với mocirci trường của mỗi caacute thể
Toaacuten tử lai gheacutep (crossover) Hai caacute thể cha vagrave mẹ trao đổi caacutec gen với nhau để tạo ra caacute thể con
Toaacuten tử đột biến (mutation) Một caacute thể thay đổi một số gen để biến đổi thagravenh một caacute thể mớiTất cả caacutec toaacuten tử trecircn khi thực hiện đều mang tiacutenh ngẫu nhiecircn
16Quaacute trigravenh cơ bản của một thuật toaacuten di truyền Khởi tạo
Đaacutenh giaacute quần thể
Lựa chọn NST thiacutech hợp nhất vagrave loại bỏ NST yếu nhất
Quy trigravenh giao nhau vagrave cải thiện quần thể
đột biến tiến trigravenh để khaacutem phaacute ra NST mới
17Ưu nhược điểm của việc kết hợp với thuật toaacuten di truyền Kiacutech thước quần thể lagrave 1 yếu tố quan trọng trong tốc độ của việc tigravem
kiếmnhưng noacute tương đối dễ dagraveng để dự đoaacuten tốc độ nagravey Giao nhau hoặc đột biến lagrave khocircng necircn đc sử dụng quaacute thường xuyecircn Luocircn coacute được iacutet nhất 1 giải phaacutep hợp lyacute Necircn coacute thể aacutep dụng chuacuteng cho caacutec vấn đề magrave chuacuteng ta khocircng coacute hướng
về caacutech giải quyết Sức mạnh của thuật toaacuten xuất phaacutet từ khaacutei niệm đơn giảnkhocircng phải từ
một thủ tục thuật toaacuten phức tạp 18Tương lai của học maacutey
Mạng lưới thần kinh nhacircn tạo vượt quaacute năng lực của con người trong caacutec trường hợp bị cocirc lập
Về mặt lyacute thuyếtmột maacutey tiacutenh coacute thể xử lyacute dũ liệu nhanh hơn hagraveng triệu lần so với 1 con người
May mắn thay cho chuacuteng tacon người tốt hơn nhiều khi magrave coacute được dữ liệumaacutey tiacutenh khocircng coacute 1 số thứ như lagrave 5 giaacutec quan
CHƯƠNG 10 KHO DỮ LIỆU
1 Kho dữ liệu Kho dữ liệu lagrave tuyển tập caacutec cơ sở dữ liệu tiacutech hợp hướng chủ đề được
thiết kế để trợ giuacutep cho một hệ hỗ trợ quyết định
Theo John Ladley Cocircng nghệ kho dữ liệu lagrave tập caacutec phương phaacutep kỹ thuật vagrave caacutec cocircng cụ coacute thể kết hợp hỗ trợ nhau để cung cấp thocircng tin cho người sử dụng trecircn cơ sở tiacutech hợp từ nhiều nguồn dữ liệu nhiều mocirci trường khaacutec nhau
Kho dữ liệu thường rất lớn tới hagraveng trăm GB hay thậm chiacute hagraveng Terabyte
2 Kho dữ liệu vận hagravenh (ODS) Một kho dữ liệu vận hagravenh Aacutep dụng kỹ thuật kho dữ liệu vagraveo caacutec hệ xử
lyacute giao taacutec lưu trữ dữ liệu cho một ứng dụng đặc thugrave Noacute đưa vagraveo kho dữ liệu một dograveng caacutec dữ liệu thocirc được thiết kế
3 So saacutenh
Kho dữ liệu vận hagravenh Kho dữ liệu
Dữ liệu theo chủ đề Dữ liệu theo chủ đề
Dữ liệu tiacutech hợp Dữ liệu tiacutech hợp
Dữ liệu thay đổi Dữ liệu khocircng thay đổi
Dữ liệu được cập nhật khi thay đổi
Dữ liệu giữ nguyecircn
Chỉ coacute dữ liệu hiện tạiDữliệu hiện tại vagrave dữ liệu lịch sử
Chu kỳ lagravem tươi dữ liệu ngắn Chu kỳ lagravem tươi dữ liệu dagravei
Chỉ coacute dữ liệu chi tiết Dữ liệu chi tiết vagrave dữ liệu tổng kết
Dugraveng cho caacutec quyết định ngắn hạn
Dugraveng cho hoạch định dagravei hạn
4 Kho dữ liệu cục bộ (Data Mart - DM)
Kho dữ liệu cục bộ lagrave CSDL coacute những đặc điểm giống với kho dữ liệu nhưng với quy mocirc nhỏ hơn vagrave lưu trữ dữ liệu về một lĩnh vực một chuyecircn ngagravenh
Data mart phụ thuộc Chứa những dữ liệu được lấy từ DW vagrave những dữ liệu nagravey sẽ được triacutech lọc vagrave tinh chế tiacutech hợp lại ở mức cao hơn để phục vụ một chủ đề nhất định của Datamart
Data mart độc lập Khocircng giống như Datamart phụ thuộc Data mart độc lập được xacircy dựng trước DW vagrave dữ liệu được trực tiếp lấy từ caacutec nguồn khaacutec nhau
5 Siecircu dữ liệu Metadata lagrave dữ liệu để mocirc tả dữ liệu Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột
một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi Metadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu
6 Mocirci trường kho dữ liệu Hệ thống của tổ chức vagrave kho cung cấp dữ liệu để xacircy dựng kho dữ liệu Trong quaacute trigravenh chuyển dữ liệu từ caacutec nguồn khaacutec nhau dữ liệu coacute thể
được lagravem sạch hoặc chuyển đổi vagrave vigrave thế DW được xem như lagrave một chuẩn cho việc lưu trữ
Đồng thời siecircu dữ liệu được ghi lại Cuối cugraveng DW hoặc siecircu thị coacute thể được sử dụng để tạo ra một kho dữ
liệu ldquocaacute nhacircnrdquo 7 Caacutec đặc điểm của kho dữ liệu
Đặc điểm Mocirc tả
Hướng chủ đề - DL tổ chức theo caacutech thức người dugraveng tham chiếu
Tiacutech hợp - Dữ liệu ldquosạchrdquo loại bỏ tiacutenh thiếu nhất quaacuten
Khocircng thay đổi - DL ldquochỉ đọcrdquo người dugraveng khocircng thay đổi được
Chuỗi thời gian - DL lagrave chuỗi thời gian khocircng phải lagrave trạng thaacutei hiện tại
Được tổng kết - DL vận hagravenhthao taacutec khi cần thiết
được kết hợp lại thagravenh dạng coacute thể dugraveng được cho quyết định
Kiacutech cỡ lớn hơn - Lưu giữ theo chuỗi thời gian tức lagrave giữ lại nhiều DL
Khocircng được chuẩn hoacutea - Coacute thể dư thừa DLSiecircu dữ liệu - Dữ liệu của dữ liệu được lưu trữNguồn dữ liệu - DL vận hagravenh (caacutec hệ sẵn coacute) cugraveng
với caacutec nguồn ngoagravei 8 Kho dữ liệu hướng chủ đề
Hướng chủ để coacute nghĩa lagrave kho dữ liệu được tổ chức xung quanh caacutec chủ đề chiacutenh như khaacutech hagraveng sản phẩm sản xuất Tập trung vagraveo việc mocirc higravenh hoacutea vagrave phacircn tiacutech dữ liệu cho caacutec nhagrave ra quyết định magrave khocircng tập trung vagraveo caacutec xử lyacute thocircng thường Cung cấp cho người dugraveng một khung nhigraven toagraven vẹn đơn giản vagrave đầy đủ về caacutec sự kiện quanh caacutec chủ đề
9 Dữ liệu trong DW được tiacutech hợp Dữ liệu trong kho dữ liệu được xacircy dựng bằng caacutech tổng hợp dữ liệu từ
nhiều nguồn khaacutec nhau vagrave caacutec nguồn coacute tổ chức khaacutec nhau Cơ sở dữ liệu caacutec file excel caacutec flat file hoặc caacutec raw file Khi đưa vagraveo kho dữ liệu caacutec dữ liệu được lagravem sạch vagrave tiacutech hợp dữ liệu nhằm đảm bảo tiacutenh nhất quaacuten của dữ liệu
10Kiến truacutec kho dữ liệu Tầng cơ sở dữ liệu hoạt động Tầng truy xuất thocircng tin Tầng truy xuất dữ liệu Tầng siecircu dữ liệu Tầng quản lyacute tiến trigravenh Tầng thocircng điệp của ứng dụng Tầng vật liacute của kho dữ liệu Tầng trigravenh diễn dữ liệu
11Higravenh trạng kho dữ liệu Kho dữ liệu ảo - người dugraveng cuối coacute thể truy cập trực tiếp đến kho dữ liệu
sử dụng caacutec cocircng cụ cho pheacutep ở tầng truy xuất dữ liệu Kho dữ liệu trung tacircm-1 cơ sở dữ liệu vật lyacute chứa tất cả dữ liệu cho một
vugraveng chuyecircn dụng nagraveo đoacute
Kho dữ liệu phacircn taacuten- Thagravenh phần được phacircn taacuten qua nhiều hệ cơ sở dữ liệu vật lyacute
12METADATA- Siecircu dữ liệu Định nghĩa Siecircu dữ liệu lagrave dữ liệu về dữ liệu Lagrave 1 lưu trữ dugraveng để
Miecircu tả kho dữ liệu tổng thể Nhận dạng kiểu kho dữ liệu Quản liacute quaacute trigravenh tiacutech hợp dữ liệu Quản liacute quaacute trigravenh cập nhật kho dữ liệu Quản liacute bảo mật
Lagrave chigravea khoacutea quyết định sự thagravenh cocircng của kho dữ liệu luocircn được thay đổi vagrave cập nhật theo sự phaacutet triển của kho dữ liệu
Dugraveng để quản liacute điều khiển kho dữ liệu Sự ra đời của kho dữ liệu như 1 cấu truacutec hỗ trợ ra quyết định siecircu dữ liệu
được xem như nguồn tagravei nguyecircn dữ liệu Siecircu dữ liệu lagrave trừu tượng Chuacuteng lagrave dữ liệu bậc cao cung cấp mocirc tả ngắn
gọn caacutec dữ liệu bậc thấp hơn 13Hoạt động của Siecircu dữ liệu
Siecircu dữ liệu rất cần thiết trong việc chuyển hoacutea thocircng tin trở thagravenh tri thức Lagrave chigravea khoacutea giuacutep chuacuteng ta xử lyacute được dữ liệu thocirc Viacute dụ một dograveng dữ liệu baacuten hagraveng 1023 K596 11121 agraveNoacute sẽ khocircng coacute nghĩa gigrave cho đến khi chuacuteng ta đưa vagraveo siecircu dữ liệu (thư
mục chứa dữ liệu) agrave cửa hagraveng 1023 sản phẩm K596 vagrave số tiền baacuten được lagrave 11121 đocirc la
14Sự cần thiết phải nhất quaacuten trong kho dữ liệu Kho dữ liệu được xacircy dựng cho lợi iacutech của những nhagrave phacircn tiacutech kinh
doanh caacutec nhagrave quản trị cho tất cả caacutec khu vực chức năng Trong cơ sở dữ liệu riecircng caacutec khu vực khaacutec nhau coacute thể định nghĩa vagrave lưu
trữ dữ liệu thocircng qua phiecircn bản của chiacutenh noacute Khi dữ liệu được lấy từ những vugraveng khaacutec nhau đoacute vagrave được đặt vagraveo kho dữ
liệu Việc chuyển đổi vagrave lagravem sạch caacutec tiến trigravenh sẽ đảm bảo noacute lagrave duy nhất được tiacutech hợp tại một mức của tổ chức
15Ragrave soaacutet lại dữ liệu ndash Thực thi siecircu dữ liệu
Bất kể cấu truacutec tự nhiecircn của 1 cacircu truy vấn thế nagraveo thigrave caacutec thagravenh phần của siecircu dữ liệu rất quan trọng đối với người ra quyết định
Bảng thuộc tiacutenh khoacutea được lưu trữ bởi kho dữ liệu Tập hợp dữ liệu được lấy từ đacircu Những chuyển đổi nagraveo được thực thi với việc lagravem sạch
16Siecircu dữ liệu lagrave gigrave Metadata - lagrave thocircng tin mocirc tả nội dung của cơ sở dữ liệu (CSDL) Metadata baacuteo cho người dugraveng biết thời gian cập nhật sau cugraveng của dữ liệu
định dạng vagrave mục điacutech sử dụng của noacute Những thocircng tin nagravey coacute thể hướng dẫn người dugraveng duyệt qua CSDL vagrave
giuacutep họ hiểu được yacute nghĩa vagrave ngữ cảnh của dữ liệu Trong CSDL metadata lagrave caacutec dạng biểu diễn khaacutec nhau của caacutec đối tượng
trong CSDL Trong CSDL quan hệ metadata lagrave caacutec định nghĩa của bảng cột CSDL
view vagrave nhiều đối tượng khaacutec Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột
một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi -gtMetadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu
Bảng chuyển đổi Ghi lại những chuyển đổi đatilde được thực hiện
Lịch sử thực thi Ghi lại những dữ liệu đatilde được
phacircn tiacutech
Higravenh thaacutei kết nốiGhi lại những dữ liệu được kết nối vagrave tần suất
17Aacutenh xạ thocircng thường của siecircu dữ liệu Bản ghi aacutenh xạ chuyển đổi bao gồm
Định danh của nguồn gốc Chuyển đổi thuộc tiacutenh Chuyển đổi thuộc tiacutenh vật lyacute Matilde hoacutea tham chiếu bảng chuyển đổi Đổi tecircn Đổi khoacutea Gaacuten giaacute trị cho thuộc tiacutenh mặc định Chọn logic cho caacutec nguồn nhiều giaacute trị Đổi thuật toaacuten
18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để
phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai
lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave
tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec
Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm
Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo
19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua
caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau
SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được
Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra
một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức
Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ
Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ
Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech
CHƯƠNG 11 KHAI PHAacute DỮ LIỆU
1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn
ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993
Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng
2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd
1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều
2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP
3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn
4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng
5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server
6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo
7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động
8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời
9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều
10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện
11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech
12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP
3 Xử lyacute phacircn tiacutech trực tuyến OLAP
MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave
dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu
ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave
thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu
HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave
ROLAP4 Khai phaacute dữ liệu
Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh
khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn
Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan
5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp
6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại
Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp
Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec
Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt
Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra
Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh
vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho
Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec
Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm
Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục
Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng
gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp
Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn
Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec
Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper
Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2
Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25
Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước
Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng
Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện
trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp
Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute
độ hỗ trợ ge ngưỡng minsup
độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan
Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn
Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết
Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu
MOLAP ROLAP HOLAP
Lưu trữ dữ liệu cơ sở
Khối Bảng quan hệ Bảng quan hệ
Lưu trữ thocircng tin tổng hợp
Khối Bảng quan hệ Khối
Hiệu suất thực hiện truy vấn
Nhanh nhất Chậm nhất Nhanh
Tiecircu thụ khocircng gian lưu trữ
Nhiều Thấp Trung bigravenh
Chi phiacute bảo trigrave Cao Thấp Trung bigravenh
Tổng thể 1 tổ chức sẽ mạnh mẽ hơn rất nhiều so với tất cả caacutec thagravenh phần của noacute cộng lại
Mối liecircn hệ của caacutec quyecirct định Mục điacutech chiacutenh của caacutec tổ chức lagrave đưa ra caacutec quyết định trong mocirci trường kinh doanh Caacutec Quyết định phải phugrave hợp với giới hạncaacutec chiacutenh saacutech caacutec thủ tục vagrave lĩnh vực hoạt động Noacute khocircng phụ thuộc vagraveo người đưa ra quyết định lagrave ai Đoacute coacute thể lagrave 1 caacute nhacircn1 nhoacutem hay thậm chiacute DSSs
Độ đo của quyết địnhNăm khiacutea cạnh ảnh hưởng tới Quyết định
Kết cấu nhoacutem (Group Structure) Vai trograve trong nhoacutem(Group Roles) Quaacute trigravenh lagravem việc(Group Processes) Taacutec phong(Group Style) Quy tăc nhoacutem(Group Norm)
Kết cấu nhoacutem Trong 1 nhoacutem chuẩn caacutec thagravenh viecircn coacute traacutech nhiệm vagrave thẩm quyền ra quyết định như nhau Vai trograve trong nhoacutemTrong nhoacutem caacutec thagravenh viecircn đều coacute vai trograve riecircng vagrave
lagrave 1 phần quan trong trong cả tiến trigravenh Quaacute trigravenh lagravem việcQuaacute trigravenh dugraveng người trong nhoacutem ảnh hưởng tới loại
quyết định gacircy hiệu quả vagrave ảnh hưởng tới cả tiến trigravenh Taacutec phong Coacute phải taacutec phong của người ra quyết định coacute ảnh hưởng tới
chất lượng quyết định cuối khocircng Quy tắc nhoacutemQuy tắc nhoacutem lagrave cực kỳ quan trọng trong việc xaacutec định
hagravenh vi caacutec thagravenh viecircn nhoacutem trong caacutec tigravenh huống xatilde hội Phacircn cấp quyết định trong tổ chức3 cấp
Chiến lược Ban latildenh đạo cấp cao hoặc nhagrave quản lyacute Caacutec quyết định mang tiacutenh lacircu dagravei nhất
Chiến thuật Quản lyacute tầm trung Thực thi caacutec quyết định chiến lược đề ra
Thực hiện
Caacute nhacircn chuyecircn ngagravenh Tự đưa ra caacutec quyết định từng ngagravey
15Năng lực của hệ HTQD
1 HHTQĐ cơ bản hỗ trợ caacutec nhagrave ra quyết định trong caacutec tigravenh huống nửa cấu truacutec vagrave phi cấu truacutec bằng caacutech kết hợp phaacuten xử của con người vagrave xử lyacute thocircng tin bằng maacutey tiacutenh Caacutec bagravei toaacuten như vậy khocircng thểkhocircng thuận tiện giải quyết được chỉ bằng caacutec cocircng cụ maacutey tiacutenh hoacutea hay caacutec phương phaacutep định lượng 2 Phugrave hợp cho caacutec cấp quản lyacute khaacutec nhau từ cao đến thấp 3 Phugrave hợp cho caacute nhacircn lẫn nhoacutem Caacutec bagravei toaacuten iacutet coacute tiacutenh cấu truacutec thường liecircn đới đến nhiều caacute nhacircn ở caacutec đơn vị chức năng hay mức tổ chức khaacutec nhau cũng như ở caacutec tổ chức khaacutec 4 Hỗ trợ cho caacutec quyết định tuần tự liecircn thuộc được đưa ra một lần vagravei lần hay lặp lại 5 Hỗ trợ cho caacutec giai đoạn của quaacute trigravenh ra quyết định tigravem hiểu thiết kế lựa chọn vagrave hiện thực 6 Phugrave hợp cho một số caacutec phong caacutech vagrave quaacute trigravenh ra quyết định 7 Coacute thể tiến hoacutea theo thời gian Người dugraveng coacute thể thecircm bỏ kết hợp thay đổi caacutec phần tử cơ bản của hệ thống 8 Dễ dugraveng vagrave thacircn thiện với người dugraveng 9 Nhằm vagraveo nacircng cao tiacutenh hiệu dụng của quyết định (chiacutenh xaacutec thời gian tiacutenh chất lượng) thay vigrave lagrave tiacutenh hiệu quả (giaacute phiacute của việc ra quyết định) 10 Người ra quyết định kiểm soaacutet toagraven bộ caacutec bước của quaacute trigravenh ra quyết định HHTQĐ chỉ trợ giuacutep khocircng thay thế người ra quyết định 11 Người dugraveng cuối cugraveng coacute thể tự kiến tạo vagrave sửa đổi caacutec hệ thống nhỏ vagrave đơn giản 12 Thường dugraveng mocirc higravenh để phacircn tiacutech caacutec tigravenh huống ra quyết định 13 Cung ứng caacutec truy đạt dữ liệu từ nhiều nguồn dạng thức vagrave kiểu khaacutec nhau 14 Coacute thể dugraveng như một cocircng cụ độc lập hay kết hợp với caacutec HHTQĐứng dụng khaacutec dugraveng đơn lẻ hay trecircn một mạng lưới maacutey tiacutenh (intranet extranet) bất kỳ với cocircng nghệ WEB
16Văn hoacutea tổ chứcVăn hoacutea của tổ chức lagrave tập hợp của rất nhiều thứ (lograveng tin biểu tượng đặc trưng regraven luyện) được phaacutet triển qua thời gian dagravei
Noacute gacircy ra ảnh hưởng mạnh mẽ cograven hơn cả những hoạt động của tổ chức đoacute 10 đặc điểm văn hoacutea của tổ chức
Điều khiển Hệ thống khen thưởng Sự đồng nhất Chịu đựng xung đột Mocirc higravenh giao tiếp Hỗ trợ quản lyacute Sự hogravea nhập Định hướng Chịu đựng rủi ro Caacute nhacircn khởi xướng
Mối quan hệ của văn hoacutea với hiệu năng lagravem việc1 tổ chức thagravenh cocircng phải coacute xu hướng hogravea hợp giữa văn hoacutea với mocirci trường trong vagrave ngoagravei tổ chức
Phugrave hợp trong nội bộ cho thấy một sự kết hợp giữa văn hoacutea của tổ chức với những cocircng nghệ của chiacutenh noacute
Phugrave hợp với becircn ngoagravei cho thấy một nền văn hoacutea phugrave hợp với chiến lược thị trường
Văn hoacutea vagrave sự thay đổi 1 tổ chức magrave khocircng biết thay đổi văn hoacutea sẽ khocircng thể giữ được vị triacute của migravenh trecircn thị trường Caacutec cocircng ty xuất sắc luocircn biết caacutech tiacutech cực tiếp cận khaacutech hagraveng động viecircn đầu tư
17Quyền lực vagrave chiacutenh trịQuyền lực vagrave chiacutenh trị luocircn đi liền với nhau
aQuyền lựclagrave khả năng ảnh hưởng đến việc phacircn phối caacutec nguồn lực trong tổ chứcGồm 5 yếu tố cơ bản
Phacircn quyền Uy quyền Quyền lực caacute nhacircn Sức ảnh hưởng Chiacutenh trị
Một vagravei thagravenh phần của quyền lực ra quyết định Quyết định việc nagraveo coacute sẵn
Quyết định sản phẩm nagraveo được sản xuất Quyết định đầu tư vagraveo đacircu Quyền đặt vagrave quản lyacute quản lyacute giaacute Thanh toaacuten vagrave khấu trừ tiền latildei
bChiacutenh trị Yếu tố cốt lotildei trong quaacute trigravenh higravenh thagravenh chiến lược ra quyết định Chiacutenh trị liecircn quan tới việc ra quyết định thocircng qua đagravem phaacutenảnh hưởngvagrave higravenh
thagravenh sự nhất triacute Trong nhiều trường hợp noacute coacute thể cho ta sự linh hoạt hơn
18Hệ trợ giuacutep quyết định trong tổ chức DSS của 1 tổ chức hỗ trợ cocircng nghệ tập trung vagraveo caacutec quyết định ảnh hưởng tới
rất nhiều người 1 hệ thống DSS hiện đại coacute thể chấp nhận nhiều quyết định vượt qua những giới
hạn phacircn cấp truyền thống aCaacutec hoạt động gần DSS
Giải quyết caacutec nhiệm vụ đặc biệt Thu thập thocircng tin Liecircn lạc qua caacutec chi nhaacutenh Động thaacutei chiacutenh trị
Phacircn loại tư duy chiến lược cho DSS Sắp xếp quyết địnhXếp hạng quyết định sao cho thứ tự đứng trước thigrave được
ưu tiecircn trước Chia sẻ thocircng tinCaacutec quyecirct định coacute thể độc lập nhưng người ra quyết định
phải chia sẻ caacutec thocircng tin liecircn quan Lựa chọn đagravem phaacutenVagravei quyết định coacute thể xaacutec lập thocircng qua đagravem phaacuten vagrave kết
quả được lagravem đồng thờiKhocircng phải cocircng nghệ tự noacute coacute thể đưa ra quyết định magrave noacute nằm ở trigravenh độ cocircng nghệ hỗ trợ caacutec chiến lược quyết định quyền lực vagrave chiacutenh trị cugraveng phối hợp với nhau
Chương 4Mocirc higravenh hoacutea quaacute trigravenh ra quyết định
(Cấu truacutec của hệ HTQD)19Vấn đề Mocirc higravenh
bull Lagrave phần tử chủ chốt trong hầu hết hệ hỗ trợ quyết định vagrave lagrave điều kiện cần trong hệ hỗ trợ quyết định dựa vagraveo mocirc higravenh (model-based DSS)
bull Coacute nhiều lớp mocirc higravenh kegravem theo lagrave caacutec kỹ thuật xử lyacute thao taacutec mocirc higravenh đặc thugrave tương ứng
bull Caacutec vấn đề chiacutenh nhận diện bagravei toaacuten vagrave phacircn tiacutech mocirci trường nhận diện biến số dự baacuteo đa mocirc higravenh caacutec phạm trugrave mocirc higravenh quản lyacute mocirc higravenh vagrave mocirc higravenh hoacutea dựa vagraveo kiến thức
bull Mocirc higravenh hoacutea lagrave taacutec vụ khocircng đơn giản Người xacircy dựng mocirc higravenh phải cacircn bằng giữa tiacutenh đơn giản của mocirc higravenh với caacutec yecircu cầu biểu diễn để mocirc higravenh coacute thể nắm bắt đủ thực tại cần thiết cho người ra quyết định
bull Mocirc phỏng lagrave kỹ thuật mocirc higravenh hoacutea thocircng dụng dugraveng để tigravem hiểu vấn đề tuy khocircng nhất thiết phải tigravem ra được caacutec giải phaacutep biến thể mở rộng quaacute trigravenh ra quyết định của tổ chức vagrave cho pheacutep tổ chức xem xeacutet taacutec độngảnh hưởng của caacutec chọn lựa tương lai
bull Mocirc phỏng tiết kiệm rất nhiều chi phiacute vagrave thời gian ndash rất dễ thay đổi mocirc higravenh hoạt động của một hệ thống vật lyacute bằng mocirc higravenh hoacutea maacutey tiacutenh
bull Mocirc higravenh coacute thể được phaacutet triển vagrave cagravei đặt bằng một số caacutec ngocircn ngữ lập trinh (thế hệ 3 4 ) vagrave hệ thống phần mềm khaacutec nhau
Mocirc higravenh tĩnh vagrave động
bull Mocirc higravenh tĩnh thể hiện bức tranh tại thời điểm của tigravenh huống Caacutec khiacutea cạnh của bagravei toaacuten được xeacutet một thời kỳ nhất định trong một khung thời gian nhất định (coacute thể ldquocuốnrdquo về tương lai) Caacutec tigravenh huống được giả sử lagrave sẽ lập lại với tập caacutec điều kiện đồng nhất
1048713 Giả định coacute được tiacutenh ổn định của dữ liệu 1048713 Mocirc phỏng quaacute trigravenh dạng tĩnh - lagravem việc trecircn caacutec trạng thaacutei ổn định để tigravem ra caacutec
thocircng số tối ưu ndash thường được dugraveng như cocircng cụ chủ yếu để thiết kế quaacute trigravenh 1048713 vd quyết định sản xuấtmua 1 sản phẩm baacuteo caacuteo thu nhập hagraveng quyacutenăm bull Mocirc higravenh động biểu diễn caacutec kịch bản thay đổi theo thời gian 1048713 Phụ thuộc thời gian caacutec trạng thaacutei thay đổi theo thời gian 1048713 Thường dugraveng để tạo sinh vagrave biểu diễn caacutec xu hướng vagrave khuocircn mẫu theo thời gian 1048713 Mocirc phỏng động thể hiện caacutec diễn tiến khi caacutec điều kiện theo thời gian khaacutec với caacutec
trạng thaacutei ổn định ndash thường được dugraveng để thiết kế việc kiểm soaacutet caacutec hệ thống 1048713 VD dự baacuteo lời-lỗ trong 5 năm với caacutec nhập lượng như giaacute phiacute số lượng thay đổi
theo từng năm
Mocirc higravenh chắc chắn tương đối dễ phaacutet triển giải quyết vagrave coacute thể sinh ra caacutec giải phaacutep tối ưu 1048713 Caacutec bagravei toaacuten coacute một số lớnvocirc hạn caacutec giải phaacutep khả thi đặc biệt quan trọng 1048713 Caacutec mocirc higravenh tagravei chaacutenh được xacircy dựng trong điều kiện chắc chắn
Mocirc higravenh bất địnhbằng caacutech thu thập thecircm thocircng tin cố gắng đưa bagravei toaacuten trở về dạng chắc chắn hay dạng
rủi ro Mocirc higravenh rủi ro caacutec quyết định kinh doanh được đưa ra dưới caacutec rủi ro giả định
1048713 Đocirci khi biết được xaacutec suất của caacutec sự kiện xảy ra trong tương lai 1048713 Caacutec trường hợp khaacutec (bất định) ước lượng caacutec rủi ro vagrave giả sử caacutec tigravenh huống rủi ro
xảy ra 20Mocirc higravenh hoacutea
MOcirc HIgraveNH HOacuteA BẰNG BẢNG TIacuteNH bull Bảng tiacutenh phần mềm mạnh linh hoạt vagrave dễ dugraveng cho pheacutep tạo sinh caacutec ứng dụng trong kinh doanh kỹ thuật toaacuten vagrave khoa học với tập caacutec hagravem mạnh về tagravei chaacutenh thống kecirc toaacuten bull Kegravem theo lagrave caacutec thagravenh phần cộng thecircm (add-ins) giuacutep xacircy dựng vagrave giải caacutec lớp mocirc higravenh đặc thugrave bull Lagrave cocircng cụ mocirc higravenh hoacutea thocircng dụng nhất của người dugraveng cuối cugraveng bull Coacute caacutec chức năng về phacircn tiacutech ldquowhat-ifrdquo dograve tigravem mục tiecircu quản lyacute dữ liệu vagrave lập trigravenh (dạng macro) bull Coacute khả năng đọc ghi caacutec cấu truacutec tập tin thocircng dụng để giao tiếp được với caacutec CSDL vagrave cocircng cụ khaacutec bull Coacute thể xacircy dựng mocirc higravenh tĩnh vagrave động bull Dugraveng trecircn maacutey tiacutenh caacute nhacircn vagrave maacutey tiacutenh lớn
bull Cơ sở để xacircy dựng caacutec bảng tiacutenh đa chiều vagrave caacutec cocircng cụ xử lyacute phacircn tiacutech trực tuyến (OLAP) MOcirc HIgraveNH HOacuteA BẰNG PHAcircN TIacuteCH QUYẾT ĐỊNH bull Tiếp cận mocirc higravenh hoacutea caacutec tigravenh huống quyết định coacute một số hữu hạnkhocircng quaacute nhiều caacutec phương aacuten ndash mỗi phương aacuten được trigravenh ra dưới dạng bảng hay đồ thị - caacutec kết quả tương ứng (dự baacuteo được kegravem xaacutec suất) theo mục tiecircu bagravei toaacuten ndash từ đoacute chọn phương aacuten tốt nhất bull Đơn mục tiecircu bảng quyết định hay cacircy quyết định bull Đa mục tiecircu AHP (analytic hierarchy process) khaacutec
MOcirc HIgraveNH HOacuteA BẰNG QUY HOẠCH TOAacuteN
bull Quy hoạch toaacuten học (mathematical programming) lagrave họ caacutec cocircng cụ giải quyết caacutec bagravei toaacuten quản lyacute theo đoacute người ra quyết định phải cấp phaacutet caacutec tagravei nguyecircn khan hiếm cho caacutec hoạt động cạnh tranh nhau (caacutec phương aacuten) nhằm tối ưu hoacutea mục tiecircu coacute khả năng đo lường được bull Caacutec mocirc higravenh quy hoạch tuyến tiacutenh (linear programming) thocircng dụng nhất trong quy hoạch toaacuten coacute nhiều ứng dụng trong thực tế được dugraveng nhiều trong caacutec hệ hỗ trợ quyết định bull Bagravei toaacuten quy hoạch tuyến tiacutenh 1048713 Caacutec biến quyết định (cần tigravem giaacute trị) 1048713 Hagravem mục tiecircu (hagravem toaacuten học dạng tuyến tiacutenh xaacutec định quan hệ giữa biến quyết định vagrave mục tiecircu đo lường mức độ đạt đạt mục tiecircu vagrave cần được tối ưu hoacutea) 1048713 Caacutec hệ số của hagravem mục tiecircu (cho biết mức đoacuteng goacutep vagraveo mục tiecircu của 1 đơn vị biến quyết định) 1048713 Ragraveng buộc (biểu thức tuyến tiacutenh cho biết giới hạn tagravei nguyecircn vagravehay caacutec quan hệ giữa caacutec biến số) 1048713 Dung lượng (mocirc tả cận trecircn vagrave dưới của caacutec biến vagrave ragraveng buộc) 1048713 Hệ số (cocircng nghệ) vagraveo-ra (cho biết mức độ sử dụng tagravei nguyecircn của biến quyết định) bull Đặc điểm của bagravei toaacuten quy hoạch tuyến tiacutenh 1048713 Tagravei nguyecircn kinh tế của bagravei toaacuten lagrave coacute hạn vagrave sẵn sagraveng 1048713 Coacute nhiều caacutech (gt2 caacutech) sử dụng tagravei nguyecircn được gọi lagrave giải phaacutep hay chương trigravenh 1048713 Mỗi hoạt động dugraveng tagravei nguyecircn đều sinh ra kết quả dưới dạng mục tiecircu đatilde phaacutet biểu trước 1048713 Việc cấp phaacutet nằm trong caacutec ragraveng buộc cho trước bull Giả định của bagravei toaacuten quy hoạch tuyến tiacutenh 1048713 Caacutec kết quả của caacutec cấp phaacutet coacute thể đem so saacutenh với nhau coacute thể đo lường bằng một đơn vị chung
1048713 Caacutec cấp phaacutet độc lập với nhau về mặt kết quả 1048713 Kết quả cuối cugraveng lagrave tổng của caacutec kết quả từ caacutec hoạt động riecircng rẽ khaacutec nhau 1048713 Dữ liệu coacute tiacutenh chắc chắn 1048713 Tagravei nguyecircn được dugraveng một caacutech kinh tế nhất 1048713 Thường coacute một số lớn caacutec giải phaacutep với kết quả khaacutec nhau 1048713 Trong số caacutec giải phaacutep coacute thể coacute 1 giải phaacutep tốt nhất ndash mức độ đạt được mục tiecircu cao nhất ndash gọi lagrave giải phaacutep tối ưu được tigravem ra bằng một giải thuật đặc biệt MOcirc HIgraveNH HOacuteA BẰNG HEURISTIC bull Việc tigravem giải phaacutep tối ưu của một số bagravei toaacuten quyết định phức tạp coacute thể tốn nhiều thời gian chi phiacute hay khocircng thể tigravem ra được Cograven nếu dugraveng tiếp cận mocirc phỏng cũng coacute thể keacuteo dagravei phức tạp khocircng thiacutech hợp hay thậm chiacute khocircng chiacutenh xaacutec
bull Lagrave một tiếp cận giuacutep tigravem ra caacutec giải phaacutep khả thithỏa matildenđủ tốt cho caacutec bagravei toaacuten phức tạp Coacute thể coacute giải phaacutep đủ tốt (90-999 giaacute trị của lời giải tối ưu) nhanh choacuteng vagrave đỡ tốn keacutem hơn bằng caacutech dugraveng heuristics bull Quaacute trigravenh heuristic lagrave datildey caacutec bước xacircy dựng caacutec quy luật giải quyết vấn đề thocircng qua việc tigravem kiếm caacutec con đường hứa hẹn nhất dẫn đến lời giải tigravem kiếm caacutech thức thu thập vagrave phacircn giải thocircng tin theo quaacute trigravenh giải vagrave phaacutet triền caacutec phương phaacutep dẫn đến một giải thuật tiacutenh toaacuten hay một lời giải tổng quaacutet đatilde coacute bull Aacutep dụng chủ yếu cho bagravei toaacuten cấu truacutec yếu cũng dugraveng để tigravem ra giải phaacutep chấp nhận được cho bagravei toaacuten cấu truacutec chặt bull Khocircng đủ tổng quaacutet như caacutec giải thuật thường chỉ dugraveng cho tigravenh huống đặc thugrave đang xeacutet bull Coacute thể dẫn đến một giải phaacutep dở - caacutec thủ tục từng bước giải quyết vấn đề khocircng đảm bảo tigravem ra giải phaacutep tối ưu bull Heuristic coacute thể lagrave định lượng vigrave vậy coacute thể đoacuteng vai trograve quan trọng trong cơ sở mocirc higravenh của hệ hỗ trợ quyết định bull Heuristic coacute thể lagrave định tiacutenh vigrave vậy coacute thể đoacuteng vai trograve quan trọng trong cung ứng kiến thức cho hệ chuyecircn gia bull Quaacute trigravenh heuristic liecircn quan đến tigravem kiếm học tập ước lượng phacircn xử vagrave lặp lại caacutec hoạt động nagravey dọc theo tiến trigravenh bull Kiến thức thu được dugrave thagravenh cocircng hay thất bại trong quaacute trigravenh đều được phản hồi vagrave sửa đổi chiacutenh quaacute trigravenh nhờ đoacute coacute thể định nghĩa lại mục tiecircu hay bagravei toaacuten 1048713 Giải thuật di truyền bắt đầu bằng tập caacutec giải phaacutep được sinh ngẫu nhiecircn taacutei kết hợp caacutec cặp giải phaacutep một caacutech ngẫu nhiecircn bull Tigravenh huống necircn dugraveng heuristics 1048713 Dữ liệu đầu vagraveo khocircng chiacutenh xaacutec hay coacute giới hạn 1048713 Thực tế quaacute phức tạp đến nỗi khocircng dugraveng được caacutec mocirc higravenh tối ưu 1048713 Chưa coacute được giải thuật chiacutenh xaacutec vagrave đủ tin cậy 1048713 Bagravei toaacuten phức tạp necircn sẽ khocircng kinh tế nếu dugraveng tối ưu hay mocirc phỏng hoặc tốn quaacute nhiều thời gian tiacutenh toaacuten 1048713 Coacute thể cải thiện tiacutenh hiệu quả của quaacute trigravenh tối ưu (tức coacute thể sinh ra caacutec giải phaacutep ban đầu tương đối tốt) 1048713 Liecircn quan đến xử lyacute kyacute hiệu chứ khocircng phải xử lyacute kyacute số (như hệ chuyecircn gia) 1048713 Cần coacute quyết định nhanh vagrave caacutec xử lyacute dựa vagraveo maacutey tiacutenh đều khocircng khả thi (một số heuristic khocircng cần đến maacutey tiacutenh) bull Thuận lợi 1048713 Dễ hiểu dễ giải thiacutech vagrave dễ cagravei đặt 1048713 Nacircng cao tiacutenh saacuteng tạo vagrave năng lực heuristic cho caacutec vấn đề khaacutec 1048713 Tiết kiệm thời gian xaacutec lập vấn đề 1048713 Tiết kiệm yecircu cầu về bộ chứa vagrave xử lyacute maacutey tiacutenh
1048713 Tiết kiệm thời gian tiacutenh toaacuten vagrave do vậy tiết kiệm thời gian thực trong ra quyết định Một số vấn đề phức tạp đến nỗi chỉ coacute thể giải được bằng heuristics 1048713 Thường sinh ra nhiều giải phaacutep chấp nhận được 1048713 Thường coacute thể phaacutet biểu lyacute thuyết hay đo lường thực nghiệm về chất lượng của giải phaacutep (tức giaacute trị mục tiecircu của giải phaacutep gần với giaacute trị tồi ưu đến mức nagraveo dugrave giaacute trị tối ưu chưa biết được) 1048713 Coacute thể kết hợp tiacutenh thocircng minh vagraveo để hướng dẫn pheacutep tigravem kiếm (tigravem kiếm tabu) Năng lực thocircng minh đoacute coacute thể lagrave đặc thugrave theo bagravei toaacuten hoặc dựa trecircn yacute kiến chuyecircn gia được cấy trong hệ chuyecircn gia hoặc cơ chế tigravem kiếm 1048713 Coacute thể dugraveng heuristic hiệu quả vagraveo caacutec mocirc higravenh coacute thể giải bằng quy hoạch toaacuten học Đocirci khi heuristic lagrave phương phaacutep được ưa thiacutech hơn khi khaacutec giải phaacutep heuristics được dugraveng như giải phaacutep ban đầu cho caacutec phương phaacutep quy hoạch toaacuten học bull Hạn chế 1048713 Khocircng đảm bảo coacute được giải phaacutep tối ưu 1048713 Caacutec quy luật coacute rất nhiều ngoại lệ 1048713 Caacutec lựa chọn quyết định tuần tự coacute thể khocircng tiecircn đoaacuten được caacutec kết cục tương lai của mỗi chọn lựa 1048713 Sự liecircn thuộc giữa caacutec phần trong hệ thống đocirci khi coacute thể gacircy ra caacutec ảnh hưởng lớn lao lecircn toagraven hệ thống bull Phacircn loại caacutec giải thuật heuristic 1048713 Heuristic xacircy dựng xacircy dựng giải phaacutep khả thi bằng caacutech cộng thecircm từng thagravenh phần một VD bagravei toaacuten người baacuten hagraveng ndash luocircn gheacute thagravenh phố chưa viếng thăm kế tiếp gần nhất
1048713 Heuristic cải tiến bắt đầu bằng một giải phaacutep khả thi vagrave cố gắng cải tiến liecircn tục trecircn đoacute VD trecircn thử hoaacuten đổi 2 thagravenh phố 1048713 Quy hoạch toaacuten aacutep dụng vagraveo caacutec mocirc higravenh chứa iacutet ragraveng buộc nhằm coacute được thocircng tin về thỏa hiệp tốt nhất với mocirc higravenh nguyecircn gốc Thường được dugraveng trong tối ưu hoacutea nguyecircn (integer optimization) 1048713 Chia giai đoạn giải quyết một vấn đề theo từng giai đoạn VD ở PampG trecircn đacircy bagravei toaacuten phacircn phối được giải quyết trước sau đoacute dugraveng giải quyết bagravei toaacuten chiến lược sản phẩm 1048713 Phacircn ratilde chia bagravei toaacuten thagravenh caacutec phần nhỏ hơn coacute thể giải quyết được sau đoacute kết hợp caacutec giải phaacutep đoacute lại VD chia latildenh thổ baacuten hagraveng thagravenh 4 vugraveng khaacutec nhau giải quyết cho từng vugraveng sau đoacute kết nối caacutec giải phaacutep
21Mocirc phỏngbull Giả định caacutec đặc điểm của thực tạibull Lagrave kỹ thuật tiến triển caacutec thực nghiệm (như phacircn tiacutech ldquowhat-ifrdquo) - bằng maacutey tiacutenh -trecircn một mocirc higravenh của hệ thocircng tin quản lyacute
bull Khocircng thực sự lagrave một mocirc higravenh vigrave khocircng biểu diễn thực tại magrave lagrave cố gắng bắtchước thực tạibull Một trong những phương phaacutep thocircng dụng nhất trong HHTQĐbull HHTQĐ lagravem việc với caacutec bagravei toaacuten phi cấu truacutec vagrave cấu truacutec yếu tigravenh huống thực tếphức tạp ndash khocircng dễ biểu diễn bằng mocirc higravenh tối ưu hay caacutec dạng mocirc higravenh khaacutecnhưng lại thường coacute thể xử lyacute được bằng mocirc phỏngbull Đặc điểm1048713 Iacutet đưa ra caacutec đơn giản hoacutea về thực tại hơn caacutec mocirc higravenh khaacutec1048713 Do triển khai caacutec thực nghiệm necircn noacute coacute thể kiểm thử caacutec giaacute trị cụ thể của caacutecbiến quyết địnhbiến khocircng kiểm soaacutet được của mocirc higravenh vagrave xem xeacutet ảnh hưởnglecircn caacutec biến kết quả1048713 Phương phaacutep coacute tiacutenh mocirc tả (như vậy khaacutec với phương phaacutep danh định)1048713 Khocircng tự động tigravem kiếm giải phaacutep tối ưu ndash noacute mocirc tảtiecircn đoaacuten caacutec đặc tiacutenh của hệthống đatilde cho dưới caacutec điều kiện khaacutec nhau từ đoacute coacute thể chọn ra phương aacuten tốtnhất1048713 Quaacute trigravenh mocirc phỏng thường lặp lại một thực nghiệm nhiều lần để coacute được ướclượng về hiệu ứng tổng quaacutet của một số hagravenh động nhất định1048713 Mocirc phỏng maacutey tiacutenh thiacutech hợp cho hầu hết caacutec tigravenh huống mặc dugrave cũng coacute một sốmocirc phỏng thủ cocircng thagravenh cocircng1048713 Thường chỉ được dugraveng khi bagravei toaacuten quaacute phức tạp khocircng thể xem xeacutet bằng caacutec kỹthuật tối ưu dạng số Tiacutenh phức tạp theo nghĩa bagravei toaacuten khocircng thể cocircng thức hoacuteacho tối ưu (do khocircng thotildea caacutec giả định) hoặc cocircng thức quaacute lớn quaacute nhiều tươngtaacutec giữa caacutec biến hoặc về bản chất bagravei toaacuten lagrave bất định hay rủi roPhương phaacutep mocirc phỏng thiết lập mocirc higravenh của hệ thống thực vagrave tiến hagravenh caacutec thựcnghiệm lặp lại trecircn mocirc higravenh
bull Thuận lợi1048713 Lyacute thuyết tương đối trực tiếp hiệu ứng dagravei hạn của nhiều chiacutenh saacutech -gt neacuten thờigian lớn1048713 Do tiacutenh chất mocirc tả (khaacutec với danh định)1048713 Coacute thể thấy được nhanh choacuteng coacute thể đặt ra caacutec cacircu hỏi ldquowhat-ifrdquo coacute thể dugravengtiếp cận thử-vagrave-sai vagraveo giải quyết vấn đề một caacutech nhanh choacuteng rẻ chiacutenh xaacutec iacutetrủi ro hơn1048713 Thử nghiệm được biến quyết định phần nagraveo của mocirci trường thực sự quan trọngvới caacutec phương aacuten khaacutec nhau1048713 Yecircu cầu kiến thức riecircng biệt về bagravei toaacuten vigrave thế buộc người xacircy dựng mocirc higravenh phảilagravem việc thường xuyecircn với nhagrave quản lyacute ndash đối tượng mong muốn của HHTQĐ để
từ đoacute bản chất bagravei toaacuten vagrave caacutec quyết định được hiểu tốt hơn1048713 Mocirc higravenh được xacircy dựng từ viễn cảnhcaacutech nhigraven của nhagrave quản lyacute1048713 Mocirc higravenh chỉ cho một bagravei toaacuten riecircng biệt thường khocircng thể dugraveng giải caacutec bagravei toaacutenkhaacutec Như vậy mỗi thagravenh phần của mocirc higravenh ứng với một phần của hệ thống thựcdo đoacute sẽ khocircng yecircu cầu nhagrave quản lyacute phải tổng quaacutet hoacutea caacutec hiểu biết của migravenh1048713 Phổ bagravei toaacuten giải được rất rộng tồn kho nhacircn sự hoạch định chiến lược 1048713 Coacute thể chứa caacutec phức tạp thực sự của bagravei toaacuten khocircng cần caacutec đơn giản hoacutea (TDdugraveng caacutec phacircn phối xaacutec suất thực thay vigrave phacircn phối lyacute thuyết xấp xỉ)1048713 Coacute thể tự động sinh ra nhiều đo lường hiệu năng quan trọng1048713 Thường lagrave phương phaacutep duy nhất của HHTQĐ coacute thể xử lyacute caacutec bagravei toaacuten tương đốiphi cấu truacutec1048713 Coacute một số caacutec goacutei phần mềm mocirc phỏng (Monte Carlo) tương đối dễ dugravengbull Điểm yếu1048713 Tuy thường tigravem được caacutec phương aacuten đủ tốt nhưng khocircng đảm bảo lời giải tối ưu1048713 Quaacute trigravenh xacircy dựng mocirc higravenh thường dagravei vagrave tốn keacutem1048713 Giải phaacutep vagrave suy diễn từ nghiecircn cứu mocirc phỏng thường khocircng thể chuyển sang bagraveitoaacuten khaacutec vigrave mocirc higravenh kết hợp caacutec yếu tố đặc thugrave1048713 Đocirci khi do mocirc higravenh quaacute dễ giải thiacutech cho nhagrave quản lyacute necircn caacutec phương phaacutep phacircntiacutech thường xem nhẹ1048713 Phần mềm mocirc phỏng đocirci khi yecircu cầu caacutec kỹ năng đặc biệt do độ phức tạp củaphương phaacutep giải higravenh thứcbull Caacutec loại mocirc phỏng1048713 Mocirc phỏng xaacutec suất một hay nhiều biến độc lập mang tiacutenh xaacutec suất với 2 loạiphacircn phối ndash thường dugraveng kỹ thuật Monte Carlo1048713 Phacircn phối rời rạc tigravenh huống coacute một số giới hạn caacutec biến cố (biến) với hữu hạncaacutec giaacute trị cho mỗi biến cố (biến)1048713 Phacircn phối liecircn tục tigravenh huống coacute số lượng khocircng giới hạn caacutec biến cố tuacircn theocaacutec hagravem mật độ xaacutec suất như phacircn phối chuẩn1048713 Mocirc phỏng độc lậpphụ thuộc theo thời gian1048713 Độc lập khocircng cần thiết phải biết chiacutenh xaacutec thời điểm xảy ra biến cố (nhu cầutiecircu thụ lượng sản phẩm trong ngagravey khocircng biết chiacutenh xaacutec thời điểm tiecircu thụ)1048713 Phụ thuộc cần biết chiacutenh xaacutec thời điểm xảy ra sự kiện (bagravei toaacuten hagraveng đợi)1048713 Mocirc phỏng tương taacutec trực quan1048713 Mocirc phỏng hướng đối tượng dugraveng tiếp cận hướng đối tượng để xacircy dựng mocirc higravenhmocirc phỏng Chuacute yacute ngocircn ngữ mocirc higravenh hoacutea nhất thể UML (unified modelinglanguage) kể cả khi mocirc phỏng caacutec hệ thời gian thựcMOcirc HIgraveNH HOacuteA ĐA CHIỀU ndash XỬ LYacute PHAcircN TIacuteCH TRỰC TUYẾNbull Người ra quyết định thường phải xem xeacutet nhiều chiều của dữ liệu (TD caacutec chiềucủa dữ liệu baacuten hagraveng lagrave sản phẩm vugraveng thời gian người baacuten ) dữ liệu cần đượcphacircn tiacutech trực tiếp bằng caacutec cocircng cụ chuẩn hay phacircn tiacutech tự động bằng caacutec
phương phaacutep khai mỏ dữ liệu (data mining)bull Hầu hết caacutec hệ thống phacircn tiacutech đa chiều được nhuacuteng trong caacutec hệ xử lyacute phacircn tiacutechtrực tuyến (HXLPTTT ndash online analytic processing - OLAP)bull Mục tiecircu của XLPTTT nắm bắt cấu truacutec của dữ liệu thực để hỗ trợ ra quyết địnhbull Trong HHTQĐ coacute sự gắn nối tự nhiecircn giữa mocirc higravenh hoacutea dữ liệu mocirc higravenh hoacutea kyacutehiệu vagrave caacutec khiacutea cạnh của phacircn tiacutech ldquowhat-ifrdquobull Caacutec baacuteo caacuteo của HXLPTTT đều coacute tiacutenh tương taacutec dễ khai thaacutec sử dụng đặc biệtphugrave hợp cho caacutec baacuteo caacuteo về chỉ số hiệu năng chủ yếu (key performance indicators- KPI) baacuteo caacuteo về đo lường hiệu năng kinh doanh bull Thế hệ hiện tại của HXLPTTT vagrave hệ khai mỏ dữ liệu (data mining) tiacutech hợp caacutecđặc tiacutenh của hệ thocircng tin latildenh đạo (executive information system ndashEIS- nhiềucaacutech nhigraven dữ liệu chi tiết hoacutea theo nhu cầu) vagrave caacutec hệ đồ họa khaacutec ndash thường coacutegiao diện người dugraveng dạng kiểu WEBbull Caacutec hệ thống như trecircn cograven được gọi lagrave caacutec cocircng cụ triacute tuệ kinh doanh (businessintelligence - BI) vigrave coacute caacutec đặc trưng về mocirc higravenh hoacutea vagrave tối ưu hoacutea nhưng lạitrong suốt đối với ngươigrave dugravengbull Hiện caacutec cocircng cụ được đưa ra bởi caacutec nhagrave cung cấp về CSDL về hoạch định tagraveinguyecircn tổ chức (ERP) về nhagrave kho dữ liệu (data warehouse) về HXLPTTT MOcirc HIgraveNH HOacuteA VAgrave MOcirc PHỎNG TƯƠNG TAacuteC TRỰC QUANbull Iacutech lợi Người ra quyết định tham gia vagraveo quaacute trigravenh phaacutet triển mocirc higravenh vagrave thựcnghiệm mocirc phỏng vigrave vậy sẽ tin tưởng khi sử dụng mocirc higravenhbull Mocirc higravenh hoacutea tương taacutec trực quan (visual interactive modeling - VIM) dugraveng caacutecbiểu diễn đồ họa maacutey tiacutenh để trigravenh bagravey caacutec ảnh hưởng của caacutec quyết định quản lyacutekhaacutec nhau ở một thời điểm (tĩnh) hay tiến triển theo thời gian (động với kỹ thuậthoạt higravenh)bull Mocirc phỏng tương taacutec trực quan (visual interactive simulation - VIS) cho pheacutepngười dugraveng theo dotildei tiến trigravenh xacircy dựng vagrave sử dụng khai thaacutec mocirc higravenh mocirc phỏngdưới dạng hoạt higravenhbull Mocirc higravenh hoacutea tương taacutec trực quan coacute thể kết hợp với tiếp cận triacute tuệ nhacircn tạo đểđưa ra caacutec khả năng mới thay đổi từ xacircy dựng hệ thống dạng đồ họa đến tigravem hiểuvề động học của hệ thốngbull Cần đến caacutec hệ thống maacutey tiacutenh xử lyacute song song tốc độ cao để xacircy dựng caacutec mocircphỏng - phức tạp quy mocirc lớn dạng hoạt higravenh - mang tiacutenh khả thi ở thời gian thực
22Caacutec dạng hệ thống hỗ trợ ra quyết địnhHệ hỗ trợ quyết định nhoacutemRa quyết định nhoacutem giao tiếp vagrave cộng taacutec- Caacutec đặc điểm của cocircng việc nhoacutem+ Một nhoacutem thực hiện một nhiệm vụ thỉnh thoảng ra quyết định thỉnh thoảngkhocircng ra quyết định+ Caacutec thagravenh viecircn trong nhoacutem coacute thể ở những nơi khaacutec nhau
+ Caacutec thagravenh viecircn trong nhoacutem coacute thể lagravem việc ở những thời gian khaacutec nhau+ Caacutec thagravenh viecircn trong nhoacutem coacute thể lagravem việc cugraveng nhau hoặc ở caacutec tổ chức khaacutecnhau+ Nhoacutem coacute thể vĩnh viễn hoặc tạm thời+ Nhoacutem coacute thể ở bất kỳ mức quản lyacute nagraveo hoặc mức thời gian nagraveo+ Coacute sự điều phối (quaacute trigravenh vagrave nhiệm vụ đạt được) hoặc macircu thuẩn trongnhoacutem+ Coacute sự đạt được hoặcvagrave mất maacutet năng suất trong tổ chức+ Nhiệm vụ phải hoagraven thagravenh rất nhanh+ Khocircng thể hoặc quaacute đắt cho tất cả caacutec thagravenh viecircn trong nhoacutem cugraveng hợp ở mộtnơi+ Một số dữ liệu thocircng tin hoặc kiến thức cần thiết nằm ở nhiều nơi một sốkhaacutec ở ngoagravei tổ chức+ Chuyecircn mocircn của caacutec thagravenh viecircn khocircng coacute trong nhoacutem lagrave cần thiết- Caacutec hoạt động vagrave caacutec quaacute trigravenh miecircu tả caacutec cuộc họp+ Cuộc họp lagrave hoạt động chung liecircn quan bởi một nhoacutem người coacute địa vị bằngnhau hoặc gần bằng nhau+ Kết quả của cuộc họp phụ thuộc một phần vagraveo kiến thức yacute kiến caacutec đaacutenh giaacutecủa caacutec thagravenh viecircn+ Kết quả của cuộc họp cũng phụ thuộc vagraveo sự kết hợp của nhoacutem vagrave phụ thuộcvagraveo quaacute trigravenh ra quyết định được sử dụng bởi nhoacutem đoacute+ Giải quyết caacutec yacute kiến khaacutec nhau bởi người coacute quyền hạn hoặc thương lượnghoặc phacircn xửHỗ trợ giao tiếp- Giao tiếp lagrave thagravenh phần quan trọng cho hỗ trợ quyết định Khocircng coacute giao tiếp thigravekhocircng coacute cộng taacutec Những người ra quyết định caacute nhacircn phải giao tiếp với caacutecđồng nghiệp chuyecircn gia cơ quan chiacutenh phủ khaacutech hagraveng đối taacutec kinh doanh hellipHọ cũng cần dữ liệu vagrave thocircng tin (vagrave kiến thức) từ nhiều nơi trecircn thế giới Caacutecnhoacutem ra quyết định phải giao tiếp cộng taacutec vagrave thương lượng trong cocircng việcHầu hết caacutec tổ chức sẽ nhanh trở thagravenh khocircng coacute chức năng nếu khocircng coacute caacutec hệthống giao tiếp Thương mại điện tử coacute thể hiệu quả chỉ qua caacutec kỹ thuật giao tiếphiện đại- Caacutec kỹ thuật thocircng tin hiện đại cung cấp caacutec phương tiện hỗ trợ giao tiếp rẻnhanh coacute khả năng coacute thể tin cậy Nền tảng hỗ trợ giao tiếp lagrave caacutec hệ thống maacuteytiacutenh mạng+ Bắt đầu bằng điện baacuteo điện thoại radio vagrave ti vi+ Trong 100 năm chuacuteng ta phaacutet triển maacutey fax thư điện tử chương trigravenh chatnhoacutem tin tức hệ thống hội nghị truyền higravenh Hầu hết caacutec kỹ thuật nagravey đềuhoạt động trecircn internet+ Sự phaacutet triển giao tiếp sau cugraveng lagrave hệ thống họp điện tử caacutec dịch vụ vagrave hệ
thống hội nghị điện tử thường sử dụng internet để kết nối caacutec người ra quyếtđịnh- Caacutec thuận lợi aacutep dụng caacutec phương phaacutep giao tiếp cải tiến trong caacutec tổ chức+ Cải tiến năng suất của nhacircn viecircn+ Liecircn quan đến nhiều người ra quyết định chiacutenh+ Khocircng quan tacircm nhiều đến đường biecircn giới địa lyacute+ Tạo nền văn hoacutea hợp taacutec nhất quaacuten+ Cải tiến chất lượng cuộc sống của nhacircn viecircnHỗ trợ cộng taacutec Maacutey tiacutenh hỗ trợ cộng taacutec- Khung thời giannơi chốn+ Sự hiệu quả của kỹ thuật tiacutenh toaacuten cộng taacutec phụ thuộc vagraveo vị triacute của caacutec thagravenhviecircn trong nhoacutem vagrave phụ thuộc vagraveo thời gian chia sẽ thocircng tin gởi vagrave nhận+ Chia sự giao tiếp thagravenh bốn ocirc vagrave tổ chức bốn ocirc dọc theo 2 chiều thời gian vagravenơi chốn1048713 Thời gian Khi gởi vagrave nhận thocircng tin hầu như đồng thời giao tiếp lagrave đồngthời Viacute dụ Điện thoại ti vi vagrave caacutec cuộc họp gặp mặt nhau Giao tiếp bấtđồng bộ xảy ra khi người nhận nhận thocircng tin ở thời điểm khaacutec thời điểmgởi thocircng tin đoacute1048713 Nơi chốn Người gởi vagrave người nhận coacute thể ở cugraveng phograveng hoặc khocircng+ Bốn ocirc lagrave1048713 Cugraveng thời giancugraveng nơi chốn Caacutec thagravenh viecircn gặp mặt nhau cugraveng một luacutecgiống như phograveng quyết định hoặc gặp mặt truyền thống1048713 Cugraveng thời giankhaacutec nơi chốn Caacutec thagravenh viecircn ở caacutec nơi khaacutec nhau nhưnggiao tiếp cugraveng nhau Viacute dụ hội nghị truyền higravenh (videoconferencing)1048713 Khaacutec thời giancugraveng nơi chốn Nhiều người lagravem việc theo ca Ca nagravey để lạithocircng tin cho ca khaacutec1048713 Khaacutec thời giankhaacutec nơi chốn Caacutec thagravenh viecircn ở caacutec nơi khaacutec nhau Caacutecthagravenh viecircn nagravey gởi vagrave nhận thocircng tin ở những lần khaacutec nhau
23Thực thi hệ DSSHệ thống hỗ trợ quản lyacute (MSS) khocircng phải luacutec nagraveo cũng luocircn thagravenh cocircng Nhiều trường hợpthất bại của ES khocircng hoagraven toagraven lagrave lyacute do kỹ thuật Thực thi hệ thống lagrave một quaacute trigravenh liecircn tụcnhằm đảm bảo cho tổ chức chuẩn bị tiếp nhận một hệ thống mới vagrave đưa hệ thống vagraveo sử dụngthagravenh cocircngThực hiện cocircng nghệ hệ thống hỗ trợ quản lyacute lagrave việc phức tạp vigrave caacutec hệ thống nagravey khocircng đơnthuần lagrave hệ thống thocircng tin chỉ thu thập thao taacutec vagrave phacircn phối thocircng tin Magrave xa hơn chuacuteng
liecircn quan tới caacutec cocircng việc coacute thể lagravem thay đổi đaacuteng kể caacutech thức hoạt động của tổ chức Tuyvậy đa số caacutec yếu tố thực thi đều liecircn quan tới hệ thống thocircng tinThực thi MSS lagrave quaacute trigravenh liecircn tục diễn ra trong suốt thời gian phaacutet triển hệ thống từ đề xuấtban đầu đến nghiecircn cứu khả thi thiết kế vagrave phacircn tiacutech hệ thống lập trigravenh huấn luyện chuyểnđổi vagrave lắp đặt Caacutec chuyecircn gia hệ thống thocircng tin thường gọi thực thi lagrave giai đoạn cuối trongvograveng đời hệ thống Định nghĩa thực thi MSS phức tạp hơn vigrave bản chất lặp của sự phaacutet triểncaacutec hệ thống
THỰC THI KHOcircNG HOAgraveN CHỈNHCaacutec quyết định về tiacutenh khả thi thường coacute giả định về lợi iacutech đạt được khi kế hoạch thực thiđược thực hiện hoagraven toagraven Trong thực tế thường chỉ thực hiện 90 thậm chiacute 70 phần trăm sovới phacircn tiacutech khả thi Lyacute do lagrave sự thay đổi tại một nơi trong hệ thống coacute thể ảnh hưởng vagrave coacutethể taacutec động tiecircu cực đến chỗ khaacutec Do vậy cấp quản lyacute coacute thể bỏ những phần trong dự aacuten coacutethể gacircy ra taacutec động xấu Do đoacute dự aacuten sẽ thực hiện iacutet hơn 100 so với dự aacuten kế hoạch Caacutec lyacutedo khaacutec coacute thể lagrave do khấu trừ ngacircn saacutech hoặc vượt chi phiacuteĐAacuteNH GIAacute SỰ THAgraveNH COcircNG CỦA THỰC THI HỆ THỐNGPhải coacute caacutec chỉ số đo lường thigrave mới coacute thể đaacutenh giaacute sự thagravenh cocircng khi thực thi một hệ thốngDickson va Powers (1973) đề ra 5 tiecircu chuẩn độc lậpbull Tỷ lệ thời gian thực hiện dự aacuten với thời gian ước lượngbull Tỷ lệ chi phiacute thực tế vagrave ngacircn saacutech thực hiệnbull Thaacutei độ của cấp quản lyacute đối với hệ thốngbull Nhu cầu thocircng tin của caacutec nhagrave quản lyacute được đaacutep ứng như thế nagraveo qua hệ thốngbull Taacutec động của dự aacuten đối với những hoạt động maacutey tiacutenh trong cocircng tyCaacutec đo lường khaacutec để đaacutenh giaacute thagravenh cocircng của hệ hỗ trợ quản lyacute (MSS)bull Sự sử dụng hệ thống (dự định dugraveng hoặc thực sự dugraveng)bull Thỏa matilden của người dugravengbull Thaacutei độ taacuten thagravenhbull Mức độ hệ thống hoagraven thagravenh caacutec mục tiecircu ban đầubull Phần thưởng đối với tổ chức (giảm chi phiacute tăng doanh thuhellip)bull Tỷ số lợi iacutech chi phiacute
bull Mức độ thể chế hoacutea của MSS trong tổ chứcDo bởi tiacutenh đa dạng của DSS necircn việc đaacutenh giaacute sự thagravenh cocircng của hệ nagravey cũng khoacute khăn tuynhiecircn cũng coacute thể coacute một số yếu tố giuacutep cho DSS thagravenh cocircng như sự tham gia người dugravenghuấn luyện người dugraveng hỗ trợ quản lyacute cấp cao nguồn thocircng tin đặc điểm của những nhiệmvụ coacute liecircn quan (cấu truacutec bất định độ khoacute phụ thuộc)
Chương5Nhoacutem hỗ trợ quyết định vagrave nhoacutemcocircng nghệ phần mềm
51Nhoacutem tạo quyết định
MDM-Holsapple đatilde gợi yacute chuacuteng ta sử dụng giới hạn người tạo quyết định
Một nhoacutem lagrave kết cấu MDM nơi magrave nhiều người ra quyết định hoagraven toagraven tương taacutec
Một đội lagrave kết cấu MDM nơi caacutec thagravenh viecircn tư vấn cho người đưa ra quyết định nhưng khocircng tương taacutec
Một Ủy ban lagrave kết cấu MDM với một người tạo quyết định duy nhất vagrave sự tương taacutec giữa caacutec thagravenh viecircn
Mạng thocircng tin
Mạng lưới baacutenh xe mỗi người tham gia coacute thể giao tiếp với người đưa ra quyết định ở trung tacircm nhưng khocircng phải với người tham gia khaacutecCấu truacutec nagravey lagrave khocircng thỏa matilden tất cả những người tham gia ngoại trừ người ra quyết định
Mạng dacircy chuyền Tham gia chuyển tiếp thocircng tin chỉ để noacute luocircn liền kề nhau trong chuỗi
Thagravenh viecircn cuối cugraveng ko được đaacutep ứng
Mạng vograveng trograven Tương tự như chuỗi nhưng kết thuacutec được kết nối
Mạng kết nối hoagraven toagraven khocircng coacute hạn chế về giao tiếp vagrave tương taacutec giữa caacutec thagravenh viecircnNoacutei chungnoacute đaacutep ứng hầu hết caacutec kết nối của người tham gia nhưng truyền đạt thocircng tin mất nhiều thời gian vagrave coacute nhiều cơ hội xảy ra lỗi
Nhoacutem hagravenh vi vagrave chuẩn mực
MDMs thiết lập caacutec chỉ tiecircu hướng dẫn quaacute trigravenh ra quyết định
Một chuẩn mực quy định cụ thể những gigrave thagravenh viecircn trong nhoacutem dự kiến sẽ lagravem trong những hoagraven cảnh nhất định
Quy tắc gửi coacute thể được thocircng qua viacute dụ đaacutenh giaacute ngang hagraveng hoặc xử phạt
Lagravem thế nagraveo để đưa ra quyết định
Việc chọn lựa magrave trong đoacute việc sử dụng cấu truacutec MDM phải được dựa trecircn một số yếu tố liecircn quan với bối cảnh quyết định
Viacute dụmột cấu truacutec riecircng lẻ sẽ lagravem việc nơi magrave quyết định được cấu truacutec cao vagrave thocircng tin lagrave coacute sẵn
Một ủy ban cơ cấu sẽ lagrave sự lựa chọn khi người ra quyết định khocircng thể đưa ra quyết định một migravenh
52Caacutec vấn đề thường gặp trong nhoacutem
Kiacutech thước Noacutei chung sự nhất triacute vagrave gắn kết giữa caacutec thagravenh viecircn tỉ lệ nghịch với phạm vi nhoacutem Trong nhoacutem lớn rất dễ higravenh thagravenh caacutec nhoacutem nhỏ vagrave hoạt động rời rạc
Tư duy tập thể Trong nhoacutem lớn mọi người coacute xu hướng suy nghĩ đểđạtđược sự nhất triacute necircn khocircng phaacutet huy được sự saacuteng tạo
Caacutec vấn đề về xatilde hội
Xung đột Trong 1 nhoacutem ai cũng muốn migravenh lagrave giỏi nhất necircn dễ dẫn đến xung đột
Ẩn danh(Giấu tecircn) Đacircy lagrave phương phaacutep được sử dụng để kiểm soaacutet xung đột Cho caacutec thagravenh viecircn tham gia ẩn danh
Vấn đề giới tiacutenh Nam vagrave nữ thường coacute những thế mạnh khaacutec nhau điều nagravey coacute thể lagrave sức mạnh trong 1 thiết lập MDM
Đagravem phaacuten vagrave quyết định
Một quyết định coacute thể liecircn quan đến nhiều quan điểm khaacutec nhau vigrave thế cần phải coacute sự đagravem phaacuten
Caacutec thiết kế của cơ chế hỗ trợ cho MDM phải phugrave hợp với caacutec hoạt độngđagravemphaacuten
Những hoạt động nagravey bao gồm việc thu nhận yacute kiến của caacutec thagravenh viecircn 1 caacutech cocircng bằng
53Cocircng nghệ hỗ trợ MDM
Organizational DSSndash 1 hệ thống cung cấp caacutec quyết định hỗ trợ
Group Support Systemndash Cocircng nghệ sử dụng sự hỗ trợ của nhiều becircn tham gia
Group DSS ndash Lagrave 1 hệ thống được thiết kế đặc biệt để hỗ trợ cho MDM
DSS ndash Lagrave 1 hệ thống dưới sự kiểm soaacutet của 1 người quyết định hệ thống nagravey cung cấp 1 bộ cocircng cụ giuacutep phacircn tiacutech hoagraven cảnh đểđưa ra quyết định vagrave nacircng cao hiệu quả của quyết địnhđoacute
53Cocircng nghệ hỗ trợ MDM
Organizational DSSndash 1 hệ thống cung cấp caacutec quyết định hỗ trợ
Group Support Systemndash Cocircng nghệ sử dụng sự hỗ trợ của nhiều becircn tham gia
Group DSS ndash Lagrave 1 hệ thống được thiết kế đặc biệt để hỗ trợ cho MDM
DSS ndash Lagrave 1 hệ thống dưới sự kiểm soaacutet của 1 người quyết định hệ thống nagravey cung cấp 1 bộ cocircng cụ giuacutep phacircn tiacutech hoagraven cảnh đểđưa ra quyết định vagrave nacircng cao hiệu quả của quyết địnhđoacute
Mục tiecircu của cocircng nghệ hỗ trợ MDM
Quy trigravenh hỗ trợ tập trung vagraveo quaacute trigravenh tạo điều kiện thuận lợi cho sự tương taacutec
Cơ chế cấu truacutec quaacute trigravenh chi phối caacutec hoạt động truyền thocircng
Nhiệm vụ hỗ trợ cocircng việc coacute thể chọn lựa tổ chức hoặc lấy thocircng tin
Nhiệm vụ cấu truacutec cocircng việc cho pheacutep truy cập đến kỹ thuật lọc kết hợp phacircn tiacutech kiến thức liecircn quan đến cocircng việc
Caacutec lớp loại cocircng nghệ hỗ trợ MDM
Phacircn loại theo đặc điểm do DeSanctis vagrave Gallupe đưa ra đề xuất một chương trigravenh ba cấp dựa trecircn caacutec tiacutenh năng được cung cấp
Hệ thống cấp 1 Mục điacutech chiacutenh lagrave tạo điều kiện thocircng tin liecircn lạc giữa caacutec thagravenh viecircn
Hệ thống cấp 2 Thiết kế để giảm thiểu rủi ro
Hệ thống cấp 3 Giuacutep điều chỉnh xử lyacute quyết định
Phacircn loại theo cocircng nghệ -Kraemer vagrave King tập trung vagraveo cocircng nghệ aacutep dụng
Cocircng nghệ bảng mạch điện tử
Hội nghị trực tuyến
Mạng lưới tập đoagraven
Trung tacircm thocircng tin
Mocirci trường cộng taacutec
Phograveng quyết định
Nhoacutem phần mềm
Phần mềm được thiết kế để hỗ trợ sự hợp taacutec bao gồm việc thu huacutet vagrave lưu trữ thocircng tin
Caacutec tổ chức dẫn đầu thị trường hiện tại lagrave Lotus Notes and Domino Microsoft Exchange Novell GroupWise and Oracle Office
Caacutec cocircng cụ trong một bộ phần mềm bao gồm người quản lyacute hội nghị (Lotus Sametime) vagrave trao đổi thocircng điệp (Lotus Notes Mail)
Xếp hạng phần mềm cho nhoacutem
Ellis vv đề xuất một hệ thống xếp hạng dựa vagraveo kiểu sự hỗ trợ noacute Cung cấp
Hệ thocircng điệp
Hệ thống hội thảo truyền higravenh
Hệ thống cộng taacutec soạn thảo
Nhoacutem phacircn phối giải phaacutep phần mền
Hệ thống phối hợp
Hệ thống thocircng minh đại diện
Lực lượng điều khiển phaacutet triển phần mềm cho nhoacutem
Một số nhacircn tố chiacutenh bao gồm
Tăng năng suất
Giảm số lượng caacutec cuộc họp
Tăng cường tự động hoacutea caacutec quy trigravenh lagravem việc thường xuyecircn
Cần phối hợp toagraven cầu tốt hơn
Tiacutenh sẵn sagraveng của những mạng lan rộng
Coleman vagrave Khanna liệt kecirc 10 nhacircn tố khaacutec
54Quản lyacute hoạt động MDM (Mobile Device Management - Quản lyacute thiết bị di động)
Một số phương phaacutep phối hợp phổ biến hơnMDM lagrave
Kỹ thuật nhoacutem định danh
Kỹ thuật Delphi
Sự phacircn xử
Hệ thocircng tin dựa trecircn vấn đề
Nemawashi
Kỹ thuật nhoacutem định danh
1-Mỗi người tham gia viết ra những yacute tưởng về những gigrave necircn quyết định
2-Lần lượt mỗi người tham gia trigravenh bagravey yacute tưởng của migravenh được ghi lại trecircn bảng Khocircng thảo luận ở đacircy
3-Sau khi tất cả caacutec yacute tưởng được trigravenh bagravey caacutec đại biểu coacute thể chất vấn những người khaacutec
4-Mỗi người tham gia bỏ phiếu cho mỗi yacute tưởng
Kỹ thuật Delphi
Về cơ bản tương tự như kỹ thuật nhoacutem định danh ngoại trừ những người khocircng bao giờ tham gia cuộc họp
Một cocircng cụ khảo saacutet được sử dụng để thu thập đầu vagraveo ban đầu từ caacutec thagravenh viecircn
Một cuộc khảo saacutet thứ hai được gửi đi với một bản toacutem tắt caacutec kết quả chung
Những bước lặp lại cho đến khi đạt được một sự đồng thuận hoặc nhigraven nhận của đa số
Sự phacircn xử(Arbitration )
Thiacutech hợp nhất khi caacutec thagravenh viecircn của MDM đại diện cho caacutec yếu tố đối lập
Những người tham gia đồng yacute rằng nếu lựa chọn thay thế hai becircn thỏa thuận khocircng được tigravem thấy thigrave một trọng tagravei viecircn becircn ngoagravei sẽ tham gia
Trọng tagravei sau đoacute lựa chọn thay thế ocircng hoặc xeacutet thấy thiacutech hợp nhất
Hệ thống thocircng tin dựa trecircn vấn đề (IBIS)
Lagrave một phương phaacutep lập luận cấu truacutec
Một đại diện cho IBIS lagrave một đồ thị với caacutec nuacutet vagrave caacutec liecircn kết
IBIS bắt đầu với lựa chọn của một nuacutet vấn đề gốc sau đoacute caacutec nuacutet vị triacute khaacutec nhau được liecircn kết với nuacutet gốc
Caacutec nuacutet vị triacute nagravey sau đoacute được đaacutenh giaacute dựa trecircn những lập luận gắn liền với chuacuteng
Nemawashi (được sử dụng rộng ratildei tại Nhật Bản)
1-Một hoặc nhiều thagravenh viecircn của MDM được chỉ định lagrave điều phối viecircnCaacutec điều phối viecircn sau đoacute chọn người tham gia cograven lại
2-Điều phối viecircn xacircy dựng một tổng hợp caacutec sự lựa chọn vagrave sau đoacute caacutec chuyecircn gia đaacutenh giaacute caacutec lựa chọn
3-Điều phối viecircn lựa chọn một sự lựa chọn dựa trecircn kết quả ở trecircn(ở 2)
4-Sự thay thế được luacircn chuyển điều phối viecircn tigravem kiếm sự đồng thuận thocircng qua sự thuyết phục vagrave đagravem phaacuten
5-Nếu đạt được sự đồng thuận điều phối viecircn cho lưu thocircng một tagravei liệu magrave mỗi thagravenh viecircn MDM để lại dấu hiệu trecircn đoacute
55Nơi lagravem việc ảo
Nhiều tổ chức trecircn toagraven thế giới kinh doanh bất động sản cho cocircng nghệ hợp taacutec
Cocircng việc được trở thagravenh một điều bạn lagravem hơn lagrave một nơi bạn đi
Những thay đổi lớn nhất mang lại bởi nơi lagravem việc ảo coacute thể lagrave về văn hoaacute hay xatilde hội hơn lagrave về cocircng nghệ
Chương 6 Hệ thống thocircng tin điều hagravenh
61 Yacute nghĩa của EIS- Hệ thống thocircng tin điều hagravenh
- EIS lagrave một dạng đặc biệt của DSS được thiết kế để hỗ trợ ra quyết định ở cấp cao nhất của một tổ chức
- Lagrave một hệ thống thocircng tin hỗ trợ nhu cầu lập kế hoạch vagrave đaacutenh giaacute của caacutec nhagrave quản lyacute điều hagravenh
- EIS coacute thể giuacutep một CEO coacute được bức tranh tổng thể chiacutenh xaacutec nhất về caacutec hoạt động vagrave một bản toacutem tắt những gigrave magrave đối thủ cạnh tranh đang lagravem
- Caacutec hệ thống nagravey noacutei chung hoạt động dễ dagraveng vagrave trigravenh bagravey thocircng tin theo những caacutech dễ hiểu để việc tiếp thu được nhanh choacuteng (biểu đồ đồ thịhellip)
(Tagravei liệu thecircm EIS lagrave những loại hệ thống lagrave rất phức tạp trong tự nhiecircn Coacute thể noacutei hệ thống nagravey cũng cung cấp cho caacutec nhagrave quản lyacute với caacutec thiết bị coacute khả năng ra quyết định bằng caacutech sử dụng của noacute Hệ thống nagravey hoạt động trong điều kiện như vậy quan trọng như trong caacutec hệ thống khaacutec khocircng hỗ trợ Khả năng lưu trữ dữ liệu nặng lagravem cho noacute lyacute tưởng để được thocircng qua khocircng chỉ bởi caacutec doanh nghiệp lớn magrave cograven bởi caacutec doanh nghiệp nhỏ hơn Nhigraven chung hệ thống nagravey lagrave dagravenh cho caacutec nhacircn viecircn cấp cao hỗ trợ thagravenh thạo trong việc đưa ra caacutec quyết định quan trọng)
Caacutec phiecircn EIS tiecircu biểu- Phiecircn lagravem việc coacute thể bắt đầu với một baacuteo caacuteo về tigravenh higravenh tagravei chiacutenh vagrave kinh
doanh của một cocircng ty caacutec chỉ số hoạt động quan trọng được hiển thị rotilde ragraveng- EIS sẽ cho pheacutep caacutec giaacutem đốc điều hagravenh coacute thể đi sacircu vagraveo dữ liệu từ những con
số bất kỳ magrave noacute hỗ trợ- Việc điều hagravenh coacute thể lựa chọn một mức độ chi tiết ( VD danh số baacuten hagraveng) nếu
như cần điều tra thecircm- Lagrave một phương phaacutep tiếp cận coacute thể giuacutep việc ra quyết định tốt hơn
Những điều magrave EIS ko coacute- EIS khocircng phải lagrave sự thay thế cho caacutec hệ thống dựa trecircn caacutec maacutey tiacutenh khaacutec EIS
thực sự chỉ cung cấp dữ liệu cho caacutec hệ thống nagravey- Noacute khocircng thể biến caacutec bộ hệ điều hagravenh của maacutey tiacutenh thagravenh những ldquochuyecircn viecircn
giỏirdquo- Coacute thể được viacute một caacutech cao hơn như lagrave một trợ lyacute đaacuteng tin cậy coacute thể được gọi
đến bất khi nagraveo vagrave mỗi khi cần thiết
Tagravei liệu thecircm Sự khaacutec nhau giữa EIS vagrave DSS+ EIS thiết kế để hỗ trợ những người điều hagravenh cấp cao giuacutep họ khaacutem phaacute caacutec vấn đề vagrave caacutec cơ hội DSS hỗ trợ những nười phacircn tiacutech cố gắng trả lời cacircu hỏi caacutei gigrave coacute thể lagravem cugraveng với một cơ hội hoặc một vấn đề
Chiều EIS DSSNhững người sử dụng thocircng thường
Duyệt dữ liệu đi xuống truy xuất trạng thaacutei
Hỗ trợ phacircn tiacutech vagrave quyết định
Sự thuacutec đẩy Tiacutenh thiacutech hợp Tiacutenh hiệu quảỨng dụng Queacutet mocirci trường đaacutenh giaacute
hiệu suất nhận dạng caacutec vấn đề vagrave caacutec cơ hội
Caacutec quyết định quản lyacute trecircn caacutec lĩnh vực đa dạng
Hỗ trợ quyết định Caacutec chiacutenh saacutech caacutec quyết định khocircng coacute cấu truacutec ở mức cao vagrave hỗ trợ giaacuten tiếp
Hỗ trợ caacutec quyết định lặp lại caacutec quyết định khocircng thể đoaacuten trước ra quyết định khocircng coacute cấu truacutec vagrave baacuten cấu truacutec
Loại thocircng tin Caacutec thocircng tin tin tức thocircng tin becircn ngoagravei về khaacutech hagraveng đối thủ cạnh tranh mocirci trường caacutec baacuteo caacuteo theo yecircu cầu vagrave định thời về caacutec hoạt động becircn trong
Caacutec thocircng tin hỗ trợ caacutec tigravenh huống đặc biệt
Sử dụng coacute nguyecircn tắc
Dograve theo vết vagrave điều khiển nhận dạng cơ hội
Hoạch định tổ chức phacircn nhoacutem vagrave điều khiển
Khả năng phugrave hợp với những người sử dụng caacute nhacircn
Thiết kế loại ra quyết định cho mỗi người điều hagravenh caacute nhacircn bằng nhiều lựa chọn đầu ra
Cho pheacutep caacutec đaacutenh giaacute caacute nhacircn caacutec khả năng what-if lựa chọn loại hộp hội thoại
Đồ họa Phải coacute Lagrave một phần quan trọng của nhiều DSS
Thacircn thiện người sử dụng
Phải coacute Phải coacute nếu khocircng coacute người sử dụng trung gian
Xử lyacute thocircng tin Lọc neacuten thocircng tin dograve theo vết dữ liệu vagrave thocircng tin quan trọng
EIS kiacutech thiacutech caacutec cacircu hỏi caacutec cacircu trả lời bằng caacutech sử dụng DSS vagrave phản hồi lại EIS
Hỗ trợ caacutec thocircng tin chi tiết
Truy xuất thường xuyecircn caacutec mức chi tiết của bất kỳ thocircng tin tổng hợp nagraveo (duyệt dữ
Coacute thể coacute trong DSS nhưng khocircng thường
liệu chi tiết)Cơ sở mocirc higravenh Caacutec chức năng coacute sẵn bị hạn
chếLagrave điểm cốt lotildei của DSS
Cấu truacutec Theo người baacuten sản phẩm hoặc theo caacutec chuyecircn gia hệ thống thocircng tin
Theo người sử dụng hoặc caacute nhacircn hoặc caacutec chuyecircn gia từ caacutec trung tacircm thocircng tin hoặc phograveng ban hệ thống thocircng tin
Phần cứng Mainframe caacutec trạm RISC mạng LANs hoặc caacutec hệ thống phacircn bố
Mainframe caacutec trạm RISC caacutec maacutey PC hoặc caacutec hệ thống phacircn bố
Bản chất caacutec goacutei phần mềm
Truy xuất tương taacutec dễ dagraveng đến nhiều cơ sở dữ liệu truy xuất trực tuyến caacutec khả năng DBMS phức tạp caacutec liecircn kết phức tạp
Caacutec khả năng tiacutenh toaacuten lớn caacutec ngocircn ngữ mocirc higravenh mocirc phỏng ứng dụng vagrave caacutec bộ tạo DSS
Bản chất caacutec thocircng tin
Trigravenh bagravey thocircng tin được phaacutet sinh trước về quaacute khứ vagrave hiện tại tạo caacutec thocircng tin mới về quaacute khứ hiện tại tương lai
Tạo thocircng tin mới về quaacute khứ hiện tại tương lai
62 Lịch sử EIS- EIS xuất hiện lần đầu tiecircn tại MIT vagraveo những năm 1970
- Những EIS đầu tiecircn được phaacutet triển bởi caacutec doanh ngiệp lớn sẵn sagraveng chấp nhận rủi ro để đạt được lợi thế cạnh tranh
- Vagraveo những năm 1980 caacutec nhagrave cung cấp đatilde phaacutet triển một số cơ sở khaacutech hagraveng rộng vagrave cocircng nghệ EIS được tiếp tục phaacutet triển cho đến ngagravey nay
(Tagravei liệu thecircm Sử dụng DSSEIS cho phaacutet triển bền vững + Một số nghiecircn cứu đatilde được tiến hagravenh để kiểm tra việc thực hiện của EIS trong khu vực cocircng cộng vagrave chiacutenh phủ caacutec nước tổ chức kể từ khi chuacuteng được phaacutet triển theo định hướng lợi nhuận cho caacutec cocircng ty tư nhacircn (Hasan vagrave Hasan năm 1997) Theo một nghiecircn cứu tiến hagravenh tại Mỹ ở hơn 300 cocircng ty kết quả cho thấy sự khaacutec biệt của EIS giữa tư nhacircn vagrave chiacutenh phủ một số kết quả thuacute vị được phaacutet hiệnViacute dụ khoacute khăn hơn để chuyển tiền từ một tagravei khoản khaacutec trong một EIS của chiacutenh phủ cũng lagrave khoacute khăn hơn để biện giải thiacutech cho những chi phiacute phaacutet triển EIS của chiacutenh phủ Một nghiecircn cứu khaacutec được tiến hagravenh ở Australia
cho thấy rằng EIS cung cấp cho quản lyacute một higravenh ảnh chiacutenh xaacutec hơn về tổ chức thực hiện vagrave cung cấp hỗ trợ cho caacutec lợi iacutech chiến lược cải thiện khocircng chỉ cho caacutec nhagrave quản lyacute nhưng cograven cho phần cograven lại của tổ chức Dựa trecircn caacutec hệ thống được thiết kế cho caacutec cocircng ty tư nhacircn với một caacutech rotilde ragravengxaacutec định mục tiecircu EIS lagrave thiacutech hợp cho caacutec tổ chức cocircng cộng hiện đại nhưng cần phải được linh hoạt hơn vagrave kết thagravenh chugravem một phạm vi rộng hơn khả năng vagrave phương tiện hơn so với khu vực tư nhacircn ban đầu theo định hướng sản phẩm (Hasan vagrave Hasan năm 1997) Điều nagravey coacute thể lagrave do thực tế rằng caacutec hoạt động khu vực cocircng lagrave bắt buộc coacute taacutec động rộng phải đaacutep ứng sự mong đợi duy nhất cocircng cộng thường coacute mục tiecircu mơ hồ vagrave macircu thuẫn iacutet quyền tự chủ vagrave kiểm soaacutet việc ra quyết định vagrave nhacircn viecircn lagrave khoacute khăn hơn (Watson vagrave Carte2000) + Toacutem lại EIS lagrave một khaacutei niệm thagravenh cocircng noacute phaacutet triển qua nhiều năm tuy nhiecircn EIS khắc phục khiếm khuyết của migravenh bằng caacutech tiến hagravenh nghiecircn cứu liecircn tục)
63 Tại sao những người điều hagravenh hagraveng đầu lại khaacutec nhau- Họ lagrave những doanh nghiệp theo định hướng coacute suy nghĩ
- Coacute một khoảng khocircng gian rộng để kiểm soaacutet
- Họ chịu traacutech nhiệm cho việc thiết lập chiacutenh saacutech
- Họ đại diện cho tổ chức mocirci trường becircn ngoagravei
- Hagravenh động của họ tạo ra những kết quả đaacuteng kể về tagravei chiacutenh vagrave con người
Tần số caacutec hoạt động điều hagravenh- Xử lyacute xaacuteo trộn 42
- Hoạt động kinh doanh 32
- Phacircn bổ nguồn lực 17
- Đagravem phaacuten 3
- Những điều khaacutec 6
Handling Disturbances 42
Entrepreneurial Activites 32
Resource Allocation 17
Negotiation 3
Other 6
Những thocircng tin điều hagravenh cần thiết- Quản lyacute xaacuteo trộn coacute thể yecircu cầu sự chuacute yacute xung quanh đồng hồ
- Hoạt động kinh doanh yecircu cầu điều hagravenh để dự đoaacuten những thay đổi trong mocirci trường
- Nhiệm vụ phacircn bổ tagravei nguyecircn yecircu cầu lựa chọn người quản lyacute vagrave caacutec nguồn lực hạn chế được triển khai
- Đagravem phaacuten yecircu cầu cập nhật thocircng tin từng phuacutet để coacute thể xacircy dựng được sự đồng thuận
Caacutec loại thocircng tin điều hagravenh- Hệ thống kế toaacuten coacute liecircn quan đến việc tiacutenh toaacuten thu nhập hoạt động cho caacutec lĩnh
vực cụ thể lagrave quan trọng hơn so với caacutec hệ thống kế toaacuten truyền thocircng- Thocircng tin về thị trường khaacutech hagraveng cung cấp giaacute trị trong việc quyết định chiến
lược- Caacutec thocircng tin cần thiết thường được truyền đi trecircn một số hệ thống maacutey tiacutenh vagrave
nằm trong toagraven tổ chức- Caacutec thocircng tin được sử dụng thường lagrave ngắn hạn vagrave dễ thay đổi
Phương thức để xaacutec định thocircng tin cần thiết
Rockart xaacutec định được năm phương thức cơ bản để xaacutec định thocircng tin cần thiết
- Phương thức dựa trecircn kết quả- Phương thức rỗng- Phương thức chỉ số khoacutea- Phương thức tổng hợp nghiecircn cứu- Phương thức dựa vagraveo nhacircn tố then chốt dẫn đến thagravenh cocircng
64 Thagravenh phần EIS
- Sản phẩm EIS đầu tiecircn được phaacutet triển để sử dụng trecircn maacutey tiacutenh cấu higravenh cao nhưng caacutec sản phẩm hiện nay nhằm mục tiecircu lagrave nền tảng ClientServer
- Những nền tảng linh hoạt hơn coacute thể thiacutech ứng với thay đổi trong tổ chức vagrave cocircng nghệ
- Sử dụng dữ liệu thời gian thực dẫn đến quyết định nhanh hơn nhiều thocircng tin hơn
Thagravenh phần phần cứng- Một EIS khocircng đogravei hỏi coacute phần cứng cụ thể hoặc duy nhất nagraveo- Chigravea khoacutea của vấn đề lagrave để đảm bảo rằng caacutec thagravenh phần của EIS tối ưu hoacutea vagrave
phugrave hợp với tagravei nguyecircn maacutey tiacutenh của tổ chức- Hệ thống nagravey phải được cấu higravenh để caacutec nguồn tagravei nguyecircn phugrave hợp với những
người điều hagravenh chuacuteng
Thagravenh phần phần mềm- Traacutei ngược với phần cứng phần mềm thường được chuyecircn mocircn hoacutea cao cho caacutec
bagravei toaacuten về miền- Sự chuyecircn mocircn hoacutea nagravey thường đạt được bằng caacutech sử dụng thagravenh phần off-the-
shelf cho toagraven bộ EIS vagrave caacutec mocirc-đun tugravey chỉnh để đaacutep ứng nhu cầu cụ thể- Lotus Notes lagrave một viacute dụ điển higravenh Noacute coacute thể được sử dụng một migravenh hoặc coacute
thể phục vụ becircn thứ ba mocirc-đun plug-in
Cocircng nghệ EIS hiện nay
Dobrzeniecki đề xuấtphacircn loạitừng cấptheo bachức năng- Loại 1 sản phẩm bao gồmmột bộ đầy đủcaacutec ứng dụngtừ mộtnhagrave cung cấp- Loại 2 sản phẩm đượcthựchiệnở phần đầu củacaacutecsản phẩmDSS đượcphaacutet triển
bởicugravengmộtnhagrave cung cấp- Loại 3 sản phẩmkết hợp với nhautheo bất kỳ số lượngthuộc sở hữu củacocircng ty
65 Xacircy dựng EIS
- Xacircy dựngmộtEISgiống nhưxacircydựngmột số hệ thống khaacutec củamocirc higravenh hệ thống thocircng tin
- Việcphaacutet triểncấu truacutecnecircn được theo dotildeitừ quaacute trigravenh thiết kế đến quaacute trigravenhthực hiện
- Tuy nhiecircn một dự aacuten phaacutet triển EIScoacute xu hướnglagrave thống nhấtvagraveyecircu cầu hỗ trợ caacutec nhagrave quản lyacute latildenh đạo
- Xacircy dựng một EIScoacute thểphaacutet hiện ra đượccaacutectigravenh huống khoacute khănmagravemột nhagrave phaacutet triển chưabao giờ gặp phải
Mocirc higravenh EIS
Khung phaacutet triển một EIS
- Watson et al đề nghị xacircy dựngkhung với ba thagravenh phần+ Caacutech tiếp cận tập trung vagraveo yếu tốcon người vagrave dữ liệu coacute liecircn quan đến EIS+ Quaacute trigravenh phaacutet triển cần sự linh hoạt vagrave tương taacutec+ Người sử dụng - hệ thống hộp thoại bao gồm một ngocircn ngữ hagravenh động để xử lyacute caacutec lệnh
Lợi iacutech của EIS- Dễ duy trigrave caacutec mục tiecircu coacute tổ chức- Dễ truy xuất thocircng tin- Cho pheacutep người sử dụng nacircng cao hiệu suất hơn
- Tăng chất lượng ra quyết định- Cung cấp sự cải tiến cạnh tranh- Tiết kiệm thời gian của người sử dụng- Tăng khả năng vagrave chất lượng giao tiếp- Cung cấp khả năng điều khiển tốt hơn trong tổ chức- Cho pheacutep tham gia caacutec vấn đề vagrave caacutec cơ hội- Cho pheacutep hoạch định- Cho pheacutep tigravem kiếm nguyecircn nhacircn của một vấn đề- Thảo matilden caacutec yecircu cầu của người điều hagravenh
Hạn chế của EIS vagrave 1 số sai lầm cần traacutenh
- Chi phiacute một cuộc khảo saacutetnăm1991 chothấychi phiacute phaacutet triểntrungbigravenh365000USDvớichi phiacute vận hagravenhhagraveng năm lagrave$200000 (EIS)
- Cocircng nghệ hạn chếEIScần phảiđượctiacutech hợp hoagraven toagravenvagraveokiếntruacuteccủadoanh nghiệphiện tại do đoacute noacutelagrave một thaacutech thứclớn đối vớithiết kế
- Hạn chế tổ chức cơ cấu tổ chứccoacute thể khocircng phugrave hợp
Sự hạn chế về tổ chức- Chương trigravenh nghị sự vagrave thời gian chệch EIS mocirc tả một phần việc thực hiện một
chương trigravenh nghị sự vagrave coacute thể dễ dagraveng đạt được sự tin cậy một caacutech chắc chắn- Đồng bộ hoacutea việc quản lyacute sự tin cậy đuacuteng luacutec đặc biệt baacuteo caacuteo EIS coacute thể phaacute
vỡ sự ổn định thiết lập caacutec chu trigravenh baacuteo caacuteo một caacutech tốt nhất- Sự bất ổn EIS phản ứng nhanh coacute thể gacircy ra việc taacutec động trở lại một caacutech
nhanh choacuteng dẫn đến sự thiếu ổn định trong tổ chức
Sự thất bại lagrave thay thế khocircng thể chấp nhận được- Một số yếu tố lagravem EIS thất bại
+ Thiếu sự hỗ trợ về mặt quản lyacute+ Vấn đề chiacutenh trị+ Thất bại của nhagrave phaacutet triển+ Lỗi về cocircng nghệ+ Giaacute cả+ Thời gian
66 Ra quyết định điều hagravenh trong tương lai vagrave EIS
- Coacute một vagravei điều kiện sẽ được hợp nhất cho việc chuyển đổi cocircng nghệ Trong đoacute một vagravei điều kiện coacute thể dễ dự đoaacuten Hai điều kiện magrave ta coacute thể thấy lagrave+ Phaacutet triển cocircng nghệ maacutey tiacutenh trong việc điều hagravenh sẽ tạo ra sự chuyển đổi được chấp nhận một caacutech dễ dagraveng hơn+ Mở rộng traacutech nhiệm điều hagravenh sẽ mở rộng nhu cầu thocircng tin
Tương lai của EIS- EIS thocircng minh Những tiến bộ trong cocircng nghệ AI sẽ được triển khai trong caacutec
EIS- EIS đa phương tiện Cơ sở dữ liệu đa phương tiện sẽ cho pheacutep tiacutech hợp văn bản
giọng noacutei vagrave higravenh ảnh trong tương lai- EIS thocircng tin Tương lai EIS sẽ mở rộng hơn trong việc sử dụng dữ liệu becircn
ngoagravei doanh nghiệp- EIS kết nối Giao tiếp với băng thocircng rộng cho pheacutep kết nối liecircn thocircng lớn hơn
Chương 7 HỆ CHUYEcircN GIA VAgrave TRIacute TUỆ NHAcircN TẠO
71 Caacutec khaacutei niệm
72 Triacute thocircng minh của triacute tuệ nhacircn tạo
73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia
74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia
75 Lợi iacutech vagrave hạn chế của hệ chuyecircn gia
71 Caacutec khaacutei niệm
Chuyecircn mocircn (Expertise) sự hiểu biết rộng trong 1 lĩnh vực hẹp
Hệ chuyecircn gia (Expert Systems)1 chương trigravenh maacutey tiacutenh sử dụng 1 tập caacutec luật dựa trecircn tri thức của con người để giải quyết caacutec vấn đề đogravei hogravei phải coacute sự chuyecircn mocircn
Một số hệ chuyecircn gia nổi tiếng
DENDRAL (Standford 1960s Edward Feigenbaum)
MYCIN (Standford1970s Edward Shortliffe)
PROSPECTOR (MIT 1979)
Triacute tuệ nhacircn tạo (Artificial Intelligence ndash AI)
Triacute tuệ nhacircn tạo một bộ phacircn của ngagravenh khoa học maacutey tiacutenh quan tacircm đến việc thiết kế caacutec hệ thống maacutey tiacutenh thocircng minh đoacute lagrave caacutec hệ thống đưa ra caacutec đặc điểm magrave từ đoacute chuacuteng ta liecircn hệ với sự thocircng minh trong hagravenh động của con người (Barr vagrave Feigenbaum 1981)
Mục điacutech của AI
Mục điacutech khoa học xaacutec định caacutec gợi yacute để giải thiacutech caacutec loại khaacutec nhau của triacute tuệ thực
Mục điacutech kỹ thuật giải quyết caacutec vấn đề trong thế giới thực
Triacute tuệ nhacircn tạo kế thừa nhiều yacute tưởng quan điểm kỹ thuật từ caacutec ngagravenh khoa học khaacutec
- Triết học
- Logic Toaacuten học
- Tiacutenh toaacuten
- Khoa học tacircm lyacute Khoa học nhận thức
- Sinh học Thần kinh học
- Tiến hoacutea
Caacutec lĩnh vực ứng dụng trong Triacute tuệ nhacircn tạo
Mạng nơ ron thần kinh (Neural Networks)
Tiacutenh toaacuten sự tiến hoacutea
(Evolutionary Computation)
Hệ chuyecircn gia (Expert Systems)
Kỹ thuật xử lyacute tiếng noacutei (Speech Processing)
Kỹ thuật xử lyacute ngocircn ngữ tự nhiecircn
(Natural Language Processing)
Lập kế hoạch (Planning)
Robot (Robotics)
Khoa học higravenh ảnh (Vision)
Caacutec kỹ thuật thocircng dụng dugraveng trong AI
Biểu diễn(Representation)
Học (Learning)
Caacutec luật (Rules)
Tigravem kiếm (Search)
72 Triacute thocircng minh của triacute tuệ nhacircn tạo
Con người suy diễn như thế nagraveo
Phacircn loại (Categorization)
Caacutec quy tắc cụ thể
Heuristics
Kinh nghiệm trước đoacute
Dự tiacutenh trước
Maacutey tiacutenh suy diễn như thế nagraveo
Lập luận dựa trecircn luật IF-THEN mocirc tả tri thức được matilde hoacutea dưới dạng caacutec luật
Caacutec khung (Frames) lagrave caacutec đại diện mocirc tả caacutec tigravenh huống giống nhau lagrave điển higravenh của một vagravei phacircn loại
Lập luận dựa trecircn caacutec trường hợp mocirc phỏng giải phaacutep trước đoacute cho một vấn đề hiện tại
Nhận dạng mẫu phaacutet hiện acircm thanh higravenh dạng hoặc caacutec chuỗi dagravei
Caacutec dạng khaacutec của Triacute tuệ nhacircn tạo
Học maacutey- mạng nơron vagrave giải thuật di truyền
Lập trigravenh tự động ndash lagrave những kỹ thuật tạo ra caacutec chương trigravenh để lagravem 1 nhiệm vụ riecircng biệt (cho pheacutep những người khocircng phải lagrave người lập trigravenh coacute thể lập trigravenh được)
Cuộc sống nhacircn tạo ndash nỗ lực để taacutei tạo caacutec hiện tượng sinh học trong caacutec hệ thống dựa trecircn maacutey tiacutenh
73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia(Expert Systems- ES)
Theo Jackson (1999) Một hệ chuyecircn gia lagrave một chương trigravenh maacutey tiacutenh mocirc tả vagrave suy diễn với tri thức của một vagravei lĩnh vực để giải quyết vấn đề hay đưa ra caacutec lời khuyecircn
Cấu truacutec cơ bản của ES được dựa theo cấu truacutec chung của DSS Sự khaacutec biệt chiacutenh giữa ES vagraveDSS lagrave hệ ES thu thập caacutec kiến thức từ những
chuyecircn gia trong lĩnh vực quan tacircmĐặc trưng của hệ chuyecircn gia Hiệu quả cao Thời gian trả lời thỏa đaacuteng Độ tin cậy cao Dễ hiểu
Giao diện người dugraveng trong ES
Thiết kế giao diện người dugraveng tập trung vagraveo caacutec yếu tố như dễ dagraveng sử dụngcoacute độ tin cậy cao giảm tải những khoacute khăn khi sử dụng
Thiết kế necircn coacute một số tương taacutec (đầu vagraveo kiểm soaacutet vagrave truy vấn)
Cấu tạo giao diện người dugraveng gồm coacute magraven higravenh cảm ứng bagraven phiacutem buacutet saacuteng lệnh thoại caacutec phiacutem chuyecircn dụng
Cơ sở tri thức (Knowledge Base)
Chứa đựng caacutec tri thức cụ thể miền thu được từ caacutec chuyecircn gia miền
Coacute thể chứa caacutec mocirc tả caacutec hagravenh vi giải quyết vấn đề caacutec ragraveng buộc caacutec heuristics
Thagravenh cocircng của một ES dựa trecircn tiacutenh đầy đủ vagrave tiacutenh chiacutenh xaacutec của cơ sở tri thức
Mocirc tơ suy diễn (Inference Engine)
Ở đacircy tri thức được đặt để sử dụng tạo ra caacutec giải phaacutep để giải quyết vấn đề
Mocirc tơ nagravey coacute khả năng thực hiện diễn dịch hoặc suy diễn dựa trecircn caacutec luật hay caacutec caacutec sự kiện
Đồng thời cũng coacute khả năng sử dụng caacutec suy diễn mờ hay khocircng chiacutenh xaacutec dựa trecircn xaacutec suất hay aacutenh xạ mẫu
Vograveng điều khiển suy diễn
1 Aacutenh xạ caacutec luật với caacutec sự kiện đatilde được cho
2 Chọn luật để thực hiện
3 Thực hiện luật bằng caacutech thecircm caacutec sự kiện được suy diễn ra vagraveo bộ nhớ lagravem việc
Chuỗi suy diễn (Chaining)
Suy diễn tiến (forward chaining) maacutey suy diễn bắt đầu từ dữ liệu ban đầu vagrave thực hiện việc suy luận để đưa ra caacutec kết luận cuối cugraveng
Suy diễn lugravei (backward chaining) maacutey suy diễn bắt đầu từ dữ liệu điacutech vagrave tigravem ra tri thức hỗ trợ cho dữ liệu điacutech đoacute
Viacute dụ suy diễn lugravei
R1 Nếu coacute A vagrave B thigrave suy ra coacute D
R2 Nếu coacute B thigrave suy ra coacute C
R3 Nếu coacute C vagrave D thigrave suy ra coacute E
Ta coacute E ta xem trong 3 luật R1 R2 R3 luật nagraveo coacute E ta thấy R3 chứa E đồng thời chứa C vagrave D Xeacutet tiếp trong 2 luật R1 R2 luật nagraveo chứa C vagrave D R2 chứa C R3 chứa D Từ đoacute ta coacute được caacutec tri thức hỗ trợ suy diễn vagrave kết luận lagrave nếu coacute A vagrave B thigrave sẽ coacute E Hay nếu A vagrave B đuacuteng thigrave sẽ coacute E
Viacute dụ suy diễn tiến
Giả sử coacute tập chứa 3 luật sau
R1 Nếu coacute A vagrave B thigrave suy ra coacute D
R2 Nếu coacute B thigrave suy ra coacute C
R3 Nếu coacute C vagrave D thigrave suy ra coacute E
Nếu ta coacute A vagrave B thigrave chuacuteng ta suy ra được D từ R1 vagrave suy ra C từ R2 Với D vagrave C đatilde được suy ra ở trecircn giờ chuacuteng ta suy ra được E từ R3
Viacute dụ thực tế
Giả sử muốn biết magraveu của một con vật nuocirci tecircn lagrave Fred biết rằng noacute kecircu ộp ộp vagrave ăn ruồi
Coacute tập 4 luật ban đầu như sau
R1 Nếu X kecircu ộp ộp vagrave ăn ruồi thigrave X lagrave con ếch
R2 Nếu X kecircu chiecircm chiếp vagrave biết hoacutet thigrave X lagrave con chim
R3 Nếu X lagrave con ếch thigrave X coacute magraveu xanh
R4 Nếu X lagrave con chim thigrave X coacute magraveu vagraveng
74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia
Expert system shells lagrave một tập caacutec goacutei phần mềm vagrave caacutec cocircng cụ dugraveng để phaacutet triển caacutec hệ chuyecircn gia
Những Expert system shells đầu tiecircn thường rất rườm ragrave Mặc dugrave vậy noacute vẫn giuacutep cho người sử dụng sẽ khocircng phải bắt đầu lại từ đầu khi xacircy dựng một hệ chuyecircn gia mới
Những shell hiện đại bao gồm hai mocirc-đun chiacutenh lagrave cocircng cụ xacircy dựng một tập quy tắc vagrave mocirc tơ suy diễn
Xacircy dựng hệ chuyecircn gia
Bước 1 xacircy dựng mocirc higravenh bagravei toaacuten xaacutec định vấn đề nhiệm vụ magrave hệ thống sẽ thực hiện Caacutec dạng bagravei toaacuten cần hệ chuyecircn gia
Bagravei toaacuten diễn giải (InterPretation)
Bagravei toaacuten dự baacuteo (Prediction)
Bagravei toaacuten chuẩn đoaacuten (Diagnose)
Bagravei toaacuten gỡ rối (Debugging)
Bagravei toaacuten thiết kế
Tương tự như một dự aacuten phần mềm để xacircy dựng một hệ chuyecircn gia cần phải coacute caacutec yếu tố về nhacircn lực tagravei nguyecircn vagrave thời gian Những yếu tố nagravey ảnh hưởng đến giaacute thah của một hệ chuyecircn giaTrong phần nagravey cacircu hỏi thường được đặt ra lagrave tại sao cần phải xacircy dựng một hệ chuyecircn giaTrước khi bắt đầu phải xaacute định rotilde bagravei toaacuten đạt ra lagrave jiAi lagrave chuyecircn giaAi lagrave người sử dụng
1 Diễn giải (InterPretation) Nghiecircn cứu 1 vấn đề -gt Dựa trecircn những biểu hiện thuộc tiacutenh đặc trưng becircn ngoagravei -gt Tư vấn
(hoặc đưa ra kết luận hay mocirc tả dễ hiểu từ tập dữ liệu thocirc)
2 Bagravei toaacuten dự baacuteo (Prediction) Coacute thể dự đoaacuten được hagravenh vi kết quả dựa trecircn caacutec hiện tượng -gt dự baacuteo
VD Dự baacuteo thời tiết động đấthellip
3 Bagravei toaacuten chẩn đoaacuten (Diagnoss) Xaacutec định caacutec lỗi caacutec bộ phận hỏng hoacutec của hệ thống dựa trecircn caacutec dữ liệu quan saacutet được
4 Bagravei toaacuten gỡ rối (Debugging) Mocirc tả caacutec phương phaacutep khắc phục hệ thống khi gặp sự cố
5 Bagravei toaacuten thiết kế Lựa chọn cấu higravenh caacutec đối tượng nhằm thoả matilden một số ragraveng buộc nagraveo đoacute
6 Giảng dạy Phần mềm dạy học coacute thể chuẩn đoaacuten vagrave sủa lỗi của học sinh trong quaacute trigravenh học tập
Để xaacutec định đuacuteng bagravei toaacuten magrave chuacuteng ta cần giải quyết thigrave phải trả lời đc một số cacircu hỏi
- cần hệ chuyecircn gia
Bước 2 thu thập tri thức lựa chọn cocircng cụ vagrave aacutep dụng
Trong bước thu thập tri thức vấn đề quan trọng lagrave lựa chọn chuyecircn gia những người magrave sẽ đoacuteng goacutep tri thức cho hệ thống Thocircng thường trong suốt quaacute trigravenh phaacutet triển thigrave chuyecircn gia được xem như một thagravenh viecircn của đội phaacutet triển
Hiện nay coacute rất nhiều cocircng cụ để xacircy dựng một hệ chuyecircn gia Phổ biến nhất lagrave JESS CLIPS vagrave OPS5
Bước 3 Thiết kế cơ sở tri thức thiết kế hệ thốngTri thức được biểu diễn trường minh trong cơ sở tri thức
Caacutec chuyecircn gia vagrave kỹ sư tri thức sẽ đối thoại với nhau bằng caacutec kỹ thuật đối thoại Suy diễn (SD) bảng Mocirc higravenh hoacutea SD quy nạp phacircn loại
Vấn đề bagraveo trigrave vagrave phaacutet triển
Caacutec hệ chuyecircn gia đogravei hỏi phải bảo trigrave vagrave phaacutet triển nhiều hơn so với caacutec hệ thống khaacutec Phải thường xuyecircn bổ sung tri thức mới vagrave thay đổi caacutec tri thức cũ để đổi mới hệ chuyecircn gia
Thu thập vagrave khắc phục lỗi do người sử dụng phaacutet hiện để kịp thời khắc phục những sai soacutet của hệ chuyecircn gia
75 Lợi iacutech vagrave hạn chế của caacutec hệ chuyecircn gia
Một số lợi iacutech chiacutenh
Thời gian trả lời hợp lyacute bằng hoặc nhanh hơn so với chuyecircn gia (người) để đi đến cugraveng một quyết định Hệ chuyecircn gia lagrave một hệ thống thời gian thực (real time system)
Khả năng trả lời với mức độ tinh thocircng bằng hoặc cao hơn so với chuyecircn gia (người) trong cugraveng lĩnh vực
Hệ chuyecircn gia giuacutep cho hiệu quả lagravem việc tăng bằng việc sử dụng tập caacutec luật một caacutech nhanh choacuteng magrave ko bị nhầm lẫn chuyecircn gia lagrave người coacute thể quecircn đi một số tri thức cơ sở lyacute luậ nhưng HCG thigrave ko
Quyết định của một người chuyecircn gia coacute thể bị thay đổi vagrave ko coacute tiacutenh thống nhất như quyết định của một hệ chuyecircn gia tạo ra
Hệ chuyecircn gia giuacutep cho người sử dụng coacute thể trau dồi sự hiểu biết trecircn lĩnh vuej cụ thể magrave noacute giải quyết hỗ trợ người ra quyết định coacute trigravenh độ như 1 chuyecircn gia trong quaacute trigravenh gia quyết định
Kiến thức của rất nhiều chuyecircn gia về một lĩnh vực nagraveo đoacute được đưa vagraveo hệ chuyecircn gia lagravem cho CSTT cuat HCG phong phuacute vagrave rộng lớn hơn rất nhiều
HCG giải thiacutech caacutec bước suy luận một caacutech dễ hiểu nhất quaacuten luacutec nagraveo cũng coacute thể sử dụng ko như chuyecircn gia con người
Hạn chế của caacutec hệ chuyecircn gia
Nhược điểm lớn nhất của hệ chuyecircn gia lagrave những yacute kiến chuyecircn mocircn thường rất khoacute matilde hoacutea vagrave giải neacuten
Hệ chuyecircn gia khocircng coacute khả năng tự học tự cập nhật kiến thức mới như caacutec chuyecircn gia magrave cần phải được matilde hoacutea lại khi noacute được cập nhật
Hệ chuyecircn gia khocircng thể nhận ra được vấn đề khocircng nằm trong miền kiến thức của hệ thống
Chương 8 Tri thức vagrave tiếp nhận
1 Bao gồm caacutec vấn đề
Dữ liệu thực tế đo lường hoặc quan saacutet coacute hoặc khocircng coacute bối cảnh
Thocircng tin dữ liệu được tổng hợp một caacutech hữu iacutech để giải quyết những khoacute khăn trong việc đưa ra quyết định
Tri thức bao gồm caacutec ứng dụng quy tắc thocircng tin hướng dẫn của người ra quyết định
2 Những caacutei nhigraven về tri thức
Đại diện lagravem thế nagraveo để diễn tả tri thức viacute dụ như một quyển saacutech khocircng phải lagrave tri thức nhưng noacute lại lagrave một đại diện của tri thức
Sản xuất tri thức lagrave một tập hơp của hagraveng tồn kho coacute thể được sản xuất cũng như mua lại
Tri thức lagrave 1 trong 6 trạng thaacutei của hệ thống
1Dữ liệu 2Thocircng tin 3Cấu truacutec thocircng tin 4Sự thấu hiểu 5Yacute kiến 6 Quyết định
3 Caacutec loại tri thức Phổ biến mocirc tả dữ liệu thocircng tin thủ tục mọi thứ lagravem như thế nagraveo lập luận chiacutenh saacutech hoặc caacutec quy tắc
4 Thu thập Tri thức hệ chuyecircn gia Hầu hết caacutec phương phaacutep đều bắt đầu với mocirc higravenh của caacutec taacutec vụ trong đoacute
hệ chuyecircn gia được xacircy dựng Trong đoacute mocirc tả về caacutec lĩnh vực được tạo ra Caacutec kỹ sư sử dụng caacutec mocirc higravenh giả thuyết vagrave nhận thức về quaacute trigravenh phacircn
tiacutech để gợi ra caacutech giải quyết vấn đề về tri thức từ caacutec chuyecircn gia
5 Caacutec chiều của thu thập tri thức KE- driven caacutec kỹ sư trao đổi trực tiếp với caacutec chuyecircn gia Expert-driven Caacutec chuyecircn gia trực tiếp đưa chuyecircn mocircn của họ vagraveo hệ
thống maacutey tiacutenh Machine-driven Sử dụng caacutec cocircng cụ suy luận để triacutech xuất tri thức từ một
tập caacutec viacute dụ
6 Kỹ thuật thu thập tri thức Trao đổi gồm 2 loại cơ bản lagrave coacute cấu truacutec(coacute kịch bản) vagrave khocircng coacute cấu
truacutec( đối thoại trực tiếp) Giao thức phacircn tiacutech bằng lời Khi caacutec chuyecircn gia thực hiện một cocircng việc
của họ thigrave một bản ghi về cocircng việc đoacute được thực hiện Caacutec kỹ sư sẽ xacircy dựng mocirc higravenh cho những gigrave được ghi lại trong bản ghi
Phương phaacutep sagraveng lọc caacutec chuyecircn gia so saacutenh caacutec nhoacutem liecircn tiếp trong ba đối tượng vagrave cho biết tại sao nhoacutem thứ hai lại khaacutec nhoacutem thứ ba
7 Thu thập tri thức từ nhiều nguồn Thu thập tri thức từ nhiều nguồn lagrave cần thiết để coacute được đầy đủ caacutec tri thức
cho một vấn đề quan điểm yacute kiến traacutei ngược nhau thường phaacutet sinh Phương phaacutep đồng thuận sẽ giuacutep giải quyết được vấn đề macircu thuẫn Kỹ thuật phacircn tiacutech Meta lagrave kỹ thuật được aacutep dụng trong caacutec trường hợp
khaacutec Caacutech tiếp cận bằng định lượng đogravei hỏi caacutec kỹ sư cần cacircn nhắc yếu tố đầu vagraveo của caacutec chuyecircn gia khaacutec nhau
8 Xaacutec nhận hợp lệ vagrave kiểm tra tri thức Một khi thu thập tri thức noacute phải được đaacutenh giaacute về khả năng sử dụng vagrave độ
chiacutenh xaacutec Hai vấn đề cụ thể lagrave hiệu lực của những kiến thức vagrave kiểm tra việc xacircy dựng cơ sở của tri thức
Cần xaacutec nhận xem liệu hệ thống coacute thể hoạt động ở mức độ tối thiểu khocircng
Xaacutec minh liecircn quan đến việc so saacutenh từng chi tiết kỹ thuật của hệ thống những gigrave đatilde được thực hiện cuối cugraveng
9 Một số caacutec biện phaacutep xaacutec nhận Độ chiacutenh xaacutec Khả năng thiacutech nghi Mức độ đầy đủ Bề rộng Độ sacircu Hiệu lực Tổng quan Chiacutenh xaacutec Hiện thực Độ tin cậy Tiacutenh hữu dụng Mức độ
Chương 9 Học maacutey
1 Logic mờ vagrave ngocircn ngữ mờ(Fuzzy Logic and Linguistic Ambiguity)
Ngocircn ngữ tự nhiecircn gồm những khaacutei niệm mơ hồ vagrave khocircng chiacutenh xaacutectruyền tải ngữ nghĩa thocircng qua tiacutenh xấp xỉkhocircng rotilde ragraveng
Những xấp xỉ nagravey giuacutep con người coacute thể truyền tải hết được yacute nghĩa nhưng maacutey thigrave khocircng hiểu
Lagravem sao biểu diễn caacutec tri thức sử dụng caacutec khaacutei niệm khocircng rotilde ragraveng(mờ) hoặc khocircng chiacutenh xaacutec
2 Khaacutei niệm cơ bản của logic mờ tập mờ lagrave những tập hợp khocircng coacute một giới hạn rotilde Mỗi phần tử của noacute chỉ
chứa một mức độ hagravem liecircn thuộc của từng phần tử Vigrave vậy tập mờ khocircng giống như tập cổ điển Tập mờ coacute thể kết hợp với nhau qua những luật mờ magrave đặc trưng cho những hagravenh động trạng thaacutei vagrave thuộc tiacutenh của logic mờ được tận dụng khi thực hiện một bộ điều khiển mờ
Logic mờ dựa trecircn yacute tưởng mỗi phần tử thuộc vagraveo một tập hợp ở một mức độ nagraveo đấy
Locircgic mờ cho pheacutep độ liecircn thuộc (microA )coacute giaacute trị trong khoảng (01) Locircgic mờ coacute thể được coi lagrave mặt ứng dụng của lyacute thuyết tập mờ để xử lyacute caacutec
giaacute trị trong thế giới thực cho caacutec bagravei toaacuten phức tạp
3 So saacutenh tiacutenh đuacuteng đắn logic mờ vagrave xaacutec suất Xaacutec suất thigrave đề cập đến khả năng xảy ra một biến cố hay một điều gigrave đoacute Logic mờ đề cập đến cấp độ magrave đặc tiacutenh ở hiện tại
o viacute dụ1 người coacute chiều cao 6 feet thigrave coacute cấp độ lagrave 05 về chiều cao
4 Ưu điểm của logic mờ Caacutech tiếp cận rất tự nhiecircnkhocircng phức tạp Coacute thể mocirc higravenh hoacutea caacutec hagravem phi tuyến tugravey yacute phức tạp
Coacute thể tận dụng được kinh nghiệm từ những chuyecircn gia hagraveng đầu trong mọi lĩnh vực
Logic mờ được xacircy dựng dựa trecircn ngocircn ngữ tự nhiecircnNền tảng của logic mờ lagrave dựa trecircn cơ sở giao tiếp của con người
5 Nhược điểm của logic mờ Trong 1 hệ thống phức tạpsử dụng logic mờ coacute thể trở thagravenh trở ngại cho
việc xaacutec thực độ tin cậy của hệ thống Cơ chế lập luận mờ khocircng thể học hỏi từ những lỗi sai
6 Mạng noron nhacircn tạo(ANN) Mạng noron nhacircn tạo lagrave một mocirc phỏng xử lyacute thocircng tinđược nghiecircn cứu ra
từ hệ thống thần kinh của sinh vậtgiống như bộ natildeo để xử lyacute thocircng tin ANNs lagrave chương trigravenh dựa trecircn maacutey tiacutenh đơn giản coacute chức năng lagrave một mocirc
higravenh bagravei toaacuten khocircng gian dựa trecircn thử nghiệm vagrave baacuteo lỗi
7 Học từ kinh nghiệm Tiến trigravenh Một mẫu dữ liệu được biểu diễn như một mạng lưới noronANN ldquodự
đoaacutenrdquo 1 đầu radự đoaacuten được so saacutenh với giaacute trị thực tế hoặc giaacute trị chiacutenh xaacutecNếu đoaacuten được chiacutenh xaacutec thigrave khocircng coacute hagravenh động nagraveo được thực hiện
Nếu dự đoaacuten sai ANN kiểm tra lại vagrave xaacutec định lại thocircng số để điều chỉnh Một mẫu dữ liệu khaacutec được biểu diễn vagrave quaacute trigravenh nagravey được lặp lại
8 Nguyecircn tắc cơ bản của cocircng nghệ nơron Caacutec yếu tố xử lyacute cơ bản trong hệ thống thần kinh của con người lagrave tế bagraveo
thần kinhMạng lưới của tế bagraveo nagravey lagrave liecircn kết với nhau nhận được thocircng tin từ caacutec cảm biến trong mắt taihellip
Thocircng tin nhận được bởi tế bagraveo thần kinh hoặc lagrave sẽ kiacutech thiacutech noacute(sẽ được chuyển qua 1 thocircng điệp dọc theo mạng lưới) hoặc lagrave sẽ ngăn cản noacute(ngăn cản dograveng thocircng tin)
Độ nhạy coacute thể thay đổi qua thời gian hoặc sau khi coacute được kinh nghiệm
9 Cấu truacutec mạng Một ANN gồm 3 lớp cơ bản
Lớp đầu vagraveo nhận dữ liệu Lớp becircn trong hoặc lagrave lớp ẩn xử lyacute dữ liệu Lớp đầu ra chuyển tiếp kết quả cuối cugraveng của mạng
10Mạng nơ ron Thường coacute nhiều đầu vagraveo mỗi đầu vagraveo với mức ảnh hưởng vagrave tầm quan
trọng riecircng của noacute Một đầu vagraveo quan trọng coacute thể được sử dụng để khuếch đại đầu ra caacutec hagravem trạng thaacutei tổng hợp caacutec trọng số của caacutec yếu tố
đầuvagraveo khaacutec nhauvagraveo một giaacute trị duy nhất Caacutec hagravem chuyển giao xử lyacute caacutec giaacute trị trạng thaacutei vagrave tạo đầu ra
11Huấn luyện mạng nơ ron Trong mocirc higravenh coacute giaacutem saacutetANN được đến so saacutenh dự đoaacuten của chiacutenh
noacute với thocircng tin phản hồi coacute chứa caacutec kết quả mong muốn ANN sẽ phải tigravem caacutech thay đổi caacutec tham số becircn trong củamigravenh (caacutec trọng số vagrave caacutec ngưỡng) để tạo necircn một aacutenh xạ coacute khả năng aacutenh xạcaacutec đầu vagraveo thagravenh caacutec đầu ra mong muốn Sự thay đổi nagravey được tiến hagravenh nhờ việc so saacutenh giữa đầu ra thực sự vagrave đầu ra mong muốn
Trong mocirc higravenh khocircng coacute giaacutem saacutetANN nhận được dữ liệu vagraveo nhưng khocircng phải coacute bất kỳ thocircng tin phản hồi về kết quả mong muốn
Phần lớn caacutec ứng dụng nằm trong vugraveng của caacutec bagravei toaacuten ước lượng như mocirc higravenh hoacuteathống kecirc neacuten lọc phacircn cụm
12Lợi iacutech Liecircn kết với mạng noron Traacutenh caacutech lập trigravenh tường minh Giảm nhu cầu của chuyecircn gia ANNs thigrave thiacutech nghi với caacutec yếu tố đầu vagraveo thay đổi Khocircng cần thiết cho cơ sở tri thức tinh chế ANNs coacute tiacutenh động vagrave cải thiện với việc sử dụng Coacute khả năng xử lyacute dữ liệu khocircng chiacutenh xaacutec hoặc khocircng đầy đủ Cho pheacutep tổng quaacutet hoacutea từ thocircng tin cụ thể Cho pheacutep thu thập cảm giaacutec thocircng thường vagraveo miền giải quyết vấn đề
13Hạn chế của việc liecircn kết với mạng noron ANNs khocircng thể giải thiacutech được suy luận Bản chất hộp đen thường khiến cho vấn đề traacutech nhiệm vagrave độ tin cậy phaacutet
sinh lagrave khoacute khăn Lặp đi lặp lại quaacute trigravenh huấn luyện rất tốn thời gian Nguồn lực caacutec nhagrave phacircn tiacutech vagrave thiết kế coacute tay nghề cao vẫn lagrave đaacuteng lo
ngại Cocircng nghệ ANN thuacutec đẩy hạn chế của phần cứng hiện tại ANN yecircu cầu phải coacute sự tin tưởng ở đầu ra
14Giới thiệu về thuật toaacuten di truyền Cũng như mạng lưới thần kinh caacutec thuật toaacuten di truyền được dựa trecircn lyacute
thuyết sinh học Thuật toaacuten di truyền tigravem thấy nguồn gốc của chuacuteng trong caacutec lyacute thuyết
tiến hoacutea của chọn lọc tự nhiecircn vagrave thiacutech ứng với biến đổi khiacute hậu Kết quả thuật toaacuten di truyền lagrave từ giao phối 2 caacute thể trong quần thế để tạo
ra con caacutei đocirci khi tốt hơn so với bậc cha mẹ của chuacuteng 15Caacutec thagravenh phần cơ bản của thuật toaacuten di truyền
Toaacuten tử chọn lọc Caacutec caacute thể tốt được chọn lọc để đưa vagraveo thế hệ sau Sự chọn lọc nagravey căn cứ vagraveo độ thiacutech nghi với mocirci trường của mỗi caacute thể
Toaacuten tử lai gheacutep (crossover) Hai caacute thể cha vagrave mẹ trao đổi caacutec gen với nhau để tạo ra caacute thể con
Toaacuten tử đột biến (mutation) Một caacute thể thay đổi một số gen để biến đổi thagravenh một caacute thể mớiTất cả caacutec toaacuten tử trecircn khi thực hiện đều mang tiacutenh ngẫu nhiecircn
16Quaacute trigravenh cơ bản của một thuật toaacuten di truyền Khởi tạo
Đaacutenh giaacute quần thể
Lựa chọn NST thiacutech hợp nhất vagrave loại bỏ NST yếu nhất
Quy trigravenh giao nhau vagrave cải thiện quần thể
đột biến tiến trigravenh để khaacutem phaacute ra NST mới
17Ưu nhược điểm của việc kết hợp với thuật toaacuten di truyền Kiacutech thước quần thể lagrave 1 yếu tố quan trọng trong tốc độ của việc tigravem
kiếmnhưng noacute tương đối dễ dagraveng để dự đoaacuten tốc độ nagravey Giao nhau hoặc đột biến lagrave khocircng necircn đc sử dụng quaacute thường xuyecircn Luocircn coacute được iacutet nhất 1 giải phaacutep hợp lyacute Necircn coacute thể aacutep dụng chuacuteng cho caacutec vấn đề magrave chuacuteng ta khocircng coacute hướng
về caacutech giải quyết Sức mạnh của thuật toaacuten xuất phaacutet từ khaacutei niệm đơn giảnkhocircng phải từ
một thủ tục thuật toaacuten phức tạp 18Tương lai của học maacutey
Mạng lưới thần kinh nhacircn tạo vượt quaacute năng lực của con người trong caacutec trường hợp bị cocirc lập
Về mặt lyacute thuyếtmột maacutey tiacutenh coacute thể xử lyacute dũ liệu nhanh hơn hagraveng triệu lần so với 1 con người
May mắn thay cho chuacuteng tacon người tốt hơn nhiều khi magrave coacute được dữ liệumaacutey tiacutenh khocircng coacute 1 số thứ như lagrave 5 giaacutec quan
CHƯƠNG 10 KHO DỮ LIỆU
1 Kho dữ liệu Kho dữ liệu lagrave tuyển tập caacutec cơ sở dữ liệu tiacutech hợp hướng chủ đề được
thiết kế để trợ giuacutep cho một hệ hỗ trợ quyết định
Theo John Ladley Cocircng nghệ kho dữ liệu lagrave tập caacutec phương phaacutep kỹ thuật vagrave caacutec cocircng cụ coacute thể kết hợp hỗ trợ nhau để cung cấp thocircng tin cho người sử dụng trecircn cơ sở tiacutech hợp từ nhiều nguồn dữ liệu nhiều mocirci trường khaacutec nhau
Kho dữ liệu thường rất lớn tới hagraveng trăm GB hay thậm chiacute hagraveng Terabyte
2 Kho dữ liệu vận hagravenh (ODS) Một kho dữ liệu vận hagravenh Aacutep dụng kỹ thuật kho dữ liệu vagraveo caacutec hệ xử
lyacute giao taacutec lưu trữ dữ liệu cho một ứng dụng đặc thugrave Noacute đưa vagraveo kho dữ liệu một dograveng caacutec dữ liệu thocirc được thiết kế
3 So saacutenh
Kho dữ liệu vận hagravenh Kho dữ liệu
Dữ liệu theo chủ đề Dữ liệu theo chủ đề
Dữ liệu tiacutech hợp Dữ liệu tiacutech hợp
Dữ liệu thay đổi Dữ liệu khocircng thay đổi
Dữ liệu được cập nhật khi thay đổi
Dữ liệu giữ nguyecircn
Chỉ coacute dữ liệu hiện tạiDữliệu hiện tại vagrave dữ liệu lịch sử
Chu kỳ lagravem tươi dữ liệu ngắn Chu kỳ lagravem tươi dữ liệu dagravei
Chỉ coacute dữ liệu chi tiết Dữ liệu chi tiết vagrave dữ liệu tổng kết
Dugraveng cho caacutec quyết định ngắn hạn
Dugraveng cho hoạch định dagravei hạn
4 Kho dữ liệu cục bộ (Data Mart - DM)
Kho dữ liệu cục bộ lagrave CSDL coacute những đặc điểm giống với kho dữ liệu nhưng với quy mocirc nhỏ hơn vagrave lưu trữ dữ liệu về một lĩnh vực một chuyecircn ngagravenh
Data mart phụ thuộc Chứa những dữ liệu được lấy từ DW vagrave những dữ liệu nagravey sẽ được triacutech lọc vagrave tinh chế tiacutech hợp lại ở mức cao hơn để phục vụ một chủ đề nhất định của Datamart
Data mart độc lập Khocircng giống như Datamart phụ thuộc Data mart độc lập được xacircy dựng trước DW vagrave dữ liệu được trực tiếp lấy từ caacutec nguồn khaacutec nhau
5 Siecircu dữ liệu Metadata lagrave dữ liệu để mocirc tả dữ liệu Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột
một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi Metadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu
6 Mocirci trường kho dữ liệu Hệ thống của tổ chức vagrave kho cung cấp dữ liệu để xacircy dựng kho dữ liệu Trong quaacute trigravenh chuyển dữ liệu từ caacutec nguồn khaacutec nhau dữ liệu coacute thể
được lagravem sạch hoặc chuyển đổi vagrave vigrave thế DW được xem như lagrave một chuẩn cho việc lưu trữ
Đồng thời siecircu dữ liệu được ghi lại Cuối cugraveng DW hoặc siecircu thị coacute thể được sử dụng để tạo ra một kho dữ
liệu ldquocaacute nhacircnrdquo 7 Caacutec đặc điểm của kho dữ liệu
Đặc điểm Mocirc tả
Hướng chủ đề - DL tổ chức theo caacutech thức người dugraveng tham chiếu
Tiacutech hợp - Dữ liệu ldquosạchrdquo loại bỏ tiacutenh thiếu nhất quaacuten
Khocircng thay đổi - DL ldquochỉ đọcrdquo người dugraveng khocircng thay đổi được
Chuỗi thời gian - DL lagrave chuỗi thời gian khocircng phải lagrave trạng thaacutei hiện tại
Được tổng kết - DL vận hagravenhthao taacutec khi cần thiết
được kết hợp lại thagravenh dạng coacute thể dugraveng được cho quyết định
Kiacutech cỡ lớn hơn - Lưu giữ theo chuỗi thời gian tức lagrave giữ lại nhiều DL
Khocircng được chuẩn hoacutea - Coacute thể dư thừa DLSiecircu dữ liệu - Dữ liệu của dữ liệu được lưu trữNguồn dữ liệu - DL vận hagravenh (caacutec hệ sẵn coacute) cugraveng
với caacutec nguồn ngoagravei 8 Kho dữ liệu hướng chủ đề
Hướng chủ để coacute nghĩa lagrave kho dữ liệu được tổ chức xung quanh caacutec chủ đề chiacutenh như khaacutech hagraveng sản phẩm sản xuất Tập trung vagraveo việc mocirc higravenh hoacutea vagrave phacircn tiacutech dữ liệu cho caacutec nhagrave ra quyết định magrave khocircng tập trung vagraveo caacutec xử lyacute thocircng thường Cung cấp cho người dugraveng một khung nhigraven toagraven vẹn đơn giản vagrave đầy đủ về caacutec sự kiện quanh caacutec chủ đề
9 Dữ liệu trong DW được tiacutech hợp Dữ liệu trong kho dữ liệu được xacircy dựng bằng caacutech tổng hợp dữ liệu từ
nhiều nguồn khaacutec nhau vagrave caacutec nguồn coacute tổ chức khaacutec nhau Cơ sở dữ liệu caacutec file excel caacutec flat file hoặc caacutec raw file Khi đưa vagraveo kho dữ liệu caacutec dữ liệu được lagravem sạch vagrave tiacutech hợp dữ liệu nhằm đảm bảo tiacutenh nhất quaacuten của dữ liệu
10Kiến truacutec kho dữ liệu Tầng cơ sở dữ liệu hoạt động Tầng truy xuất thocircng tin Tầng truy xuất dữ liệu Tầng siecircu dữ liệu Tầng quản lyacute tiến trigravenh Tầng thocircng điệp của ứng dụng Tầng vật liacute của kho dữ liệu Tầng trigravenh diễn dữ liệu
11Higravenh trạng kho dữ liệu Kho dữ liệu ảo - người dugraveng cuối coacute thể truy cập trực tiếp đến kho dữ liệu
sử dụng caacutec cocircng cụ cho pheacutep ở tầng truy xuất dữ liệu Kho dữ liệu trung tacircm-1 cơ sở dữ liệu vật lyacute chứa tất cả dữ liệu cho một
vugraveng chuyecircn dụng nagraveo đoacute
Kho dữ liệu phacircn taacuten- Thagravenh phần được phacircn taacuten qua nhiều hệ cơ sở dữ liệu vật lyacute
12METADATA- Siecircu dữ liệu Định nghĩa Siecircu dữ liệu lagrave dữ liệu về dữ liệu Lagrave 1 lưu trữ dugraveng để
Miecircu tả kho dữ liệu tổng thể Nhận dạng kiểu kho dữ liệu Quản liacute quaacute trigravenh tiacutech hợp dữ liệu Quản liacute quaacute trigravenh cập nhật kho dữ liệu Quản liacute bảo mật
Lagrave chigravea khoacutea quyết định sự thagravenh cocircng của kho dữ liệu luocircn được thay đổi vagrave cập nhật theo sự phaacutet triển của kho dữ liệu
Dugraveng để quản liacute điều khiển kho dữ liệu Sự ra đời của kho dữ liệu như 1 cấu truacutec hỗ trợ ra quyết định siecircu dữ liệu
được xem như nguồn tagravei nguyecircn dữ liệu Siecircu dữ liệu lagrave trừu tượng Chuacuteng lagrave dữ liệu bậc cao cung cấp mocirc tả ngắn
gọn caacutec dữ liệu bậc thấp hơn 13Hoạt động của Siecircu dữ liệu
Siecircu dữ liệu rất cần thiết trong việc chuyển hoacutea thocircng tin trở thagravenh tri thức Lagrave chigravea khoacutea giuacutep chuacuteng ta xử lyacute được dữ liệu thocirc Viacute dụ một dograveng dữ liệu baacuten hagraveng 1023 K596 11121 agraveNoacute sẽ khocircng coacute nghĩa gigrave cho đến khi chuacuteng ta đưa vagraveo siecircu dữ liệu (thư
mục chứa dữ liệu) agrave cửa hagraveng 1023 sản phẩm K596 vagrave số tiền baacuten được lagrave 11121 đocirc la
14Sự cần thiết phải nhất quaacuten trong kho dữ liệu Kho dữ liệu được xacircy dựng cho lợi iacutech của những nhagrave phacircn tiacutech kinh
doanh caacutec nhagrave quản trị cho tất cả caacutec khu vực chức năng Trong cơ sở dữ liệu riecircng caacutec khu vực khaacutec nhau coacute thể định nghĩa vagrave lưu
trữ dữ liệu thocircng qua phiecircn bản của chiacutenh noacute Khi dữ liệu được lấy từ những vugraveng khaacutec nhau đoacute vagrave được đặt vagraveo kho dữ
liệu Việc chuyển đổi vagrave lagravem sạch caacutec tiến trigravenh sẽ đảm bảo noacute lagrave duy nhất được tiacutech hợp tại một mức của tổ chức
15Ragrave soaacutet lại dữ liệu ndash Thực thi siecircu dữ liệu
Bất kể cấu truacutec tự nhiecircn của 1 cacircu truy vấn thế nagraveo thigrave caacutec thagravenh phần của siecircu dữ liệu rất quan trọng đối với người ra quyết định
Bảng thuộc tiacutenh khoacutea được lưu trữ bởi kho dữ liệu Tập hợp dữ liệu được lấy từ đacircu Những chuyển đổi nagraveo được thực thi với việc lagravem sạch
16Siecircu dữ liệu lagrave gigrave Metadata - lagrave thocircng tin mocirc tả nội dung của cơ sở dữ liệu (CSDL) Metadata baacuteo cho người dugraveng biết thời gian cập nhật sau cugraveng của dữ liệu
định dạng vagrave mục điacutech sử dụng của noacute Những thocircng tin nagravey coacute thể hướng dẫn người dugraveng duyệt qua CSDL vagrave
giuacutep họ hiểu được yacute nghĩa vagrave ngữ cảnh của dữ liệu Trong CSDL metadata lagrave caacutec dạng biểu diễn khaacutec nhau của caacutec đối tượng
trong CSDL Trong CSDL quan hệ metadata lagrave caacutec định nghĩa của bảng cột CSDL
view vagrave nhiều đối tượng khaacutec Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột
một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi -gtMetadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu
Bảng chuyển đổi Ghi lại những chuyển đổi đatilde được thực hiện
Lịch sử thực thi Ghi lại những dữ liệu đatilde được
phacircn tiacutech
Higravenh thaacutei kết nốiGhi lại những dữ liệu được kết nối vagrave tần suất
17Aacutenh xạ thocircng thường của siecircu dữ liệu Bản ghi aacutenh xạ chuyển đổi bao gồm
Định danh của nguồn gốc Chuyển đổi thuộc tiacutenh Chuyển đổi thuộc tiacutenh vật lyacute Matilde hoacutea tham chiếu bảng chuyển đổi Đổi tecircn Đổi khoacutea Gaacuten giaacute trị cho thuộc tiacutenh mặc định Chọn logic cho caacutec nguồn nhiều giaacute trị Đổi thuật toaacuten
18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để
phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai
lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave
tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec
Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm
Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo
19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua
caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau
SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được
Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra
một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức
Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ
Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ
Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech
CHƯƠNG 11 KHAI PHAacute DỮ LIỆU
1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn
ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993
Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng
2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd
1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều
2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP
3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn
4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng
5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server
6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo
7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động
8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời
9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều
10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện
11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech
12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP
3 Xử lyacute phacircn tiacutech trực tuyến OLAP
MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave
dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu
ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave
thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu
HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave
ROLAP4 Khai phaacute dữ liệu
Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh
khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn
Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan
5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp
6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại
Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp
Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec
Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt
Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra
Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh
vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho
Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec
Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm
Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục
Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng
gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp
Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn
Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec
Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper
Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2
Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25
Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước
Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng
Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện
trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp
Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute
độ hỗ trợ ge ngưỡng minsup
độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan
Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn
Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết
Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu
MOLAP ROLAP HOLAP
Lưu trữ dữ liệu cơ sở
Khối Bảng quan hệ Bảng quan hệ
Lưu trữ thocircng tin tổng hợp
Khối Bảng quan hệ Khối
Hiệu suất thực hiện truy vấn
Nhanh nhất Chậm nhất Nhanh
Tiecircu thụ khocircng gian lưu trữ
Nhiều Thấp Trung bigravenh
Chi phiacute bảo trigrave Cao Thấp Trung bigravenh
Caacute nhacircn chuyecircn ngagravenh Tự đưa ra caacutec quyết định từng ngagravey
15Năng lực của hệ HTQD
1 HHTQĐ cơ bản hỗ trợ caacutec nhagrave ra quyết định trong caacutec tigravenh huống nửa cấu truacutec vagrave phi cấu truacutec bằng caacutech kết hợp phaacuten xử của con người vagrave xử lyacute thocircng tin bằng maacutey tiacutenh Caacutec bagravei toaacuten như vậy khocircng thểkhocircng thuận tiện giải quyết được chỉ bằng caacutec cocircng cụ maacutey tiacutenh hoacutea hay caacutec phương phaacutep định lượng 2 Phugrave hợp cho caacutec cấp quản lyacute khaacutec nhau từ cao đến thấp 3 Phugrave hợp cho caacute nhacircn lẫn nhoacutem Caacutec bagravei toaacuten iacutet coacute tiacutenh cấu truacutec thường liecircn đới đến nhiều caacute nhacircn ở caacutec đơn vị chức năng hay mức tổ chức khaacutec nhau cũng như ở caacutec tổ chức khaacutec 4 Hỗ trợ cho caacutec quyết định tuần tự liecircn thuộc được đưa ra một lần vagravei lần hay lặp lại 5 Hỗ trợ cho caacutec giai đoạn của quaacute trigravenh ra quyết định tigravem hiểu thiết kế lựa chọn vagrave hiện thực 6 Phugrave hợp cho một số caacutec phong caacutech vagrave quaacute trigravenh ra quyết định 7 Coacute thể tiến hoacutea theo thời gian Người dugraveng coacute thể thecircm bỏ kết hợp thay đổi caacutec phần tử cơ bản của hệ thống 8 Dễ dugraveng vagrave thacircn thiện với người dugraveng 9 Nhằm vagraveo nacircng cao tiacutenh hiệu dụng của quyết định (chiacutenh xaacutec thời gian tiacutenh chất lượng) thay vigrave lagrave tiacutenh hiệu quả (giaacute phiacute của việc ra quyết định) 10 Người ra quyết định kiểm soaacutet toagraven bộ caacutec bước của quaacute trigravenh ra quyết định HHTQĐ chỉ trợ giuacutep khocircng thay thế người ra quyết định 11 Người dugraveng cuối cugraveng coacute thể tự kiến tạo vagrave sửa đổi caacutec hệ thống nhỏ vagrave đơn giản 12 Thường dugraveng mocirc higravenh để phacircn tiacutech caacutec tigravenh huống ra quyết định 13 Cung ứng caacutec truy đạt dữ liệu từ nhiều nguồn dạng thức vagrave kiểu khaacutec nhau 14 Coacute thể dugraveng như một cocircng cụ độc lập hay kết hợp với caacutec HHTQĐứng dụng khaacutec dugraveng đơn lẻ hay trecircn một mạng lưới maacutey tiacutenh (intranet extranet) bất kỳ với cocircng nghệ WEB
16Văn hoacutea tổ chứcVăn hoacutea của tổ chức lagrave tập hợp của rất nhiều thứ (lograveng tin biểu tượng đặc trưng regraven luyện) được phaacutet triển qua thời gian dagravei
Noacute gacircy ra ảnh hưởng mạnh mẽ cograven hơn cả những hoạt động của tổ chức đoacute 10 đặc điểm văn hoacutea của tổ chức
Điều khiển Hệ thống khen thưởng Sự đồng nhất Chịu đựng xung đột Mocirc higravenh giao tiếp Hỗ trợ quản lyacute Sự hogravea nhập Định hướng Chịu đựng rủi ro Caacute nhacircn khởi xướng
Mối quan hệ của văn hoacutea với hiệu năng lagravem việc1 tổ chức thagravenh cocircng phải coacute xu hướng hogravea hợp giữa văn hoacutea với mocirci trường trong vagrave ngoagravei tổ chức
Phugrave hợp trong nội bộ cho thấy một sự kết hợp giữa văn hoacutea của tổ chức với những cocircng nghệ của chiacutenh noacute
Phugrave hợp với becircn ngoagravei cho thấy một nền văn hoacutea phugrave hợp với chiến lược thị trường
Văn hoacutea vagrave sự thay đổi 1 tổ chức magrave khocircng biết thay đổi văn hoacutea sẽ khocircng thể giữ được vị triacute của migravenh trecircn thị trường Caacutec cocircng ty xuất sắc luocircn biết caacutech tiacutech cực tiếp cận khaacutech hagraveng động viecircn đầu tư
17Quyền lực vagrave chiacutenh trịQuyền lực vagrave chiacutenh trị luocircn đi liền với nhau
aQuyền lựclagrave khả năng ảnh hưởng đến việc phacircn phối caacutec nguồn lực trong tổ chứcGồm 5 yếu tố cơ bản
Phacircn quyền Uy quyền Quyền lực caacute nhacircn Sức ảnh hưởng Chiacutenh trị
Một vagravei thagravenh phần của quyền lực ra quyết định Quyết định việc nagraveo coacute sẵn
Quyết định sản phẩm nagraveo được sản xuất Quyết định đầu tư vagraveo đacircu Quyền đặt vagrave quản lyacute quản lyacute giaacute Thanh toaacuten vagrave khấu trừ tiền latildei
bChiacutenh trị Yếu tố cốt lotildei trong quaacute trigravenh higravenh thagravenh chiến lược ra quyết định Chiacutenh trị liecircn quan tới việc ra quyết định thocircng qua đagravem phaacutenảnh hưởngvagrave higravenh
thagravenh sự nhất triacute Trong nhiều trường hợp noacute coacute thể cho ta sự linh hoạt hơn
18Hệ trợ giuacutep quyết định trong tổ chức DSS của 1 tổ chức hỗ trợ cocircng nghệ tập trung vagraveo caacutec quyết định ảnh hưởng tới
rất nhiều người 1 hệ thống DSS hiện đại coacute thể chấp nhận nhiều quyết định vượt qua những giới
hạn phacircn cấp truyền thống aCaacutec hoạt động gần DSS
Giải quyết caacutec nhiệm vụ đặc biệt Thu thập thocircng tin Liecircn lạc qua caacutec chi nhaacutenh Động thaacutei chiacutenh trị
Phacircn loại tư duy chiến lược cho DSS Sắp xếp quyết địnhXếp hạng quyết định sao cho thứ tự đứng trước thigrave được
ưu tiecircn trước Chia sẻ thocircng tinCaacutec quyecirct định coacute thể độc lập nhưng người ra quyết định
phải chia sẻ caacutec thocircng tin liecircn quan Lựa chọn đagravem phaacutenVagravei quyết định coacute thể xaacutec lập thocircng qua đagravem phaacuten vagrave kết
quả được lagravem đồng thờiKhocircng phải cocircng nghệ tự noacute coacute thể đưa ra quyết định magrave noacute nằm ở trigravenh độ cocircng nghệ hỗ trợ caacutec chiến lược quyết định quyền lực vagrave chiacutenh trị cugraveng phối hợp với nhau
Chương 4Mocirc higravenh hoacutea quaacute trigravenh ra quyết định
(Cấu truacutec của hệ HTQD)19Vấn đề Mocirc higravenh
bull Lagrave phần tử chủ chốt trong hầu hết hệ hỗ trợ quyết định vagrave lagrave điều kiện cần trong hệ hỗ trợ quyết định dựa vagraveo mocirc higravenh (model-based DSS)
bull Coacute nhiều lớp mocirc higravenh kegravem theo lagrave caacutec kỹ thuật xử lyacute thao taacutec mocirc higravenh đặc thugrave tương ứng
bull Caacutec vấn đề chiacutenh nhận diện bagravei toaacuten vagrave phacircn tiacutech mocirci trường nhận diện biến số dự baacuteo đa mocirc higravenh caacutec phạm trugrave mocirc higravenh quản lyacute mocirc higravenh vagrave mocirc higravenh hoacutea dựa vagraveo kiến thức
bull Mocirc higravenh hoacutea lagrave taacutec vụ khocircng đơn giản Người xacircy dựng mocirc higravenh phải cacircn bằng giữa tiacutenh đơn giản của mocirc higravenh với caacutec yecircu cầu biểu diễn để mocirc higravenh coacute thể nắm bắt đủ thực tại cần thiết cho người ra quyết định
bull Mocirc phỏng lagrave kỹ thuật mocirc higravenh hoacutea thocircng dụng dugraveng để tigravem hiểu vấn đề tuy khocircng nhất thiết phải tigravem ra được caacutec giải phaacutep biến thể mở rộng quaacute trigravenh ra quyết định của tổ chức vagrave cho pheacutep tổ chức xem xeacutet taacutec độngảnh hưởng của caacutec chọn lựa tương lai
bull Mocirc phỏng tiết kiệm rất nhiều chi phiacute vagrave thời gian ndash rất dễ thay đổi mocirc higravenh hoạt động của một hệ thống vật lyacute bằng mocirc higravenh hoacutea maacutey tiacutenh
bull Mocirc higravenh coacute thể được phaacutet triển vagrave cagravei đặt bằng một số caacutec ngocircn ngữ lập trinh (thế hệ 3 4 ) vagrave hệ thống phần mềm khaacutec nhau
Mocirc higravenh tĩnh vagrave động
bull Mocirc higravenh tĩnh thể hiện bức tranh tại thời điểm của tigravenh huống Caacutec khiacutea cạnh của bagravei toaacuten được xeacutet một thời kỳ nhất định trong một khung thời gian nhất định (coacute thể ldquocuốnrdquo về tương lai) Caacutec tigravenh huống được giả sử lagrave sẽ lập lại với tập caacutec điều kiện đồng nhất
1048713 Giả định coacute được tiacutenh ổn định của dữ liệu 1048713 Mocirc phỏng quaacute trigravenh dạng tĩnh - lagravem việc trecircn caacutec trạng thaacutei ổn định để tigravem ra caacutec
thocircng số tối ưu ndash thường được dugraveng như cocircng cụ chủ yếu để thiết kế quaacute trigravenh 1048713 vd quyết định sản xuấtmua 1 sản phẩm baacuteo caacuteo thu nhập hagraveng quyacutenăm bull Mocirc higravenh động biểu diễn caacutec kịch bản thay đổi theo thời gian 1048713 Phụ thuộc thời gian caacutec trạng thaacutei thay đổi theo thời gian 1048713 Thường dugraveng để tạo sinh vagrave biểu diễn caacutec xu hướng vagrave khuocircn mẫu theo thời gian 1048713 Mocirc phỏng động thể hiện caacutec diễn tiến khi caacutec điều kiện theo thời gian khaacutec với caacutec
trạng thaacutei ổn định ndash thường được dugraveng để thiết kế việc kiểm soaacutet caacutec hệ thống 1048713 VD dự baacuteo lời-lỗ trong 5 năm với caacutec nhập lượng như giaacute phiacute số lượng thay đổi
theo từng năm
Mocirc higravenh chắc chắn tương đối dễ phaacutet triển giải quyết vagrave coacute thể sinh ra caacutec giải phaacutep tối ưu 1048713 Caacutec bagravei toaacuten coacute một số lớnvocirc hạn caacutec giải phaacutep khả thi đặc biệt quan trọng 1048713 Caacutec mocirc higravenh tagravei chaacutenh được xacircy dựng trong điều kiện chắc chắn
Mocirc higravenh bất địnhbằng caacutech thu thập thecircm thocircng tin cố gắng đưa bagravei toaacuten trở về dạng chắc chắn hay dạng
rủi ro Mocirc higravenh rủi ro caacutec quyết định kinh doanh được đưa ra dưới caacutec rủi ro giả định
1048713 Đocirci khi biết được xaacutec suất của caacutec sự kiện xảy ra trong tương lai 1048713 Caacutec trường hợp khaacutec (bất định) ước lượng caacutec rủi ro vagrave giả sử caacutec tigravenh huống rủi ro
xảy ra 20Mocirc higravenh hoacutea
MOcirc HIgraveNH HOacuteA BẰNG BẢNG TIacuteNH bull Bảng tiacutenh phần mềm mạnh linh hoạt vagrave dễ dugraveng cho pheacutep tạo sinh caacutec ứng dụng trong kinh doanh kỹ thuật toaacuten vagrave khoa học với tập caacutec hagravem mạnh về tagravei chaacutenh thống kecirc toaacuten bull Kegravem theo lagrave caacutec thagravenh phần cộng thecircm (add-ins) giuacutep xacircy dựng vagrave giải caacutec lớp mocirc higravenh đặc thugrave bull Lagrave cocircng cụ mocirc higravenh hoacutea thocircng dụng nhất của người dugraveng cuối cugraveng bull Coacute caacutec chức năng về phacircn tiacutech ldquowhat-ifrdquo dograve tigravem mục tiecircu quản lyacute dữ liệu vagrave lập trigravenh (dạng macro) bull Coacute khả năng đọc ghi caacutec cấu truacutec tập tin thocircng dụng để giao tiếp được với caacutec CSDL vagrave cocircng cụ khaacutec bull Coacute thể xacircy dựng mocirc higravenh tĩnh vagrave động bull Dugraveng trecircn maacutey tiacutenh caacute nhacircn vagrave maacutey tiacutenh lớn
bull Cơ sở để xacircy dựng caacutec bảng tiacutenh đa chiều vagrave caacutec cocircng cụ xử lyacute phacircn tiacutech trực tuyến (OLAP) MOcirc HIgraveNH HOacuteA BẰNG PHAcircN TIacuteCH QUYẾT ĐỊNH bull Tiếp cận mocirc higravenh hoacutea caacutec tigravenh huống quyết định coacute một số hữu hạnkhocircng quaacute nhiều caacutec phương aacuten ndash mỗi phương aacuten được trigravenh ra dưới dạng bảng hay đồ thị - caacutec kết quả tương ứng (dự baacuteo được kegravem xaacutec suất) theo mục tiecircu bagravei toaacuten ndash từ đoacute chọn phương aacuten tốt nhất bull Đơn mục tiecircu bảng quyết định hay cacircy quyết định bull Đa mục tiecircu AHP (analytic hierarchy process) khaacutec
MOcirc HIgraveNH HOacuteA BẰNG QUY HOẠCH TOAacuteN
bull Quy hoạch toaacuten học (mathematical programming) lagrave họ caacutec cocircng cụ giải quyết caacutec bagravei toaacuten quản lyacute theo đoacute người ra quyết định phải cấp phaacutet caacutec tagravei nguyecircn khan hiếm cho caacutec hoạt động cạnh tranh nhau (caacutec phương aacuten) nhằm tối ưu hoacutea mục tiecircu coacute khả năng đo lường được bull Caacutec mocirc higravenh quy hoạch tuyến tiacutenh (linear programming) thocircng dụng nhất trong quy hoạch toaacuten coacute nhiều ứng dụng trong thực tế được dugraveng nhiều trong caacutec hệ hỗ trợ quyết định bull Bagravei toaacuten quy hoạch tuyến tiacutenh 1048713 Caacutec biến quyết định (cần tigravem giaacute trị) 1048713 Hagravem mục tiecircu (hagravem toaacuten học dạng tuyến tiacutenh xaacutec định quan hệ giữa biến quyết định vagrave mục tiecircu đo lường mức độ đạt đạt mục tiecircu vagrave cần được tối ưu hoacutea) 1048713 Caacutec hệ số của hagravem mục tiecircu (cho biết mức đoacuteng goacutep vagraveo mục tiecircu của 1 đơn vị biến quyết định) 1048713 Ragraveng buộc (biểu thức tuyến tiacutenh cho biết giới hạn tagravei nguyecircn vagravehay caacutec quan hệ giữa caacutec biến số) 1048713 Dung lượng (mocirc tả cận trecircn vagrave dưới của caacutec biến vagrave ragraveng buộc) 1048713 Hệ số (cocircng nghệ) vagraveo-ra (cho biết mức độ sử dụng tagravei nguyecircn của biến quyết định) bull Đặc điểm của bagravei toaacuten quy hoạch tuyến tiacutenh 1048713 Tagravei nguyecircn kinh tế của bagravei toaacuten lagrave coacute hạn vagrave sẵn sagraveng 1048713 Coacute nhiều caacutech (gt2 caacutech) sử dụng tagravei nguyecircn được gọi lagrave giải phaacutep hay chương trigravenh 1048713 Mỗi hoạt động dugraveng tagravei nguyecircn đều sinh ra kết quả dưới dạng mục tiecircu đatilde phaacutet biểu trước 1048713 Việc cấp phaacutet nằm trong caacutec ragraveng buộc cho trước bull Giả định của bagravei toaacuten quy hoạch tuyến tiacutenh 1048713 Caacutec kết quả của caacutec cấp phaacutet coacute thể đem so saacutenh với nhau coacute thể đo lường bằng một đơn vị chung
1048713 Caacutec cấp phaacutet độc lập với nhau về mặt kết quả 1048713 Kết quả cuối cugraveng lagrave tổng của caacutec kết quả từ caacutec hoạt động riecircng rẽ khaacutec nhau 1048713 Dữ liệu coacute tiacutenh chắc chắn 1048713 Tagravei nguyecircn được dugraveng một caacutech kinh tế nhất 1048713 Thường coacute một số lớn caacutec giải phaacutep với kết quả khaacutec nhau 1048713 Trong số caacutec giải phaacutep coacute thể coacute 1 giải phaacutep tốt nhất ndash mức độ đạt được mục tiecircu cao nhất ndash gọi lagrave giải phaacutep tối ưu được tigravem ra bằng một giải thuật đặc biệt MOcirc HIgraveNH HOacuteA BẰNG HEURISTIC bull Việc tigravem giải phaacutep tối ưu của một số bagravei toaacuten quyết định phức tạp coacute thể tốn nhiều thời gian chi phiacute hay khocircng thể tigravem ra được Cograven nếu dugraveng tiếp cận mocirc phỏng cũng coacute thể keacuteo dagravei phức tạp khocircng thiacutech hợp hay thậm chiacute khocircng chiacutenh xaacutec
bull Lagrave một tiếp cận giuacutep tigravem ra caacutec giải phaacutep khả thithỏa matildenđủ tốt cho caacutec bagravei toaacuten phức tạp Coacute thể coacute giải phaacutep đủ tốt (90-999 giaacute trị của lời giải tối ưu) nhanh choacuteng vagrave đỡ tốn keacutem hơn bằng caacutech dugraveng heuristics bull Quaacute trigravenh heuristic lagrave datildey caacutec bước xacircy dựng caacutec quy luật giải quyết vấn đề thocircng qua việc tigravem kiếm caacutec con đường hứa hẹn nhất dẫn đến lời giải tigravem kiếm caacutech thức thu thập vagrave phacircn giải thocircng tin theo quaacute trigravenh giải vagrave phaacutet triền caacutec phương phaacutep dẫn đến một giải thuật tiacutenh toaacuten hay một lời giải tổng quaacutet đatilde coacute bull Aacutep dụng chủ yếu cho bagravei toaacuten cấu truacutec yếu cũng dugraveng để tigravem ra giải phaacutep chấp nhận được cho bagravei toaacuten cấu truacutec chặt bull Khocircng đủ tổng quaacutet như caacutec giải thuật thường chỉ dugraveng cho tigravenh huống đặc thugrave đang xeacutet bull Coacute thể dẫn đến một giải phaacutep dở - caacutec thủ tục từng bước giải quyết vấn đề khocircng đảm bảo tigravem ra giải phaacutep tối ưu bull Heuristic coacute thể lagrave định lượng vigrave vậy coacute thể đoacuteng vai trograve quan trọng trong cơ sở mocirc higravenh của hệ hỗ trợ quyết định bull Heuristic coacute thể lagrave định tiacutenh vigrave vậy coacute thể đoacuteng vai trograve quan trọng trong cung ứng kiến thức cho hệ chuyecircn gia bull Quaacute trigravenh heuristic liecircn quan đến tigravem kiếm học tập ước lượng phacircn xử vagrave lặp lại caacutec hoạt động nagravey dọc theo tiến trigravenh bull Kiến thức thu được dugrave thagravenh cocircng hay thất bại trong quaacute trigravenh đều được phản hồi vagrave sửa đổi chiacutenh quaacute trigravenh nhờ đoacute coacute thể định nghĩa lại mục tiecircu hay bagravei toaacuten 1048713 Giải thuật di truyền bắt đầu bằng tập caacutec giải phaacutep được sinh ngẫu nhiecircn taacutei kết hợp caacutec cặp giải phaacutep một caacutech ngẫu nhiecircn bull Tigravenh huống necircn dugraveng heuristics 1048713 Dữ liệu đầu vagraveo khocircng chiacutenh xaacutec hay coacute giới hạn 1048713 Thực tế quaacute phức tạp đến nỗi khocircng dugraveng được caacutec mocirc higravenh tối ưu 1048713 Chưa coacute được giải thuật chiacutenh xaacutec vagrave đủ tin cậy 1048713 Bagravei toaacuten phức tạp necircn sẽ khocircng kinh tế nếu dugraveng tối ưu hay mocirc phỏng hoặc tốn quaacute nhiều thời gian tiacutenh toaacuten 1048713 Coacute thể cải thiện tiacutenh hiệu quả của quaacute trigravenh tối ưu (tức coacute thể sinh ra caacutec giải phaacutep ban đầu tương đối tốt) 1048713 Liecircn quan đến xử lyacute kyacute hiệu chứ khocircng phải xử lyacute kyacute số (như hệ chuyecircn gia) 1048713 Cần coacute quyết định nhanh vagrave caacutec xử lyacute dựa vagraveo maacutey tiacutenh đều khocircng khả thi (một số heuristic khocircng cần đến maacutey tiacutenh) bull Thuận lợi 1048713 Dễ hiểu dễ giải thiacutech vagrave dễ cagravei đặt 1048713 Nacircng cao tiacutenh saacuteng tạo vagrave năng lực heuristic cho caacutec vấn đề khaacutec 1048713 Tiết kiệm thời gian xaacutec lập vấn đề 1048713 Tiết kiệm yecircu cầu về bộ chứa vagrave xử lyacute maacutey tiacutenh
1048713 Tiết kiệm thời gian tiacutenh toaacuten vagrave do vậy tiết kiệm thời gian thực trong ra quyết định Một số vấn đề phức tạp đến nỗi chỉ coacute thể giải được bằng heuristics 1048713 Thường sinh ra nhiều giải phaacutep chấp nhận được 1048713 Thường coacute thể phaacutet biểu lyacute thuyết hay đo lường thực nghiệm về chất lượng của giải phaacutep (tức giaacute trị mục tiecircu của giải phaacutep gần với giaacute trị tồi ưu đến mức nagraveo dugrave giaacute trị tối ưu chưa biết được) 1048713 Coacute thể kết hợp tiacutenh thocircng minh vagraveo để hướng dẫn pheacutep tigravem kiếm (tigravem kiếm tabu) Năng lực thocircng minh đoacute coacute thể lagrave đặc thugrave theo bagravei toaacuten hoặc dựa trecircn yacute kiến chuyecircn gia được cấy trong hệ chuyecircn gia hoặc cơ chế tigravem kiếm 1048713 Coacute thể dugraveng heuristic hiệu quả vagraveo caacutec mocirc higravenh coacute thể giải bằng quy hoạch toaacuten học Đocirci khi heuristic lagrave phương phaacutep được ưa thiacutech hơn khi khaacutec giải phaacutep heuristics được dugraveng như giải phaacutep ban đầu cho caacutec phương phaacutep quy hoạch toaacuten học bull Hạn chế 1048713 Khocircng đảm bảo coacute được giải phaacutep tối ưu 1048713 Caacutec quy luật coacute rất nhiều ngoại lệ 1048713 Caacutec lựa chọn quyết định tuần tự coacute thể khocircng tiecircn đoaacuten được caacutec kết cục tương lai của mỗi chọn lựa 1048713 Sự liecircn thuộc giữa caacutec phần trong hệ thống đocirci khi coacute thể gacircy ra caacutec ảnh hưởng lớn lao lecircn toagraven hệ thống bull Phacircn loại caacutec giải thuật heuristic 1048713 Heuristic xacircy dựng xacircy dựng giải phaacutep khả thi bằng caacutech cộng thecircm từng thagravenh phần một VD bagravei toaacuten người baacuten hagraveng ndash luocircn gheacute thagravenh phố chưa viếng thăm kế tiếp gần nhất
1048713 Heuristic cải tiến bắt đầu bằng một giải phaacutep khả thi vagrave cố gắng cải tiến liecircn tục trecircn đoacute VD trecircn thử hoaacuten đổi 2 thagravenh phố 1048713 Quy hoạch toaacuten aacutep dụng vagraveo caacutec mocirc higravenh chứa iacutet ragraveng buộc nhằm coacute được thocircng tin về thỏa hiệp tốt nhất với mocirc higravenh nguyecircn gốc Thường được dugraveng trong tối ưu hoacutea nguyecircn (integer optimization) 1048713 Chia giai đoạn giải quyết một vấn đề theo từng giai đoạn VD ở PampG trecircn đacircy bagravei toaacuten phacircn phối được giải quyết trước sau đoacute dugraveng giải quyết bagravei toaacuten chiến lược sản phẩm 1048713 Phacircn ratilde chia bagravei toaacuten thagravenh caacutec phần nhỏ hơn coacute thể giải quyết được sau đoacute kết hợp caacutec giải phaacutep đoacute lại VD chia latildenh thổ baacuten hagraveng thagravenh 4 vugraveng khaacutec nhau giải quyết cho từng vugraveng sau đoacute kết nối caacutec giải phaacutep
21Mocirc phỏngbull Giả định caacutec đặc điểm của thực tạibull Lagrave kỹ thuật tiến triển caacutec thực nghiệm (như phacircn tiacutech ldquowhat-ifrdquo) - bằng maacutey tiacutenh -trecircn một mocirc higravenh của hệ thocircng tin quản lyacute
bull Khocircng thực sự lagrave một mocirc higravenh vigrave khocircng biểu diễn thực tại magrave lagrave cố gắng bắtchước thực tạibull Một trong những phương phaacutep thocircng dụng nhất trong HHTQĐbull HHTQĐ lagravem việc với caacutec bagravei toaacuten phi cấu truacutec vagrave cấu truacutec yếu tigravenh huống thực tếphức tạp ndash khocircng dễ biểu diễn bằng mocirc higravenh tối ưu hay caacutec dạng mocirc higravenh khaacutecnhưng lại thường coacute thể xử lyacute được bằng mocirc phỏngbull Đặc điểm1048713 Iacutet đưa ra caacutec đơn giản hoacutea về thực tại hơn caacutec mocirc higravenh khaacutec1048713 Do triển khai caacutec thực nghiệm necircn noacute coacute thể kiểm thử caacutec giaacute trị cụ thể của caacutecbiến quyết địnhbiến khocircng kiểm soaacutet được của mocirc higravenh vagrave xem xeacutet ảnh hưởnglecircn caacutec biến kết quả1048713 Phương phaacutep coacute tiacutenh mocirc tả (như vậy khaacutec với phương phaacutep danh định)1048713 Khocircng tự động tigravem kiếm giải phaacutep tối ưu ndash noacute mocirc tảtiecircn đoaacuten caacutec đặc tiacutenh của hệthống đatilde cho dưới caacutec điều kiện khaacutec nhau từ đoacute coacute thể chọn ra phương aacuten tốtnhất1048713 Quaacute trigravenh mocirc phỏng thường lặp lại một thực nghiệm nhiều lần để coacute được ướclượng về hiệu ứng tổng quaacutet của một số hagravenh động nhất định1048713 Mocirc phỏng maacutey tiacutenh thiacutech hợp cho hầu hết caacutec tigravenh huống mặc dugrave cũng coacute một sốmocirc phỏng thủ cocircng thagravenh cocircng1048713 Thường chỉ được dugraveng khi bagravei toaacuten quaacute phức tạp khocircng thể xem xeacutet bằng caacutec kỹthuật tối ưu dạng số Tiacutenh phức tạp theo nghĩa bagravei toaacuten khocircng thể cocircng thức hoacuteacho tối ưu (do khocircng thotildea caacutec giả định) hoặc cocircng thức quaacute lớn quaacute nhiều tươngtaacutec giữa caacutec biến hoặc về bản chất bagravei toaacuten lagrave bất định hay rủi roPhương phaacutep mocirc phỏng thiết lập mocirc higravenh của hệ thống thực vagrave tiến hagravenh caacutec thựcnghiệm lặp lại trecircn mocirc higravenh
bull Thuận lợi1048713 Lyacute thuyết tương đối trực tiếp hiệu ứng dagravei hạn của nhiều chiacutenh saacutech -gt neacuten thờigian lớn1048713 Do tiacutenh chất mocirc tả (khaacutec với danh định)1048713 Coacute thể thấy được nhanh choacuteng coacute thể đặt ra caacutec cacircu hỏi ldquowhat-ifrdquo coacute thể dugravengtiếp cận thử-vagrave-sai vagraveo giải quyết vấn đề một caacutech nhanh choacuteng rẻ chiacutenh xaacutec iacutetrủi ro hơn1048713 Thử nghiệm được biến quyết định phần nagraveo của mocirci trường thực sự quan trọngvới caacutec phương aacuten khaacutec nhau1048713 Yecircu cầu kiến thức riecircng biệt về bagravei toaacuten vigrave thế buộc người xacircy dựng mocirc higravenh phảilagravem việc thường xuyecircn với nhagrave quản lyacute ndash đối tượng mong muốn của HHTQĐ để
từ đoacute bản chất bagravei toaacuten vagrave caacutec quyết định được hiểu tốt hơn1048713 Mocirc higravenh được xacircy dựng từ viễn cảnhcaacutech nhigraven của nhagrave quản lyacute1048713 Mocirc higravenh chỉ cho một bagravei toaacuten riecircng biệt thường khocircng thể dugraveng giải caacutec bagravei toaacutenkhaacutec Như vậy mỗi thagravenh phần của mocirc higravenh ứng với một phần của hệ thống thựcdo đoacute sẽ khocircng yecircu cầu nhagrave quản lyacute phải tổng quaacutet hoacutea caacutec hiểu biết của migravenh1048713 Phổ bagravei toaacuten giải được rất rộng tồn kho nhacircn sự hoạch định chiến lược 1048713 Coacute thể chứa caacutec phức tạp thực sự của bagravei toaacuten khocircng cần caacutec đơn giản hoacutea (TDdugraveng caacutec phacircn phối xaacutec suất thực thay vigrave phacircn phối lyacute thuyết xấp xỉ)1048713 Coacute thể tự động sinh ra nhiều đo lường hiệu năng quan trọng1048713 Thường lagrave phương phaacutep duy nhất của HHTQĐ coacute thể xử lyacute caacutec bagravei toaacuten tương đốiphi cấu truacutec1048713 Coacute một số caacutec goacutei phần mềm mocirc phỏng (Monte Carlo) tương đối dễ dugravengbull Điểm yếu1048713 Tuy thường tigravem được caacutec phương aacuten đủ tốt nhưng khocircng đảm bảo lời giải tối ưu1048713 Quaacute trigravenh xacircy dựng mocirc higravenh thường dagravei vagrave tốn keacutem1048713 Giải phaacutep vagrave suy diễn từ nghiecircn cứu mocirc phỏng thường khocircng thể chuyển sang bagraveitoaacuten khaacutec vigrave mocirc higravenh kết hợp caacutec yếu tố đặc thugrave1048713 Đocirci khi do mocirc higravenh quaacute dễ giải thiacutech cho nhagrave quản lyacute necircn caacutec phương phaacutep phacircntiacutech thường xem nhẹ1048713 Phần mềm mocirc phỏng đocirci khi yecircu cầu caacutec kỹ năng đặc biệt do độ phức tạp củaphương phaacutep giải higravenh thứcbull Caacutec loại mocirc phỏng1048713 Mocirc phỏng xaacutec suất một hay nhiều biến độc lập mang tiacutenh xaacutec suất với 2 loạiphacircn phối ndash thường dugraveng kỹ thuật Monte Carlo1048713 Phacircn phối rời rạc tigravenh huống coacute một số giới hạn caacutec biến cố (biến) với hữu hạncaacutec giaacute trị cho mỗi biến cố (biến)1048713 Phacircn phối liecircn tục tigravenh huống coacute số lượng khocircng giới hạn caacutec biến cố tuacircn theocaacutec hagravem mật độ xaacutec suất như phacircn phối chuẩn1048713 Mocirc phỏng độc lậpphụ thuộc theo thời gian1048713 Độc lập khocircng cần thiết phải biết chiacutenh xaacutec thời điểm xảy ra biến cố (nhu cầutiecircu thụ lượng sản phẩm trong ngagravey khocircng biết chiacutenh xaacutec thời điểm tiecircu thụ)1048713 Phụ thuộc cần biết chiacutenh xaacutec thời điểm xảy ra sự kiện (bagravei toaacuten hagraveng đợi)1048713 Mocirc phỏng tương taacutec trực quan1048713 Mocirc phỏng hướng đối tượng dugraveng tiếp cận hướng đối tượng để xacircy dựng mocirc higravenhmocirc phỏng Chuacute yacute ngocircn ngữ mocirc higravenh hoacutea nhất thể UML (unified modelinglanguage) kể cả khi mocirc phỏng caacutec hệ thời gian thựcMOcirc HIgraveNH HOacuteA ĐA CHIỀU ndash XỬ LYacute PHAcircN TIacuteCH TRỰC TUYẾNbull Người ra quyết định thường phải xem xeacutet nhiều chiều của dữ liệu (TD caacutec chiềucủa dữ liệu baacuten hagraveng lagrave sản phẩm vugraveng thời gian người baacuten ) dữ liệu cần đượcphacircn tiacutech trực tiếp bằng caacutec cocircng cụ chuẩn hay phacircn tiacutech tự động bằng caacutec
phương phaacutep khai mỏ dữ liệu (data mining)bull Hầu hết caacutec hệ thống phacircn tiacutech đa chiều được nhuacuteng trong caacutec hệ xử lyacute phacircn tiacutechtrực tuyến (HXLPTTT ndash online analytic processing - OLAP)bull Mục tiecircu của XLPTTT nắm bắt cấu truacutec của dữ liệu thực để hỗ trợ ra quyết địnhbull Trong HHTQĐ coacute sự gắn nối tự nhiecircn giữa mocirc higravenh hoacutea dữ liệu mocirc higravenh hoacutea kyacutehiệu vagrave caacutec khiacutea cạnh của phacircn tiacutech ldquowhat-ifrdquobull Caacutec baacuteo caacuteo của HXLPTTT đều coacute tiacutenh tương taacutec dễ khai thaacutec sử dụng đặc biệtphugrave hợp cho caacutec baacuteo caacuteo về chỉ số hiệu năng chủ yếu (key performance indicators- KPI) baacuteo caacuteo về đo lường hiệu năng kinh doanh bull Thế hệ hiện tại của HXLPTTT vagrave hệ khai mỏ dữ liệu (data mining) tiacutech hợp caacutecđặc tiacutenh của hệ thocircng tin latildenh đạo (executive information system ndashEIS- nhiềucaacutech nhigraven dữ liệu chi tiết hoacutea theo nhu cầu) vagrave caacutec hệ đồ họa khaacutec ndash thường coacutegiao diện người dugraveng dạng kiểu WEBbull Caacutec hệ thống như trecircn cograven được gọi lagrave caacutec cocircng cụ triacute tuệ kinh doanh (businessintelligence - BI) vigrave coacute caacutec đặc trưng về mocirc higravenh hoacutea vagrave tối ưu hoacutea nhưng lạitrong suốt đối với ngươigrave dugravengbull Hiện caacutec cocircng cụ được đưa ra bởi caacutec nhagrave cung cấp về CSDL về hoạch định tagraveinguyecircn tổ chức (ERP) về nhagrave kho dữ liệu (data warehouse) về HXLPTTT MOcirc HIgraveNH HOacuteA VAgrave MOcirc PHỎNG TƯƠNG TAacuteC TRỰC QUANbull Iacutech lợi Người ra quyết định tham gia vagraveo quaacute trigravenh phaacutet triển mocirc higravenh vagrave thựcnghiệm mocirc phỏng vigrave vậy sẽ tin tưởng khi sử dụng mocirc higravenhbull Mocirc higravenh hoacutea tương taacutec trực quan (visual interactive modeling - VIM) dugraveng caacutecbiểu diễn đồ họa maacutey tiacutenh để trigravenh bagravey caacutec ảnh hưởng của caacutec quyết định quản lyacutekhaacutec nhau ở một thời điểm (tĩnh) hay tiến triển theo thời gian (động với kỹ thuậthoạt higravenh)bull Mocirc phỏng tương taacutec trực quan (visual interactive simulation - VIS) cho pheacutepngười dugraveng theo dotildei tiến trigravenh xacircy dựng vagrave sử dụng khai thaacutec mocirc higravenh mocirc phỏngdưới dạng hoạt higravenhbull Mocirc higravenh hoacutea tương taacutec trực quan coacute thể kết hợp với tiếp cận triacute tuệ nhacircn tạo đểđưa ra caacutec khả năng mới thay đổi từ xacircy dựng hệ thống dạng đồ họa đến tigravem hiểuvề động học của hệ thốngbull Cần đến caacutec hệ thống maacutey tiacutenh xử lyacute song song tốc độ cao để xacircy dựng caacutec mocircphỏng - phức tạp quy mocirc lớn dạng hoạt higravenh - mang tiacutenh khả thi ở thời gian thực
22Caacutec dạng hệ thống hỗ trợ ra quyết địnhHệ hỗ trợ quyết định nhoacutemRa quyết định nhoacutem giao tiếp vagrave cộng taacutec- Caacutec đặc điểm của cocircng việc nhoacutem+ Một nhoacutem thực hiện một nhiệm vụ thỉnh thoảng ra quyết định thỉnh thoảngkhocircng ra quyết định+ Caacutec thagravenh viecircn trong nhoacutem coacute thể ở những nơi khaacutec nhau
+ Caacutec thagravenh viecircn trong nhoacutem coacute thể lagravem việc ở những thời gian khaacutec nhau+ Caacutec thagravenh viecircn trong nhoacutem coacute thể lagravem việc cugraveng nhau hoặc ở caacutec tổ chức khaacutecnhau+ Nhoacutem coacute thể vĩnh viễn hoặc tạm thời+ Nhoacutem coacute thể ở bất kỳ mức quản lyacute nagraveo hoặc mức thời gian nagraveo+ Coacute sự điều phối (quaacute trigravenh vagrave nhiệm vụ đạt được) hoặc macircu thuẩn trongnhoacutem+ Coacute sự đạt được hoặcvagrave mất maacutet năng suất trong tổ chức+ Nhiệm vụ phải hoagraven thagravenh rất nhanh+ Khocircng thể hoặc quaacute đắt cho tất cả caacutec thagravenh viecircn trong nhoacutem cugraveng hợp ở mộtnơi+ Một số dữ liệu thocircng tin hoặc kiến thức cần thiết nằm ở nhiều nơi một sốkhaacutec ở ngoagravei tổ chức+ Chuyecircn mocircn của caacutec thagravenh viecircn khocircng coacute trong nhoacutem lagrave cần thiết- Caacutec hoạt động vagrave caacutec quaacute trigravenh miecircu tả caacutec cuộc họp+ Cuộc họp lagrave hoạt động chung liecircn quan bởi một nhoacutem người coacute địa vị bằngnhau hoặc gần bằng nhau+ Kết quả của cuộc họp phụ thuộc một phần vagraveo kiến thức yacute kiến caacutec đaacutenh giaacutecủa caacutec thagravenh viecircn+ Kết quả của cuộc họp cũng phụ thuộc vagraveo sự kết hợp của nhoacutem vagrave phụ thuộcvagraveo quaacute trigravenh ra quyết định được sử dụng bởi nhoacutem đoacute+ Giải quyết caacutec yacute kiến khaacutec nhau bởi người coacute quyền hạn hoặc thương lượnghoặc phacircn xửHỗ trợ giao tiếp- Giao tiếp lagrave thagravenh phần quan trọng cho hỗ trợ quyết định Khocircng coacute giao tiếp thigravekhocircng coacute cộng taacutec Những người ra quyết định caacute nhacircn phải giao tiếp với caacutecđồng nghiệp chuyecircn gia cơ quan chiacutenh phủ khaacutech hagraveng đối taacutec kinh doanh hellipHọ cũng cần dữ liệu vagrave thocircng tin (vagrave kiến thức) từ nhiều nơi trecircn thế giới Caacutecnhoacutem ra quyết định phải giao tiếp cộng taacutec vagrave thương lượng trong cocircng việcHầu hết caacutec tổ chức sẽ nhanh trở thagravenh khocircng coacute chức năng nếu khocircng coacute caacutec hệthống giao tiếp Thương mại điện tử coacute thể hiệu quả chỉ qua caacutec kỹ thuật giao tiếphiện đại- Caacutec kỹ thuật thocircng tin hiện đại cung cấp caacutec phương tiện hỗ trợ giao tiếp rẻnhanh coacute khả năng coacute thể tin cậy Nền tảng hỗ trợ giao tiếp lagrave caacutec hệ thống maacuteytiacutenh mạng+ Bắt đầu bằng điện baacuteo điện thoại radio vagrave ti vi+ Trong 100 năm chuacuteng ta phaacutet triển maacutey fax thư điện tử chương trigravenh chatnhoacutem tin tức hệ thống hội nghị truyền higravenh Hầu hết caacutec kỹ thuật nagravey đềuhoạt động trecircn internet+ Sự phaacutet triển giao tiếp sau cugraveng lagrave hệ thống họp điện tử caacutec dịch vụ vagrave hệ
thống hội nghị điện tử thường sử dụng internet để kết nối caacutec người ra quyếtđịnh- Caacutec thuận lợi aacutep dụng caacutec phương phaacutep giao tiếp cải tiến trong caacutec tổ chức+ Cải tiến năng suất của nhacircn viecircn+ Liecircn quan đến nhiều người ra quyết định chiacutenh+ Khocircng quan tacircm nhiều đến đường biecircn giới địa lyacute+ Tạo nền văn hoacutea hợp taacutec nhất quaacuten+ Cải tiến chất lượng cuộc sống của nhacircn viecircnHỗ trợ cộng taacutec Maacutey tiacutenh hỗ trợ cộng taacutec- Khung thời giannơi chốn+ Sự hiệu quả của kỹ thuật tiacutenh toaacuten cộng taacutec phụ thuộc vagraveo vị triacute của caacutec thagravenhviecircn trong nhoacutem vagrave phụ thuộc vagraveo thời gian chia sẽ thocircng tin gởi vagrave nhận+ Chia sự giao tiếp thagravenh bốn ocirc vagrave tổ chức bốn ocirc dọc theo 2 chiều thời gian vagravenơi chốn1048713 Thời gian Khi gởi vagrave nhận thocircng tin hầu như đồng thời giao tiếp lagrave đồngthời Viacute dụ Điện thoại ti vi vagrave caacutec cuộc họp gặp mặt nhau Giao tiếp bấtđồng bộ xảy ra khi người nhận nhận thocircng tin ở thời điểm khaacutec thời điểmgởi thocircng tin đoacute1048713 Nơi chốn Người gởi vagrave người nhận coacute thể ở cugraveng phograveng hoặc khocircng+ Bốn ocirc lagrave1048713 Cugraveng thời giancugraveng nơi chốn Caacutec thagravenh viecircn gặp mặt nhau cugraveng một luacutecgiống như phograveng quyết định hoặc gặp mặt truyền thống1048713 Cugraveng thời giankhaacutec nơi chốn Caacutec thagravenh viecircn ở caacutec nơi khaacutec nhau nhưnggiao tiếp cugraveng nhau Viacute dụ hội nghị truyền higravenh (videoconferencing)1048713 Khaacutec thời giancugraveng nơi chốn Nhiều người lagravem việc theo ca Ca nagravey để lạithocircng tin cho ca khaacutec1048713 Khaacutec thời giankhaacutec nơi chốn Caacutec thagravenh viecircn ở caacutec nơi khaacutec nhau Caacutecthagravenh viecircn nagravey gởi vagrave nhận thocircng tin ở những lần khaacutec nhau
23Thực thi hệ DSSHệ thống hỗ trợ quản lyacute (MSS) khocircng phải luacutec nagraveo cũng luocircn thagravenh cocircng Nhiều trường hợpthất bại của ES khocircng hoagraven toagraven lagrave lyacute do kỹ thuật Thực thi hệ thống lagrave một quaacute trigravenh liecircn tụcnhằm đảm bảo cho tổ chức chuẩn bị tiếp nhận một hệ thống mới vagrave đưa hệ thống vagraveo sử dụngthagravenh cocircngThực hiện cocircng nghệ hệ thống hỗ trợ quản lyacute lagrave việc phức tạp vigrave caacutec hệ thống nagravey khocircng đơnthuần lagrave hệ thống thocircng tin chỉ thu thập thao taacutec vagrave phacircn phối thocircng tin Magrave xa hơn chuacuteng
liecircn quan tới caacutec cocircng việc coacute thể lagravem thay đổi đaacuteng kể caacutech thức hoạt động của tổ chức Tuyvậy đa số caacutec yếu tố thực thi đều liecircn quan tới hệ thống thocircng tinThực thi MSS lagrave quaacute trigravenh liecircn tục diễn ra trong suốt thời gian phaacutet triển hệ thống từ đề xuấtban đầu đến nghiecircn cứu khả thi thiết kế vagrave phacircn tiacutech hệ thống lập trigravenh huấn luyện chuyểnđổi vagrave lắp đặt Caacutec chuyecircn gia hệ thống thocircng tin thường gọi thực thi lagrave giai đoạn cuối trongvograveng đời hệ thống Định nghĩa thực thi MSS phức tạp hơn vigrave bản chất lặp của sự phaacutet triểncaacutec hệ thống
THỰC THI KHOcircNG HOAgraveN CHỈNHCaacutec quyết định về tiacutenh khả thi thường coacute giả định về lợi iacutech đạt được khi kế hoạch thực thiđược thực hiện hoagraven toagraven Trong thực tế thường chỉ thực hiện 90 thậm chiacute 70 phần trăm sovới phacircn tiacutech khả thi Lyacute do lagrave sự thay đổi tại một nơi trong hệ thống coacute thể ảnh hưởng vagrave coacutethể taacutec động tiecircu cực đến chỗ khaacutec Do vậy cấp quản lyacute coacute thể bỏ những phần trong dự aacuten coacutethể gacircy ra taacutec động xấu Do đoacute dự aacuten sẽ thực hiện iacutet hơn 100 so với dự aacuten kế hoạch Caacutec lyacutedo khaacutec coacute thể lagrave do khấu trừ ngacircn saacutech hoặc vượt chi phiacuteĐAacuteNH GIAacute SỰ THAgraveNH COcircNG CỦA THỰC THI HỆ THỐNGPhải coacute caacutec chỉ số đo lường thigrave mới coacute thể đaacutenh giaacute sự thagravenh cocircng khi thực thi một hệ thốngDickson va Powers (1973) đề ra 5 tiecircu chuẩn độc lậpbull Tỷ lệ thời gian thực hiện dự aacuten với thời gian ước lượngbull Tỷ lệ chi phiacute thực tế vagrave ngacircn saacutech thực hiệnbull Thaacutei độ của cấp quản lyacute đối với hệ thốngbull Nhu cầu thocircng tin của caacutec nhagrave quản lyacute được đaacutep ứng như thế nagraveo qua hệ thốngbull Taacutec động của dự aacuten đối với những hoạt động maacutey tiacutenh trong cocircng tyCaacutec đo lường khaacutec để đaacutenh giaacute thagravenh cocircng của hệ hỗ trợ quản lyacute (MSS)bull Sự sử dụng hệ thống (dự định dugraveng hoặc thực sự dugraveng)bull Thỏa matilden của người dugravengbull Thaacutei độ taacuten thagravenhbull Mức độ hệ thống hoagraven thagravenh caacutec mục tiecircu ban đầubull Phần thưởng đối với tổ chức (giảm chi phiacute tăng doanh thuhellip)bull Tỷ số lợi iacutech chi phiacute
bull Mức độ thể chế hoacutea của MSS trong tổ chứcDo bởi tiacutenh đa dạng của DSS necircn việc đaacutenh giaacute sự thagravenh cocircng của hệ nagravey cũng khoacute khăn tuynhiecircn cũng coacute thể coacute một số yếu tố giuacutep cho DSS thagravenh cocircng như sự tham gia người dugravenghuấn luyện người dugraveng hỗ trợ quản lyacute cấp cao nguồn thocircng tin đặc điểm của những nhiệmvụ coacute liecircn quan (cấu truacutec bất định độ khoacute phụ thuộc)
Chương5Nhoacutem hỗ trợ quyết định vagrave nhoacutemcocircng nghệ phần mềm
51Nhoacutem tạo quyết định
MDM-Holsapple đatilde gợi yacute chuacuteng ta sử dụng giới hạn người tạo quyết định
Một nhoacutem lagrave kết cấu MDM nơi magrave nhiều người ra quyết định hoagraven toagraven tương taacutec
Một đội lagrave kết cấu MDM nơi caacutec thagravenh viecircn tư vấn cho người đưa ra quyết định nhưng khocircng tương taacutec
Một Ủy ban lagrave kết cấu MDM với một người tạo quyết định duy nhất vagrave sự tương taacutec giữa caacutec thagravenh viecircn
Mạng thocircng tin
Mạng lưới baacutenh xe mỗi người tham gia coacute thể giao tiếp với người đưa ra quyết định ở trung tacircm nhưng khocircng phải với người tham gia khaacutecCấu truacutec nagravey lagrave khocircng thỏa matilden tất cả những người tham gia ngoại trừ người ra quyết định
Mạng dacircy chuyền Tham gia chuyển tiếp thocircng tin chỉ để noacute luocircn liền kề nhau trong chuỗi
Thagravenh viecircn cuối cugraveng ko được đaacutep ứng
Mạng vograveng trograven Tương tự như chuỗi nhưng kết thuacutec được kết nối
Mạng kết nối hoagraven toagraven khocircng coacute hạn chế về giao tiếp vagrave tương taacutec giữa caacutec thagravenh viecircnNoacutei chungnoacute đaacutep ứng hầu hết caacutec kết nối của người tham gia nhưng truyền đạt thocircng tin mất nhiều thời gian vagrave coacute nhiều cơ hội xảy ra lỗi
Nhoacutem hagravenh vi vagrave chuẩn mực
MDMs thiết lập caacutec chỉ tiecircu hướng dẫn quaacute trigravenh ra quyết định
Một chuẩn mực quy định cụ thể những gigrave thagravenh viecircn trong nhoacutem dự kiến sẽ lagravem trong những hoagraven cảnh nhất định
Quy tắc gửi coacute thể được thocircng qua viacute dụ đaacutenh giaacute ngang hagraveng hoặc xử phạt
Lagravem thế nagraveo để đưa ra quyết định
Việc chọn lựa magrave trong đoacute việc sử dụng cấu truacutec MDM phải được dựa trecircn một số yếu tố liecircn quan với bối cảnh quyết định
Viacute dụmột cấu truacutec riecircng lẻ sẽ lagravem việc nơi magrave quyết định được cấu truacutec cao vagrave thocircng tin lagrave coacute sẵn
Một ủy ban cơ cấu sẽ lagrave sự lựa chọn khi người ra quyết định khocircng thể đưa ra quyết định một migravenh
52Caacutec vấn đề thường gặp trong nhoacutem
Kiacutech thước Noacutei chung sự nhất triacute vagrave gắn kết giữa caacutec thagravenh viecircn tỉ lệ nghịch với phạm vi nhoacutem Trong nhoacutem lớn rất dễ higravenh thagravenh caacutec nhoacutem nhỏ vagrave hoạt động rời rạc
Tư duy tập thể Trong nhoacutem lớn mọi người coacute xu hướng suy nghĩ đểđạtđược sự nhất triacute necircn khocircng phaacutet huy được sự saacuteng tạo
Caacutec vấn đề về xatilde hội
Xung đột Trong 1 nhoacutem ai cũng muốn migravenh lagrave giỏi nhất necircn dễ dẫn đến xung đột
Ẩn danh(Giấu tecircn) Đacircy lagrave phương phaacutep được sử dụng để kiểm soaacutet xung đột Cho caacutec thagravenh viecircn tham gia ẩn danh
Vấn đề giới tiacutenh Nam vagrave nữ thường coacute những thế mạnh khaacutec nhau điều nagravey coacute thể lagrave sức mạnh trong 1 thiết lập MDM
Đagravem phaacuten vagrave quyết định
Một quyết định coacute thể liecircn quan đến nhiều quan điểm khaacutec nhau vigrave thế cần phải coacute sự đagravem phaacuten
Caacutec thiết kế của cơ chế hỗ trợ cho MDM phải phugrave hợp với caacutec hoạt độngđagravemphaacuten
Những hoạt động nagravey bao gồm việc thu nhận yacute kiến của caacutec thagravenh viecircn 1 caacutech cocircng bằng
53Cocircng nghệ hỗ trợ MDM
Organizational DSSndash 1 hệ thống cung cấp caacutec quyết định hỗ trợ
Group Support Systemndash Cocircng nghệ sử dụng sự hỗ trợ của nhiều becircn tham gia
Group DSS ndash Lagrave 1 hệ thống được thiết kế đặc biệt để hỗ trợ cho MDM
DSS ndash Lagrave 1 hệ thống dưới sự kiểm soaacutet của 1 người quyết định hệ thống nagravey cung cấp 1 bộ cocircng cụ giuacutep phacircn tiacutech hoagraven cảnh đểđưa ra quyết định vagrave nacircng cao hiệu quả của quyết địnhđoacute
53Cocircng nghệ hỗ trợ MDM
Organizational DSSndash 1 hệ thống cung cấp caacutec quyết định hỗ trợ
Group Support Systemndash Cocircng nghệ sử dụng sự hỗ trợ của nhiều becircn tham gia
Group DSS ndash Lagrave 1 hệ thống được thiết kế đặc biệt để hỗ trợ cho MDM
DSS ndash Lagrave 1 hệ thống dưới sự kiểm soaacutet của 1 người quyết định hệ thống nagravey cung cấp 1 bộ cocircng cụ giuacutep phacircn tiacutech hoagraven cảnh đểđưa ra quyết định vagrave nacircng cao hiệu quả của quyết địnhđoacute
Mục tiecircu của cocircng nghệ hỗ trợ MDM
Quy trigravenh hỗ trợ tập trung vagraveo quaacute trigravenh tạo điều kiện thuận lợi cho sự tương taacutec
Cơ chế cấu truacutec quaacute trigravenh chi phối caacutec hoạt động truyền thocircng
Nhiệm vụ hỗ trợ cocircng việc coacute thể chọn lựa tổ chức hoặc lấy thocircng tin
Nhiệm vụ cấu truacutec cocircng việc cho pheacutep truy cập đến kỹ thuật lọc kết hợp phacircn tiacutech kiến thức liecircn quan đến cocircng việc
Caacutec lớp loại cocircng nghệ hỗ trợ MDM
Phacircn loại theo đặc điểm do DeSanctis vagrave Gallupe đưa ra đề xuất một chương trigravenh ba cấp dựa trecircn caacutec tiacutenh năng được cung cấp
Hệ thống cấp 1 Mục điacutech chiacutenh lagrave tạo điều kiện thocircng tin liecircn lạc giữa caacutec thagravenh viecircn
Hệ thống cấp 2 Thiết kế để giảm thiểu rủi ro
Hệ thống cấp 3 Giuacutep điều chỉnh xử lyacute quyết định
Phacircn loại theo cocircng nghệ -Kraemer vagrave King tập trung vagraveo cocircng nghệ aacutep dụng
Cocircng nghệ bảng mạch điện tử
Hội nghị trực tuyến
Mạng lưới tập đoagraven
Trung tacircm thocircng tin
Mocirci trường cộng taacutec
Phograveng quyết định
Nhoacutem phần mềm
Phần mềm được thiết kế để hỗ trợ sự hợp taacutec bao gồm việc thu huacutet vagrave lưu trữ thocircng tin
Caacutec tổ chức dẫn đầu thị trường hiện tại lagrave Lotus Notes and Domino Microsoft Exchange Novell GroupWise and Oracle Office
Caacutec cocircng cụ trong một bộ phần mềm bao gồm người quản lyacute hội nghị (Lotus Sametime) vagrave trao đổi thocircng điệp (Lotus Notes Mail)
Xếp hạng phần mềm cho nhoacutem
Ellis vv đề xuất một hệ thống xếp hạng dựa vagraveo kiểu sự hỗ trợ noacute Cung cấp
Hệ thocircng điệp
Hệ thống hội thảo truyền higravenh
Hệ thống cộng taacutec soạn thảo
Nhoacutem phacircn phối giải phaacutep phần mền
Hệ thống phối hợp
Hệ thống thocircng minh đại diện
Lực lượng điều khiển phaacutet triển phần mềm cho nhoacutem
Một số nhacircn tố chiacutenh bao gồm
Tăng năng suất
Giảm số lượng caacutec cuộc họp
Tăng cường tự động hoacutea caacutec quy trigravenh lagravem việc thường xuyecircn
Cần phối hợp toagraven cầu tốt hơn
Tiacutenh sẵn sagraveng của những mạng lan rộng
Coleman vagrave Khanna liệt kecirc 10 nhacircn tố khaacutec
54Quản lyacute hoạt động MDM (Mobile Device Management - Quản lyacute thiết bị di động)
Một số phương phaacutep phối hợp phổ biến hơnMDM lagrave
Kỹ thuật nhoacutem định danh
Kỹ thuật Delphi
Sự phacircn xử
Hệ thocircng tin dựa trecircn vấn đề
Nemawashi
Kỹ thuật nhoacutem định danh
1-Mỗi người tham gia viết ra những yacute tưởng về những gigrave necircn quyết định
2-Lần lượt mỗi người tham gia trigravenh bagravey yacute tưởng của migravenh được ghi lại trecircn bảng Khocircng thảo luận ở đacircy
3-Sau khi tất cả caacutec yacute tưởng được trigravenh bagravey caacutec đại biểu coacute thể chất vấn những người khaacutec
4-Mỗi người tham gia bỏ phiếu cho mỗi yacute tưởng
Kỹ thuật Delphi
Về cơ bản tương tự như kỹ thuật nhoacutem định danh ngoại trừ những người khocircng bao giờ tham gia cuộc họp
Một cocircng cụ khảo saacutet được sử dụng để thu thập đầu vagraveo ban đầu từ caacutec thagravenh viecircn
Một cuộc khảo saacutet thứ hai được gửi đi với một bản toacutem tắt caacutec kết quả chung
Những bước lặp lại cho đến khi đạt được một sự đồng thuận hoặc nhigraven nhận của đa số
Sự phacircn xử(Arbitration )
Thiacutech hợp nhất khi caacutec thagravenh viecircn của MDM đại diện cho caacutec yếu tố đối lập
Những người tham gia đồng yacute rằng nếu lựa chọn thay thế hai becircn thỏa thuận khocircng được tigravem thấy thigrave một trọng tagravei viecircn becircn ngoagravei sẽ tham gia
Trọng tagravei sau đoacute lựa chọn thay thế ocircng hoặc xeacutet thấy thiacutech hợp nhất
Hệ thống thocircng tin dựa trecircn vấn đề (IBIS)
Lagrave một phương phaacutep lập luận cấu truacutec
Một đại diện cho IBIS lagrave một đồ thị với caacutec nuacutet vagrave caacutec liecircn kết
IBIS bắt đầu với lựa chọn của một nuacutet vấn đề gốc sau đoacute caacutec nuacutet vị triacute khaacutec nhau được liecircn kết với nuacutet gốc
Caacutec nuacutet vị triacute nagravey sau đoacute được đaacutenh giaacute dựa trecircn những lập luận gắn liền với chuacuteng
Nemawashi (được sử dụng rộng ratildei tại Nhật Bản)
1-Một hoặc nhiều thagravenh viecircn của MDM được chỉ định lagrave điều phối viecircnCaacutec điều phối viecircn sau đoacute chọn người tham gia cograven lại
2-Điều phối viecircn xacircy dựng một tổng hợp caacutec sự lựa chọn vagrave sau đoacute caacutec chuyecircn gia đaacutenh giaacute caacutec lựa chọn
3-Điều phối viecircn lựa chọn một sự lựa chọn dựa trecircn kết quả ở trecircn(ở 2)
4-Sự thay thế được luacircn chuyển điều phối viecircn tigravem kiếm sự đồng thuận thocircng qua sự thuyết phục vagrave đagravem phaacuten
5-Nếu đạt được sự đồng thuận điều phối viecircn cho lưu thocircng một tagravei liệu magrave mỗi thagravenh viecircn MDM để lại dấu hiệu trecircn đoacute
55Nơi lagravem việc ảo
Nhiều tổ chức trecircn toagraven thế giới kinh doanh bất động sản cho cocircng nghệ hợp taacutec
Cocircng việc được trở thagravenh một điều bạn lagravem hơn lagrave một nơi bạn đi
Những thay đổi lớn nhất mang lại bởi nơi lagravem việc ảo coacute thể lagrave về văn hoaacute hay xatilde hội hơn lagrave về cocircng nghệ
Chương 6 Hệ thống thocircng tin điều hagravenh
61 Yacute nghĩa của EIS- Hệ thống thocircng tin điều hagravenh
- EIS lagrave một dạng đặc biệt của DSS được thiết kế để hỗ trợ ra quyết định ở cấp cao nhất của một tổ chức
- Lagrave một hệ thống thocircng tin hỗ trợ nhu cầu lập kế hoạch vagrave đaacutenh giaacute của caacutec nhagrave quản lyacute điều hagravenh
- EIS coacute thể giuacutep một CEO coacute được bức tranh tổng thể chiacutenh xaacutec nhất về caacutec hoạt động vagrave một bản toacutem tắt những gigrave magrave đối thủ cạnh tranh đang lagravem
- Caacutec hệ thống nagravey noacutei chung hoạt động dễ dagraveng vagrave trigravenh bagravey thocircng tin theo những caacutech dễ hiểu để việc tiếp thu được nhanh choacuteng (biểu đồ đồ thịhellip)
(Tagravei liệu thecircm EIS lagrave những loại hệ thống lagrave rất phức tạp trong tự nhiecircn Coacute thể noacutei hệ thống nagravey cũng cung cấp cho caacutec nhagrave quản lyacute với caacutec thiết bị coacute khả năng ra quyết định bằng caacutech sử dụng của noacute Hệ thống nagravey hoạt động trong điều kiện như vậy quan trọng như trong caacutec hệ thống khaacutec khocircng hỗ trợ Khả năng lưu trữ dữ liệu nặng lagravem cho noacute lyacute tưởng để được thocircng qua khocircng chỉ bởi caacutec doanh nghiệp lớn magrave cograven bởi caacutec doanh nghiệp nhỏ hơn Nhigraven chung hệ thống nagravey lagrave dagravenh cho caacutec nhacircn viecircn cấp cao hỗ trợ thagravenh thạo trong việc đưa ra caacutec quyết định quan trọng)
Caacutec phiecircn EIS tiecircu biểu- Phiecircn lagravem việc coacute thể bắt đầu với một baacuteo caacuteo về tigravenh higravenh tagravei chiacutenh vagrave kinh
doanh của một cocircng ty caacutec chỉ số hoạt động quan trọng được hiển thị rotilde ragraveng- EIS sẽ cho pheacutep caacutec giaacutem đốc điều hagravenh coacute thể đi sacircu vagraveo dữ liệu từ những con
số bất kỳ magrave noacute hỗ trợ- Việc điều hagravenh coacute thể lựa chọn một mức độ chi tiết ( VD danh số baacuten hagraveng) nếu
như cần điều tra thecircm- Lagrave một phương phaacutep tiếp cận coacute thể giuacutep việc ra quyết định tốt hơn
Những điều magrave EIS ko coacute- EIS khocircng phải lagrave sự thay thế cho caacutec hệ thống dựa trecircn caacutec maacutey tiacutenh khaacutec EIS
thực sự chỉ cung cấp dữ liệu cho caacutec hệ thống nagravey- Noacute khocircng thể biến caacutec bộ hệ điều hagravenh của maacutey tiacutenh thagravenh những ldquochuyecircn viecircn
giỏirdquo- Coacute thể được viacute một caacutech cao hơn như lagrave một trợ lyacute đaacuteng tin cậy coacute thể được gọi
đến bất khi nagraveo vagrave mỗi khi cần thiết
Tagravei liệu thecircm Sự khaacutec nhau giữa EIS vagrave DSS+ EIS thiết kế để hỗ trợ những người điều hagravenh cấp cao giuacutep họ khaacutem phaacute caacutec vấn đề vagrave caacutec cơ hội DSS hỗ trợ những nười phacircn tiacutech cố gắng trả lời cacircu hỏi caacutei gigrave coacute thể lagravem cugraveng với một cơ hội hoặc một vấn đề
Chiều EIS DSSNhững người sử dụng thocircng thường
Duyệt dữ liệu đi xuống truy xuất trạng thaacutei
Hỗ trợ phacircn tiacutech vagrave quyết định
Sự thuacutec đẩy Tiacutenh thiacutech hợp Tiacutenh hiệu quảỨng dụng Queacutet mocirci trường đaacutenh giaacute
hiệu suất nhận dạng caacutec vấn đề vagrave caacutec cơ hội
Caacutec quyết định quản lyacute trecircn caacutec lĩnh vực đa dạng
Hỗ trợ quyết định Caacutec chiacutenh saacutech caacutec quyết định khocircng coacute cấu truacutec ở mức cao vagrave hỗ trợ giaacuten tiếp
Hỗ trợ caacutec quyết định lặp lại caacutec quyết định khocircng thể đoaacuten trước ra quyết định khocircng coacute cấu truacutec vagrave baacuten cấu truacutec
Loại thocircng tin Caacutec thocircng tin tin tức thocircng tin becircn ngoagravei về khaacutech hagraveng đối thủ cạnh tranh mocirci trường caacutec baacuteo caacuteo theo yecircu cầu vagrave định thời về caacutec hoạt động becircn trong
Caacutec thocircng tin hỗ trợ caacutec tigravenh huống đặc biệt
Sử dụng coacute nguyecircn tắc
Dograve theo vết vagrave điều khiển nhận dạng cơ hội
Hoạch định tổ chức phacircn nhoacutem vagrave điều khiển
Khả năng phugrave hợp với những người sử dụng caacute nhacircn
Thiết kế loại ra quyết định cho mỗi người điều hagravenh caacute nhacircn bằng nhiều lựa chọn đầu ra
Cho pheacutep caacutec đaacutenh giaacute caacute nhacircn caacutec khả năng what-if lựa chọn loại hộp hội thoại
Đồ họa Phải coacute Lagrave một phần quan trọng của nhiều DSS
Thacircn thiện người sử dụng
Phải coacute Phải coacute nếu khocircng coacute người sử dụng trung gian
Xử lyacute thocircng tin Lọc neacuten thocircng tin dograve theo vết dữ liệu vagrave thocircng tin quan trọng
EIS kiacutech thiacutech caacutec cacircu hỏi caacutec cacircu trả lời bằng caacutech sử dụng DSS vagrave phản hồi lại EIS
Hỗ trợ caacutec thocircng tin chi tiết
Truy xuất thường xuyecircn caacutec mức chi tiết của bất kỳ thocircng tin tổng hợp nagraveo (duyệt dữ
Coacute thể coacute trong DSS nhưng khocircng thường
liệu chi tiết)Cơ sở mocirc higravenh Caacutec chức năng coacute sẵn bị hạn
chếLagrave điểm cốt lotildei của DSS
Cấu truacutec Theo người baacuten sản phẩm hoặc theo caacutec chuyecircn gia hệ thống thocircng tin
Theo người sử dụng hoặc caacute nhacircn hoặc caacutec chuyecircn gia từ caacutec trung tacircm thocircng tin hoặc phograveng ban hệ thống thocircng tin
Phần cứng Mainframe caacutec trạm RISC mạng LANs hoặc caacutec hệ thống phacircn bố
Mainframe caacutec trạm RISC caacutec maacutey PC hoặc caacutec hệ thống phacircn bố
Bản chất caacutec goacutei phần mềm
Truy xuất tương taacutec dễ dagraveng đến nhiều cơ sở dữ liệu truy xuất trực tuyến caacutec khả năng DBMS phức tạp caacutec liecircn kết phức tạp
Caacutec khả năng tiacutenh toaacuten lớn caacutec ngocircn ngữ mocirc higravenh mocirc phỏng ứng dụng vagrave caacutec bộ tạo DSS
Bản chất caacutec thocircng tin
Trigravenh bagravey thocircng tin được phaacutet sinh trước về quaacute khứ vagrave hiện tại tạo caacutec thocircng tin mới về quaacute khứ hiện tại tương lai
Tạo thocircng tin mới về quaacute khứ hiện tại tương lai
62 Lịch sử EIS- EIS xuất hiện lần đầu tiecircn tại MIT vagraveo những năm 1970
- Những EIS đầu tiecircn được phaacutet triển bởi caacutec doanh ngiệp lớn sẵn sagraveng chấp nhận rủi ro để đạt được lợi thế cạnh tranh
- Vagraveo những năm 1980 caacutec nhagrave cung cấp đatilde phaacutet triển một số cơ sở khaacutech hagraveng rộng vagrave cocircng nghệ EIS được tiếp tục phaacutet triển cho đến ngagravey nay
(Tagravei liệu thecircm Sử dụng DSSEIS cho phaacutet triển bền vững + Một số nghiecircn cứu đatilde được tiến hagravenh để kiểm tra việc thực hiện của EIS trong khu vực cocircng cộng vagrave chiacutenh phủ caacutec nước tổ chức kể từ khi chuacuteng được phaacutet triển theo định hướng lợi nhuận cho caacutec cocircng ty tư nhacircn (Hasan vagrave Hasan năm 1997) Theo một nghiecircn cứu tiến hagravenh tại Mỹ ở hơn 300 cocircng ty kết quả cho thấy sự khaacutec biệt của EIS giữa tư nhacircn vagrave chiacutenh phủ một số kết quả thuacute vị được phaacutet hiệnViacute dụ khoacute khăn hơn để chuyển tiền từ một tagravei khoản khaacutec trong một EIS của chiacutenh phủ cũng lagrave khoacute khăn hơn để biện giải thiacutech cho những chi phiacute phaacutet triển EIS của chiacutenh phủ Một nghiecircn cứu khaacutec được tiến hagravenh ở Australia
cho thấy rằng EIS cung cấp cho quản lyacute một higravenh ảnh chiacutenh xaacutec hơn về tổ chức thực hiện vagrave cung cấp hỗ trợ cho caacutec lợi iacutech chiến lược cải thiện khocircng chỉ cho caacutec nhagrave quản lyacute nhưng cograven cho phần cograven lại của tổ chức Dựa trecircn caacutec hệ thống được thiết kế cho caacutec cocircng ty tư nhacircn với một caacutech rotilde ragravengxaacutec định mục tiecircu EIS lagrave thiacutech hợp cho caacutec tổ chức cocircng cộng hiện đại nhưng cần phải được linh hoạt hơn vagrave kết thagravenh chugravem một phạm vi rộng hơn khả năng vagrave phương tiện hơn so với khu vực tư nhacircn ban đầu theo định hướng sản phẩm (Hasan vagrave Hasan năm 1997) Điều nagravey coacute thể lagrave do thực tế rằng caacutec hoạt động khu vực cocircng lagrave bắt buộc coacute taacutec động rộng phải đaacutep ứng sự mong đợi duy nhất cocircng cộng thường coacute mục tiecircu mơ hồ vagrave macircu thuẫn iacutet quyền tự chủ vagrave kiểm soaacutet việc ra quyết định vagrave nhacircn viecircn lagrave khoacute khăn hơn (Watson vagrave Carte2000) + Toacutem lại EIS lagrave một khaacutei niệm thagravenh cocircng noacute phaacutet triển qua nhiều năm tuy nhiecircn EIS khắc phục khiếm khuyết của migravenh bằng caacutech tiến hagravenh nghiecircn cứu liecircn tục)
63 Tại sao những người điều hagravenh hagraveng đầu lại khaacutec nhau- Họ lagrave những doanh nghiệp theo định hướng coacute suy nghĩ
- Coacute một khoảng khocircng gian rộng để kiểm soaacutet
- Họ chịu traacutech nhiệm cho việc thiết lập chiacutenh saacutech
- Họ đại diện cho tổ chức mocirci trường becircn ngoagravei
- Hagravenh động của họ tạo ra những kết quả đaacuteng kể về tagravei chiacutenh vagrave con người
Tần số caacutec hoạt động điều hagravenh- Xử lyacute xaacuteo trộn 42
- Hoạt động kinh doanh 32
- Phacircn bổ nguồn lực 17
- Đagravem phaacuten 3
- Những điều khaacutec 6
Handling Disturbances 42
Entrepreneurial Activites 32
Resource Allocation 17
Negotiation 3
Other 6
Những thocircng tin điều hagravenh cần thiết- Quản lyacute xaacuteo trộn coacute thể yecircu cầu sự chuacute yacute xung quanh đồng hồ
- Hoạt động kinh doanh yecircu cầu điều hagravenh để dự đoaacuten những thay đổi trong mocirci trường
- Nhiệm vụ phacircn bổ tagravei nguyecircn yecircu cầu lựa chọn người quản lyacute vagrave caacutec nguồn lực hạn chế được triển khai
- Đagravem phaacuten yecircu cầu cập nhật thocircng tin từng phuacutet để coacute thể xacircy dựng được sự đồng thuận
Caacutec loại thocircng tin điều hagravenh- Hệ thống kế toaacuten coacute liecircn quan đến việc tiacutenh toaacuten thu nhập hoạt động cho caacutec lĩnh
vực cụ thể lagrave quan trọng hơn so với caacutec hệ thống kế toaacuten truyền thocircng- Thocircng tin về thị trường khaacutech hagraveng cung cấp giaacute trị trong việc quyết định chiến
lược- Caacutec thocircng tin cần thiết thường được truyền đi trecircn một số hệ thống maacutey tiacutenh vagrave
nằm trong toagraven tổ chức- Caacutec thocircng tin được sử dụng thường lagrave ngắn hạn vagrave dễ thay đổi
Phương thức để xaacutec định thocircng tin cần thiết
Rockart xaacutec định được năm phương thức cơ bản để xaacutec định thocircng tin cần thiết
- Phương thức dựa trecircn kết quả- Phương thức rỗng- Phương thức chỉ số khoacutea- Phương thức tổng hợp nghiecircn cứu- Phương thức dựa vagraveo nhacircn tố then chốt dẫn đến thagravenh cocircng
64 Thagravenh phần EIS
- Sản phẩm EIS đầu tiecircn được phaacutet triển để sử dụng trecircn maacutey tiacutenh cấu higravenh cao nhưng caacutec sản phẩm hiện nay nhằm mục tiecircu lagrave nền tảng ClientServer
- Những nền tảng linh hoạt hơn coacute thể thiacutech ứng với thay đổi trong tổ chức vagrave cocircng nghệ
- Sử dụng dữ liệu thời gian thực dẫn đến quyết định nhanh hơn nhiều thocircng tin hơn
Thagravenh phần phần cứng- Một EIS khocircng đogravei hỏi coacute phần cứng cụ thể hoặc duy nhất nagraveo- Chigravea khoacutea của vấn đề lagrave để đảm bảo rằng caacutec thagravenh phần của EIS tối ưu hoacutea vagrave
phugrave hợp với tagravei nguyecircn maacutey tiacutenh của tổ chức- Hệ thống nagravey phải được cấu higravenh để caacutec nguồn tagravei nguyecircn phugrave hợp với những
người điều hagravenh chuacuteng
Thagravenh phần phần mềm- Traacutei ngược với phần cứng phần mềm thường được chuyecircn mocircn hoacutea cao cho caacutec
bagravei toaacuten về miền- Sự chuyecircn mocircn hoacutea nagravey thường đạt được bằng caacutech sử dụng thagravenh phần off-the-
shelf cho toagraven bộ EIS vagrave caacutec mocirc-đun tugravey chỉnh để đaacutep ứng nhu cầu cụ thể- Lotus Notes lagrave một viacute dụ điển higravenh Noacute coacute thể được sử dụng một migravenh hoặc coacute
thể phục vụ becircn thứ ba mocirc-đun plug-in
Cocircng nghệ EIS hiện nay
Dobrzeniecki đề xuấtphacircn loạitừng cấptheo bachức năng- Loại 1 sản phẩm bao gồmmột bộ đầy đủcaacutec ứng dụngtừ mộtnhagrave cung cấp- Loại 2 sản phẩm đượcthựchiệnở phần đầu củacaacutecsản phẩmDSS đượcphaacutet triển
bởicugravengmộtnhagrave cung cấp- Loại 3 sản phẩmkết hợp với nhautheo bất kỳ số lượngthuộc sở hữu củacocircng ty
65 Xacircy dựng EIS
- Xacircy dựngmộtEISgiống nhưxacircydựngmột số hệ thống khaacutec củamocirc higravenh hệ thống thocircng tin
- Việcphaacutet triểncấu truacutecnecircn được theo dotildeitừ quaacute trigravenh thiết kế đến quaacute trigravenhthực hiện
- Tuy nhiecircn một dự aacuten phaacutet triển EIScoacute xu hướnglagrave thống nhấtvagraveyecircu cầu hỗ trợ caacutec nhagrave quản lyacute latildenh đạo
- Xacircy dựng một EIScoacute thểphaacutet hiện ra đượccaacutectigravenh huống khoacute khănmagravemột nhagrave phaacutet triển chưabao giờ gặp phải
Mocirc higravenh EIS
Khung phaacutet triển một EIS
- Watson et al đề nghị xacircy dựngkhung với ba thagravenh phần+ Caacutech tiếp cận tập trung vagraveo yếu tốcon người vagrave dữ liệu coacute liecircn quan đến EIS+ Quaacute trigravenh phaacutet triển cần sự linh hoạt vagrave tương taacutec+ Người sử dụng - hệ thống hộp thoại bao gồm một ngocircn ngữ hagravenh động để xử lyacute caacutec lệnh
Lợi iacutech của EIS- Dễ duy trigrave caacutec mục tiecircu coacute tổ chức- Dễ truy xuất thocircng tin- Cho pheacutep người sử dụng nacircng cao hiệu suất hơn
- Tăng chất lượng ra quyết định- Cung cấp sự cải tiến cạnh tranh- Tiết kiệm thời gian của người sử dụng- Tăng khả năng vagrave chất lượng giao tiếp- Cung cấp khả năng điều khiển tốt hơn trong tổ chức- Cho pheacutep tham gia caacutec vấn đề vagrave caacutec cơ hội- Cho pheacutep hoạch định- Cho pheacutep tigravem kiếm nguyecircn nhacircn của một vấn đề- Thảo matilden caacutec yecircu cầu của người điều hagravenh
Hạn chế của EIS vagrave 1 số sai lầm cần traacutenh
- Chi phiacute một cuộc khảo saacutetnăm1991 chothấychi phiacute phaacutet triểntrungbigravenh365000USDvớichi phiacute vận hagravenhhagraveng năm lagrave$200000 (EIS)
- Cocircng nghệ hạn chếEIScần phảiđượctiacutech hợp hoagraven toagravenvagraveokiếntruacuteccủadoanh nghiệphiện tại do đoacute noacutelagrave một thaacutech thứclớn đối vớithiết kế
- Hạn chế tổ chức cơ cấu tổ chứccoacute thể khocircng phugrave hợp
Sự hạn chế về tổ chức- Chương trigravenh nghị sự vagrave thời gian chệch EIS mocirc tả một phần việc thực hiện một
chương trigravenh nghị sự vagrave coacute thể dễ dagraveng đạt được sự tin cậy một caacutech chắc chắn- Đồng bộ hoacutea việc quản lyacute sự tin cậy đuacuteng luacutec đặc biệt baacuteo caacuteo EIS coacute thể phaacute
vỡ sự ổn định thiết lập caacutec chu trigravenh baacuteo caacuteo một caacutech tốt nhất- Sự bất ổn EIS phản ứng nhanh coacute thể gacircy ra việc taacutec động trở lại một caacutech
nhanh choacuteng dẫn đến sự thiếu ổn định trong tổ chức
Sự thất bại lagrave thay thế khocircng thể chấp nhận được- Một số yếu tố lagravem EIS thất bại
+ Thiếu sự hỗ trợ về mặt quản lyacute+ Vấn đề chiacutenh trị+ Thất bại của nhagrave phaacutet triển+ Lỗi về cocircng nghệ+ Giaacute cả+ Thời gian
66 Ra quyết định điều hagravenh trong tương lai vagrave EIS
- Coacute một vagravei điều kiện sẽ được hợp nhất cho việc chuyển đổi cocircng nghệ Trong đoacute một vagravei điều kiện coacute thể dễ dự đoaacuten Hai điều kiện magrave ta coacute thể thấy lagrave+ Phaacutet triển cocircng nghệ maacutey tiacutenh trong việc điều hagravenh sẽ tạo ra sự chuyển đổi được chấp nhận một caacutech dễ dagraveng hơn+ Mở rộng traacutech nhiệm điều hagravenh sẽ mở rộng nhu cầu thocircng tin
Tương lai của EIS- EIS thocircng minh Những tiến bộ trong cocircng nghệ AI sẽ được triển khai trong caacutec
EIS- EIS đa phương tiện Cơ sở dữ liệu đa phương tiện sẽ cho pheacutep tiacutech hợp văn bản
giọng noacutei vagrave higravenh ảnh trong tương lai- EIS thocircng tin Tương lai EIS sẽ mở rộng hơn trong việc sử dụng dữ liệu becircn
ngoagravei doanh nghiệp- EIS kết nối Giao tiếp với băng thocircng rộng cho pheacutep kết nối liecircn thocircng lớn hơn
Chương 7 HỆ CHUYEcircN GIA VAgrave TRIacute TUỆ NHAcircN TẠO
71 Caacutec khaacutei niệm
72 Triacute thocircng minh của triacute tuệ nhacircn tạo
73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia
74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia
75 Lợi iacutech vagrave hạn chế của hệ chuyecircn gia
71 Caacutec khaacutei niệm
Chuyecircn mocircn (Expertise) sự hiểu biết rộng trong 1 lĩnh vực hẹp
Hệ chuyecircn gia (Expert Systems)1 chương trigravenh maacutey tiacutenh sử dụng 1 tập caacutec luật dựa trecircn tri thức của con người để giải quyết caacutec vấn đề đogravei hogravei phải coacute sự chuyecircn mocircn
Một số hệ chuyecircn gia nổi tiếng
DENDRAL (Standford 1960s Edward Feigenbaum)
MYCIN (Standford1970s Edward Shortliffe)
PROSPECTOR (MIT 1979)
Triacute tuệ nhacircn tạo (Artificial Intelligence ndash AI)
Triacute tuệ nhacircn tạo một bộ phacircn của ngagravenh khoa học maacutey tiacutenh quan tacircm đến việc thiết kế caacutec hệ thống maacutey tiacutenh thocircng minh đoacute lagrave caacutec hệ thống đưa ra caacutec đặc điểm magrave từ đoacute chuacuteng ta liecircn hệ với sự thocircng minh trong hagravenh động của con người (Barr vagrave Feigenbaum 1981)
Mục điacutech của AI
Mục điacutech khoa học xaacutec định caacutec gợi yacute để giải thiacutech caacutec loại khaacutec nhau của triacute tuệ thực
Mục điacutech kỹ thuật giải quyết caacutec vấn đề trong thế giới thực
Triacute tuệ nhacircn tạo kế thừa nhiều yacute tưởng quan điểm kỹ thuật từ caacutec ngagravenh khoa học khaacutec
- Triết học
- Logic Toaacuten học
- Tiacutenh toaacuten
- Khoa học tacircm lyacute Khoa học nhận thức
- Sinh học Thần kinh học
- Tiến hoacutea
Caacutec lĩnh vực ứng dụng trong Triacute tuệ nhacircn tạo
Mạng nơ ron thần kinh (Neural Networks)
Tiacutenh toaacuten sự tiến hoacutea
(Evolutionary Computation)
Hệ chuyecircn gia (Expert Systems)
Kỹ thuật xử lyacute tiếng noacutei (Speech Processing)
Kỹ thuật xử lyacute ngocircn ngữ tự nhiecircn
(Natural Language Processing)
Lập kế hoạch (Planning)
Robot (Robotics)
Khoa học higravenh ảnh (Vision)
Caacutec kỹ thuật thocircng dụng dugraveng trong AI
Biểu diễn(Representation)
Học (Learning)
Caacutec luật (Rules)
Tigravem kiếm (Search)
72 Triacute thocircng minh của triacute tuệ nhacircn tạo
Con người suy diễn như thế nagraveo
Phacircn loại (Categorization)
Caacutec quy tắc cụ thể
Heuristics
Kinh nghiệm trước đoacute
Dự tiacutenh trước
Maacutey tiacutenh suy diễn như thế nagraveo
Lập luận dựa trecircn luật IF-THEN mocirc tả tri thức được matilde hoacutea dưới dạng caacutec luật
Caacutec khung (Frames) lagrave caacutec đại diện mocirc tả caacutec tigravenh huống giống nhau lagrave điển higravenh của một vagravei phacircn loại
Lập luận dựa trecircn caacutec trường hợp mocirc phỏng giải phaacutep trước đoacute cho một vấn đề hiện tại
Nhận dạng mẫu phaacutet hiện acircm thanh higravenh dạng hoặc caacutec chuỗi dagravei
Caacutec dạng khaacutec của Triacute tuệ nhacircn tạo
Học maacutey- mạng nơron vagrave giải thuật di truyền
Lập trigravenh tự động ndash lagrave những kỹ thuật tạo ra caacutec chương trigravenh để lagravem 1 nhiệm vụ riecircng biệt (cho pheacutep những người khocircng phải lagrave người lập trigravenh coacute thể lập trigravenh được)
Cuộc sống nhacircn tạo ndash nỗ lực để taacutei tạo caacutec hiện tượng sinh học trong caacutec hệ thống dựa trecircn maacutey tiacutenh
73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia(Expert Systems- ES)
Theo Jackson (1999) Một hệ chuyecircn gia lagrave một chương trigravenh maacutey tiacutenh mocirc tả vagrave suy diễn với tri thức của một vagravei lĩnh vực để giải quyết vấn đề hay đưa ra caacutec lời khuyecircn
Cấu truacutec cơ bản của ES được dựa theo cấu truacutec chung của DSS Sự khaacutec biệt chiacutenh giữa ES vagraveDSS lagrave hệ ES thu thập caacutec kiến thức từ những
chuyecircn gia trong lĩnh vực quan tacircmĐặc trưng của hệ chuyecircn gia Hiệu quả cao Thời gian trả lời thỏa đaacuteng Độ tin cậy cao Dễ hiểu
Giao diện người dugraveng trong ES
Thiết kế giao diện người dugraveng tập trung vagraveo caacutec yếu tố như dễ dagraveng sử dụngcoacute độ tin cậy cao giảm tải những khoacute khăn khi sử dụng
Thiết kế necircn coacute một số tương taacutec (đầu vagraveo kiểm soaacutet vagrave truy vấn)
Cấu tạo giao diện người dugraveng gồm coacute magraven higravenh cảm ứng bagraven phiacutem buacutet saacuteng lệnh thoại caacutec phiacutem chuyecircn dụng
Cơ sở tri thức (Knowledge Base)
Chứa đựng caacutec tri thức cụ thể miền thu được từ caacutec chuyecircn gia miền
Coacute thể chứa caacutec mocirc tả caacutec hagravenh vi giải quyết vấn đề caacutec ragraveng buộc caacutec heuristics
Thagravenh cocircng của một ES dựa trecircn tiacutenh đầy đủ vagrave tiacutenh chiacutenh xaacutec của cơ sở tri thức
Mocirc tơ suy diễn (Inference Engine)
Ở đacircy tri thức được đặt để sử dụng tạo ra caacutec giải phaacutep để giải quyết vấn đề
Mocirc tơ nagravey coacute khả năng thực hiện diễn dịch hoặc suy diễn dựa trecircn caacutec luật hay caacutec caacutec sự kiện
Đồng thời cũng coacute khả năng sử dụng caacutec suy diễn mờ hay khocircng chiacutenh xaacutec dựa trecircn xaacutec suất hay aacutenh xạ mẫu
Vograveng điều khiển suy diễn
1 Aacutenh xạ caacutec luật với caacutec sự kiện đatilde được cho
2 Chọn luật để thực hiện
3 Thực hiện luật bằng caacutech thecircm caacutec sự kiện được suy diễn ra vagraveo bộ nhớ lagravem việc
Chuỗi suy diễn (Chaining)
Suy diễn tiến (forward chaining) maacutey suy diễn bắt đầu từ dữ liệu ban đầu vagrave thực hiện việc suy luận để đưa ra caacutec kết luận cuối cugraveng
Suy diễn lugravei (backward chaining) maacutey suy diễn bắt đầu từ dữ liệu điacutech vagrave tigravem ra tri thức hỗ trợ cho dữ liệu điacutech đoacute
Viacute dụ suy diễn lugravei
R1 Nếu coacute A vagrave B thigrave suy ra coacute D
R2 Nếu coacute B thigrave suy ra coacute C
R3 Nếu coacute C vagrave D thigrave suy ra coacute E
Ta coacute E ta xem trong 3 luật R1 R2 R3 luật nagraveo coacute E ta thấy R3 chứa E đồng thời chứa C vagrave D Xeacutet tiếp trong 2 luật R1 R2 luật nagraveo chứa C vagrave D R2 chứa C R3 chứa D Từ đoacute ta coacute được caacutec tri thức hỗ trợ suy diễn vagrave kết luận lagrave nếu coacute A vagrave B thigrave sẽ coacute E Hay nếu A vagrave B đuacuteng thigrave sẽ coacute E
Viacute dụ suy diễn tiến
Giả sử coacute tập chứa 3 luật sau
R1 Nếu coacute A vagrave B thigrave suy ra coacute D
R2 Nếu coacute B thigrave suy ra coacute C
R3 Nếu coacute C vagrave D thigrave suy ra coacute E
Nếu ta coacute A vagrave B thigrave chuacuteng ta suy ra được D từ R1 vagrave suy ra C từ R2 Với D vagrave C đatilde được suy ra ở trecircn giờ chuacuteng ta suy ra được E từ R3
Viacute dụ thực tế
Giả sử muốn biết magraveu của một con vật nuocirci tecircn lagrave Fred biết rằng noacute kecircu ộp ộp vagrave ăn ruồi
Coacute tập 4 luật ban đầu như sau
R1 Nếu X kecircu ộp ộp vagrave ăn ruồi thigrave X lagrave con ếch
R2 Nếu X kecircu chiecircm chiếp vagrave biết hoacutet thigrave X lagrave con chim
R3 Nếu X lagrave con ếch thigrave X coacute magraveu xanh
R4 Nếu X lagrave con chim thigrave X coacute magraveu vagraveng
74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia
Expert system shells lagrave một tập caacutec goacutei phần mềm vagrave caacutec cocircng cụ dugraveng để phaacutet triển caacutec hệ chuyecircn gia
Những Expert system shells đầu tiecircn thường rất rườm ragrave Mặc dugrave vậy noacute vẫn giuacutep cho người sử dụng sẽ khocircng phải bắt đầu lại từ đầu khi xacircy dựng một hệ chuyecircn gia mới
Những shell hiện đại bao gồm hai mocirc-đun chiacutenh lagrave cocircng cụ xacircy dựng một tập quy tắc vagrave mocirc tơ suy diễn
Xacircy dựng hệ chuyecircn gia
Bước 1 xacircy dựng mocirc higravenh bagravei toaacuten xaacutec định vấn đề nhiệm vụ magrave hệ thống sẽ thực hiện Caacutec dạng bagravei toaacuten cần hệ chuyecircn gia
Bagravei toaacuten diễn giải (InterPretation)
Bagravei toaacuten dự baacuteo (Prediction)
Bagravei toaacuten chuẩn đoaacuten (Diagnose)
Bagravei toaacuten gỡ rối (Debugging)
Bagravei toaacuten thiết kế
Tương tự như một dự aacuten phần mềm để xacircy dựng một hệ chuyecircn gia cần phải coacute caacutec yếu tố về nhacircn lực tagravei nguyecircn vagrave thời gian Những yếu tố nagravey ảnh hưởng đến giaacute thah của một hệ chuyecircn giaTrong phần nagravey cacircu hỏi thường được đặt ra lagrave tại sao cần phải xacircy dựng một hệ chuyecircn giaTrước khi bắt đầu phải xaacute định rotilde bagravei toaacuten đạt ra lagrave jiAi lagrave chuyecircn giaAi lagrave người sử dụng
1 Diễn giải (InterPretation) Nghiecircn cứu 1 vấn đề -gt Dựa trecircn những biểu hiện thuộc tiacutenh đặc trưng becircn ngoagravei -gt Tư vấn
(hoặc đưa ra kết luận hay mocirc tả dễ hiểu từ tập dữ liệu thocirc)
2 Bagravei toaacuten dự baacuteo (Prediction) Coacute thể dự đoaacuten được hagravenh vi kết quả dựa trecircn caacutec hiện tượng -gt dự baacuteo
VD Dự baacuteo thời tiết động đấthellip
3 Bagravei toaacuten chẩn đoaacuten (Diagnoss) Xaacutec định caacutec lỗi caacutec bộ phận hỏng hoacutec của hệ thống dựa trecircn caacutec dữ liệu quan saacutet được
4 Bagravei toaacuten gỡ rối (Debugging) Mocirc tả caacutec phương phaacutep khắc phục hệ thống khi gặp sự cố
5 Bagravei toaacuten thiết kế Lựa chọn cấu higravenh caacutec đối tượng nhằm thoả matilden một số ragraveng buộc nagraveo đoacute
6 Giảng dạy Phần mềm dạy học coacute thể chuẩn đoaacuten vagrave sủa lỗi của học sinh trong quaacute trigravenh học tập
Để xaacutec định đuacuteng bagravei toaacuten magrave chuacuteng ta cần giải quyết thigrave phải trả lời đc một số cacircu hỏi
- cần hệ chuyecircn gia
Bước 2 thu thập tri thức lựa chọn cocircng cụ vagrave aacutep dụng
Trong bước thu thập tri thức vấn đề quan trọng lagrave lựa chọn chuyecircn gia những người magrave sẽ đoacuteng goacutep tri thức cho hệ thống Thocircng thường trong suốt quaacute trigravenh phaacutet triển thigrave chuyecircn gia được xem như một thagravenh viecircn của đội phaacutet triển
Hiện nay coacute rất nhiều cocircng cụ để xacircy dựng một hệ chuyecircn gia Phổ biến nhất lagrave JESS CLIPS vagrave OPS5
Bước 3 Thiết kế cơ sở tri thức thiết kế hệ thốngTri thức được biểu diễn trường minh trong cơ sở tri thức
Caacutec chuyecircn gia vagrave kỹ sư tri thức sẽ đối thoại với nhau bằng caacutec kỹ thuật đối thoại Suy diễn (SD) bảng Mocirc higravenh hoacutea SD quy nạp phacircn loại
Vấn đề bagraveo trigrave vagrave phaacutet triển
Caacutec hệ chuyecircn gia đogravei hỏi phải bảo trigrave vagrave phaacutet triển nhiều hơn so với caacutec hệ thống khaacutec Phải thường xuyecircn bổ sung tri thức mới vagrave thay đổi caacutec tri thức cũ để đổi mới hệ chuyecircn gia
Thu thập vagrave khắc phục lỗi do người sử dụng phaacutet hiện để kịp thời khắc phục những sai soacutet của hệ chuyecircn gia
75 Lợi iacutech vagrave hạn chế của caacutec hệ chuyecircn gia
Một số lợi iacutech chiacutenh
Thời gian trả lời hợp lyacute bằng hoặc nhanh hơn so với chuyecircn gia (người) để đi đến cugraveng một quyết định Hệ chuyecircn gia lagrave một hệ thống thời gian thực (real time system)
Khả năng trả lời với mức độ tinh thocircng bằng hoặc cao hơn so với chuyecircn gia (người) trong cugraveng lĩnh vực
Hệ chuyecircn gia giuacutep cho hiệu quả lagravem việc tăng bằng việc sử dụng tập caacutec luật một caacutech nhanh choacuteng magrave ko bị nhầm lẫn chuyecircn gia lagrave người coacute thể quecircn đi một số tri thức cơ sở lyacute luậ nhưng HCG thigrave ko
Quyết định của một người chuyecircn gia coacute thể bị thay đổi vagrave ko coacute tiacutenh thống nhất như quyết định của một hệ chuyecircn gia tạo ra
Hệ chuyecircn gia giuacutep cho người sử dụng coacute thể trau dồi sự hiểu biết trecircn lĩnh vuej cụ thể magrave noacute giải quyết hỗ trợ người ra quyết định coacute trigravenh độ như 1 chuyecircn gia trong quaacute trigravenh gia quyết định
Kiến thức của rất nhiều chuyecircn gia về một lĩnh vực nagraveo đoacute được đưa vagraveo hệ chuyecircn gia lagravem cho CSTT cuat HCG phong phuacute vagrave rộng lớn hơn rất nhiều
HCG giải thiacutech caacutec bước suy luận một caacutech dễ hiểu nhất quaacuten luacutec nagraveo cũng coacute thể sử dụng ko như chuyecircn gia con người
Hạn chế của caacutec hệ chuyecircn gia
Nhược điểm lớn nhất của hệ chuyecircn gia lagrave những yacute kiến chuyecircn mocircn thường rất khoacute matilde hoacutea vagrave giải neacuten
Hệ chuyecircn gia khocircng coacute khả năng tự học tự cập nhật kiến thức mới như caacutec chuyecircn gia magrave cần phải được matilde hoacutea lại khi noacute được cập nhật
Hệ chuyecircn gia khocircng thể nhận ra được vấn đề khocircng nằm trong miền kiến thức của hệ thống
Chương 8 Tri thức vagrave tiếp nhận
1 Bao gồm caacutec vấn đề
Dữ liệu thực tế đo lường hoặc quan saacutet coacute hoặc khocircng coacute bối cảnh
Thocircng tin dữ liệu được tổng hợp một caacutech hữu iacutech để giải quyết những khoacute khăn trong việc đưa ra quyết định
Tri thức bao gồm caacutec ứng dụng quy tắc thocircng tin hướng dẫn của người ra quyết định
2 Những caacutei nhigraven về tri thức
Đại diện lagravem thế nagraveo để diễn tả tri thức viacute dụ như một quyển saacutech khocircng phải lagrave tri thức nhưng noacute lại lagrave một đại diện của tri thức
Sản xuất tri thức lagrave một tập hơp của hagraveng tồn kho coacute thể được sản xuất cũng như mua lại
Tri thức lagrave 1 trong 6 trạng thaacutei của hệ thống
1Dữ liệu 2Thocircng tin 3Cấu truacutec thocircng tin 4Sự thấu hiểu 5Yacute kiến 6 Quyết định
3 Caacutec loại tri thức Phổ biến mocirc tả dữ liệu thocircng tin thủ tục mọi thứ lagravem như thế nagraveo lập luận chiacutenh saacutech hoặc caacutec quy tắc
4 Thu thập Tri thức hệ chuyecircn gia Hầu hết caacutec phương phaacutep đều bắt đầu với mocirc higravenh của caacutec taacutec vụ trong đoacute
hệ chuyecircn gia được xacircy dựng Trong đoacute mocirc tả về caacutec lĩnh vực được tạo ra Caacutec kỹ sư sử dụng caacutec mocirc higravenh giả thuyết vagrave nhận thức về quaacute trigravenh phacircn
tiacutech để gợi ra caacutech giải quyết vấn đề về tri thức từ caacutec chuyecircn gia
5 Caacutec chiều của thu thập tri thức KE- driven caacutec kỹ sư trao đổi trực tiếp với caacutec chuyecircn gia Expert-driven Caacutec chuyecircn gia trực tiếp đưa chuyecircn mocircn của họ vagraveo hệ
thống maacutey tiacutenh Machine-driven Sử dụng caacutec cocircng cụ suy luận để triacutech xuất tri thức từ một
tập caacutec viacute dụ
6 Kỹ thuật thu thập tri thức Trao đổi gồm 2 loại cơ bản lagrave coacute cấu truacutec(coacute kịch bản) vagrave khocircng coacute cấu
truacutec( đối thoại trực tiếp) Giao thức phacircn tiacutech bằng lời Khi caacutec chuyecircn gia thực hiện một cocircng việc
của họ thigrave một bản ghi về cocircng việc đoacute được thực hiện Caacutec kỹ sư sẽ xacircy dựng mocirc higravenh cho những gigrave được ghi lại trong bản ghi
Phương phaacutep sagraveng lọc caacutec chuyecircn gia so saacutenh caacutec nhoacutem liecircn tiếp trong ba đối tượng vagrave cho biết tại sao nhoacutem thứ hai lại khaacutec nhoacutem thứ ba
7 Thu thập tri thức từ nhiều nguồn Thu thập tri thức từ nhiều nguồn lagrave cần thiết để coacute được đầy đủ caacutec tri thức
cho một vấn đề quan điểm yacute kiến traacutei ngược nhau thường phaacutet sinh Phương phaacutep đồng thuận sẽ giuacutep giải quyết được vấn đề macircu thuẫn Kỹ thuật phacircn tiacutech Meta lagrave kỹ thuật được aacutep dụng trong caacutec trường hợp
khaacutec Caacutech tiếp cận bằng định lượng đogravei hỏi caacutec kỹ sư cần cacircn nhắc yếu tố đầu vagraveo của caacutec chuyecircn gia khaacutec nhau
8 Xaacutec nhận hợp lệ vagrave kiểm tra tri thức Một khi thu thập tri thức noacute phải được đaacutenh giaacute về khả năng sử dụng vagrave độ
chiacutenh xaacutec Hai vấn đề cụ thể lagrave hiệu lực của những kiến thức vagrave kiểm tra việc xacircy dựng cơ sở của tri thức
Cần xaacutec nhận xem liệu hệ thống coacute thể hoạt động ở mức độ tối thiểu khocircng
Xaacutec minh liecircn quan đến việc so saacutenh từng chi tiết kỹ thuật của hệ thống những gigrave đatilde được thực hiện cuối cugraveng
9 Một số caacutec biện phaacutep xaacutec nhận Độ chiacutenh xaacutec Khả năng thiacutech nghi Mức độ đầy đủ Bề rộng Độ sacircu Hiệu lực Tổng quan Chiacutenh xaacutec Hiện thực Độ tin cậy Tiacutenh hữu dụng Mức độ
Chương 9 Học maacutey
1 Logic mờ vagrave ngocircn ngữ mờ(Fuzzy Logic and Linguistic Ambiguity)
Ngocircn ngữ tự nhiecircn gồm những khaacutei niệm mơ hồ vagrave khocircng chiacutenh xaacutectruyền tải ngữ nghĩa thocircng qua tiacutenh xấp xỉkhocircng rotilde ragraveng
Những xấp xỉ nagravey giuacutep con người coacute thể truyền tải hết được yacute nghĩa nhưng maacutey thigrave khocircng hiểu
Lagravem sao biểu diễn caacutec tri thức sử dụng caacutec khaacutei niệm khocircng rotilde ragraveng(mờ) hoặc khocircng chiacutenh xaacutec
2 Khaacutei niệm cơ bản của logic mờ tập mờ lagrave những tập hợp khocircng coacute một giới hạn rotilde Mỗi phần tử của noacute chỉ
chứa một mức độ hagravem liecircn thuộc của từng phần tử Vigrave vậy tập mờ khocircng giống như tập cổ điển Tập mờ coacute thể kết hợp với nhau qua những luật mờ magrave đặc trưng cho những hagravenh động trạng thaacutei vagrave thuộc tiacutenh của logic mờ được tận dụng khi thực hiện một bộ điều khiển mờ
Logic mờ dựa trecircn yacute tưởng mỗi phần tử thuộc vagraveo một tập hợp ở một mức độ nagraveo đấy
Locircgic mờ cho pheacutep độ liecircn thuộc (microA )coacute giaacute trị trong khoảng (01) Locircgic mờ coacute thể được coi lagrave mặt ứng dụng của lyacute thuyết tập mờ để xử lyacute caacutec
giaacute trị trong thế giới thực cho caacutec bagravei toaacuten phức tạp
3 So saacutenh tiacutenh đuacuteng đắn logic mờ vagrave xaacutec suất Xaacutec suất thigrave đề cập đến khả năng xảy ra một biến cố hay một điều gigrave đoacute Logic mờ đề cập đến cấp độ magrave đặc tiacutenh ở hiện tại
o viacute dụ1 người coacute chiều cao 6 feet thigrave coacute cấp độ lagrave 05 về chiều cao
4 Ưu điểm của logic mờ Caacutech tiếp cận rất tự nhiecircnkhocircng phức tạp Coacute thể mocirc higravenh hoacutea caacutec hagravem phi tuyến tugravey yacute phức tạp
Coacute thể tận dụng được kinh nghiệm từ những chuyecircn gia hagraveng đầu trong mọi lĩnh vực
Logic mờ được xacircy dựng dựa trecircn ngocircn ngữ tự nhiecircnNền tảng của logic mờ lagrave dựa trecircn cơ sở giao tiếp của con người
5 Nhược điểm của logic mờ Trong 1 hệ thống phức tạpsử dụng logic mờ coacute thể trở thagravenh trở ngại cho
việc xaacutec thực độ tin cậy của hệ thống Cơ chế lập luận mờ khocircng thể học hỏi từ những lỗi sai
6 Mạng noron nhacircn tạo(ANN) Mạng noron nhacircn tạo lagrave một mocirc phỏng xử lyacute thocircng tinđược nghiecircn cứu ra
từ hệ thống thần kinh của sinh vậtgiống như bộ natildeo để xử lyacute thocircng tin ANNs lagrave chương trigravenh dựa trecircn maacutey tiacutenh đơn giản coacute chức năng lagrave một mocirc
higravenh bagravei toaacuten khocircng gian dựa trecircn thử nghiệm vagrave baacuteo lỗi
7 Học từ kinh nghiệm Tiến trigravenh Một mẫu dữ liệu được biểu diễn như một mạng lưới noronANN ldquodự
đoaacutenrdquo 1 đầu radự đoaacuten được so saacutenh với giaacute trị thực tế hoặc giaacute trị chiacutenh xaacutecNếu đoaacuten được chiacutenh xaacutec thigrave khocircng coacute hagravenh động nagraveo được thực hiện
Nếu dự đoaacuten sai ANN kiểm tra lại vagrave xaacutec định lại thocircng số để điều chỉnh Một mẫu dữ liệu khaacutec được biểu diễn vagrave quaacute trigravenh nagravey được lặp lại
8 Nguyecircn tắc cơ bản của cocircng nghệ nơron Caacutec yếu tố xử lyacute cơ bản trong hệ thống thần kinh của con người lagrave tế bagraveo
thần kinhMạng lưới của tế bagraveo nagravey lagrave liecircn kết với nhau nhận được thocircng tin từ caacutec cảm biến trong mắt taihellip
Thocircng tin nhận được bởi tế bagraveo thần kinh hoặc lagrave sẽ kiacutech thiacutech noacute(sẽ được chuyển qua 1 thocircng điệp dọc theo mạng lưới) hoặc lagrave sẽ ngăn cản noacute(ngăn cản dograveng thocircng tin)
Độ nhạy coacute thể thay đổi qua thời gian hoặc sau khi coacute được kinh nghiệm
9 Cấu truacutec mạng Một ANN gồm 3 lớp cơ bản
Lớp đầu vagraveo nhận dữ liệu Lớp becircn trong hoặc lagrave lớp ẩn xử lyacute dữ liệu Lớp đầu ra chuyển tiếp kết quả cuối cugraveng của mạng
10Mạng nơ ron Thường coacute nhiều đầu vagraveo mỗi đầu vagraveo với mức ảnh hưởng vagrave tầm quan
trọng riecircng của noacute Một đầu vagraveo quan trọng coacute thể được sử dụng để khuếch đại đầu ra caacutec hagravem trạng thaacutei tổng hợp caacutec trọng số của caacutec yếu tố
đầuvagraveo khaacutec nhauvagraveo một giaacute trị duy nhất Caacutec hagravem chuyển giao xử lyacute caacutec giaacute trị trạng thaacutei vagrave tạo đầu ra
11Huấn luyện mạng nơ ron Trong mocirc higravenh coacute giaacutem saacutetANN được đến so saacutenh dự đoaacuten của chiacutenh
noacute với thocircng tin phản hồi coacute chứa caacutec kết quả mong muốn ANN sẽ phải tigravem caacutech thay đổi caacutec tham số becircn trong củamigravenh (caacutec trọng số vagrave caacutec ngưỡng) để tạo necircn một aacutenh xạ coacute khả năng aacutenh xạcaacutec đầu vagraveo thagravenh caacutec đầu ra mong muốn Sự thay đổi nagravey được tiến hagravenh nhờ việc so saacutenh giữa đầu ra thực sự vagrave đầu ra mong muốn
Trong mocirc higravenh khocircng coacute giaacutem saacutetANN nhận được dữ liệu vagraveo nhưng khocircng phải coacute bất kỳ thocircng tin phản hồi về kết quả mong muốn
Phần lớn caacutec ứng dụng nằm trong vugraveng của caacutec bagravei toaacuten ước lượng như mocirc higravenh hoacuteathống kecirc neacuten lọc phacircn cụm
12Lợi iacutech Liecircn kết với mạng noron Traacutenh caacutech lập trigravenh tường minh Giảm nhu cầu của chuyecircn gia ANNs thigrave thiacutech nghi với caacutec yếu tố đầu vagraveo thay đổi Khocircng cần thiết cho cơ sở tri thức tinh chế ANNs coacute tiacutenh động vagrave cải thiện với việc sử dụng Coacute khả năng xử lyacute dữ liệu khocircng chiacutenh xaacutec hoặc khocircng đầy đủ Cho pheacutep tổng quaacutet hoacutea từ thocircng tin cụ thể Cho pheacutep thu thập cảm giaacutec thocircng thường vagraveo miền giải quyết vấn đề
13Hạn chế của việc liecircn kết với mạng noron ANNs khocircng thể giải thiacutech được suy luận Bản chất hộp đen thường khiến cho vấn đề traacutech nhiệm vagrave độ tin cậy phaacutet
sinh lagrave khoacute khăn Lặp đi lặp lại quaacute trigravenh huấn luyện rất tốn thời gian Nguồn lực caacutec nhagrave phacircn tiacutech vagrave thiết kế coacute tay nghề cao vẫn lagrave đaacuteng lo
ngại Cocircng nghệ ANN thuacutec đẩy hạn chế của phần cứng hiện tại ANN yecircu cầu phải coacute sự tin tưởng ở đầu ra
14Giới thiệu về thuật toaacuten di truyền Cũng như mạng lưới thần kinh caacutec thuật toaacuten di truyền được dựa trecircn lyacute
thuyết sinh học Thuật toaacuten di truyền tigravem thấy nguồn gốc của chuacuteng trong caacutec lyacute thuyết
tiến hoacutea của chọn lọc tự nhiecircn vagrave thiacutech ứng với biến đổi khiacute hậu Kết quả thuật toaacuten di truyền lagrave từ giao phối 2 caacute thể trong quần thế để tạo
ra con caacutei đocirci khi tốt hơn so với bậc cha mẹ của chuacuteng 15Caacutec thagravenh phần cơ bản của thuật toaacuten di truyền
Toaacuten tử chọn lọc Caacutec caacute thể tốt được chọn lọc để đưa vagraveo thế hệ sau Sự chọn lọc nagravey căn cứ vagraveo độ thiacutech nghi với mocirci trường của mỗi caacute thể
Toaacuten tử lai gheacutep (crossover) Hai caacute thể cha vagrave mẹ trao đổi caacutec gen với nhau để tạo ra caacute thể con
Toaacuten tử đột biến (mutation) Một caacute thể thay đổi một số gen để biến đổi thagravenh một caacute thể mớiTất cả caacutec toaacuten tử trecircn khi thực hiện đều mang tiacutenh ngẫu nhiecircn
16Quaacute trigravenh cơ bản của một thuật toaacuten di truyền Khởi tạo
Đaacutenh giaacute quần thể
Lựa chọn NST thiacutech hợp nhất vagrave loại bỏ NST yếu nhất
Quy trigravenh giao nhau vagrave cải thiện quần thể
đột biến tiến trigravenh để khaacutem phaacute ra NST mới
17Ưu nhược điểm của việc kết hợp với thuật toaacuten di truyền Kiacutech thước quần thể lagrave 1 yếu tố quan trọng trong tốc độ của việc tigravem
kiếmnhưng noacute tương đối dễ dagraveng để dự đoaacuten tốc độ nagravey Giao nhau hoặc đột biến lagrave khocircng necircn đc sử dụng quaacute thường xuyecircn Luocircn coacute được iacutet nhất 1 giải phaacutep hợp lyacute Necircn coacute thể aacutep dụng chuacuteng cho caacutec vấn đề magrave chuacuteng ta khocircng coacute hướng
về caacutech giải quyết Sức mạnh của thuật toaacuten xuất phaacutet từ khaacutei niệm đơn giảnkhocircng phải từ
một thủ tục thuật toaacuten phức tạp 18Tương lai của học maacutey
Mạng lưới thần kinh nhacircn tạo vượt quaacute năng lực của con người trong caacutec trường hợp bị cocirc lập
Về mặt lyacute thuyếtmột maacutey tiacutenh coacute thể xử lyacute dũ liệu nhanh hơn hagraveng triệu lần so với 1 con người
May mắn thay cho chuacuteng tacon người tốt hơn nhiều khi magrave coacute được dữ liệumaacutey tiacutenh khocircng coacute 1 số thứ như lagrave 5 giaacutec quan
CHƯƠNG 10 KHO DỮ LIỆU
1 Kho dữ liệu Kho dữ liệu lagrave tuyển tập caacutec cơ sở dữ liệu tiacutech hợp hướng chủ đề được
thiết kế để trợ giuacutep cho một hệ hỗ trợ quyết định
Theo John Ladley Cocircng nghệ kho dữ liệu lagrave tập caacutec phương phaacutep kỹ thuật vagrave caacutec cocircng cụ coacute thể kết hợp hỗ trợ nhau để cung cấp thocircng tin cho người sử dụng trecircn cơ sở tiacutech hợp từ nhiều nguồn dữ liệu nhiều mocirci trường khaacutec nhau
Kho dữ liệu thường rất lớn tới hagraveng trăm GB hay thậm chiacute hagraveng Terabyte
2 Kho dữ liệu vận hagravenh (ODS) Một kho dữ liệu vận hagravenh Aacutep dụng kỹ thuật kho dữ liệu vagraveo caacutec hệ xử
lyacute giao taacutec lưu trữ dữ liệu cho một ứng dụng đặc thugrave Noacute đưa vagraveo kho dữ liệu một dograveng caacutec dữ liệu thocirc được thiết kế
3 So saacutenh
Kho dữ liệu vận hagravenh Kho dữ liệu
Dữ liệu theo chủ đề Dữ liệu theo chủ đề
Dữ liệu tiacutech hợp Dữ liệu tiacutech hợp
Dữ liệu thay đổi Dữ liệu khocircng thay đổi
Dữ liệu được cập nhật khi thay đổi
Dữ liệu giữ nguyecircn
Chỉ coacute dữ liệu hiện tạiDữliệu hiện tại vagrave dữ liệu lịch sử
Chu kỳ lagravem tươi dữ liệu ngắn Chu kỳ lagravem tươi dữ liệu dagravei
Chỉ coacute dữ liệu chi tiết Dữ liệu chi tiết vagrave dữ liệu tổng kết
Dugraveng cho caacutec quyết định ngắn hạn
Dugraveng cho hoạch định dagravei hạn
4 Kho dữ liệu cục bộ (Data Mart - DM)
Kho dữ liệu cục bộ lagrave CSDL coacute những đặc điểm giống với kho dữ liệu nhưng với quy mocirc nhỏ hơn vagrave lưu trữ dữ liệu về một lĩnh vực một chuyecircn ngagravenh
Data mart phụ thuộc Chứa những dữ liệu được lấy từ DW vagrave những dữ liệu nagravey sẽ được triacutech lọc vagrave tinh chế tiacutech hợp lại ở mức cao hơn để phục vụ một chủ đề nhất định của Datamart
Data mart độc lập Khocircng giống như Datamart phụ thuộc Data mart độc lập được xacircy dựng trước DW vagrave dữ liệu được trực tiếp lấy từ caacutec nguồn khaacutec nhau
5 Siecircu dữ liệu Metadata lagrave dữ liệu để mocirc tả dữ liệu Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột
một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi Metadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu
6 Mocirci trường kho dữ liệu Hệ thống của tổ chức vagrave kho cung cấp dữ liệu để xacircy dựng kho dữ liệu Trong quaacute trigravenh chuyển dữ liệu từ caacutec nguồn khaacutec nhau dữ liệu coacute thể
được lagravem sạch hoặc chuyển đổi vagrave vigrave thế DW được xem như lagrave một chuẩn cho việc lưu trữ
Đồng thời siecircu dữ liệu được ghi lại Cuối cugraveng DW hoặc siecircu thị coacute thể được sử dụng để tạo ra một kho dữ
liệu ldquocaacute nhacircnrdquo 7 Caacutec đặc điểm của kho dữ liệu
Đặc điểm Mocirc tả
Hướng chủ đề - DL tổ chức theo caacutech thức người dugraveng tham chiếu
Tiacutech hợp - Dữ liệu ldquosạchrdquo loại bỏ tiacutenh thiếu nhất quaacuten
Khocircng thay đổi - DL ldquochỉ đọcrdquo người dugraveng khocircng thay đổi được
Chuỗi thời gian - DL lagrave chuỗi thời gian khocircng phải lagrave trạng thaacutei hiện tại
Được tổng kết - DL vận hagravenhthao taacutec khi cần thiết
được kết hợp lại thagravenh dạng coacute thể dugraveng được cho quyết định
Kiacutech cỡ lớn hơn - Lưu giữ theo chuỗi thời gian tức lagrave giữ lại nhiều DL
Khocircng được chuẩn hoacutea - Coacute thể dư thừa DLSiecircu dữ liệu - Dữ liệu của dữ liệu được lưu trữNguồn dữ liệu - DL vận hagravenh (caacutec hệ sẵn coacute) cugraveng
với caacutec nguồn ngoagravei 8 Kho dữ liệu hướng chủ đề
Hướng chủ để coacute nghĩa lagrave kho dữ liệu được tổ chức xung quanh caacutec chủ đề chiacutenh như khaacutech hagraveng sản phẩm sản xuất Tập trung vagraveo việc mocirc higravenh hoacutea vagrave phacircn tiacutech dữ liệu cho caacutec nhagrave ra quyết định magrave khocircng tập trung vagraveo caacutec xử lyacute thocircng thường Cung cấp cho người dugraveng một khung nhigraven toagraven vẹn đơn giản vagrave đầy đủ về caacutec sự kiện quanh caacutec chủ đề
9 Dữ liệu trong DW được tiacutech hợp Dữ liệu trong kho dữ liệu được xacircy dựng bằng caacutech tổng hợp dữ liệu từ
nhiều nguồn khaacutec nhau vagrave caacutec nguồn coacute tổ chức khaacutec nhau Cơ sở dữ liệu caacutec file excel caacutec flat file hoặc caacutec raw file Khi đưa vagraveo kho dữ liệu caacutec dữ liệu được lagravem sạch vagrave tiacutech hợp dữ liệu nhằm đảm bảo tiacutenh nhất quaacuten của dữ liệu
10Kiến truacutec kho dữ liệu Tầng cơ sở dữ liệu hoạt động Tầng truy xuất thocircng tin Tầng truy xuất dữ liệu Tầng siecircu dữ liệu Tầng quản lyacute tiến trigravenh Tầng thocircng điệp của ứng dụng Tầng vật liacute của kho dữ liệu Tầng trigravenh diễn dữ liệu
11Higravenh trạng kho dữ liệu Kho dữ liệu ảo - người dugraveng cuối coacute thể truy cập trực tiếp đến kho dữ liệu
sử dụng caacutec cocircng cụ cho pheacutep ở tầng truy xuất dữ liệu Kho dữ liệu trung tacircm-1 cơ sở dữ liệu vật lyacute chứa tất cả dữ liệu cho một
vugraveng chuyecircn dụng nagraveo đoacute
Kho dữ liệu phacircn taacuten- Thagravenh phần được phacircn taacuten qua nhiều hệ cơ sở dữ liệu vật lyacute
12METADATA- Siecircu dữ liệu Định nghĩa Siecircu dữ liệu lagrave dữ liệu về dữ liệu Lagrave 1 lưu trữ dugraveng để
Miecircu tả kho dữ liệu tổng thể Nhận dạng kiểu kho dữ liệu Quản liacute quaacute trigravenh tiacutech hợp dữ liệu Quản liacute quaacute trigravenh cập nhật kho dữ liệu Quản liacute bảo mật
Lagrave chigravea khoacutea quyết định sự thagravenh cocircng của kho dữ liệu luocircn được thay đổi vagrave cập nhật theo sự phaacutet triển của kho dữ liệu
Dugraveng để quản liacute điều khiển kho dữ liệu Sự ra đời của kho dữ liệu như 1 cấu truacutec hỗ trợ ra quyết định siecircu dữ liệu
được xem như nguồn tagravei nguyecircn dữ liệu Siecircu dữ liệu lagrave trừu tượng Chuacuteng lagrave dữ liệu bậc cao cung cấp mocirc tả ngắn
gọn caacutec dữ liệu bậc thấp hơn 13Hoạt động của Siecircu dữ liệu
Siecircu dữ liệu rất cần thiết trong việc chuyển hoacutea thocircng tin trở thagravenh tri thức Lagrave chigravea khoacutea giuacutep chuacuteng ta xử lyacute được dữ liệu thocirc Viacute dụ một dograveng dữ liệu baacuten hagraveng 1023 K596 11121 agraveNoacute sẽ khocircng coacute nghĩa gigrave cho đến khi chuacuteng ta đưa vagraveo siecircu dữ liệu (thư
mục chứa dữ liệu) agrave cửa hagraveng 1023 sản phẩm K596 vagrave số tiền baacuten được lagrave 11121 đocirc la
14Sự cần thiết phải nhất quaacuten trong kho dữ liệu Kho dữ liệu được xacircy dựng cho lợi iacutech của những nhagrave phacircn tiacutech kinh
doanh caacutec nhagrave quản trị cho tất cả caacutec khu vực chức năng Trong cơ sở dữ liệu riecircng caacutec khu vực khaacutec nhau coacute thể định nghĩa vagrave lưu
trữ dữ liệu thocircng qua phiecircn bản của chiacutenh noacute Khi dữ liệu được lấy từ những vugraveng khaacutec nhau đoacute vagrave được đặt vagraveo kho dữ
liệu Việc chuyển đổi vagrave lagravem sạch caacutec tiến trigravenh sẽ đảm bảo noacute lagrave duy nhất được tiacutech hợp tại một mức của tổ chức
15Ragrave soaacutet lại dữ liệu ndash Thực thi siecircu dữ liệu
Bất kể cấu truacutec tự nhiecircn của 1 cacircu truy vấn thế nagraveo thigrave caacutec thagravenh phần của siecircu dữ liệu rất quan trọng đối với người ra quyết định
Bảng thuộc tiacutenh khoacutea được lưu trữ bởi kho dữ liệu Tập hợp dữ liệu được lấy từ đacircu Những chuyển đổi nagraveo được thực thi với việc lagravem sạch
16Siecircu dữ liệu lagrave gigrave Metadata - lagrave thocircng tin mocirc tả nội dung của cơ sở dữ liệu (CSDL) Metadata baacuteo cho người dugraveng biết thời gian cập nhật sau cugraveng của dữ liệu
định dạng vagrave mục điacutech sử dụng của noacute Những thocircng tin nagravey coacute thể hướng dẫn người dugraveng duyệt qua CSDL vagrave
giuacutep họ hiểu được yacute nghĩa vagrave ngữ cảnh của dữ liệu Trong CSDL metadata lagrave caacutec dạng biểu diễn khaacutec nhau của caacutec đối tượng
trong CSDL Trong CSDL quan hệ metadata lagrave caacutec định nghĩa của bảng cột CSDL
view vagrave nhiều đối tượng khaacutec Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột
một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi -gtMetadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu
Bảng chuyển đổi Ghi lại những chuyển đổi đatilde được thực hiện
Lịch sử thực thi Ghi lại những dữ liệu đatilde được
phacircn tiacutech
Higravenh thaacutei kết nốiGhi lại những dữ liệu được kết nối vagrave tần suất
17Aacutenh xạ thocircng thường của siecircu dữ liệu Bản ghi aacutenh xạ chuyển đổi bao gồm
Định danh của nguồn gốc Chuyển đổi thuộc tiacutenh Chuyển đổi thuộc tiacutenh vật lyacute Matilde hoacutea tham chiếu bảng chuyển đổi Đổi tecircn Đổi khoacutea Gaacuten giaacute trị cho thuộc tiacutenh mặc định Chọn logic cho caacutec nguồn nhiều giaacute trị Đổi thuật toaacuten
18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để
phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai
lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave
tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec
Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm
Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo
19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua
caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau
SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được
Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra
một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức
Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ
Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ
Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech
CHƯƠNG 11 KHAI PHAacute DỮ LIỆU
1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn
ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993
Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng
2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd
1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều
2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP
3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn
4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng
5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server
6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo
7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động
8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời
9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều
10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện
11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech
12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP
3 Xử lyacute phacircn tiacutech trực tuyến OLAP
MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave
dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu
ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave
thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu
HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave
ROLAP4 Khai phaacute dữ liệu
Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh
khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn
Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan
5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp
6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại
Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp
Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec
Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt
Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra
Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh
vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho
Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec
Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm
Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục
Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng
gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp
Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn
Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec
Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper
Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2
Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25
Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước
Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng
Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện
trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp
Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute
độ hỗ trợ ge ngưỡng minsup
độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan
Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn
Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết
Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu
MOLAP ROLAP HOLAP
Lưu trữ dữ liệu cơ sở
Khối Bảng quan hệ Bảng quan hệ
Lưu trữ thocircng tin tổng hợp
Khối Bảng quan hệ Khối
Hiệu suất thực hiện truy vấn
Nhanh nhất Chậm nhất Nhanh
Tiecircu thụ khocircng gian lưu trữ
Nhiều Thấp Trung bigravenh
Chi phiacute bảo trigrave Cao Thấp Trung bigravenh
Noacute gacircy ra ảnh hưởng mạnh mẽ cograven hơn cả những hoạt động của tổ chức đoacute 10 đặc điểm văn hoacutea của tổ chức
Điều khiển Hệ thống khen thưởng Sự đồng nhất Chịu đựng xung đột Mocirc higravenh giao tiếp Hỗ trợ quản lyacute Sự hogravea nhập Định hướng Chịu đựng rủi ro Caacute nhacircn khởi xướng
Mối quan hệ của văn hoacutea với hiệu năng lagravem việc1 tổ chức thagravenh cocircng phải coacute xu hướng hogravea hợp giữa văn hoacutea với mocirci trường trong vagrave ngoagravei tổ chức
Phugrave hợp trong nội bộ cho thấy một sự kết hợp giữa văn hoacutea của tổ chức với những cocircng nghệ của chiacutenh noacute
Phugrave hợp với becircn ngoagravei cho thấy một nền văn hoacutea phugrave hợp với chiến lược thị trường
Văn hoacutea vagrave sự thay đổi 1 tổ chức magrave khocircng biết thay đổi văn hoacutea sẽ khocircng thể giữ được vị triacute của migravenh trecircn thị trường Caacutec cocircng ty xuất sắc luocircn biết caacutech tiacutech cực tiếp cận khaacutech hagraveng động viecircn đầu tư
17Quyền lực vagrave chiacutenh trịQuyền lực vagrave chiacutenh trị luocircn đi liền với nhau
aQuyền lựclagrave khả năng ảnh hưởng đến việc phacircn phối caacutec nguồn lực trong tổ chứcGồm 5 yếu tố cơ bản
Phacircn quyền Uy quyền Quyền lực caacute nhacircn Sức ảnh hưởng Chiacutenh trị
Một vagravei thagravenh phần của quyền lực ra quyết định Quyết định việc nagraveo coacute sẵn
Quyết định sản phẩm nagraveo được sản xuất Quyết định đầu tư vagraveo đacircu Quyền đặt vagrave quản lyacute quản lyacute giaacute Thanh toaacuten vagrave khấu trừ tiền latildei
bChiacutenh trị Yếu tố cốt lotildei trong quaacute trigravenh higravenh thagravenh chiến lược ra quyết định Chiacutenh trị liecircn quan tới việc ra quyết định thocircng qua đagravem phaacutenảnh hưởngvagrave higravenh
thagravenh sự nhất triacute Trong nhiều trường hợp noacute coacute thể cho ta sự linh hoạt hơn
18Hệ trợ giuacutep quyết định trong tổ chức DSS của 1 tổ chức hỗ trợ cocircng nghệ tập trung vagraveo caacutec quyết định ảnh hưởng tới
rất nhiều người 1 hệ thống DSS hiện đại coacute thể chấp nhận nhiều quyết định vượt qua những giới
hạn phacircn cấp truyền thống aCaacutec hoạt động gần DSS
Giải quyết caacutec nhiệm vụ đặc biệt Thu thập thocircng tin Liecircn lạc qua caacutec chi nhaacutenh Động thaacutei chiacutenh trị
Phacircn loại tư duy chiến lược cho DSS Sắp xếp quyết địnhXếp hạng quyết định sao cho thứ tự đứng trước thigrave được
ưu tiecircn trước Chia sẻ thocircng tinCaacutec quyecirct định coacute thể độc lập nhưng người ra quyết định
phải chia sẻ caacutec thocircng tin liecircn quan Lựa chọn đagravem phaacutenVagravei quyết định coacute thể xaacutec lập thocircng qua đagravem phaacuten vagrave kết
quả được lagravem đồng thờiKhocircng phải cocircng nghệ tự noacute coacute thể đưa ra quyết định magrave noacute nằm ở trigravenh độ cocircng nghệ hỗ trợ caacutec chiến lược quyết định quyền lực vagrave chiacutenh trị cugraveng phối hợp với nhau
Chương 4Mocirc higravenh hoacutea quaacute trigravenh ra quyết định
(Cấu truacutec của hệ HTQD)19Vấn đề Mocirc higravenh
bull Lagrave phần tử chủ chốt trong hầu hết hệ hỗ trợ quyết định vagrave lagrave điều kiện cần trong hệ hỗ trợ quyết định dựa vagraveo mocirc higravenh (model-based DSS)
bull Coacute nhiều lớp mocirc higravenh kegravem theo lagrave caacutec kỹ thuật xử lyacute thao taacutec mocirc higravenh đặc thugrave tương ứng
bull Caacutec vấn đề chiacutenh nhận diện bagravei toaacuten vagrave phacircn tiacutech mocirci trường nhận diện biến số dự baacuteo đa mocirc higravenh caacutec phạm trugrave mocirc higravenh quản lyacute mocirc higravenh vagrave mocirc higravenh hoacutea dựa vagraveo kiến thức
bull Mocirc higravenh hoacutea lagrave taacutec vụ khocircng đơn giản Người xacircy dựng mocirc higravenh phải cacircn bằng giữa tiacutenh đơn giản của mocirc higravenh với caacutec yecircu cầu biểu diễn để mocirc higravenh coacute thể nắm bắt đủ thực tại cần thiết cho người ra quyết định
bull Mocirc phỏng lagrave kỹ thuật mocirc higravenh hoacutea thocircng dụng dugraveng để tigravem hiểu vấn đề tuy khocircng nhất thiết phải tigravem ra được caacutec giải phaacutep biến thể mở rộng quaacute trigravenh ra quyết định của tổ chức vagrave cho pheacutep tổ chức xem xeacutet taacutec độngảnh hưởng của caacutec chọn lựa tương lai
bull Mocirc phỏng tiết kiệm rất nhiều chi phiacute vagrave thời gian ndash rất dễ thay đổi mocirc higravenh hoạt động của một hệ thống vật lyacute bằng mocirc higravenh hoacutea maacutey tiacutenh
bull Mocirc higravenh coacute thể được phaacutet triển vagrave cagravei đặt bằng một số caacutec ngocircn ngữ lập trinh (thế hệ 3 4 ) vagrave hệ thống phần mềm khaacutec nhau
Mocirc higravenh tĩnh vagrave động
bull Mocirc higravenh tĩnh thể hiện bức tranh tại thời điểm của tigravenh huống Caacutec khiacutea cạnh của bagravei toaacuten được xeacutet một thời kỳ nhất định trong một khung thời gian nhất định (coacute thể ldquocuốnrdquo về tương lai) Caacutec tigravenh huống được giả sử lagrave sẽ lập lại với tập caacutec điều kiện đồng nhất
1048713 Giả định coacute được tiacutenh ổn định của dữ liệu 1048713 Mocirc phỏng quaacute trigravenh dạng tĩnh - lagravem việc trecircn caacutec trạng thaacutei ổn định để tigravem ra caacutec
thocircng số tối ưu ndash thường được dugraveng như cocircng cụ chủ yếu để thiết kế quaacute trigravenh 1048713 vd quyết định sản xuấtmua 1 sản phẩm baacuteo caacuteo thu nhập hagraveng quyacutenăm bull Mocirc higravenh động biểu diễn caacutec kịch bản thay đổi theo thời gian 1048713 Phụ thuộc thời gian caacutec trạng thaacutei thay đổi theo thời gian 1048713 Thường dugraveng để tạo sinh vagrave biểu diễn caacutec xu hướng vagrave khuocircn mẫu theo thời gian 1048713 Mocirc phỏng động thể hiện caacutec diễn tiến khi caacutec điều kiện theo thời gian khaacutec với caacutec
trạng thaacutei ổn định ndash thường được dugraveng để thiết kế việc kiểm soaacutet caacutec hệ thống 1048713 VD dự baacuteo lời-lỗ trong 5 năm với caacutec nhập lượng như giaacute phiacute số lượng thay đổi
theo từng năm
Mocirc higravenh chắc chắn tương đối dễ phaacutet triển giải quyết vagrave coacute thể sinh ra caacutec giải phaacutep tối ưu 1048713 Caacutec bagravei toaacuten coacute một số lớnvocirc hạn caacutec giải phaacutep khả thi đặc biệt quan trọng 1048713 Caacutec mocirc higravenh tagravei chaacutenh được xacircy dựng trong điều kiện chắc chắn
Mocirc higravenh bất địnhbằng caacutech thu thập thecircm thocircng tin cố gắng đưa bagravei toaacuten trở về dạng chắc chắn hay dạng
rủi ro Mocirc higravenh rủi ro caacutec quyết định kinh doanh được đưa ra dưới caacutec rủi ro giả định
1048713 Đocirci khi biết được xaacutec suất của caacutec sự kiện xảy ra trong tương lai 1048713 Caacutec trường hợp khaacutec (bất định) ước lượng caacutec rủi ro vagrave giả sử caacutec tigravenh huống rủi ro
xảy ra 20Mocirc higravenh hoacutea
MOcirc HIgraveNH HOacuteA BẰNG BẢNG TIacuteNH bull Bảng tiacutenh phần mềm mạnh linh hoạt vagrave dễ dugraveng cho pheacutep tạo sinh caacutec ứng dụng trong kinh doanh kỹ thuật toaacuten vagrave khoa học với tập caacutec hagravem mạnh về tagravei chaacutenh thống kecirc toaacuten bull Kegravem theo lagrave caacutec thagravenh phần cộng thecircm (add-ins) giuacutep xacircy dựng vagrave giải caacutec lớp mocirc higravenh đặc thugrave bull Lagrave cocircng cụ mocirc higravenh hoacutea thocircng dụng nhất của người dugraveng cuối cugraveng bull Coacute caacutec chức năng về phacircn tiacutech ldquowhat-ifrdquo dograve tigravem mục tiecircu quản lyacute dữ liệu vagrave lập trigravenh (dạng macro) bull Coacute khả năng đọc ghi caacutec cấu truacutec tập tin thocircng dụng để giao tiếp được với caacutec CSDL vagrave cocircng cụ khaacutec bull Coacute thể xacircy dựng mocirc higravenh tĩnh vagrave động bull Dugraveng trecircn maacutey tiacutenh caacute nhacircn vagrave maacutey tiacutenh lớn
bull Cơ sở để xacircy dựng caacutec bảng tiacutenh đa chiều vagrave caacutec cocircng cụ xử lyacute phacircn tiacutech trực tuyến (OLAP) MOcirc HIgraveNH HOacuteA BẰNG PHAcircN TIacuteCH QUYẾT ĐỊNH bull Tiếp cận mocirc higravenh hoacutea caacutec tigravenh huống quyết định coacute một số hữu hạnkhocircng quaacute nhiều caacutec phương aacuten ndash mỗi phương aacuten được trigravenh ra dưới dạng bảng hay đồ thị - caacutec kết quả tương ứng (dự baacuteo được kegravem xaacutec suất) theo mục tiecircu bagravei toaacuten ndash từ đoacute chọn phương aacuten tốt nhất bull Đơn mục tiecircu bảng quyết định hay cacircy quyết định bull Đa mục tiecircu AHP (analytic hierarchy process) khaacutec
MOcirc HIgraveNH HOacuteA BẰNG QUY HOẠCH TOAacuteN
bull Quy hoạch toaacuten học (mathematical programming) lagrave họ caacutec cocircng cụ giải quyết caacutec bagravei toaacuten quản lyacute theo đoacute người ra quyết định phải cấp phaacutet caacutec tagravei nguyecircn khan hiếm cho caacutec hoạt động cạnh tranh nhau (caacutec phương aacuten) nhằm tối ưu hoacutea mục tiecircu coacute khả năng đo lường được bull Caacutec mocirc higravenh quy hoạch tuyến tiacutenh (linear programming) thocircng dụng nhất trong quy hoạch toaacuten coacute nhiều ứng dụng trong thực tế được dugraveng nhiều trong caacutec hệ hỗ trợ quyết định bull Bagravei toaacuten quy hoạch tuyến tiacutenh 1048713 Caacutec biến quyết định (cần tigravem giaacute trị) 1048713 Hagravem mục tiecircu (hagravem toaacuten học dạng tuyến tiacutenh xaacutec định quan hệ giữa biến quyết định vagrave mục tiecircu đo lường mức độ đạt đạt mục tiecircu vagrave cần được tối ưu hoacutea) 1048713 Caacutec hệ số của hagravem mục tiecircu (cho biết mức đoacuteng goacutep vagraveo mục tiecircu của 1 đơn vị biến quyết định) 1048713 Ragraveng buộc (biểu thức tuyến tiacutenh cho biết giới hạn tagravei nguyecircn vagravehay caacutec quan hệ giữa caacutec biến số) 1048713 Dung lượng (mocirc tả cận trecircn vagrave dưới của caacutec biến vagrave ragraveng buộc) 1048713 Hệ số (cocircng nghệ) vagraveo-ra (cho biết mức độ sử dụng tagravei nguyecircn của biến quyết định) bull Đặc điểm của bagravei toaacuten quy hoạch tuyến tiacutenh 1048713 Tagravei nguyecircn kinh tế của bagravei toaacuten lagrave coacute hạn vagrave sẵn sagraveng 1048713 Coacute nhiều caacutech (gt2 caacutech) sử dụng tagravei nguyecircn được gọi lagrave giải phaacutep hay chương trigravenh 1048713 Mỗi hoạt động dugraveng tagravei nguyecircn đều sinh ra kết quả dưới dạng mục tiecircu đatilde phaacutet biểu trước 1048713 Việc cấp phaacutet nằm trong caacutec ragraveng buộc cho trước bull Giả định của bagravei toaacuten quy hoạch tuyến tiacutenh 1048713 Caacutec kết quả của caacutec cấp phaacutet coacute thể đem so saacutenh với nhau coacute thể đo lường bằng một đơn vị chung
1048713 Caacutec cấp phaacutet độc lập với nhau về mặt kết quả 1048713 Kết quả cuối cugraveng lagrave tổng của caacutec kết quả từ caacutec hoạt động riecircng rẽ khaacutec nhau 1048713 Dữ liệu coacute tiacutenh chắc chắn 1048713 Tagravei nguyecircn được dugraveng một caacutech kinh tế nhất 1048713 Thường coacute một số lớn caacutec giải phaacutep với kết quả khaacutec nhau 1048713 Trong số caacutec giải phaacutep coacute thể coacute 1 giải phaacutep tốt nhất ndash mức độ đạt được mục tiecircu cao nhất ndash gọi lagrave giải phaacutep tối ưu được tigravem ra bằng một giải thuật đặc biệt MOcirc HIgraveNH HOacuteA BẰNG HEURISTIC bull Việc tigravem giải phaacutep tối ưu của một số bagravei toaacuten quyết định phức tạp coacute thể tốn nhiều thời gian chi phiacute hay khocircng thể tigravem ra được Cograven nếu dugraveng tiếp cận mocirc phỏng cũng coacute thể keacuteo dagravei phức tạp khocircng thiacutech hợp hay thậm chiacute khocircng chiacutenh xaacutec
bull Lagrave một tiếp cận giuacutep tigravem ra caacutec giải phaacutep khả thithỏa matildenđủ tốt cho caacutec bagravei toaacuten phức tạp Coacute thể coacute giải phaacutep đủ tốt (90-999 giaacute trị của lời giải tối ưu) nhanh choacuteng vagrave đỡ tốn keacutem hơn bằng caacutech dugraveng heuristics bull Quaacute trigravenh heuristic lagrave datildey caacutec bước xacircy dựng caacutec quy luật giải quyết vấn đề thocircng qua việc tigravem kiếm caacutec con đường hứa hẹn nhất dẫn đến lời giải tigravem kiếm caacutech thức thu thập vagrave phacircn giải thocircng tin theo quaacute trigravenh giải vagrave phaacutet triền caacutec phương phaacutep dẫn đến một giải thuật tiacutenh toaacuten hay một lời giải tổng quaacutet đatilde coacute bull Aacutep dụng chủ yếu cho bagravei toaacuten cấu truacutec yếu cũng dugraveng để tigravem ra giải phaacutep chấp nhận được cho bagravei toaacuten cấu truacutec chặt bull Khocircng đủ tổng quaacutet như caacutec giải thuật thường chỉ dugraveng cho tigravenh huống đặc thugrave đang xeacutet bull Coacute thể dẫn đến một giải phaacutep dở - caacutec thủ tục từng bước giải quyết vấn đề khocircng đảm bảo tigravem ra giải phaacutep tối ưu bull Heuristic coacute thể lagrave định lượng vigrave vậy coacute thể đoacuteng vai trograve quan trọng trong cơ sở mocirc higravenh của hệ hỗ trợ quyết định bull Heuristic coacute thể lagrave định tiacutenh vigrave vậy coacute thể đoacuteng vai trograve quan trọng trong cung ứng kiến thức cho hệ chuyecircn gia bull Quaacute trigravenh heuristic liecircn quan đến tigravem kiếm học tập ước lượng phacircn xử vagrave lặp lại caacutec hoạt động nagravey dọc theo tiến trigravenh bull Kiến thức thu được dugrave thagravenh cocircng hay thất bại trong quaacute trigravenh đều được phản hồi vagrave sửa đổi chiacutenh quaacute trigravenh nhờ đoacute coacute thể định nghĩa lại mục tiecircu hay bagravei toaacuten 1048713 Giải thuật di truyền bắt đầu bằng tập caacutec giải phaacutep được sinh ngẫu nhiecircn taacutei kết hợp caacutec cặp giải phaacutep một caacutech ngẫu nhiecircn bull Tigravenh huống necircn dugraveng heuristics 1048713 Dữ liệu đầu vagraveo khocircng chiacutenh xaacutec hay coacute giới hạn 1048713 Thực tế quaacute phức tạp đến nỗi khocircng dugraveng được caacutec mocirc higravenh tối ưu 1048713 Chưa coacute được giải thuật chiacutenh xaacutec vagrave đủ tin cậy 1048713 Bagravei toaacuten phức tạp necircn sẽ khocircng kinh tế nếu dugraveng tối ưu hay mocirc phỏng hoặc tốn quaacute nhiều thời gian tiacutenh toaacuten 1048713 Coacute thể cải thiện tiacutenh hiệu quả của quaacute trigravenh tối ưu (tức coacute thể sinh ra caacutec giải phaacutep ban đầu tương đối tốt) 1048713 Liecircn quan đến xử lyacute kyacute hiệu chứ khocircng phải xử lyacute kyacute số (như hệ chuyecircn gia) 1048713 Cần coacute quyết định nhanh vagrave caacutec xử lyacute dựa vagraveo maacutey tiacutenh đều khocircng khả thi (một số heuristic khocircng cần đến maacutey tiacutenh) bull Thuận lợi 1048713 Dễ hiểu dễ giải thiacutech vagrave dễ cagravei đặt 1048713 Nacircng cao tiacutenh saacuteng tạo vagrave năng lực heuristic cho caacutec vấn đề khaacutec 1048713 Tiết kiệm thời gian xaacutec lập vấn đề 1048713 Tiết kiệm yecircu cầu về bộ chứa vagrave xử lyacute maacutey tiacutenh
1048713 Tiết kiệm thời gian tiacutenh toaacuten vagrave do vậy tiết kiệm thời gian thực trong ra quyết định Một số vấn đề phức tạp đến nỗi chỉ coacute thể giải được bằng heuristics 1048713 Thường sinh ra nhiều giải phaacutep chấp nhận được 1048713 Thường coacute thể phaacutet biểu lyacute thuyết hay đo lường thực nghiệm về chất lượng của giải phaacutep (tức giaacute trị mục tiecircu của giải phaacutep gần với giaacute trị tồi ưu đến mức nagraveo dugrave giaacute trị tối ưu chưa biết được) 1048713 Coacute thể kết hợp tiacutenh thocircng minh vagraveo để hướng dẫn pheacutep tigravem kiếm (tigravem kiếm tabu) Năng lực thocircng minh đoacute coacute thể lagrave đặc thugrave theo bagravei toaacuten hoặc dựa trecircn yacute kiến chuyecircn gia được cấy trong hệ chuyecircn gia hoặc cơ chế tigravem kiếm 1048713 Coacute thể dugraveng heuristic hiệu quả vagraveo caacutec mocirc higravenh coacute thể giải bằng quy hoạch toaacuten học Đocirci khi heuristic lagrave phương phaacutep được ưa thiacutech hơn khi khaacutec giải phaacutep heuristics được dugraveng như giải phaacutep ban đầu cho caacutec phương phaacutep quy hoạch toaacuten học bull Hạn chế 1048713 Khocircng đảm bảo coacute được giải phaacutep tối ưu 1048713 Caacutec quy luật coacute rất nhiều ngoại lệ 1048713 Caacutec lựa chọn quyết định tuần tự coacute thể khocircng tiecircn đoaacuten được caacutec kết cục tương lai của mỗi chọn lựa 1048713 Sự liecircn thuộc giữa caacutec phần trong hệ thống đocirci khi coacute thể gacircy ra caacutec ảnh hưởng lớn lao lecircn toagraven hệ thống bull Phacircn loại caacutec giải thuật heuristic 1048713 Heuristic xacircy dựng xacircy dựng giải phaacutep khả thi bằng caacutech cộng thecircm từng thagravenh phần một VD bagravei toaacuten người baacuten hagraveng ndash luocircn gheacute thagravenh phố chưa viếng thăm kế tiếp gần nhất
1048713 Heuristic cải tiến bắt đầu bằng một giải phaacutep khả thi vagrave cố gắng cải tiến liecircn tục trecircn đoacute VD trecircn thử hoaacuten đổi 2 thagravenh phố 1048713 Quy hoạch toaacuten aacutep dụng vagraveo caacutec mocirc higravenh chứa iacutet ragraveng buộc nhằm coacute được thocircng tin về thỏa hiệp tốt nhất với mocirc higravenh nguyecircn gốc Thường được dugraveng trong tối ưu hoacutea nguyecircn (integer optimization) 1048713 Chia giai đoạn giải quyết một vấn đề theo từng giai đoạn VD ở PampG trecircn đacircy bagravei toaacuten phacircn phối được giải quyết trước sau đoacute dugraveng giải quyết bagravei toaacuten chiến lược sản phẩm 1048713 Phacircn ratilde chia bagravei toaacuten thagravenh caacutec phần nhỏ hơn coacute thể giải quyết được sau đoacute kết hợp caacutec giải phaacutep đoacute lại VD chia latildenh thổ baacuten hagraveng thagravenh 4 vugraveng khaacutec nhau giải quyết cho từng vugraveng sau đoacute kết nối caacutec giải phaacutep
21Mocirc phỏngbull Giả định caacutec đặc điểm của thực tạibull Lagrave kỹ thuật tiến triển caacutec thực nghiệm (như phacircn tiacutech ldquowhat-ifrdquo) - bằng maacutey tiacutenh -trecircn một mocirc higravenh của hệ thocircng tin quản lyacute
bull Khocircng thực sự lagrave một mocirc higravenh vigrave khocircng biểu diễn thực tại magrave lagrave cố gắng bắtchước thực tạibull Một trong những phương phaacutep thocircng dụng nhất trong HHTQĐbull HHTQĐ lagravem việc với caacutec bagravei toaacuten phi cấu truacutec vagrave cấu truacutec yếu tigravenh huống thực tếphức tạp ndash khocircng dễ biểu diễn bằng mocirc higravenh tối ưu hay caacutec dạng mocirc higravenh khaacutecnhưng lại thường coacute thể xử lyacute được bằng mocirc phỏngbull Đặc điểm1048713 Iacutet đưa ra caacutec đơn giản hoacutea về thực tại hơn caacutec mocirc higravenh khaacutec1048713 Do triển khai caacutec thực nghiệm necircn noacute coacute thể kiểm thử caacutec giaacute trị cụ thể của caacutecbiến quyết địnhbiến khocircng kiểm soaacutet được của mocirc higravenh vagrave xem xeacutet ảnh hưởnglecircn caacutec biến kết quả1048713 Phương phaacutep coacute tiacutenh mocirc tả (như vậy khaacutec với phương phaacutep danh định)1048713 Khocircng tự động tigravem kiếm giải phaacutep tối ưu ndash noacute mocirc tảtiecircn đoaacuten caacutec đặc tiacutenh của hệthống đatilde cho dưới caacutec điều kiện khaacutec nhau từ đoacute coacute thể chọn ra phương aacuten tốtnhất1048713 Quaacute trigravenh mocirc phỏng thường lặp lại một thực nghiệm nhiều lần để coacute được ướclượng về hiệu ứng tổng quaacutet của một số hagravenh động nhất định1048713 Mocirc phỏng maacutey tiacutenh thiacutech hợp cho hầu hết caacutec tigravenh huống mặc dugrave cũng coacute một sốmocirc phỏng thủ cocircng thagravenh cocircng1048713 Thường chỉ được dugraveng khi bagravei toaacuten quaacute phức tạp khocircng thể xem xeacutet bằng caacutec kỹthuật tối ưu dạng số Tiacutenh phức tạp theo nghĩa bagravei toaacuten khocircng thể cocircng thức hoacuteacho tối ưu (do khocircng thotildea caacutec giả định) hoặc cocircng thức quaacute lớn quaacute nhiều tươngtaacutec giữa caacutec biến hoặc về bản chất bagravei toaacuten lagrave bất định hay rủi roPhương phaacutep mocirc phỏng thiết lập mocirc higravenh của hệ thống thực vagrave tiến hagravenh caacutec thựcnghiệm lặp lại trecircn mocirc higravenh
bull Thuận lợi1048713 Lyacute thuyết tương đối trực tiếp hiệu ứng dagravei hạn của nhiều chiacutenh saacutech -gt neacuten thờigian lớn1048713 Do tiacutenh chất mocirc tả (khaacutec với danh định)1048713 Coacute thể thấy được nhanh choacuteng coacute thể đặt ra caacutec cacircu hỏi ldquowhat-ifrdquo coacute thể dugravengtiếp cận thử-vagrave-sai vagraveo giải quyết vấn đề một caacutech nhanh choacuteng rẻ chiacutenh xaacutec iacutetrủi ro hơn1048713 Thử nghiệm được biến quyết định phần nagraveo của mocirci trường thực sự quan trọngvới caacutec phương aacuten khaacutec nhau1048713 Yecircu cầu kiến thức riecircng biệt về bagravei toaacuten vigrave thế buộc người xacircy dựng mocirc higravenh phảilagravem việc thường xuyecircn với nhagrave quản lyacute ndash đối tượng mong muốn của HHTQĐ để
từ đoacute bản chất bagravei toaacuten vagrave caacutec quyết định được hiểu tốt hơn1048713 Mocirc higravenh được xacircy dựng từ viễn cảnhcaacutech nhigraven của nhagrave quản lyacute1048713 Mocirc higravenh chỉ cho một bagravei toaacuten riecircng biệt thường khocircng thể dugraveng giải caacutec bagravei toaacutenkhaacutec Như vậy mỗi thagravenh phần của mocirc higravenh ứng với một phần của hệ thống thựcdo đoacute sẽ khocircng yecircu cầu nhagrave quản lyacute phải tổng quaacutet hoacutea caacutec hiểu biết của migravenh1048713 Phổ bagravei toaacuten giải được rất rộng tồn kho nhacircn sự hoạch định chiến lược 1048713 Coacute thể chứa caacutec phức tạp thực sự của bagravei toaacuten khocircng cần caacutec đơn giản hoacutea (TDdugraveng caacutec phacircn phối xaacutec suất thực thay vigrave phacircn phối lyacute thuyết xấp xỉ)1048713 Coacute thể tự động sinh ra nhiều đo lường hiệu năng quan trọng1048713 Thường lagrave phương phaacutep duy nhất của HHTQĐ coacute thể xử lyacute caacutec bagravei toaacuten tương đốiphi cấu truacutec1048713 Coacute một số caacutec goacutei phần mềm mocirc phỏng (Monte Carlo) tương đối dễ dugravengbull Điểm yếu1048713 Tuy thường tigravem được caacutec phương aacuten đủ tốt nhưng khocircng đảm bảo lời giải tối ưu1048713 Quaacute trigravenh xacircy dựng mocirc higravenh thường dagravei vagrave tốn keacutem1048713 Giải phaacutep vagrave suy diễn từ nghiecircn cứu mocirc phỏng thường khocircng thể chuyển sang bagraveitoaacuten khaacutec vigrave mocirc higravenh kết hợp caacutec yếu tố đặc thugrave1048713 Đocirci khi do mocirc higravenh quaacute dễ giải thiacutech cho nhagrave quản lyacute necircn caacutec phương phaacutep phacircntiacutech thường xem nhẹ1048713 Phần mềm mocirc phỏng đocirci khi yecircu cầu caacutec kỹ năng đặc biệt do độ phức tạp củaphương phaacutep giải higravenh thứcbull Caacutec loại mocirc phỏng1048713 Mocirc phỏng xaacutec suất một hay nhiều biến độc lập mang tiacutenh xaacutec suất với 2 loạiphacircn phối ndash thường dugraveng kỹ thuật Monte Carlo1048713 Phacircn phối rời rạc tigravenh huống coacute một số giới hạn caacutec biến cố (biến) với hữu hạncaacutec giaacute trị cho mỗi biến cố (biến)1048713 Phacircn phối liecircn tục tigravenh huống coacute số lượng khocircng giới hạn caacutec biến cố tuacircn theocaacutec hagravem mật độ xaacutec suất như phacircn phối chuẩn1048713 Mocirc phỏng độc lậpphụ thuộc theo thời gian1048713 Độc lập khocircng cần thiết phải biết chiacutenh xaacutec thời điểm xảy ra biến cố (nhu cầutiecircu thụ lượng sản phẩm trong ngagravey khocircng biết chiacutenh xaacutec thời điểm tiecircu thụ)1048713 Phụ thuộc cần biết chiacutenh xaacutec thời điểm xảy ra sự kiện (bagravei toaacuten hagraveng đợi)1048713 Mocirc phỏng tương taacutec trực quan1048713 Mocirc phỏng hướng đối tượng dugraveng tiếp cận hướng đối tượng để xacircy dựng mocirc higravenhmocirc phỏng Chuacute yacute ngocircn ngữ mocirc higravenh hoacutea nhất thể UML (unified modelinglanguage) kể cả khi mocirc phỏng caacutec hệ thời gian thựcMOcirc HIgraveNH HOacuteA ĐA CHIỀU ndash XỬ LYacute PHAcircN TIacuteCH TRỰC TUYẾNbull Người ra quyết định thường phải xem xeacutet nhiều chiều của dữ liệu (TD caacutec chiềucủa dữ liệu baacuten hagraveng lagrave sản phẩm vugraveng thời gian người baacuten ) dữ liệu cần đượcphacircn tiacutech trực tiếp bằng caacutec cocircng cụ chuẩn hay phacircn tiacutech tự động bằng caacutec
phương phaacutep khai mỏ dữ liệu (data mining)bull Hầu hết caacutec hệ thống phacircn tiacutech đa chiều được nhuacuteng trong caacutec hệ xử lyacute phacircn tiacutechtrực tuyến (HXLPTTT ndash online analytic processing - OLAP)bull Mục tiecircu của XLPTTT nắm bắt cấu truacutec của dữ liệu thực để hỗ trợ ra quyết địnhbull Trong HHTQĐ coacute sự gắn nối tự nhiecircn giữa mocirc higravenh hoacutea dữ liệu mocirc higravenh hoacutea kyacutehiệu vagrave caacutec khiacutea cạnh của phacircn tiacutech ldquowhat-ifrdquobull Caacutec baacuteo caacuteo của HXLPTTT đều coacute tiacutenh tương taacutec dễ khai thaacutec sử dụng đặc biệtphugrave hợp cho caacutec baacuteo caacuteo về chỉ số hiệu năng chủ yếu (key performance indicators- KPI) baacuteo caacuteo về đo lường hiệu năng kinh doanh bull Thế hệ hiện tại của HXLPTTT vagrave hệ khai mỏ dữ liệu (data mining) tiacutech hợp caacutecđặc tiacutenh của hệ thocircng tin latildenh đạo (executive information system ndashEIS- nhiềucaacutech nhigraven dữ liệu chi tiết hoacutea theo nhu cầu) vagrave caacutec hệ đồ họa khaacutec ndash thường coacutegiao diện người dugraveng dạng kiểu WEBbull Caacutec hệ thống như trecircn cograven được gọi lagrave caacutec cocircng cụ triacute tuệ kinh doanh (businessintelligence - BI) vigrave coacute caacutec đặc trưng về mocirc higravenh hoacutea vagrave tối ưu hoacutea nhưng lạitrong suốt đối với ngươigrave dugravengbull Hiện caacutec cocircng cụ được đưa ra bởi caacutec nhagrave cung cấp về CSDL về hoạch định tagraveinguyecircn tổ chức (ERP) về nhagrave kho dữ liệu (data warehouse) về HXLPTTT MOcirc HIgraveNH HOacuteA VAgrave MOcirc PHỎNG TƯƠNG TAacuteC TRỰC QUANbull Iacutech lợi Người ra quyết định tham gia vagraveo quaacute trigravenh phaacutet triển mocirc higravenh vagrave thựcnghiệm mocirc phỏng vigrave vậy sẽ tin tưởng khi sử dụng mocirc higravenhbull Mocirc higravenh hoacutea tương taacutec trực quan (visual interactive modeling - VIM) dugraveng caacutecbiểu diễn đồ họa maacutey tiacutenh để trigravenh bagravey caacutec ảnh hưởng của caacutec quyết định quản lyacutekhaacutec nhau ở một thời điểm (tĩnh) hay tiến triển theo thời gian (động với kỹ thuậthoạt higravenh)bull Mocirc phỏng tương taacutec trực quan (visual interactive simulation - VIS) cho pheacutepngười dugraveng theo dotildei tiến trigravenh xacircy dựng vagrave sử dụng khai thaacutec mocirc higravenh mocirc phỏngdưới dạng hoạt higravenhbull Mocirc higravenh hoacutea tương taacutec trực quan coacute thể kết hợp với tiếp cận triacute tuệ nhacircn tạo đểđưa ra caacutec khả năng mới thay đổi từ xacircy dựng hệ thống dạng đồ họa đến tigravem hiểuvề động học của hệ thốngbull Cần đến caacutec hệ thống maacutey tiacutenh xử lyacute song song tốc độ cao để xacircy dựng caacutec mocircphỏng - phức tạp quy mocirc lớn dạng hoạt higravenh - mang tiacutenh khả thi ở thời gian thực
22Caacutec dạng hệ thống hỗ trợ ra quyết địnhHệ hỗ trợ quyết định nhoacutemRa quyết định nhoacutem giao tiếp vagrave cộng taacutec- Caacutec đặc điểm của cocircng việc nhoacutem+ Một nhoacutem thực hiện một nhiệm vụ thỉnh thoảng ra quyết định thỉnh thoảngkhocircng ra quyết định+ Caacutec thagravenh viecircn trong nhoacutem coacute thể ở những nơi khaacutec nhau
+ Caacutec thagravenh viecircn trong nhoacutem coacute thể lagravem việc ở những thời gian khaacutec nhau+ Caacutec thagravenh viecircn trong nhoacutem coacute thể lagravem việc cugraveng nhau hoặc ở caacutec tổ chức khaacutecnhau+ Nhoacutem coacute thể vĩnh viễn hoặc tạm thời+ Nhoacutem coacute thể ở bất kỳ mức quản lyacute nagraveo hoặc mức thời gian nagraveo+ Coacute sự điều phối (quaacute trigravenh vagrave nhiệm vụ đạt được) hoặc macircu thuẩn trongnhoacutem+ Coacute sự đạt được hoặcvagrave mất maacutet năng suất trong tổ chức+ Nhiệm vụ phải hoagraven thagravenh rất nhanh+ Khocircng thể hoặc quaacute đắt cho tất cả caacutec thagravenh viecircn trong nhoacutem cugraveng hợp ở mộtnơi+ Một số dữ liệu thocircng tin hoặc kiến thức cần thiết nằm ở nhiều nơi một sốkhaacutec ở ngoagravei tổ chức+ Chuyecircn mocircn của caacutec thagravenh viecircn khocircng coacute trong nhoacutem lagrave cần thiết- Caacutec hoạt động vagrave caacutec quaacute trigravenh miecircu tả caacutec cuộc họp+ Cuộc họp lagrave hoạt động chung liecircn quan bởi một nhoacutem người coacute địa vị bằngnhau hoặc gần bằng nhau+ Kết quả của cuộc họp phụ thuộc một phần vagraveo kiến thức yacute kiến caacutec đaacutenh giaacutecủa caacutec thagravenh viecircn+ Kết quả của cuộc họp cũng phụ thuộc vagraveo sự kết hợp của nhoacutem vagrave phụ thuộcvagraveo quaacute trigravenh ra quyết định được sử dụng bởi nhoacutem đoacute+ Giải quyết caacutec yacute kiến khaacutec nhau bởi người coacute quyền hạn hoặc thương lượnghoặc phacircn xửHỗ trợ giao tiếp- Giao tiếp lagrave thagravenh phần quan trọng cho hỗ trợ quyết định Khocircng coacute giao tiếp thigravekhocircng coacute cộng taacutec Những người ra quyết định caacute nhacircn phải giao tiếp với caacutecđồng nghiệp chuyecircn gia cơ quan chiacutenh phủ khaacutech hagraveng đối taacutec kinh doanh hellipHọ cũng cần dữ liệu vagrave thocircng tin (vagrave kiến thức) từ nhiều nơi trecircn thế giới Caacutecnhoacutem ra quyết định phải giao tiếp cộng taacutec vagrave thương lượng trong cocircng việcHầu hết caacutec tổ chức sẽ nhanh trở thagravenh khocircng coacute chức năng nếu khocircng coacute caacutec hệthống giao tiếp Thương mại điện tử coacute thể hiệu quả chỉ qua caacutec kỹ thuật giao tiếphiện đại- Caacutec kỹ thuật thocircng tin hiện đại cung cấp caacutec phương tiện hỗ trợ giao tiếp rẻnhanh coacute khả năng coacute thể tin cậy Nền tảng hỗ trợ giao tiếp lagrave caacutec hệ thống maacuteytiacutenh mạng+ Bắt đầu bằng điện baacuteo điện thoại radio vagrave ti vi+ Trong 100 năm chuacuteng ta phaacutet triển maacutey fax thư điện tử chương trigravenh chatnhoacutem tin tức hệ thống hội nghị truyền higravenh Hầu hết caacutec kỹ thuật nagravey đềuhoạt động trecircn internet+ Sự phaacutet triển giao tiếp sau cugraveng lagrave hệ thống họp điện tử caacutec dịch vụ vagrave hệ
thống hội nghị điện tử thường sử dụng internet để kết nối caacutec người ra quyếtđịnh- Caacutec thuận lợi aacutep dụng caacutec phương phaacutep giao tiếp cải tiến trong caacutec tổ chức+ Cải tiến năng suất của nhacircn viecircn+ Liecircn quan đến nhiều người ra quyết định chiacutenh+ Khocircng quan tacircm nhiều đến đường biecircn giới địa lyacute+ Tạo nền văn hoacutea hợp taacutec nhất quaacuten+ Cải tiến chất lượng cuộc sống của nhacircn viecircnHỗ trợ cộng taacutec Maacutey tiacutenh hỗ trợ cộng taacutec- Khung thời giannơi chốn+ Sự hiệu quả của kỹ thuật tiacutenh toaacuten cộng taacutec phụ thuộc vagraveo vị triacute của caacutec thagravenhviecircn trong nhoacutem vagrave phụ thuộc vagraveo thời gian chia sẽ thocircng tin gởi vagrave nhận+ Chia sự giao tiếp thagravenh bốn ocirc vagrave tổ chức bốn ocirc dọc theo 2 chiều thời gian vagravenơi chốn1048713 Thời gian Khi gởi vagrave nhận thocircng tin hầu như đồng thời giao tiếp lagrave đồngthời Viacute dụ Điện thoại ti vi vagrave caacutec cuộc họp gặp mặt nhau Giao tiếp bấtđồng bộ xảy ra khi người nhận nhận thocircng tin ở thời điểm khaacutec thời điểmgởi thocircng tin đoacute1048713 Nơi chốn Người gởi vagrave người nhận coacute thể ở cugraveng phograveng hoặc khocircng+ Bốn ocirc lagrave1048713 Cugraveng thời giancugraveng nơi chốn Caacutec thagravenh viecircn gặp mặt nhau cugraveng một luacutecgiống như phograveng quyết định hoặc gặp mặt truyền thống1048713 Cugraveng thời giankhaacutec nơi chốn Caacutec thagravenh viecircn ở caacutec nơi khaacutec nhau nhưnggiao tiếp cugraveng nhau Viacute dụ hội nghị truyền higravenh (videoconferencing)1048713 Khaacutec thời giancugraveng nơi chốn Nhiều người lagravem việc theo ca Ca nagravey để lạithocircng tin cho ca khaacutec1048713 Khaacutec thời giankhaacutec nơi chốn Caacutec thagravenh viecircn ở caacutec nơi khaacutec nhau Caacutecthagravenh viecircn nagravey gởi vagrave nhận thocircng tin ở những lần khaacutec nhau
23Thực thi hệ DSSHệ thống hỗ trợ quản lyacute (MSS) khocircng phải luacutec nagraveo cũng luocircn thagravenh cocircng Nhiều trường hợpthất bại của ES khocircng hoagraven toagraven lagrave lyacute do kỹ thuật Thực thi hệ thống lagrave một quaacute trigravenh liecircn tụcnhằm đảm bảo cho tổ chức chuẩn bị tiếp nhận một hệ thống mới vagrave đưa hệ thống vagraveo sử dụngthagravenh cocircngThực hiện cocircng nghệ hệ thống hỗ trợ quản lyacute lagrave việc phức tạp vigrave caacutec hệ thống nagravey khocircng đơnthuần lagrave hệ thống thocircng tin chỉ thu thập thao taacutec vagrave phacircn phối thocircng tin Magrave xa hơn chuacuteng
liecircn quan tới caacutec cocircng việc coacute thể lagravem thay đổi đaacuteng kể caacutech thức hoạt động của tổ chức Tuyvậy đa số caacutec yếu tố thực thi đều liecircn quan tới hệ thống thocircng tinThực thi MSS lagrave quaacute trigravenh liecircn tục diễn ra trong suốt thời gian phaacutet triển hệ thống từ đề xuấtban đầu đến nghiecircn cứu khả thi thiết kế vagrave phacircn tiacutech hệ thống lập trigravenh huấn luyện chuyểnđổi vagrave lắp đặt Caacutec chuyecircn gia hệ thống thocircng tin thường gọi thực thi lagrave giai đoạn cuối trongvograveng đời hệ thống Định nghĩa thực thi MSS phức tạp hơn vigrave bản chất lặp của sự phaacutet triểncaacutec hệ thống
THỰC THI KHOcircNG HOAgraveN CHỈNHCaacutec quyết định về tiacutenh khả thi thường coacute giả định về lợi iacutech đạt được khi kế hoạch thực thiđược thực hiện hoagraven toagraven Trong thực tế thường chỉ thực hiện 90 thậm chiacute 70 phần trăm sovới phacircn tiacutech khả thi Lyacute do lagrave sự thay đổi tại một nơi trong hệ thống coacute thể ảnh hưởng vagrave coacutethể taacutec động tiecircu cực đến chỗ khaacutec Do vậy cấp quản lyacute coacute thể bỏ những phần trong dự aacuten coacutethể gacircy ra taacutec động xấu Do đoacute dự aacuten sẽ thực hiện iacutet hơn 100 so với dự aacuten kế hoạch Caacutec lyacutedo khaacutec coacute thể lagrave do khấu trừ ngacircn saacutech hoặc vượt chi phiacuteĐAacuteNH GIAacute SỰ THAgraveNH COcircNG CỦA THỰC THI HỆ THỐNGPhải coacute caacutec chỉ số đo lường thigrave mới coacute thể đaacutenh giaacute sự thagravenh cocircng khi thực thi một hệ thốngDickson va Powers (1973) đề ra 5 tiecircu chuẩn độc lậpbull Tỷ lệ thời gian thực hiện dự aacuten với thời gian ước lượngbull Tỷ lệ chi phiacute thực tế vagrave ngacircn saacutech thực hiệnbull Thaacutei độ của cấp quản lyacute đối với hệ thốngbull Nhu cầu thocircng tin của caacutec nhagrave quản lyacute được đaacutep ứng như thế nagraveo qua hệ thốngbull Taacutec động của dự aacuten đối với những hoạt động maacutey tiacutenh trong cocircng tyCaacutec đo lường khaacutec để đaacutenh giaacute thagravenh cocircng của hệ hỗ trợ quản lyacute (MSS)bull Sự sử dụng hệ thống (dự định dugraveng hoặc thực sự dugraveng)bull Thỏa matilden của người dugravengbull Thaacutei độ taacuten thagravenhbull Mức độ hệ thống hoagraven thagravenh caacutec mục tiecircu ban đầubull Phần thưởng đối với tổ chức (giảm chi phiacute tăng doanh thuhellip)bull Tỷ số lợi iacutech chi phiacute
bull Mức độ thể chế hoacutea của MSS trong tổ chứcDo bởi tiacutenh đa dạng của DSS necircn việc đaacutenh giaacute sự thagravenh cocircng của hệ nagravey cũng khoacute khăn tuynhiecircn cũng coacute thể coacute một số yếu tố giuacutep cho DSS thagravenh cocircng như sự tham gia người dugravenghuấn luyện người dugraveng hỗ trợ quản lyacute cấp cao nguồn thocircng tin đặc điểm của những nhiệmvụ coacute liecircn quan (cấu truacutec bất định độ khoacute phụ thuộc)
Chương5Nhoacutem hỗ trợ quyết định vagrave nhoacutemcocircng nghệ phần mềm
51Nhoacutem tạo quyết định
MDM-Holsapple đatilde gợi yacute chuacuteng ta sử dụng giới hạn người tạo quyết định
Một nhoacutem lagrave kết cấu MDM nơi magrave nhiều người ra quyết định hoagraven toagraven tương taacutec
Một đội lagrave kết cấu MDM nơi caacutec thagravenh viecircn tư vấn cho người đưa ra quyết định nhưng khocircng tương taacutec
Một Ủy ban lagrave kết cấu MDM với một người tạo quyết định duy nhất vagrave sự tương taacutec giữa caacutec thagravenh viecircn
Mạng thocircng tin
Mạng lưới baacutenh xe mỗi người tham gia coacute thể giao tiếp với người đưa ra quyết định ở trung tacircm nhưng khocircng phải với người tham gia khaacutecCấu truacutec nagravey lagrave khocircng thỏa matilden tất cả những người tham gia ngoại trừ người ra quyết định
Mạng dacircy chuyền Tham gia chuyển tiếp thocircng tin chỉ để noacute luocircn liền kề nhau trong chuỗi
Thagravenh viecircn cuối cugraveng ko được đaacutep ứng
Mạng vograveng trograven Tương tự như chuỗi nhưng kết thuacutec được kết nối
Mạng kết nối hoagraven toagraven khocircng coacute hạn chế về giao tiếp vagrave tương taacutec giữa caacutec thagravenh viecircnNoacutei chungnoacute đaacutep ứng hầu hết caacutec kết nối của người tham gia nhưng truyền đạt thocircng tin mất nhiều thời gian vagrave coacute nhiều cơ hội xảy ra lỗi
Nhoacutem hagravenh vi vagrave chuẩn mực
MDMs thiết lập caacutec chỉ tiecircu hướng dẫn quaacute trigravenh ra quyết định
Một chuẩn mực quy định cụ thể những gigrave thagravenh viecircn trong nhoacutem dự kiến sẽ lagravem trong những hoagraven cảnh nhất định
Quy tắc gửi coacute thể được thocircng qua viacute dụ đaacutenh giaacute ngang hagraveng hoặc xử phạt
Lagravem thế nagraveo để đưa ra quyết định
Việc chọn lựa magrave trong đoacute việc sử dụng cấu truacutec MDM phải được dựa trecircn một số yếu tố liecircn quan với bối cảnh quyết định
Viacute dụmột cấu truacutec riecircng lẻ sẽ lagravem việc nơi magrave quyết định được cấu truacutec cao vagrave thocircng tin lagrave coacute sẵn
Một ủy ban cơ cấu sẽ lagrave sự lựa chọn khi người ra quyết định khocircng thể đưa ra quyết định một migravenh
52Caacutec vấn đề thường gặp trong nhoacutem
Kiacutech thước Noacutei chung sự nhất triacute vagrave gắn kết giữa caacutec thagravenh viecircn tỉ lệ nghịch với phạm vi nhoacutem Trong nhoacutem lớn rất dễ higravenh thagravenh caacutec nhoacutem nhỏ vagrave hoạt động rời rạc
Tư duy tập thể Trong nhoacutem lớn mọi người coacute xu hướng suy nghĩ đểđạtđược sự nhất triacute necircn khocircng phaacutet huy được sự saacuteng tạo
Caacutec vấn đề về xatilde hội
Xung đột Trong 1 nhoacutem ai cũng muốn migravenh lagrave giỏi nhất necircn dễ dẫn đến xung đột
Ẩn danh(Giấu tecircn) Đacircy lagrave phương phaacutep được sử dụng để kiểm soaacutet xung đột Cho caacutec thagravenh viecircn tham gia ẩn danh
Vấn đề giới tiacutenh Nam vagrave nữ thường coacute những thế mạnh khaacutec nhau điều nagravey coacute thể lagrave sức mạnh trong 1 thiết lập MDM
Đagravem phaacuten vagrave quyết định
Một quyết định coacute thể liecircn quan đến nhiều quan điểm khaacutec nhau vigrave thế cần phải coacute sự đagravem phaacuten
Caacutec thiết kế của cơ chế hỗ trợ cho MDM phải phugrave hợp với caacutec hoạt độngđagravemphaacuten
Những hoạt động nagravey bao gồm việc thu nhận yacute kiến của caacutec thagravenh viecircn 1 caacutech cocircng bằng
53Cocircng nghệ hỗ trợ MDM
Organizational DSSndash 1 hệ thống cung cấp caacutec quyết định hỗ trợ
Group Support Systemndash Cocircng nghệ sử dụng sự hỗ trợ của nhiều becircn tham gia
Group DSS ndash Lagrave 1 hệ thống được thiết kế đặc biệt để hỗ trợ cho MDM
DSS ndash Lagrave 1 hệ thống dưới sự kiểm soaacutet của 1 người quyết định hệ thống nagravey cung cấp 1 bộ cocircng cụ giuacutep phacircn tiacutech hoagraven cảnh đểđưa ra quyết định vagrave nacircng cao hiệu quả của quyết địnhđoacute
53Cocircng nghệ hỗ trợ MDM
Organizational DSSndash 1 hệ thống cung cấp caacutec quyết định hỗ trợ
Group Support Systemndash Cocircng nghệ sử dụng sự hỗ trợ của nhiều becircn tham gia
Group DSS ndash Lagrave 1 hệ thống được thiết kế đặc biệt để hỗ trợ cho MDM
DSS ndash Lagrave 1 hệ thống dưới sự kiểm soaacutet của 1 người quyết định hệ thống nagravey cung cấp 1 bộ cocircng cụ giuacutep phacircn tiacutech hoagraven cảnh đểđưa ra quyết định vagrave nacircng cao hiệu quả của quyết địnhđoacute
Mục tiecircu của cocircng nghệ hỗ trợ MDM
Quy trigravenh hỗ trợ tập trung vagraveo quaacute trigravenh tạo điều kiện thuận lợi cho sự tương taacutec
Cơ chế cấu truacutec quaacute trigravenh chi phối caacutec hoạt động truyền thocircng
Nhiệm vụ hỗ trợ cocircng việc coacute thể chọn lựa tổ chức hoặc lấy thocircng tin
Nhiệm vụ cấu truacutec cocircng việc cho pheacutep truy cập đến kỹ thuật lọc kết hợp phacircn tiacutech kiến thức liecircn quan đến cocircng việc
Caacutec lớp loại cocircng nghệ hỗ trợ MDM
Phacircn loại theo đặc điểm do DeSanctis vagrave Gallupe đưa ra đề xuất một chương trigravenh ba cấp dựa trecircn caacutec tiacutenh năng được cung cấp
Hệ thống cấp 1 Mục điacutech chiacutenh lagrave tạo điều kiện thocircng tin liecircn lạc giữa caacutec thagravenh viecircn
Hệ thống cấp 2 Thiết kế để giảm thiểu rủi ro
Hệ thống cấp 3 Giuacutep điều chỉnh xử lyacute quyết định
Phacircn loại theo cocircng nghệ -Kraemer vagrave King tập trung vagraveo cocircng nghệ aacutep dụng
Cocircng nghệ bảng mạch điện tử
Hội nghị trực tuyến
Mạng lưới tập đoagraven
Trung tacircm thocircng tin
Mocirci trường cộng taacutec
Phograveng quyết định
Nhoacutem phần mềm
Phần mềm được thiết kế để hỗ trợ sự hợp taacutec bao gồm việc thu huacutet vagrave lưu trữ thocircng tin
Caacutec tổ chức dẫn đầu thị trường hiện tại lagrave Lotus Notes and Domino Microsoft Exchange Novell GroupWise and Oracle Office
Caacutec cocircng cụ trong một bộ phần mềm bao gồm người quản lyacute hội nghị (Lotus Sametime) vagrave trao đổi thocircng điệp (Lotus Notes Mail)
Xếp hạng phần mềm cho nhoacutem
Ellis vv đề xuất một hệ thống xếp hạng dựa vagraveo kiểu sự hỗ trợ noacute Cung cấp
Hệ thocircng điệp
Hệ thống hội thảo truyền higravenh
Hệ thống cộng taacutec soạn thảo
Nhoacutem phacircn phối giải phaacutep phần mền
Hệ thống phối hợp
Hệ thống thocircng minh đại diện
Lực lượng điều khiển phaacutet triển phần mềm cho nhoacutem
Một số nhacircn tố chiacutenh bao gồm
Tăng năng suất
Giảm số lượng caacutec cuộc họp
Tăng cường tự động hoacutea caacutec quy trigravenh lagravem việc thường xuyecircn
Cần phối hợp toagraven cầu tốt hơn
Tiacutenh sẵn sagraveng của những mạng lan rộng
Coleman vagrave Khanna liệt kecirc 10 nhacircn tố khaacutec
54Quản lyacute hoạt động MDM (Mobile Device Management - Quản lyacute thiết bị di động)
Một số phương phaacutep phối hợp phổ biến hơnMDM lagrave
Kỹ thuật nhoacutem định danh
Kỹ thuật Delphi
Sự phacircn xử
Hệ thocircng tin dựa trecircn vấn đề
Nemawashi
Kỹ thuật nhoacutem định danh
1-Mỗi người tham gia viết ra những yacute tưởng về những gigrave necircn quyết định
2-Lần lượt mỗi người tham gia trigravenh bagravey yacute tưởng của migravenh được ghi lại trecircn bảng Khocircng thảo luận ở đacircy
3-Sau khi tất cả caacutec yacute tưởng được trigravenh bagravey caacutec đại biểu coacute thể chất vấn những người khaacutec
4-Mỗi người tham gia bỏ phiếu cho mỗi yacute tưởng
Kỹ thuật Delphi
Về cơ bản tương tự như kỹ thuật nhoacutem định danh ngoại trừ những người khocircng bao giờ tham gia cuộc họp
Một cocircng cụ khảo saacutet được sử dụng để thu thập đầu vagraveo ban đầu từ caacutec thagravenh viecircn
Một cuộc khảo saacutet thứ hai được gửi đi với một bản toacutem tắt caacutec kết quả chung
Những bước lặp lại cho đến khi đạt được một sự đồng thuận hoặc nhigraven nhận của đa số
Sự phacircn xử(Arbitration )
Thiacutech hợp nhất khi caacutec thagravenh viecircn của MDM đại diện cho caacutec yếu tố đối lập
Những người tham gia đồng yacute rằng nếu lựa chọn thay thế hai becircn thỏa thuận khocircng được tigravem thấy thigrave một trọng tagravei viecircn becircn ngoagravei sẽ tham gia
Trọng tagravei sau đoacute lựa chọn thay thế ocircng hoặc xeacutet thấy thiacutech hợp nhất
Hệ thống thocircng tin dựa trecircn vấn đề (IBIS)
Lagrave một phương phaacutep lập luận cấu truacutec
Một đại diện cho IBIS lagrave một đồ thị với caacutec nuacutet vagrave caacutec liecircn kết
IBIS bắt đầu với lựa chọn của một nuacutet vấn đề gốc sau đoacute caacutec nuacutet vị triacute khaacutec nhau được liecircn kết với nuacutet gốc
Caacutec nuacutet vị triacute nagravey sau đoacute được đaacutenh giaacute dựa trecircn những lập luận gắn liền với chuacuteng
Nemawashi (được sử dụng rộng ratildei tại Nhật Bản)
1-Một hoặc nhiều thagravenh viecircn của MDM được chỉ định lagrave điều phối viecircnCaacutec điều phối viecircn sau đoacute chọn người tham gia cograven lại
2-Điều phối viecircn xacircy dựng một tổng hợp caacutec sự lựa chọn vagrave sau đoacute caacutec chuyecircn gia đaacutenh giaacute caacutec lựa chọn
3-Điều phối viecircn lựa chọn một sự lựa chọn dựa trecircn kết quả ở trecircn(ở 2)
4-Sự thay thế được luacircn chuyển điều phối viecircn tigravem kiếm sự đồng thuận thocircng qua sự thuyết phục vagrave đagravem phaacuten
5-Nếu đạt được sự đồng thuận điều phối viecircn cho lưu thocircng một tagravei liệu magrave mỗi thagravenh viecircn MDM để lại dấu hiệu trecircn đoacute
55Nơi lagravem việc ảo
Nhiều tổ chức trecircn toagraven thế giới kinh doanh bất động sản cho cocircng nghệ hợp taacutec
Cocircng việc được trở thagravenh một điều bạn lagravem hơn lagrave một nơi bạn đi
Những thay đổi lớn nhất mang lại bởi nơi lagravem việc ảo coacute thể lagrave về văn hoaacute hay xatilde hội hơn lagrave về cocircng nghệ
Chương 6 Hệ thống thocircng tin điều hagravenh
61 Yacute nghĩa của EIS- Hệ thống thocircng tin điều hagravenh
- EIS lagrave một dạng đặc biệt của DSS được thiết kế để hỗ trợ ra quyết định ở cấp cao nhất của một tổ chức
- Lagrave một hệ thống thocircng tin hỗ trợ nhu cầu lập kế hoạch vagrave đaacutenh giaacute của caacutec nhagrave quản lyacute điều hagravenh
- EIS coacute thể giuacutep một CEO coacute được bức tranh tổng thể chiacutenh xaacutec nhất về caacutec hoạt động vagrave một bản toacutem tắt những gigrave magrave đối thủ cạnh tranh đang lagravem
- Caacutec hệ thống nagravey noacutei chung hoạt động dễ dagraveng vagrave trigravenh bagravey thocircng tin theo những caacutech dễ hiểu để việc tiếp thu được nhanh choacuteng (biểu đồ đồ thịhellip)
(Tagravei liệu thecircm EIS lagrave những loại hệ thống lagrave rất phức tạp trong tự nhiecircn Coacute thể noacutei hệ thống nagravey cũng cung cấp cho caacutec nhagrave quản lyacute với caacutec thiết bị coacute khả năng ra quyết định bằng caacutech sử dụng của noacute Hệ thống nagravey hoạt động trong điều kiện như vậy quan trọng như trong caacutec hệ thống khaacutec khocircng hỗ trợ Khả năng lưu trữ dữ liệu nặng lagravem cho noacute lyacute tưởng để được thocircng qua khocircng chỉ bởi caacutec doanh nghiệp lớn magrave cograven bởi caacutec doanh nghiệp nhỏ hơn Nhigraven chung hệ thống nagravey lagrave dagravenh cho caacutec nhacircn viecircn cấp cao hỗ trợ thagravenh thạo trong việc đưa ra caacutec quyết định quan trọng)
Caacutec phiecircn EIS tiecircu biểu- Phiecircn lagravem việc coacute thể bắt đầu với một baacuteo caacuteo về tigravenh higravenh tagravei chiacutenh vagrave kinh
doanh của một cocircng ty caacutec chỉ số hoạt động quan trọng được hiển thị rotilde ragraveng- EIS sẽ cho pheacutep caacutec giaacutem đốc điều hagravenh coacute thể đi sacircu vagraveo dữ liệu từ những con
số bất kỳ magrave noacute hỗ trợ- Việc điều hagravenh coacute thể lựa chọn một mức độ chi tiết ( VD danh số baacuten hagraveng) nếu
như cần điều tra thecircm- Lagrave một phương phaacutep tiếp cận coacute thể giuacutep việc ra quyết định tốt hơn
Những điều magrave EIS ko coacute- EIS khocircng phải lagrave sự thay thế cho caacutec hệ thống dựa trecircn caacutec maacutey tiacutenh khaacutec EIS
thực sự chỉ cung cấp dữ liệu cho caacutec hệ thống nagravey- Noacute khocircng thể biến caacutec bộ hệ điều hagravenh của maacutey tiacutenh thagravenh những ldquochuyecircn viecircn
giỏirdquo- Coacute thể được viacute một caacutech cao hơn như lagrave một trợ lyacute đaacuteng tin cậy coacute thể được gọi
đến bất khi nagraveo vagrave mỗi khi cần thiết
Tagravei liệu thecircm Sự khaacutec nhau giữa EIS vagrave DSS+ EIS thiết kế để hỗ trợ những người điều hagravenh cấp cao giuacutep họ khaacutem phaacute caacutec vấn đề vagrave caacutec cơ hội DSS hỗ trợ những nười phacircn tiacutech cố gắng trả lời cacircu hỏi caacutei gigrave coacute thể lagravem cugraveng với một cơ hội hoặc một vấn đề
Chiều EIS DSSNhững người sử dụng thocircng thường
Duyệt dữ liệu đi xuống truy xuất trạng thaacutei
Hỗ trợ phacircn tiacutech vagrave quyết định
Sự thuacutec đẩy Tiacutenh thiacutech hợp Tiacutenh hiệu quảỨng dụng Queacutet mocirci trường đaacutenh giaacute
hiệu suất nhận dạng caacutec vấn đề vagrave caacutec cơ hội
Caacutec quyết định quản lyacute trecircn caacutec lĩnh vực đa dạng
Hỗ trợ quyết định Caacutec chiacutenh saacutech caacutec quyết định khocircng coacute cấu truacutec ở mức cao vagrave hỗ trợ giaacuten tiếp
Hỗ trợ caacutec quyết định lặp lại caacutec quyết định khocircng thể đoaacuten trước ra quyết định khocircng coacute cấu truacutec vagrave baacuten cấu truacutec
Loại thocircng tin Caacutec thocircng tin tin tức thocircng tin becircn ngoagravei về khaacutech hagraveng đối thủ cạnh tranh mocirci trường caacutec baacuteo caacuteo theo yecircu cầu vagrave định thời về caacutec hoạt động becircn trong
Caacutec thocircng tin hỗ trợ caacutec tigravenh huống đặc biệt
Sử dụng coacute nguyecircn tắc
Dograve theo vết vagrave điều khiển nhận dạng cơ hội
Hoạch định tổ chức phacircn nhoacutem vagrave điều khiển
Khả năng phugrave hợp với những người sử dụng caacute nhacircn
Thiết kế loại ra quyết định cho mỗi người điều hagravenh caacute nhacircn bằng nhiều lựa chọn đầu ra
Cho pheacutep caacutec đaacutenh giaacute caacute nhacircn caacutec khả năng what-if lựa chọn loại hộp hội thoại
Đồ họa Phải coacute Lagrave một phần quan trọng của nhiều DSS
Thacircn thiện người sử dụng
Phải coacute Phải coacute nếu khocircng coacute người sử dụng trung gian
Xử lyacute thocircng tin Lọc neacuten thocircng tin dograve theo vết dữ liệu vagrave thocircng tin quan trọng
EIS kiacutech thiacutech caacutec cacircu hỏi caacutec cacircu trả lời bằng caacutech sử dụng DSS vagrave phản hồi lại EIS
Hỗ trợ caacutec thocircng tin chi tiết
Truy xuất thường xuyecircn caacutec mức chi tiết của bất kỳ thocircng tin tổng hợp nagraveo (duyệt dữ
Coacute thể coacute trong DSS nhưng khocircng thường
liệu chi tiết)Cơ sở mocirc higravenh Caacutec chức năng coacute sẵn bị hạn
chếLagrave điểm cốt lotildei của DSS
Cấu truacutec Theo người baacuten sản phẩm hoặc theo caacutec chuyecircn gia hệ thống thocircng tin
Theo người sử dụng hoặc caacute nhacircn hoặc caacutec chuyecircn gia từ caacutec trung tacircm thocircng tin hoặc phograveng ban hệ thống thocircng tin
Phần cứng Mainframe caacutec trạm RISC mạng LANs hoặc caacutec hệ thống phacircn bố
Mainframe caacutec trạm RISC caacutec maacutey PC hoặc caacutec hệ thống phacircn bố
Bản chất caacutec goacutei phần mềm
Truy xuất tương taacutec dễ dagraveng đến nhiều cơ sở dữ liệu truy xuất trực tuyến caacutec khả năng DBMS phức tạp caacutec liecircn kết phức tạp
Caacutec khả năng tiacutenh toaacuten lớn caacutec ngocircn ngữ mocirc higravenh mocirc phỏng ứng dụng vagrave caacutec bộ tạo DSS
Bản chất caacutec thocircng tin
Trigravenh bagravey thocircng tin được phaacutet sinh trước về quaacute khứ vagrave hiện tại tạo caacutec thocircng tin mới về quaacute khứ hiện tại tương lai
Tạo thocircng tin mới về quaacute khứ hiện tại tương lai
62 Lịch sử EIS- EIS xuất hiện lần đầu tiecircn tại MIT vagraveo những năm 1970
- Những EIS đầu tiecircn được phaacutet triển bởi caacutec doanh ngiệp lớn sẵn sagraveng chấp nhận rủi ro để đạt được lợi thế cạnh tranh
- Vagraveo những năm 1980 caacutec nhagrave cung cấp đatilde phaacutet triển một số cơ sở khaacutech hagraveng rộng vagrave cocircng nghệ EIS được tiếp tục phaacutet triển cho đến ngagravey nay
(Tagravei liệu thecircm Sử dụng DSSEIS cho phaacutet triển bền vững + Một số nghiecircn cứu đatilde được tiến hagravenh để kiểm tra việc thực hiện của EIS trong khu vực cocircng cộng vagrave chiacutenh phủ caacutec nước tổ chức kể từ khi chuacuteng được phaacutet triển theo định hướng lợi nhuận cho caacutec cocircng ty tư nhacircn (Hasan vagrave Hasan năm 1997) Theo một nghiecircn cứu tiến hagravenh tại Mỹ ở hơn 300 cocircng ty kết quả cho thấy sự khaacutec biệt của EIS giữa tư nhacircn vagrave chiacutenh phủ một số kết quả thuacute vị được phaacutet hiệnViacute dụ khoacute khăn hơn để chuyển tiền từ một tagravei khoản khaacutec trong một EIS của chiacutenh phủ cũng lagrave khoacute khăn hơn để biện giải thiacutech cho những chi phiacute phaacutet triển EIS của chiacutenh phủ Một nghiecircn cứu khaacutec được tiến hagravenh ở Australia
cho thấy rằng EIS cung cấp cho quản lyacute một higravenh ảnh chiacutenh xaacutec hơn về tổ chức thực hiện vagrave cung cấp hỗ trợ cho caacutec lợi iacutech chiến lược cải thiện khocircng chỉ cho caacutec nhagrave quản lyacute nhưng cograven cho phần cograven lại của tổ chức Dựa trecircn caacutec hệ thống được thiết kế cho caacutec cocircng ty tư nhacircn với một caacutech rotilde ragravengxaacutec định mục tiecircu EIS lagrave thiacutech hợp cho caacutec tổ chức cocircng cộng hiện đại nhưng cần phải được linh hoạt hơn vagrave kết thagravenh chugravem một phạm vi rộng hơn khả năng vagrave phương tiện hơn so với khu vực tư nhacircn ban đầu theo định hướng sản phẩm (Hasan vagrave Hasan năm 1997) Điều nagravey coacute thể lagrave do thực tế rằng caacutec hoạt động khu vực cocircng lagrave bắt buộc coacute taacutec động rộng phải đaacutep ứng sự mong đợi duy nhất cocircng cộng thường coacute mục tiecircu mơ hồ vagrave macircu thuẫn iacutet quyền tự chủ vagrave kiểm soaacutet việc ra quyết định vagrave nhacircn viecircn lagrave khoacute khăn hơn (Watson vagrave Carte2000) + Toacutem lại EIS lagrave một khaacutei niệm thagravenh cocircng noacute phaacutet triển qua nhiều năm tuy nhiecircn EIS khắc phục khiếm khuyết của migravenh bằng caacutech tiến hagravenh nghiecircn cứu liecircn tục)
63 Tại sao những người điều hagravenh hagraveng đầu lại khaacutec nhau- Họ lagrave những doanh nghiệp theo định hướng coacute suy nghĩ
- Coacute một khoảng khocircng gian rộng để kiểm soaacutet
- Họ chịu traacutech nhiệm cho việc thiết lập chiacutenh saacutech
- Họ đại diện cho tổ chức mocirci trường becircn ngoagravei
- Hagravenh động của họ tạo ra những kết quả đaacuteng kể về tagravei chiacutenh vagrave con người
Tần số caacutec hoạt động điều hagravenh- Xử lyacute xaacuteo trộn 42
- Hoạt động kinh doanh 32
- Phacircn bổ nguồn lực 17
- Đagravem phaacuten 3
- Những điều khaacutec 6
Handling Disturbances 42
Entrepreneurial Activites 32
Resource Allocation 17
Negotiation 3
Other 6
Những thocircng tin điều hagravenh cần thiết- Quản lyacute xaacuteo trộn coacute thể yecircu cầu sự chuacute yacute xung quanh đồng hồ
- Hoạt động kinh doanh yecircu cầu điều hagravenh để dự đoaacuten những thay đổi trong mocirci trường
- Nhiệm vụ phacircn bổ tagravei nguyecircn yecircu cầu lựa chọn người quản lyacute vagrave caacutec nguồn lực hạn chế được triển khai
- Đagravem phaacuten yecircu cầu cập nhật thocircng tin từng phuacutet để coacute thể xacircy dựng được sự đồng thuận
Caacutec loại thocircng tin điều hagravenh- Hệ thống kế toaacuten coacute liecircn quan đến việc tiacutenh toaacuten thu nhập hoạt động cho caacutec lĩnh
vực cụ thể lagrave quan trọng hơn so với caacutec hệ thống kế toaacuten truyền thocircng- Thocircng tin về thị trường khaacutech hagraveng cung cấp giaacute trị trong việc quyết định chiến
lược- Caacutec thocircng tin cần thiết thường được truyền đi trecircn một số hệ thống maacutey tiacutenh vagrave
nằm trong toagraven tổ chức- Caacutec thocircng tin được sử dụng thường lagrave ngắn hạn vagrave dễ thay đổi
Phương thức để xaacutec định thocircng tin cần thiết
Rockart xaacutec định được năm phương thức cơ bản để xaacutec định thocircng tin cần thiết
- Phương thức dựa trecircn kết quả- Phương thức rỗng- Phương thức chỉ số khoacutea- Phương thức tổng hợp nghiecircn cứu- Phương thức dựa vagraveo nhacircn tố then chốt dẫn đến thagravenh cocircng
64 Thagravenh phần EIS
- Sản phẩm EIS đầu tiecircn được phaacutet triển để sử dụng trecircn maacutey tiacutenh cấu higravenh cao nhưng caacutec sản phẩm hiện nay nhằm mục tiecircu lagrave nền tảng ClientServer
- Những nền tảng linh hoạt hơn coacute thể thiacutech ứng với thay đổi trong tổ chức vagrave cocircng nghệ
- Sử dụng dữ liệu thời gian thực dẫn đến quyết định nhanh hơn nhiều thocircng tin hơn
Thagravenh phần phần cứng- Một EIS khocircng đogravei hỏi coacute phần cứng cụ thể hoặc duy nhất nagraveo- Chigravea khoacutea của vấn đề lagrave để đảm bảo rằng caacutec thagravenh phần của EIS tối ưu hoacutea vagrave
phugrave hợp với tagravei nguyecircn maacutey tiacutenh của tổ chức- Hệ thống nagravey phải được cấu higravenh để caacutec nguồn tagravei nguyecircn phugrave hợp với những
người điều hagravenh chuacuteng
Thagravenh phần phần mềm- Traacutei ngược với phần cứng phần mềm thường được chuyecircn mocircn hoacutea cao cho caacutec
bagravei toaacuten về miền- Sự chuyecircn mocircn hoacutea nagravey thường đạt được bằng caacutech sử dụng thagravenh phần off-the-
shelf cho toagraven bộ EIS vagrave caacutec mocirc-đun tugravey chỉnh để đaacutep ứng nhu cầu cụ thể- Lotus Notes lagrave một viacute dụ điển higravenh Noacute coacute thể được sử dụng một migravenh hoặc coacute
thể phục vụ becircn thứ ba mocirc-đun plug-in
Cocircng nghệ EIS hiện nay
Dobrzeniecki đề xuấtphacircn loạitừng cấptheo bachức năng- Loại 1 sản phẩm bao gồmmột bộ đầy đủcaacutec ứng dụngtừ mộtnhagrave cung cấp- Loại 2 sản phẩm đượcthựchiệnở phần đầu củacaacutecsản phẩmDSS đượcphaacutet triển
bởicugravengmộtnhagrave cung cấp- Loại 3 sản phẩmkết hợp với nhautheo bất kỳ số lượngthuộc sở hữu củacocircng ty
65 Xacircy dựng EIS
- Xacircy dựngmộtEISgiống nhưxacircydựngmột số hệ thống khaacutec củamocirc higravenh hệ thống thocircng tin
- Việcphaacutet triểncấu truacutecnecircn được theo dotildeitừ quaacute trigravenh thiết kế đến quaacute trigravenhthực hiện
- Tuy nhiecircn một dự aacuten phaacutet triển EIScoacute xu hướnglagrave thống nhấtvagraveyecircu cầu hỗ trợ caacutec nhagrave quản lyacute latildenh đạo
- Xacircy dựng một EIScoacute thểphaacutet hiện ra đượccaacutectigravenh huống khoacute khănmagravemột nhagrave phaacutet triển chưabao giờ gặp phải
Mocirc higravenh EIS
Khung phaacutet triển một EIS
- Watson et al đề nghị xacircy dựngkhung với ba thagravenh phần+ Caacutech tiếp cận tập trung vagraveo yếu tốcon người vagrave dữ liệu coacute liecircn quan đến EIS+ Quaacute trigravenh phaacutet triển cần sự linh hoạt vagrave tương taacutec+ Người sử dụng - hệ thống hộp thoại bao gồm một ngocircn ngữ hagravenh động để xử lyacute caacutec lệnh
Lợi iacutech của EIS- Dễ duy trigrave caacutec mục tiecircu coacute tổ chức- Dễ truy xuất thocircng tin- Cho pheacutep người sử dụng nacircng cao hiệu suất hơn
- Tăng chất lượng ra quyết định- Cung cấp sự cải tiến cạnh tranh- Tiết kiệm thời gian của người sử dụng- Tăng khả năng vagrave chất lượng giao tiếp- Cung cấp khả năng điều khiển tốt hơn trong tổ chức- Cho pheacutep tham gia caacutec vấn đề vagrave caacutec cơ hội- Cho pheacutep hoạch định- Cho pheacutep tigravem kiếm nguyecircn nhacircn của một vấn đề- Thảo matilden caacutec yecircu cầu của người điều hagravenh
Hạn chế của EIS vagrave 1 số sai lầm cần traacutenh
- Chi phiacute một cuộc khảo saacutetnăm1991 chothấychi phiacute phaacutet triểntrungbigravenh365000USDvớichi phiacute vận hagravenhhagraveng năm lagrave$200000 (EIS)
- Cocircng nghệ hạn chếEIScần phảiđượctiacutech hợp hoagraven toagravenvagraveokiếntruacuteccủadoanh nghiệphiện tại do đoacute noacutelagrave một thaacutech thứclớn đối vớithiết kế
- Hạn chế tổ chức cơ cấu tổ chứccoacute thể khocircng phugrave hợp
Sự hạn chế về tổ chức- Chương trigravenh nghị sự vagrave thời gian chệch EIS mocirc tả một phần việc thực hiện một
chương trigravenh nghị sự vagrave coacute thể dễ dagraveng đạt được sự tin cậy một caacutech chắc chắn- Đồng bộ hoacutea việc quản lyacute sự tin cậy đuacuteng luacutec đặc biệt baacuteo caacuteo EIS coacute thể phaacute
vỡ sự ổn định thiết lập caacutec chu trigravenh baacuteo caacuteo một caacutech tốt nhất- Sự bất ổn EIS phản ứng nhanh coacute thể gacircy ra việc taacutec động trở lại một caacutech
nhanh choacuteng dẫn đến sự thiếu ổn định trong tổ chức
Sự thất bại lagrave thay thế khocircng thể chấp nhận được- Một số yếu tố lagravem EIS thất bại
+ Thiếu sự hỗ trợ về mặt quản lyacute+ Vấn đề chiacutenh trị+ Thất bại của nhagrave phaacutet triển+ Lỗi về cocircng nghệ+ Giaacute cả+ Thời gian
66 Ra quyết định điều hagravenh trong tương lai vagrave EIS
- Coacute một vagravei điều kiện sẽ được hợp nhất cho việc chuyển đổi cocircng nghệ Trong đoacute một vagravei điều kiện coacute thể dễ dự đoaacuten Hai điều kiện magrave ta coacute thể thấy lagrave+ Phaacutet triển cocircng nghệ maacutey tiacutenh trong việc điều hagravenh sẽ tạo ra sự chuyển đổi được chấp nhận một caacutech dễ dagraveng hơn+ Mở rộng traacutech nhiệm điều hagravenh sẽ mở rộng nhu cầu thocircng tin
Tương lai của EIS- EIS thocircng minh Những tiến bộ trong cocircng nghệ AI sẽ được triển khai trong caacutec
EIS- EIS đa phương tiện Cơ sở dữ liệu đa phương tiện sẽ cho pheacutep tiacutech hợp văn bản
giọng noacutei vagrave higravenh ảnh trong tương lai- EIS thocircng tin Tương lai EIS sẽ mở rộng hơn trong việc sử dụng dữ liệu becircn
ngoagravei doanh nghiệp- EIS kết nối Giao tiếp với băng thocircng rộng cho pheacutep kết nối liecircn thocircng lớn hơn
Chương 7 HỆ CHUYEcircN GIA VAgrave TRIacute TUỆ NHAcircN TẠO
71 Caacutec khaacutei niệm
72 Triacute thocircng minh của triacute tuệ nhacircn tạo
73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia
74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia
75 Lợi iacutech vagrave hạn chế của hệ chuyecircn gia
71 Caacutec khaacutei niệm
Chuyecircn mocircn (Expertise) sự hiểu biết rộng trong 1 lĩnh vực hẹp
Hệ chuyecircn gia (Expert Systems)1 chương trigravenh maacutey tiacutenh sử dụng 1 tập caacutec luật dựa trecircn tri thức của con người để giải quyết caacutec vấn đề đogravei hogravei phải coacute sự chuyecircn mocircn
Một số hệ chuyecircn gia nổi tiếng
DENDRAL (Standford 1960s Edward Feigenbaum)
MYCIN (Standford1970s Edward Shortliffe)
PROSPECTOR (MIT 1979)
Triacute tuệ nhacircn tạo (Artificial Intelligence ndash AI)
Triacute tuệ nhacircn tạo một bộ phacircn của ngagravenh khoa học maacutey tiacutenh quan tacircm đến việc thiết kế caacutec hệ thống maacutey tiacutenh thocircng minh đoacute lagrave caacutec hệ thống đưa ra caacutec đặc điểm magrave từ đoacute chuacuteng ta liecircn hệ với sự thocircng minh trong hagravenh động của con người (Barr vagrave Feigenbaum 1981)
Mục điacutech của AI
Mục điacutech khoa học xaacutec định caacutec gợi yacute để giải thiacutech caacutec loại khaacutec nhau của triacute tuệ thực
Mục điacutech kỹ thuật giải quyết caacutec vấn đề trong thế giới thực
Triacute tuệ nhacircn tạo kế thừa nhiều yacute tưởng quan điểm kỹ thuật từ caacutec ngagravenh khoa học khaacutec
- Triết học
- Logic Toaacuten học
- Tiacutenh toaacuten
- Khoa học tacircm lyacute Khoa học nhận thức
- Sinh học Thần kinh học
- Tiến hoacutea
Caacutec lĩnh vực ứng dụng trong Triacute tuệ nhacircn tạo
Mạng nơ ron thần kinh (Neural Networks)
Tiacutenh toaacuten sự tiến hoacutea
(Evolutionary Computation)
Hệ chuyecircn gia (Expert Systems)
Kỹ thuật xử lyacute tiếng noacutei (Speech Processing)
Kỹ thuật xử lyacute ngocircn ngữ tự nhiecircn
(Natural Language Processing)
Lập kế hoạch (Planning)
Robot (Robotics)
Khoa học higravenh ảnh (Vision)
Caacutec kỹ thuật thocircng dụng dugraveng trong AI
Biểu diễn(Representation)
Học (Learning)
Caacutec luật (Rules)
Tigravem kiếm (Search)
72 Triacute thocircng minh của triacute tuệ nhacircn tạo
Con người suy diễn như thế nagraveo
Phacircn loại (Categorization)
Caacutec quy tắc cụ thể
Heuristics
Kinh nghiệm trước đoacute
Dự tiacutenh trước
Maacutey tiacutenh suy diễn như thế nagraveo
Lập luận dựa trecircn luật IF-THEN mocirc tả tri thức được matilde hoacutea dưới dạng caacutec luật
Caacutec khung (Frames) lagrave caacutec đại diện mocirc tả caacutec tigravenh huống giống nhau lagrave điển higravenh của một vagravei phacircn loại
Lập luận dựa trecircn caacutec trường hợp mocirc phỏng giải phaacutep trước đoacute cho một vấn đề hiện tại
Nhận dạng mẫu phaacutet hiện acircm thanh higravenh dạng hoặc caacutec chuỗi dagravei
Caacutec dạng khaacutec của Triacute tuệ nhacircn tạo
Học maacutey- mạng nơron vagrave giải thuật di truyền
Lập trigravenh tự động ndash lagrave những kỹ thuật tạo ra caacutec chương trigravenh để lagravem 1 nhiệm vụ riecircng biệt (cho pheacutep những người khocircng phải lagrave người lập trigravenh coacute thể lập trigravenh được)
Cuộc sống nhacircn tạo ndash nỗ lực để taacutei tạo caacutec hiện tượng sinh học trong caacutec hệ thống dựa trecircn maacutey tiacutenh
73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia(Expert Systems- ES)
Theo Jackson (1999) Một hệ chuyecircn gia lagrave một chương trigravenh maacutey tiacutenh mocirc tả vagrave suy diễn với tri thức của một vagravei lĩnh vực để giải quyết vấn đề hay đưa ra caacutec lời khuyecircn
Cấu truacutec cơ bản của ES được dựa theo cấu truacutec chung của DSS Sự khaacutec biệt chiacutenh giữa ES vagraveDSS lagrave hệ ES thu thập caacutec kiến thức từ những
chuyecircn gia trong lĩnh vực quan tacircmĐặc trưng của hệ chuyecircn gia Hiệu quả cao Thời gian trả lời thỏa đaacuteng Độ tin cậy cao Dễ hiểu
Giao diện người dugraveng trong ES
Thiết kế giao diện người dugraveng tập trung vagraveo caacutec yếu tố như dễ dagraveng sử dụngcoacute độ tin cậy cao giảm tải những khoacute khăn khi sử dụng
Thiết kế necircn coacute một số tương taacutec (đầu vagraveo kiểm soaacutet vagrave truy vấn)
Cấu tạo giao diện người dugraveng gồm coacute magraven higravenh cảm ứng bagraven phiacutem buacutet saacuteng lệnh thoại caacutec phiacutem chuyecircn dụng
Cơ sở tri thức (Knowledge Base)
Chứa đựng caacutec tri thức cụ thể miền thu được từ caacutec chuyecircn gia miền
Coacute thể chứa caacutec mocirc tả caacutec hagravenh vi giải quyết vấn đề caacutec ragraveng buộc caacutec heuristics
Thagravenh cocircng của một ES dựa trecircn tiacutenh đầy đủ vagrave tiacutenh chiacutenh xaacutec của cơ sở tri thức
Mocirc tơ suy diễn (Inference Engine)
Ở đacircy tri thức được đặt để sử dụng tạo ra caacutec giải phaacutep để giải quyết vấn đề
Mocirc tơ nagravey coacute khả năng thực hiện diễn dịch hoặc suy diễn dựa trecircn caacutec luật hay caacutec caacutec sự kiện
Đồng thời cũng coacute khả năng sử dụng caacutec suy diễn mờ hay khocircng chiacutenh xaacutec dựa trecircn xaacutec suất hay aacutenh xạ mẫu
Vograveng điều khiển suy diễn
1 Aacutenh xạ caacutec luật với caacutec sự kiện đatilde được cho
2 Chọn luật để thực hiện
3 Thực hiện luật bằng caacutech thecircm caacutec sự kiện được suy diễn ra vagraveo bộ nhớ lagravem việc
Chuỗi suy diễn (Chaining)
Suy diễn tiến (forward chaining) maacutey suy diễn bắt đầu từ dữ liệu ban đầu vagrave thực hiện việc suy luận để đưa ra caacutec kết luận cuối cugraveng
Suy diễn lugravei (backward chaining) maacutey suy diễn bắt đầu từ dữ liệu điacutech vagrave tigravem ra tri thức hỗ trợ cho dữ liệu điacutech đoacute
Viacute dụ suy diễn lugravei
R1 Nếu coacute A vagrave B thigrave suy ra coacute D
R2 Nếu coacute B thigrave suy ra coacute C
R3 Nếu coacute C vagrave D thigrave suy ra coacute E
Ta coacute E ta xem trong 3 luật R1 R2 R3 luật nagraveo coacute E ta thấy R3 chứa E đồng thời chứa C vagrave D Xeacutet tiếp trong 2 luật R1 R2 luật nagraveo chứa C vagrave D R2 chứa C R3 chứa D Từ đoacute ta coacute được caacutec tri thức hỗ trợ suy diễn vagrave kết luận lagrave nếu coacute A vagrave B thigrave sẽ coacute E Hay nếu A vagrave B đuacuteng thigrave sẽ coacute E
Viacute dụ suy diễn tiến
Giả sử coacute tập chứa 3 luật sau
R1 Nếu coacute A vagrave B thigrave suy ra coacute D
R2 Nếu coacute B thigrave suy ra coacute C
R3 Nếu coacute C vagrave D thigrave suy ra coacute E
Nếu ta coacute A vagrave B thigrave chuacuteng ta suy ra được D từ R1 vagrave suy ra C từ R2 Với D vagrave C đatilde được suy ra ở trecircn giờ chuacuteng ta suy ra được E từ R3
Viacute dụ thực tế
Giả sử muốn biết magraveu của một con vật nuocirci tecircn lagrave Fred biết rằng noacute kecircu ộp ộp vagrave ăn ruồi
Coacute tập 4 luật ban đầu như sau
R1 Nếu X kecircu ộp ộp vagrave ăn ruồi thigrave X lagrave con ếch
R2 Nếu X kecircu chiecircm chiếp vagrave biết hoacutet thigrave X lagrave con chim
R3 Nếu X lagrave con ếch thigrave X coacute magraveu xanh
R4 Nếu X lagrave con chim thigrave X coacute magraveu vagraveng
74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia
Expert system shells lagrave một tập caacutec goacutei phần mềm vagrave caacutec cocircng cụ dugraveng để phaacutet triển caacutec hệ chuyecircn gia
Những Expert system shells đầu tiecircn thường rất rườm ragrave Mặc dugrave vậy noacute vẫn giuacutep cho người sử dụng sẽ khocircng phải bắt đầu lại từ đầu khi xacircy dựng một hệ chuyecircn gia mới
Những shell hiện đại bao gồm hai mocirc-đun chiacutenh lagrave cocircng cụ xacircy dựng một tập quy tắc vagrave mocirc tơ suy diễn
Xacircy dựng hệ chuyecircn gia
Bước 1 xacircy dựng mocirc higravenh bagravei toaacuten xaacutec định vấn đề nhiệm vụ magrave hệ thống sẽ thực hiện Caacutec dạng bagravei toaacuten cần hệ chuyecircn gia
Bagravei toaacuten diễn giải (InterPretation)
Bagravei toaacuten dự baacuteo (Prediction)
Bagravei toaacuten chuẩn đoaacuten (Diagnose)
Bagravei toaacuten gỡ rối (Debugging)
Bagravei toaacuten thiết kế
Tương tự như một dự aacuten phần mềm để xacircy dựng một hệ chuyecircn gia cần phải coacute caacutec yếu tố về nhacircn lực tagravei nguyecircn vagrave thời gian Những yếu tố nagravey ảnh hưởng đến giaacute thah của một hệ chuyecircn giaTrong phần nagravey cacircu hỏi thường được đặt ra lagrave tại sao cần phải xacircy dựng một hệ chuyecircn giaTrước khi bắt đầu phải xaacute định rotilde bagravei toaacuten đạt ra lagrave jiAi lagrave chuyecircn giaAi lagrave người sử dụng
1 Diễn giải (InterPretation) Nghiecircn cứu 1 vấn đề -gt Dựa trecircn những biểu hiện thuộc tiacutenh đặc trưng becircn ngoagravei -gt Tư vấn
(hoặc đưa ra kết luận hay mocirc tả dễ hiểu từ tập dữ liệu thocirc)
2 Bagravei toaacuten dự baacuteo (Prediction) Coacute thể dự đoaacuten được hagravenh vi kết quả dựa trecircn caacutec hiện tượng -gt dự baacuteo
VD Dự baacuteo thời tiết động đấthellip
3 Bagravei toaacuten chẩn đoaacuten (Diagnoss) Xaacutec định caacutec lỗi caacutec bộ phận hỏng hoacutec của hệ thống dựa trecircn caacutec dữ liệu quan saacutet được
4 Bagravei toaacuten gỡ rối (Debugging) Mocirc tả caacutec phương phaacutep khắc phục hệ thống khi gặp sự cố
5 Bagravei toaacuten thiết kế Lựa chọn cấu higravenh caacutec đối tượng nhằm thoả matilden một số ragraveng buộc nagraveo đoacute
6 Giảng dạy Phần mềm dạy học coacute thể chuẩn đoaacuten vagrave sủa lỗi của học sinh trong quaacute trigravenh học tập
Để xaacutec định đuacuteng bagravei toaacuten magrave chuacuteng ta cần giải quyết thigrave phải trả lời đc một số cacircu hỏi
- cần hệ chuyecircn gia
Bước 2 thu thập tri thức lựa chọn cocircng cụ vagrave aacutep dụng
Trong bước thu thập tri thức vấn đề quan trọng lagrave lựa chọn chuyecircn gia những người magrave sẽ đoacuteng goacutep tri thức cho hệ thống Thocircng thường trong suốt quaacute trigravenh phaacutet triển thigrave chuyecircn gia được xem như một thagravenh viecircn của đội phaacutet triển
Hiện nay coacute rất nhiều cocircng cụ để xacircy dựng một hệ chuyecircn gia Phổ biến nhất lagrave JESS CLIPS vagrave OPS5
Bước 3 Thiết kế cơ sở tri thức thiết kế hệ thốngTri thức được biểu diễn trường minh trong cơ sở tri thức
Caacutec chuyecircn gia vagrave kỹ sư tri thức sẽ đối thoại với nhau bằng caacutec kỹ thuật đối thoại Suy diễn (SD) bảng Mocirc higravenh hoacutea SD quy nạp phacircn loại
Vấn đề bagraveo trigrave vagrave phaacutet triển
Caacutec hệ chuyecircn gia đogravei hỏi phải bảo trigrave vagrave phaacutet triển nhiều hơn so với caacutec hệ thống khaacutec Phải thường xuyecircn bổ sung tri thức mới vagrave thay đổi caacutec tri thức cũ để đổi mới hệ chuyecircn gia
Thu thập vagrave khắc phục lỗi do người sử dụng phaacutet hiện để kịp thời khắc phục những sai soacutet của hệ chuyecircn gia
75 Lợi iacutech vagrave hạn chế của caacutec hệ chuyecircn gia
Một số lợi iacutech chiacutenh
Thời gian trả lời hợp lyacute bằng hoặc nhanh hơn so với chuyecircn gia (người) để đi đến cugraveng một quyết định Hệ chuyecircn gia lagrave một hệ thống thời gian thực (real time system)
Khả năng trả lời với mức độ tinh thocircng bằng hoặc cao hơn so với chuyecircn gia (người) trong cugraveng lĩnh vực
Hệ chuyecircn gia giuacutep cho hiệu quả lagravem việc tăng bằng việc sử dụng tập caacutec luật một caacutech nhanh choacuteng magrave ko bị nhầm lẫn chuyecircn gia lagrave người coacute thể quecircn đi một số tri thức cơ sở lyacute luậ nhưng HCG thigrave ko
Quyết định của một người chuyecircn gia coacute thể bị thay đổi vagrave ko coacute tiacutenh thống nhất như quyết định của một hệ chuyecircn gia tạo ra
Hệ chuyecircn gia giuacutep cho người sử dụng coacute thể trau dồi sự hiểu biết trecircn lĩnh vuej cụ thể magrave noacute giải quyết hỗ trợ người ra quyết định coacute trigravenh độ như 1 chuyecircn gia trong quaacute trigravenh gia quyết định
Kiến thức của rất nhiều chuyecircn gia về một lĩnh vực nagraveo đoacute được đưa vagraveo hệ chuyecircn gia lagravem cho CSTT cuat HCG phong phuacute vagrave rộng lớn hơn rất nhiều
HCG giải thiacutech caacutec bước suy luận một caacutech dễ hiểu nhất quaacuten luacutec nagraveo cũng coacute thể sử dụng ko như chuyecircn gia con người
Hạn chế của caacutec hệ chuyecircn gia
Nhược điểm lớn nhất của hệ chuyecircn gia lagrave những yacute kiến chuyecircn mocircn thường rất khoacute matilde hoacutea vagrave giải neacuten
Hệ chuyecircn gia khocircng coacute khả năng tự học tự cập nhật kiến thức mới như caacutec chuyecircn gia magrave cần phải được matilde hoacutea lại khi noacute được cập nhật
Hệ chuyecircn gia khocircng thể nhận ra được vấn đề khocircng nằm trong miền kiến thức của hệ thống
Chương 8 Tri thức vagrave tiếp nhận
1 Bao gồm caacutec vấn đề
Dữ liệu thực tế đo lường hoặc quan saacutet coacute hoặc khocircng coacute bối cảnh
Thocircng tin dữ liệu được tổng hợp một caacutech hữu iacutech để giải quyết những khoacute khăn trong việc đưa ra quyết định
Tri thức bao gồm caacutec ứng dụng quy tắc thocircng tin hướng dẫn của người ra quyết định
2 Những caacutei nhigraven về tri thức
Đại diện lagravem thế nagraveo để diễn tả tri thức viacute dụ như một quyển saacutech khocircng phải lagrave tri thức nhưng noacute lại lagrave một đại diện của tri thức
Sản xuất tri thức lagrave một tập hơp của hagraveng tồn kho coacute thể được sản xuất cũng như mua lại
Tri thức lagrave 1 trong 6 trạng thaacutei của hệ thống
1Dữ liệu 2Thocircng tin 3Cấu truacutec thocircng tin 4Sự thấu hiểu 5Yacute kiến 6 Quyết định
3 Caacutec loại tri thức Phổ biến mocirc tả dữ liệu thocircng tin thủ tục mọi thứ lagravem như thế nagraveo lập luận chiacutenh saacutech hoặc caacutec quy tắc
4 Thu thập Tri thức hệ chuyecircn gia Hầu hết caacutec phương phaacutep đều bắt đầu với mocirc higravenh của caacutec taacutec vụ trong đoacute
hệ chuyecircn gia được xacircy dựng Trong đoacute mocirc tả về caacutec lĩnh vực được tạo ra Caacutec kỹ sư sử dụng caacutec mocirc higravenh giả thuyết vagrave nhận thức về quaacute trigravenh phacircn
tiacutech để gợi ra caacutech giải quyết vấn đề về tri thức từ caacutec chuyecircn gia
5 Caacutec chiều của thu thập tri thức KE- driven caacutec kỹ sư trao đổi trực tiếp với caacutec chuyecircn gia Expert-driven Caacutec chuyecircn gia trực tiếp đưa chuyecircn mocircn của họ vagraveo hệ
thống maacutey tiacutenh Machine-driven Sử dụng caacutec cocircng cụ suy luận để triacutech xuất tri thức từ một
tập caacutec viacute dụ
6 Kỹ thuật thu thập tri thức Trao đổi gồm 2 loại cơ bản lagrave coacute cấu truacutec(coacute kịch bản) vagrave khocircng coacute cấu
truacutec( đối thoại trực tiếp) Giao thức phacircn tiacutech bằng lời Khi caacutec chuyecircn gia thực hiện một cocircng việc
của họ thigrave một bản ghi về cocircng việc đoacute được thực hiện Caacutec kỹ sư sẽ xacircy dựng mocirc higravenh cho những gigrave được ghi lại trong bản ghi
Phương phaacutep sagraveng lọc caacutec chuyecircn gia so saacutenh caacutec nhoacutem liecircn tiếp trong ba đối tượng vagrave cho biết tại sao nhoacutem thứ hai lại khaacutec nhoacutem thứ ba
7 Thu thập tri thức từ nhiều nguồn Thu thập tri thức từ nhiều nguồn lagrave cần thiết để coacute được đầy đủ caacutec tri thức
cho một vấn đề quan điểm yacute kiến traacutei ngược nhau thường phaacutet sinh Phương phaacutep đồng thuận sẽ giuacutep giải quyết được vấn đề macircu thuẫn Kỹ thuật phacircn tiacutech Meta lagrave kỹ thuật được aacutep dụng trong caacutec trường hợp
khaacutec Caacutech tiếp cận bằng định lượng đogravei hỏi caacutec kỹ sư cần cacircn nhắc yếu tố đầu vagraveo của caacutec chuyecircn gia khaacutec nhau
8 Xaacutec nhận hợp lệ vagrave kiểm tra tri thức Một khi thu thập tri thức noacute phải được đaacutenh giaacute về khả năng sử dụng vagrave độ
chiacutenh xaacutec Hai vấn đề cụ thể lagrave hiệu lực của những kiến thức vagrave kiểm tra việc xacircy dựng cơ sở của tri thức
Cần xaacutec nhận xem liệu hệ thống coacute thể hoạt động ở mức độ tối thiểu khocircng
Xaacutec minh liecircn quan đến việc so saacutenh từng chi tiết kỹ thuật của hệ thống những gigrave đatilde được thực hiện cuối cugraveng
9 Một số caacutec biện phaacutep xaacutec nhận Độ chiacutenh xaacutec Khả năng thiacutech nghi Mức độ đầy đủ Bề rộng Độ sacircu Hiệu lực Tổng quan Chiacutenh xaacutec Hiện thực Độ tin cậy Tiacutenh hữu dụng Mức độ
Chương 9 Học maacutey
1 Logic mờ vagrave ngocircn ngữ mờ(Fuzzy Logic and Linguistic Ambiguity)
Ngocircn ngữ tự nhiecircn gồm những khaacutei niệm mơ hồ vagrave khocircng chiacutenh xaacutectruyền tải ngữ nghĩa thocircng qua tiacutenh xấp xỉkhocircng rotilde ragraveng
Những xấp xỉ nagravey giuacutep con người coacute thể truyền tải hết được yacute nghĩa nhưng maacutey thigrave khocircng hiểu
Lagravem sao biểu diễn caacutec tri thức sử dụng caacutec khaacutei niệm khocircng rotilde ragraveng(mờ) hoặc khocircng chiacutenh xaacutec
2 Khaacutei niệm cơ bản của logic mờ tập mờ lagrave những tập hợp khocircng coacute một giới hạn rotilde Mỗi phần tử của noacute chỉ
chứa một mức độ hagravem liecircn thuộc của từng phần tử Vigrave vậy tập mờ khocircng giống như tập cổ điển Tập mờ coacute thể kết hợp với nhau qua những luật mờ magrave đặc trưng cho những hagravenh động trạng thaacutei vagrave thuộc tiacutenh của logic mờ được tận dụng khi thực hiện một bộ điều khiển mờ
Logic mờ dựa trecircn yacute tưởng mỗi phần tử thuộc vagraveo một tập hợp ở một mức độ nagraveo đấy
Locircgic mờ cho pheacutep độ liecircn thuộc (microA )coacute giaacute trị trong khoảng (01) Locircgic mờ coacute thể được coi lagrave mặt ứng dụng của lyacute thuyết tập mờ để xử lyacute caacutec
giaacute trị trong thế giới thực cho caacutec bagravei toaacuten phức tạp
3 So saacutenh tiacutenh đuacuteng đắn logic mờ vagrave xaacutec suất Xaacutec suất thigrave đề cập đến khả năng xảy ra một biến cố hay một điều gigrave đoacute Logic mờ đề cập đến cấp độ magrave đặc tiacutenh ở hiện tại
o viacute dụ1 người coacute chiều cao 6 feet thigrave coacute cấp độ lagrave 05 về chiều cao
4 Ưu điểm của logic mờ Caacutech tiếp cận rất tự nhiecircnkhocircng phức tạp Coacute thể mocirc higravenh hoacutea caacutec hagravem phi tuyến tugravey yacute phức tạp
Coacute thể tận dụng được kinh nghiệm từ những chuyecircn gia hagraveng đầu trong mọi lĩnh vực
Logic mờ được xacircy dựng dựa trecircn ngocircn ngữ tự nhiecircnNền tảng của logic mờ lagrave dựa trecircn cơ sở giao tiếp của con người
5 Nhược điểm của logic mờ Trong 1 hệ thống phức tạpsử dụng logic mờ coacute thể trở thagravenh trở ngại cho
việc xaacutec thực độ tin cậy của hệ thống Cơ chế lập luận mờ khocircng thể học hỏi từ những lỗi sai
6 Mạng noron nhacircn tạo(ANN) Mạng noron nhacircn tạo lagrave một mocirc phỏng xử lyacute thocircng tinđược nghiecircn cứu ra
từ hệ thống thần kinh của sinh vậtgiống như bộ natildeo để xử lyacute thocircng tin ANNs lagrave chương trigravenh dựa trecircn maacutey tiacutenh đơn giản coacute chức năng lagrave một mocirc
higravenh bagravei toaacuten khocircng gian dựa trecircn thử nghiệm vagrave baacuteo lỗi
7 Học từ kinh nghiệm Tiến trigravenh Một mẫu dữ liệu được biểu diễn như một mạng lưới noronANN ldquodự
đoaacutenrdquo 1 đầu radự đoaacuten được so saacutenh với giaacute trị thực tế hoặc giaacute trị chiacutenh xaacutecNếu đoaacuten được chiacutenh xaacutec thigrave khocircng coacute hagravenh động nagraveo được thực hiện
Nếu dự đoaacuten sai ANN kiểm tra lại vagrave xaacutec định lại thocircng số để điều chỉnh Một mẫu dữ liệu khaacutec được biểu diễn vagrave quaacute trigravenh nagravey được lặp lại
8 Nguyecircn tắc cơ bản của cocircng nghệ nơron Caacutec yếu tố xử lyacute cơ bản trong hệ thống thần kinh của con người lagrave tế bagraveo
thần kinhMạng lưới của tế bagraveo nagravey lagrave liecircn kết với nhau nhận được thocircng tin từ caacutec cảm biến trong mắt taihellip
Thocircng tin nhận được bởi tế bagraveo thần kinh hoặc lagrave sẽ kiacutech thiacutech noacute(sẽ được chuyển qua 1 thocircng điệp dọc theo mạng lưới) hoặc lagrave sẽ ngăn cản noacute(ngăn cản dograveng thocircng tin)
Độ nhạy coacute thể thay đổi qua thời gian hoặc sau khi coacute được kinh nghiệm
9 Cấu truacutec mạng Một ANN gồm 3 lớp cơ bản
Lớp đầu vagraveo nhận dữ liệu Lớp becircn trong hoặc lagrave lớp ẩn xử lyacute dữ liệu Lớp đầu ra chuyển tiếp kết quả cuối cugraveng của mạng
10Mạng nơ ron Thường coacute nhiều đầu vagraveo mỗi đầu vagraveo với mức ảnh hưởng vagrave tầm quan
trọng riecircng của noacute Một đầu vagraveo quan trọng coacute thể được sử dụng để khuếch đại đầu ra caacutec hagravem trạng thaacutei tổng hợp caacutec trọng số của caacutec yếu tố
đầuvagraveo khaacutec nhauvagraveo một giaacute trị duy nhất Caacutec hagravem chuyển giao xử lyacute caacutec giaacute trị trạng thaacutei vagrave tạo đầu ra
11Huấn luyện mạng nơ ron Trong mocirc higravenh coacute giaacutem saacutetANN được đến so saacutenh dự đoaacuten của chiacutenh
noacute với thocircng tin phản hồi coacute chứa caacutec kết quả mong muốn ANN sẽ phải tigravem caacutech thay đổi caacutec tham số becircn trong củamigravenh (caacutec trọng số vagrave caacutec ngưỡng) để tạo necircn một aacutenh xạ coacute khả năng aacutenh xạcaacutec đầu vagraveo thagravenh caacutec đầu ra mong muốn Sự thay đổi nagravey được tiến hagravenh nhờ việc so saacutenh giữa đầu ra thực sự vagrave đầu ra mong muốn
Trong mocirc higravenh khocircng coacute giaacutem saacutetANN nhận được dữ liệu vagraveo nhưng khocircng phải coacute bất kỳ thocircng tin phản hồi về kết quả mong muốn
Phần lớn caacutec ứng dụng nằm trong vugraveng của caacutec bagravei toaacuten ước lượng như mocirc higravenh hoacuteathống kecirc neacuten lọc phacircn cụm
12Lợi iacutech Liecircn kết với mạng noron Traacutenh caacutech lập trigravenh tường minh Giảm nhu cầu của chuyecircn gia ANNs thigrave thiacutech nghi với caacutec yếu tố đầu vagraveo thay đổi Khocircng cần thiết cho cơ sở tri thức tinh chế ANNs coacute tiacutenh động vagrave cải thiện với việc sử dụng Coacute khả năng xử lyacute dữ liệu khocircng chiacutenh xaacutec hoặc khocircng đầy đủ Cho pheacutep tổng quaacutet hoacutea từ thocircng tin cụ thể Cho pheacutep thu thập cảm giaacutec thocircng thường vagraveo miền giải quyết vấn đề
13Hạn chế của việc liecircn kết với mạng noron ANNs khocircng thể giải thiacutech được suy luận Bản chất hộp đen thường khiến cho vấn đề traacutech nhiệm vagrave độ tin cậy phaacutet
sinh lagrave khoacute khăn Lặp đi lặp lại quaacute trigravenh huấn luyện rất tốn thời gian Nguồn lực caacutec nhagrave phacircn tiacutech vagrave thiết kế coacute tay nghề cao vẫn lagrave đaacuteng lo
ngại Cocircng nghệ ANN thuacutec đẩy hạn chế của phần cứng hiện tại ANN yecircu cầu phải coacute sự tin tưởng ở đầu ra
14Giới thiệu về thuật toaacuten di truyền Cũng như mạng lưới thần kinh caacutec thuật toaacuten di truyền được dựa trecircn lyacute
thuyết sinh học Thuật toaacuten di truyền tigravem thấy nguồn gốc của chuacuteng trong caacutec lyacute thuyết
tiến hoacutea của chọn lọc tự nhiecircn vagrave thiacutech ứng với biến đổi khiacute hậu Kết quả thuật toaacuten di truyền lagrave từ giao phối 2 caacute thể trong quần thế để tạo
ra con caacutei đocirci khi tốt hơn so với bậc cha mẹ của chuacuteng 15Caacutec thagravenh phần cơ bản của thuật toaacuten di truyền
Toaacuten tử chọn lọc Caacutec caacute thể tốt được chọn lọc để đưa vagraveo thế hệ sau Sự chọn lọc nagravey căn cứ vagraveo độ thiacutech nghi với mocirci trường của mỗi caacute thể
Toaacuten tử lai gheacutep (crossover) Hai caacute thể cha vagrave mẹ trao đổi caacutec gen với nhau để tạo ra caacute thể con
Toaacuten tử đột biến (mutation) Một caacute thể thay đổi một số gen để biến đổi thagravenh một caacute thể mớiTất cả caacutec toaacuten tử trecircn khi thực hiện đều mang tiacutenh ngẫu nhiecircn
16Quaacute trigravenh cơ bản của một thuật toaacuten di truyền Khởi tạo
Đaacutenh giaacute quần thể
Lựa chọn NST thiacutech hợp nhất vagrave loại bỏ NST yếu nhất
Quy trigravenh giao nhau vagrave cải thiện quần thể
đột biến tiến trigravenh để khaacutem phaacute ra NST mới
17Ưu nhược điểm của việc kết hợp với thuật toaacuten di truyền Kiacutech thước quần thể lagrave 1 yếu tố quan trọng trong tốc độ của việc tigravem
kiếmnhưng noacute tương đối dễ dagraveng để dự đoaacuten tốc độ nagravey Giao nhau hoặc đột biến lagrave khocircng necircn đc sử dụng quaacute thường xuyecircn Luocircn coacute được iacutet nhất 1 giải phaacutep hợp lyacute Necircn coacute thể aacutep dụng chuacuteng cho caacutec vấn đề magrave chuacuteng ta khocircng coacute hướng
về caacutech giải quyết Sức mạnh của thuật toaacuten xuất phaacutet từ khaacutei niệm đơn giảnkhocircng phải từ
một thủ tục thuật toaacuten phức tạp 18Tương lai của học maacutey
Mạng lưới thần kinh nhacircn tạo vượt quaacute năng lực của con người trong caacutec trường hợp bị cocirc lập
Về mặt lyacute thuyếtmột maacutey tiacutenh coacute thể xử lyacute dũ liệu nhanh hơn hagraveng triệu lần so với 1 con người
May mắn thay cho chuacuteng tacon người tốt hơn nhiều khi magrave coacute được dữ liệumaacutey tiacutenh khocircng coacute 1 số thứ như lagrave 5 giaacutec quan
CHƯƠNG 10 KHO DỮ LIỆU
1 Kho dữ liệu Kho dữ liệu lagrave tuyển tập caacutec cơ sở dữ liệu tiacutech hợp hướng chủ đề được
thiết kế để trợ giuacutep cho một hệ hỗ trợ quyết định
Theo John Ladley Cocircng nghệ kho dữ liệu lagrave tập caacutec phương phaacutep kỹ thuật vagrave caacutec cocircng cụ coacute thể kết hợp hỗ trợ nhau để cung cấp thocircng tin cho người sử dụng trecircn cơ sở tiacutech hợp từ nhiều nguồn dữ liệu nhiều mocirci trường khaacutec nhau
Kho dữ liệu thường rất lớn tới hagraveng trăm GB hay thậm chiacute hagraveng Terabyte
2 Kho dữ liệu vận hagravenh (ODS) Một kho dữ liệu vận hagravenh Aacutep dụng kỹ thuật kho dữ liệu vagraveo caacutec hệ xử
lyacute giao taacutec lưu trữ dữ liệu cho một ứng dụng đặc thugrave Noacute đưa vagraveo kho dữ liệu một dograveng caacutec dữ liệu thocirc được thiết kế
3 So saacutenh
Kho dữ liệu vận hagravenh Kho dữ liệu
Dữ liệu theo chủ đề Dữ liệu theo chủ đề
Dữ liệu tiacutech hợp Dữ liệu tiacutech hợp
Dữ liệu thay đổi Dữ liệu khocircng thay đổi
Dữ liệu được cập nhật khi thay đổi
Dữ liệu giữ nguyecircn
Chỉ coacute dữ liệu hiện tạiDữliệu hiện tại vagrave dữ liệu lịch sử
Chu kỳ lagravem tươi dữ liệu ngắn Chu kỳ lagravem tươi dữ liệu dagravei
Chỉ coacute dữ liệu chi tiết Dữ liệu chi tiết vagrave dữ liệu tổng kết
Dugraveng cho caacutec quyết định ngắn hạn
Dugraveng cho hoạch định dagravei hạn
4 Kho dữ liệu cục bộ (Data Mart - DM)
Kho dữ liệu cục bộ lagrave CSDL coacute những đặc điểm giống với kho dữ liệu nhưng với quy mocirc nhỏ hơn vagrave lưu trữ dữ liệu về một lĩnh vực một chuyecircn ngagravenh
Data mart phụ thuộc Chứa những dữ liệu được lấy từ DW vagrave những dữ liệu nagravey sẽ được triacutech lọc vagrave tinh chế tiacutech hợp lại ở mức cao hơn để phục vụ một chủ đề nhất định của Datamart
Data mart độc lập Khocircng giống như Datamart phụ thuộc Data mart độc lập được xacircy dựng trước DW vagrave dữ liệu được trực tiếp lấy từ caacutec nguồn khaacutec nhau
5 Siecircu dữ liệu Metadata lagrave dữ liệu để mocirc tả dữ liệu Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột
một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi Metadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu
6 Mocirci trường kho dữ liệu Hệ thống của tổ chức vagrave kho cung cấp dữ liệu để xacircy dựng kho dữ liệu Trong quaacute trigravenh chuyển dữ liệu từ caacutec nguồn khaacutec nhau dữ liệu coacute thể
được lagravem sạch hoặc chuyển đổi vagrave vigrave thế DW được xem như lagrave một chuẩn cho việc lưu trữ
Đồng thời siecircu dữ liệu được ghi lại Cuối cugraveng DW hoặc siecircu thị coacute thể được sử dụng để tạo ra một kho dữ
liệu ldquocaacute nhacircnrdquo 7 Caacutec đặc điểm của kho dữ liệu
Đặc điểm Mocirc tả
Hướng chủ đề - DL tổ chức theo caacutech thức người dugraveng tham chiếu
Tiacutech hợp - Dữ liệu ldquosạchrdquo loại bỏ tiacutenh thiếu nhất quaacuten
Khocircng thay đổi - DL ldquochỉ đọcrdquo người dugraveng khocircng thay đổi được
Chuỗi thời gian - DL lagrave chuỗi thời gian khocircng phải lagrave trạng thaacutei hiện tại
Được tổng kết - DL vận hagravenhthao taacutec khi cần thiết
được kết hợp lại thagravenh dạng coacute thể dugraveng được cho quyết định
Kiacutech cỡ lớn hơn - Lưu giữ theo chuỗi thời gian tức lagrave giữ lại nhiều DL
Khocircng được chuẩn hoacutea - Coacute thể dư thừa DLSiecircu dữ liệu - Dữ liệu của dữ liệu được lưu trữNguồn dữ liệu - DL vận hagravenh (caacutec hệ sẵn coacute) cugraveng
với caacutec nguồn ngoagravei 8 Kho dữ liệu hướng chủ đề
Hướng chủ để coacute nghĩa lagrave kho dữ liệu được tổ chức xung quanh caacutec chủ đề chiacutenh như khaacutech hagraveng sản phẩm sản xuất Tập trung vagraveo việc mocirc higravenh hoacutea vagrave phacircn tiacutech dữ liệu cho caacutec nhagrave ra quyết định magrave khocircng tập trung vagraveo caacutec xử lyacute thocircng thường Cung cấp cho người dugraveng một khung nhigraven toagraven vẹn đơn giản vagrave đầy đủ về caacutec sự kiện quanh caacutec chủ đề
9 Dữ liệu trong DW được tiacutech hợp Dữ liệu trong kho dữ liệu được xacircy dựng bằng caacutech tổng hợp dữ liệu từ
nhiều nguồn khaacutec nhau vagrave caacutec nguồn coacute tổ chức khaacutec nhau Cơ sở dữ liệu caacutec file excel caacutec flat file hoặc caacutec raw file Khi đưa vagraveo kho dữ liệu caacutec dữ liệu được lagravem sạch vagrave tiacutech hợp dữ liệu nhằm đảm bảo tiacutenh nhất quaacuten của dữ liệu
10Kiến truacutec kho dữ liệu Tầng cơ sở dữ liệu hoạt động Tầng truy xuất thocircng tin Tầng truy xuất dữ liệu Tầng siecircu dữ liệu Tầng quản lyacute tiến trigravenh Tầng thocircng điệp của ứng dụng Tầng vật liacute của kho dữ liệu Tầng trigravenh diễn dữ liệu
11Higravenh trạng kho dữ liệu Kho dữ liệu ảo - người dugraveng cuối coacute thể truy cập trực tiếp đến kho dữ liệu
sử dụng caacutec cocircng cụ cho pheacutep ở tầng truy xuất dữ liệu Kho dữ liệu trung tacircm-1 cơ sở dữ liệu vật lyacute chứa tất cả dữ liệu cho một
vugraveng chuyecircn dụng nagraveo đoacute
Kho dữ liệu phacircn taacuten- Thagravenh phần được phacircn taacuten qua nhiều hệ cơ sở dữ liệu vật lyacute
12METADATA- Siecircu dữ liệu Định nghĩa Siecircu dữ liệu lagrave dữ liệu về dữ liệu Lagrave 1 lưu trữ dugraveng để
Miecircu tả kho dữ liệu tổng thể Nhận dạng kiểu kho dữ liệu Quản liacute quaacute trigravenh tiacutech hợp dữ liệu Quản liacute quaacute trigravenh cập nhật kho dữ liệu Quản liacute bảo mật
Lagrave chigravea khoacutea quyết định sự thagravenh cocircng của kho dữ liệu luocircn được thay đổi vagrave cập nhật theo sự phaacutet triển của kho dữ liệu
Dugraveng để quản liacute điều khiển kho dữ liệu Sự ra đời của kho dữ liệu như 1 cấu truacutec hỗ trợ ra quyết định siecircu dữ liệu
được xem như nguồn tagravei nguyecircn dữ liệu Siecircu dữ liệu lagrave trừu tượng Chuacuteng lagrave dữ liệu bậc cao cung cấp mocirc tả ngắn
gọn caacutec dữ liệu bậc thấp hơn 13Hoạt động của Siecircu dữ liệu
Siecircu dữ liệu rất cần thiết trong việc chuyển hoacutea thocircng tin trở thagravenh tri thức Lagrave chigravea khoacutea giuacutep chuacuteng ta xử lyacute được dữ liệu thocirc Viacute dụ một dograveng dữ liệu baacuten hagraveng 1023 K596 11121 agraveNoacute sẽ khocircng coacute nghĩa gigrave cho đến khi chuacuteng ta đưa vagraveo siecircu dữ liệu (thư
mục chứa dữ liệu) agrave cửa hagraveng 1023 sản phẩm K596 vagrave số tiền baacuten được lagrave 11121 đocirc la
14Sự cần thiết phải nhất quaacuten trong kho dữ liệu Kho dữ liệu được xacircy dựng cho lợi iacutech của những nhagrave phacircn tiacutech kinh
doanh caacutec nhagrave quản trị cho tất cả caacutec khu vực chức năng Trong cơ sở dữ liệu riecircng caacutec khu vực khaacutec nhau coacute thể định nghĩa vagrave lưu
trữ dữ liệu thocircng qua phiecircn bản của chiacutenh noacute Khi dữ liệu được lấy từ những vugraveng khaacutec nhau đoacute vagrave được đặt vagraveo kho dữ
liệu Việc chuyển đổi vagrave lagravem sạch caacutec tiến trigravenh sẽ đảm bảo noacute lagrave duy nhất được tiacutech hợp tại một mức của tổ chức
15Ragrave soaacutet lại dữ liệu ndash Thực thi siecircu dữ liệu
Bất kể cấu truacutec tự nhiecircn của 1 cacircu truy vấn thế nagraveo thigrave caacutec thagravenh phần của siecircu dữ liệu rất quan trọng đối với người ra quyết định
Bảng thuộc tiacutenh khoacutea được lưu trữ bởi kho dữ liệu Tập hợp dữ liệu được lấy từ đacircu Những chuyển đổi nagraveo được thực thi với việc lagravem sạch
16Siecircu dữ liệu lagrave gigrave Metadata - lagrave thocircng tin mocirc tả nội dung của cơ sở dữ liệu (CSDL) Metadata baacuteo cho người dugraveng biết thời gian cập nhật sau cugraveng của dữ liệu
định dạng vagrave mục điacutech sử dụng của noacute Những thocircng tin nagravey coacute thể hướng dẫn người dugraveng duyệt qua CSDL vagrave
giuacutep họ hiểu được yacute nghĩa vagrave ngữ cảnh của dữ liệu Trong CSDL metadata lagrave caacutec dạng biểu diễn khaacutec nhau của caacutec đối tượng
trong CSDL Trong CSDL quan hệ metadata lagrave caacutec định nghĩa của bảng cột CSDL
view vagrave nhiều đối tượng khaacutec Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột
một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi -gtMetadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu
Bảng chuyển đổi Ghi lại những chuyển đổi đatilde được thực hiện
Lịch sử thực thi Ghi lại những dữ liệu đatilde được
phacircn tiacutech
Higravenh thaacutei kết nốiGhi lại những dữ liệu được kết nối vagrave tần suất
17Aacutenh xạ thocircng thường của siecircu dữ liệu Bản ghi aacutenh xạ chuyển đổi bao gồm
Định danh của nguồn gốc Chuyển đổi thuộc tiacutenh Chuyển đổi thuộc tiacutenh vật lyacute Matilde hoacutea tham chiếu bảng chuyển đổi Đổi tecircn Đổi khoacutea Gaacuten giaacute trị cho thuộc tiacutenh mặc định Chọn logic cho caacutec nguồn nhiều giaacute trị Đổi thuật toaacuten
18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để
phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai
lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave
tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec
Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm
Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo
19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua
caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau
SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được
Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra
một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức
Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ
Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ
Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech
CHƯƠNG 11 KHAI PHAacute DỮ LIỆU
1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn
ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993
Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng
2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd
1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều
2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP
3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn
4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng
5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server
6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo
7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động
8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời
9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều
10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện
11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech
12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP
3 Xử lyacute phacircn tiacutech trực tuyến OLAP
MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave
dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu
ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave
thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu
HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave
ROLAP4 Khai phaacute dữ liệu
Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh
khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn
Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan
5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp
6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại
Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp
Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec
Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt
Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra
Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh
vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho
Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec
Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm
Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục
Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng
gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp
Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn
Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec
Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper
Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2
Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25
Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước
Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng
Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện
trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp
Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute
độ hỗ trợ ge ngưỡng minsup
độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan
Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn
Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết
Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu
MOLAP ROLAP HOLAP
Lưu trữ dữ liệu cơ sở
Khối Bảng quan hệ Bảng quan hệ
Lưu trữ thocircng tin tổng hợp
Khối Bảng quan hệ Khối
Hiệu suất thực hiện truy vấn
Nhanh nhất Chậm nhất Nhanh
Tiecircu thụ khocircng gian lưu trữ
Nhiều Thấp Trung bigravenh
Chi phiacute bảo trigrave Cao Thấp Trung bigravenh
Quyết định sản phẩm nagraveo được sản xuất Quyết định đầu tư vagraveo đacircu Quyền đặt vagrave quản lyacute quản lyacute giaacute Thanh toaacuten vagrave khấu trừ tiền latildei
bChiacutenh trị Yếu tố cốt lotildei trong quaacute trigravenh higravenh thagravenh chiến lược ra quyết định Chiacutenh trị liecircn quan tới việc ra quyết định thocircng qua đagravem phaacutenảnh hưởngvagrave higravenh
thagravenh sự nhất triacute Trong nhiều trường hợp noacute coacute thể cho ta sự linh hoạt hơn
18Hệ trợ giuacutep quyết định trong tổ chức DSS của 1 tổ chức hỗ trợ cocircng nghệ tập trung vagraveo caacutec quyết định ảnh hưởng tới
rất nhiều người 1 hệ thống DSS hiện đại coacute thể chấp nhận nhiều quyết định vượt qua những giới
hạn phacircn cấp truyền thống aCaacutec hoạt động gần DSS
Giải quyết caacutec nhiệm vụ đặc biệt Thu thập thocircng tin Liecircn lạc qua caacutec chi nhaacutenh Động thaacutei chiacutenh trị
Phacircn loại tư duy chiến lược cho DSS Sắp xếp quyết địnhXếp hạng quyết định sao cho thứ tự đứng trước thigrave được
ưu tiecircn trước Chia sẻ thocircng tinCaacutec quyecirct định coacute thể độc lập nhưng người ra quyết định
phải chia sẻ caacutec thocircng tin liecircn quan Lựa chọn đagravem phaacutenVagravei quyết định coacute thể xaacutec lập thocircng qua đagravem phaacuten vagrave kết
quả được lagravem đồng thờiKhocircng phải cocircng nghệ tự noacute coacute thể đưa ra quyết định magrave noacute nằm ở trigravenh độ cocircng nghệ hỗ trợ caacutec chiến lược quyết định quyền lực vagrave chiacutenh trị cugraveng phối hợp với nhau
Chương 4Mocirc higravenh hoacutea quaacute trigravenh ra quyết định
(Cấu truacutec của hệ HTQD)19Vấn đề Mocirc higravenh
bull Lagrave phần tử chủ chốt trong hầu hết hệ hỗ trợ quyết định vagrave lagrave điều kiện cần trong hệ hỗ trợ quyết định dựa vagraveo mocirc higravenh (model-based DSS)
bull Coacute nhiều lớp mocirc higravenh kegravem theo lagrave caacutec kỹ thuật xử lyacute thao taacutec mocirc higravenh đặc thugrave tương ứng
bull Caacutec vấn đề chiacutenh nhận diện bagravei toaacuten vagrave phacircn tiacutech mocirci trường nhận diện biến số dự baacuteo đa mocirc higravenh caacutec phạm trugrave mocirc higravenh quản lyacute mocirc higravenh vagrave mocirc higravenh hoacutea dựa vagraveo kiến thức
bull Mocirc higravenh hoacutea lagrave taacutec vụ khocircng đơn giản Người xacircy dựng mocirc higravenh phải cacircn bằng giữa tiacutenh đơn giản của mocirc higravenh với caacutec yecircu cầu biểu diễn để mocirc higravenh coacute thể nắm bắt đủ thực tại cần thiết cho người ra quyết định
bull Mocirc phỏng lagrave kỹ thuật mocirc higravenh hoacutea thocircng dụng dugraveng để tigravem hiểu vấn đề tuy khocircng nhất thiết phải tigravem ra được caacutec giải phaacutep biến thể mở rộng quaacute trigravenh ra quyết định của tổ chức vagrave cho pheacutep tổ chức xem xeacutet taacutec độngảnh hưởng của caacutec chọn lựa tương lai
bull Mocirc phỏng tiết kiệm rất nhiều chi phiacute vagrave thời gian ndash rất dễ thay đổi mocirc higravenh hoạt động của một hệ thống vật lyacute bằng mocirc higravenh hoacutea maacutey tiacutenh
bull Mocirc higravenh coacute thể được phaacutet triển vagrave cagravei đặt bằng một số caacutec ngocircn ngữ lập trinh (thế hệ 3 4 ) vagrave hệ thống phần mềm khaacutec nhau
Mocirc higravenh tĩnh vagrave động
bull Mocirc higravenh tĩnh thể hiện bức tranh tại thời điểm của tigravenh huống Caacutec khiacutea cạnh của bagravei toaacuten được xeacutet một thời kỳ nhất định trong một khung thời gian nhất định (coacute thể ldquocuốnrdquo về tương lai) Caacutec tigravenh huống được giả sử lagrave sẽ lập lại với tập caacutec điều kiện đồng nhất
1048713 Giả định coacute được tiacutenh ổn định của dữ liệu 1048713 Mocirc phỏng quaacute trigravenh dạng tĩnh - lagravem việc trecircn caacutec trạng thaacutei ổn định để tigravem ra caacutec
thocircng số tối ưu ndash thường được dugraveng như cocircng cụ chủ yếu để thiết kế quaacute trigravenh 1048713 vd quyết định sản xuấtmua 1 sản phẩm baacuteo caacuteo thu nhập hagraveng quyacutenăm bull Mocirc higravenh động biểu diễn caacutec kịch bản thay đổi theo thời gian 1048713 Phụ thuộc thời gian caacutec trạng thaacutei thay đổi theo thời gian 1048713 Thường dugraveng để tạo sinh vagrave biểu diễn caacutec xu hướng vagrave khuocircn mẫu theo thời gian 1048713 Mocirc phỏng động thể hiện caacutec diễn tiến khi caacutec điều kiện theo thời gian khaacutec với caacutec
trạng thaacutei ổn định ndash thường được dugraveng để thiết kế việc kiểm soaacutet caacutec hệ thống 1048713 VD dự baacuteo lời-lỗ trong 5 năm với caacutec nhập lượng như giaacute phiacute số lượng thay đổi
theo từng năm
Mocirc higravenh chắc chắn tương đối dễ phaacutet triển giải quyết vagrave coacute thể sinh ra caacutec giải phaacutep tối ưu 1048713 Caacutec bagravei toaacuten coacute một số lớnvocirc hạn caacutec giải phaacutep khả thi đặc biệt quan trọng 1048713 Caacutec mocirc higravenh tagravei chaacutenh được xacircy dựng trong điều kiện chắc chắn
Mocirc higravenh bất địnhbằng caacutech thu thập thecircm thocircng tin cố gắng đưa bagravei toaacuten trở về dạng chắc chắn hay dạng
rủi ro Mocirc higravenh rủi ro caacutec quyết định kinh doanh được đưa ra dưới caacutec rủi ro giả định
1048713 Đocirci khi biết được xaacutec suất của caacutec sự kiện xảy ra trong tương lai 1048713 Caacutec trường hợp khaacutec (bất định) ước lượng caacutec rủi ro vagrave giả sử caacutec tigravenh huống rủi ro
xảy ra 20Mocirc higravenh hoacutea
MOcirc HIgraveNH HOacuteA BẰNG BẢNG TIacuteNH bull Bảng tiacutenh phần mềm mạnh linh hoạt vagrave dễ dugraveng cho pheacutep tạo sinh caacutec ứng dụng trong kinh doanh kỹ thuật toaacuten vagrave khoa học với tập caacutec hagravem mạnh về tagravei chaacutenh thống kecirc toaacuten bull Kegravem theo lagrave caacutec thagravenh phần cộng thecircm (add-ins) giuacutep xacircy dựng vagrave giải caacutec lớp mocirc higravenh đặc thugrave bull Lagrave cocircng cụ mocirc higravenh hoacutea thocircng dụng nhất của người dugraveng cuối cugraveng bull Coacute caacutec chức năng về phacircn tiacutech ldquowhat-ifrdquo dograve tigravem mục tiecircu quản lyacute dữ liệu vagrave lập trigravenh (dạng macro) bull Coacute khả năng đọc ghi caacutec cấu truacutec tập tin thocircng dụng để giao tiếp được với caacutec CSDL vagrave cocircng cụ khaacutec bull Coacute thể xacircy dựng mocirc higravenh tĩnh vagrave động bull Dugraveng trecircn maacutey tiacutenh caacute nhacircn vagrave maacutey tiacutenh lớn
bull Cơ sở để xacircy dựng caacutec bảng tiacutenh đa chiều vagrave caacutec cocircng cụ xử lyacute phacircn tiacutech trực tuyến (OLAP) MOcirc HIgraveNH HOacuteA BẰNG PHAcircN TIacuteCH QUYẾT ĐỊNH bull Tiếp cận mocirc higravenh hoacutea caacutec tigravenh huống quyết định coacute một số hữu hạnkhocircng quaacute nhiều caacutec phương aacuten ndash mỗi phương aacuten được trigravenh ra dưới dạng bảng hay đồ thị - caacutec kết quả tương ứng (dự baacuteo được kegravem xaacutec suất) theo mục tiecircu bagravei toaacuten ndash từ đoacute chọn phương aacuten tốt nhất bull Đơn mục tiecircu bảng quyết định hay cacircy quyết định bull Đa mục tiecircu AHP (analytic hierarchy process) khaacutec
MOcirc HIgraveNH HOacuteA BẰNG QUY HOẠCH TOAacuteN
bull Quy hoạch toaacuten học (mathematical programming) lagrave họ caacutec cocircng cụ giải quyết caacutec bagravei toaacuten quản lyacute theo đoacute người ra quyết định phải cấp phaacutet caacutec tagravei nguyecircn khan hiếm cho caacutec hoạt động cạnh tranh nhau (caacutec phương aacuten) nhằm tối ưu hoacutea mục tiecircu coacute khả năng đo lường được bull Caacutec mocirc higravenh quy hoạch tuyến tiacutenh (linear programming) thocircng dụng nhất trong quy hoạch toaacuten coacute nhiều ứng dụng trong thực tế được dugraveng nhiều trong caacutec hệ hỗ trợ quyết định bull Bagravei toaacuten quy hoạch tuyến tiacutenh 1048713 Caacutec biến quyết định (cần tigravem giaacute trị) 1048713 Hagravem mục tiecircu (hagravem toaacuten học dạng tuyến tiacutenh xaacutec định quan hệ giữa biến quyết định vagrave mục tiecircu đo lường mức độ đạt đạt mục tiecircu vagrave cần được tối ưu hoacutea) 1048713 Caacutec hệ số của hagravem mục tiecircu (cho biết mức đoacuteng goacutep vagraveo mục tiecircu của 1 đơn vị biến quyết định) 1048713 Ragraveng buộc (biểu thức tuyến tiacutenh cho biết giới hạn tagravei nguyecircn vagravehay caacutec quan hệ giữa caacutec biến số) 1048713 Dung lượng (mocirc tả cận trecircn vagrave dưới của caacutec biến vagrave ragraveng buộc) 1048713 Hệ số (cocircng nghệ) vagraveo-ra (cho biết mức độ sử dụng tagravei nguyecircn của biến quyết định) bull Đặc điểm của bagravei toaacuten quy hoạch tuyến tiacutenh 1048713 Tagravei nguyecircn kinh tế của bagravei toaacuten lagrave coacute hạn vagrave sẵn sagraveng 1048713 Coacute nhiều caacutech (gt2 caacutech) sử dụng tagravei nguyecircn được gọi lagrave giải phaacutep hay chương trigravenh 1048713 Mỗi hoạt động dugraveng tagravei nguyecircn đều sinh ra kết quả dưới dạng mục tiecircu đatilde phaacutet biểu trước 1048713 Việc cấp phaacutet nằm trong caacutec ragraveng buộc cho trước bull Giả định của bagravei toaacuten quy hoạch tuyến tiacutenh 1048713 Caacutec kết quả của caacutec cấp phaacutet coacute thể đem so saacutenh với nhau coacute thể đo lường bằng một đơn vị chung
1048713 Caacutec cấp phaacutet độc lập với nhau về mặt kết quả 1048713 Kết quả cuối cugraveng lagrave tổng của caacutec kết quả từ caacutec hoạt động riecircng rẽ khaacutec nhau 1048713 Dữ liệu coacute tiacutenh chắc chắn 1048713 Tagravei nguyecircn được dugraveng một caacutech kinh tế nhất 1048713 Thường coacute một số lớn caacutec giải phaacutep với kết quả khaacutec nhau 1048713 Trong số caacutec giải phaacutep coacute thể coacute 1 giải phaacutep tốt nhất ndash mức độ đạt được mục tiecircu cao nhất ndash gọi lagrave giải phaacutep tối ưu được tigravem ra bằng một giải thuật đặc biệt MOcirc HIgraveNH HOacuteA BẰNG HEURISTIC bull Việc tigravem giải phaacutep tối ưu của một số bagravei toaacuten quyết định phức tạp coacute thể tốn nhiều thời gian chi phiacute hay khocircng thể tigravem ra được Cograven nếu dugraveng tiếp cận mocirc phỏng cũng coacute thể keacuteo dagravei phức tạp khocircng thiacutech hợp hay thậm chiacute khocircng chiacutenh xaacutec
bull Lagrave một tiếp cận giuacutep tigravem ra caacutec giải phaacutep khả thithỏa matildenđủ tốt cho caacutec bagravei toaacuten phức tạp Coacute thể coacute giải phaacutep đủ tốt (90-999 giaacute trị của lời giải tối ưu) nhanh choacuteng vagrave đỡ tốn keacutem hơn bằng caacutech dugraveng heuristics bull Quaacute trigravenh heuristic lagrave datildey caacutec bước xacircy dựng caacutec quy luật giải quyết vấn đề thocircng qua việc tigravem kiếm caacutec con đường hứa hẹn nhất dẫn đến lời giải tigravem kiếm caacutech thức thu thập vagrave phacircn giải thocircng tin theo quaacute trigravenh giải vagrave phaacutet triền caacutec phương phaacutep dẫn đến một giải thuật tiacutenh toaacuten hay một lời giải tổng quaacutet đatilde coacute bull Aacutep dụng chủ yếu cho bagravei toaacuten cấu truacutec yếu cũng dugraveng để tigravem ra giải phaacutep chấp nhận được cho bagravei toaacuten cấu truacutec chặt bull Khocircng đủ tổng quaacutet như caacutec giải thuật thường chỉ dugraveng cho tigravenh huống đặc thugrave đang xeacutet bull Coacute thể dẫn đến một giải phaacutep dở - caacutec thủ tục từng bước giải quyết vấn đề khocircng đảm bảo tigravem ra giải phaacutep tối ưu bull Heuristic coacute thể lagrave định lượng vigrave vậy coacute thể đoacuteng vai trograve quan trọng trong cơ sở mocirc higravenh của hệ hỗ trợ quyết định bull Heuristic coacute thể lagrave định tiacutenh vigrave vậy coacute thể đoacuteng vai trograve quan trọng trong cung ứng kiến thức cho hệ chuyecircn gia bull Quaacute trigravenh heuristic liecircn quan đến tigravem kiếm học tập ước lượng phacircn xử vagrave lặp lại caacutec hoạt động nagravey dọc theo tiến trigravenh bull Kiến thức thu được dugrave thagravenh cocircng hay thất bại trong quaacute trigravenh đều được phản hồi vagrave sửa đổi chiacutenh quaacute trigravenh nhờ đoacute coacute thể định nghĩa lại mục tiecircu hay bagravei toaacuten 1048713 Giải thuật di truyền bắt đầu bằng tập caacutec giải phaacutep được sinh ngẫu nhiecircn taacutei kết hợp caacutec cặp giải phaacutep một caacutech ngẫu nhiecircn bull Tigravenh huống necircn dugraveng heuristics 1048713 Dữ liệu đầu vagraveo khocircng chiacutenh xaacutec hay coacute giới hạn 1048713 Thực tế quaacute phức tạp đến nỗi khocircng dugraveng được caacutec mocirc higravenh tối ưu 1048713 Chưa coacute được giải thuật chiacutenh xaacutec vagrave đủ tin cậy 1048713 Bagravei toaacuten phức tạp necircn sẽ khocircng kinh tế nếu dugraveng tối ưu hay mocirc phỏng hoặc tốn quaacute nhiều thời gian tiacutenh toaacuten 1048713 Coacute thể cải thiện tiacutenh hiệu quả của quaacute trigravenh tối ưu (tức coacute thể sinh ra caacutec giải phaacutep ban đầu tương đối tốt) 1048713 Liecircn quan đến xử lyacute kyacute hiệu chứ khocircng phải xử lyacute kyacute số (như hệ chuyecircn gia) 1048713 Cần coacute quyết định nhanh vagrave caacutec xử lyacute dựa vagraveo maacutey tiacutenh đều khocircng khả thi (một số heuristic khocircng cần đến maacutey tiacutenh) bull Thuận lợi 1048713 Dễ hiểu dễ giải thiacutech vagrave dễ cagravei đặt 1048713 Nacircng cao tiacutenh saacuteng tạo vagrave năng lực heuristic cho caacutec vấn đề khaacutec 1048713 Tiết kiệm thời gian xaacutec lập vấn đề 1048713 Tiết kiệm yecircu cầu về bộ chứa vagrave xử lyacute maacutey tiacutenh
1048713 Tiết kiệm thời gian tiacutenh toaacuten vagrave do vậy tiết kiệm thời gian thực trong ra quyết định Một số vấn đề phức tạp đến nỗi chỉ coacute thể giải được bằng heuristics 1048713 Thường sinh ra nhiều giải phaacutep chấp nhận được 1048713 Thường coacute thể phaacutet biểu lyacute thuyết hay đo lường thực nghiệm về chất lượng của giải phaacutep (tức giaacute trị mục tiecircu của giải phaacutep gần với giaacute trị tồi ưu đến mức nagraveo dugrave giaacute trị tối ưu chưa biết được) 1048713 Coacute thể kết hợp tiacutenh thocircng minh vagraveo để hướng dẫn pheacutep tigravem kiếm (tigravem kiếm tabu) Năng lực thocircng minh đoacute coacute thể lagrave đặc thugrave theo bagravei toaacuten hoặc dựa trecircn yacute kiến chuyecircn gia được cấy trong hệ chuyecircn gia hoặc cơ chế tigravem kiếm 1048713 Coacute thể dugraveng heuristic hiệu quả vagraveo caacutec mocirc higravenh coacute thể giải bằng quy hoạch toaacuten học Đocirci khi heuristic lagrave phương phaacutep được ưa thiacutech hơn khi khaacutec giải phaacutep heuristics được dugraveng như giải phaacutep ban đầu cho caacutec phương phaacutep quy hoạch toaacuten học bull Hạn chế 1048713 Khocircng đảm bảo coacute được giải phaacutep tối ưu 1048713 Caacutec quy luật coacute rất nhiều ngoại lệ 1048713 Caacutec lựa chọn quyết định tuần tự coacute thể khocircng tiecircn đoaacuten được caacutec kết cục tương lai của mỗi chọn lựa 1048713 Sự liecircn thuộc giữa caacutec phần trong hệ thống đocirci khi coacute thể gacircy ra caacutec ảnh hưởng lớn lao lecircn toagraven hệ thống bull Phacircn loại caacutec giải thuật heuristic 1048713 Heuristic xacircy dựng xacircy dựng giải phaacutep khả thi bằng caacutech cộng thecircm từng thagravenh phần một VD bagravei toaacuten người baacuten hagraveng ndash luocircn gheacute thagravenh phố chưa viếng thăm kế tiếp gần nhất
1048713 Heuristic cải tiến bắt đầu bằng một giải phaacutep khả thi vagrave cố gắng cải tiến liecircn tục trecircn đoacute VD trecircn thử hoaacuten đổi 2 thagravenh phố 1048713 Quy hoạch toaacuten aacutep dụng vagraveo caacutec mocirc higravenh chứa iacutet ragraveng buộc nhằm coacute được thocircng tin về thỏa hiệp tốt nhất với mocirc higravenh nguyecircn gốc Thường được dugraveng trong tối ưu hoacutea nguyecircn (integer optimization) 1048713 Chia giai đoạn giải quyết một vấn đề theo từng giai đoạn VD ở PampG trecircn đacircy bagravei toaacuten phacircn phối được giải quyết trước sau đoacute dugraveng giải quyết bagravei toaacuten chiến lược sản phẩm 1048713 Phacircn ratilde chia bagravei toaacuten thagravenh caacutec phần nhỏ hơn coacute thể giải quyết được sau đoacute kết hợp caacutec giải phaacutep đoacute lại VD chia latildenh thổ baacuten hagraveng thagravenh 4 vugraveng khaacutec nhau giải quyết cho từng vugraveng sau đoacute kết nối caacutec giải phaacutep
21Mocirc phỏngbull Giả định caacutec đặc điểm của thực tạibull Lagrave kỹ thuật tiến triển caacutec thực nghiệm (như phacircn tiacutech ldquowhat-ifrdquo) - bằng maacutey tiacutenh -trecircn một mocirc higravenh của hệ thocircng tin quản lyacute
bull Khocircng thực sự lagrave một mocirc higravenh vigrave khocircng biểu diễn thực tại magrave lagrave cố gắng bắtchước thực tạibull Một trong những phương phaacutep thocircng dụng nhất trong HHTQĐbull HHTQĐ lagravem việc với caacutec bagravei toaacuten phi cấu truacutec vagrave cấu truacutec yếu tigravenh huống thực tếphức tạp ndash khocircng dễ biểu diễn bằng mocirc higravenh tối ưu hay caacutec dạng mocirc higravenh khaacutecnhưng lại thường coacute thể xử lyacute được bằng mocirc phỏngbull Đặc điểm1048713 Iacutet đưa ra caacutec đơn giản hoacutea về thực tại hơn caacutec mocirc higravenh khaacutec1048713 Do triển khai caacutec thực nghiệm necircn noacute coacute thể kiểm thử caacutec giaacute trị cụ thể của caacutecbiến quyết địnhbiến khocircng kiểm soaacutet được của mocirc higravenh vagrave xem xeacutet ảnh hưởnglecircn caacutec biến kết quả1048713 Phương phaacutep coacute tiacutenh mocirc tả (như vậy khaacutec với phương phaacutep danh định)1048713 Khocircng tự động tigravem kiếm giải phaacutep tối ưu ndash noacute mocirc tảtiecircn đoaacuten caacutec đặc tiacutenh của hệthống đatilde cho dưới caacutec điều kiện khaacutec nhau từ đoacute coacute thể chọn ra phương aacuten tốtnhất1048713 Quaacute trigravenh mocirc phỏng thường lặp lại một thực nghiệm nhiều lần để coacute được ướclượng về hiệu ứng tổng quaacutet của một số hagravenh động nhất định1048713 Mocirc phỏng maacutey tiacutenh thiacutech hợp cho hầu hết caacutec tigravenh huống mặc dugrave cũng coacute một sốmocirc phỏng thủ cocircng thagravenh cocircng1048713 Thường chỉ được dugraveng khi bagravei toaacuten quaacute phức tạp khocircng thể xem xeacutet bằng caacutec kỹthuật tối ưu dạng số Tiacutenh phức tạp theo nghĩa bagravei toaacuten khocircng thể cocircng thức hoacuteacho tối ưu (do khocircng thotildea caacutec giả định) hoặc cocircng thức quaacute lớn quaacute nhiều tươngtaacutec giữa caacutec biến hoặc về bản chất bagravei toaacuten lagrave bất định hay rủi roPhương phaacutep mocirc phỏng thiết lập mocirc higravenh của hệ thống thực vagrave tiến hagravenh caacutec thựcnghiệm lặp lại trecircn mocirc higravenh
bull Thuận lợi1048713 Lyacute thuyết tương đối trực tiếp hiệu ứng dagravei hạn của nhiều chiacutenh saacutech -gt neacuten thờigian lớn1048713 Do tiacutenh chất mocirc tả (khaacutec với danh định)1048713 Coacute thể thấy được nhanh choacuteng coacute thể đặt ra caacutec cacircu hỏi ldquowhat-ifrdquo coacute thể dugravengtiếp cận thử-vagrave-sai vagraveo giải quyết vấn đề một caacutech nhanh choacuteng rẻ chiacutenh xaacutec iacutetrủi ro hơn1048713 Thử nghiệm được biến quyết định phần nagraveo của mocirci trường thực sự quan trọngvới caacutec phương aacuten khaacutec nhau1048713 Yecircu cầu kiến thức riecircng biệt về bagravei toaacuten vigrave thế buộc người xacircy dựng mocirc higravenh phảilagravem việc thường xuyecircn với nhagrave quản lyacute ndash đối tượng mong muốn của HHTQĐ để
từ đoacute bản chất bagravei toaacuten vagrave caacutec quyết định được hiểu tốt hơn1048713 Mocirc higravenh được xacircy dựng từ viễn cảnhcaacutech nhigraven của nhagrave quản lyacute1048713 Mocirc higravenh chỉ cho một bagravei toaacuten riecircng biệt thường khocircng thể dugraveng giải caacutec bagravei toaacutenkhaacutec Như vậy mỗi thagravenh phần của mocirc higravenh ứng với một phần của hệ thống thựcdo đoacute sẽ khocircng yecircu cầu nhagrave quản lyacute phải tổng quaacutet hoacutea caacutec hiểu biết của migravenh1048713 Phổ bagravei toaacuten giải được rất rộng tồn kho nhacircn sự hoạch định chiến lược 1048713 Coacute thể chứa caacutec phức tạp thực sự của bagravei toaacuten khocircng cần caacutec đơn giản hoacutea (TDdugraveng caacutec phacircn phối xaacutec suất thực thay vigrave phacircn phối lyacute thuyết xấp xỉ)1048713 Coacute thể tự động sinh ra nhiều đo lường hiệu năng quan trọng1048713 Thường lagrave phương phaacutep duy nhất của HHTQĐ coacute thể xử lyacute caacutec bagravei toaacuten tương đốiphi cấu truacutec1048713 Coacute một số caacutec goacutei phần mềm mocirc phỏng (Monte Carlo) tương đối dễ dugravengbull Điểm yếu1048713 Tuy thường tigravem được caacutec phương aacuten đủ tốt nhưng khocircng đảm bảo lời giải tối ưu1048713 Quaacute trigravenh xacircy dựng mocirc higravenh thường dagravei vagrave tốn keacutem1048713 Giải phaacutep vagrave suy diễn từ nghiecircn cứu mocirc phỏng thường khocircng thể chuyển sang bagraveitoaacuten khaacutec vigrave mocirc higravenh kết hợp caacutec yếu tố đặc thugrave1048713 Đocirci khi do mocirc higravenh quaacute dễ giải thiacutech cho nhagrave quản lyacute necircn caacutec phương phaacutep phacircntiacutech thường xem nhẹ1048713 Phần mềm mocirc phỏng đocirci khi yecircu cầu caacutec kỹ năng đặc biệt do độ phức tạp củaphương phaacutep giải higravenh thứcbull Caacutec loại mocirc phỏng1048713 Mocirc phỏng xaacutec suất một hay nhiều biến độc lập mang tiacutenh xaacutec suất với 2 loạiphacircn phối ndash thường dugraveng kỹ thuật Monte Carlo1048713 Phacircn phối rời rạc tigravenh huống coacute một số giới hạn caacutec biến cố (biến) với hữu hạncaacutec giaacute trị cho mỗi biến cố (biến)1048713 Phacircn phối liecircn tục tigravenh huống coacute số lượng khocircng giới hạn caacutec biến cố tuacircn theocaacutec hagravem mật độ xaacutec suất như phacircn phối chuẩn1048713 Mocirc phỏng độc lậpphụ thuộc theo thời gian1048713 Độc lập khocircng cần thiết phải biết chiacutenh xaacutec thời điểm xảy ra biến cố (nhu cầutiecircu thụ lượng sản phẩm trong ngagravey khocircng biết chiacutenh xaacutec thời điểm tiecircu thụ)1048713 Phụ thuộc cần biết chiacutenh xaacutec thời điểm xảy ra sự kiện (bagravei toaacuten hagraveng đợi)1048713 Mocirc phỏng tương taacutec trực quan1048713 Mocirc phỏng hướng đối tượng dugraveng tiếp cận hướng đối tượng để xacircy dựng mocirc higravenhmocirc phỏng Chuacute yacute ngocircn ngữ mocirc higravenh hoacutea nhất thể UML (unified modelinglanguage) kể cả khi mocirc phỏng caacutec hệ thời gian thựcMOcirc HIgraveNH HOacuteA ĐA CHIỀU ndash XỬ LYacute PHAcircN TIacuteCH TRỰC TUYẾNbull Người ra quyết định thường phải xem xeacutet nhiều chiều của dữ liệu (TD caacutec chiềucủa dữ liệu baacuten hagraveng lagrave sản phẩm vugraveng thời gian người baacuten ) dữ liệu cần đượcphacircn tiacutech trực tiếp bằng caacutec cocircng cụ chuẩn hay phacircn tiacutech tự động bằng caacutec
phương phaacutep khai mỏ dữ liệu (data mining)bull Hầu hết caacutec hệ thống phacircn tiacutech đa chiều được nhuacuteng trong caacutec hệ xử lyacute phacircn tiacutechtrực tuyến (HXLPTTT ndash online analytic processing - OLAP)bull Mục tiecircu của XLPTTT nắm bắt cấu truacutec của dữ liệu thực để hỗ trợ ra quyết địnhbull Trong HHTQĐ coacute sự gắn nối tự nhiecircn giữa mocirc higravenh hoacutea dữ liệu mocirc higravenh hoacutea kyacutehiệu vagrave caacutec khiacutea cạnh của phacircn tiacutech ldquowhat-ifrdquobull Caacutec baacuteo caacuteo của HXLPTTT đều coacute tiacutenh tương taacutec dễ khai thaacutec sử dụng đặc biệtphugrave hợp cho caacutec baacuteo caacuteo về chỉ số hiệu năng chủ yếu (key performance indicators- KPI) baacuteo caacuteo về đo lường hiệu năng kinh doanh bull Thế hệ hiện tại của HXLPTTT vagrave hệ khai mỏ dữ liệu (data mining) tiacutech hợp caacutecđặc tiacutenh của hệ thocircng tin latildenh đạo (executive information system ndashEIS- nhiềucaacutech nhigraven dữ liệu chi tiết hoacutea theo nhu cầu) vagrave caacutec hệ đồ họa khaacutec ndash thường coacutegiao diện người dugraveng dạng kiểu WEBbull Caacutec hệ thống như trecircn cograven được gọi lagrave caacutec cocircng cụ triacute tuệ kinh doanh (businessintelligence - BI) vigrave coacute caacutec đặc trưng về mocirc higravenh hoacutea vagrave tối ưu hoacutea nhưng lạitrong suốt đối với ngươigrave dugravengbull Hiện caacutec cocircng cụ được đưa ra bởi caacutec nhagrave cung cấp về CSDL về hoạch định tagraveinguyecircn tổ chức (ERP) về nhagrave kho dữ liệu (data warehouse) về HXLPTTT MOcirc HIgraveNH HOacuteA VAgrave MOcirc PHỎNG TƯƠNG TAacuteC TRỰC QUANbull Iacutech lợi Người ra quyết định tham gia vagraveo quaacute trigravenh phaacutet triển mocirc higravenh vagrave thựcnghiệm mocirc phỏng vigrave vậy sẽ tin tưởng khi sử dụng mocirc higravenhbull Mocirc higravenh hoacutea tương taacutec trực quan (visual interactive modeling - VIM) dugraveng caacutecbiểu diễn đồ họa maacutey tiacutenh để trigravenh bagravey caacutec ảnh hưởng của caacutec quyết định quản lyacutekhaacutec nhau ở một thời điểm (tĩnh) hay tiến triển theo thời gian (động với kỹ thuậthoạt higravenh)bull Mocirc phỏng tương taacutec trực quan (visual interactive simulation - VIS) cho pheacutepngười dugraveng theo dotildei tiến trigravenh xacircy dựng vagrave sử dụng khai thaacutec mocirc higravenh mocirc phỏngdưới dạng hoạt higravenhbull Mocirc higravenh hoacutea tương taacutec trực quan coacute thể kết hợp với tiếp cận triacute tuệ nhacircn tạo đểđưa ra caacutec khả năng mới thay đổi từ xacircy dựng hệ thống dạng đồ họa đến tigravem hiểuvề động học của hệ thốngbull Cần đến caacutec hệ thống maacutey tiacutenh xử lyacute song song tốc độ cao để xacircy dựng caacutec mocircphỏng - phức tạp quy mocirc lớn dạng hoạt higravenh - mang tiacutenh khả thi ở thời gian thực
22Caacutec dạng hệ thống hỗ trợ ra quyết địnhHệ hỗ trợ quyết định nhoacutemRa quyết định nhoacutem giao tiếp vagrave cộng taacutec- Caacutec đặc điểm của cocircng việc nhoacutem+ Một nhoacutem thực hiện một nhiệm vụ thỉnh thoảng ra quyết định thỉnh thoảngkhocircng ra quyết định+ Caacutec thagravenh viecircn trong nhoacutem coacute thể ở những nơi khaacutec nhau
+ Caacutec thagravenh viecircn trong nhoacutem coacute thể lagravem việc ở những thời gian khaacutec nhau+ Caacutec thagravenh viecircn trong nhoacutem coacute thể lagravem việc cugraveng nhau hoặc ở caacutec tổ chức khaacutecnhau+ Nhoacutem coacute thể vĩnh viễn hoặc tạm thời+ Nhoacutem coacute thể ở bất kỳ mức quản lyacute nagraveo hoặc mức thời gian nagraveo+ Coacute sự điều phối (quaacute trigravenh vagrave nhiệm vụ đạt được) hoặc macircu thuẩn trongnhoacutem+ Coacute sự đạt được hoặcvagrave mất maacutet năng suất trong tổ chức+ Nhiệm vụ phải hoagraven thagravenh rất nhanh+ Khocircng thể hoặc quaacute đắt cho tất cả caacutec thagravenh viecircn trong nhoacutem cugraveng hợp ở mộtnơi+ Một số dữ liệu thocircng tin hoặc kiến thức cần thiết nằm ở nhiều nơi một sốkhaacutec ở ngoagravei tổ chức+ Chuyecircn mocircn của caacutec thagravenh viecircn khocircng coacute trong nhoacutem lagrave cần thiết- Caacutec hoạt động vagrave caacutec quaacute trigravenh miecircu tả caacutec cuộc họp+ Cuộc họp lagrave hoạt động chung liecircn quan bởi một nhoacutem người coacute địa vị bằngnhau hoặc gần bằng nhau+ Kết quả của cuộc họp phụ thuộc một phần vagraveo kiến thức yacute kiến caacutec đaacutenh giaacutecủa caacutec thagravenh viecircn+ Kết quả của cuộc họp cũng phụ thuộc vagraveo sự kết hợp của nhoacutem vagrave phụ thuộcvagraveo quaacute trigravenh ra quyết định được sử dụng bởi nhoacutem đoacute+ Giải quyết caacutec yacute kiến khaacutec nhau bởi người coacute quyền hạn hoặc thương lượnghoặc phacircn xửHỗ trợ giao tiếp- Giao tiếp lagrave thagravenh phần quan trọng cho hỗ trợ quyết định Khocircng coacute giao tiếp thigravekhocircng coacute cộng taacutec Những người ra quyết định caacute nhacircn phải giao tiếp với caacutecđồng nghiệp chuyecircn gia cơ quan chiacutenh phủ khaacutech hagraveng đối taacutec kinh doanh hellipHọ cũng cần dữ liệu vagrave thocircng tin (vagrave kiến thức) từ nhiều nơi trecircn thế giới Caacutecnhoacutem ra quyết định phải giao tiếp cộng taacutec vagrave thương lượng trong cocircng việcHầu hết caacutec tổ chức sẽ nhanh trở thagravenh khocircng coacute chức năng nếu khocircng coacute caacutec hệthống giao tiếp Thương mại điện tử coacute thể hiệu quả chỉ qua caacutec kỹ thuật giao tiếphiện đại- Caacutec kỹ thuật thocircng tin hiện đại cung cấp caacutec phương tiện hỗ trợ giao tiếp rẻnhanh coacute khả năng coacute thể tin cậy Nền tảng hỗ trợ giao tiếp lagrave caacutec hệ thống maacuteytiacutenh mạng+ Bắt đầu bằng điện baacuteo điện thoại radio vagrave ti vi+ Trong 100 năm chuacuteng ta phaacutet triển maacutey fax thư điện tử chương trigravenh chatnhoacutem tin tức hệ thống hội nghị truyền higravenh Hầu hết caacutec kỹ thuật nagravey đềuhoạt động trecircn internet+ Sự phaacutet triển giao tiếp sau cugraveng lagrave hệ thống họp điện tử caacutec dịch vụ vagrave hệ
thống hội nghị điện tử thường sử dụng internet để kết nối caacutec người ra quyếtđịnh- Caacutec thuận lợi aacutep dụng caacutec phương phaacutep giao tiếp cải tiến trong caacutec tổ chức+ Cải tiến năng suất của nhacircn viecircn+ Liecircn quan đến nhiều người ra quyết định chiacutenh+ Khocircng quan tacircm nhiều đến đường biecircn giới địa lyacute+ Tạo nền văn hoacutea hợp taacutec nhất quaacuten+ Cải tiến chất lượng cuộc sống của nhacircn viecircnHỗ trợ cộng taacutec Maacutey tiacutenh hỗ trợ cộng taacutec- Khung thời giannơi chốn+ Sự hiệu quả của kỹ thuật tiacutenh toaacuten cộng taacutec phụ thuộc vagraveo vị triacute của caacutec thagravenhviecircn trong nhoacutem vagrave phụ thuộc vagraveo thời gian chia sẽ thocircng tin gởi vagrave nhận+ Chia sự giao tiếp thagravenh bốn ocirc vagrave tổ chức bốn ocirc dọc theo 2 chiều thời gian vagravenơi chốn1048713 Thời gian Khi gởi vagrave nhận thocircng tin hầu như đồng thời giao tiếp lagrave đồngthời Viacute dụ Điện thoại ti vi vagrave caacutec cuộc họp gặp mặt nhau Giao tiếp bấtđồng bộ xảy ra khi người nhận nhận thocircng tin ở thời điểm khaacutec thời điểmgởi thocircng tin đoacute1048713 Nơi chốn Người gởi vagrave người nhận coacute thể ở cugraveng phograveng hoặc khocircng+ Bốn ocirc lagrave1048713 Cugraveng thời giancugraveng nơi chốn Caacutec thagravenh viecircn gặp mặt nhau cugraveng một luacutecgiống như phograveng quyết định hoặc gặp mặt truyền thống1048713 Cugraveng thời giankhaacutec nơi chốn Caacutec thagravenh viecircn ở caacutec nơi khaacutec nhau nhưnggiao tiếp cugraveng nhau Viacute dụ hội nghị truyền higravenh (videoconferencing)1048713 Khaacutec thời giancugraveng nơi chốn Nhiều người lagravem việc theo ca Ca nagravey để lạithocircng tin cho ca khaacutec1048713 Khaacutec thời giankhaacutec nơi chốn Caacutec thagravenh viecircn ở caacutec nơi khaacutec nhau Caacutecthagravenh viecircn nagravey gởi vagrave nhận thocircng tin ở những lần khaacutec nhau
23Thực thi hệ DSSHệ thống hỗ trợ quản lyacute (MSS) khocircng phải luacutec nagraveo cũng luocircn thagravenh cocircng Nhiều trường hợpthất bại của ES khocircng hoagraven toagraven lagrave lyacute do kỹ thuật Thực thi hệ thống lagrave một quaacute trigravenh liecircn tụcnhằm đảm bảo cho tổ chức chuẩn bị tiếp nhận một hệ thống mới vagrave đưa hệ thống vagraveo sử dụngthagravenh cocircngThực hiện cocircng nghệ hệ thống hỗ trợ quản lyacute lagrave việc phức tạp vigrave caacutec hệ thống nagravey khocircng đơnthuần lagrave hệ thống thocircng tin chỉ thu thập thao taacutec vagrave phacircn phối thocircng tin Magrave xa hơn chuacuteng
liecircn quan tới caacutec cocircng việc coacute thể lagravem thay đổi đaacuteng kể caacutech thức hoạt động của tổ chức Tuyvậy đa số caacutec yếu tố thực thi đều liecircn quan tới hệ thống thocircng tinThực thi MSS lagrave quaacute trigravenh liecircn tục diễn ra trong suốt thời gian phaacutet triển hệ thống từ đề xuấtban đầu đến nghiecircn cứu khả thi thiết kế vagrave phacircn tiacutech hệ thống lập trigravenh huấn luyện chuyểnđổi vagrave lắp đặt Caacutec chuyecircn gia hệ thống thocircng tin thường gọi thực thi lagrave giai đoạn cuối trongvograveng đời hệ thống Định nghĩa thực thi MSS phức tạp hơn vigrave bản chất lặp của sự phaacutet triểncaacutec hệ thống
THỰC THI KHOcircNG HOAgraveN CHỈNHCaacutec quyết định về tiacutenh khả thi thường coacute giả định về lợi iacutech đạt được khi kế hoạch thực thiđược thực hiện hoagraven toagraven Trong thực tế thường chỉ thực hiện 90 thậm chiacute 70 phần trăm sovới phacircn tiacutech khả thi Lyacute do lagrave sự thay đổi tại một nơi trong hệ thống coacute thể ảnh hưởng vagrave coacutethể taacutec động tiecircu cực đến chỗ khaacutec Do vậy cấp quản lyacute coacute thể bỏ những phần trong dự aacuten coacutethể gacircy ra taacutec động xấu Do đoacute dự aacuten sẽ thực hiện iacutet hơn 100 so với dự aacuten kế hoạch Caacutec lyacutedo khaacutec coacute thể lagrave do khấu trừ ngacircn saacutech hoặc vượt chi phiacuteĐAacuteNH GIAacute SỰ THAgraveNH COcircNG CỦA THỰC THI HỆ THỐNGPhải coacute caacutec chỉ số đo lường thigrave mới coacute thể đaacutenh giaacute sự thagravenh cocircng khi thực thi một hệ thốngDickson va Powers (1973) đề ra 5 tiecircu chuẩn độc lậpbull Tỷ lệ thời gian thực hiện dự aacuten với thời gian ước lượngbull Tỷ lệ chi phiacute thực tế vagrave ngacircn saacutech thực hiệnbull Thaacutei độ của cấp quản lyacute đối với hệ thốngbull Nhu cầu thocircng tin của caacutec nhagrave quản lyacute được đaacutep ứng như thế nagraveo qua hệ thốngbull Taacutec động của dự aacuten đối với những hoạt động maacutey tiacutenh trong cocircng tyCaacutec đo lường khaacutec để đaacutenh giaacute thagravenh cocircng của hệ hỗ trợ quản lyacute (MSS)bull Sự sử dụng hệ thống (dự định dugraveng hoặc thực sự dugraveng)bull Thỏa matilden của người dugravengbull Thaacutei độ taacuten thagravenhbull Mức độ hệ thống hoagraven thagravenh caacutec mục tiecircu ban đầubull Phần thưởng đối với tổ chức (giảm chi phiacute tăng doanh thuhellip)bull Tỷ số lợi iacutech chi phiacute
bull Mức độ thể chế hoacutea của MSS trong tổ chứcDo bởi tiacutenh đa dạng của DSS necircn việc đaacutenh giaacute sự thagravenh cocircng của hệ nagravey cũng khoacute khăn tuynhiecircn cũng coacute thể coacute một số yếu tố giuacutep cho DSS thagravenh cocircng như sự tham gia người dugravenghuấn luyện người dugraveng hỗ trợ quản lyacute cấp cao nguồn thocircng tin đặc điểm của những nhiệmvụ coacute liecircn quan (cấu truacutec bất định độ khoacute phụ thuộc)
Chương5Nhoacutem hỗ trợ quyết định vagrave nhoacutemcocircng nghệ phần mềm
51Nhoacutem tạo quyết định
MDM-Holsapple đatilde gợi yacute chuacuteng ta sử dụng giới hạn người tạo quyết định
Một nhoacutem lagrave kết cấu MDM nơi magrave nhiều người ra quyết định hoagraven toagraven tương taacutec
Một đội lagrave kết cấu MDM nơi caacutec thagravenh viecircn tư vấn cho người đưa ra quyết định nhưng khocircng tương taacutec
Một Ủy ban lagrave kết cấu MDM với một người tạo quyết định duy nhất vagrave sự tương taacutec giữa caacutec thagravenh viecircn
Mạng thocircng tin
Mạng lưới baacutenh xe mỗi người tham gia coacute thể giao tiếp với người đưa ra quyết định ở trung tacircm nhưng khocircng phải với người tham gia khaacutecCấu truacutec nagravey lagrave khocircng thỏa matilden tất cả những người tham gia ngoại trừ người ra quyết định
Mạng dacircy chuyền Tham gia chuyển tiếp thocircng tin chỉ để noacute luocircn liền kề nhau trong chuỗi
Thagravenh viecircn cuối cugraveng ko được đaacutep ứng
Mạng vograveng trograven Tương tự như chuỗi nhưng kết thuacutec được kết nối
Mạng kết nối hoagraven toagraven khocircng coacute hạn chế về giao tiếp vagrave tương taacutec giữa caacutec thagravenh viecircnNoacutei chungnoacute đaacutep ứng hầu hết caacutec kết nối của người tham gia nhưng truyền đạt thocircng tin mất nhiều thời gian vagrave coacute nhiều cơ hội xảy ra lỗi
Nhoacutem hagravenh vi vagrave chuẩn mực
MDMs thiết lập caacutec chỉ tiecircu hướng dẫn quaacute trigravenh ra quyết định
Một chuẩn mực quy định cụ thể những gigrave thagravenh viecircn trong nhoacutem dự kiến sẽ lagravem trong những hoagraven cảnh nhất định
Quy tắc gửi coacute thể được thocircng qua viacute dụ đaacutenh giaacute ngang hagraveng hoặc xử phạt
Lagravem thế nagraveo để đưa ra quyết định
Việc chọn lựa magrave trong đoacute việc sử dụng cấu truacutec MDM phải được dựa trecircn một số yếu tố liecircn quan với bối cảnh quyết định
Viacute dụmột cấu truacutec riecircng lẻ sẽ lagravem việc nơi magrave quyết định được cấu truacutec cao vagrave thocircng tin lagrave coacute sẵn
Một ủy ban cơ cấu sẽ lagrave sự lựa chọn khi người ra quyết định khocircng thể đưa ra quyết định một migravenh
52Caacutec vấn đề thường gặp trong nhoacutem
Kiacutech thước Noacutei chung sự nhất triacute vagrave gắn kết giữa caacutec thagravenh viecircn tỉ lệ nghịch với phạm vi nhoacutem Trong nhoacutem lớn rất dễ higravenh thagravenh caacutec nhoacutem nhỏ vagrave hoạt động rời rạc
Tư duy tập thể Trong nhoacutem lớn mọi người coacute xu hướng suy nghĩ đểđạtđược sự nhất triacute necircn khocircng phaacutet huy được sự saacuteng tạo
Caacutec vấn đề về xatilde hội
Xung đột Trong 1 nhoacutem ai cũng muốn migravenh lagrave giỏi nhất necircn dễ dẫn đến xung đột
Ẩn danh(Giấu tecircn) Đacircy lagrave phương phaacutep được sử dụng để kiểm soaacutet xung đột Cho caacutec thagravenh viecircn tham gia ẩn danh
Vấn đề giới tiacutenh Nam vagrave nữ thường coacute những thế mạnh khaacutec nhau điều nagravey coacute thể lagrave sức mạnh trong 1 thiết lập MDM
Đagravem phaacuten vagrave quyết định
Một quyết định coacute thể liecircn quan đến nhiều quan điểm khaacutec nhau vigrave thế cần phải coacute sự đagravem phaacuten
Caacutec thiết kế của cơ chế hỗ trợ cho MDM phải phugrave hợp với caacutec hoạt độngđagravemphaacuten
Những hoạt động nagravey bao gồm việc thu nhận yacute kiến của caacutec thagravenh viecircn 1 caacutech cocircng bằng
53Cocircng nghệ hỗ trợ MDM
Organizational DSSndash 1 hệ thống cung cấp caacutec quyết định hỗ trợ
Group Support Systemndash Cocircng nghệ sử dụng sự hỗ trợ của nhiều becircn tham gia
Group DSS ndash Lagrave 1 hệ thống được thiết kế đặc biệt để hỗ trợ cho MDM
DSS ndash Lagrave 1 hệ thống dưới sự kiểm soaacutet của 1 người quyết định hệ thống nagravey cung cấp 1 bộ cocircng cụ giuacutep phacircn tiacutech hoagraven cảnh đểđưa ra quyết định vagrave nacircng cao hiệu quả của quyết địnhđoacute
53Cocircng nghệ hỗ trợ MDM
Organizational DSSndash 1 hệ thống cung cấp caacutec quyết định hỗ trợ
Group Support Systemndash Cocircng nghệ sử dụng sự hỗ trợ của nhiều becircn tham gia
Group DSS ndash Lagrave 1 hệ thống được thiết kế đặc biệt để hỗ trợ cho MDM
DSS ndash Lagrave 1 hệ thống dưới sự kiểm soaacutet của 1 người quyết định hệ thống nagravey cung cấp 1 bộ cocircng cụ giuacutep phacircn tiacutech hoagraven cảnh đểđưa ra quyết định vagrave nacircng cao hiệu quả của quyết địnhđoacute
Mục tiecircu của cocircng nghệ hỗ trợ MDM
Quy trigravenh hỗ trợ tập trung vagraveo quaacute trigravenh tạo điều kiện thuận lợi cho sự tương taacutec
Cơ chế cấu truacutec quaacute trigravenh chi phối caacutec hoạt động truyền thocircng
Nhiệm vụ hỗ trợ cocircng việc coacute thể chọn lựa tổ chức hoặc lấy thocircng tin
Nhiệm vụ cấu truacutec cocircng việc cho pheacutep truy cập đến kỹ thuật lọc kết hợp phacircn tiacutech kiến thức liecircn quan đến cocircng việc
Caacutec lớp loại cocircng nghệ hỗ trợ MDM
Phacircn loại theo đặc điểm do DeSanctis vagrave Gallupe đưa ra đề xuất một chương trigravenh ba cấp dựa trecircn caacutec tiacutenh năng được cung cấp
Hệ thống cấp 1 Mục điacutech chiacutenh lagrave tạo điều kiện thocircng tin liecircn lạc giữa caacutec thagravenh viecircn
Hệ thống cấp 2 Thiết kế để giảm thiểu rủi ro
Hệ thống cấp 3 Giuacutep điều chỉnh xử lyacute quyết định
Phacircn loại theo cocircng nghệ -Kraemer vagrave King tập trung vagraveo cocircng nghệ aacutep dụng
Cocircng nghệ bảng mạch điện tử
Hội nghị trực tuyến
Mạng lưới tập đoagraven
Trung tacircm thocircng tin
Mocirci trường cộng taacutec
Phograveng quyết định
Nhoacutem phần mềm
Phần mềm được thiết kế để hỗ trợ sự hợp taacutec bao gồm việc thu huacutet vagrave lưu trữ thocircng tin
Caacutec tổ chức dẫn đầu thị trường hiện tại lagrave Lotus Notes and Domino Microsoft Exchange Novell GroupWise and Oracle Office
Caacutec cocircng cụ trong một bộ phần mềm bao gồm người quản lyacute hội nghị (Lotus Sametime) vagrave trao đổi thocircng điệp (Lotus Notes Mail)
Xếp hạng phần mềm cho nhoacutem
Ellis vv đề xuất một hệ thống xếp hạng dựa vagraveo kiểu sự hỗ trợ noacute Cung cấp
Hệ thocircng điệp
Hệ thống hội thảo truyền higravenh
Hệ thống cộng taacutec soạn thảo
Nhoacutem phacircn phối giải phaacutep phần mền
Hệ thống phối hợp
Hệ thống thocircng minh đại diện
Lực lượng điều khiển phaacutet triển phần mềm cho nhoacutem
Một số nhacircn tố chiacutenh bao gồm
Tăng năng suất
Giảm số lượng caacutec cuộc họp
Tăng cường tự động hoacutea caacutec quy trigravenh lagravem việc thường xuyecircn
Cần phối hợp toagraven cầu tốt hơn
Tiacutenh sẵn sagraveng của những mạng lan rộng
Coleman vagrave Khanna liệt kecirc 10 nhacircn tố khaacutec
54Quản lyacute hoạt động MDM (Mobile Device Management - Quản lyacute thiết bị di động)
Một số phương phaacutep phối hợp phổ biến hơnMDM lagrave
Kỹ thuật nhoacutem định danh
Kỹ thuật Delphi
Sự phacircn xử
Hệ thocircng tin dựa trecircn vấn đề
Nemawashi
Kỹ thuật nhoacutem định danh
1-Mỗi người tham gia viết ra những yacute tưởng về những gigrave necircn quyết định
2-Lần lượt mỗi người tham gia trigravenh bagravey yacute tưởng của migravenh được ghi lại trecircn bảng Khocircng thảo luận ở đacircy
3-Sau khi tất cả caacutec yacute tưởng được trigravenh bagravey caacutec đại biểu coacute thể chất vấn những người khaacutec
4-Mỗi người tham gia bỏ phiếu cho mỗi yacute tưởng
Kỹ thuật Delphi
Về cơ bản tương tự như kỹ thuật nhoacutem định danh ngoại trừ những người khocircng bao giờ tham gia cuộc họp
Một cocircng cụ khảo saacutet được sử dụng để thu thập đầu vagraveo ban đầu từ caacutec thagravenh viecircn
Một cuộc khảo saacutet thứ hai được gửi đi với một bản toacutem tắt caacutec kết quả chung
Những bước lặp lại cho đến khi đạt được một sự đồng thuận hoặc nhigraven nhận của đa số
Sự phacircn xử(Arbitration )
Thiacutech hợp nhất khi caacutec thagravenh viecircn của MDM đại diện cho caacutec yếu tố đối lập
Những người tham gia đồng yacute rằng nếu lựa chọn thay thế hai becircn thỏa thuận khocircng được tigravem thấy thigrave một trọng tagravei viecircn becircn ngoagravei sẽ tham gia
Trọng tagravei sau đoacute lựa chọn thay thế ocircng hoặc xeacutet thấy thiacutech hợp nhất
Hệ thống thocircng tin dựa trecircn vấn đề (IBIS)
Lagrave một phương phaacutep lập luận cấu truacutec
Một đại diện cho IBIS lagrave một đồ thị với caacutec nuacutet vagrave caacutec liecircn kết
IBIS bắt đầu với lựa chọn của một nuacutet vấn đề gốc sau đoacute caacutec nuacutet vị triacute khaacutec nhau được liecircn kết với nuacutet gốc
Caacutec nuacutet vị triacute nagravey sau đoacute được đaacutenh giaacute dựa trecircn những lập luận gắn liền với chuacuteng
Nemawashi (được sử dụng rộng ratildei tại Nhật Bản)
1-Một hoặc nhiều thagravenh viecircn của MDM được chỉ định lagrave điều phối viecircnCaacutec điều phối viecircn sau đoacute chọn người tham gia cograven lại
2-Điều phối viecircn xacircy dựng một tổng hợp caacutec sự lựa chọn vagrave sau đoacute caacutec chuyecircn gia đaacutenh giaacute caacutec lựa chọn
3-Điều phối viecircn lựa chọn một sự lựa chọn dựa trecircn kết quả ở trecircn(ở 2)
4-Sự thay thế được luacircn chuyển điều phối viecircn tigravem kiếm sự đồng thuận thocircng qua sự thuyết phục vagrave đagravem phaacuten
5-Nếu đạt được sự đồng thuận điều phối viecircn cho lưu thocircng một tagravei liệu magrave mỗi thagravenh viecircn MDM để lại dấu hiệu trecircn đoacute
55Nơi lagravem việc ảo
Nhiều tổ chức trecircn toagraven thế giới kinh doanh bất động sản cho cocircng nghệ hợp taacutec
Cocircng việc được trở thagravenh một điều bạn lagravem hơn lagrave một nơi bạn đi
Những thay đổi lớn nhất mang lại bởi nơi lagravem việc ảo coacute thể lagrave về văn hoaacute hay xatilde hội hơn lagrave về cocircng nghệ
Chương 6 Hệ thống thocircng tin điều hagravenh
61 Yacute nghĩa của EIS- Hệ thống thocircng tin điều hagravenh
- EIS lagrave một dạng đặc biệt của DSS được thiết kế để hỗ trợ ra quyết định ở cấp cao nhất của một tổ chức
- Lagrave một hệ thống thocircng tin hỗ trợ nhu cầu lập kế hoạch vagrave đaacutenh giaacute của caacutec nhagrave quản lyacute điều hagravenh
- EIS coacute thể giuacutep một CEO coacute được bức tranh tổng thể chiacutenh xaacutec nhất về caacutec hoạt động vagrave một bản toacutem tắt những gigrave magrave đối thủ cạnh tranh đang lagravem
- Caacutec hệ thống nagravey noacutei chung hoạt động dễ dagraveng vagrave trigravenh bagravey thocircng tin theo những caacutech dễ hiểu để việc tiếp thu được nhanh choacuteng (biểu đồ đồ thịhellip)
(Tagravei liệu thecircm EIS lagrave những loại hệ thống lagrave rất phức tạp trong tự nhiecircn Coacute thể noacutei hệ thống nagravey cũng cung cấp cho caacutec nhagrave quản lyacute với caacutec thiết bị coacute khả năng ra quyết định bằng caacutech sử dụng của noacute Hệ thống nagravey hoạt động trong điều kiện như vậy quan trọng như trong caacutec hệ thống khaacutec khocircng hỗ trợ Khả năng lưu trữ dữ liệu nặng lagravem cho noacute lyacute tưởng để được thocircng qua khocircng chỉ bởi caacutec doanh nghiệp lớn magrave cograven bởi caacutec doanh nghiệp nhỏ hơn Nhigraven chung hệ thống nagravey lagrave dagravenh cho caacutec nhacircn viecircn cấp cao hỗ trợ thagravenh thạo trong việc đưa ra caacutec quyết định quan trọng)
Caacutec phiecircn EIS tiecircu biểu- Phiecircn lagravem việc coacute thể bắt đầu với một baacuteo caacuteo về tigravenh higravenh tagravei chiacutenh vagrave kinh
doanh của một cocircng ty caacutec chỉ số hoạt động quan trọng được hiển thị rotilde ragraveng- EIS sẽ cho pheacutep caacutec giaacutem đốc điều hagravenh coacute thể đi sacircu vagraveo dữ liệu từ những con
số bất kỳ magrave noacute hỗ trợ- Việc điều hagravenh coacute thể lựa chọn một mức độ chi tiết ( VD danh số baacuten hagraveng) nếu
như cần điều tra thecircm- Lagrave một phương phaacutep tiếp cận coacute thể giuacutep việc ra quyết định tốt hơn
Những điều magrave EIS ko coacute- EIS khocircng phải lagrave sự thay thế cho caacutec hệ thống dựa trecircn caacutec maacutey tiacutenh khaacutec EIS
thực sự chỉ cung cấp dữ liệu cho caacutec hệ thống nagravey- Noacute khocircng thể biến caacutec bộ hệ điều hagravenh của maacutey tiacutenh thagravenh những ldquochuyecircn viecircn
giỏirdquo- Coacute thể được viacute một caacutech cao hơn như lagrave một trợ lyacute đaacuteng tin cậy coacute thể được gọi
đến bất khi nagraveo vagrave mỗi khi cần thiết
Tagravei liệu thecircm Sự khaacutec nhau giữa EIS vagrave DSS+ EIS thiết kế để hỗ trợ những người điều hagravenh cấp cao giuacutep họ khaacutem phaacute caacutec vấn đề vagrave caacutec cơ hội DSS hỗ trợ những nười phacircn tiacutech cố gắng trả lời cacircu hỏi caacutei gigrave coacute thể lagravem cugraveng với một cơ hội hoặc một vấn đề
Chiều EIS DSSNhững người sử dụng thocircng thường
Duyệt dữ liệu đi xuống truy xuất trạng thaacutei
Hỗ trợ phacircn tiacutech vagrave quyết định
Sự thuacutec đẩy Tiacutenh thiacutech hợp Tiacutenh hiệu quảỨng dụng Queacutet mocirci trường đaacutenh giaacute
hiệu suất nhận dạng caacutec vấn đề vagrave caacutec cơ hội
Caacutec quyết định quản lyacute trecircn caacutec lĩnh vực đa dạng
Hỗ trợ quyết định Caacutec chiacutenh saacutech caacutec quyết định khocircng coacute cấu truacutec ở mức cao vagrave hỗ trợ giaacuten tiếp
Hỗ trợ caacutec quyết định lặp lại caacutec quyết định khocircng thể đoaacuten trước ra quyết định khocircng coacute cấu truacutec vagrave baacuten cấu truacutec
Loại thocircng tin Caacutec thocircng tin tin tức thocircng tin becircn ngoagravei về khaacutech hagraveng đối thủ cạnh tranh mocirci trường caacutec baacuteo caacuteo theo yecircu cầu vagrave định thời về caacutec hoạt động becircn trong
Caacutec thocircng tin hỗ trợ caacutec tigravenh huống đặc biệt
Sử dụng coacute nguyecircn tắc
Dograve theo vết vagrave điều khiển nhận dạng cơ hội
Hoạch định tổ chức phacircn nhoacutem vagrave điều khiển
Khả năng phugrave hợp với những người sử dụng caacute nhacircn
Thiết kế loại ra quyết định cho mỗi người điều hagravenh caacute nhacircn bằng nhiều lựa chọn đầu ra
Cho pheacutep caacutec đaacutenh giaacute caacute nhacircn caacutec khả năng what-if lựa chọn loại hộp hội thoại
Đồ họa Phải coacute Lagrave một phần quan trọng của nhiều DSS
Thacircn thiện người sử dụng
Phải coacute Phải coacute nếu khocircng coacute người sử dụng trung gian
Xử lyacute thocircng tin Lọc neacuten thocircng tin dograve theo vết dữ liệu vagrave thocircng tin quan trọng
EIS kiacutech thiacutech caacutec cacircu hỏi caacutec cacircu trả lời bằng caacutech sử dụng DSS vagrave phản hồi lại EIS
Hỗ trợ caacutec thocircng tin chi tiết
Truy xuất thường xuyecircn caacutec mức chi tiết của bất kỳ thocircng tin tổng hợp nagraveo (duyệt dữ
Coacute thể coacute trong DSS nhưng khocircng thường
liệu chi tiết)Cơ sở mocirc higravenh Caacutec chức năng coacute sẵn bị hạn
chếLagrave điểm cốt lotildei của DSS
Cấu truacutec Theo người baacuten sản phẩm hoặc theo caacutec chuyecircn gia hệ thống thocircng tin
Theo người sử dụng hoặc caacute nhacircn hoặc caacutec chuyecircn gia từ caacutec trung tacircm thocircng tin hoặc phograveng ban hệ thống thocircng tin
Phần cứng Mainframe caacutec trạm RISC mạng LANs hoặc caacutec hệ thống phacircn bố
Mainframe caacutec trạm RISC caacutec maacutey PC hoặc caacutec hệ thống phacircn bố
Bản chất caacutec goacutei phần mềm
Truy xuất tương taacutec dễ dagraveng đến nhiều cơ sở dữ liệu truy xuất trực tuyến caacutec khả năng DBMS phức tạp caacutec liecircn kết phức tạp
Caacutec khả năng tiacutenh toaacuten lớn caacutec ngocircn ngữ mocirc higravenh mocirc phỏng ứng dụng vagrave caacutec bộ tạo DSS
Bản chất caacutec thocircng tin
Trigravenh bagravey thocircng tin được phaacutet sinh trước về quaacute khứ vagrave hiện tại tạo caacutec thocircng tin mới về quaacute khứ hiện tại tương lai
Tạo thocircng tin mới về quaacute khứ hiện tại tương lai
62 Lịch sử EIS- EIS xuất hiện lần đầu tiecircn tại MIT vagraveo những năm 1970
- Những EIS đầu tiecircn được phaacutet triển bởi caacutec doanh ngiệp lớn sẵn sagraveng chấp nhận rủi ro để đạt được lợi thế cạnh tranh
- Vagraveo những năm 1980 caacutec nhagrave cung cấp đatilde phaacutet triển một số cơ sở khaacutech hagraveng rộng vagrave cocircng nghệ EIS được tiếp tục phaacutet triển cho đến ngagravey nay
(Tagravei liệu thecircm Sử dụng DSSEIS cho phaacutet triển bền vững + Một số nghiecircn cứu đatilde được tiến hagravenh để kiểm tra việc thực hiện của EIS trong khu vực cocircng cộng vagrave chiacutenh phủ caacutec nước tổ chức kể từ khi chuacuteng được phaacutet triển theo định hướng lợi nhuận cho caacutec cocircng ty tư nhacircn (Hasan vagrave Hasan năm 1997) Theo một nghiecircn cứu tiến hagravenh tại Mỹ ở hơn 300 cocircng ty kết quả cho thấy sự khaacutec biệt của EIS giữa tư nhacircn vagrave chiacutenh phủ một số kết quả thuacute vị được phaacutet hiệnViacute dụ khoacute khăn hơn để chuyển tiền từ một tagravei khoản khaacutec trong một EIS của chiacutenh phủ cũng lagrave khoacute khăn hơn để biện giải thiacutech cho những chi phiacute phaacutet triển EIS của chiacutenh phủ Một nghiecircn cứu khaacutec được tiến hagravenh ở Australia
cho thấy rằng EIS cung cấp cho quản lyacute một higravenh ảnh chiacutenh xaacutec hơn về tổ chức thực hiện vagrave cung cấp hỗ trợ cho caacutec lợi iacutech chiến lược cải thiện khocircng chỉ cho caacutec nhagrave quản lyacute nhưng cograven cho phần cograven lại của tổ chức Dựa trecircn caacutec hệ thống được thiết kế cho caacutec cocircng ty tư nhacircn với một caacutech rotilde ragravengxaacutec định mục tiecircu EIS lagrave thiacutech hợp cho caacutec tổ chức cocircng cộng hiện đại nhưng cần phải được linh hoạt hơn vagrave kết thagravenh chugravem một phạm vi rộng hơn khả năng vagrave phương tiện hơn so với khu vực tư nhacircn ban đầu theo định hướng sản phẩm (Hasan vagrave Hasan năm 1997) Điều nagravey coacute thể lagrave do thực tế rằng caacutec hoạt động khu vực cocircng lagrave bắt buộc coacute taacutec động rộng phải đaacutep ứng sự mong đợi duy nhất cocircng cộng thường coacute mục tiecircu mơ hồ vagrave macircu thuẫn iacutet quyền tự chủ vagrave kiểm soaacutet việc ra quyết định vagrave nhacircn viecircn lagrave khoacute khăn hơn (Watson vagrave Carte2000) + Toacutem lại EIS lagrave một khaacutei niệm thagravenh cocircng noacute phaacutet triển qua nhiều năm tuy nhiecircn EIS khắc phục khiếm khuyết của migravenh bằng caacutech tiến hagravenh nghiecircn cứu liecircn tục)
63 Tại sao những người điều hagravenh hagraveng đầu lại khaacutec nhau- Họ lagrave những doanh nghiệp theo định hướng coacute suy nghĩ
- Coacute một khoảng khocircng gian rộng để kiểm soaacutet
- Họ chịu traacutech nhiệm cho việc thiết lập chiacutenh saacutech
- Họ đại diện cho tổ chức mocirci trường becircn ngoagravei
- Hagravenh động của họ tạo ra những kết quả đaacuteng kể về tagravei chiacutenh vagrave con người
Tần số caacutec hoạt động điều hagravenh- Xử lyacute xaacuteo trộn 42
- Hoạt động kinh doanh 32
- Phacircn bổ nguồn lực 17
- Đagravem phaacuten 3
- Những điều khaacutec 6
Handling Disturbances 42
Entrepreneurial Activites 32
Resource Allocation 17
Negotiation 3
Other 6
Những thocircng tin điều hagravenh cần thiết- Quản lyacute xaacuteo trộn coacute thể yecircu cầu sự chuacute yacute xung quanh đồng hồ
- Hoạt động kinh doanh yecircu cầu điều hagravenh để dự đoaacuten những thay đổi trong mocirci trường
- Nhiệm vụ phacircn bổ tagravei nguyecircn yecircu cầu lựa chọn người quản lyacute vagrave caacutec nguồn lực hạn chế được triển khai
- Đagravem phaacuten yecircu cầu cập nhật thocircng tin từng phuacutet để coacute thể xacircy dựng được sự đồng thuận
Caacutec loại thocircng tin điều hagravenh- Hệ thống kế toaacuten coacute liecircn quan đến việc tiacutenh toaacuten thu nhập hoạt động cho caacutec lĩnh
vực cụ thể lagrave quan trọng hơn so với caacutec hệ thống kế toaacuten truyền thocircng- Thocircng tin về thị trường khaacutech hagraveng cung cấp giaacute trị trong việc quyết định chiến
lược- Caacutec thocircng tin cần thiết thường được truyền đi trecircn một số hệ thống maacutey tiacutenh vagrave
nằm trong toagraven tổ chức- Caacutec thocircng tin được sử dụng thường lagrave ngắn hạn vagrave dễ thay đổi
Phương thức để xaacutec định thocircng tin cần thiết
Rockart xaacutec định được năm phương thức cơ bản để xaacutec định thocircng tin cần thiết
- Phương thức dựa trecircn kết quả- Phương thức rỗng- Phương thức chỉ số khoacutea- Phương thức tổng hợp nghiecircn cứu- Phương thức dựa vagraveo nhacircn tố then chốt dẫn đến thagravenh cocircng
64 Thagravenh phần EIS
- Sản phẩm EIS đầu tiecircn được phaacutet triển để sử dụng trecircn maacutey tiacutenh cấu higravenh cao nhưng caacutec sản phẩm hiện nay nhằm mục tiecircu lagrave nền tảng ClientServer
- Những nền tảng linh hoạt hơn coacute thể thiacutech ứng với thay đổi trong tổ chức vagrave cocircng nghệ
- Sử dụng dữ liệu thời gian thực dẫn đến quyết định nhanh hơn nhiều thocircng tin hơn
Thagravenh phần phần cứng- Một EIS khocircng đogravei hỏi coacute phần cứng cụ thể hoặc duy nhất nagraveo- Chigravea khoacutea của vấn đề lagrave để đảm bảo rằng caacutec thagravenh phần của EIS tối ưu hoacutea vagrave
phugrave hợp với tagravei nguyecircn maacutey tiacutenh của tổ chức- Hệ thống nagravey phải được cấu higravenh để caacutec nguồn tagravei nguyecircn phugrave hợp với những
người điều hagravenh chuacuteng
Thagravenh phần phần mềm- Traacutei ngược với phần cứng phần mềm thường được chuyecircn mocircn hoacutea cao cho caacutec
bagravei toaacuten về miền- Sự chuyecircn mocircn hoacutea nagravey thường đạt được bằng caacutech sử dụng thagravenh phần off-the-
shelf cho toagraven bộ EIS vagrave caacutec mocirc-đun tugravey chỉnh để đaacutep ứng nhu cầu cụ thể- Lotus Notes lagrave một viacute dụ điển higravenh Noacute coacute thể được sử dụng một migravenh hoặc coacute
thể phục vụ becircn thứ ba mocirc-đun plug-in
Cocircng nghệ EIS hiện nay
Dobrzeniecki đề xuấtphacircn loạitừng cấptheo bachức năng- Loại 1 sản phẩm bao gồmmột bộ đầy đủcaacutec ứng dụngtừ mộtnhagrave cung cấp- Loại 2 sản phẩm đượcthựchiệnở phần đầu củacaacutecsản phẩmDSS đượcphaacutet triển
bởicugravengmộtnhagrave cung cấp- Loại 3 sản phẩmkết hợp với nhautheo bất kỳ số lượngthuộc sở hữu củacocircng ty
65 Xacircy dựng EIS
- Xacircy dựngmộtEISgiống nhưxacircydựngmột số hệ thống khaacutec củamocirc higravenh hệ thống thocircng tin
- Việcphaacutet triểncấu truacutecnecircn được theo dotildeitừ quaacute trigravenh thiết kế đến quaacute trigravenhthực hiện
- Tuy nhiecircn một dự aacuten phaacutet triển EIScoacute xu hướnglagrave thống nhấtvagraveyecircu cầu hỗ trợ caacutec nhagrave quản lyacute latildenh đạo
- Xacircy dựng một EIScoacute thểphaacutet hiện ra đượccaacutectigravenh huống khoacute khănmagravemột nhagrave phaacutet triển chưabao giờ gặp phải
Mocirc higravenh EIS
Khung phaacutet triển một EIS
- Watson et al đề nghị xacircy dựngkhung với ba thagravenh phần+ Caacutech tiếp cận tập trung vagraveo yếu tốcon người vagrave dữ liệu coacute liecircn quan đến EIS+ Quaacute trigravenh phaacutet triển cần sự linh hoạt vagrave tương taacutec+ Người sử dụng - hệ thống hộp thoại bao gồm một ngocircn ngữ hagravenh động để xử lyacute caacutec lệnh
Lợi iacutech của EIS- Dễ duy trigrave caacutec mục tiecircu coacute tổ chức- Dễ truy xuất thocircng tin- Cho pheacutep người sử dụng nacircng cao hiệu suất hơn
- Tăng chất lượng ra quyết định- Cung cấp sự cải tiến cạnh tranh- Tiết kiệm thời gian của người sử dụng- Tăng khả năng vagrave chất lượng giao tiếp- Cung cấp khả năng điều khiển tốt hơn trong tổ chức- Cho pheacutep tham gia caacutec vấn đề vagrave caacutec cơ hội- Cho pheacutep hoạch định- Cho pheacutep tigravem kiếm nguyecircn nhacircn của một vấn đề- Thảo matilden caacutec yecircu cầu của người điều hagravenh
Hạn chế của EIS vagrave 1 số sai lầm cần traacutenh
- Chi phiacute một cuộc khảo saacutetnăm1991 chothấychi phiacute phaacutet triểntrungbigravenh365000USDvớichi phiacute vận hagravenhhagraveng năm lagrave$200000 (EIS)
- Cocircng nghệ hạn chếEIScần phảiđượctiacutech hợp hoagraven toagravenvagraveokiếntruacuteccủadoanh nghiệphiện tại do đoacute noacutelagrave một thaacutech thứclớn đối vớithiết kế
- Hạn chế tổ chức cơ cấu tổ chứccoacute thể khocircng phugrave hợp
Sự hạn chế về tổ chức- Chương trigravenh nghị sự vagrave thời gian chệch EIS mocirc tả một phần việc thực hiện một
chương trigravenh nghị sự vagrave coacute thể dễ dagraveng đạt được sự tin cậy một caacutech chắc chắn- Đồng bộ hoacutea việc quản lyacute sự tin cậy đuacuteng luacutec đặc biệt baacuteo caacuteo EIS coacute thể phaacute
vỡ sự ổn định thiết lập caacutec chu trigravenh baacuteo caacuteo một caacutech tốt nhất- Sự bất ổn EIS phản ứng nhanh coacute thể gacircy ra việc taacutec động trở lại một caacutech
nhanh choacuteng dẫn đến sự thiếu ổn định trong tổ chức
Sự thất bại lagrave thay thế khocircng thể chấp nhận được- Một số yếu tố lagravem EIS thất bại
+ Thiếu sự hỗ trợ về mặt quản lyacute+ Vấn đề chiacutenh trị+ Thất bại của nhagrave phaacutet triển+ Lỗi về cocircng nghệ+ Giaacute cả+ Thời gian
66 Ra quyết định điều hagravenh trong tương lai vagrave EIS
- Coacute một vagravei điều kiện sẽ được hợp nhất cho việc chuyển đổi cocircng nghệ Trong đoacute một vagravei điều kiện coacute thể dễ dự đoaacuten Hai điều kiện magrave ta coacute thể thấy lagrave+ Phaacutet triển cocircng nghệ maacutey tiacutenh trong việc điều hagravenh sẽ tạo ra sự chuyển đổi được chấp nhận một caacutech dễ dagraveng hơn+ Mở rộng traacutech nhiệm điều hagravenh sẽ mở rộng nhu cầu thocircng tin
Tương lai của EIS- EIS thocircng minh Những tiến bộ trong cocircng nghệ AI sẽ được triển khai trong caacutec
EIS- EIS đa phương tiện Cơ sở dữ liệu đa phương tiện sẽ cho pheacutep tiacutech hợp văn bản
giọng noacutei vagrave higravenh ảnh trong tương lai- EIS thocircng tin Tương lai EIS sẽ mở rộng hơn trong việc sử dụng dữ liệu becircn
ngoagravei doanh nghiệp- EIS kết nối Giao tiếp với băng thocircng rộng cho pheacutep kết nối liecircn thocircng lớn hơn
Chương 7 HỆ CHUYEcircN GIA VAgrave TRIacute TUỆ NHAcircN TẠO
71 Caacutec khaacutei niệm
72 Triacute thocircng minh của triacute tuệ nhacircn tạo
73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia
74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia
75 Lợi iacutech vagrave hạn chế của hệ chuyecircn gia
71 Caacutec khaacutei niệm
Chuyecircn mocircn (Expertise) sự hiểu biết rộng trong 1 lĩnh vực hẹp
Hệ chuyecircn gia (Expert Systems)1 chương trigravenh maacutey tiacutenh sử dụng 1 tập caacutec luật dựa trecircn tri thức của con người để giải quyết caacutec vấn đề đogravei hogravei phải coacute sự chuyecircn mocircn
Một số hệ chuyecircn gia nổi tiếng
DENDRAL (Standford 1960s Edward Feigenbaum)
MYCIN (Standford1970s Edward Shortliffe)
PROSPECTOR (MIT 1979)
Triacute tuệ nhacircn tạo (Artificial Intelligence ndash AI)
Triacute tuệ nhacircn tạo một bộ phacircn của ngagravenh khoa học maacutey tiacutenh quan tacircm đến việc thiết kế caacutec hệ thống maacutey tiacutenh thocircng minh đoacute lagrave caacutec hệ thống đưa ra caacutec đặc điểm magrave từ đoacute chuacuteng ta liecircn hệ với sự thocircng minh trong hagravenh động của con người (Barr vagrave Feigenbaum 1981)
Mục điacutech của AI
Mục điacutech khoa học xaacutec định caacutec gợi yacute để giải thiacutech caacutec loại khaacutec nhau của triacute tuệ thực
Mục điacutech kỹ thuật giải quyết caacutec vấn đề trong thế giới thực
Triacute tuệ nhacircn tạo kế thừa nhiều yacute tưởng quan điểm kỹ thuật từ caacutec ngagravenh khoa học khaacutec
- Triết học
- Logic Toaacuten học
- Tiacutenh toaacuten
- Khoa học tacircm lyacute Khoa học nhận thức
- Sinh học Thần kinh học
- Tiến hoacutea
Caacutec lĩnh vực ứng dụng trong Triacute tuệ nhacircn tạo
Mạng nơ ron thần kinh (Neural Networks)
Tiacutenh toaacuten sự tiến hoacutea
(Evolutionary Computation)
Hệ chuyecircn gia (Expert Systems)
Kỹ thuật xử lyacute tiếng noacutei (Speech Processing)
Kỹ thuật xử lyacute ngocircn ngữ tự nhiecircn
(Natural Language Processing)
Lập kế hoạch (Planning)
Robot (Robotics)
Khoa học higravenh ảnh (Vision)
Caacutec kỹ thuật thocircng dụng dugraveng trong AI
Biểu diễn(Representation)
Học (Learning)
Caacutec luật (Rules)
Tigravem kiếm (Search)
72 Triacute thocircng minh của triacute tuệ nhacircn tạo
Con người suy diễn như thế nagraveo
Phacircn loại (Categorization)
Caacutec quy tắc cụ thể
Heuristics
Kinh nghiệm trước đoacute
Dự tiacutenh trước
Maacutey tiacutenh suy diễn như thế nagraveo
Lập luận dựa trecircn luật IF-THEN mocirc tả tri thức được matilde hoacutea dưới dạng caacutec luật
Caacutec khung (Frames) lagrave caacutec đại diện mocirc tả caacutec tigravenh huống giống nhau lagrave điển higravenh của một vagravei phacircn loại
Lập luận dựa trecircn caacutec trường hợp mocirc phỏng giải phaacutep trước đoacute cho một vấn đề hiện tại
Nhận dạng mẫu phaacutet hiện acircm thanh higravenh dạng hoặc caacutec chuỗi dagravei
Caacutec dạng khaacutec của Triacute tuệ nhacircn tạo
Học maacutey- mạng nơron vagrave giải thuật di truyền
Lập trigravenh tự động ndash lagrave những kỹ thuật tạo ra caacutec chương trigravenh để lagravem 1 nhiệm vụ riecircng biệt (cho pheacutep những người khocircng phải lagrave người lập trigravenh coacute thể lập trigravenh được)
Cuộc sống nhacircn tạo ndash nỗ lực để taacutei tạo caacutec hiện tượng sinh học trong caacutec hệ thống dựa trecircn maacutey tiacutenh
73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia(Expert Systems- ES)
Theo Jackson (1999) Một hệ chuyecircn gia lagrave một chương trigravenh maacutey tiacutenh mocirc tả vagrave suy diễn với tri thức của một vagravei lĩnh vực để giải quyết vấn đề hay đưa ra caacutec lời khuyecircn
Cấu truacutec cơ bản của ES được dựa theo cấu truacutec chung của DSS Sự khaacutec biệt chiacutenh giữa ES vagraveDSS lagrave hệ ES thu thập caacutec kiến thức từ những
chuyecircn gia trong lĩnh vực quan tacircmĐặc trưng của hệ chuyecircn gia Hiệu quả cao Thời gian trả lời thỏa đaacuteng Độ tin cậy cao Dễ hiểu
Giao diện người dugraveng trong ES
Thiết kế giao diện người dugraveng tập trung vagraveo caacutec yếu tố như dễ dagraveng sử dụngcoacute độ tin cậy cao giảm tải những khoacute khăn khi sử dụng
Thiết kế necircn coacute một số tương taacutec (đầu vagraveo kiểm soaacutet vagrave truy vấn)
Cấu tạo giao diện người dugraveng gồm coacute magraven higravenh cảm ứng bagraven phiacutem buacutet saacuteng lệnh thoại caacutec phiacutem chuyecircn dụng
Cơ sở tri thức (Knowledge Base)
Chứa đựng caacutec tri thức cụ thể miền thu được từ caacutec chuyecircn gia miền
Coacute thể chứa caacutec mocirc tả caacutec hagravenh vi giải quyết vấn đề caacutec ragraveng buộc caacutec heuristics
Thagravenh cocircng của một ES dựa trecircn tiacutenh đầy đủ vagrave tiacutenh chiacutenh xaacutec của cơ sở tri thức
Mocirc tơ suy diễn (Inference Engine)
Ở đacircy tri thức được đặt để sử dụng tạo ra caacutec giải phaacutep để giải quyết vấn đề
Mocirc tơ nagravey coacute khả năng thực hiện diễn dịch hoặc suy diễn dựa trecircn caacutec luật hay caacutec caacutec sự kiện
Đồng thời cũng coacute khả năng sử dụng caacutec suy diễn mờ hay khocircng chiacutenh xaacutec dựa trecircn xaacutec suất hay aacutenh xạ mẫu
Vograveng điều khiển suy diễn
1 Aacutenh xạ caacutec luật với caacutec sự kiện đatilde được cho
2 Chọn luật để thực hiện
3 Thực hiện luật bằng caacutech thecircm caacutec sự kiện được suy diễn ra vagraveo bộ nhớ lagravem việc
Chuỗi suy diễn (Chaining)
Suy diễn tiến (forward chaining) maacutey suy diễn bắt đầu từ dữ liệu ban đầu vagrave thực hiện việc suy luận để đưa ra caacutec kết luận cuối cugraveng
Suy diễn lugravei (backward chaining) maacutey suy diễn bắt đầu từ dữ liệu điacutech vagrave tigravem ra tri thức hỗ trợ cho dữ liệu điacutech đoacute
Viacute dụ suy diễn lugravei
R1 Nếu coacute A vagrave B thigrave suy ra coacute D
R2 Nếu coacute B thigrave suy ra coacute C
R3 Nếu coacute C vagrave D thigrave suy ra coacute E
Ta coacute E ta xem trong 3 luật R1 R2 R3 luật nagraveo coacute E ta thấy R3 chứa E đồng thời chứa C vagrave D Xeacutet tiếp trong 2 luật R1 R2 luật nagraveo chứa C vagrave D R2 chứa C R3 chứa D Từ đoacute ta coacute được caacutec tri thức hỗ trợ suy diễn vagrave kết luận lagrave nếu coacute A vagrave B thigrave sẽ coacute E Hay nếu A vagrave B đuacuteng thigrave sẽ coacute E
Viacute dụ suy diễn tiến
Giả sử coacute tập chứa 3 luật sau
R1 Nếu coacute A vagrave B thigrave suy ra coacute D
R2 Nếu coacute B thigrave suy ra coacute C
R3 Nếu coacute C vagrave D thigrave suy ra coacute E
Nếu ta coacute A vagrave B thigrave chuacuteng ta suy ra được D từ R1 vagrave suy ra C từ R2 Với D vagrave C đatilde được suy ra ở trecircn giờ chuacuteng ta suy ra được E từ R3
Viacute dụ thực tế
Giả sử muốn biết magraveu của một con vật nuocirci tecircn lagrave Fred biết rằng noacute kecircu ộp ộp vagrave ăn ruồi
Coacute tập 4 luật ban đầu như sau
R1 Nếu X kecircu ộp ộp vagrave ăn ruồi thigrave X lagrave con ếch
R2 Nếu X kecircu chiecircm chiếp vagrave biết hoacutet thigrave X lagrave con chim
R3 Nếu X lagrave con ếch thigrave X coacute magraveu xanh
R4 Nếu X lagrave con chim thigrave X coacute magraveu vagraveng
74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia
Expert system shells lagrave một tập caacutec goacutei phần mềm vagrave caacutec cocircng cụ dugraveng để phaacutet triển caacutec hệ chuyecircn gia
Những Expert system shells đầu tiecircn thường rất rườm ragrave Mặc dugrave vậy noacute vẫn giuacutep cho người sử dụng sẽ khocircng phải bắt đầu lại từ đầu khi xacircy dựng một hệ chuyecircn gia mới
Những shell hiện đại bao gồm hai mocirc-đun chiacutenh lagrave cocircng cụ xacircy dựng một tập quy tắc vagrave mocirc tơ suy diễn
Xacircy dựng hệ chuyecircn gia
Bước 1 xacircy dựng mocirc higravenh bagravei toaacuten xaacutec định vấn đề nhiệm vụ magrave hệ thống sẽ thực hiện Caacutec dạng bagravei toaacuten cần hệ chuyecircn gia
Bagravei toaacuten diễn giải (InterPretation)
Bagravei toaacuten dự baacuteo (Prediction)
Bagravei toaacuten chuẩn đoaacuten (Diagnose)
Bagravei toaacuten gỡ rối (Debugging)
Bagravei toaacuten thiết kế
Tương tự như một dự aacuten phần mềm để xacircy dựng một hệ chuyecircn gia cần phải coacute caacutec yếu tố về nhacircn lực tagravei nguyecircn vagrave thời gian Những yếu tố nagravey ảnh hưởng đến giaacute thah của một hệ chuyecircn giaTrong phần nagravey cacircu hỏi thường được đặt ra lagrave tại sao cần phải xacircy dựng một hệ chuyecircn giaTrước khi bắt đầu phải xaacute định rotilde bagravei toaacuten đạt ra lagrave jiAi lagrave chuyecircn giaAi lagrave người sử dụng
1 Diễn giải (InterPretation) Nghiecircn cứu 1 vấn đề -gt Dựa trecircn những biểu hiện thuộc tiacutenh đặc trưng becircn ngoagravei -gt Tư vấn
(hoặc đưa ra kết luận hay mocirc tả dễ hiểu từ tập dữ liệu thocirc)
2 Bagravei toaacuten dự baacuteo (Prediction) Coacute thể dự đoaacuten được hagravenh vi kết quả dựa trecircn caacutec hiện tượng -gt dự baacuteo
VD Dự baacuteo thời tiết động đấthellip
3 Bagravei toaacuten chẩn đoaacuten (Diagnoss) Xaacutec định caacutec lỗi caacutec bộ phận hỏng hoacutec của hệ thống dựa trecircn caacutec dữ liệu quan saacutet được
4 Bagravei toaacuten gỡ rối (Debugging) Mocirc tả caacutec phương phaacutep khắc phục hệ thống khi gặp sự cố
5 Bagravei toaacuten thiết kế Lựa chọn cấu higravenh caacutec đối tượng nhằm thoả matilden một số ragraveng buộc nagraveo đoacute
6 Giảng dạy Phần mềm dạy học coacute thể chuẩn đoaacuten vagrave sủa lỗi của học sinh trong quaacute trigravenh học tập
Để xaacutec định đuacuteng bagravei toaacuten magrave chuacuteng ta cần giải quyết thigrave phải trả lời đc một số cacircu hỏi
- cần hệ chuyecircn gia
Bước 2 thu thập tri thức lựa chọn cocircng cụ vagrave aacutep dụng
Trong bước thu thập tri thức vấn đề quan trọng lagrave lựa chọn chuyecircn gia những người magrave sẽ đoacuteng goacutep tri thức cho hệ thống Thocircng thường trong suốt quaacute trigravenh phaacutet triển thigrave chuyecircn gia được xem như một thagravenh viecircn của đội phaacutet triển
Hiện nay coacute rất nhiều cocircng cụ để xacircy dựng một hệ chuyecircn gia Phổ biến nhất lagrave JESS CLIPS vagrave OPS5
Bước 3 Thiết kế cơ sở tri thức thiết kế hệ thốngTri thức được biểu diễn trường minh trong cơ sở tri thức
Caacutec chuyecircn gia vagrave kỹ sư tri thức sẽ đối thoại với nhau bằng caacutec kỹ thuật đối thoại Suy diễn (SD) bảng Mocirc higravenh hoacutea SD quy nạp phacircn loại
Vấn đề bagraveo trigrave vagrave phaacutet triển
Caacutec hệ chuyecircn gia đogravei hỏi phải bảo trigrave vagrave phaacutet triển nhiều hơn so với caacutec hệ thống khaacutec Phải thường xuyecircn bổ sung tri thức mới vagrave thay đổi caacutec tri thức cũ để đổi mới hệ chuyecircn gia
Thu thập vagrave khắc phục lỗi do người sử dụng phaacutet hiện để kịp thời khắc phục những sai soacutet của hệ chuyecircn gia
75 Lợi iacutech vagrave hạn chế của caacutec hệ chuyecircn gia
Một số lợi iacutech chiacutenh
Thời gian trả lời hợp lyacute bằng hoặc nhanh hơn so với chuyecircn gia (người) để đi đến cugraveng một quyết định Hệ chuyecircn gia lagrave một hệ thống thời gian thực (real time system)
Khả năng trả lời với mức độ tinh thocircng bằng hoặc cao hơn so với chuyecircn gia (người) trong cugraveng lĩnh vực
Hệ chuyecircn gia giuacutep cho hiệu quả lagravem việc tăng bằng việc sử dụng tập caacutec luật một caacutech nhanh choacuteng magrave ko bị nhầm lẫn chuyecircn gia lagrave người coacute thể quecircn đi một số tri thức cơ sở lyacute luậ nhưng HCG thigrave ko
Quyết định của một người chuyecircn gia coacute thể bị thay đổi vagrave ko coacute tiacutenh thống nhất như quyết định của một hệ chuyecircn gia tạo ra
Hệ chuyecircn gia giuacutep cho người sử dụng coacute thể trau dồi sự hiểu biết trecircn lĩnh vuej cụ thể magrave noacute giải quyết hỗ trợ người ra quyết định coacute trigravenh độ như 1 chuyecircn gia trong quaacute trigravenh gia quyết định
Kiến thức của rất nhiều chuyecircn gia về một lĩnh vực nagraveo đoacute được đưa vagraveo hệ chuyecircn gia lagravem cho CSTT cuat HCG phong phuacute vagrave rộng lớn hơn rất nhiều
HCG giải thiacutech caacutec bước suy luận một caacutech dễ hiểu nhất quaacuten luacutec nagraveo cũng coacute thể sử dụng ko như chuyecircn gia con người
Hạn chế của caacutec hệ chuyecircn gia
Nhược điểm lớn nhất của hệ chuyecircn gia lagrave những yacute kiến chuyecircn mocircn thường rất khoacute matilde hoacutea vagrave giải neacuten
Hệ chuyecircn gia khocircng coacute khả năng tự học tự cập nhật kiến thức mới như caacutec chuyecircn gia magrave cần phải được matilde hoacutea lại khi noacute được cập nhật
Hệ chuyecircn gia khocircng thể nhận ra được vấn đề khocircng nằm trong miền kiến thức của hệ thống
Chương 8 Tri thức vagrave tiếp nhận
1 Bao gồm caacutec vấn đề
Dữ liệu thực tế đo lường hoặc quan saacutet coacute hoặc khocircng coacute bối cảnh
Thocircng tin dữ liệu được tổng hợp một caacutech hữu iacutech để giải quyết những khoacute khăn trong việc đưa ra quyết định
Tri thức bao gồm caacutec ứng dụng quy tắc thocircng tin hướng dẫn của người ra quyết định
2 Những caacutei nhigraven về tri thức
Đại diện lagravem thế nagraveo để diễn tả tri thức viacute dụ như một quyển saacutech khocircng phải lagrave tri thức nhưng noacute lại lagrave một đại diện của tri thức
Sản xuất tri thức lagrave một tập hơp của hagraveng tồn kho coacute thể được sản xuất cũng như mua lại
Tri thức lagrave 1 trong 6 trạng thaacutei của hệ thống
1Dữ liệu 2Thocircng tin 3Cấu truacutec thocircng tin 4Sự thấu hiểu 5Yacute kiến 6 Quyết định
3 Caacutec loại tri thức Phổ biến mocirc tả dữ liệu thocircng tin thủ tục mọi thứ lagravem như thế nagraveo lập luận chiacutenh saacutech hoặc caacutec quy tắc
4 Thu thập Tri thức hệ chuyecircn gia Hầu hết caacutec phương phaacutep đều bắt đầu với mocirc higravenh của caacutec taacutec vụ trong đoacute
hệ chuyecircn gia được xacircy dựng Trong đoacute mocirc tả về caacutec lĩnh vực được tạo ra Caacutec kỹ sư sử dụng caacutec mocirc higravenh giả thuyết vagrave nhận thức về quaacute trigravenh phacircn
tiacutech để gợi ra caacutech giải quyết vấn đề về tri thức từ caacutec chuyecircn gia
5 Caacutec chiều của thu thập tri thức KE- driven caacutec kỹ sư trao đổi trực tiếp với caacutec chuyecircn gia Expert-driven Caacutec chuyecircn gia trực tiếp đưa chuyecircn mocircn của họ vagraveo hệ
thống maacutey tiacutenh Machine-driven Sử dụng caacutec cocircng cụ suy luận để triacutech xuất tri thức từ một
tập caacutec viacute dụ
6 Kỹ thuật thu thập tri thức Trao đổi gồm 2 loại cơ bản lagrave coacute cấu truacutec(coacute kịch bản) vagrave khocircng coacute cấu
truacutec( đối thoại trực tiếp) Giao thức phacircn tiacutech bằng lời Khi caacutec chuyecircn gia thực hiện một cocircng việc
của họ thigrave một bản ghi về cocircng việc đoacute được thực hiện Caacutec kỹ sư sẽ xacircy dựng mocirc higravenh cho những gigrave được ghi lại trong bản ghi
Phương phaacutep sagraveng lọc caacutec chuyecircn gia so saacutenh caacutec nhoacutem liecircn tiếp trong ba đối tượng vagrave cho biết tại sao nhoacutem thứ hai lại khaacutec nhoacutem thứ ba
7 Thu thập tri thức từ nhiều nguồn Thu thập tri thức từ nhiều nguồn lagrave cần thiết để coacute được đầy đủ caacutec tri thức
cho một vấn đề quan điểm yacute kiến traacutei ngược nhau thường phaacutet sinh Phương phaacutep đồng thuận sẽ giuacutep giải quyết được vấn đề macircu thuẫn Kỹ thuật phacircn tiacutech Meta lagrave kỹ thuật được aacutep dụng trong caacutec trường hợp
khaacutec Caacutech tiếp cận bằng định lượng đogravei hỏi caacutec kỹ sư cần cacircn nhắc yếu tố đầu vagraveo của caacutec chuyecircn gia khaacutec nhau
8 Xaacutec nhận hợp lệ vagrave kiểm tra tri thức Một khi thu thập tri thức noacute phải được đaacutenh giaacute về khả năng sử dụng vagrave độ
chiacutenh xaacutec Hai vấn đề cụ thể lagrave hiệu lực của những kiến thức vagrave kiểm tra việc xacircy dựng cơ sở của tri thức
Cần xaacutec nhận xem liệu hệ thống coacute thể hoạt động ở mức độ tối thiểu khocircng
Xaacutec minh liecircn quan đến việc so saacutenh từng chi tiết kỹ thuật của hệ thống những gigrave đatilde được thực hiện cuối cugraveng
9 Một số caacutec biện phaacutep xaacutec nhận Độ chiacutenh xaacutec Khả năng thiacutech nghi Mức độ đầy đủ Bề rộng Độ sacircu Hiệu lực Tổng quan Chiacutenh xaacutec Hiện thực Độ tin cậy Tiacutenh hữu dụng Mức độ
Chương 9 Học maacutey
1 Logic mờ vagrave ngocircn ngữ mờ(Fuzzy Logic and Linguistic Ambiguity)
Ngocircn ngữ tự nhiecircn gồm những khaacutei niệm mơ hồ vagrave khocircng chiacutenh xaacutectruyền tải ngữ nghĩa thocircng qua tiacutenh xấp xỉkhocircng rotilde ragraveng
Những xấp xỉ nagravey giuacutep con người coacute thể truyền tải hết được yacute nghĩa nhưng maacutey thigrave khocircng hiểu
Lagravem sao biểu diễn caacutec tri thức sử dụng caacutec khaacutei niệm khocircng rotilde ragraveng(mờ) hoặc khocircng chiacutenh xaacutec
2 Khaacutei niệm cơ bản của logic mờ tập mờ lagrave những tập hợp khocircng coacute một giới hạn rotilde Mỗi phần tử của noacute chỉ
chứa một mức độ hagravem liecircn thuộc của từng phần tử Vigrave vậy tập mờ khocircng giống như tập cổ điển Tập mờ coacute thể kết hợp với nhau qua những luật mờ magrave đặc trưng cho những hagravenh động trạng thaacutei vagrave thuộc tiacutenh của logic mờ được tận dụng khi thực hiện một bộ điều khiển mờ
Logic mờ dựa trecircn yacute tưởng mỗi phần tử thuộc vagraveo một tập hợp ở một mức độ nagraveo đấy
Locircgic mờ cho pheacutep độ liecircn thuộc (microA )coacute giaacute trị trong khoảng (01) Locircgic mờ coacute thể được coi lagrave mặt ứng dụng của lyacute thuyết tập mờ để xử lyacute caacutec
giaacute trị trong thế giới thực cho caacutec bagravei toaacuten phức tạp
3 So saacutenh tiacutenh đuacuteng đắn logic mờ vagrave xaacutec suất Xaacutec suất thigrave đề cập đến khả năng xảy ra một biến cố hay một điều gigrave đoacute Logic mờ đề cập đến cấp độ magrave đặc tiacutenh ở hiện tại
o viacute dụ1 người coacute chiều cao 6 feet thigrave coacute cấp độ lagrave 05 về chiều cao
4 Ưu điểm của logic mờ Caacutech tiếp cận rất tự nhiecircnkhocircng phức tạp Coacute thể mocirc higravenh hoacutea caacutec hagravem phi tuyến tugravey yacute phức tạp
Coacute thể tận dụng được kinh nghiệm từ những chuyecircn gia hagraveng đầu trong mọi lĩnh vực
Logic mờ được xacircy dựng dựa trecircn ngocircn ngữ tự nhiecircnNền tảng của logic mờ lagrave dựa trecircn cơ sở giao tiếp của con người
5 Nhược điểm của logic mờ Trong 1 hệ thống phức tạpsử dụng logic mờ coacute thể trở thagravenh trở ngại cho
việc xaacutec thực độ tin cậy của hệ thống Cơ chế lập luận mờ khocircng thể học hỏi từ những lỗi sai
6 Mạng noron nhacircn tạo(ANN) Mạng noron nhacircn tạo lagrave một mocirc phỏng xử lyacute thocircng tinđược nghiecircn cứu ra
từ hệ thống thần kinh của sinh vậtgiống như bộ natildeo để xử lyacute thocircng tin ANNs lagrave chương trigravenh dựa trecircn maacutey tiacutenh đơn giản coacute chức năng lagrave một mocirc
higravenh bagravei toaacuten khocircng gian dựa trecircn thử nghiệm vagrave baacuteo lỗi
7 Học từ kinh nghiệm Tiến trigravenh Một mẫu dữ liệu được biểu diễn như một mạng lưới noronANN ldquodự
đoaacutenrdquo 1 đầu radự đoaacuten được so saacutenh với giaacute trị thực tế hoặc giaacute trị chiacutenh xaacutecNếu đoaacuten được chiacutenh xaacutec thigrave khocircng coacute hagravenh động nagraveo được thực hiện
Nếu dự đoaacuten sai ANN kiểm tra lại vagrave xaacutec định lại thocircng số để điều chỉnh Một mẫu dữ liệu khaacutec được biểu diễn vagrave quaacute trigravenh nagravey được lặp lại
8 Nguyecircn tắc cơ bản của cocircng nghệ nơron Caacutec yếu tố xử lyacute cơ bản trong hệ thống thần kinh của con người lagrave tế bagraveo
thần kinhMạng lưới của tế bagraveo nagravey lagrave liecircn kết với nhau nhận được thocircng tin từ caacutec cảm biến trong mắt taihellip
Thocircng tin nhận được bởi tế bagraveo thần kinh hoặc lagrave sẽ kiacutech thiacutech noacute(sẽ được chuyển qua 1 thocircng điệp dọc theo mạng lưới) hoặc lagrave sẽ ngăn cản noacute(ngăn cản dograveng thocircng tin)
Độ nhạy coacute thể thay đổi qua thời gian hoặc sau khi coacute được kinh nghiệm
9 Cấu truacutec mạng Một ANN gồm 3 lớp cơ bản
Lớp đầu vagraveo nhận dữ liệu Lớp becircn trong hoặc lagrave lớp ẩn xử lyacute dữ liệu Lớp đầu ra chuyển tiếp kết quả cuối cugraveng của mạng
10Mạng nơ ron Thường coacute nhiều đầu vagraveo mỗi đầu vagraveo với mức ảnh hưởng vagrave tầm quan
trọng riecircng của noacute Một đầu vagraveo quan trọng coacute thể được sử dụng để khuếch đại đầu ra caacutec hagravem trạng thaacutei tổng hợp caacutec trọng số của caacutec yếu tố
đầuvagraveo khaacutec nhauvagraveo một giaacute trị duy nhất Caacutec hagravem chuyển giao xử lyacute caacutec giaacute trị trạng thaacutei vagrave tạo đầu ra
11Huấn luyện mạng nơ ron Trong mocirc higravenh coacute giaacutem saacutetANN được đến so saacutenh dự đoaacuten của chiacutenh
noacute với thocircng tin phản hồi coacute chứa caacutec kết quả mong muốn ANN sẽ phải tigravem caacutech thay đổi caacutec tham số becircn trong củamigravenh (caacutec trọng số vagrave caacutec ngưỡng) để tạo necircn một aacutenh xạ coacute khả năng aacutenh xạcaacutec đầu vagraveo thagravenh caacutec đầu ra mong muốn Sự thay đổi nagravey được tiến hagravenh nhờ việc so saacutenh giữa đầu ra thực sự vagrave đầu ra mong muốn
Trong mocirc higravenh khocircng coacute giaacutem saacutetANN nhận được dữ liệu vagraveo nhưng khocircng phải coacute bất kỳ thocircng tin phản hồi về kết quả mong muốn
Phần lớn caacutec ứng dụng nằm trong vugraveng của caacutec bagravei toaacuten ước lượng như mocirc higravenh hoacuteathống kecirc neacuten lọc phacircn cụm
12Lợi iacutech Liecircn kết với mạng noron Traacutenh caacutech lập trigravenh tường minh Giảm nhu cầu của chuyecircn gia ANNs thigrave thiacutech nghi với caacutec yếu tố đầu vagraveo thay đổi Khocircng cần thiết cho cơ sở tri thức tinh chế ANNs coacute tiacutenh động vagrave cải thiện với việc sử dụng Coacute khả năng xử lyacute dữ liệu khocircng chiacutenh xaacutec hoặc khocircng đầy đủ Cho pheacutep tổng quaacutet hoacutea từ thocircng tin cụ thể Cho pheacutep thu thập cảm giaacutec thocircng thường vagraveo miền giải quyết vấn đề
13Hạn chế của việc liecircn kết với mạng noron ANNs khocircng thể giải thiacutech được suy luận Bản chất hộp đen thường khiến cho vấn đề traacutech nhiệm vagrave độ tin cậy phaacutet
sinh lagrave khoacute khăn Lặp đi lặp lại quaacute trigravenh huấn luyện rất tốn thời gian Nguồn lực caacutec nhagrave phacircn tiacutech vagrave thiết kế coacute tay nghề cao vẫn lagrave đaacuteng lo
ngại Cocircng nghệ ANN thuacutec đẩy hạn chế của phần cứng hiện tại ANN yecircu cầu phải coacute sự tin tưởng ở đầu ra
14Giới thiệu về thuật toaacuten di truyền Cũng như mạng lưới thần kinh caacutec thuật toaacuten di truyền được dựa trecircn lyacute
thuyết sinh học Thuật toaacuten di truyền tigravem thấy nguồn gốc của chuacuteng trong caacutec lyacute thuyết
tiến hoacutea của chọn lọc tự nhiecircn vagrave thiacutech ứng với biến đổi khiacute hậu Kết quả thuật toaacuten di truyền lagrave từ giao phối 2 caacute thể trong quần thế để tạo
ra con caacutei đocirci khi tốt hơn so với bậc cha mẹ của chuacuteng 15Caacutec thagravenh phần cơ bản của thuật toaacuten di truyền
Toaacuten tử chọn lọc Caacutec caacute thể tốt được chọn lọc để đưa vagraveo thế hệ sau Sự chọn lọc nagravey căn cứ vagraveo độ thiacutech nghi với mocirci trường của mỗi caacute thể
Toaacuten tử lai gheacutep (crossover) Hai caacute thể cha vagrave mẹ trao đổi caacutec gen với nhau để tạo ra caacute thể con
Toaacuten tử đột biến (mutation) Một caacute thể thay đổi một số gen để biến đổi thagravenh một caacute thể mớiTất cả caacutec toaacuten tử trecircn khi thực hiện đều mang tiacutenh ngẫu nhiecircn
16Quaacute trigravenh cơ bản của một thuật toaacuten di truyền Khởi tạo
Đaacutenh giaacute quần thể
Lựa chọn NST thiacutech hợp nhất vagrave loại bỏ NST yếu nhất
Quy trigravenh giao nhau vagrave cải thiện quần thể
đột biến tiến trigravenh để khaacutem phaacute ra NST mới
17Ưu nhược điểm của việc kết hợp với thuật toaacuten di truyền Kiacutech thước quần thể lagrave 1 yếu tố quan trọng trong tốc độ của việc tigravem
kiếmnhưng noacute tương đối dễ dagraveng để dự đoaacuten tốc độ nagravey Giao nhau hoặc đột biến lagrave khocircng necircn đc sử dụng quaacute thường xuyecircn Luocircn coacute được iacutet nhất 1 giải phaacutep hợp lyacute Necircn coacute thể aacutep dụng chuacuteng cho caacutec vấn đề magrave chuacuteng ta khocircng coacute hướng
về caacutech giải quyết Sức mạnh của thuật toaacuten xuất phaacutet từ khaacutei niệm đơn giảnkhocircng phải từ
một thủ tục thuật toaacuten phức tạp 18Tương lai của học maacutey
Mạng lưới thần kinh nhacircn tạo vượt quaacute năng lực của con người trong caacutec trường hợp bị cocirc lập
Về mặt lyacute thuyếtmột maacutey tiacutenh coacute thể xử lyacute dũ liệu nhanh hơn hagraveng triệu lần so với 1 con người
May mắn thay cho chuacuteng tacon người tốt hơn nhiều khi magrave coacute được dữ liệumaacutey tiacutenh khocircng coacute 1 số thứ như lagrave 5 giaacutec quan
CHƯƠNG 10 KHO DỮ LIỆU
1 Kho dữ liệu Kho dữ liệu lagrave tuyển tập caacutec cơ sở dữ liệu tiacutech hợp hướng chủ đề được
thiết kế để trợ giuacutep cho một hệ hỗ trợ quyết định
Theo John Ladley Cocircng nghệ kho dữ liệu lagrave tập caacutec phương phaacutep kỹ thuật vagrave caacutec cocircng cụ coacute thể kết hợp hỗ trợ nhau để cung cấp thocircng tin cho người sử dụng trecircn cơ sở tiacutech hợp từ nhiều nguồn dữ liệu nhiều mocirci trường khaacutec nhau
Kho dữ liệu thường rất lớn tới hagraveng trăm GB hay thậm chiacute hagraveng Terabyte
2 Kho dữ liệu vận hagravenh (ODS) Một kho dữ liệu vận hagravenh Aacutep dụng kỹ thuật kho dữ liệu vagraveo caacutec hệ xử
lyacute giao taacutec lưu trữ dữ liệu cho một ứng dụng đặc thugrave Noacute đưa vagraveo kho dữ liệu một dograveng caacutec dữ liệu thocirc được thiết kế
3 So saacutenh
Kho dữ liệu vận hagravenh Kho dữ liệu
Dữ liệu theo chủ đề Dữ liệu theo chủ đề
Dữ liệu tiacutech hợp Dữ liệu tiacutech hợp
Dữ liệu thay đổi Dữ liệu khocircng thay đổi
Dữ liệu được cập nhật khi thay đổi
Dữ liệu giữ nguyecircn
Chỉ coacute dữ liệu hiện tạiDữliệu hiện tại vagrave dữ liệu lịch sử
Chu kỳ lagravem tươi dữ liệu ngắn Chu kỳ lagravem tươi dữ liệu dagravei
Chỉ coacute dữ liệu chi tiết Dữ liệu chi tiết vagrave dữ liệu tổng kết
Dugraveng cho caacutec quyết định ngắn hạn
Dugraveng cho hoạch định dagravei hạn
4 Kho dữ liệu cục bộ (Data Mart - DM)
Kho dữ liệu cục bộ lagrave CSDL coacute những đặc điểm giống với kho dữ liệu nhưng với quy mocirc nhỏ hơn vagrave lưu trữ dữ liệu về một lĩnh vực một chuyecircn ngagravenh
Data mart phụ thuộc Chứa những dữ liệu được lấy từ DW vagrave những dữ liệu nagravey sẽ được triacutech lọc vagrave tinh chế tiacutech hợp lại ở mức cao hơn để phục vụ một chủ đề nhất định của Datamart
Data mart độc lập Khocircng giống như Datamart phụ thuộc Data mart độc lập được xacircy dựng trước DW vagrave dữ liệu được trực tiếp lấy từ caacutec nguồn khaacutec nhau
5 Siecircu dữ liệu Metadata lagrave dữ liệu để mocirc tả dữ liệu Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột
một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi Metadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu
6 Mocirci trường kho dữ liệu Hệ thống của tổ chức vagrave kho cung cấp dữ liệu để xacircy dựng kho dữ liệu Trong quaacute trigravenh chuyển dữ liệu từ caacutec nguồn khaacutec nhau dữ liệu coacute thể
được lagravem sạch hoặc chuyển đổi vagrave vigrave thế DW được xem như lagrave một chuẩn cho việc lưu trữ
Đồng thời siecircu dữ liệu được ghi lại Cuối cugraveng DW hoặc siecircu thị coacute thể được sử dụng để tạo ra một kho dữ
liệu ldquocaacute nhacircnrdquo 7 Caacutec đặc điểm của kho dữ liệu
Đặc điểm Mocirc tả
Hướng chủ đề - DL tổ chức theo caacutech thức người dugraveng tham chiếu
Tiacutech hợp - Dữ liệu ldquosạchrdquo loại bỏ tiacutenh thiếu nhất quaacuten
Khocircng thay đổi - DL ldquochỉ đọcrdquo người dugraveng khocircng thay đổi được
Chuỗi thời gian - DL lagrave chuỗi thời gian khocircng phải lagrave trạng thaacutei hiện tại
Được tổng kết - DL vận hagravenhthao taacutec khi cần thiết
được kết hợp lại thagravenh dạng coacute thể dugraveng được cho quyết định
Kiacutech cỡ lớn hơn - Lưu giữ theo chuỗi thời gian tức lagrave giữ lại nhiều DL
Khocircng được chuẩn hoacutea - Coacute thể dư thừa DLSiecircu dữ liệu - Dữ liệu của dữ liệu được lưu trữNguồn dữ liệu - DL vận hagravenh (caacutec hệ sẵn coacute) cugraveng
với caacutec nguồn ngoagravei 8 Kho dữ liệu hướng chủ đề
Hướng chủ để coacute nghĩa lagrave kho dữ liệu được tổ chức xung quanh caacutec chủ đề chiacutenh như khaacutech hagraveng sản phẩm sản xuất Tập trung vagraveo việc mocirc higravenh hoacutea vagrave phacircn tiacutech dữ liệu cho caacutec nhagrave ra quyết định magrave khocircng tập trung vagraveo caacutec xử lyacute thocircng thường Cung cấp cho người dugraveng một khung nhigraven toagraven vẹn đơn giản vagrave đầy đủ về caacutec sự kiện quanh caacutec chủ đề
9 Dữ liệu trong DW được tiacutech hợp Dữ liệu trong kho dữ liệu được xacircy dựng bằng caacutech tổng hợp dữ liệu từ
nhiều nguồn khaacutec nhau vagrave caacutec nguồn coacute tổ chức khaacutec nhau Cơ sở dữ liệu caacutec file excel caacutec flat file hoặc caacutec raw file Khi đưa vagraveo kho dữ liệu caacutec dữ liệu được lagravem sạch vagrave tiacutech hợp dữ liệu nhằm đảm bảo tiacutenh nhất quaacuten của dữ liệu
10Kiến truacutec kho dữ liệu Tầng cơ sở dữ liệu hoạt động Tầng truy xuất thocircng tin Tầng truy xuất dữ liệu Tầng siecircu dữ liệu Tầng quản lyacute tiến trigravenh Tầng thocircng điệp của ứng dụng Tầng vật liacute của kho dữ liệu Tầng trigravenh diễn dữ liệu
11Higravenh trạng kho dữ liệu Kho dữ liệu ảo - người dugraveng cuối coacute thể truy cập trực tiếp đến kho dữ liệu
sử dụng caacutec cocircng cụ cho pheacutep ở tầng truy xuất dữ liệu Kho dữ liệu trung tacircm-1 cơ sở dữ liệu vật lyacute chứa tất cả dữ liệu cho một
vugraveng chuyecircn dụng nagraveo đoacute
Kho dữ liệu phacircn taacuten- Thagravenh phần được phacircn taacuten qua nhiều hệ cơ sở dữ liệu vật lyacute
12METADATA- Siecircu dữ liệu Định nghĩa Siecircu dữ liệu lagrave dữ liệu về dữ liệu Lagrave 1 lưu trữ dugraveng để
Miecircu tả kho dữ liệu tổng thể Nhận dạng kiểu kho dữ liệu Quản liacute quaacute trigravenh tiacutech hợp dữ liệu Quản liacute quaacute trigravenh cập nhật kho dữ liệu Quản liacute bảo mật
Lagrave chigravea khoacutea quyết định sự thagravenh cocircng của kho dữ liệu luocircn được thay đổi vagrave cập nhật theo sự phaacutet triển của kho dữ liệu
Dugraveng để quản liacute điều khiển kho dữ liệu Sự ra đời của kho dữ liệu như 1 cấu truacutec hỗ trợ ra quyết định siecircu dữ liệu
được xem như nguồn tagravei nguyecircn dữ liệu Siecircu dữ liệu lagrave trừu tượng Chuacuteng lagrave dữ liệu bậc cao cung cấp mocirc tả ngắn
gọn caacutec dữ liệu bậc thấp hơn 13Hoạt động của Siecircu dữ liệu
Siecircu dữ liệu rất cần thiết trong việc chuyển hoacutea thocircng tin trở thagravenh tri thức Lagrave chigravea khoacutea giuacutep chuacuteng ta xử lyacute được dữ liệu thocirc Viacute dụ một dograveng dữ liệu baacuten hagraveng 1023 K596 11121 agraveNoacute sẽ khocircng coacute nghĩa gigrave cho đến khi chuacuteng ta đưa vagraveo siecircu dữ liệu (thư
mục chứa dữ liệu) agrave cửa hagraveng 1023 sản phẩm K596 vagrave số tiền baacuten được lagrave 11121 đocirc la
14Sự cần thiết phải nhất quaacuten trong kho dữ liệu Kho dữ liệu được xacircy dựng cho lợi iacutech của những nhagrave phacircn tiacutech kinh
doanh caacutec nhagrave quản trị cho tất cả caacutec khu vực chức năng Trong cơ sở dữ liệu riecircng caacutec khu vực khaacutec nhau coacute thể định nghĩa vagrave lưu
trữ dữ liệu thocircng qua phiecircn bản của chiacutenh noacute Khi dữ liệu được lấy từ những vugraveng khaacutec nhau đoacute vagrave được đặt vagraveo kho dữ
liệu Việc chuyển đổi vagrave lagravem sạch caacutec tiến trigravenh sẽ đảm bảo noacute lagrave duy nhất được tiacutech hợp tại một mức của tổ chức
15Ragrave soaacutet lại dữ liệu ndash Thực thi siecircu dữ liệu
Bất kể cấu truacutec tự nhiecircn của 1 cacircu truy vấn thế nagraveo thigrave caacutec thagravenh phần của siecircu dữ liệu rất quan trọng đối với người ra quyết định
Bảng thuộc tiacutenh khoacutea được lưu trữ bởi kho dữ liệu Tập hợp dữ liệu được lấy từ đacircu Những chuyển đổi nagraveo được thực thi với việc lagravem sạch
16Siecircu dữ liệu lagrave gigrave Metadata - lagrave thocircng tin mocirc tả nội dung của cơ sở dữ liệu (CSDL) Metadata baacuteo cho người dugraveng biết thời gian cập nhật sau cugraveng của dữ liệu
định dạng vagrave mục điacutech sử dụng của noacute Những thocircng tin nagravey coacute thể hướng dẫn người dugraveng duyệt qua CSDL vagrave
giuacutep họ hiểu được yacute nghĩa vagrave ngữ cảnh của dữ liệu Trong CSDL metadata lagrave caacutec dạng biểu diễn khaacutec nhau của caacutec đối tượng
trong CSDL Trong CSDL quan hệ metadata lagrave caacutec định nghĩa của bảng cột CSDL
view vagrave nhiều đối tượng khaacutec Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột
một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi -gtMetadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu
Bảng chuyển đổi Ghi lại những chuyển đổi đatilde được thực hiện
Lịch sử thực thi Ghi lại những dữ liệu đatilde được
phacircn tiacutech
Higravenh thaacutei kết nốiGhi lại những dữ liệu được kết nối vagrave tần suất
17Aacutenh xạ thocircng thường của siecircu dữ liệu Bản ghi aacutenh xạ chuyển đổi bao gồm
Định danh của nguồn gốc Chuyển đổi thuộc tiacutenh Chuyển đổi thuộc tiacutenh vật lyacute Matilde hoacutea tham chiếu bảng chuyển đổi Đổi tecircn Đổi khoacutea Gaacuten giaacute trị cho thuộc tiacutenh mặc định Chọn logic cho caacutec nguồn nhiều giaacute trị Đổi thuật toaacuten
18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để
phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai
lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave
tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec
Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm
Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo
19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua
caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau
SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được
Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra
một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức
Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ
Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ
Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech
CHƯƠNG 11 KHAI PHAacute DỮ LIỆU
1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn
ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993
Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng
2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd
1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều
2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP
3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn
4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng
5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server
6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo
7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động
8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời
9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều
10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện
11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech
12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP
3 Xử lyacute phacircn tiacutech trực tuyến OLAP
MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave
dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu
ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave
thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu
HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave
ROLAP4 Khai phaacute dữ liệu
Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh
khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn
Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan
5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp
6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại
Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp
Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec
Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt
Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra
Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh
vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho
Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec
Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm
Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục
Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng
gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp
Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn
Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec
Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper
Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2
Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25
Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước
Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng
Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện
trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp
Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute
độ hỗ trợ ge ngưỡng minsup
độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan
Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn
Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết
Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu
MOLAP ROLAP HOLAP
Lưu trữ dữ liệu cơ sở
Khối Bảng quan hệ Bảng quan hệ
Lưu trữ thocircng tin tổng hợp
Khối Bảng quan hệ Khối
Hiệu suất thực hiện truy vấn
Nhanh nhất Chậm nhất Nhanh
Tiecircu thụ khocircng gian lưu trữ
Nhiều Thấp Trung bigravenh
Chi phiacute bảo trigrave Cao Thấp Trung bigravenh
bull Lagrave phần tử chủ chốt trong hầu hết hệ hỗ trợ quyết định vagrave lagrave điều kiện cần trong hệ hỗ trợ quyết định dựa vagraveo mocirc higravenh (model-based DSS)
bull Coacute nhiều lớp mocirc higravenh kegravem theo lagrave caacutec kỹ thuật xử lyacute thao taacutec mocirc higravenh đặc thugrave tương ứng
bull Caacutec vấn đề chiacutenh nhận diện bagravei toaacuten vagrave phacircn tiacutech mocirci trường nhận diện biến số dự baacuteo đa mocirc higravenh caacutec phạm trugrave mocirc higravenh quản lyacute mocirc higravenh vagrave mocirc higravenh hoacutea dựa vagraveo kiến thức
bull Mocirc higravenh hoacutea lagrave taacutec vụ khocircng đơn giản Người xacircy dựng mocirc higravenh phải cacircn bằng giữa tiacutenh đơn giản của mocirc higravenh với caacutec yecircu cầu biểu diễn để mocirc higravenh coacute thể nắm bắt đủ thực tại cần thiết cho người ra quyết định
bull Mocirc phỏng lagrave kỹ thuật mocirc higravenh hoacutea thocircng dụng dugraveng để tigravem hiểu vấn đề tuy khocircng nhất thiết phải tigravem ra được caacutec giải phaacutep biến thể mở rộng quaacute trigravenh ra quyết định của tổ chức vagrave cho pheacutep tổ chức xem xeacutet taacutec độngảnh hưởng của caacutec chọn lựa tương lai
bull Mocirc phỏng tiết kiệm rất nhiều chi phiacute vagrave thời gian ndash rất dễ thay đổi mocirc higravenh hoạt động của một hệ thống vật lyacute bằng mocirc higravenh hoacutea maacutey tiacutenh
bull Mocirc higravenh coacute thể được phaacutet triển vagrave cagravei đặt bằng một số caacutec ngocircn ngữ lập trinh (thế hệ 3 4 ) vagrave hệ thống phần mềm khaacutec nhau
Mocirc higravenh tĩnh vagrave động
bull Mocirc higravenh tĩnh thể hiện bức tranh tại thời điểm của tigravenh huống Caacutec khiacutea cạnh của bagravei toaacuten được xeacutet một thời kỳ nhất định trong một khung thời gian nhất định (coacute thể ldquocuốnrdquo về tương lai) Caacutec tigravenh huống được giả sử lagrave sẽ lập lại với tập caacutec điều kiện đồng nhất
1048713 Giả định coacute được tiacutenh ổn định của dữ liệu 1048713 Mocirc phỏng quaacute trigravenh dạng tĩnh - lagravem việc trecircn caacutec trạng thaacutei ổn định để tigravem ra caacutec
thocircng số tối ưu ndash thường được dugraveng như cocircng cụ chủ yếu để thiết kế quaacute trigravenh 1048713 vd quyết định sản xuấtmua 1 sản phẩm baacuteo caacuteo thu nhập hagraveng quyacutenăm bull Mocirc higravenh động biểu diễn caacutec kịch bản thay đổi theo thời gian 1048713 Phụ thuộc thời gian caacutec trạng thaacutei thay đổi theo thời gian 1048713 Thường dugraveng để tạo sinh vagrave biểu diễn caacutec xu hướng vagrave khuocircn mẫu theo thời gian 1048713 Mocirc phỏng động thể hiện caacutec diễn tiến khi caacutec điều kiện theo thời gian khaacutec với caacutec
trạng thaacutei ổn định ndash thường được dugraveng để thiết kế việc kiểm soaacutet caacutec hệ thống 1048713 VD dự baacuteo lời-lỗ trong 5 năm với caacutec nhập lượng như giaacute phiacute số lượng thay đổi
theo từng năm
Mocirc higravenh chắc chắn tương đối dễ phaacutet triển giải quyết vagrave coacute thể sinh ra caacutec giải phaacutep tối ưu 1048713 Caacutec bagravei toaacuten coacute một số lớnvocirc hạn caacutec giải phaacutep khả thi đặc biệt quan trọng 1048713 Caacutec mocirc higravenh tagravei chaacutenh được xacircy dựng trong điều kiện chắc chắn
Mocirc higravenh bất địnhbằng caacutech thu thập thecircm thocircng tin cố gắng đưa bagravei toaacuten trở về dạng chắc chắn hay dạng
rủi ro Mocirc higravenh rủi ro caacutec quyết định kinh doanh được đưa ra dưới caacutec rủi ro giả định
1048713 Đocirci khi biết được xaacutec suất của caacutec sự kiện xảy ra trong tương lai 1048713 Caacutec trường hợp khaacutec (bất định) ước lượng caacutec rủi ro vagrave giả sử caacutec tigravenh huống rủi ro
xảy ra 20Mocirc higravenh hoacutea
MOcirc HIgraveNH HOacuteA BẰNG BẢNG TIacuteNH bull Bảng tiacutenh phần mềm mạnh linh hoạt vagrave dễ dugraveng cho pheacutep tạo sinh caacutec ứng dụng trong kinh doanh kỹ thuật toaacuten vagrave khoa học với tập caacutec hagravem mạnh về tagravei chaacutenh thống kecirc toaacuten bull Kegravem theo lagrave caacutec thagravenh phần cộng thecircm (add-ins) giuacutep xacircy dựng vagrave giải caacutec lớp mocirc higravenh đặc thugrave bull Lagrave cocircng cụ mocirc higravenh hoacutea thocircng dụng nhất của người dugraveng cuối cugraveng bull Coacute caacutec chức năng về phacircn tiacutech ldquowhat-ifrdquo dograve tigravem mục tiecircu quản lyacute dữ liệu vagrave lập trigravenh (dạng macro) bull Coacute khả năng đọc ghi caacutec cấu truacutec tập tin thocircng dụng để giao tiếp được với caacutec CSDL vagrave cocircng cụ khaacutec bull Coacute thể xacircy dựng mocirc higravenh tĩnh vagrave động bull Dugraveng trecircn maacutey tiacutenh caacute nhacircn vagrave maacutey tiacutenh lớn
bull Cơ sở để xacircy dựng caacutec bảng tiacutenh đa chiều vagrave caacutec cocircng cụ xử lyacute phacircn tiacutech trực tuyến (OLAP) MOcirc HIgraveNH HOacuteA BẰNG PHAcircN TIacuteCH QUYẾT ĐỊNH bull Tiếp cận mocirc higravenh hoacutea caacutec tigravenh huống quyết định coacute một số hữu hạnkhocircng quaacute nhiều caacutec phương aacuten ndash mỗi phương aacuten được trigravenh ra dưới dạng bảng hay đồ thị - caacutec kết quả tương ứng (dự baacuteo được kegravem xaacutec suất) theo mục tiecircu bagravei toaacuten ndash từ đoacute chọn phương aacuten tốt nhất bull Đơn mục tiecircu bảng quyết định hay cacircy quyết định bull Đa mục tiecircu AHP (analytic hierarchy process) khaacutec
MOcirc HIgraveNH HOacuteA BẰNG QUY HOẠCH TOAacuteN
bull Quy hoạch toaacuten học (mathematical programming) lagrave họ caacutec cocircng cụ giải quyết caacutec bagravei toaacuten quản lyacute theo đoacute người ra quyết định phải cấp phaacutet caacutec tagravei nguyecircn khan hiếm cho caacutec hoạt động cạnh tranh nhau (caacutec phương aacuten) nhằm tối ưu hoacutea mục tiecircu coacute khả năng đo lường được bull Caacutec mocirc higravenh quy hoạch tuyến tiacutenh (linear programming) thocircng dụng nhất trong quy hoạch toaacuten coacute nhiều ứng dụng trong thực tế được dugraveng nhiều trong caacutec hệ hỗ trợ quyết định bull Bagravei toaacuten quy hoạch tuyến tiacutenh 1048713 Caacutec biến quyết định (cần tigravem giaacute trị) 1048713 Hagravem mục tiecircu (hagravem toaacuten học dạng tuyến tiacutenh xaacutec định quan hệ giữa biến quyết định vagrave mục tiecircu đo lường mức độ đạt đạt mục tiecircu vagrave cần được tối ưu hoacutea) 1048713 Caacutec hệ số của hagravem mục tiecircu (cho biết mức đoacuteng goacutep vagraveo mục tiecircu của 1 đơn vị biến quyết định) 1048713 Ragraveng buộc (biểu thức tuyến tiacutenh cho biết giới hạn tagravei nguyecircn vagravehay caacutec quan hệ giữa caacutec biến số) 1048713 Dung lượng (mocirc tả cận trecircn vagrave dưới của caacutec biến vagrave ragraveng buộc) 1048713 Hệ số (cocircng nghệ) vagraveo-ra (cho biết mức độ sử dụng tagravei nguyecircn của biến quyết định) bull Đặc điểm của bagravei toaacuten quy hoạch tuyến tiacutenh 1048713 Tagravei nguyecircn kinh tế của bagravei toaacuten lagrave coacute hạn vagrave sẵn sagraveng 1048713 Coacute nhiều caacutech (gt2 caacutech) sử dụng tagravei nguyecircn được gọi lagrave giải phaacutep hay chương trigravenh 1048713 Mỗi hoạt động dugraveng tagravei nguyecircn đều sinh ra kết quả dưới dạng mục tiecircu đatilde phaacutet biểu trước 1048713 Việc cấp phaacutet nằm trong caacutec ragraveng buộc cho trước bull Giả định của bagravei toaacuten quy hoạch tuyến tiacutenh 1048713 Caacutec kết quả của caacutec cấp phaacutet coacute thể đem so saacutenh với nhau coacute thể đo lường bằng một đơn vị chung
1048713 Caacutec cấp phaacutet độc lập với nhau về mặt kết quả 1048713 Kết quả cuối cugraveng lagrave tổng của caacutec kết quả từ caacutec hoạt động riecircng rẽ khaacutec nhau 1048713 Dữ liệu coacute tiacutenh chắc chắn 1048713 Tagravei nguyecircn được dugraveng một caacutech kinh tế nhất 1048713 Thường coacute một số lớn caacutec giải phaacutep với kết quả khaacutec nhau 1048713 Trong số caacutec giải phaacutep coacute thể coacute 1 giải phaacutep tốt nhất ndash mức độ đạt được mục tiecircu cao nhất ndash gọi lagrave giải phaacutep tối ưu được tigravem ra bằng một giải thuật đặc biệt MOcirc HIgraveNH HOacuteA BẰNG HEURISTIC bull Việc tigravem giải phaacutep tối ưu của một số bagravei toaacuten quyết định phức tạp coacute thể tốn nhiều thời gian chi phiacute hay khocircng thể tigravem ra được Cograven nếu dugraveng tiếp cận mocirc phỏng cũng coacute thể keacuteo dagravei phức tạp khocircng thiacutech hợp hay thậm chiacute khocircng chiacutenh xaacutec
bull Lagrave một tiếp cận giuacutep tigravem ra caacutec giải phaacutep khả thithỏa matildenđủ tốt cho caacutec bagravei toaacuten phức tạp Coacute thể coacute giải phaacutep đủ tốt (90-999 giaacute trị của lời giải tối ưu) nhanh choacuteng vagrave đỡ tốn keacutem hơn bằng caacutech dugraveng heuristics bull Quaacute trigravenh heuristic lagrave datildey caacutec bước xacircy dựng caacutec quy luật giải quyết vấn đề thocircng qua việc tigravem kiếm caacutec con đường hứa hẹn nhất dẫn đến lời giải tigravem kiếm caacutech thức thu thập vagrave phacircn giải thocircng tin theo quaacute trigravenh giải vagrave phaacutet triền caacutec phương phaacutep dẫn đến một giải thuật tiacutenh toaacuten hay một lời giải tổng quaacutet đatilde coacute bull Aacutep dụng chủ yếu cho bagravei toaacuten cấu truacutec yếu cũng dugraveng để tigravem ra giải phaacutep chấp nhận được cho bagravei toaacuten cấu truacutec chặt bull Khocircng đủ tổng quaacutet như caacutec giải thuật thường chỉ dugraveng cho tigravenh huống đặc thugrave đang xeacutet bull Coacute thể dẫn đến một giải phaacutep dở - caacutec thủ tục từng bước giải quyết vấn đề khocircng đảm bảo tigravem ra giải phaacutep tối ưu bull Heuristic coacute thể lagrave định lượng vigrave vậy coacute thể đoacuteng vai trograve quan trọng trong cơ sở mocirc higravenh của hệ hỗ trợ quyết định bull Heuristic coacute thể lagrave định tiacutenh vigrave vậy coacute thể đoacuteng vai trograve quan trọng trong cung ứng kiến thức cho hệ chuyecircn gia bull Quaacute trigravenh heuristic liecircn quan đến tigravem kiếm học tập ước lượng phacircn xử vagrave lặp lại caacutec hoạt động nagravey dọc theo tiến trigravenh bull Kiến thức thu được dugrave thagravenh cocircng hay thất bại trong quaacute trigravenh đều được phản hồi vagrave sửa đổi chiacutenh quaacute trigravenh nhờ đoacute coacute thể định nghĩa lại mục tiecircu hay bagravei toaacuten 1048713 Giải thuật di truyền bắt đầu bằng tập caacutec giải phaacutep được sinh ngẫu nhiecircn taacutei kết hợp caacutec cặp giải phaacutep một caacutech ngẫu nhiecircn bull Tigravenh huống necircn dugraveng heuristics 1048713 Dữ liệu đầu vagraveo khocircng chiacutenh xaacutec hay coacute giới hạn 1048713 Thực tế quaacute phức tạp đến nỗi khocircng dugraveng được caacutec mocirc higravenh tối ưu 1048713 Chưa coacute được giải thuật chiacutenh xaacutec vagrave đủ tin cậy 1048713 Bagravei toaacuten phức tạp necircn sẽ khocircng kinh tế nếu dugraveng tối ưu hay mocirc phỏng hoặc tốn quaacute nhiều thời gian tiacutenh toaacuten 1048713 Coacute thể cải thiện tiacutenh hiệu quả của quaacute trigravenh tối ưu (tức coacute thể sinh ra caacutec giải phaacutep ban đầu tương đối tốt) 1048713 Liecircn quan đến xử lyacute kyacute hiệu chứ khocircng phải xử lyacute kyacute số (như hệ chuyecircn gia) 1048713 Cần coacute quyết định nhanh vagrave caacutec xử lyacute dựa vagraveo maacutey tiacutenh đều khocircng khả thi (một số heuristic khocircng cần đến maacutey tiacutenh) bull Thuận lợi 1048713 Dễ hiểu dễ giải thiacutech vagrave dễ cagravei đặt 1048713 Nacircng cao tiacutenh saacuteng tạo vagrave năng lực heuristic cho caacutec vấn đề khaacutec 1048713 Tiết kiệm thời gian xaacutec lập vấn đề 1048713 Tiết kiệm yecircu cầu về bộ chứa vagrave xử lyacute maacutey tiacutenh
1048713 Tiết kiệm thời gian tiacutenh toaacuten vagrave do vậy tiết kiệm thời gian thực trong ra quyết định Một số vấn đề phức tạp đến nỗi chỉ coacute thể giải được bằng heuristics 1048713 Thường sinh ra nhiều giải phaacutep chấp nhận được 1048713 Thường coacute thể phaacutet biểu lyacute thuyết hay đo lường thực nghiệm về chất lượng của giải phaacutep (tức giaacute trị mục tiecircu của giải phaacutep gần với giaacute trị tồi ưu đến mức nagraveo dugrave giaacute trị tối ưu chưa biết được) 1048713 Coacute thể kết hợp tiacutenh thocircng minh vagraveo để hướng dẫn pheacutep tigravem kiếm (tigravem kiếm tabu) Năng lực thocircng minh đoacute coacute thể lagrave đặc thugrave theo bagravei toaacuten hoặc dựa trecircn yacute kiến chuyecircn gia được cấy trong hệ chuyecircn gia hoặc cơ chế tigravem kiếm 1048713 Coacute thể dugraveng heuristic hiệu quả vagraveo caacutec mocirc higravenh coacute thể giải bằng quy hoạch toaacuten học Đocirci khi heuristic lagrave phương phaacutep được ưa thiacutech hơn khi khaacutec giải phaacutep heuristics được dugraveng như giải phaacutep ban đầu cho caacutec phương phaacutep quy hoạch toaacuten học bull Hạn chế 1048713 Khocircng đảm bảo coacute được giải phaacutep tối ưu 1048713 Caacutec quy luật coacute rất nhiều ngoại lệ 1048713 Caacutec lựa chọn quyết định tuần tự coacute thể khocircng tiecircn đoaacuten được caacutec kết cục tương lai của mỗi chọn lựa 1048713 Sự liecircn thuộc giữa caacutec phần trong hệ thống đocirci khi coacute thể gacircy ra caacutec ảnh hưởng lớn lao lecircn toagraven hệ thống bull Phacircn loại caacutec giải thuật heuristic 1048713 Heuristic xacircy dựng xacircy dựng giải phaacutep khả thi bằng caacutech cộng thecircm từng thagravenh phần một VD bagravei toaacuten người baacuten hagraveng ndash luocircn gheacute thagravenh phố chưa viếng thăm kế tiếp gần nhất
1048713 Heuristic cải tiến bắt đầu bằng một giải phaacutep khả thi vagrave cố gắng cải tiến liecircn tục trecircn đoacute VD trecircn thử hoaacuten đổi 2 thagravenh phố 1048713 Quy hoạch toaacuten aacutep dụng vagraveo caacutec mocirc higravenh chứa iacutet ragraveng buộc nhằm coacute được thocircng tin về thỏa hiệp tốt nhất với mocirc higravenh nguyecircn gốc Thường được dugraveng trong tối ưu hoacutea nguyecircn (integer optimization) 1048713 Chia giai đoạn giải quyết một vấn đề theo từng giai đoạn VD ở PampG trecircn đacircy bagravei toaacuten phacircn phối được giải quyết trước sau đoacute dugraveng giải quyết bagravei toaacuten chiến lược sản phẩm 1048713 Phacircn ratilde chia bagravei toaacuten thagravenh caacutec phần nhỏ hơn coacute thể giải quyết được sau đoacute kết hợp caacutec giải phaacutep đoacute lại VD chia latildenh thổ baacuten hagraveng thagravenh 4 vugraveng khaacutec nhau giải quyết cho từng vugraveng sau đoacute kết nối caacutec giải phaacutep
21Mocirc phỏngbull Giả định caacutec đặc điểm của thực tạibull Lagrave kỹ thuật tiến triển caacutec thực nghiệm (như phacircn tiacutech ldquowhat-ifrdquo) - bằng maacutey tiacutenh -trecircn một mocirc higravenh của hệ thocircng tin quản lyacute
bull Khocircng thực sự lagrave một mocirc higravenh vigrave khocircng biểu diễn thực tại magrave lagrave cố gắng bắtchước thực tạibull Một trong những phương phaacutep thocircng dụng nhất trong HHTQĐbull HHTQĐ lagravem việc với caacutec bagravei toaacuten phi cấu truacutec vagrave cấu truacutec yếu tigravenh huống thực tếphức tạp ndash khocircng dễ biểu diễn bằng mocirc higravenh tối ưu hay caacutec dạng mocirc higravenh khaacutecnhưng lại thường coacute thể xử lyacute được bằng mocirc phỏngbull Đặc điểm1048713 Iacutet đưa ra caacutec đơn giản hoacutea về thực tại hơn caacutec mocirc higravenh khaacutec1048713 Do triển khai caacutec thực nghiệm necircn noacute coacute thể kiểm thử caacutec giaacute trị cụ thể của caacutecbiến quyết địnhbiến khocircng kiểm soaacutet được của mocirc higravenh vagrave xem xeacutet ảnh hưởnglecircn caacutec biến kết quả1048713 Phương phaacutep coacute tiacutenh mocirc tả (như vậy khaacutec với phương phaacutep danh định)1048713 Khocircng tự động tigravem kiếm giải phaacutep tối ưu ndash noacute mocirc tảtiecircn đoaacuten caacutec đặc tiacutenh của hệthống đatilde cho dưới caacutec điều kiện khaacutec nhau từ đoacute coacute thể chọn ra phương aacuten tốtnhất1048713 Quaacute trigravenh mocirc phỏng thường lặp lại một thực nghiệm nhiều lần để coacute được ướclượng về hiệu ứng tổng quaacutet của một số hagravenh động nhất định1048713 Mocirc phỏng maacutey tiacutenh thiacutech hợp cho hầu hết caacutec tigravenh huống mặc dugrave cũng coacute một sốmocirc phỏng thủ cocircng thagravenh cocircng1048713 Thường chỉ được dugraveng khi bagravei toaacuten quaacute phức tạp khocircng thể xem xeacutet bằng caacutec kỹthuật tối ưu dạng số Tiacutenh phức tạp theo nghĩa bagravei toaacuten khocircng thể cocircng thức hoacuteacho tối ưu (do khocircng thotildea caacutec giả định) hoặc cocircng thức quaacute lớn quaacute nhiều tươngtaacutec giữa caacutec biến hoặc về bản chất bagravei toaacuten lagrave bất định hay rủi roPhương phaacutep mocirc phỏng thiết lập mocirc higravenh của hệ thống thực vagrave tiến hagravenh caacutec thựcnghiệm lặp lại trecircn mocirc higravenh
bull Thuận lợi1048713 Lyacute thuyết tương đối trực tiếp hiệu ứng dagravei hạn của nhiều chiacutenh saacutech -gt neacuten thờigian lớn1048713 Do tiacutenh chất mocirc tả (khaacutec với danh định)1048713 Coacute thể thấy được nhanh choacuteng coacute thể đặt ra caacutec cacircu hỏi ldquowhat-ifrdquo coacute thể dugravengtiếp cận thử-vagrave-sai vagraveo giải quyết vấn đề một caacutech nhanh choacuteng rẻ chiacutenh xaacutec iacutetrủi ro hơn1048713 Thử nghiệm được biến quyết định phần nagraveo của mocirci trường thực sự quan trọngvới caacutec phương aacuten khaacutec nhau1048713 Yecircu cầu kiến thức riecircng biệt về bagravei toaacuten vigrave thế buộc người xacircy dựng mocirc higravenh phảilagravem việc thường xuyecircn với nhagrave quản lyacute ndash đối tượng mong muốn của HHTQĐ để
từ đoacute bản chất bagravei toaacuten vagrave caacutec quyết định được hiểu tốt hơn1048713 Mocirc higravenh được xacircy dựng từ viễn cảnhcaacutech nhigraven của nhagrave quản lyacute1048713 Mocirc higravenh chỉ cho một bagravei toaacuten riecircng biệt thường khocircng thể dugraveng giải caacutec bagravei toaacutenkhaacutec Như vậy mỗi thagravenh phần của mocirc higravenh ứng với một phần của hệ thống thựcdo đoacute sẽ khocircng yecircu cầu nhagrave quản lyacute phải tổng quaacutet hoacutea caacutec hiểu biết của migravenh1048713 Phổ bagravei toaacuten giải được rất rộng tồn kho nhacircn sự hoạch định chiến lược 1048713 Coacute thể chứa caacutec phức tạp thực sự của bagravei toaacuten khocircng cần caacutec đơn giản hoacutea (TDdugraveng caacutec phacircn phối xaacutec suất thực thay vigrave phacircn phối lyacute thuyết xấp xỉ)1048713 Coacute thể tự động sinh ra nhiều đo lường hiệu năng quan trọng1048713 Thường lagrave phương phaacutep duy nhất của HHTQĐ coacute thể xử lyacute caacutec bagravei toaacuten tương đốiphi cấu truacutec1048713 Coacute một số caacutec goacutei phần mềm mocirc phỏng (Monte Carlo) tương đối dễ dugravengbull Điểm yếu1048713 Tuy thường tigravem được caacutec phương aacuten đủ tốt nhưng khocircng đảm bảo lời giải tối ưu1048713 Quaacute trigravenh xacircy dựng mocirc higravenh thường dagravei vagrave tốn keacutem1048713 Giải phaacutep vagrave suy diễn từ nghiecircn cứu mocirc phỏng thường khocircng thể chuyển sang bagraveitoaacuten khaacutec vigrave mocirc higravenh kết hợp caacutec yếu tố đặc thugrave1048713 Đocirci khi do mocirc higravenh quaacute dễ giải thiacutech cho nhagrave quản lyacute necircn caacutec phương phaacutep phacircntiacutech thường xem nhẹ1048713 Phần mềm mocirc phỏng đocirci khi yecircu cầu caacutec kỹ năng đặc biệt do độ phức tạp củaphương phaacutep giải higravenh thứcbull Caacutec loại mocirc phỏng1048713 Mocirc phỏng xaacutec suất một hay nhiều biến độc lập mang tiacutenh xaacutec suất với 2 loạiphacircn phối ndash thường dugraveng kỹ thuật Monte Carlo1048713 Phacircn phối rời rạc tigravenh huống coacute một số giới hạn caacutec biến cố (biến) với hữu hạncaacutec giaacute trị cho mỗi biến cố (biến)1048713 Phacircn phối liecircn tục tigravenh huống coacute số lượng khocircng giới hạn caacutec biến cố tuacircn theocaacutec hagravem mật độ xaacutec suất như phacircn phối chuẩn1048713 Mocirc phỏng độc lậpphụ thuộc theo thời gian1048713 Độc lập khocircng cần thiết phải biết chiacutenh xaacutec thời điểm xảy ra biến cố (nhu cầutiecircu thụ lượng sản phẩm trong ngagravey khocircng biết chiacutenh xaacutec thời điểm tiecircu thụ)1048713 Phụ thuộc cần biết chiacutenh xaacutec thời điểm xảy ra sự kiện (bagravei toaacuten hagraveng đợi)1048713 Mocirc phỏng tương taacutec trực quan1048713 Mocirc phỏng hướng đối tượng dugraveng tiếp cận hướng đối tượng để xacircy dựng mocirc higravenhmocirc phỏng Chuacute yacute ngocircn ngữ mocirc higravenh hoacutea nhất thể UML (unified modelinglanguage) kể cả khi mocirc phỏng caacutec hệ thời gian thựcMOcirc HIgraveNH HOacuteA ĐA CHIỀU ndash XỬ LYacute PHAcircN TIacuteCH TRỰC TUYẾNbull Người ra quyết định thường phải xem xeacutet nhiều chiều của dữ liệu (TD caacutec chiềucủa dữ liệu baacuten hagraveng lagrave sản phẩm vugraveng thời gian người baacuten ) dữ liệu cần đượcphacircn tiacutech trực tiếp bằng caacutec cocircng cụ chuẩn hay phacircn tiacutech tự động bằng caacutec
phương phaacutep khai mỏ dữ liệu (data mining)bull Hầu hết caacutec hệ thống phacircn tiacutech đa chiều được nhuacuteng trong caacutec hệ xử lyacute phacircn tiacutechtrực tuyến (HXLPTTT ndash online analytic processing - OLAP)bull Mục tiecircu của XLPTTT nắm bắt cấu truacutec của dữ liệu thực để hỗ trợ ra quyết địnhbull Trong HHTQĐ coacute sự gắn nối tự nhiecircn giữa mocirc higravenh hoacutea dữ liệu mocirc higravenh hoacutea kyacutehiệu vagrave caacutec khiacutea cạnh của phacircn tiacutech ldquowhat-ifrdquobull Caacutec baacuteo caacuteo của HXLPTTT đều coacute tiacutenh tương taacutec dễ khai thaacutec sử dụng đặc biệtphugrave hợp cho caacutec baacuteo caacuteo về chỉ số hiệu năng chủ yếu (key performance indicators- KPI) baacuteo caacuteo về đo lường hiệu năng kinh doanh bull Thế hệ hiện tại của HXLPTTT vagrave hệ khai mỏ dữ liệu (data mining) tiacutech hợp caacutecđặc tiacutenh của hệ thocircng tin latildenh đạo (executive information system ndashEIS- nhiềucaacutech nhigraven dữ liệu chi tiết hoacutea theo nhu cầu) vagrave caacutec hệ đồ họa khaacutec ndash thường coacutegiao diện người dugraveng dạng kiểu WEBbull Caacutec hệ thống như trecircn cograven được gọi lagrave caacutec cocircng cụ triacute tuệ kinh doanh (businessintelligence - BI) vigrave coacute caacutec đặc trưng về mocirc higravenh hoacutea vagrave tối ưu hoacutea nhưng lạitrong suốt đối với ngươigrave dugravengbull Hiện caacutec cocircng cụ được đưa ra bởi caacutec nhagrave cung cấp về CSDL về hoạch định tagraveinguyecircn tổ chức (ERP) về nhagrave kho dữ liệu (data warehouse) về HXLPTTT MOcirc HIgraveNH HOacuteA VAgrave MOcirc PHỎNG TƯƠNG TAacuteC TRỰC QUANbull Iacutech lợi Người ra quyết định tham gia vagraveo quaacute trigravenh phaacutet triển mocirc higravenh vagrave thựcnghiệm mocirc phỏng vigrave vậy sẽ tin tưởng khi sử dụng mocirc higravenhbull Mocirc higravenh hoacutea tương taacutec trực quan (visual interactive modeling - VIM) dugraveng caacutecbiểu diễn đồ họa maacutey tiacutenh để trigravenh bagravey caacutec ảnh hưởng của caacutec quyết định quản lyacutekhaacutec nhau ở một thời điểm (tĩnh) hay tiến triển theo thời gian (động với kỹ thuậthoạt higravenh)bull Mocirc phỏng tương taacutec trực quan (visual interactive simulation - VIS) cho pheacutepngười dugraveng theo dotildei tiến trigravenh xacircy dựng vagrave sử dụng khai thaacutec mocirc higravenh mocirc phỏngdưới dạng hoạt higravenhbull Mocirc higravenh hoacutea tương taacutec trực quan coacute thể kết hợp với tiếp cận triacute tuệ nhacircn tạo đểđưa ra caacutec khả năng mới thay đổi từ xacircy dựng hệ thống dạng đồ họa đến tigravem hiểuvề động học của hệ thốngbull Cần đến caacutec hệ thống maacutey tiacutenh xử lyacute song song tốc độ cao để xacircy dựng caacutec mocircphỏng - phức tạp quy mocirc lớn dạng hoạt higravenh - mang tiacutenh khả thi ở thời gian thực
22Caacutec dạng hệ thống hỗ trợ ra quyết địnhHệ hỗ trợ quyết định nhoacutemRa quyết định nhoacutem giao tiếp vagrave cộng taacutec- Caacutec đặc điểm của cocircng việc nhoacutem+ Một nhoacutem thực hiện một nhiệm vụ thỉnh thoảng ra quyết định thỉnh thoảngkhocircng ra quyết định+ Caacutec thagravenh viecircn trong nhoacutem coacute thể ở những nơi khaacutec nhau
+ Caacutec thagravenh viecircn trong nhoacutem coacute thể lagravem việc ở những thời gian khaacutec nhau+ Caacutec thagravenh viecircn trong nhoacutem coacute thể lagravem việc cugraveng nhau hoặc ở caacutec tổ chức khaacutecnhau+ Nhoacutem coacute thể vĩnh viễn hoặc tạm thời+ Nhoacutem coacute thể ở bất kỳ mức quản lyacute nagraveo hoặc mức thời gian nagraveo+ Coacute sự điều phối (quaacute trigravenh vagrave nhiệm vụ đạt được) hoặc macircu thuẩn trongnhoacutem+ Coacute sự đạt được hoặcvagrave mất maacutet năng suất trong tổ chức+ Nhiệm vụ phải hoagraven thagravenh rất nhanh+ Khocircng thể hoặc quaacute đắt cho tất cả caacutec thagravenh viecircn trong nhoacutem cugraveng hợp ở mộtnơi+ Một số dữ liệu thocircng tin hoặc kiến thức cần thiết nằm ở nhiều nơi một sốkhaacutec ở ngoagravei tổ chức+ Chuyecircn mocircn của caacutec thagravenh viecircn khocircng coacute trong nhoacutem lagrave cần thiết- Caacutec hoạt động vagrave caacutec quaacute trigravenh miecircu tả caacutec cuộc họp+ Cuộc họp lagrave hoạt động chung liecircn quan bởi một nhoacutem người coacute địa vị bằngnhau hoặc gần bằng nhau+ Kết quả của cuộc họp phụ thuộc một phần vagraveo kiến thức yacute kiến caacutec đaacutenh giaacutecủa caacutec thagravenh viecircn+ Kết quả của cuộc họp cũng phụ thuộc vagraveo sự kết hợp của nhoacutem vagrave phụ thuộcvagraveo quaacute trigravenh ra quyết định được sử dụng bởi nhoacutem đoacute+ Giải quyết caacutec yacute kiến khaacutec nhau bởi người coacute quyền hạn hoặc thương lượnghoặc phacircn xửHỗ trợ giao tiếp- Giao tiếp lagrave thagravenh phần quan trọng cho hỗ trợ quyết định Khocircng coacute giao tiếp thigravekhocircng coacute cộng taacutec Những người ra quyết định caacute nhacircn phải giao tiếp với caacutecđồng nghiệp chuyecircn gia cơ quan chiacutenh phủ khaacutech hagraveng đối taacutec kinh doanh hellipHọ cũng cần dữ liệu vagrave thocircng tin (vagrave kiến thức) từ nhiều nơi trecircn thế giới Caacutecnhoacutem ra quyết định phải giao tiếp cộng taacutec vagrave thương lượng trong cocircng việcHầu hết caacutec tổ chức sẽ nhanh trở thagravenh khocircng coacute chức năng nếu khocircng coacute caacutec hệthống giao tiếp Thương mại điện tử coacute thể hiệu quả chỉ qua caacutec kỹ thuật giao tiếphiện đại- Caacutec kỹ thuật thocircng tin hiện đại cung cấp caacutec phương tiện hỗ trợ giao tiếp rẻnhanh coacute khả năng coacute thể tin cậy Nền tảng hỗ trợ giao tiếp lagrave caacutec hệ thống maacuteytiacutenh mạng+ Bắt đầu bằng điện baacuteo điện thoại radio vagrave ti vi+ Trong 100 năm chuacuteng ta phaacutet triển maacutey fax thư điện tử chương trigravenh chatnhoacutem tin tức hệ thống hội nghị truyền higravenh Hầu hết caacutec kỹ thuật nagravey đềuhoạt động trecircn internet+ Sự phaacutet triển giao tiếp sau cugraveng lagrave hệ thống họp điện tử caacutec dịch vụ vagrave hệ
thống hội nghị điện tử thường sử dụng internet để kết nối caacutec người ra quyếtđịnh- Caacutec thuận lợi aacutep dụng caacutec phương phaacutep giao tiếp cải tiến trong caacutec tổ chức+ Cải tiến năng suất của nhacircn viecircn+ Liecircn quan đến nhiều người ra quyết định chiacutenh+ Khocircng quan tacircm nhiều đến đường biecircn giới địa lyacute+ Tạo nền văn hoacutea hợp taacutec nhất quaacuten+ Cải tiến chất lượng cuộc sống của nhacircn viecircnHỗ trợ cộng taacutec Maacutey tiacutenh hỗ trợ cộng taacutec- Khung thời giannơi chốn+ Sự hiệu quả của kỹ thuật tiacutenh toaacuten cộng taacutec phụ thuộc vagraveo vị triacute của caacutec thagravenhviecircn trong nhoacutem vagrave phụ thuộc vagraveo thời gian chia sẽ thocircng tin gởi vagrave nhận+ Chia sự giao tiếp thagravenh bốn ocirc vagrave tổ chức bốn ocirc dọc theo 2 chiều thời gian vagravenơi chốn1048713 Thời gian Khi gởi vagrave nhận thocircng tin hầu như đồng thời giao tiếp lagrave đồngthời Viacute dụ Điện thoại ti vi vagrave caacutec cuộc họp gặp mặt nhau Giao tiếp bấtđồng bộ xảy ra khi người nhận nhận thocircng tin ở thời điểm khaacutec thời điểmgởi thocircng tin đoacute1048713 Nơi chốn Người gởi vagrave người nhận coacute thể ở cugraveng phograveng hoặc khocircng+ Bốn ocirc lagrave1048713 Cugraveng thời giancugraveng nơi chốn Caacutec thagravenh viecircn gặp mặt nhau cugraveng một luacutecgiống như phograveng quyết định hoặc gặp mặt truyền thống1048713 Cugraveng thời giankhaacutec nơi chốn Caacutec thagravenh viecircn ở caacutec nơi khaacutec nhau nhưnggiao tiếp cugraveng nhau Viacute dụ hội nghị truyền higravenh (videoconferencing)1048713 Khaacutec thời giancugraveng nơi chốn Nhiều người lagravem việc theo ca Ca nagravey để lạithocircng tin cho ca khaacutec1048713 Khaacutec thời giankhaacutec nơi chốn Caacutec thagravenh viecircn ở caacutec nơi khaacutec nhau Caacutecthagravenh viecircn nagravey gởi vagrave nhận thocircng tin ở những lần khaacutec nhau
23Thực thi hệ DSSHệ thống hỗ trợ quản lyacute (MSS) khocircng phải luacutec nagraveo cũng luocircn thagravenh cocircng Nhiều trường hợpthất bại của ES khocircng hoagraven toagraven lagrave lyacute do kỹ thuật Thực thi hệ thống lagrave một quaacute trigravenh liecircn tụcnhằm đảm bảo cho tổ chức chuẩn bị tiếp nhận một hệ thống mới vagrave đưa hệ thống vagraveo sử dụngthagravenh cocircngThực hiện cocircng nghệ hệ thống hỗ trợ quản lyacute lagrave việc phức tạp vigrave caacutec hệ thống nagravey khocircng đơnthuần lagrave hệ thống thocircng tin chỉ thu thập thao taacutec vagrave phacircn phối thocircng tin Magrave xa hơn chuacuteng
liecircn quan tới caacutec cocircng việc coacute thể lagravem thay đổi đaacuteng kể caacutech thức hoạt động của tổ chức Tuyvậy đa số caacutec yếu tố thực thi đều liecircn quan tới hệ thống thocircng tinThực thi MSS lagrave quaacute trigravenh liecircn tục diễn ra trong suốt thời gian phaacutet triển hệ thống từ đề xuấtban đầu đến nghiecircn cứu khả thi thiết kế vagrave phacircn tiacutech hệ thống lập trigravenh huấn luyện chuyểnđổi vagrave lắp đặt Caacutec chuyecircn gia hệ thống thocircng tin thường gọi thực thi lagrave giai đoạn cuối trongvograveng đời hệ thống Định nghĩa thực thi MSS phức tạp hơn vigrave bản chất lặp của sự phaacutet triểncaacutec hệ thống
THỰC THI KHOcircNG HOAgraveN CHỈNHCaacutec quyết định về tiacutenh khả thi thường coacute giả định về lợi iacutech đạt được khi kế hoạch thực thiđược thực hiện hoagraven toagraven Trong thực tế thường chỉ thực hiện 90 thậm chiacute 70 phần trăm sovới phacircn tiacutech khả thi Lyacute do lagrave sự thay đổi tại một nơi trong hệ thống coacute thể ảnh hưởng vagrave coacutethể taacutec động tiecircu cực đến chỗ khaacutec Do vậy cấp quản lyacute coacute thể bỏ những phần trong dự aacuten coacutethể gacircy ra taacutec động xấu Do đoacute dự aacuten sẽ thực hiện iacutet hơn 100 so với dự aacuten kế hoạch Caacutec lyacutedo khaacutec coacute thể lagrave do khấu trừ ngacircn saacutech hoặc vượt chi phiacuteĐAacuteNH GIAacute SỰ THAgraveNH COcircNG CỦA THỰC THI HỆ THỐNGPhải coacute caacutec chỉ số đo lường thigrave mới coacute thể đaacutenh giaacute sự thagravenh cocircng khi thực thi một hệ thốngDickson va Powers (1973) đề ra 5 tiecircu chuẩn độc lậpbull Tỷ lệ thời gian thực hiện dự aacuten với thời gian ước lượngbull Tỷ lệ chi phiacute thực tế vagrave ngacircn saacutech thực hiệnbull Thaacutei độ của cấp quản lyacute đối với hệ thốngbull Nhu cầu thocircng tin của caacutec nhagrave quản lyacute được đaacutep ứng như thế nagraveo qua hệ thốngbull Taacutec động của dự aacuten đối với những hoạt động maacutey tiacutenh trong cocircng tyCaacutec đo lường khaacutec để đaacutenh giaacute thagravenh cocircng của hệ hỗ trợ quản lyacute (MSS)bull Sự sử dụng hệ thống (dự định dugraveng hoặc thực sự dugraveng)bull Thỏa matilden của người dugravengbull Thaacutei độ taacuten thagravenhbull Mức độ hệ thống hoagraven thagravenh caacutec mục tiecircu ban đầubull Phần thưởng đối với tổ chức (giảm chi phiacute tăng doanh thuhellip)bull Tỷ số lợi iacutech chi phiacute
bull Mức độ thể chế hoacutea của MSS trong tổ chứcDo bởi tiacutenh đa dạng của DSS necircn việc đaacutenh giaacute sự thagravenh cocircng của hệ nagravey cũng khoacute khăn tuynhiecircn cũng coacute thể coacute một số yếu tố giuacutep cho DSS thagravenh cocircng như sự tham gia người dugravenghuấn luyện người dugraveng hỗ trợ quản lyacute cấp cao nguồn thocircng tin đặc điểm của những nhiệmvụ coacute liecircn quan (cấu truacutec bất định độ khoacute phụ thuộc)
Chương5Nhoacutem hỗ trợ quyết định vagrave nhoacutemcocircng nghệ phần mềm
51Nhoacutem tạo quyết định
MDM-Holsapple đatilde gợi yacute chuacuteng ta sử dụng giới hạn người tạo quyết định
Một nhoacutem lagrave kết cấu MDM nơi magrave nhiều người ra quyết định hoagraven toagraven tương taacutec
Một đội lagrave kết cấu MDM nơi caacutec thagravenh viecircn tư vấn cho người đưa ra quyết định nhưng khocircng tương taacutec
Một Ủy ban lagrave kết cấu MDM với một người tạo quyết định duy nhất vagrave sự tương taacutec giữa caacutec thagravenh viecircn
Mạng thocircng tin
Mạng lưới baacutenh xe mỗi người tham gia coacute thể giao tiếp với người đưa ra quyết định ở trung tacircm nhưng khocircng phải với người tham gia khaacutecCấu truacutec nagravey lagrave khocircng thỏa matilden tất cả những người tham gia ngoại trừ người ra quyết định
Mạng dacircy chuyền Tham gia chuyển tiếp thocircng tin chỉ để noacute luocircn liền kề nhau trong chuỗi
Thagravenh viecircn cuối cugraveng ko được đaacutep ứng
Mạng vograveng trograven Tương tự như chuỗi nhưng kết thuacutec được kết nối
Mạng kết nối hoagraven toagraven khocircng coacute hạn chế về giao tiếp vagrave tương taacutec giữa caacutec thagravenh viecircnNoacutei chungnoacute đaacutep ứng hầu hết caacutec kết nối của người tham gia nhưng truyền đạt thocircng tin mất nhiều thời gian vagrave coacute nhiều cơ hội xảy ra lỗi
Nhoacutem hagravenh vi vagrave chuẩn mực
MDMs thiết lập caacutec chỉ tiecircu hướng dẫn quaacute trigravenh ra quyết định
Một chuẩn mực quy định cụ thể những gigrave thagravenh viecircn trong nhoacutem dự kiến sẽ lagravem trong những hoagraven cảnh nhất định
Quy tắc gửi coacute thể được thocircng qua viacute dụ đaacutenh giaacute ngang hagraveng hoặc xử phạt
Lagravem thế nagraveo để đưa ra quyết định
Việc chọn lựa magrave trong đoacute việc sử dụng cấu truacutec MDM phải được dựa trecircn một số yếu tố liecircn quan với bối cảnh quyết định
Viacute dụmột cấu truacutec riecircng lẻ sẽ lagravem việc nơi magrave quyết định được cấu truacutec cao vagrave thocircng tin lagrave coacute sẵn
Một ủy ban cơ cấu sẽ lagrave sự lựa chọn khi người ra quyết định khocircng thể đưa ra quyết định một migravenh
52Caacutec vấn đề thường gặp trong nhoacutem
Kiacutech thước Noacutei chung sự nhất triacute vagrave gắn kết giữa caacutec thagravenh viecircn tỉ lệ nghịch với phạm vi nhoacutem Trong nhoacutem lớn rất dễ higravenh thagravenh caacutec nhoacutem nhỏ vagrave hoạt động rời rạc
Tư duy tập thể Trong nhoacutem lớn mọi người coacute xu hướng suy nghĩ đểđạtđược sự nhất triacute necircn khocircng phaacutet huy được sự saacuteng tạo
Caacutec vấn đề về xatilde hội
Xung đột Trong 1 nhoacutem ai cũng muốn migravenh lagrave giỏi nhất necircn dễ dẫn đến xung đột
Ẩn danh(Giấu tecircn) Đacircy lagrave phương phaacutep được sử dụng để kiểm soaacutet xung đột Cho caacutec thagravenh viecircn tham gia ẩn danh
Vấn đề giới tiacutenh Nam vagrave nữ thường coacute những thế mạnh khaacutec nhau điều nagravey coacute thể lagrave sức mạnh trong 1 thiết lập MDM
Đagravem phaacuten vagrave quyết định
Một quyết định coacute thể liecircn quan đến nhiều quan điểm khaacutec nhau vigrave thế cần phải coacute sự đagravem phaacuten
Caacutec thiết kế của cơ chế hỗ trợ cho MDM phải phugrave hợp với caacutec hoạt độngđagravemphaacuten
Những hoạt động nagravey bao gồm việc thu nhận yacute kiến của caacutec thagravenh viecircn 1 caacutech cocircng bằng
53Cocircng nghệ hỗ trợ MDM
Organizational DSSndash 1 hệ thống cung cấp caacutec quyết định hỗ trợ
Group Support Systemndash Cocircng nghệ sử dụng sự hỗ trợ của nhiều becircn tham gia
Group DSS ndash Lagrave 1 hệ thống được thiết kế đặc biệt để hỗ trợ cho MDM
DSS ndash Lagrave 1 hệ thống dưới sự kiểm soaacutet của 1 người quyết định hệ thống nagravey cung cấp 1 bộ cocircng cụ giuacutep phacircn tiacutech hoagraven cảnh đểđưa ra quyết định vagrave nacircng cao hiệu quả của quyết địnhđoacute
53Cocircng nghệ hỗ trợ MDM
Organizational DSSndash 1 hệ thống cung cấp caacutec quyết định hỗ trợ
Group Support Systemndash Cocircng nghệ sử dụng sự hỗ trợ của nhiều becircn tham gia
Group DSS ndash Lagrave 1 hệ thống được thiết kế đặc biệt để hỗ trợ cho MDM
DSS ndash Lagrave 1 hệ thống dưới sự kiểm soaacutet của 1 người quyết định hệ thống nagravey cung cấp 1 bộ cocircng cụ giuacutep phacircn tiacutech hoagraven cảnh đểđưa ra quyết định vagrave nacircng cao hiệu quả của quyết địnhđoacute
Mục tiecircu của cocircng nghệ hỗ trợ MDM
Quy trigravenh hỗ trợ tập trung vagraveo quaacute trigravenh tạo điều kiện thuận lợi cho sự tương taacutec
Cơ chế cấu truacutec quaacute trigravenh chi phối caacutec hoạt động truyền thocircng
Nhiệm vụ hỗ trợ cocircng việc coacute thể chọn lựa tổ chức hoặc lấy thocircng tin
Nhiệm vụ cấu truacutec cocircng việc cho pheacutep truy cập đến kỹ thuật lọc kết hợp phacircn tiacutech kiến thức liecircn quan đến cocircng việc
Caacutec lớp loại cocircng nghệ hỗ trợ MDM
Phacircn loại theo đặc điểm do DeSanctis vagrave Gallupe đưa ra đề xuất một chương trigravenh ba cấp dựa trecircn caacutec tiacutenh năng được cung cấp
Hệ thống cấp 1 Mục điacutech chiacutenh lagrave tạo điều kiện thocircng tin liecircn lạc giữa caacutec thagravenh viecircn
Hệ thống cấp 2 Thiết kế để giảm thiểu rủi ro
Hệ thống cấp 3 Giuacutep điều chỉnh xử lyacute quyết định
Phacircn loại theo cocircng nghệ -Kraemer vagrave King tập trung vagraveo cocircng nghệ aacutep dụng
Cocircng nghệ bảng mạch điện tử
Hội nghị trực tuyến
Mạng lưới tập đoagraven
Trung tacircm thocircng tin
Mocirci trường cộng taacutec
Phograveng quyết định
Nhoacutem phần mềm
Phần mềm được thiết kế để hỗ trợ sự hợp taacutec bao gồm việc thu huacutet vagrave lưu trữ thocircng tin
Caacutec tổ chức dẫn đầu thị trường hiện tại lagrave Lotus Notes and Domino Microsoft Exchange Novell GroupWise and Oracle Office
Caacutec cocircng cụ trong một bộ phần mềm bao gồm người quản lyacute hội nghị (Lotus Sametime) vagrave trao đổi thocircng điệp (Lotus Notes Mail)
Xếp hạng phần mềm cho nhoacutem
Ellis vv đề xuất một hệ thống xếp hạng dựa vagraveo kiểu sự hỗ trợ noacute Cung cấp
Hệ thocircng điệp
Hệ thống hội thảo truyền higravenh
Hệ thống cộng taacutec soạn thảo
Nhoacutem phacircn phối giải phaacutep phần mền
Hệ thống phối hợp
Hệ thống thocircng minh đại diện
Lực lượng điều khiển phaacutet triển phần mềm cho nhoacutem
Một số nhacircn tố chiacutenh bao gồm
Tăng năng suất
Giảm số lượng caacutec cuộc họp
Tăng cường tự động hoacutea caacutec quy trigravenh lagravem việc thường xuyecircn
Cần phối hợp toagraven cầu tốt hơn
Tiacutenh sẵn sagraveng của những mạng lan rộng
Coleman vagrave Khanna liệt kecirc 10 nhacircn tố khaacutec
54Quản lyacute hoạt động MDM (Mobile Device Management - Quản lyacute thiết bị di động)
Một số phương phaacutep phối hợp phổ biến hơnMDM lagrave
Kỹ thuật nhoacutem định danh
Kỹ thuật Delphi
Sự phacircn xử
Hệ thocircng tin dựa trecircn vấn đề
Nemawashi
Kỹ thuật nhoacutem định danh
1-Mỗi người tham gia viết ra những yacute tưởng về những gigrave necircn quyết định
2-Lần lượt mỗi người tham gia trigravenh bagravey yacute tưởng của migravenh được ghi lại trecircn bảng Khocircng thảo luận ở đacircy
3-Sau khi tất cả caacutec yacute tưởng được trigravenh bagravey caacutec đại biểu coacute thể chất vấn những người khaacutec
4-Mỗi người tham gia bỏ phiếu cho mỗi yacute tưởng
Kỹ thuật Delphi
Về cơ bản tương tự như kỹ thuật nhoacutem định danh ngoại trừ những người khocircng bao giờ tham gia cuộc họp
Một cocircng cụ khảo saacutet được sử dụng để thu thập đầu vagraveo ban đầu từ caacutec thagravenh viecircn
Một cuộc khảo saacutet thứ hai được gửi đi với một bản toacutem tắt caacutec kết quả chung
Những bước lặp lại cho đến khi đạt được một sự đồng thuận hoặc nhigraven nhận của đa số
Sự phacircn xử(Arbitration )
Thiacutech hợp nhất khi caacutec thagravenh viecircn của MDM đại diện cho caacutec yếu tố đối lập
Những người tham gia đồng yacute rằng nếu lựa chọn thay thế hai becircn thỏa thuận khocircng được tigravem thấy thigrave một trọng tagravei viecircn becircn ngoagravei sẽ tham gia
Trọng tagravei sau đoacute lựa chọn thay thế ocircng hoặc xeacutet thấy thiacutech hợp nhất
Hệ thống thocircng tin dựa trecircn vấn đề (IBIS)
Lagrave một phương phaacutep lập luận cấu truacutec
Một đại diện cho IBIS lagrave một đồ thị với caacutec nuacutet vagrave caacutec liecircn kết
IBIS bắt đầu với lựa chọn của một nuacutet vấn đề gốc sau đoacute caacutec nuacutet vị triacute khaacutec nhau được liecircn kết với nuacutet gốc
Caacutec nuacutet vị triacute nagravey sau đoacute được đaacutenh giaacute dựa trecircn những lập luận gắn liền với chuacuteng
Nemawashi (được sử dụng rộng ratildei tại Nhật Bản)
1-Một hoặc nhiều thagravenh viecircn của MDM được chỉ định lagrave điều phối viecircnCaacutec điều phối viecircn sau đoacute chọn người tham gia cograven lại
2-Điều phối viecircn xacircy dựng một tổng hợp caacutec sự lựa chọn vagrave sau đoacute caacutec chuyecircn gia đaacutenh giaacute caacutec lựa chọn
3-Điều phối viecircn lựa chọn một sự lựa chọn dựa trecircn kết quả ở trecircn(ở 2)
4-Sự thay thế được luacircn chuyển điều phối viecircn tigravem kiếm sự đồng thuận thocircng qua sự thuyết phục vagrave đagravem phaacuten
5-Nếu đạt được sự đồng thuận điều phối viecircn cho lưu thocircng một tagravei liệu magrave mỗi thagravenh viecircn MDM để lại dấu hiệu trecircn đoacute
55Nơi lagravem việc ảo
Nhiều tổ chức trecircn toagraven thế giới kinh doanh bất động sản cho cocircng nghệ hợp taacutec
Cocircng việc được trở thagravenh một điều bạn lagravem hơn lagrave một nơi bạn đi
Những thay đổi lớn nhất mang lại bởi nơi lagravem việc ảo coacute thể lagrave về văn hoaacute hay xatilde hội hơn lagrave về cocircng nghệ
Chương 6 Hệ thống thocircng tin điều hagravenh
61 Yacute nghĩa của EIS- Hệ thống thocircng tin điều hagravenh
- EIS lagrave một dạng đặc biệt của DSS được thiết kế để hỗ trợ ra quyết định ở cấp cao nhất của một tổ chức
- Lagrave một hệ thống thocircng tin hỗ trợ nhu cầu lập kế hoạch vagrave đaacutenh giaacute của caacutec nhagrave quản lyacute điều hagravenh
- EIS coacute thể giuacutep một CEO coacute được bức tranh tổng thể chiacutenh xaacutec nhất về caacutec hoạt động vagrave một bản toacutem tắt những gigrave magrave đối thủ cạnh tranh đang lagravem
- Caacutec hệ thống nagravey noacutei chung hoạt động dễ dagraveng vagrave trigravenh bagravey thocircng tin theo những caacutech dễ hiểu để việc tiếp thu được nhanh choacuteng (biểu đồ đồ thịhellip)
(Tagravei liệu thecircm EIS lagrave những loại hệ thống lagrave rất phức tạp trong tự nhiecircn Coacute thể noacutei hệ thống nagravey cũng cung cấp cho caacutec nhagrave quản lyacute với caacutec thiết bị coacute khả năng ra quyết định bằng caacutech sử dụng của noacute Hệ thống nagravey hoạt động trong điều kiện như vậy quan trọng như trong caacutec hệ thống khaacutec khocircng hỗ trợ Khả năng lưu trữ dữ liệu nặng lagravem cho noacute lyacute tưởng để được thocircng qua khocircng chỉ bởi caacutec doanh nghiệp lớn magrave cograven bởi caacutec doanh nghiệp nhỏ hơn Nhigraven chung hệ thống nagravey lagrave dagravenh cho caacutec nhacircn viecircn cấp cao hỗ trợ thagravenh thạo trong việc đưa ra caacutec quyết định quan trọng)
Caacutec phiecircn EIS tiecircu biểu- Phiecircn lagravem việc coacute thể bắt đầu với một baacuteo caacuteo về tigravenh higravenh tagravei chiacutenh vagrave kinh
doanh của một cocircng ty caacutec chỉ số hoạt động quan trọng được hiển thị rotilde ragraveng- EIS sẽ cho pheacutep caacutec giaacutem đốc điều hagravenh coacute thể đi sacircu vagraveo dữ liệu từ những con
số bất kỳ magrave noacute hỗ trợ- Việc điều hagravenh coacute thể lựa chọn một mức độ chi tiết ( VD danh số baacuten hagraveng) nếu
như cần điều tra thecircm- Lagrave một phương phaacutep tiếp cận coacute thể giuacutep việc ra quyết định tốt hơn
Những điều magrave EIS ko coacute- EIS khocircng phải lagrave sự thay thế cho caacutec hệ thống dựa trecircn caacutec maacutey tiacutenh khaacutec EIS
thực sự chỉ cung cấp dữ liệu cho caacutec hệ thống nagravey- Noacute khocircng thể biến caacutec bộ hệ điều hagravenh của maacutey tiacutenh thagravenh những ldquochuyecircn viecircn
giỏirdquo- Coacute thể được viacute một caacutech cao hơn như lagrave một trợ lyacute đaacuteng tin cậy coacute thể được gọi
đến bất khi nagraveo vagrave mỗi khi cần thiết
Tagravei liệu thecircm Sự khaacutec nhau giữa EIS vagrave DSS+ EIS thiết kế để hỗ trợ những người điều hagravenh cấp cao giuacutep họ khaacutem phaacute caacutec vấn đề vagrave caacutec cơ hội DSS hỗ trợ những nười phacircn tiacutech cố gắng trả lời cacircu hỏi caacutei gigrave coacute thể lagravem cugraveng với một cơ hội hoặc một vấn đề
Chiều EIS DSSNhững người sử dụng thocircng thường
Duyệt dữ liệu đi xuống truy xuất trạng thaacutei
Hỗ trợ phacircn tiacutech vagrave quyết định
Sự thuacutec đẩy Tiacutenh thiacutech hợp Tiacutenh hiệu quảỨng dụng Queacutet mocirci trường đaacutenh giaacute
hiệu suất nhận dạng caacutec vấn đề vagrave caacutec cơ hội
Caacutec quyết định quản lyacute trecircn caacutec lĩnh vực đa dạng
Hỗ trợ quyết định Caacutec chiacutenh saacutech caacutec quyết định khocircng coacute cấu truacutec ở mức cao vagrave hỗ trợ giaacuten tiếp
Hỗ trợ caacutec quyết định lặp lại caacutec quyết định khocircng thể đoaacuten trước ra quyết định khocircng coacute cấu truacutec vagrave baacuten cấu truacutec
Loại thocircng tin Caacutec thocircng tin tin tức thocircng tin becircn ngoagravei về khaacutech hagraveng đối thủ cạnh tranh mocirci trường caacutec baacuteo caacuteo theo yecircu cầu vagrave định thời về caacutec hoạt động becircn trong
Caacutec thocircng tin hỗ trợ caacutec tigravenh huống đặc biệt
Sử dụng coacute nguyecircn tắc
Dograve theo vết vagrave điều khiển nhận dạng cơ hội
Hoạch định tổ chức phacircn nhoacutem vagrave điều khiển
Khả năng phugrave hợp với những người sử dụng caacute nhacircn
Thiết kế loại ra quyết định cho mỗi người điều hagravenh caacute nhacircn bằng nhiều lựa chọn đầu ra
Cho pheacutep caacutec đaacutenh giaacute caacute nhacircn caacutec khả năng what-if lựa chọn loại hộp hội thoại
Đồ họa Phải coacute Lagrave một phần quan trọng của nhiều DSS
Thacircn thiện người sử dụng
Phải coacute Phải coacute nếu khocircng coacute người sử dụng trung gian
Xử lyacute thocircng tin Lọc neacuten thocircng tin dograve theo vết dữ liệu vagrave thocircng tin quan trọng
EIS kiacutech thiacutech caacutec cacircu hỏi caacutec cacircu trả lời bằng caacutech sử dụng DSS vagrave phản hồi lại EIS
Hỗ trợ caacutec thocircng tin chi tiết
Truy xuất thường xuyecircn caacutec mức chi tiết của bất kỳ thocircng tin tổng hợp nagraveo (duyệt dữ
Coacute thể coacute trong DSS nhưng khocircng thường
liệu chi tiết)Cơ sở mocirc higravenh Caacutec chức năng coacute sẵn bị hạn
chếLagrave điểm cốt lotildei của DSS
Cấu truacutec Theo người baacuten sản phẩm hoặc theo caacutec chuyecircn gia hệ thống thocircng tin
Theo người sử dụng hoặc caacute nhacircn hoặc caacutec chuyecircn gia từ caacutec trung tacircm thocircng tin hoặc phograveng ban hệ thống thocircng tin
Phần cứng Mainframe caacutec trạm RISC mạng LANs hoặc caacutec hệ thống phacircn bố
Mainframe caacutec trạm RISC caacutec maacutey PC hoặc caacutec hệ thống phacircn bố
Bản chất caacutec goacutei phần mềm
Truy xuất tương taacutec dễ dagraveng đến nhiều cơ sở dữ liệu truy xuất trực tuyến caacutec khả năng DBMS phức tạp caacutec liecircn kết phức tạp
Caacutec khả năng tiacutenh toaacuten lớn caacutec ngocircn ngữ mocirc higravenh mocirc phỏng ứng dụng vagrave caacutec bộ tạo DSS
Bản chất caacutec thocircng tin
Trigravenh bagravey thocircng tin được phaacutet sinh trước về quaacute khứ vagrave hiện tại tạo caacutec thocircng tin mới về quaacute khứ hiện tại tương lai
Tạo thocircng tin mới về quaacute khứ hiện tại tương lai
62 Lịch sử EIS- EIS xuất hiện lần đầu tiecircn tại MIT vagraveo những năm 1970
- Những EIS đầu tiecircn được phaacutet triển bởi caacutec doanh ngiệp lớn sẵn sagraveng chấp nhận rủi ro để đạt được lợi thế cạnh tranh
- Vagraveo những năm 1980 caacutec nhagrave cung cấp đatilde phaacutet triển một số cơ sở khaacutech hagraveng rộng vagrave cocircng nghệ EIS được tiếp tục phaacutet triển cho đến ngagravey nay
(Tagravei liệu thecircm Sử dụng DSSEIS cho phaacutet triển bền vững + Một số nghiecircn cứu đatilde được tiến hagravenh để kiểm tra việc thực hiện của EIS trong khu vực cocircng cộng vagrave chiacutenh phủ caacutec nước tổ chức kể từ khi chuacuteng được phaacutet triển theo định hướng lợi nhuận cho caacutec cocircng ty tư nhacircn (Hasan vagrave Hasan năm 1997) Theo một nghiecircn cứu tiến hagravenh tại Mỹ ở hơn 300 cocircng ty kết quả cho thấy sự khaacutec biệt của EIS giữa tư nhacircn vagrave chiacutenh phủ một số kết quả thuacute vị được phaacutet hiệnViacute dụ khoacute khăn hơn để chuyển tiền từ một tagravei khoản khaacutec trong một EIS của chiacutenh phủ cũng lagrave khoacute khăn hơn để biện giải thiacutech cho những chi phiacute phaacutet triển EIS của chiacutenh phủ Một nghiecircn cứu khaacutec được tiến hagravenh ở Australia
cho thấy rằng EIS cung cấp cho quản lyacute một higravenh ảnh chiacutenh xaacutec hơn về tổ chức thực hiện vagrave cung cấp hỗ trợ cho caacutec lợi iacutech chiến lược cải thiện khocircng chỉ cho caacutec nhagrave quản lyacute nhưng cograven cho phần cograven lại của tổ chức Dựa trecircn caacutec hệ thống được thiết kế cho caacutec cocircng ty tư nhacircn với một caacutech rotilde ragravengxaacutec định mục tiecircu EIS lagrave thiacutech hợp cho caacutec tổ chức cocircng cộng hiện đại nhưng cần phải được linh hoạt hơn vagrave kết thagravenh chugravem một phạm vi rộng hơn khả năng vagrave phương tiện hơn so với khu vực tư nhacircn ban đầu theo định hướng sản phẩm (Hasan vagrave Hasan năm 1997) Điều nagravey coacute thể lagrave do thực tế rằng caacutec hoạt động khu vực cocircng lagrave bắt buộc coacute taacutec động rộng phải đaacutep ứng sự mong đợi duy nhất cocircng cộng thường coacute mục tiecircu mơ hồ vagrave macircu thuẫn iacutet quyền tự chủ vagrave kiểm soaacutet việc ra quyết định vagrave nhacircn viecircn lagrave khoacute khăn hơn (Watson vagrave Carte2000) + Toacutem lại EIS lagrave một khaacutei niệm thagravenh cocircng noacute phaacutet triển qua nhiều năm tuy nhiecircn EIS khắc phục khiếm khuyết của migravenh bằng caacutech tiến hagravenh nghiecircn cứu liecircn tục)
63 Tại sao những người điều hagravenh hagraveng đầu lại khaacutec nhau- Họ lagrave những doanh nghiệp theo định hướng coacute suy nghĩ
- Coacute một khoảng khocircng gian rộng để kiểm soaacutet
- Họ chịu traacutech nhiệm cho việc thiết lập chiacutenh saacutech
- Họ đại diện cho tổ chức mocirci trường becircn ngoagravei
- Hagravenh động của họ tạo ra những kết quả đaacuteng kể về tagravei chiacutenh vagrave con người
Tần số caacutec hoạt động điều hagravenh- Xử lyacute xaacuteo trộn 42
- Hoạt động kinh doanh 32
- Phacircn bổ nguồn lực 17
- Đagravem phaacuten 3
- Những điều khaacutec 6
Handling Disturbances 42
Entrepreneurial Activites 32
Resource Allocation 17
Negotiation 3
Other 6
Những thocircng tin điều hagravenh cần thiết- Quản lyacute xaacuteo trộn coacute thể yecircu cầu sự chuacute yacute xung quanh đồng hồ
- Hoạt động kinh doanh yecircu cầu điều hagravenh để dự đoaacuten những thay đổi trong mocirci trường
- Nhiệm vụ phacircn bổ tagravei nguyecircn yecircu cầu lựa chọn người quản lyacute vagrave caacutec nguồn lực hạn chế được triển khai
- Đagravem phaacuten yecircu cầu cập nhật thocircng tin từng phuacutet để coacute thể xacircy dựng được sự đồng thuận
Caacutec loại thocircng tin điều hagravenh- Hệ thống kế toaacuten coacute liecircn quan đến việc tiacutenh toaacuten thu nhập hoạt động cho caacutec lĩnh
vực cụ thể lagrave quan trọng hơn so với caacutec hệ thống kế toaacuten truyền thocircng- Thocircng tin về thị trường khaacutech hagraveng cung cấp giaacute trị trong việc quyết định chiến
lược- Caacutec thocircng tin cần thiết thường được truyền đi trecircn một số hệ thống maacutey tiacutenh vagrave
nằm trong toagraven tổ chức- Caacutec thocircng tin được sử dụng thường lagrave ngắn hạn vagrave dễ thay đổi
Phương thức để xaacutec định thocircng tin cần thiết
Rockart xaacutec định được năm phương thức cơ bản để xaacutec định thocircng tin cần thiết
- Phương thức dựa trecircn kết quả- Phương thức rỗng- Phương thức chỉ số khoacutea- Phương thức tổng hợp nghiecircn cứu- Phương thức dựa vagraveo nhacircn tố then chốt dẫn đến thagravenh cocircng
64 Thagravenh phần EIS
- Sản phẩm EIS đầu tiecircn được phaacutet triển để sử dụng trecircn maacutey tiacutenh cấu higravenh cao nhưng caacutec sản phẩm hiện nay nhằm mục tiecircu lagrave nền tảng ClientServer
- Những nền tảng linh hoạt hơn coacute thể thiacutech ứng với thay đổi trong tổ chức vagrave cocircng nghệ
- Sử dụng dữ liệu thời gian thực dẫn đến quyết định nhanh hơn nhiều thocircng tin hơn
Thagravenh phần phần cứng- Một EIS khocircng đogravei hỏi coacute phần cứng cụ thể hoặc duy nhất nagraveo- Chigravea khoacutea của vấn đề lagrave để đảm bảo rằng caacutec thagravenh phần của EIS tối ưu hoacutea vagrave
phugrave hợp với tagravei nguyecircn maacutey tiacutenh của tổ chức- Hệ thống nagravey phải được cấu higravenh để caacutec nguồn tagravei nguyecircn phugrave hợp với những
người điều hagravenh chuacuteng
Thagravenh phần phần mềm- Traacutei ngược với phần cứng phần mềm thường được chuyecircn mocircn hoacutea cao cho caacutec
bagravei toaacuten về miền- Sự chuyecircn mocircn hoacutea nagravey thường đạt được bằng caacutech sử dụng thagravenh phần off-the-
shelf cho toagraven bộ EIS vagrave caacutec mocirc-đun tugravey chỉnh để đaacutep ứng nhu cầu cụ thể- Lotus Notes lagrave một viacute dụ điển higravenh Noacute coacute thể được sử dụng một migravenh hoặc coacute
thể phục vụ becircn thứ ba mocirc-đun plug-in
Cocircng nghệ EIS hiện nay
Dobrzeniecki đề xuấtphacircn loạitừng cấptheo bachức năng- Loại 1 sản phẩm bao gồmmột bộ đầy đủcaacutec ứng dụngtừ mộtnhagrave cung cấp- Loại 2 sản phẩm đượcthựchiệnở phần đầu củacaacutecsản phẩmDSS đượcphaacutet triển
bởicugravengmộtnhagrave cung cấp- Loại 3 sản phẩmkết hợp với nhautheo bất kỳ số lượngthuộc sở hữu củacocircng ty
65 Xacircy dựng EIS
- Xacircy dựngmộtEISgiống nhưxacircydựngmột số hệ thống khaacutec củamocirc higravenh hệ thống thocircng tin
- Việcphaacutet triểncấu truacutecnecircn được theo dotildeitừ quaacute trigravenh thiết kế đến quaacute trigravenhthực hiện
- Tuy nhiecircn một dự aacuten phaacutet triển EIScoacute xu hướnglagrave thống nhấtvagraveyecircu cầu hỗ trợ caacutec nhagrave quản lyacute latildenh đạo
- Xacircy dựng một EIScoacute thểphaacutet hiện ra đượccaacutectigravenh huống khoacute khănmagravemột nhagrave phaacutet triển chưabao giờ gặp phải
Mocirc higravenh EIS
Khung phaacutet triển một EIS
- Watson et al đề nghị xacircy dựngkhung với ba thagravenh phần+ Caacutech tiếp cận tập trung vagraveo yếu tốcon người vagrave dữ liệu coacute liecircn quan đến EIS+ Quaacute trigravenh phaacutet triển cần sự linh hoạt vagrave tương taacutec+ Người sử dụng - hệ thống hộp thoại bao gồm một ngocircn ngữ hagravenh động để xử lyacute caacutec lệnh
Lợi iacutech của EIS- Dễ duy trigrave caacutec mục tiecircu coacute tổ chức- Dễ truy xuất thocircng tin- Cho pheacutep người sử dụng nacircng cao hiệu suất hơn
- Tăng chất lượng ra quyết định- Cung cấp sự cải tiến cạnh tranh- Tiết kiệm thời gian của người sử dụng- Tăng khả năng vagrave chất lượng giao tiếp- Cung cấp khả năng điều khiển tốt hơn trong tổ chức- Cho pheacutep tham gia caacutec vấn đề vagrave caacutec cơ hội- Cho pheacutep hoạch định- Cho pheacutep tigravem kiếm nguyecircn nhacircn của một vấn đề- Thảo matilden caacutec yecircu cầu của người điều hagravenh
Hạn chế của EIS vagrave 1 số sai lầm cần traacutenh
- Chi phiacute một cuộc khảo saacutetnăm1991 chothấychi phiacute phaacutet triểntrungbigravenh365000USDvớichi phiacute vận hagravenhhagraveng năm lagrave$200000 (EIS)
- Cocircng nghệ hạn chếEIScần phảiđượctiacutech hợp hoagraven toagravenvagraveokiếntruacuteccủadoanh nghiệphiện tại do đoacute noacutelagrave một thaacutech thứclớn đối vớithiết kế
- Hạn chế tổ chức cơ cấu tổ chứccoacute thể khocircng phugrave hợp
Sự hạn chế về tổ chức- Chương trigravenh nghị sự vagrave thời gian chệch EIS mocirc tả một phần việc thực hiện một
chương trigravenh nghị sự vagrave coacute thể dễ dagraveng đạt được sự tin cậy một caacutech chắc chắn- Đồng bộ hoacutea việc quản lyacute sự tin cậy đuacuteng luacutec đặc biệt baacuteo caacuteo EIS coacute thể phaacute
vỡ sự ổn định thiết lập caacutec chu trigravenh baacuteo caacuteo một caacutech tốt nhất- Sự bất ổn EIS phản ứng nhanh coacute thể gacircy ra việc taacutec động trở lại một caacutech
nhanh choacuteng dẫn đến sự thiếu ổn định trong tổ chức
Sự thất bại lagrave thay thế khocircng thể chấp nhận được- Một số yếu tố lagravem EIS thất bại
+ Thiếu sự hỗ trợ về mặt quản lyacute+ Vấn đề chiacutenh trị+ Thất bại của nhagrave phaacutet triển+ Lỗi về cocircng nghệ+ Giaacute cả+ Thời gian
66 Ra quyết định điều hagravenh trong tương lai vagrave EIS
- Coacute một vagravei điều kiện sẽ được hợp nhất cho việc chuyển đổi cocircng nghệ Trong đoacute một vagravei điều kiện coacute thể dễ dự đoaacuten Hai điều kiện magrave ta coacute thể thấy lagrave+ Phaacutet triển cocircng nghệ maacutey tiacutenh trong việc điều hagravenh sẽ tạo ra sự chuyển đổi được chấp nhận một caacutech dễ dagraveng hơn+ Mở rộng traacutech nhiệm điều hagravenh sẽ mở rộng nhu cầu thocircng tin
Tương lai của EIS- EIS thocircng minh Những tiến bộ trong cocircng nghệ AI sẽ được triển khai trong caacutec
EIS- EIS đa phương tiện Cơ sở dữ liệu đa phương tiện sẽ cho pheacutep tiacutech hợp văn bản
giọng noacutei vagrave higravenh ảnh trong tương lai- EIS thocircng tin Tương lai EIS sẽ mở rộng hơn trong việc sử dụng dữ liệu becircn
ngoagravei doanh nghiệp- EIS kết nối Giao tiếp với băng thocircng rộng cho pheacutep kết nối liecircn thocircng lớn hơn
Chương 7 HỆ CHUYEcircN GIA VAgrave TRIacute TUỆ NHAcircN TẠO
71 Caacutec khaacutei niệm
72 Triacute thocircng minh của triacute tuệ nhacircn tạo
73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia
74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia
75 Lợi iacutech vagrave hạn chế của hệ chuyecircn gia
71 Caacutec khaacutei niệm
Chuyecircn mocircn (Expertise) sự hiểu biết rộng trong 1 lĩnh vực hẹp
Hệ chuyecircn gia (Expert Systems)1 chương trigravenh maacutey tiacutenh sử dụng 1 tập caacutec luật dựa trecircn tri thức của con người để giải quyết caacutec vấn đề đogravei hogravei phải coacute sự chuyecircn mocircn
Một số hệ chuyecircn gia nổi tiếng
DENDRAL (Standford 1960s Edward Feigenbaum)
MYCIN (Standford1970s Edward Shortliffe)
PROSPECTOR (MIT 1979)
Triacute tuệ nhacircn tạo (Artificial Intelligence ndash AI)
Triacute tuệ nhacircn tạo một bộ phacircn của ngagravenh khoa học maacutey tiacutenh quan tacircm đến việc thiết kế caacutec hệ thống maacutey tiacutenh thocircng minh đoacute lagrave caacutec hệ thống đưa ra caacutec đặc điểm magrave từ đoacute chuacuteng ta liecircn hệ với sự thocircng minh trong hagravenh động của con người (Barr vagrave Feigenbaum 1981)
Mục điacutech của AI
Mục điacutech khoa học xaacutec định caacutec gợi yacute để giải thiacutech caacutec loại khaacutec nhau của triacute tuệ thực
Mục điacutech kỹ thuật giải quyết caacutec vấn đề trong thế giới thực
Triacute tuệ nhacircn tạo kế thừa nhiều yacute tưởng quan điểm kỹ thuật từ caacutec ngagravenh khoa học khaacutec
- Triết học
- Logic Toaacuten học
- Tiacutenh toaacuten
- Khoa học tacircm lyacute Khoa học nhận thức
- Sinh học Thần kinh học
- Tiến hoacutea
Caacutec lĩnh vực ứng dụng trong Triacute tuệ nhacircn tạo
Mạng nơ ron thần kinh (Neural Networks)
Tiacutenh toaacuten sự tiến hoacutea
(Evolutionary Computation)
Hệ chuyecircn gia (Expert Systems)
Kỹ thuật xử lyacute tiếng noacutei (Speech Processing)
Kỹ thuật xử lyacute ngocircn ngữ tự nhiecircn
(Natural Language Processing)
Lập kế hoạch (Planning)
Robot (Robotics)
Khoa học higravenh ảnh (Vision)
Caacutec kỹ thuật thocircng dụng dugraveng trong AI
Biểu diễn(Representation)
Học (Learning)
Caacutec luật (Rules)
Tigravem kiếm (Search)
72 Triacute thocircng minh của triacute tuệ nhacircn tạo
Con người suy diễn như thế nagraveo
Phacircn loại (Categorization)
Caacutec quy tắc cụ thể
Heuristics
Kinh nghiệm trước đoacute
Dự tiacutenh trước
Maacutey tiacutenh suy diễn như thế nagraveo
Lập luận dựa trecircn luật IF-THEN mocirc tả tri thức được matilde hoacutea dưới dạng caacutec luật
Caacutec khung (Frames) lagrave caacutec đại diện mocirc tả caacutec tigravenh huống giống nhau lagrave điển higravenh của một vagravei phacircn loại
Lập luận dựa trecircn caacutec trường hợp mocirc phỏng giải phaacutep trước đoacute cho một vấn đề hiện tại
Nhận dạng mẫu phaacutet hiện acircm thanh higravenh dạng hoặc caacutec chuỗi dagravei
Caacutec dạng khaacutec của Triacute tuệ nhacircn tạo
Học maacutey- mạng nơron vagrave giải thuật di truyền
Lập trigravenh tự động ndash lagrave những kỹ thuật tạo ra caacutec chương trigravenh để lagravem 1 nhiệm vụ riecircng biệt (cho pheacutep những người khocircng phải lagrave người lập trigravenh coacute thể lập trigravenh được)
Cuộc sống nhacircn tạo ndash nỗ lực để taacutei tạo caacutec hiện tượng sinh học trong caacutec hệ thống dựa trecircn maacutey tiacutenh
73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia(Expert Systems- ES)
Theo Jackson (1999) Một hệ chuyecircn gia lagrave một chương trigravenh maacutey tiacutenh mocirc tả vagrave suy diễn với tri thức của một vagravei lĩnh vực để giải quyết vấn đề hay đưa ra caacutec lời khuyecircn
Cấu truacutec cơ bản của ES được dựa theo cấu truacutec chung của DSS Sự khaacutec biệt chiacutenh giữa ES vagraveDSS lagrave hệ ES thu thập caacutec kiến thức từ những
chuyecircn gia trong lĩnh vực quan tacircmĐặc trưng của hệ chuyecircn gia Hiệu quả cao Thời gian trả lời thỏa đaacuteng Độ tin cậy cao Dễ hiểu
Giao diện người dugraveng trong ES
Thiết kế giao diện người dugraveng tập trung vagraveo caacutec yếu tố như dễ dagraveng sử dụngcoacute độ tin cậy cao giảm tải những khoacute khăn khi sử dụng
Thiết kế necircn coacute một số tương taacutec (đầu vagraveo kiểm soaacutet vagrave truy vấn)
Cấu tạo giao diện người dugraveng gồm coacute magraven higravenh cảm ứng bagraven phiacutem buacutet saacuteng lệnh thoại caacutec phiacutem chuyecircn dụng
Cơ sở tri thức (Knowledge Base)
Chứa đựng caacutec tri thức cụ thể miền thu được từ caacutec chuyecircn gia miền
Coacute thể chứa caacutec mocirc tả caacutec hagravenh vi giải quyết vấn đề caacutec ragraveng buộc caacutec heuristics
Thagravenh cocircng của một ES dựa trecircn tiacutenh đầy đủ vagrave tiacutenh chiacutenh xaacutec của cơ sở tri thức
Mocirc tơ suy diễn (Inference Engine)
Ở đacircy tri thức được đặt để sử dụng tạo ra caacutec giải phaacutep để giải quyết vấn đề
Mocirc tơ nagravey coacute khả năng thực hiện diễn dịch hoặc suy diễn dựa trecircn caacutec luật hay caacutec caacutec sự kiện
Đồng thời cũng coacute khả năng sử dụng caacutec suy diễn mờ hay khocircng chiacutenh xaacutec dựa trecircn xaacutec suất hay aacutenh xạ mẫu
Vograveng điều khiển suy diễn
1 Aacutenh xạ caacutec luật với caacutec sự kiện đatilde được cho
2 Chọn luật để thực hiện
3 Thực hiện luật bằng caacutech thecircm caacutec sự kiện được suy diễn ra vagraveo bộ nhớ lagravem việc
Chuỗi suy diễn (Chaining)
Suy diễn tiến (forward chaining) maacutey suy diễn bắt đầu từ dữ liệu ban đầu vagrave thực hiện việc suy luận để đưa ra caacutec kết luận cuối cugraveng
Suy diễn lugravei (backward chaining) maacutey suy diễn bắt đầu từ dữ liệu điacutech vagrave tigravem ra tri thức hỗ trợ cho dữ liệu điacutech đoacute
Viacute dụ suy diễn lugravei
R1 Nếu coacute A vagrave B thigrave suy ra coacute D
R2 Nếu coacute B thigrave suy ra coacute C
R3 Nếu coacute C vagrave D thigrave suy ra coacute E
Ta coacute E ta xem trong 3 luật R1 R2 R3 luật nagraveo coacute E ta thấy R3 chứa E đồng thời chứa C vagrave D Xeacutet tiếp trong 2 luật R1 R2 luật nagraveo chứa C vagrave D R2 chứa C R3 chứa D Từ đoacute ta coacute được caacutec tri thức hỗ trợ suy diễn vagrave kết luận lagrave nếu coacute A vagrave B thigrave sẽ coacute E Hay nếu A vagrave B đuacuteng thigrave sẽ coacute E
Viacute dụ suy diễn tiến
Giả sử coacute tập chứa 3 luật sau
R1 Nếu coacute A vagrave B thigrave suy ra coacute D
R2 Nếu coacute B thigrave suy ra coacute C
R3 Nếu coacute C vagrave D thigrave suy ra coacute E
Nếu ta coacute A vagrave B thigrave chuacuteng ta suy ra được D từ R1 vagrave suy ra C từ R2 Với D vagrave C đatilde được suy ra ở trecircn giờ chuacuteng ta suy ra được E từ R3
Viacute dụ thực tế
Giả sử muốn biết magraveu của một con vật nuocirci tecircn lagrave Fred biết rằng noacute kecircu ộp ộp vagrave ăn ruồi
Coacute tập 4 luật ban đầu như sau
R1 Nếu X kecircu ộp ộp vagrave ăn ruồi thigrave X lagrave con ếch
R2 Nếu X kecircu chiecircm chiếp vagrave biết hoacutet thigrave X lagrave con chim
R3 Nếu X lagrave con ếch thigrave X coacute magraveu xanh
R4 Nếu X lagrave con chim thigrave X coacute magraveu vagraveng
74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia
Expert system shells lagrave một tập caacutec goacutei phần mềm vagrave caacutec cocircng cụ dugraveng để phaacutet triển caacutec hệ chuyecircn gia
Những Expert system shells đầu tiecircn thường rất rườm ragrave Mặc dugrave vậy noacute vẫn giuacutep cho người sử dụng sẽ khocircng phải bắt đầu lại từ đầu khi xacircy dựng một hệ chuyecircn gia mới
Những shell hiện đại bao gồm hai mocirc-đun chiacutenh lagrave cocircng cụ xacircy dựng một tập quy tắc vagrave mocirc tơ suy diễn
Xacircy dựng hệ chuyecircn gia
Bước 1 xacircy dựng mocirc higravenh bagravei toaacuten xaacutec định vấn đề nhiệm vụ magrave hệ thống sẽ thực hiện Caacutec dạng bagravei toaacuten cần hệ chuyecircn gia
Bagravei toaacuten diễn giải (InterPretation)
Bagravei toaacuten dự baacuteo (Prediction)
Bagravei toaacuten chuẩn đoaacuten (Diagnose)
Bagravei toaacuten gỡ rối (Debugging)
Bagravei toaacuten thiết kế
Tương tự như một dự aacuten phần mềm để xacircy dựng một hệ chuyecircn gia cần phải coacute caacutec yếu tố về nhacircn lực tagravei nguyecircn vagrave thời gian Những yếu tố nagravey ảnh hưởng đến giaacute thah của một hệ chuyecircn giaTrong phần nagravey cacircu hỏi thường được đặt ra lagrave tại sao cần phải xacircy dựng một hệ chuyecircn giaTrước khi bắt đầu phải xaacute định rotilde bagravei toaacuten đạt ra lagrave jiAi lagrave chuyecircn giaAi lagrave người sử dụng
1 Diễn giải (InterPretation) Nghiecircn cứu 1 vấn đề -gt Dựa trecircn những biểu hiện thuộc tiacutenh đặc trưng becircn ngoagravei -gt Tư vấn
(hoặc đưa ra kết luận hay mocirc tả dễ hiểu từ tập dữ liệu thocirc)
2 Bagravei toaacuten dự baacuteo (Prediction) Coacute thể dự đoaacuten được hagravenh vi kết quả dựa trecircn caacutec hiện tượng -gt dự baacuteo
VD Dự baacuteo thời tiết động đấthellip
3 Bagravei toaacuten chẩn đoaacuten (Diagnoss) Xaacutec định caacutec lỗi caacutec bộ phận hỏng hoacutec của hệ thống dựa trecircn caacutec dữ liệu quan saacutet được
4 Bagravei toaacuten gỡ rối (Debugging) Mocirc tả caacutec phương phaacutep khắc phục hệ thống khi gặp sự cố
5 Bagravei toaacuten thiết kế Lựa chọn cấu higravenh caacutec đối tượng nhằm thoả matilden một số ragraveng buộc nagraveo đoacute
6 Giảng dạy Phần mềm dạy học coacute thể chuẩn đoaacuten vagrave sủa lỗi của học sinh trong quaacute trigravenh học tập
Để xaacutec định đuacuteng bagravei toaacuten magrave chuacuteng ta cần giải quyết thigrave phải trả lời đc một số cacircu hỏi
- cần hệ chuyecircn gia
Bước 2 thu thập tri thức lựa chọn cocircng cụ vagrave aacutep dụng
Trong bước thu thập tri thức vấn đề quan trọng lagrave lựa chọn chuyecircn gia những người magrave sẽ đoacuteng goacutep tri thức cho hệ thống Thocircng thường trong suốt quaacute trigravenh phaacutet triển thigrave chuyecircn gia được xem như một thagravenh viecircn của đội phaacutet triển
Hiện nay coacute rất nhiều cocircng cụ để xacircy dựng một hệ chuyecircn gia Phổ biến nhất lagrave JESS CLIPS vagrave OPS5
Bước 3 Thiết kế cơ sở tri thức thiết kế hệ thốngTri thức được biểu diễn trường minh trong cơ sở tri thức
Caacutec chuyecircn gia vagrave kỹ sư tri thức sẽ đối thoại với nhau bằng caacutec kỹ thuật đối thoại Suy diễn (SD) bảng Mocirc higravenh hoacutea SD quy nạp phacircn loại
Vấn đề bagraveo trigrave vagrave phaacutet triển
Caacutec hệ chuyecircn gia đogravei hỏi phải bảo trigrave vagrave phaacutet triển nhiều hơn so với caacutec hệ thống khaacutec Phải thường xuyecircn bổ sung tri thức mới vagrave thay đổi caacutec tri thức cũ để đổi mới hệ chuyecircn gia
Thu thập vagrave khắc phục lỗi do người sử dụng phaacutet hiện để kịp thời khắc phục những sai soacutet của hệ chuyecircn gia
75 Lợi iacutech vagrave hạn chế của caacutec hệ chuyecircn gia
Một số lợi iacutech chiacutenh
Thời gian trả lời hợp lyacute bằng hoặc nhanh hơn so với chuyecircn gia (người) để đi đến cugraveng một quyết định Hệ chuyecircn gia lagrave một hệ thống thời gian thực (real time system)
Khả năng trả lời với mức độ tinh thocircng bằng hoặc cao hơn so với chuyecircn gia (người) trong cugraveng lĩnh vực
Hệ chuyecircn gia giuacutep cho hiệu quả lagravem việc tăng bằng việc sử dụng tập caacutec luật một caacutech nhanh choacuteng magrave ko bị nhầm lẫn chuyecircn gia lagrave người coacute thể quecircn đi một số tri thức cơ sở lyacute luậ nhưng HCG thigrave ko
Quyết định của một người chuyecircn gia coacute thể bị thay đổi vagrave ko coacute tiacutenh thống nhất như quyết định của một hệ chuyecircn gia tạo ra
Hệ chuyecircn gia giuacutep cho người sử dụng coacute thể trau dồi sự hiểu biết trecircn lĩnh vuej cụ thể magrave noacute giải quyết hỗ trợ người ra quyết định coacute trigravenh độ như 1 chuyecircn gia trong quaacute trigravenh gia quyết định
Kiến thức của rất nhiều chuyecircn gia về một lĩnh vực nagraveo đoacute được đưa vagraveo hệ chuyecircn gia lagravem cho CSTT cuat HCG phong phuacute vagrave rộng lớn hơn rất nhiều
HCG giải thiacutech caacutec bước suy luận một caacutech dễ hiểu nhất quaacuten luacutec nagraveo cũng coacute thể sử dụng ko như chuyecircn gia con người
Hạn chế của caacutec hệ chuyecircn gia
Nhược điểm lớn nhất của hệ chuyecircn gia lagrave những yacute kiến chuyecircn mocircn thường rất khoacute matilde hoacutea vagrave giải neacuten
Hệ chuyecircn gia khocircng coacute khả năng tự học tự cập nhật kiến thức mới như caacutec chuyecircn gia magrave cần phải được matilde hoacutea lại khi noacute được cập nhật
Hệ chuyecircn gia khocircng thể nhận ra được vấn đề khocircng nằm trong miền kiến thức của hệ thống
Chương 8 Tri thức vagrave tiếp nhận
1 Bao gồm caacutec vấn đề
Dữ liệu thực tế đo lường hoặc quan saacutet coacute hoặc khocircng coacute bối cảnh
Thocircng tin dữ liệu được tổng hợp một caacutech hữu iacutech để giải quyết những khoacute khăn trong việc đưa ra quyết định
Tri thức bao gồm caacutec ứng dụng quy tắc thocircng tin hướng dẫn của người ra quyết định
2 Những caacutei nhigraven về tri thức
Đại diện lagravem thế nagraveo để diễn tả tri thức viacute dụ như một quyển saacutech khocircng phải lagrave tri thức nhưng noacute lại lagrave một đại diện của tri thức
Sản xuất tri thức lagrave một tập hơp của hagraveng tồn kho coacute thể được sản xuất cũng như mua lại
Tri thức lagrave 1 trong 6 trạng thaacutei của hệ thống
1Dữ liệu 2Thocircng tin 3Cấu truacutec thocircng tin 4Sự thấu hiểu 5Yacute kiến 6 Quyết định
3 Caacutec loại tri thức Phổ biến mocirc tả dữ liệu thocircng tin thủ tục mọi thứ lagravem như thế nagraveo lập luận chiacutenh saacutech hoặc caacutec quy tắc
4 Thu thập Tri thức hệ chuyecircn gia Hầu hết caacutec phương phaacutep đều bắt đầu với mocirc higravenh của caacutec taacutec vụ trong đoacute
hệ chuyecircn gia được xacircy dựng Trong đoacute mocirc tả về caacutec lĩnh vực được tạo ra Caacutec kỹ sư sử dụng caacutec mocirc higravenh giả thuyết vagrave nhận thức về quaacute trigravenh phacircn
tiacutech để gợi ra caacutech giải quyết vấn đề về tri thức từ caacutec chuyecircn gia
5 Caacutec chiều của thu thập tri thức KE- driven caacutec kỹ sư trao đổi trực tiếp với caacutec chuyecircn gia Expert-driven Caacutec chuyecircn gia trực tiếp đưa chuyecircn mocircn của họ vagraveo hệ
thống maacutey tiacutenh Machine-driven Sử dụng caacutec cocircng cụ suy luận để triacutech xuất tri thức từ một
tập caacutec viacute dụ
6 Kỹ thuật thu thập tri thức Trao đổi gồm 2 loại cơ bản lagrave coacute cấu truacutec(coacute kịch bản) vagrave khocircng coacute cấu
truacutec( đối thoại trực tiếp) Giao thức phacircn tiacutech bằng lời Khi caacutec chuyecircn gia thực hiện một cocircng việc
của họ thigrave một bản ghi về cocircng việc đoacute được thực hiện Caacutec kỹ sư sẽ xacircy dựng mocirc higravenh cho những gigrave được ghi lại trong bản ghi
Phương phaacutep sagraveng lọc caacutec chuyecircn gia so saacutenh caacutec nhoacutem liecircn tiếp trong ba đối tượng vagrave cho biết tại sao nhoacutem thứ hai lại khaacutec nhoacutem thứ ba
7 Thu thập tri thức từ nhiều nguồn Thu thập tri thức từ nhiều nguồn lagrave cần thiết để coacute được đầy đủ caacutec tri thức
cho một vấn đề quan điểm yacute kiến traacutei ngược nhau thường phaacutet sinh Phương phaacutep đồng thuận sẽ giuacutep giải quyết được vấn đề macircu thuẫn Kỹ thuật phacircn tiacutech Meta lagrave kỹ thuật được aacutep dụng trong caacutec trường hợp
khaacutec Caacutech tiếp cận bằng định lượng đogravei hỏi caacutec kỹ sư cần cacircn nhắc yếu tố đầu vagraveo của caacutec chuyecircn gia khaacutec nhau
8 Xaacutec nhận hợp lệ vagrave kiểm tra tri thức Một khi thu thập tri thức noacute phải được đaacutenh giaacute về khả năng sử dụng vagrave độ
chiacutenh xaacutec Hai vấn đề cụ thể lagrave hiệu lực của những kiến thức vagrave kiểm tra việc xacircy dựng cơ sở của tri thức
Cần xaacutec nhận xem liệu hệ thống coacute thể hoạt động ở mức độ tối thiểu khocircng
Xaacutec minh liecircn quan đến việc so saacutenh từng chi tiết kỹ thuật của hệ thống những gigrave đatilde được thực hiện cuối cugraveng
9 Một số caacutec biện phaacutep xaacutec nhận Độ chiacutenh xaacutec Khả năng thiacutech nghi Mức độ đầy đủ Bề rộng Độ sacircu Hiệu lực Tổng quan Chiacutenh xaacutec Hiện thực Độ tin cậy Tiacutenh hữu dụng Mức độ
Chương 9 Học maacutey
1 Logic mờ vagrave ngocircn ngữ mờ(Fuzzy Logic and Linguistic Ambiguity)
Ngocircn ngữ tự nhiecircn gồm những khaacutei niệm mơ hồ vagrave khocircng chiacutenh xaacutectruyền tải ngữ nghĩa thocircng qua tiacutenh xấp xỉkhocircng rotilde ragraveng
Những xấp xỉ nagravey giuacutep con người coacute thể truyền tải hết được yacute nghĩa nhưng maacutey thigrave khocircng hiểu
Lagravem sao biểu diễn caacutec tri thức sử dụng caacutec khaacutei niệm khocircng rotilde ragraveng(mờ) hoặc khocircng chiacutenh xaacutec
2 Khaacutei niệm cơ bản của logic mờ tập mờ lagrave những tập hợp khocircng coacute một giới hạn rotilde Mỗi phần tử của noacute chỉ
chứa một mức độ hagravem liecircn thuộc của từng phần tử Vigrave vậy tập mờ khocircng giống như tập cổ điển Tập mờ coacute thể kết hợp với nhau qua những luật mờ magrave đặc trưng cho những hagravenh động trạng thaacutei vagrave thuộc tiacutenh của logic mờ được tận dụng khi thực hiện một bộ điều khiển mờ
Logic mờ dựa trecircn yacute tưởng mỗi phần tử thuộc vagraveo một tập hợp ở một mức độ nagraveo đấy
Locircgic mờ cho pheacutep độ liecircn thuộc (microA )coacute giaacute trị trong khoảng (01) Locircgic mờ coacute thể được coi lagrave mặt ứng dụng của lyacute thuyết tập mờ để xử lyacute caacutec
giaacute trị trong thế giới thực cho caacutec bagravei toaacuten phức tạp
3 So saacutenh tiacutenh đuacuteng đắn logic mờ vagrave xaacutec suất Xaacutec suất thigrave đề cập đến khả năng xảy ra một biến cố hay một điều gigrave đoacute Logic mờ đề cập đến cấp độ magrave đặc tiacutenh ở hiện tại
o viacute dụ1 người coacute chiều cao 6 feet thigrave coacute cấp độ lagrave 05 về chiều cao
4 Ưu điểm của logic mờ Caacutech tiếp cận rất tự nhiecircnkhocircng phức tạp Coacute thể mocirc higravenh hoacutea caacutec hagravem phi tuyến tugravey yacute phức tạp
Coacute thể tận dụng được kinh nghiệm từ những chuyecircn gia hagraveng đầu trong mọi lĩnh vực
Logic mờ được xacircy dựng dựa trecircn ngocircn ngữ tự nhiecircnNền tảng của logic mờ lagrave dựa trecircn cơ sở giao tiếp của con người
5 Nhược điểm của logic mờ Trong 1 hệ thống phức tạpsử dụng logic mờ coacute thể trở thagravenh trở ngại cho
việc xaacutec thực độ tin cậy của hệ thống Cơ chế lập luận mờ khocircng thể học hỏi từ những lỗi sai
6 Mạng noron nhacircn tạo(ANN) Mạng noron nhacircn tạo lagrave một mocirc phỏng xử lyacute thocircng tinđược nghiecircn cứu ra
từ hệ thống thần kinh của sinh vậtgiống như bộ natildeo để xử lyacute thocircng tin ANNs lagrave chương trigravenh dựa trecircn maacutey tiacutenh đơn giản coacute chức năng lagrave một mocirc
higravenh bagravei toaacuten khocircng gian dựa trecircn thử nghiệm vagrave baacuteo lỗi
7 Học từ kinh nghiệm Tiến trigravenh Một mẫu dữ liệu được biểu diễn như một mạng lưới noronANN ldquodự
đoaacutenrdquo 1 đầu radự đoaacuten được so saacutenh với giaacute trị thực tế hoặc giaacute trị chiacutenh xaacutecNếu đoaacuten được chiacutenh xaacutec thigrave khocircng coacute hagravenh động nagraveo được thực hiện
Nếu dự đoaacuten sai ANN kiểm tra lại vagrave xaacutec định lại thocircng số để điều chỉnh Một mẫu dữ liệu khaacutec được biểu diễn vagrave quaacute trigravenh nagravey được lặp lại
8 Nguyecircn tắc cơ bản của cocircng nghệ nơron Caacutec yếu tố xử lyacute cơ bản trong hệ thống thần kinh của con người lagrave tế bagraveo
thần kinhMạng lưới của tế bagraveo nagravey lagrave liecircn kết với nhau nhận được thocircng tin từ caacutec cảm biến trong mắt taihellip
Thocircng tin nhận được bởi tế bagraveo thần kinh hoặc lagrave sẽ kiacutech thiacutech noacute(sẽ được chuyển qua 1 thocircng điệp dọc theo mạng lưới) hoặc lagrave sẽ ngăn cản noacute(ngăn cản dograveng thocircng tin)
Độ nhạy coacute thể thay đổi qua thời gian hoặc sau khi coacute được kinh nghiệm
9 Cấu truacutec mạng Một ANN gồm 3 lớp cơ bản
Lớp đầu vagraveo nhận dữ liệu Lớp becircn trong hoặc lagrave lớp ẩn xử lyacute dữ liệu Lớp đầu ra chuyển tiếp kết quả cuối cugraveng của mạng
10Mạng nơ ron Thường coacute nhiều đầu vagraveo mỗi đầu vagraveo với mức ảnh hưởng vagrave tầm quan
trọng riecircng của noacute Một đầu vagraveo quan trọng coacute thể được sử dụng để khuếch đại đầu ra caacutec hagravem trạng thaacutei tổng hợp caacutec trọng số của caacutec yếu tố
đầuvagraveo khaacutec nhauvagraveo một giaacute trị duy nhất Caacutec hagravem chuyển giao xử lyacute caacutec giaacute trị trạng thaacutei vagrave tạo đầu ra
11Huấn luyện mạng nơ ron Trong mocirc higravenh coacute giaacutem saacutetANN được đến so saacutenh dự đoaacuten của chiacutenh
noacute với thocircng tin phản hồi coacute chứa caacutec kết quả mong muốn ANN sẽ phải tigravem caacutech thay đổi caacutec tham số becircn trong củamigravenh (caacutec trọng số vagrave caacutec ngưỡng) để tạo necircn một aacutenh xạ coacute khả năng aacutenh xạcaacutec đầu vagraveo thagravenh caacutec đầu ra mong muốn Sự thay đổi nagravey được tiến hagravenh nhờ việc so saacutenh giữa đầu ra thực sự vagrave đầu ra mong muốn
Trong mocirc higravenh khocircng coacute giaacutem saacutetANN nhận được dữ liệu vagraveo nhưng khocircng phải coacute bất kỳ thocircng tin phản hồi về kết quả mong muốn
Phần lớn caacutec ứng dụng nằm trong vugraveng của caacutec bagravei toaacuten ước lượng như mocirc higravenh hoacuteathống kecirc neacuten lọc phacircn cụm
12Lợi iacutech Liecircn kết với mạng noron Traacutenh caacutech lập trigravenh tường minh Giảm nhu cầu của chuyecircn gia ANNs thigrave thiacutech nghi với caacutec yếu tố đầu vagraveo thay đổi Khocircng cần thiết cho cơ sở tri thức tinh chế ANNs coacute tiacutenh động vagrave cải thiện với việc sử dụng Coacute khả năng xử lyacute dữ liệu khocircng chiacutenh xaacutec hoặc khocircng đầy đủ Cho pheacutep tổng quaacutet hoacutea từ thocircng tin cụ thể Cho pheacutep thu thập cảm giaacutec thocircng thường vagraveo miền giải quyết vấn đề
13Hạn chế của việc liecircn kết với mạng noron ANNs khocircng thể giải thiacutech được suy luận Bản chất hộp đen thường khiến cho vấn đề traacutech nhiệm vagrave độ tin cậy phaacutet
sinh lagrave khoacute khăn Lặp đi lặp lại quaacute trigravenh huấn luyện rất tốn thời gian Nguồn lực caacutec nhagrave phacircn tiacutech vagrave thiết kế coacute tay nghề cao vẫn lagrave đaacuteng lo
ngại Cocircng nghệ ANN thuacutec đẩy hạn chế của phần cứng hiện tại ANN yecircu cầu phải coacute sự tin tưởng ở đầu ra
14Giới thiệu về thuật toaacuten di truyền Cũng như mạng lưới thần kinh caacutec thuật toaacuten di truyền được dựa trecircn lyacute
thuyết sinh học Thuật toaacuten di truyền tigravem thấy nguồn gốc của chuacuteng trong caacutec lyacute thuyết
tiến hoacutea của chọn lọc tự nhiecircn vagrave thiacutech ứng với biến đổi khiacute hậu Kết quả thuật toaacuten di truyền lagrave từ giao phối 2 caacute thể trong quần thế để tạo
ra con caacutei đocirci khi tốt hơn so với bậc cha mẹ của chuacuteng 15Caacutec thagravenh phần cơ bản của thuật toaacuten di truyền
Toaacuten tử chọn lọc Caacutec caacute thể tốt được chọn lọc để đưa vagraveo thế hệ sau Sự chọn lọc nagravey căn cứ vagraveo độ thiacutech nghi với mocirci trường của mỗi caacute thể
Toaacuten tử lai gheacutep (crossover) Hai caacute thể cha vagrave mẹ trao đổi caacutec gen với nhau để tạo ra caacute thể con
Toaacuten tử đột biến (mutation) Một caacute thể thay đổi một số gen để biến đổi thagravenh một caacute thể mớiTất cả caacutec toaacuten tử trecircn khi thực hiện đều mang tiacutenh ngẫu nhiecircn
16Quaacute trigravenh cơ bản của một thuật toaacuten di truyền Khởi tạo
Đaacutenh giaacute quần thể
Lựa chọn NST thiacutech hợp nhất vagrave loại bỏ NST yếu nhất
Quy trigravenh giao nhau vagrave cải thiện quần thể
đột biến tiến trigravenh để khaacutem phaacute ra NST mới
17Ưu nhược điểm của việc kết hợp với thuật toaacuten di truyền Kiacutech thước quần thể lagrave 1 yếu tố quan trọng trong tốc độ của việc tigravem
kiếmnhưng noacute tương đối dễ dagraveng để dự đoaacuten tốc độ nagravey Giao nhau hoặc đột biến lagrave khocircng necircn đc sử dụng quaacute thường xuyecircn Luocircn coacute được iacutet nhất 1 giải phaacutep hợp lyacute Necircn coacute thể aacutep dụng chuacuteng cho caacutec vấn đề magrave chuacuteng ta khocircng coacute hướng
về caacutech giải quyết Sức mạnh của thuật toaacuten xuất phaacutet từ khaacutei niệm đơn giảnkhocircng phải từ
một thủ tục thuật toaacuten phức tạp 18Tương lai của học maacutey
Mạng lưới thần kinh nhacircn tạo vượt quaacute năng lực của con người trong caacutec trường hợp bị cocirc lập
Về mặt lyacute thuyếtmột maacutey tiacutenh coacute thể xử lyacute dũ liệu nhanh hơn hagraveng triệu lần so với 1 con người
May mắn thay cho chuacuteng tacon người tốt hơn nhiều khi magrave coacute được dữ liệumaacutey tiacutenh khocircng coacute 1 số thứ như lagrave 5 giaacutec quan
CHƯƠNG 10 KHO DỮ LIỆU
1 Kho dữ liệu Kho dữ liệu lagrave tuyển tập caacutec cơ sở dữ liệu tiacutech hợp hướng chủ đề được
thiết kế để trợ giuacutep cho một hệ hỗ trợ quyết định
Theo John Ladley Cocircng nghệ kho dữ liệu lagrave tập caacutec phương phaacutep kỹ thuật vagrave caacutec cocircng cụ coacute thể kết hợp hỗ trợ nhau để cung cấp thocircng tin cho người sử dụng trecircn cơ sở tiacutech hợp từ nhiều nguồn dữ liệu nhiều mocirci trường khaacutec nhau
Kho dữ liệu thường rất lớn tới hagraveng trăm GB hay thậm chiacute hagraveng Terabyte
2 Kho dữ liệu vận hagravenh (ODS) Một kho dữ liệu vận hagravenh Aacutep dụng kỹ thuật kho dữ liệu vagraveo caacutec hệ xử
lyacute giao taacutec lưu trữ dữ liệu cho một ứng dụng đặc thugrave Noacute đưa vagraveo kho dữ liệu một dograveng caacutec dữ liệu thocirc được thiết kế
3 So saacutenh
Kho dữ liệu vận hagravenh Kho dữ liệu
Dữ liệu theo chủ đề Dữ liệu theo chủ đề
Dữ liệu tiacutech hợp Dữ liệu tiacutech hợp
Dữ liệu thay đổi Dữ liệu khocircng thay đổi
Dữ liệu được cập nhật khi thay đổi
Dữ liệu giữ nguyecircn
Chỉ coacute dữ liệu hiện tạiDữliệu hiện tại vagrave dữ liệu lịch sử
Chu kỳ lagravem tươi dữ liệu ngắn Chu kỳ lagravem tươi dữ liệu dagravei
Chỉ coacute dữ liệu chi tiết Dữ liệu chi tiết vagrave dữ liệu tổng kết
Dugraveng cho caacutec quyết định ngắn hạn
Dugraveng cho hoạch định dagravei hạn
4 Kho dữ liệu cục bộ (Data Mart - DM)
Kho dữ liệu cục bộ lagrave CSDL coacute những đặc điểm giống với kho dữ liệu nhưng với quy mocirc nhỏ hơn vagrave lưu trữ dữ liệu về một lĩnh vực một chuyecircn ngagravenh
Data mart phụ thuộc Chứa những dữ liệu được lấy từ DW vagrave những dữ liệu nagravey sẽ được triacutech lọc vagrave tinh chế tiacutech hợp lại ở mức cao hơn để phục vụ một chủ đề nhất định của Datamart
Data mart độc lập Khocircng giống như Datamart phụ thuộc Data mart độc lập được xacircy dựng trước DW vagrave dữ liệu được trực tiếp lấy từ caacutec nguồn khaacutec nhau
5 Siecircu dữ liệu Metadata lagrave dữ liệu để mocirc tả dữ liệu Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột
một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi Metadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu
6 Mocirci trường kho dữ liệu Hệ thống của tổ chức vagrave kho cung cấp dữ liệu để xacircy dựng kho dữ liệu Trong quaacute trigravenh chuyển dữ liệu từ caacutec nguồn khaacutec nhau dữ liệu coacute thể
được lagravem sạch hoặc chuyển đổi vagrave vigrave thế DW được xem như lagrave một chuẩn cho việc lưu trữ
Đồng thời siecircu dữ liệu được ghi lại Cuối cugraveng DW hoặc siecircu thị coacute thể được sử dụng để tạo ra một kho dữ
liệu ldquocaacute nhacircnrdquo 7 Caacutec đặc điểm của kho dữ liệu
Đặc điểm Mocirc tả
Hướng chủ đề - DL tổ chức theo caacutech thức người dugraveng tham chiếu
Tiacutech hợp - Dữ liệu ldquosạchrdquo loại bỏ tiacutenh thiếu nhất quaacuten
Khocircng thay đổi - DL ldquochỉ đọcrdquo người dugraveng khocircng thay đổi được
Chuỗi thời gian - DL lagrave chuỗi thời gian khocircng phải lagrave trạng thaacutei hiện tại
Được tổng kết - DL vận hagravenhthao taacutec khi cần thiết
được kết hợp lại thagravenh dạng coacute thể dugraveng được cho quyết định
Kiacutech cỡ lớn hơn - Lưu giữ theo chuỗi thời gian tức lagrave giữ lại nhiều DL
Khocircng được chuẩn hoacutea - Coacute thể dư thừa DLSiecircu dữ liệu - Dữ liệu của dữ liệu được lưu trữNguồn dữ liệu - DL vận hagravenh (caacutec hệ sẵn coacute) cugraveng
với caacutec nguồn ngoagravei 8 Kho dữ liệu hướng chủ đề
Hướng chủ để coacute nghĩa lagrave kho dữ liệu được tổ chức xung quanh caacutec chủ đề chiacutenh như khaacutech hagraveng sản phẩm sản xuất Tập trung vagraveo việc mocirc higravenh hoacutea vagrave phacircn tiacutech dữ liệu cho caacutec nhagrave ra quyết định magrave khocircng tập trung vagraveo caacutec xử lyacute thocircng thường Cung cấp cho người dugraveng một khung nhigraven toagraven vẹn đơn giản vagrave đầy đủ về caacutec sự kiện quanh caacutec chủ đề
9 Dữ liệu trong DW được tiacutech hợp Dữ liệu trong kho dữ liệu được xacircy dựng bằng caacutech tổng hợp dữ liệu từ
nhiều nguồn khaacutec nhau vagrave caacutec nguồn coacute tổ chức khaacutec nhau Cơ sở dữ liệu caacutec file excel caacutec flat file hoặc caacutec raw file Khi đưa vagraveo kho dữ liệu caacutec dữ liệu được lagravem sạch vagrave tiacutech hợp dữ liệu nhằm đảm bảo tiacutenh nhất quaacuten của dữ liệu
10Kiến truacutec kho dữ liệu Tầng cơ sở dữ liệu hoạt động Tầng truy xuất thocircng tin Tầng truy xuất dữ liệu Tầng siecircu dữ liệu Tầng quản lyacute tiến trigravenh Tầng thocircng điệp của ứng dụng Tầng vật liacute của kho dữ liệu Tầng trigravenh diễn dữ liệu
11Higravenh trạng kho dữ liệu Kho dữ liệu ảo - người dugraveng cuối coacute thể truy cập trực tiếp đến kho dữ liệu
sử dụng caacutec cocircng cụ cho pheacutep ở tầng truy xuất dữ liệu Kho dữ liệu trung tacircm-1 cơ sở dữ liệu vật lyacute chứa tất cả dữ liệu cho một
vugraveng chuyecircn dụng nagraveo đoacute
Kho dữ liệu phacircn taacuten- Thagravenh phần được phacircn taacuten qua nhiều hệ cơ sở dữ liệu vật lyacute
12METADATA- Siecircu dữ liệu Định nghĩa Siecircu dữ liệu lagrave dữ liệu về dữ liệu Lagrave 1 lưu trữ dugraveng để
Miecircu tả kho dữ liệu tổng thể Nhận dạng kiểu kho dữ liệu Quản liacute quaacute trigravenh tiacutech hợp dữ liệu Quản liacute quaacute trigravenh cập nhật kho dữ liệu Quản liacute bảo mật
Lagrave chigravea khoacutea quyết định sự thagravenh cocircng của kho dữ liệu luocircn được thay đổi vagrave cập nhật theo sự phaacutet triển của kho dữ liệu
Dugraveng để quản liacute điều khiển kho dữ liệu Sự ra đời của kho dữ liệu như 1 cấu truacutec hỗ trợ ra quyết định siecircu dữ liệu
được xem như nguồn tagravei nguyecircn dữ liệu Siecircu dữ liệu lagrave trừu tượng Chuacuteng lagrave dữ liệu bậc cao cung cấp mocirc tả ngắn
gọn caacutec dữ liệu bậc thấp hơn 13Hoạt động của Siecircu dữ liệu
Siecircu dữ liệu rất cần thiết trong việc chuyển hoacutea thocircng tin trở thagravenh tri thức Lagrave chigravea khoacutea giuacutep chuacuteng ta xử lyacute được dữ liệu thocirc Viacute dụ một dograveng dữ liệu baacuten hagraveng 1023 K596 11121 agraveNoacute sẽ khocircng coacute nghĩa gigrave cho đến khi chuacuteng ta đưa vagraveo siecircu dữ liệu (thư
mục chứa dữ liệu) agrave cửa hagraveng 1023 sản phẩm K596 vagrave số tiền baacuten được lagrave 11121 đocirc la
14Sự cần thiết phải nhất quaacuten trong kho dữ liệu Kho dữ liệu được xacircy dựng cho lợi iacutech của những nhagrave phacircn tiacutech kinh
doanh caacutec nhagrave quản trị cho tất cả caacutec khu vực chức năng Trong cơ sở dữ liệu riecircng caacutec khu vực khaacutec nhau coacute thể định nghĩa vagrave lưu
trữ dữ liệu thocircng qua phiecircn bản của chiacutenh noacute Khi dữ liệu được lấy từ những vugraveng khaacutec nhau đoacute vagrave được đặt vagraveo kho dữ
liệu Việc chuyển đổi vagrave lagravem sạch caacutec tiến trigravenh sẽ đảm bảo noacute lagrave duy nhất được tiacutech hợp tại một mức của tổ chức
15Ragrave soaacutet lại dữ liệu ndash Thực thi siecircu dữ liệu
Bất kể cấu truacutec tự nhiecircn của 1 cacircu truy vấn thế nagraveo thigrave caacutec thagravenh phần của siecircu dữ liệu rất quan trọng đối với người ra quyết định
Bảng thuộc tiacutenh khoacutea được lưu trữ bởi kho dữ liệu Tập hợp dữ liệu được lấy từ đacircu Những chuyển đổi nagraveo được thực thi với việc lagravem sạch
16Siecircu dữ liệu lagrave gigrave Metadata - lagrave thocircng tin mocirc tả nội dung của cơ sở dữ liệu (CSDL) Metadata baacuteo cho người dugraveng biết thời gian cập nhật sau cugraveng của dữ liệu
định dạng vagrave mục điacutech sử dụng của noacute Những thocircng tin nagravey coacute thể hướng dẫn người dugraveng duyệt qua CSDL vagrave
giuacutep họ hiểu được yacute nghĩa vagrave ngữ cảnh của dữ liệu Trong CSDL metadata lagrave caacutec dạng biểu diễn khaacutec nhau của caacutec đối tượng
trong CSDL Trong CSDL quan hệ metadata lagrave caacutec định nghĩa của bảng cột CSDL
view vagrave nhiều đối tượng khaacutec Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột
một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi -gtMetadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu
Bảng chuyển đổi Ghi lại những chuyển đổi đatilde được thực hiện
Lịch sử thực thi Ghi lại những dữ liệu đatilde được
phacircn tiacutech
Higravenh thaacutei kết nốiGhi lại những dữ liệu được kết nối vagrave tần suất
17Aacutenh xạ thocircng thường của siecircu dữ liệu Bản ghi aacutenh xạ chuyển đổi bao gồm
Định danh của nguồn gốc Chuyển đổi thuộc tiacutenh Chuyển đổi thuộc tiacutenh vật lyacute Matilde hoacutea tham chiếu bảng chuyển đổi Đổi tecircn Đổi khoacutea Gaacuten giaacute trị cho thuộc tiacutenh mặc định Chọn logic cho caacutec nguồn nhiều giaacute trị Đổi thuật toaacuten
18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để
phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai
lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave
tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec
Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm
Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo
19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua
caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau
SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được
Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra
một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức
Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ
Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ
Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech
CHƯƠNG 11 KHAI PHAacute DỮ LIỆU
1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn
ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993
Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng
2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd
1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều
2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP
3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn
4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng
5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server
6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo
7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động
8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời
9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều
10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện
11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech
12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP
3 Xử lyacute phacircn tiacutech trực tuyến OLAP
MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave
dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu
ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave
thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu
HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave
ROLAP4 Khai phaacute dữ liệu
Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh
khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn
Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan
5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp
6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại
Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp
Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec
Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt
Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra
Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh
vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho
Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec
Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm
Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục
Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng
gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp
Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn
Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec
Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper
Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2
Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25
Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước
Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng
Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện
trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp
Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute
độ hỗ trợ ge ngưỡng minsup
độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan
Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn
Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết
Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu
MOLAP ROLAP HOLAP
Lưu trữ dữ liệu cơ sở
Khối Bảng quan hệ Bảng quan hệ
Lưu trữ thocircng tin tổng hợp
Khối Bảng quan hệ Khối
Hiệu suất thực hiện truy vấn
Nhanh nhất Chậm nhất Nhanh
Tiecircu thụ khocircng gian lưu trữ
Nhiều Thấp Trung bigravenh
Chi phiacute bảo trigrave Cao Thấp Trung bigravenh
Mocirc higravenh chắc chắn tương đối dễ phaacutet triển giải quyết vagrave coacute thể sinh ra caacutec giải phaacutep tối ưu 1048713 Caacutec bagravei toaacuten coacute một số lớnvocirc hạn caacutec giải phaacutep khả thi đặc biệt quan trọng 1048713 Caacutec mocirc higravenh tagravei chaacutenh được xacircy dựng trong điều kiện chắc chắn
Mocirc higravenh bất địnhbằng caacutech thu thập thecircm thocircng tin cố gắng đưa bagravei toaacuten trở về dạng chắc chắn hay dạng
rủi ro Mocirc higravenh rủi ro caacutec quyết định kinh doanh được đưa ra dưới caacutec rủi ro giả định
1048713 Đocirci khi biết được xaacutec suất của caacutec sự kiện xảy ra trong tương lai 1048713 Caacutec trường hợp khaacutec (bất định) ước lượng caacutec rủi ro vagrave giả sử caacutec tigravenh huống rủi ro
xảy ra 20Mocirc higravenh hoacutea
MOcirc HIgraveNH HOacuteA BẰNG BẢNG TIacuteNH bull Bảng tiacutenh phần mềm mạnh linh hoạt vagrave dễ dugraveng cho pheacutep tạo sinh caacutec ứng dụng trong kinh doanh kỹ thuật toaacuten vagrave khoa học với tập caacutec hagravem mạnh về tagravei chaacutenh thống kecirc toaacuten bull Kegravem theo lagrave caacutec thagravenh phần cộng thecircm (add-ins) giuacutep xacircy dựng vagrave giải caacutec lớp mocirc higravenh đặc thugrave bull Lagrave cocircng cụ mocirc higravenh hoacutea thocircng dụng nhất của người dugraveng cuối cugraveng bull Coacute caacutec chức năng về phacircn tiacutech ldquowhat-ifrdquo dograve tigravem mục tiecircu quản lyacute dữ liệu vagrave lập trigravenh (dạng macro) bull Coacute khả năng đọc ghi caacutec cấu truacutec tập tin thocircng dụng để giao tiếp được với caacutec CSDL vagrave cocircng cụ khaacutec bull Coacute thể xacircy dựng mocirc higravenh tĩnh vagrave động bull Dugraveng trecircn maacutey tiacutenh caacute nhacircn vagrave maacutey tiacutenh lớn
bull Cơ sở để xacircy dựng caacutec bảng tiacutenh đa chiều vagrave caacutec cocircng cụ xử lyacute phacircn tiacutech trực tuyến (OLAP) MOcirc HIgraveNH HOacuteA BẰNG PHAcircN TIacuteCH QUYẾT ĐỊNH bull Tiếp cận mocirc higravenh hoacutea caacutec tigravenh huống quyết định coacute một số hữu hạnkhocircng quaacute nhiều caacutec phương aacuten ndash mỗi phương aacuten được trigravenh ra dưới dạng bảng hay đồ thị - caacutec kết quả tương ứng (dự baacuteo được kegravem xaacutec suất) theo mục tiecircu bagravei toaacuten ndash từ đoacute chọn phương aacuten tốt nhất bull Đơn mục tiecircu bảng quyết định hay cacircy quyết định bull Đa mục tiecircu AHP (analytic hierarchy process) khaacutec
MOcirc HIgraveNH HOacuteA BẰNG QUY HOẠCH TOAacuteN
bull Quy hoạch toaacuten học (mathematical programming) lagrave họ caacutec cocircng cụ giải quyết caacutec bagravei toaacuten quản lyacute theo đoacute người ra quyết định phải cấp phaacutet caacutec tagravei nguyecircn khan hiếm cho caacutec hoạt động cạnh tranh nhau (caacutec phương aacuten) nhằm tối ưu hoacutea mục tiecircu coacute khả năng đo lường được bull Caacutec mocirc higravenh quy hoạch tuyến tiacutenh (linear programming) thocircng dụng nhất trong quy hoạch toaacuten coacute nhiều ứng dụng trong thực tế được dugraveng nhiều trong caacutec hệ hỗ trợ quyết định bull Bagravei toaacuten quy hoạch tuyến tiacutenh 1048713 Caacutec biến quyết định (cần tigravem giaacute trị) 1048713 Hagravem mục tiecircu (hagravem toaacuten học dạng tuyến tiacutenh xaacutec định quan hệ giữa biến quyết định vagrave mục tiecircu đo lường mức độ đạt đạt mục tiecircu vagrave cần được tối ưu hoacutea) 1048713 Caacutec hệ số của hagravem mục tiecircu (cho biết mức đoacuteng goacutep vagraveo mục tiecircu của 1 đơn vị biến quyết định) 1048713 Ragraveng buộc (biểu thức tuyến tiacutenh cho biết giới hạn tagravei nguyecircn vagravehay caacutec quan hệ giữa caacutec biến số) 1048713 Dung lượng (mocirc tả cận trecircn vagrave dưới của caacutec biến vagrave ragraveng buộc) 1048713 Hệ số (cocircng nghệ) vagraveo-ra (cho biết mức độ sử dụng tagravei nguyecircn của biến quyết định) bull Đặc điểm của bagravei toaacuten quy hoạch tuyến tiacutenh 1048713 Tagravei nguyecircn kinh tế của bagravei toaacuten lagrave coacute hạn vagrave sẵn sagraveng 1048713 Coacute nhiều caacutech (gt2 caacutech) sử dụng tagravei nguyecircn được gọi lagrave giải phaacutep hay chương trigravenh 1048713 Mỗi hoạt động dugraveng tagravei nguyecircn đều sinh ra kết quả dưới dạng mục tiecircu đatilde phaacutet biểu trước 1048713 Việc cấp phaacutet nằm trong caacutec ragraveng buộc cho trước bull Giả định của bagravei toaacuten quy hoạch tuyến tiacutenh 1048713 Caacutec kết quả của caacutec cấp phaacutet coacute thể đem so saacutenh với nhau coacute thể đo lường bằng một đơn vị chung
1048713 Caacutec cấp phaacutet độc lập với nhau về mặt kết quả 1048713 Kết quả cuối cugraveng lagrave tổng của caacutec kết quả từ caacutec hoạt động riecircng rẽ khaacutec nhau 1048713 Dữ liệu coacute tiacutenh chắc chắn 1048713 Tagravei nguyecircn được dugraveng một caacutech kinh tế nhất 1048713 Thường coacute một số lớn caacutec giải phaacutep với kết quả khaacutec nhau 1048713 Trong số caacutec giải phaacutep coacute thể coacute 1 giải phaacutep tốt nhất ndash mức độ đạt được mục tiecircu cao nhất ndash gọi lagrave giải phaacutep tối ưu được tigravem ra bằng một giải thuật đặc biệt MOcirc HIgraveNH HOacuteA BẰNG HEURISTIC bull Việc tigravem giải phaacutep tối ưu của một số bagravei toaacuten quyết định phức tạp coacute thể tốn nhiều thời gian chi phiacute hay khocircng thể tigravem ra được Cograven nếu dugraveng tiếp cận mocirc phỏng cũng coacute thể keacuteo dagravei phức tạp khocircng thiacutech hợp hay thậm chiacute khocircng chiacutenh xaacutec
bull Lagrave một tiếp cận giuacutep tigravem ra caacutec giải phaacutep khả thithỏa matildenđủ tốt cho caacutec bagravei toaacuten phức tạp Coacute thể coacute giải phaacutep đủ tốt (90-999 giaacute trị của lời giải tối ưu) nhanh choacuteng vagrave đỡ tốn keacutem hơn bằng caacutech dugraveng heuristics bull Quaacute trigravenh heuristic lagrave datildey caacutec bước xacircy dựng caacutec quy luật giải quyết vấn đề thocircng qua việc tigravem kiếm caacutec con đường hứa hẹn nhất dẫn đến lời giải tigravem kiếm caacutech thức thu thập vagrave phacircn giải thocircng tin theo quaacute trigravenh giải vagrave phaacutet triền caacutec phương phaacutep dẫn đến một giải thuật tiacutenh toaacuten hay một lời giải tổng quaacutet đatilde coacute bull Aacutep dụng chủ yếu cho bagravei toaacuten cấu truacutec yếu cũng dugraveng để tigravem ra giải phaacutep chấp nhận được cho bagravei toaacuten cấu truacutec chặt bull Khocircng đủ tổng quaacutet như caacutec giải thuật thường chỉ dugraveng cho tigravenh huống đặc thugrave đang xeacutet bull Coacute thể dẫn đến một giải phaacutep dở - caacutec thủ tục từng bước giải quyết vấn đề khocircng đảm bảo tigravem ra giải phaacutep tối ưu bull Heuristic coacute thể lagrave định lượng vigrave vậy coacute thể đoacuteng vai trograve quan trọng trong cơ sở mocirc higravenh của hệ hỗ trợ quyết định bull Heuristic coacute thể lagrave định tiacutenh vigrave vậy coacute thể đoacuteng vai trograve quan trọng trong cung ứng kiến thức cho hệ chuyecircn gia bull Quaacute trigravenh heuristic liecircn quan đến tigravem kiếm học tập ước lượng phacircn xử vagrave lặp lại caacutec hoạt động nagravey dọc theo tiến trigravenh bull Kiến thức thu được dugrave thagravenh cocircng hay thất bại trong quaacute trigravenh đều được phản hồi vagrave sửa đổi chiacutenh quaacute trigravenh nhờ đoacute coacute thể định nghĩa lại mục tiecircu hay bagravei toaacuten 1048713 Giải thuật di truyền bắt đầu bằng tập caacutec giải phaacutep được sinh ngẫu nhiecircn taacutei kết hợp caacutec cặp giải phaacutep một caacutech ngẫu nhiecircn bull Tigravenh huống necircn dugraveng heuristics 1048713 Dữ liệu đầu vagraveo khocircng chiacutenh xaacutec hay coacute giới hạn 1048713 Thực tế quaacute phức tạp đến nỗi khocircng dugraveng được caacutec mocirc higravenh tối ưu 1048713 Chưa coacute được giải thuật chiacutenh xaacutec vagrave đủ tin cậy 1048713 Bagravei toaacuten phức tạp necircn sẽ khocircng kinh tế nếu dugraveng tối ưu hay mocirc phỏng hoặc tốn quaacute nhiều thời gian tiacutenh toaacuten 1048713 Coacute thể cải thiện tiacutenh hiệu quả của quaacute trigravenh tối ưu (tức coacute thể sinh ra caacutec giải phaacutep ban đầu tương đối tốt) 1048713 Liecircn quan đến xử lyacute kyacute hiệu chứ khocircng phải xử lyacute kyacute số (như hệ chuyecircn gia) 1048713 Cần coacute quyết định nhanh vagrave caacutec xử lyacute dựa vagraveo maacutey tiacutenh đều khocircng khả thi (một số heuristic khocircng cần đến maacutey tiacutenh) bull Thuận lợi 1048713 Dễ hiểu dễ giải thiacutech vagrave dễ cagravei đặt 1048713 Nacircng cao tiacutenh saacuteng tạo vagrave năng lực heuristic cho caacutec vấn đề khaacutec 1048713 Tiết kiệm thời gian xaacutec lập vấn đề 1048713 Tiết kiệm yecircu cầu về bộ chứa vagrave xử lyacute maacutey tiacutenh
1048713 Tiết kiệm thời gian tiacutenh toaacuten vagrave do vậy tiết kiệm thời gian thực trong ra quyết định Một số vấn đề phức tạp đến nỗi chỉ coacute thể giải được bằng heuristics 1048713 Thường sinh ra nhiều giải phaacutep chấp nhận được 1048713 Thường coacute thể phaacutet biểu lyacute thuyết hay đo lường thực nghiệm về chất lượng của giải phaacutep (tức giaacute trị mục tiecircu của giải phaacutep gần với giaacute trị tồi ưu đến mức nagraveo dugrave giaacute trị tối ưu chưa biết được) 1048713 Coacute thể kết hợp tiacutenh thocircng minh vagraveo để hướng dẫn pheacutep tigravem kiếm (tigravem kiếm tabu) Năng lực thocircng minh đoacute coacute thể lagrave đặc thugrave theo bagravei toaacuten hoặc dựa trecircn yacute kiến chuyecircn gia được cấy trong hệ chuyecircn gia hoặc cơ chế tigravem kiếm 1048713 Coacute thể dugraveng heuristic hiệu quả vagraveo caacutec mocirc higravenh coacute thể giải bằng quy hoạch toaacuten học Đocirci khi heuristic lagrave phương phaacutep được ưa thiacutech hơn khi khaacutec giải phaacutep heuristics được dugraveng như giải phaacutep ban đầu cho caacutec phương phaacutep quy hoạch toaacuten học bull Hạn chế 1048713 Khocircng đảm bảo coacute được giải phaacutep tối ưu 1048713 Caacutec quy luật coacute rất nhiều ngoại lệ 1048713 Caacutec lựa chọn quyết định tuần tự coacute thể khocircng tiecircn đoaacuten được caacutec kết cục tương lai của mỗi chọn lựa 1048713 Sự liecircn thuộc giữa caacutec phần trong hệ thống đocirci khi coacute thể gacircy ra caacutec ảnh hưởng lớn lao lecircn toagraven hệ thống bull Phacircn loại caacutec giải thuật heuristic 1048713 Heuristic xacircy dựng xacircy dựng giải phaacutep khả thi bằng caacutech cộng thecircm từng thagravenh phần một VD bagravei toaacuten người baacuten hagraveng ndash luocircn gheacute thagravenh phố chưa viếng thăm kế tiếp gần nhất
1048713 Heuristic cải tiến bắt đầu bằng một giải phaacutep khả thi vagrave cố gắng cải tiến liecircn tục trecircn đoacute VD trecircn thử hoaacuten đổi 2 thagravenh phố 1048713 Quy hoạch toaacuten aacutep dụng vagraveo caacutec mocirc higravenh chứa iacutet ragraveng buộc nhằm coacute được thocircng tin về thỏa hiệp tốt nhất với mocirc higravenh nguyecircn gốc Thường được dugraveng trong tối ưu hoacutea nguyecircn (integer optimization) 1048713 Chia giai đoạn giải quyết một vấn đề theo từng giai đoạn VD ở PampG trecircn đacircy bagravei toaacuten phacircn phối được giải quyết trước sau đoacute dugraveng giải quyết bagravei toaacuten chiến lược sản phẩm 1048713 Phacircn ratilde chia bagravei toaacuten thagravenh caacutec phần nhỏ hơn coacute thể giải quyết được sau đoacute kết hợp caacutec giải phaacutep đoacute lại VD chia latildenh thổ baacuten hagraveng thagravenh 4 vugraveng khaacutec nhau giải quyết cho từng vugraveng sau đoacute kết nối caacutec giải phaacutep
21Mocirc phỏngbull Giả định caacutec đặc điểm của thực tạibull Lagrave kỹ thuật tiến triển caacutec thực nghiệm (như phacircn tiacutech ldquowhat-ifrdquo) - bằng maacutey tiacutenh -trecircn một mocirc higravenh của hệ thocircng tin quản lyacute
bull Khocircng thực sự lagrave một mocirc higravenh vigrave khocircng biểu diễn thực tại magrave lagrave cố gắng bắtchước thực tạibull Một trong những phương phaacutep thocircng dụng nhất trong HHTQĐbull HHTQĐ lagravem việc với caacutec bagravei toaacuten phi cấu truacutec vagrave cấu truacutec yếu tigravenh huống thực tếphức tạp ndash khocircng dễ biểu diễn bằng mocirc higravenh tối ưu hay caacutec dạng mocirc higravenh khaacutecnhưng lại thường coacute thể xử lyacute được bằng mocirc phỏngbull Đặc điểm1048713 Iacutet đưa ra caacutec đơn giản hoacutea về thực tại hơn caacutec mocirc higravenh khaacutec1048713 Do triển khai caacutec thực nghiệm necircn noacute coacute thể kiểm thử caacutec giaacute trị cụ thể của caacutecbiến quyết địnhbiến khocircng kiểm soaacutet được của mocirc higravenh vagrave xem xeacutet ảnh hưởnglecircn caacutec biến kết quả1048713 Phương phaacutep coacute tiacutenh mocirc tả (như vậy khaacutec với phương phaacutep danh định)1048713 Khocircng tự động tigravem kiếm giải phaacutep tối ưu ndash noacute mocirc tảtiecircn đoaacuten caacutec đặc tiacutenh của hệthống đatilde cho dưới caacutec điều kiện khaacutec nhau từ đoacute coacute thể chọn ra phương aacuten tốtnhất1048713 Quaacute trigravenh mocirc phỏng thường lặp lại một thực nghiệm nhiều lần để coacute được ướclượng về hiệu ứng tổng quaacutet của một số hagravenh động nhất định1048713 Mocirc phỏng maacutey tiacutenh thiacutech hợp cho hầu hết caacutec tigravenh huống mặc dugrave cũng coacute một sốmocirc phỏng thủ cocircng thagravenh cocircng1048713 Thường chỉ được dugraveng khi bagravei toaacuten quaacute phức tạp khocircng thể xem xeacutet bằng caacutec kỹthuật tối ưu dạng số Tiacutenh phức tạp theo nghĩa bagravei toaacuten khocircng thể cocircng thức hoacuteacho tối ưu (do khocircng thotildea caacutec giả định) hoặc cocircng thức quaacute lớn quaacute nhiều tươngtaacutec giữa caacutec biến hoặc về bản chất bagravei toaacuten lagrave bất định hay rủi roPhương phaacutep mocirc phỏng thiết lập mocirc higravenh của hệ thống thực vagrave tiến hagravenh caacutec thựcnghiệm lặp lại trecircn mocirc higravenh
bull Thuận lợi1048713 Lyacute thuyết tương đối trực tiếp hiệu ứng dagravei hạn của nhiều chiacutenh saacutech -gt neacuten thờigian lớn1048713 Do tiacutenh chất mocirc tả (khaacutec với danh định)1048713 Coacute thể thấy được nhanh choacuteng coacute thể đặt ra caacutec cacircu hỏi ldquowhat-ifrdquo coacute thể dugravengtiếp cận thử-vagrave-sai vagraveo giải quyết vấn đề một caacutech nhanh choacuteng rẻ chiacutenh xaacutec iacutetrủi ro hơn1048713 Thử nghiệm được biến quyết định phần nagraveo của mocirci trường thực sự quan trọngvới caacutec phương aacuten khaacutec nhau1048713 Yecircu cầu kiến thức riecircng biệt về bagravei toaacuten vigrave thế buộc người xacircy dựng mocirc higravenh phảilagravem việc thường xuyecircn với nhagrave quản lyacute ndash đối tượng mong muốn của HHTQĐ để
từ đoacute bản chất bagravei toaacuten vagrave caacutec quyết định được hiểu tốt hơn1048713 Mocirc higravenh được xacircy dựng từ viễn cảnhcaacutech nhigraven của nhagrave quản lyacute1048713 Mocirc higravenh chỉ cho một bagravei toaacuten riecircng biệt thường khocircng thể dugraveng giải caacutec bagravei toaacutenkhaacutec Như vậy mỗi thagravenh phần của mocirc higravenh ứng với một phần của hệ thống thựcdo đoacute sẽ khocircng yecircu cầu nhagrave quản lyacute phải tổng quaacutet hoacutea caacutec hiểu biết của migravenh1048713 Phổ bagravei toaacuten giải được rất rộng tồn kho nhacircn sự hoạch định chiến lược 1048713 Coacute thể chứa caacutec phức tạp thực sự của bagravei toaacuten khocircng cần caacutec đơn giản hoacutea (TDdugraveng caacutec phacircn phối xaacutec suất thực thay vigrave phacircn phối lyacute thuyết xấp xỉ)1048713 Coacute thể tự động sinh ra nhiều đo lường hiệu năng quan trọng1048713 Thường lagrave phương phaacutep duy nhất của HHTQĐ coacute thể xử lyacute caacutec bagravei toaacuten tương đốiphi cấu truacutec1048713 Coacute một số caacutec goacutei phần mềm mocirc phỏng (Monte Carlo) tương đối dễ dugravengbull Điểm yếu1048713 Tuy thường tigravem được caacutec phương aacuten đủ tốt nhưng khocircng đảm bảo lời giải tối ưu1048713 Quaacute trigravenh xacircy dựng mocirc higravenh thường dagravei vagrave tốn keacutem1048713 Giải phaacutep vagrave suy diễn từ nghiecircn cứu mocirc phỏng thường khocircng thể chuyển sang bagraveitoaacuten khaacutec vigrave mocirc higravenh kết hợp caacutec yếu tố đặc thugrave1048713 Đocirci khi do mocirc higravenh quaacute dễ giải thiacutech cho nhagrave quản lyacute necircn caacutec phương phaacutep phacircntiacutech thường xem nhẹ1048713 Phần mềm mocirc phỏng đocirci khi yecircu cầu caacutec kỹ năng đặc biệt do độ phức tạp củaphương phaacutep giải higravenh thứcbull Caacutec loại mocirc phỏng1048713 Mocirc phỏng xaacutec suất một hay nhiều biến độc lập mang tiacutenh xaacutec suất với 2 loạiphacircn phối ndash thường dugraveng kỹ thuật Monte Carlo1048713 Phacircn phối rời rạc tigravenh huống coacute một số giới hạn caacutec biến cố (biến) với hữu hạncaacutec giaacute trị cho mỗi biến cố (biến)1048713 Phacircn phối liecircn tục tigravenh huống coacute số lượng khocircng giới hạn caacutec biến cố tuacircn theocaacutec hagravem mật độ xaacutec suất như phacircn phối chuẩn1048713 Mocirc phỏng độc lậpphụ thuộc theo thời gian1048713 Độc lập khocircng cần thiết phải biết chiacutenh xaacutec thời điểm xảy ra biến cố (nhu cầutiecircu thụ lượng sản phẩm trong ngagravey khocircng biết chiacutenh xaacutec thời điểm tiecircu thụ)1048713 Phụ thuộc cần biết chiacutenh xaacutec thời điểm xảy ra sự kiện (bagravei toaacuten hagraveng đợi)1048713 Mocirc phỏng tương taacutec trực quan1048713 Mocirc phỏng hướng đối tượng dugraveng tiếp cận hướng đối tượng để xacircy dựng mocirc higravenhmocirc phỏng Chuacute yacute ngocircn ngữ mocirc higravenh hoacutea nhất thể UML (unified modelinglanguage) kể cả khi mocirc phỏng caacutec hệ thời gian thựcMOcirc HIgraveNH HOacuteA ĐA CHIỀU ndash XỬ LYacute PHAcircN TIacuteCH TRỰC TUYẾNbull Người ra quyết định thường phải xem xeacutet nhiều chiều của dữ liệu (TD caacutec chiềucủa dữ liệu baacuten hagraveng lagrave sản phẩm vugraveng thời gian người baacuten ) dữ liệu cần đượcphacircn tiacutech trực tiếp bằng caacutec cocircng cụ chuẩn hay phacircn tiacutech tự động bằng caacutec
phương phaacutep khai mỏ dữ liệu (data mining)bull Hầu hết caacutec hệ thống phacircn tiacutech đa chiều được nhuacuteng trong caacutec hệ xử lyacute phacircn tiacutechtrực tuyến (HXLPTTT ndash online analytic processing - OLAP)bull Mục tiecircu của XLPTTT nắm bắt cấu truacutec của dữ liệu thực để hỗ trợ ra quyết địnhbull Trong HHTQĐ coacute sự gắn nối tự nhiecircn giữa mocirc higravenh hoacutea dữ liệu mocirc higravenh hoacutea kyacutehiệu vagrave caacutec khiacutea cạnh của phacircn tiacutech ldquowhat-ifrdquobull Caacutec baacuteo caacuteo của HXLPTTT đều coacute tiacutenh tương taacutec dễ khai thaacutec sử dụng đặc biệtphugrave hợp cho caacutec baacuteo caacuteo về chỉ số hiệu năng chủ yếu (key performance indicators- KPI) baacuteo caacuteo về đo lường hiệu năng kinh doanh bull Thế hệ hiện tại của HXLPTTT vagrave hệ khai mỏ dữ liệu (data mining) tiacutech hợp caacutecđặc tiacutenh của hệ thocircng tin latildenh đạo (executive information system ndashEIS- nhiềucaacutech nhigraven dữ liệu chi tiết hoacutea theo nhu cầu) vagrave caacutec hệ đồ họa khaacutec ndash thường coacutegiao diện người dugraveng dạng kiểu WEBbull Caacutec hệ thống như trecircn cograven được gọi lagrave caacutec cocircng cụ triacute tuệ kinh doanh (businessintelligence - BI) vigrave coacute caacutec đặc trưng về mocirc higravenh hoacutea vagrave tối ưu hoacutea nhưng lạitrong suốt đối với ngươigrave dugravengbull Hiện caacutec cocircng cụ được đưa ra bởi caacutec nhagrave cung cấp về CSDL về hoạch định tagraveinguyecircn tổ chức (ERP) về nhagrave kho dữ liệu (data warehouse) về HXLPTTT MOcirc HIgraveNH HOacuteA VAgrave MOcirc PHỎNG TƯƠNG TAacuteC TRỰC QUANbull Iacutech lợi Người ra quyết định tham gia vagraveo quaacute trigravenh phaacutet triển mocirc higravenh vagrave thựcnghiệm mocirc phỏng vigrave vậy sẽ tin tưởng khi sử dụng mocirc higravenhbull Mocirc higravenh hoacutea tương taacutec trực quan (visual interactive modeling - VIM) dugraveng caacutecbiểu diễn đồ họa maacutey tiacutenh để trigravenh bagravey caacutec ảnh hưởng của caacutec quyết định quản lyacutekhaacutec nhau ở một thời điểm (tĩnh) hay tiến triển theo thời gian (động với kỹ thuậthoạt higravenh)bull Mocirc phỏng tương taacutec trực quan (visual interactive simulation - VIS) cho pheacutepngười dugraveng theo dotildei tiến trigravenh xacircy dựng vagrave sử dụng khai thaacutec mocirc higravenh mocirc phỏngdưới dạng hoạt higravenhbull Mocirc higravenh hoacutea tương taacutec trực quan coacute thể kết hợp với tiếp cận triacute tuệ nhacircn tạo đểđưa ra caacutec khả năng mới thay đổi từ xacircy dựng hệ thống dạng đồ họa đến tigravem hiểuvề động học của hệ thốngbull Cần đến caacutec hệ thống maacutey tiacutenh xử lyacute song song tốc độ cao để xacircy dựng caacutec mocircphỏng - phức tạp quy mocirc lớn dạng hoạt higravenh - mang tiacutenh khả thi ở thời gian thực
22Caacutec dạng hệ thống hỗ trợ ra quyết địnhHệ hỗ trợ quyết định nhoacutemRa quyết định nhoacutem giao tiếp vagrave cộng taacutec- Caacutec đặc điểm của cocircng việc nhoacutem+ Một nhoacutem thực hiện một nhiệm vụ thỉnh thoảng ra quyết định thỉnh thoảngkhocircng ra quyết định+ Caacutec thagravenh viecircn trong nhoacutem coacute thể ở những nơi khaacutec nhau
+ Caacutec thagravenh viecircn trong nhoacutem coacute thể lagravem việc ở những thời gian khaacutec nhau+ Caacutec thagravenh viecircn trong nhoacutem coacute thể lagravem việc cugraveng nhau hoặc ở caacutec tổ chức khaacutecnhau+ Nhoacutem coacute thể vĩnh viễn hoặc tạm thời+ Nhoacutem coacute thể ở bất kỳ mức quản lyacute nagraveo hoặc mức thời gian nagraveo+ Coacute sự điều phối (quaacute trigravenh vagrave nhiệm vụ đạt được) hoặc macircu thuẩn trongnhoacutem+ Coacute sự đạt được hoặcvagrave mất maacutet năng suất trong tổ chức+ Nhiệm vụ phải hoagraven thagravenh rất nhanh+ Khocircng thể hoặc quaacute đắt cho tất cả caacutec thagravenh viecircn trong nhoacutem cugraveng hợp ở mộtnơi+ Một số dữ liệu thocircng tin hoặc kiến thức cần thiết nằm ở nhiều nơi một sốkhaacutec ở ngoagravei tổ chức+ Chuyecircn mocircn của caacutec thagravenh viecircn khocircng coacute trong nhoacutem lagrave cần thiết- Caacutec hoạt động vagrave caacutec quaacute trigravenh miecircu tả caacutec cuộc họp+ Cuộc họp lagrave hoạt động chung liecircn quan bởi một nhoacutem người coacute địa vị bằngnhau hoặc gần bằng nhau+ Kết quả của cuộc họp phụ thuộc một phần vagraveo kiến thức yacute kiến caacutec đaacutenh giaacutecủa caacutec thagravenh viecircn+ Kết quả của cuộc họp cũng phụ thuộc vagraveo sự kết hợp của nhoacutem vagrave phụ thuộcvagraveo quaacute trigravenh ra quyết định được sử dụng bởi nhoacutem đoacute+ Giải quyết caacutec yacute kiến khaacutec nhau bởi người coacute quyền hạn hoặc thương lượnghoặc phacircn xửHỗ trợ giao tiếp- Giao tiếp lagrave thagravenh phần quan trọng cho hỗ trợ quyết định Khocircng coacute giao tiếp thigravekhocircng coacute cộng taacutec Những người ra quyết định caacute nhacircn phải giao tiếp với caacutecđồng nghiệp chuyecircn gia cơ quan chiacutenh phủ khaacutech hagraveng đối taacutec kinh doanh hellipHọ cũng cần dữ liệu vagrave thocircng tin (vagrave kiến thức) từ nhiều nơi trecircn thế giới Caacutecnhoacutem ra quyết định phải giao tiếp cộng taacutec vagrave thương lượng trong cocircng việcHầu hết caacutec tổ chức sẽ nhanh trở thagravenh khocircng coacute chức năng nếu khocircng coacute caacutec hệthống giao tiếp Thương mại điện tử coacute thể hiệu quả chỉ qua caacutec kỹ thuật giao tiếphiện đại- Caacutec kỹ thuật thocircng tin hiện đại cung cấp caacutec phương tiện hỗ trợ giao tiếp rẻnhanh coacute khả năng coacute thể tin cậy Nền tảng hỗ trợ giao tiếp lagrave caacutec hệ thống maacuteytiacutenh mạng+ Bắt đầu bằng điện baacuteo điện thoại radio vagrave ti vi+ Trong 100 năm chuacuteng ta phaacutet triển maacutey fax thư điện tử chương trigravenh chatnhoacutem tin tức hệ thống hội nghị truyền higravenh Hầu hết caacutec kỹ thuật nagravey đềuhoạt động trecircn internet+ Sự phaacutet triển giao tiếp sau cugraveng lagrave hệ thống họp điện tử caacutec dịch vụ vagrave hệ
thống hội nghị điện tử thường sử dụng internet để kết nối caacutec người ra quyếtđịnh- Caacutec thuận lợi aacutep dụng caacutec phương phaacutep giao tiếp cải tiến trong caacutec tổ chức+ Cải tiến năng suất của nhacircn viecircn+ Liecircn quan đến nhiều người ra quyết định chiacutenh+ Khocircng quan tacircm nhiều đến đường biecircn giới địa lyacute+ Tạo nền văn hoacutea hợp taacutec nhất quaacuten+ Cải tiến chất lượng cuộc sống của nhacircn viecircnHỗ trợ cộng taacutec Maacutey tiacutenh hỗ trợ cộng taacutec- Khung thời giannơi chốn+ Sự hiệu quả của kỹ thuật tiacutenh toaacuten cộng taacutec phụ thuộc vagraveo vị triacute của caacutec thagravenhviecircn trong nhoacutem vagrave phụ thuộc vagraveo thời gian chia sẽ thocircng tin gởi vagrave nhận+ Chia sự giao tiếp thagravenh bốn ocirc vagrave tổ chức bốn ocirc dọc theo 2 chiều thời gian vagravenơi chốn1048713 Thời gian Khi gởi vagrave nhận thocircng tin hầu như đồng thời giao tiếp lagrave đồngthời Viacute dụ Điện thoại ti vi vagrave caacutec cuộc họp gặp mặt nhau Giao tiếp bấtđồng bộ xảy ra khi người nhận nhận thocircng tin ở thời điểm khaacutec thời điểmgởi thocircng tin đoacute1048713 Nơi chốn Người gởi vagrave người nhận coacute thể ở cugraveng phograveng hoặc khocircng+ Bốn ocirc lagrave1048713 Cugraveng thời giancugraveng nơi chốn Caacutec thagravenh viecircn gặp mặt nhau cugraveng một luacutecgiống như phograveng quyết định hoặc gặp mặt truyền thống1048713 Cugraveng thời giankhaacutec nơi chốn Caacutec thagravenh viecircn ở caacutec nơi khaacutec nhau nhưnggiao tiếp cugraveng nhau Viacute dụ hội nghị truyền higravenh (videoconferencing)1048713 Khaacutec thời giancugraveng nơi chốn Nhiều người lagravem việc theo ca Ca nagravey để lạithocircng tin cho ca khaacutec1048713 Khaacutec thời giankhaacutec nơi chốn Caacutec thagravenh viecircn ở caacutec nơi khaacutec nhau Caacutecthagravenh viecircn nagravey gởi vagrave nhận thocircng tin ở những lần khaacutec nhau
23Thực thi hệ DSSHệ thống hỗ trợ quản lyacute (MSS) khocircng phải luacutec nagraveo cũng luocircn thagravenh cocircng Nhiều trường hợpthất bại của ES khocircng hoagraven toagraven lagrave lyacute do kỹ thuật Thực thi hệ thống lagrave một quaacute trigravenh liecircn tụcnhằm đảm bảo cho tổ chức chuẩn bị tiếp nhận một hệ thống mới vagrave đưa hệ thống vagraveo sử dụngthagravenh cocircngThực hiện cocircng nghệ hệ thống hỗ trợ quản lyacute lagrave việc phức tạp vigrave caacutec hệ thống nagravey khocircng đơnthuần lagrave hệ thống thocircng tin chỉ thu thập thao taacutec vagrave phacircn phối thocircng tin Magrave xa hơn chuacuteng
liecircn quan tới caacutec cocircng việc coacute thể lagravem thay đổi đaacuteng kể caacutech thức hoạt động của tổ chức Tuyvậy đa số caacutec yếu tố thực thi đều liecircn quan tới hệ thống thocircng tinThực thi MSS lagrave quaacute trigravenh liecircn tục diễn ra trong suốt thời gian phaacutet triển hệ thống từ đề xuấtban đầu đến nghiecircn cứu khả thi thiết kế vagrave phacircn tiacutech hệ thống lập trigravenh huấn luyện chuyểnđổi vagrave lắp đặt Caacutec chuyecircn gia hệ thống thocircng tin thường gọi thực thi lagrave giai đoạn cuối trongvograveng đời hệ thống Định nghĩa thực thi MSS phức tạp hơn vigrave bản chất lặp của sự phaacutet triểncaacutec hệ thống
THỰC THI KHOcircNG HOAgraveN CHỈNHCaacutec quyết định về tiacutenh khả thi thường coacute giả định về lợi iacutech đạt được khi kế hoạch thực thiđược thực hiện hoagraven toagraven Trong thực tế thường chỉ thực hiện 90 thậm chiacute 70 phần trăm sovới phacircn tiacutech khả thi Lyacute do lagrave sự thay đổi tại một nơi trong hệ thống coacute thể ảnh hưởng vagrave coacutethể taacutec động tiecircu cực đến chỗ khaacutec Do vậy cấp quản lyacute coacute thể bỏ những phần trong dự aacuten coacutethể gacircy ra taacutec động xấu Do đoacute dự aacuten sẽ thực hiện iacutet hơn 100 so với dự aacuten kế hoạch Caacutec lyacutedo khaacutec coacute thể lagrave do khấu trừ ngacircn saacutech hoặc vượt chi phiacuteĐAacuteNH GIAacute SỰ THAgraveNH COcircNG CỦA THỰC THI HỆ THỐNGPhải coacute caacutec chỉ số đo lường thigrave mới coacute thể đaacutenh giaacute sự thagravenh cocircng khi thực thi một hệ thốngDickson va Powers (1973) đề ra 5 tiecircu chuẩn độc lậpbull Tỷ lệ thời gian thực hiện dự aacuten với thời gian ước lượngbull Tỷ lệ chi phiacute thực tế vagrave ngacircn saacutech thực hiệnbull Thaacutei độ của cấp quản lyacute đối với hệ thốngbull Nhu cầu thocircng tin của caacutec nhagrave quản lyacute được đaacutep ứng như thế nagraveo qua hệ thốngbull Taacutec động của dự aacuten đối với những hoạt động maacutey tiacutenh trong cocircng tyCaacutec đo lường khaacutec để đaacutenh giaacute thagravenh cocircng của hệ hỗ trợ quản lyacute (MSS)bull Sự sử dụng hệ thống (dự định dugraveng hoặc thực sự dugraveng)bull Thỏa matilden của người dugravengbull Thaacutei độ taacuten thagravenhbull Mức độ hệ thống hoagraven thagravenh caacutec mục tiecircu ban đầubull Phần thưởng đối với tổ chức (giảm chi phiacute tăng doanh thuhellip)bull Tỷ số lợi iacutech chi phiacute
bull Mức độ thể chế hoacutea của MSS trong tổ chứcDo bởi tiacutenh đa dạng của DSS necircn việc đaacutenh giaacute sự thagravenh cocircng của hệ nagravey cũng khoacute khăn tuynhiecircn cũng coacute thể coacute một số yếu tố giuacutep cho DSS thagravenh cocircng như sự tham gia người dugravenghuấn luyện người dugraveng hỗ trợ quản lyacute cấp cao nguồn thocircng tin đặc điểm của những nhiệmvụ coacute liecircn quan (cấu truacutec bất định độ khoacute phụ thuộc)
Chương5Nhoacutem hỗ trợ quyết định vagrave nhoacutemcocircng nghệ phần mềm
51Nhoacutem tạo quyết định
MDM-Holsapple đatilde gợi yacute chuacuteng ta sử dụng giới hạn người tạo quyết định
Một nhoacutem lagrave kết cấu MDM nơi magrave nhiều người ra quyết định hoagraven toagraven tương taacutec
Một đội lagrave kết cấu MDM nơi caacutec thagravenh viecircn tư vấn cho người đưa ra quyết định nhưng khocircng tương taacutec
Một Ủy ban lagrave kết cấu MDM với một người tạo quyết định duy nhất vagrave sự tương taacutec giữa caacutec thagravenh viecircn
Mạng thocircng tin
Mạng lưới baacutenh xe mỗi người tham gia coacute thể giao tiếp với người đưa ra quyết định ở trung tacircm nhưng khocircng phải với người tham gia khaacutecCấu truacutec nagravey lagrave khocircng thỏa matilden tất cả những người tham gia ngoại trừ người ra quyết định
Mạng dacircy chuyền Tham gia chuyển tiếp thocircng tin chỉ để noacute luocircn liền kề nhau trong chuỗi
Thagravenh viecircn cuối cugraveng ko được đaacutep ứng
Mạng vograveng trograven Tương tự như chuỗi nhưng kết thuacutec được kết nối
Mạng kết nối hoagraven toagraven khocircng coacute hạn chế về giao tiếp vagrave tương taacutec giữa caacutec thagravenh viecircnNoacutei chungnoacute đaacutep ứng hầu hết caacutec kết nối của người tham gia nhưng truyền đạt thocircng tin mất nhiều thời gian vagrave coacute nhiều cơ hội xảy ra lỗi
Nhoacutem hagravenh vi vagrave chuẩn mực
MDMs thiết lập caacutec chỉ tiecircu hướng dẫn quaacute trigravenh ra quyết định
Một chuẩn mực quy định cụ thể những gigrave thagravenh viecircn trong nhoacutem dự kiến sẽ lagravem trong những hoagraven cảnh nhất định
Quy tắc gửi coacute thể được thocircng qua viacute dụ đaacutenh giaacute ngang hagraveng hoặc xử phạt
Lagravem thế nagraveo để đưa ra quyết định
Việc chọn lựa magrave trong đoacute việc sử dụng cấu truacutec MDM phải được dựa trecircn một số yếu tố liecircn quan với bối cảnh quyết định
Viacute dụmột cấu truacutec riecircng lẻ sẽ lagravem việc nơi magrave quyết định được cấu truacutec cao vagrave thocircng tin lagrave coacute sẵn
Một ủy ban cơ cấu sẽ lagrave sự lựa chọn khi người ra quyết định khocircng thể đưa ra quyết định một migravenh
52Caacutec vấn đề thường gặp trong nhoacutem
Kiacutech thước Noacutei chung sự nhất triacute vagrave gắn kết giữa caacutec thagravenh viecircn tỉ lệ nghịch với phạm vi nhoacutem Trong nhoacutem lớn rất dễ higravenh thagravenh caacutec nhoacutem nhỏ vagrave hoạt động rời rạc
Tư duy tập thể Trong nhoacutem lớn mọi người coacute xu hướng suy nghĩ đểđạtđược sự nhất triacute necircn khocircng phaacutet huy được sự saacuteng tạo
Caacutec vấn đề về xatilde hội
Xung đột Trong 1 nhoacutem ai cũng muốn migravenh lagrave giỏi nhất necircn dễ dẫn đến xung đột
Ẩn danh(Giấu tecircn) Đacircy lagrave phương phaacutep được sử dụng để kiểm soaacutet xung đột Cho caacutec thagravenh viecircn tham gia ẩn danh
Vấn đề giới tiacutenh Nam vagrave nữ thường coacute những thế mạnh khaacutec nhau điều nagravey coacute thể lagrave sức mạnh trong 1 thiết lập MDM
Đagravem phaacuten vagrave quyết định
Một quyết định coacute thể liecircn quan đến nhiều quan điểm khaacutec nhau vigrave thế cần phải coacute sự đagravem phaacuten
Caacutec thiết kế của cơ chế hỗ trợ cho MDM phải phugrave hợp với caacutec hoạt độngđagravemphaacuten
Những hoạt động nagravey bao gồm việc thu nhận yacute kiến của caacutec thagravenh viecircn 1 caacutech cocircng bằng
53Cocircng nghệ hỗ trợ MDM
Organizational DSSndash 1 hệ thống cung cấp caacutec quyết định hỗ trợ
Group Support Systemndash Cocircng nghệ sử dụng sự hỗ trợ của nhiều becircn tham gia
Group DSS ndash Lagrave 1 hệ thống được thiết kế đặc biệt để hỗ trợ cho MDM
DSS ndash Lagrave 1 hệ thống dưới sự kiểm soaacutet của 1 người quyết định hệ thống nagravey cung cấp 1 bộ cocircng cụ giuacutep phacircn tiacutech hoagraven cảnh đểđưa ra quyết định vagrave nacircng cao hiệu quả của quyết địnhđoacute
53Cocircng nghệ hỗ trợ MDM
Organizational DSSndash 1 hệ thống cung cấp caacutec quyết định hỗ trợ
Group Support Systemndash Cocircng nghệ sử dụng sự hỗ trợ của nhiều becircn tham gia
Group DSS ndash Lagrave 1 hệ thống được thiết kế đặc biệt để hỗ trợ cho MDM
DSS ndash Lagrave 1 hệ thống dưới sự kiểm soaacutet của 1 người quyết định hệ thống nagravey cung cấp 1 bộ cocircng cụ giuacutep phacircn tiacutech hoagraven cảnh đểđưa ra quyết định vagrave nacircng cao hiệu quả của quyết địnhđoacute
Mục tiecircu của cocircng nghệ hỗ trợ MDM
Quy trigravenh hỗ trợ tập trung vagraveo quaacute trigravenh tạo điều kiện thuận lợi cho sự tương taacutec
Cơ chế cấu truacutec quaacute trigravenh chi phối caacutec hoạt động truyền thocircng
Nhiệm vụ hỗ trợ cocircng việc coacute thể chọn lựa tổ chức hoặc lấy thocircng tin
Nhiệm vụ cấu truacutec cocircng việc cho pheacutep truy cập đến kỹ thuật lọc kết hợp phacircn tiacutech kiến thức liecircn quan đến cocircng việc
Caacutec lớp loại cocircng nghệ hỗ trợ MDM
Phacircn loại theo đặc điểm do DeSanctis vagrave Gallupe đưa ra đề xuất một chương trigravenh ba cấp dựa trecircn caacutec tiacutenh năng được cung cấp
Hệ thống cấp 1 Mục điacutech chiacutenh lagrave tạo điều kiện thocircng tin liecircn lạc giữa caacutec thagravenh viecircn
Hệ thống cấp 2 Thiết kế để giảm thiểu rủi ro
Hệ thống cấp 3 Giuacutep điều chỉnh xử lyacute quyết định
Phacircn loại theo cocircng nghệ -Kraemer vagrave King tập trung vagraveo cocircng nghệ aacutep dụng
Cocircng nghệ bảng mạch điện tử
Hội nghị trực tuyến
Mạng lưới tập đoagraven
Trung tacircm thocircng tin
Mocirci trường cộng taacutec
Phograveng quyết định
Nhoacutem phần mềm
Phần mềm được thiết kế để hỗ trợ sự hợp taacutec bao gồm việc thu huacutet vagrave lưu trữ thocircng tin
Caacutec tổ chức dẫn đầu thị trường hiện tại lagrave Lotus Notes and Domino Microsoft Exchange Novell GroupWise and Oracle Office
Caacutec cocircng cụ trong một bộ phần mềm bao gồm người quản lyacute hội nghị (Lotus Sametime) vagrave trao đổi thocircng điệp (Lotus Notes Mail)
Xếp hạng phần mềm cho nhoacutem
Ellis vv đề xuất một hệ thống xếp hạng dựa vagraveo kiểu sự hỗ trợ noacute Cung cấp
Hệ thocircng điệp
Hệ thống hội thảo truyền higravenh
Hệ thống cộng taacutec soạn thảo
Nhoacutem phacircn phối giải phaacutep phần mền
Hệ thống phối hợp
Hệ thống thocircng minh đại diện
Lực lượng điều khiển phaacutet triển phần mềm cho nhoacutem
Một số nhacircn tố chiacutenh bao gồm
Tăng năng suất
Giảm số lượng caacutec cuộc họp
Tăng cường tự động hoacutea caacutec quy trigravenh lagravem việc thường xuyecircn
Cần phối hợp toagraven cầu tốt hơn
Tiacutenh sẵn sagraveng của những mạng lan rộng
Coleman vagrave Khanna liệt kecirc 10 nhacircn tố khaacutec
54Quản lyacute hoạt động MDM (Mobile Device Management - Quản lyacute thiết bị di động)
Một số phương phaacutep phối hợp phổ biến hơnMDM lagrave
Kỹ thuật nhoacutem định danh
Kỹ thuật Delphi
Sự phacircn xử
Hệ thocircng tin dựa trecircn vấn đề
Nemawashi
Kỹ thuật nhoacutem định danh
1-Mỗi người tham gia viết ra những yacute tưởng về những gigrave necircn quyết định
2-Lần lượt mỗi người tham gia trigravenh bagravey yacute tưởng của migravenh được ghi lại trecircn bảng Khocircng thảo luận ở đacircy
3-Sau khi tất cả caacutec yacute tưởng được trigravenh bagravey caacutec đại biểu coacute thể chất vấn những người khaacutec
4-Mỗi người tham gia bỏ phiếu cho mỗi yacute tưởng
Kỹ thuật Delphi
Về cơ bản tương tự như kỹ thuật nhoacutem định danh ngoại trừ những người khocircng bao giờ tham gia cuộc họp
Một cocircng cụ khảo saacutet được sử dụng để thu thập đầu vagraveo ban đầu từ caacutec thagravenh viecircn
Một cuộc khảo saacutet thứ hai được gửi đi với một bản toacutem tắt caacutec kết quả chung
Những bước lặp lại cho đến khi đạt được một sự đồng thuận hoặc nhigraven nhận của đa số
Sự phacircn xử(Arbitration )
Thiacutech hợp nhất khi caacutec thagravenh viecircn của MDM đại diện cho caacutec yếu tố đối lập
Những người tham gia đồng yacute rằng nếu lựa chọn thay thế hai becircn thỏa thuận khocircng được tigravem thấy thigrave một trọng tagravei viecircn becircn ngoagravei sẽ tham gia
Trọng tagravei sau đoacute lựa chọn thay thế ocircng hoặc xeacutet thấy thiacutech hợp nhất
Hệ thống thocircng tin dựa trecircn vấn đề (IBIS)
Lagrave một phương phaacutep lập luận cấu truacutec
Một đại diện cho IBIS lagrave một đồ thị với caacutec nuacutet vagrave caacutec liecircn kết
IBIS bắt đầu với lựa chọn của một nuacutet vấn đề gốc sau đoacute caacutec nuacutet vị triacute khaacutec nhau được liecircn kết với nuacutet gốc
Caacutec nuacutet vị triacute nagravey sau đoacute được đaacutenh giaacute dựa trecircn những lập luận gắn liền với chuacuteng
Nemawashi (được sử dụng rộng ratildei tại Nhật Bản)
1-Một hoặc nhiều thagravenh viecircn của MDM được chỉ định lagrave điều phối viecircnCaacutec điều phối viecircn sau đoacute chọn người tham gia cograven lại
2-Điều phối viecircn xacircy dựng một tổng hợp caacutec sự lựa chọn vagrave sau đoacute caacutec chuyecircn gia đaacutenh giaacute caacutec lựa chọn
3-Điều phối viecircn lựa chọn một sự lựa chọn dựa trecircn kết quả ở trecircn(ở 2)
4-Sự thay thế được luacircn chuyển điều phối viecircn tigravem kiếm sự đồng thuận thocircng qua sự thuyết phục vagrave đagravem phaacuten
5-Nếu đạt được sự đồng thuận điều phối viecircn cho lưu thocircng một tagravei liệu magrave mỗi thagravenh viecircn MDM để lại dấu hiệu trecircn đoacute
55Nơi lagravem việc ảo
Nhiều tổ chức trecircn toagraven thế giới kinh doanh bất động sản cho cocircng nghệ hợp taacutec
Cocircng việc được trở thagravenh một điều bạn lagravem hơn lagrave một nơi bạn đi
Những thay đổi lớn nhất mang lại bởi nơi lagravem việc ảo coacute thể lagrave về văn hoaacute hay xatilde hội hơn lagrave về cocircng nghệ
Chương 6 Hệ thống thocircng tin điều hagravenh
61 Yacute nghĩa của EIS- Hệ thống thocircng tin điều hagravenh
- EIS lagrave một dạng đặc biệt của DSS được thiết kế để hỗ trợ ra quyết định ở cấp cao nhất của một tổ chức
- Lagrave một hệ thống thocircng tin hỗ trợ nhu cầu lập kế hoạch vagrave đaacutenh giaacute của caacutec nhagrave quản lyacute điều hagravenh
- EIS coacute thể giuacutep một CEO coacute được bức tranh tổng thể chiacutenh xaacutec nhất về caacutec hoạt động vagrave một bản toacutem tắt những gigrave magrave đối thủ cạnh tranh đang lagravem
- Caacutec hệ thống nagravey noacutei chung hoạt động dễ dagraveng vagrave trigravenh bagravey thocircng tin theo những caacutech dễ hiểu để việc tiếp thu được nhanh choacuteng (biểu đồ đồ thịhellip)
(Tagravei liệu thecircm EIS lagrave những loại hệ thống lagrave rất phức tạp trong tự nhiecircn Coacute thể noacutei hệ thống nagravey cũng cung cấp cho caacutec nhagrave quản lyacute với caacutec thiết bị coacute khả năng ra quyết định bằng caacutech sử dụng của noacute Hệ thống nagravey hoạt động trong điều kiện như vậy quan trọng như trong caacutec hệ thống khaacutec khocircng hỗ trợ Khả năng lưu trữ dữ liệu nặng lagravem cho noacute lyacute tưởng để được thocircng qua khocircng chỉ bởi caacutec doanh nghiệp lớn magrave cograven bởi caacutec doanh nghiệp nhỏ hơn Nhigraven chung hệ thống nagravey lagrave dagravenh cho caacutec nhacircn viecircn cấp cao hỗ trợ thagravenh thạo trong việc đưa ra caacutec quyết định quan trọng)
Caacutec phiecircn EIS tiecircu biểu- Phiecircn lagravem việc coacute thể bắt đầu với một baacuteo caacuteo về tigravenh higravenh tagravei chiacutenh vagrave kinh
doanh của một cocircng ty caacutec chỉ số hoạt động quan trọng được hiển thị rotilde ragraveng- EIS sẽ cho pheacutep caacutec giaacutem đốc điều hagravenh coacute thể đi sacircu vagraveo dữ liệu từ những con
số bất kỳ magrave noacute hỗ trợ- Việc điều hagravenh coacute thể lựa chọn một mức độ chi tiết ( VD danh số baacuten hagraveng) nếu
như cần điều tra thecircm- Lagrave một phương phaacutep tiếp cận coacute thể giuacutep việc ra quyết định tốt hơn
Những điều magrave EIS ko coacute- EIS khocircng phải lagrave sự thay thế cho caacutec hệ thống dựa trecircn caacutec maacutey tiacutenh khaacutec EIS
thực sự chỉ cung cấp dữ liệu cho caacutec hệ thống nagravey- Noacute khocircng thể biến caacutec bộ hệ điều hagravenh của maacutey tiacutenh thagravenh những ldquochuyecircn viecircn
giỏirdquo- Coacute thể được viacute một caacutech cao hơn như lagrave một trợ lyacute đaacuteng tin cậy coacute thể được gọi
đến bất khi nagraveo vagrave mỗi khi cần thiết
Tagravei liệu thecircm Sự khaacutec nhau giữa EIS vagrave DSS+ EIS thiết kế để hỗ trợ những người điều hagravenh cấp cao giuacutep họ khaacutem phaacute caacutec vấn đề vagrave caacutec cơ hội DSS hỗ trợ những nười phacircn tiacutech cố gắng trả lời cacircu hỏi caacutei gigrave coacute thể lagravem cugraveng với một cơ hội hoặc một vấn đề
Chiều EIS DSSNhững người sử dụng thocircng thường
Duyệt dữ liệu đi xuống truy xuất trạng thaacutei
Hỗ trợ phacircn tiacutech vagrave quyết định
Sự thuacutec đẩy Tiacutenh thiacutech hợp Tiacutenh hiệu quảỨng dụng Queacutet mocirci trường đaacutenh giaacute
hiệu suất nhận dạng caacutec vấn đề vagrave caacutec cơ hội
Caacutec quyết định quản lyacute trecircn caacutec lĩnh vực đa dạng
Hỗ trợ quyết định Caacutec chiacutenh saacutech caacutec quyết định khocircng coacute cấu truacutec ở mức cao vagrave hỗ trợ giaacuten tiếp
Hỗ trợ caacutec quyết định lặp lại caacutec quyết định khocircng thể đoaacuten trước ra quyết định khocircng coacute cấu truacutec vagrave baacuten cấu truacutec
Loại thocircng tin Caacutec thocircng tin tin tức thocircng tin becircn ngoagravei về khaacutech hagraveng đối thủ cạnh tranh mocirci trường caacutec baacuteo caacuteo theo yecircu cầu vagrave định thời về caacutec hoạt động becircn trong
Caacutec thocircng tin hỗ trợ caacutec tigravenh huống đặc biệt
Sử dụng coacute nguyecircn tắc
Dograve theo vết vagrave điều khiển nhận dạng cơ hội
Hoạch định tổ chức phacircn nhoacutem vagrave điều khiển
Khả năng phugrave hợp với những người sử dụng caacute nhacircn
Thiết kế loại ra quyết định cho mỗi người điều hagravenh caacute nhacircn bằng nhiều lựa chọn đầu ra
Cho pheacutep caacutec đaacutenh giaacute caacute nhacircn caacutec khả năng what-if lựa chọn loại hộp hội thoại
Đồ họa Phải coacute Lagrave một phần quan trọng của nhiều DSS
Thacircn thiện người sử dụng
Phải coacute Phải coacute nếu khocircng coacute người sử dụng trung gian
Xử lyacute thocircng tin Lọc neacuten thocircng tin dograve theo vết dữ liệu vagrave thocircng tin quan trọng
EIS kiacutech thiacutech caacutec cacircu hỏi caacutec cacircu trả lời bằng caacutech sử dụng DSS vagrave phản hồi lại EIS
Hỗ trợ caacutec thocircng tin chi tiết
Truy xuất thường xuyecircn caacutec mức chi tiết của bất kỳ thocircng tin tổng hợp nagraveo (duyệt dữ
Coacute thể coacute trong DSS nhưng khocircng thường
liệu chi tiết)Cơ sở mocirc higravenh Caacutec chức năng coacute sẵn bị hạn
chếLagrave điểm cốt lotildei của DSS
Cấu truacutec Theo người baacuten sản phẩm hoặc theo caacutec chuyecircn gia hệ thống thocircng tin
Theo người sử dụng hoặc caacute nhacircn hoặc caacutec chuyecircn gia từ caacutec trung tacircm thocircng tin hoặc phograveng ban hệ thống thocircng tin
Phần cứng Mainframe caacutec trạm RISC mạng LANs hoặc caacutec hệ thống phacircn bố
Mainframe caacutec trạm RISC caacutec maacutey PC hoặc caacutec hệ thống phacircn bố
Bản chất caacutec goacutei phần mềm
Truy xuất tương taacutec dễ dagraveng đến nhiều cơ sở dữ liệu truy xuất trực tuyến caacutec khả năng DBMS phức tạp caacutec liecircn kết phức tạp
Caacutec khả năng tiacutenh toaacuten lớn caacutec ngocircn ngữ mocirc higravenh mocirc phỏng ứng dụng vagrave caacutec bộ tạo DSS
Bản chất caacutec thocircng tin
Trigravenh bagravey thocircng tin được phaacutet sinh trước về quaacute khứ vagrave hiện tại tạo caacutec thocircng tin mới về quaacute khứ hiện tại tương lai
Tạo thocircng tin mới về quaacute khứ hiện tại tương lai
62 Lịch sử EIS- EIS xuất hiện lần đầu tiecircn tại MIT vagraveo những năm 1970
- Những EIS đầu tiecircn được phaacutet triển bởi caacutec doanh ngiệp lớn sẵn sagraveng chấp nhận rủi ro để đạt được lợi thế cạnh tranh
- Vagraveo những năm 1980 caacutec nhagrave cung cấp đatilde phaacutet triển một số cơ sở khaacutech hagraveng rộng vagrave cocircng nghệ EIS được tiếp tục phaacutet triển cho đến ngagravey nay
(Tagravei liệu thecircm Sử dụng DSSEIS cho phaacutet triển bền vững + Một số nghiecircn cứu đatilde được tiến hagravenh để kiểm tra việc thực hiện của EIS trong khu vực cocircng cộng vagrave chiacutenh phủ caacutec nước tổ chức kể từ khi chuacuteng được phaacutet triển theo định hướng lợi nhuận cho caacutec cocircng ty tư nhacircn (Hasan vagrave Hasan năm 1997) Theo một nghiecircn cứu tiến hagravenh tại Mỹ ở hơn 300 cocircng ty kết quả cho thấy sự khaacutec biệt của EIS giữa tư nhacircn vagrave chiacutenh phủ một số kết quả thuacute vị được phaacutet hiệnViacute dụ khoacute khăn hơn để chuyển tiền từ một tagravei khoản khaacutec trong một EIS của chiacutenh phủ cũng lagrave khoacute khăn hơn để biện giải thiacutech cho những chi phiacute phaacutet triển EIS của chiacutenh phủ Một nghiecircn cứu khaacutec được tiến hagravenh ở Australia
cho thấy rằng EIS cung cấp cho quản lyacute một higravenh ảnh chiacutenh xaacutec hơn về tổ chức thực hiện vagrave cung cấp hỗ trợ cho caacutec lợi iacutech chiến lược cải thiện khocircng chỉ cho caacutec nhagrave quản lyacute nhưng cograven cho phần cograven lại của tổ chức Dựa trecircn caacutec hệ thống được thiết kế cho caacutec cocircng ty tư nhacircn với một caacutech rotilde ragravengxaacutec định mục tiecircu EIS lagrave thiacutech hợp cho caacutec tổ chức cocircng cộng hiện đại nhưng cần phải được linh hoạt hơn vagrave kết thagravenh chugravem một phạm vi rộng hơn khả năng vagrave phương tiện hơn so với khu vực tư nhacircn ban đầu theo định hướng sản phẩm (Hasan vagrave Hasan năm 1997) Điều nagravey coacute thể lagrave do thực tế rằng caacutec hoạt động khu vực cocircng lagrave bắt buộc coacute taacutec động rộng phải đaacutep ứng sự mong đợi duy nhất cocircng cộng thường coacute mục tiecircu mơ hồ vagrave macircu thuẫn iacutet quyền tự chủ vagrave kiểm soaacutet việc ra quyết định vagrave nhacircn viecircn lagrave khoacute khăn hơn (Watson vagrave Carte2000) + Toacutem lại EIS lagrave một khaacutei niệm thagravenh cocircng noacute phaacutet triển qua nhiều năm tuy nhiecircn EIS khắc phục khiếm khuyết của migravenh bằng caacutech tiến hagravenh nghiecircn cứu liecircn tục)
63 Tại sao những người điều hagravenh hagraveng đầu lại khaacutec nhau- Họ lagrave những doanh nghiệp theo định hướng coacute suy nghĩ
- Coacute một khoảng khocircng gian rộng để kiểm soaacutet
- Họ chịu traacutech nhiệm cho việc thiết lập chiacutenh saacutech
- Họ đại diện cho tổ chức mocirci trường becircn ngoagravei
- Hagravenh động của họ tạo ra những kết quả đaacuteng kể về tagravei chiacutenh vagrave con người
Tần số caacutec hoạt động điều hagravenh- Xử lyacute xaacuteo trộn 42
- Hoạt động kinh doanh 32
- Phacircn bổ nguồn lực 17
- Đagravem phaacuten 3
- Những điều khaacutec 6
Handling Disturbances 42
Entrepreneurial Activites 32
Resource Allocation 17
Negotiation 3
Other 6
Những thocircng tin điều hagravenh cần thiết- Quản lyacute xaacuteo trộn coacute thể yecircu cầu sự chuacute yacute xung quanh đồng hồ
- Hoạt động kinh doanh yecircu cầu điều hagravenh để dự đoaacuten những thay đổi trong mocirci trường
- Nhiệm vụ phacircn bổ tagravei nguyecircn yecircu cầu lựa chọn người quản lyacute vagrave caacutec nguồn lực hạn chế được triển khai
- Đagravem phaacuten yecircu cầu cập nhật thocircng tin từng phuacutet để coacute thể xacircy dựng được sự đồng thuận
Caacutec loại thocircng tin điều hagravenh- Hệ thống kế toaacuten coacute liecircn quan đến việc tiacutenh toaacuten thu nhập hoạt động cho caacutec lĩnh
vực cụ thể lagrave quan trọng hơn so với caacutec hệ thống kế toaacuten truyền thocircng- Thocircng tin về thị trường khaacutech hagraveng cung cấp giaacute trị trong việc quyết định chiến
lược- Caacutec thocircng tin cần thiết thường được truyền đi trecircn một số hệ thống maacutey tiacutenh vagrave
nằm trong toagraven tổ chức- Caacutec thocircng tin được sử dụng thường lagrave ngắn hạn vagrave dễ thay đổi
Phương thức để xaacutec định thocircng tin cần thiết
Rockart xaacutec định được năm phương thức cơ bản để xaacutec định thocircng tin cần thiết
- Phương thức dựa trecircn kết quả- Phương thức rỗng- Phương thức chỉ số khoacutea- Phương thức tổng hợp nghiecircn cứu- Phương thức dựa vagraveo nhacircn tố then chốt dẫn đến thagravenh cocircng
64 Thagravenh phần EIS
- Sản phẩm EIS đầu tiecircn được phaacutet triển để sử dụng trecircn maacutey tiacutenh cấu higravenh cao nhưng caacutec sản phẩm hiện nay nhằm mục tiecircu lagrave nền tảng ClientServer
- Những nền tảng linh hoạt hơn coacute thể thiacutech ứng với thay đổi trong tổ chức vagrave cocircng nghệ
- Sử dụng dữ liệu thời gian thực dẫn đến quyết định nhanh hơn nhiều thocircng tin hơn
Thagravenh phần phần cứng- Một EIS khocircng đogravei hỏi coacute phần cứng cụ thể hoặc duy nhất nagraveo- Chigravea khoacutea của vấn đề lagrave để đảm bảo rằng caacutec thagravenh phần của EIS tối ưu hoacutea vagrave
phugrave hợp với tagravei nguyecircn maacutey tiacutenh của tổ chức- Hệ thống nagravey phải được cấu higravenh để caacutec nguồn tagravei nguyecircn phugrave hợp với những
người điều hagravenh chuacuteng
Thagravenh phần phần mềm- Traacutei ngược với phần cứng phần mềm thường được chuyecircn mocircn hoacutea cao cho caacutec
bagravei toaacuten về miền- Sự chuyecircn mocircn hoacutea nagravey thường đạt được bằng caacutech sử dụng thagravenh phần off-the-
shelf cho toagraven bộ EIS vagrave caacutec mocirc-đun tugravey chỉnh để đaacutep ứng nhu cầu cụ thể- Lotus Notes lagrave một viacute dụ điển higravenh Noacute coacute thể được sử dụng một migravenh hoặc coacute
thể phục vụ becircn thứ ba mocirc-đun plug-in
Cocircng nghệ EIS hiện nay
Dobrzeniecki đề xuấtphacircn loạitừng cấptheo bachức năng- Loại 1 sản phẩm bao gồmmột bộ đầy đủcaacutec ứng dụngtừ mộtnhagrave cung cấp- Loại 2 sản phẩm đượcthựchiệnở phần đầu củacaacutecsản phẩmDSS đượcphaacutet triển
bởicugravengmộtnhagrave cung cấp- Loại 3 sản phẩmkết hợp với nhautheo bất kỳ số lượngthuộc sở hữu củacocircng ty
65 Xacircy dựng EIS
- Xacircy dựngmộtEISgiống nhưxacircydựngmột số hệ thống khaacutec củamocirc higravenh hệ thống thocircng tin
- Việcphaacutet triểncấu truacutecnecircn được theo dotildeitừ quaacute trigravenh thiết kế đến quaacute trigravenhthực hiện
- Tuy nhiecircn một dự aacuten phaacutet triển EIScoacute xu hướnglagrave thống nhấtvagraveyecircu cầu hỗ trợ caacutec nhagrave quản lyacute latildenh đạo
- Xacircy dựng một EIScoacute thểphaacutet hiện ra đượccaacutectigravenh huống khoacute khănmagravemột nhagrave phaacutet triển chưabao giờ gặp phải
Mocirc higravenh EIS
Khung phaacutet triển một EIS
- Watson et al đề nghị xacircy dựngkhung với ba thagravenh phần+ Caacutech tiếp cận tập trung vagraveo yếu tốcon người vagrave dữ liệu coacute liecircn quan đến EIS+ Quaacute trigravenh phaacutet triển cần sự linh hoạt vagrave tương taacutec+ Người sử dụng - hệ thống hộp thoại bao gồm một ngocircn ngữ hagravenh động để xử lyacute caacutec lệnh
Lợi iacutech của EIS- Dễ duy trigrave caacutec mục tiecircu coacute tổ chức- Dễ truy xuất thocircng tin- Cho pheacutep người sử dụng nacircng cao hiệu suất hơn
- Tăng chất lượng ra quyết định- Cung cấp sự cải tiến cạnh tranh- Tiết kiệm thời gian của người sử dụng- Tăng khả năng vagrave chất lượng giao tiếp- Cung cấp khả năng điều khiển tốt hơn trong tổ chức- Cho pheacutep tham gia caacutec vấn đề vagrave caacutec cơ hội- Cho pheacutep hoạch định- Cho pheacutep tigravem kiếm nguyecircn nhacircn của một vấn đề- Thảo matilden caacutec yecircu cầu của người điều hagravenh
Hạn chế của EIS vagrave 1 số sai lầm cần traacutenh
- Chi phiacute một cuộc khảo saacutetnăm1991 chothấychi phiacute phaacutet triểntrungbigravenh365000USDvớichi phiacute vận hagravenhhagraveng năm lagrave$200000 (EIS)
- Cocircng nghệ hạn chếEIScần phảiđượctiacutech hợp hoagraven toagravenvagraveokiếntruacuteccủadoanh nghiệphiện tại do đoacute noacutelagrave một thaacutech thứclớn đối vớithiết kế
- Hạn chế tổ chức cơ cấu tổ chứccoacute thể khocircng phugrave hợp
Sự hạn chế về tổ chức- Chương trigravenh nghị sự vagrave thời gian chệch EIS mocirc tả một phần việc thực hiện một
chương trigravenh nghị sự vagrave coacute thể dễ dagraveng đạt được sự tin cậy một caacutech chắc chắn- Đồng bộ hoacutea việc quản lyacute sự tin cậy đuacuteng luacutec đặc biệt baacuteo caacuteo EIS coacute thể phaacute
vỡ sự ổn định thiết lập caacutec chu trigravenh baacuteo caacuteo một caacutech tốt nhất- Sự bất ổn EIS phản ứng nhanh coacute thể gacircy ra việc taacutec động trở lại một caacutech
nhanh choacuteng dẫn đến sự thiếu ổn định trong tổ chức
Sự thất bại lagrave thay thế khocircng thể chấp nhận được- Một số yếu tố lagravem EIS thất bại
+ Thiếu sự hỗ trợ về mặt quản lyacute+ Vấn đề chiacutenh trị+ Thất bại của nhagrave phaacutet triển+ Lỗi về cocircng nghệ+ Giaacute cả+ Thời gian
66 Ra quyết định điều hagravenh trong tương lai vagrave EIS
- Coacute một vagravei điều kiện sẽ được hợp nhất cho việc chuyển đổi cocircng nghệ Trong đoacute một vagravei điều kiện coacute thể dễ dự đoaacuten Hai điều kiện magrave ta coacute thể thấy lagrave+ Phaacutet triển cocircng nghệ maacutey tiacutenh trong việc điều hagravenh sẽ tạo ra sự chuyển đổi được chấp nhận một caacutech dễ dagraveng hơn+ Mở rộng traacutech nhiệm điều hagravenh sẽ mở rộng nhu cầu thocircng tin
Tương lai của EIS- EIS thocircng minh Những tiến bộ trong cocircng nghệ AI sẽ được triển khai trong caacutec
EIS- EIS đa phương tiện Cơ sở dữ liệu đa phương tiện sẽ cho pheacutep tiacutech hợp văn bản
giọng noacutei vagrave higravenh ảnh trong tương lai- EIS thocircng tin Tương lai EIS sẽ mở rộng hơn trong việc sử dụng dữ liệu becircn
ngoagravei doanh nghiệp- EIS kết nối Giao tiếp với băng thocircng rộng cho pheacutep kết nối liecircn thocircng lớn hơn
Chương 7 HỆ CHUYEcircN GIA VAgrave TRIacute TUỆ NHAcircN TẠO
71 Caacutec khaacutei niệm
72 Triacute thocircng minh của triacute tuệ nhacircn tạo
73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia
74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia
75 Lợi iacutech vagrave hạn chế của hệ chuyecircn gia
71 Caacutec khaacutei niệm
Chuyecircn mocircn (Expertise) sự hiểu biết rộng trong 1 lĩnh vực hẹp
Hệ chuyecircn gia (Expert Systems)1 chương trigravenh maacutey tiacutenh sử dụng 1 tập caacutec luật dựa trecircn tri thức của con người để giải quyết caacutec vấn đề đogravei hogravei phải coacute sự chuyecircn mocircn
Một số hệ chuyecircn gia nổi tiếng
DENDRAL (Standford 1960s Edward Feigenbaum)
MYCIN (Standford1970s Edward Shortliffe)
PROSPECTOR (MIT 1979)
Triacute tuệ nhacircn tạo (Artificial Intelligence ndash AI)
Triacute tuệ nhacircn tạo một bộ phacircn của ngagravenh khoa học maacutey tiacutenh quan tacircm đến việc thiết kế caacutec hệ thống maacutey tiacutenh thocircng minh đoacute lagrave caacutec hệ thống đưa ra caacutec đặc điểm magrave từ đoacute chuacuteng ta liecircn hệ với sự thocircng minh trong hagravenh động của con người (Barr vagrave Feigenbaum 1981)
Mục điacutech của AI
Mục điacutech khoa học xaacutec định caacutec gợi yacute để giải thiacutech caacutec loại khaacutec nhau của triacute tuệ thực
Mục điacutech kỹ thuật giải quyết caacutec vấn đề trong thế giới thực
Triacute tuệ nhacircn tạo kế thừa nhiều yacute tưởng quan điểm kỹ thuật từ caacutec ngagravenh khoa học khaacutec
- Triết học
- Logic Toaacuten học
- Tiacutenh toaacuten
- Khoa học tacircm lyacute Khoa học nhận thức
- Sinh học Thần kinh học
- Tiến hoacutea
Caacutec lĩnh vực ứng dụng trong Triacute tuệ nhacircn tạo
Mạng nơ ron thần kinh (Neural Networks)
Tiacutenh toaacuten sự tiến hoacutea
(Evolutionary Computation)
Hệ chuyecircn gia (Expert Systems)
Kỹ thuật xử lyacute tiếng noacutei (Speech Processing)
Kỹ thuật xử lyacute ngocircn ngữ tự nhiecircn
(Natural Language Processing)
Lập kế hoạch (Planning)
Robot (Robotics)
Khoa học higravenh ảnh (Vision)
Caacutec kỹ thuật thocircng dụng dugraveng trong AI
Biểu diễn(Representation)
Học (Learning)
Caacutec luật (Rules)
Tigravem kiếm (Search)
72 Triacute thocircng minh của triacute tuệ nhacircn tạo
Con người suy diễn như thế nagraveo
Phacircn loại (Categorization)
Caacutec quy tắc cụ thể
Heuristics
Kinh nghiệm trước đoacute
Dự tiacutenh trước
Maacutey tiacutenh suy diễn như thế nagraveo
Lập luận dựa trecircn luật IF-THEN mocirc tả tri thức được matilde hoacutea dưới dạng caacutec luật
Caacutec khung (Frames) lagrave caacutec đại diện mocirc tả caacutec tigravenh huống giống nhau lagrave điển higravenh của một vagravei phacircn loại
Lập luận dựa trecircn caacutec trường hợp mocirc phỏng giải phaacutep trước đoacute cho một vấn đề hiện tại
Nhận dạng mẫu phaacutet hiện acircm thanh higravenh dạng hoặc caacutec chuỗi dagravei
Caacutec dạng khaacutec của Triacute tuệ nhacircn tạo
Học maacutey- mạng nơron vagrave giải thuật di truyền
Lập trigravenh tự động ndash lagrave những kỹ thuật tạo ra caacutec chương trigravenh để lagravem 1 nhiệm vụ riecircng biệt (cho pheacutep những người khocircng phải lagrave người lập trigravenh coacute thể lập trigravenh được)
Cuộc sống nhacircn tạo ndash nỗ lực để taacutei tạo caacutec hiện tượng sinh học trong caacutec hệ thống dựa trecircn maacutey tiacutenh
73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia(Expert Systems- ES)
Theo Jackson (1999) Một hệ chuyecircn gia lagrave một chương trigravenh maacutey tiacutenh mocirc tả vagrave suy diễn với tri thức của một vagravei lĩnh vực để giải quyết vấn đề hay đưa ra caacutec lời khuyecircn
Cấu truacutec cơ bản của ES được dựa theo cấu truacutec chung của DSS Sự khaacutec biệt chiacutenh giữa ES vagraveDSS lagrave hệ ES thu thập caacutec kiến thức từ những
chuyecircn gia trong lĩnh vực quan tacircmĐặc trưng của hệ chuyecircn gia Hiệu quả cao Thời gian trả lời thỏa đaacuteng Độ tin cậy cao Dễ hiểu
Giao diện người dugraveng trong ES
Thiết kế giao diện người dugraveng tập trung vagraveo caacutec yếu tố như dễ dagraveng sử dụngcoacute độ tin cậy cao giảm tải những khoacute khăn khi sử dụng
Thiết kế necircn coacute một số tương taacutec (đầu vagraveo kiểm soaacutet vagrave truy vấn)
Cấu tạo giao diện người dugraveng gồm coacute magraven higravenh cảm ứng bagraven phiacutem buacutet saacuteng lệnh thoại caacutec phiacutem chuyecircn dụng
Cơ sở tri thức (Knowledge Base)
Chứa đựng caacutec tri thức cụ thể miền thu được từ caacutec chuyecircn gia miền
Coacute thể chứa caacutec mocirc tả caacutec hagravenh vi giải quyết vấn đề caacutec ragraveng buộc caacutec heuristics
Thagravenh cocircng của một ES dựa trecircn tiacutenh đầy đủ vagrave tiacutenh chiacutenh xaacutec của cơ sở tri thức
Mocirc tơ suy diễn (Inference Engine)
Ở đacircy tri thức được đặt để sử dụng tạo ra caacutec giải phaacutep để giải quyết vấn đề
Mocirc tơ nagravey coacute khả năng thực hiện diễn dịch hoặc suy diễn dựa trecircn caacutec luật hay caacutec caacutec sự kiện
Đồng thời cũng coacute khả năng sử dụng caacutec suy diễn mờ hay khocircng chiacutenh xaacutec dựa trecircn xaacutec suất hay aacutenh xạ mẫu
Vograveng điều khiển suy diễn
1 Aacutenh xạ caacutec luật với caacutec sự kiện đatilde được cho
2 Chọn luật để thực hiện
3 Thực hiện luật bằng caacutech thecircm caacutec sự kiện được suy diễn ra vagraveo bộ nhớ lagravem việc
Chuỗi suy diễn (Chaining)
Suy diễn tiến (forward chaining) maacutey suy diễn bắt đầu từ dữ liệu ban đầu vagrave thực hiện việc suy luận để đưa ra caacutec kết luận cuối cugraveng
Suy diễn lugravei (backward chaining) maacutey suy diễn bắt đầu từ dữ liệu điacutech vagrave tigravem ra tri thức hỗ trợ cho dữ liệu điacutech đoacute
Viacute dụ suy diễn lugravei
R1 Nếu coacute A vagrave B thigrave suy ra coacute D
R2 Nếu coacute B thigrave suy ra coacute C
R3 Nếu coacute C vagrave D thigrave suy ra coacute E
Ta coacute E ta xem trong 3 luật R1 R2 R3 luật nagraveo coacute E ta thấy R3 chứa E đồng thời chứa C vagrave D Xeacutet tiếp trong 2 luật R1 R2 luật nagraveo chứa C vagrave D R2 chứa C R3 chứa D Từ đoacute ta coacute được caacutec tri thức hỗ trợ suy diễn vagrave kết luận lagrave nếu coacute A vagrave B thigrave sẽ coacute E Hay nếu A vagrave B đuacuteng thigrave sẽ coacute E
Viacute dụ suy diễn tiến
Giả sử coacute tập chứa 3 luật sau
R1 Nếu coacute A vagrave B thigrave suy ra coacute D
R2 Nếu coacute B thigrave suy ra coacute C
R3 Nếu coacute C vagrave D thigrave suy ra coacute E
Nếu ta coacute A vagrave B thigrave chuacuteng ta suy ra được D từ R1 vagrave suy ra C từ R2 Với D vagrave C đatilde được suy ra ở trecircn giờ chuacuteng ta suy ra được E từ R3
Viacute dụ thực tế
Giả sử muốn biết magraveu của một con vật nuocirci tecircn lagrave Fred biết rằng noacute kecircu ộp ộp vagrave ăn ruồi
Coacute tập 4 luật ban đầu như sau
R1 Nếu X kecircu ộp ộp vagrave ăn ruồi thigrave X lagrave con ếch
R2 Nếu X kecircu chiecircm chiếp vagrave biết hoacutet thigrave X lagrave con chim
R3 Nếu X lagrave con ếch thigrave X coacute magraveu xanh
R4 Nếu X lagrave con chim thigrave X coacute magraveu vagraveng
74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia
Expert system shells lagrave một tập caacutec goacutei phần mềm vagrave caacutec cocircng cụ dugraveng để phaacutet triển caacutec hệ chuyecircn gia
Những Expert system shells đầu tiecircn thường rất rườm ragrave Mặc dugrave vậy noacute vẫn giuacutep cho người sử dụng sẽ khocircng phải bắt đầu lại từ đầu khi xacircy dựng một hệ chuyecircn gia mới
Những shell hiện đại bao gồm hai mocirc-đun chiacutenh lagrave cocircng cụ xacircy dựng một tập quy tắc vagrave mocirc tơ suy diễn
Xacircy dựng hệ chuyecircn gia
Bước 1 xacircy dựng mocirc higravenh bagravei toaacuten xaacutec định vấn đề nhiệm vụ magrave hệ thống sẽ thực hiện Caacutec dạng bagravei toaacuten cần hệ chuyecircn gia
Bagravei toaacuten diễn giải (InterPretation)
Bagravei toaacuten dự baacuteo (Prediction)
Bagravei toaacuten chuẩn đoaacuten (Diagnose)
Bagravei toaacuten gỡ rối (Debugging)
Bagravei toaacuten thiết kế
Tương tự như một dự aacuten phần mềm để xacircy dựng một hệ chuyecircn gia cần phải coacute caacutec yếu tố về nhacircn lực tagravei nguyecircn vagrave thời gian Những yếu tố nagravey ảnh hưởng đến giaacute thah của một hệ chuyecircn giaTrong phần nagravey cacircu hỏi thường được đặt ra lagrave tại sao cần phải xacircy dựng một hệ chuyecircn giaTrước khi bắt đầu phải xaacute định rotilde bagravei toaacuten đạt ra lagrave jiAi lagrave chuyecircn giaAi lagrave người sử dụng
1 Diễn giải (InterPretation) Nghiecircn cứu 1 vấn đề -gt Dựa trecircn những biểu hiện thuộc tiacutenh đặc trưng becircn ngoagravei -gt Tư vấn
(hoặc đưa ra kết luận hay mocirc tả dễ hiểu từ tập dữ liệu thocirc)
2 Bagravei toaacuten dự baacuteo (Prediction) Coacute thể dự đoaacuten được hagravenh vi kết quả dựa trecircn caacutec hiện tượng -gt dự baacuteo
VD Dự baacuteo thời tiết động đấthellip
3 Bagravei toaacuten chẩn đoaacuten (Diagnoss) Xaacutec định caacutec lỗi caacutec bộ phận hỏng hoacutec của hệ thống dựa trecircn caacutec dữ liệu quan saacutet được
4 Bagravei toaacuten gỡ rối (Debugging) Mocirc tả caacutec phương phaacutep khắc phục hệ thống khi gặp sự cố
5 Bagravei toaacuten thiết kế Lựa chọn cấu higravenh caacutec đối tượng nhằm thoả matilden một số ragraveng buộc nagraveo đoacute
6 Giảng dạy Phần mềm dạy học coacute thể chuẩn đoaacuten vagrave sủa lỗi của học sinh trong quaacute trigravenh học tập
Để xaacutec định đuacuteng bagravei toaacuten magrave chuacuteng ta cần giải quyết thigrave phải trả lời đc một số cacircu hỏi
- cần hệ chuyecircn gia
Bước 2 thu thập tri thức lựa chọn cocircng cụ vagrave aacutep dụng
Trong bước thu thập tri thức vấn đề quan trọng lagrave lựa chọn chuyecircn gia những người magrave sẽ đoacuteng goacutep tri thức cho hệ thống Thocircng thường trong suốt quaacute trigravenh phaacutet triển thigrave chuyecircn gia được xem như một thagravenh viecircn của đội phaacutet triển
Hiện nay coacute rất nhiều cocircng cụ để xacircy dựng một hệ chuyecircn gia Phổ biến nhất lagrave JESS CLIPS vagrave OPS5
Bước 3 Thiết kế cơ sở tri thức thiết kế hệ thốngTri thức được biểu diễn trường minh trong cơ sở tri thức
Caacutec chuyecircn gia vagrave kỹ sư tri thức sẽ đối thoại với nhau bằng caacutec kỹ thuật đối thoại Suy diễn (SD) bảng Mocirc higravenh hoacutea SD quy nạp phacircn loại
Vấn đề bagraveo trigrave vagrave phaacutet triển
Caacutec hệ chuyecircn gia đogravei hỏi phải bảo trigrave vagrave phaacutet triển nhiều hơn so với caacutec hệ thống khaacutec Phải thường xuyecircn bổ sung tri thức mới vagrave thay đổi caacutec tri thức cũ để đổi mới hệ chuyecircn gia
Thu thập vagrave khắc phục lỗi do người sử dụng phaacutet hiện để kịp thời khắc phục những sai soacutet của hệ chuyecircn gia
75 Lợi iacutech vagrave hạn chế của caacutec hệ chuyecircn gia
Một số lợi iacutech chiacutenh
Thời gian trả lời hợp lyacute bằng hoặc nhanh hơn so với chuyecircn gia (người) để đi đến cugraveng một quyết định Hệ chuyecircn gia lagrave một hệ thống thời gian thực (real time system)
Khả năng trả lời với mức độ tinh thocircng bằng hoặc cao hơn so với chuyecircn gia (người) trong cugraveng lĩnh vực
Hệ chuyecircn gia giuacutep cho hiệu quả lagravem việc tăng bằng việc sử dụng tập caacutec luật một caacutech nhanh choacuteng magrave ko bị nhầm lẫn chuyecircn gia lagrave người coacute thể quecircn đi một số tri thức cơ sở lyacute luậ nhưng HCG thigrave ko
Quyết định của một người chuyecircn gia coacute thể bị thay đổi vagrave ko coacute tiacutenh thống nhất như quyết định của một hệ chuyecircn gia tạo ra
Hệ chuyecircn gia giuacutep cho người sử dụng coacute thể trau dồi sự hiểu biết trecircn lĩnh vuej cụ thể magrave noacute giải quyết hỗ trợ người ra quyết định coacute trigravenh độ như 1 chuyecircn gia trong quaacute trigravenh gia quyết định
Kiến thức của rất nhiều chuyecircn gia về một lĩnh vực nagraveo đoacute được đưa vagraveo hệ chuyecircn gia lagravem cho CSTT cuat HCG phong phuacute vagrave rộng lớn hơn rất nhiều
HCG giải thiacutech caacutec bước suy luận một caacutech dễ hiểu nhất quaacuten luacutec nagraveo cũng coacute thể sử dụng ko như chuyecircn gia con người
Hạn chế của caacutec hệ chuyecircn gia
Nhược điểm lớn nhất của hệ chuyecircn gia lagrave những yacute kiến chuyecircn mocircn thường rất khoacute matilde hoacutea vagrave giải neacuten
Hệ chuyecircn gia khocircng coacute khả năng tự học tự cập nhật kiến thức mới như caacutec chuyecircn gia magrave cần phải được matilde hoacutea lại khi noacute được cập nhật
Hệ chuyecircn gia khocircng thể nhận ra được vấn đề khocircng nằm trong miền kiến thức của hệ thống
Chương 8 Tri thức vagrave tiếp nhận
1 Bao gồm caacutec vấn đề
Dữ liệu thực tế đo lường hoặc quan saacutet coacute hoặc khocircng coacute bối cảnh
Thocircng tin dữ liệu được tổng hợp một caacutech hữu iacutech để giải quyết những khoacute khăn trong việc đưa ra quyết định
Tri thức bao gồm caacutec ứng dụng quy tắc thocircng tin hướng dẫn của người ra quyết định
2 Những caacutei nhigraven về tri thức
Đại diện lagravem thế nagraveo để diễn tả tri thức viacute dụ như một quyển saacutech khocircng phải lagrave tri thức nhưng noacute lại lagrave một đại diện của tri thức
Sản xuất tri thức lagrave một tập hơp của hagraveng tồn kho coacute thể được sản xuất cũng như mua lại
Tri thức lagrave 1 trong 6 trạng thaacutei của hệ thống
1Dữ liệu 2Thocircng tin 3Cấu truacutec thocircng tin 4Sự thấu hiểu 5Yacute kiến 6 Quyết định
3 Caacutec loại tri thức Phổ biến mocirc tả dữ liệu thocircng tin thủ tục mọi thứ lagravem như thế nagraveo lập luận chiacutenh saacutech hoặc caacutec quy tắc
4 Thu thập Tri thức hệ chuyecircn gia Hầu hết caacutec phương phaacutep đều bắt đầu với mocirc higravenh của caacutec taacutec vụ trong đoacute
hệ chuyecircn gia được xacircy dựng Trong đoacute mocirc tả về caacutec lĩnh vực được tạo ra Caacutec kỹ sư sử dụng caacutec mocirc higravenh giả thuyết vagrave nhận thức về quaacute trigravenh phacircn
tiacutech để gợi ra caacutech giải quyết vấn đề về tri thức từ caacutec chuyecircn gia
5 Caacutec chiều của thu thập tri thức KE- driven caacutec kỹ sư trao đổi trực tiếp với caacutec chuyecircn gia Expert-driven Caacutec chuyecircn gia trực tiếp đưa chuyecircn mocircn của họ vagraveo hệ
thống maacutey tiacutenh Machine-driven Sử dụng caacutec cocircng cụ suy luận để triacutech xuất tri thức từ một
tập caacutec viacute dụ
6 Kỹ thuật thu thập tri thức Trao đổi gồm 2 loại cơ bản lagrave coacute cấu truacutec(coacute kịch bản) vagrave khocircng coacute cấu
truacutec( đối thoại trực tiếp) Giao thức phacircn tiacutech bằng lời Khi caacutec chuyecircn gia thực hiện một cocircng việc
của họ thigrave một bản ghi về cocircng việc đoacute được thực hiện Caacutec kỹ sư sẽ xacircy dựng mocirc higravenh cho những gigrave được ghi lại trong bản ghi
Phương phaacutep sagraveng lọc caacutec chuyecircn gia so saacutenh caacutec nhoacutem liecircn tiếp trong ba đối tượng vagrave cho biết tại sao nhoacutem thứ hai lại khaacutec nhoacutem thứ ba
7 Thu thập tri thức từ nhiều nguồn Thu thập tri thức từ nhiều nguồn lagrave cần thiết để coacute được đầy đủ caacutec tri thức
cho một vấn đề quan điểm yacute kiến traacutei ngược nhau thường phaacutet sinh Phương phaacutep đồng thuận sẽ giuacutep giải quyết được vấn đề macircu thuẫn Kỹ thuật phacircn tiacutech Meta lagrave kỹ thuật được aacutep dụng trong caacutec trường hợp
khaacutec Caacutech tiếp cận bằng định lượng đogravei hỏi caacutec kỹ sư cần cacircn nhắc yếu tố đầu vagraveo của caacutec chuyecircn gia khaacutec nhau
8 Xaacutec nhận hợp lệ vagrave kiểm tra tri thức Một khi thu thập tri thức noacute phải được đaacutenh giaacute về khả năng sử dụng vagrave độ
chiacutenh xaacutec Hai vấn đề cụ thể lagrave hiệu lực của những kiến thức vagrave kiểm tra việc xacircy dựng cơ sở của tri thức
Cần xaacutec nhận xem liệu hệ thống coacute thể hoạt động ở mức độ tối thiểu khocircng
Xaacutec minh liecircn quan đến việc so saacutenh từng chi tiết kỹ thuật của hệ thống những gigrave đatilde được thực hiện cuối cugraveng
9 Một số caacutec biện phaacutep xaacutec nhận Độ chiacutenh xaacutec Khả năng thiacutech nghi Mức độ đầy đủ Bề rộng Độ sacircu Hiệu lực Tổng quan Chiacutenh xaacutec Hiện thực Độ tin cậy Tiacutenh hữu dụng Mức độ
Chương 9 Học maacutey
1 Logic mờ vagrave ngocircn ngữ mờ(Fuzzy Logic and Linguistic Ambiguity)
Ngocircn ngữ tự nhiecircn gồm những khaacutei niệm mơ hồ vagrave khocircng chiacutenh xaacutectruyền tải ngữ nghĩa thocircng qua tiacutenh xấp xỉkhocircng rotilde ragraveng
Những xấp xỉ nagravey giuacutep con người coacute thể truyền tải hết được yacute nghĩa nhưng maacutey thigrave khocircng hiểu
Lagravem sao biểu diễn caacutec tri thức sử dụng caacutec khaacutei niệm khocircng rotilde ragraveng(mờ) hoặc khocircng chiacutenh xaacutec
2 Khaacutei niệm cơ bản của logic mờ tập mờ lagrave những tập hợp khocircng coacute một giới hạn rotilde Mỗi phần tử của noacute chỉ
chứa một mức độ hagravem liecircn thuộc của từng phần tử Vigrave vậy tập mờ khocircng giống như tập cổ điển Tập mờ coacute thể kết hợp với nhau qua những luật mờ magrave đặc trưng cho những hagravenh động trạng thaacutei vagrave thuộc tiacutenh của logic mờ được tận dụng khi thực hiện một bộ điều khiển mờ
Logic mờ dựa trecircn yacute tưởng mỗi phần tử thuộc vagraveo một tập hợp ở một mức độ nagraveo đấy
Locircgic mờ cho pheacutep độ liecircn thuộc (microA )coacute giaacute trị trong khoảng (01) Locircgic mờ coacute thể được coi lagrave mặt ứng dụng của lyacute thuyết tập mờ để xử lyacute caacutec
giaacute trị trong thế giới thực cho caacutec bagravei toaacuten phức tạp
3 So saacutenh tiacutenh đuacuteng đắn logic mờ vagrave xaacutec suất Xaacutec suất thigrave đề cập đến khả năng xảy ra một biến cố hay một điều gigrave đoacute Logic mờ đề cập đến cấp độ magrave đặc tiacutenh ở hiện tại
o viacute dụ1 người coacute chiều cao 6 feet thigrave coacute cấp độ lagrave 05 về chiều cao
4 Ưu điểm của logic mờ Caacutech tiếp cận rất tự nhiecircnkhocircng phức tạp Coacute thể mocirc higravenh hoacutea caacutec hagravem phi tuyến tugravey yacute phức tạp
Coacute thể tận dụng được kinh nghiệm từ những chuyecircn gia hagraveng đầu trong mọi lĩnh vực
Logic mờ được xacircy dựng dựa trecircn ngocircn ngữ tự nhiecircnNền tảng của logic mờ lagrave dựa trecircn cơ sở giao tiếp của con người
5 Nhược điểm của logic mờ Trong 1 hệ thống phức tạpsử dụng logic mờ coacute thể trở thagravenh trở ngại cho
việc xaacutec thực độ tin cậy của hệ thống Cơ chế lập luận mờ khocircng thể học hỏi từ những lỗi sai
6 Mạng noron nhacircn tạo(ANN) Mạng noron nhacircn tạo lagrave một mocirc phỏng xử lyacute thocircng tinđược nghiecircn cứu ra
từ hệ thống thần kinh của sinh vậtgiống như bộ natildeo để xử lyacute thocircng tin ANNs lagrave chương trigravenh dựa trecircn maacutey tiacutenh đơn giản coacute chức năng lagrave một mocirc
higravenh bagravei toaacuten khocircng gian dựa trecircn thử nghiệm vagrave baacuteo lỗi
7 Học từ kinh nghiệm Tiến trigravenh Một mẫu dữ liệu được biểu diễn như một mạng lưới noronANN ldquodự
đoaacutenrdquo 1 đầu radự đoaacuten được so saacutenh với giaacute trị thực tế hoặc giaacute trị chiacutenh xaacutecNếu đoaacuten được chiacutenh xaacutec thigrave khocircng coacute hagravenh động nagraveo được thực hiện
Nếu dự đoaacuten sai ANN kiểm tra lại vagrave xaacutec định lại thocircng số để điều chỉnh Một mẫu dữ liệu khaacutec được biểu diễn vagrave quaacute trigravenh nagravey được lặp lại
8 Nguyecircn tắc cơ bản của cocircng nghệ nơron Caacutec yếu tố xử lyacute cơ bản trong hệ thống thần kinh của con người lagrave tế bagraveo
thần kinhMạng lưới của tế bagraveo nagravey lagrave liecircn kết với nhau nhận được thocircng tin từ caacutec cảm biến trong mắt taihellip
Thocircng tin nhận được bởi tế bagraveo thần kinh hoặc lagrave sẽ kiacutech thiacutech noacute(sẽ được chuyển qua 1 thocircng điệp dọc theo mạng lưới) hoặc lagrave sẽ ngăn cản noacute(ngăn cản dograveng thocircng tin)
Độ nhạy coacute thể thay đổi qua thời gian hoặc sau khi coacute được kinh nghiệm
9 Cấu truacutec mạng Một ANN gồm 3 lớp cơ bản
Lớp đầu vagraveo nhận dữ liệu Lớp becircn trong hoặc lagrave lớp ẩn xử lyacute dữ liệu Lớp đầu ra chuyển tiếp kết quả cuối cugraveng của mạng
10Mạng nơ ron Thường coacute nhiều đầu vagraveo mỗi đầu vagraveo với mức ảnh hưởng vagrave tầm quan
trọng riecircng của noacute Một đầu vagraveo quan trọng coacute thể được sử dụng để khuếch đại đầu ra caacutec hagravem trạng thaacutei tổng hợp caacutec trọng số của caacutec yếu tố
đầuvagraveo khaacutec nhauvagraveo một giaacute trị duy nhất Caacutec hagravem chuyển giao xử lyacute caacutec giaacute trị trạng thaacutei vagrave tạo đầu ra
11Huấn luyện mạng nơ ron Trong mocirc higravenh coacute giaacutem saacutetANN được đến so saacutenh dự đoaacuten của chiacutenh
noacute với thocircng tin phản hồi coacute chứa caacutec kết quả mong muốn ANN sẽ phải tigravem caacutech thay đổi caacutec tham số becircn trong củamigravenh (caacutec trọng số vagrave caacutec ngưỡng) để tạo necircn một aacutenh xạ coacute khả năng aacutenh xạcaacutec đầu vagraveo thagravenh caacutec đầu ra mong muốn Sự thay đổi nagravey được tiến hagravenh nhờ việc so saacutenh giữa đầu ra thực sự vagrave đầu ra mong muốn
Trong mocirc higravenh khocircng coacute giaacutem saacutetANN nhận được dữ liệu vagraveo nhưng khocircng phải coacute bất kỳ thocircng tin phản hồi về kết quả mong muốn
Phần lớn caacutec ứng dụng nằm trong vugraveng của caacutec bagravei toaacuten ước lượng như mocirc higravenh hoacuteathống kecirc neacuten lọc phacircn cụm
12Lợi iacutech Liecircn kết với mạng noron Traacutenh caacutech lập trigravenh tường minh Giảm nhu cầu của chuyecircn gia ANNs thigrave thiacutech nghi với caacutec yếu tố đầu vagraveo thay đổi Khocircng cần thiết cho cơ sở tri thức tinh chế ANNs coacute tiacutenh động vagrave cải thiện với việc sử dụng Coacute khả năng xử lyacute dữ liệu khocircng chiacutenh xaacutec hoặc khocircng đầy đủ Cho pheacutep tổng quaacutet hoacutea từ thocircng tin cụ thể Cho pheacutep thu thập cảm giaacutec thocircng thường vagraveo miền giải quyết vấn đề
13Hạn chế của việc liecircn kết với mạng noron ANNs khocircng thể giải thiacutech được suy luận Bản chất hộp đen thường khiến cho vấn đề traacutech nhiệm vagrave độ tin cậy phaacutet
sinh lagrave khoacute khăn Lặp đi lặp lại quaacute trigravenh huấn luyện rất tốn thời gian Nguồn lực caacutec nhagrave phacircn tiacutech vagrave thiết kế coacute tay nghề cao vẫn lagrave đaacuteng lo
ngại Cocircng nghệ ANN thuacutec đẩy hạn chế của phần cứng hiện tại ANN yecircu cầu phải coacute sự tin tưởng ở đầu ra
14Giới thiệu về thuật toaacuten di truyền Cũng như mạng lưới thần kinh caacutec thuật toaacuten di truyền được dựa trecircn lyacute
thuyết sinh học Thuật toaacuten di truyền tigravem thấy nguồn gốc của chuacuteng trong caacutec lyacute thuyết
tiến hoacutea của chọn lọc tự nhiecircn vagrave thiacutech ứng với biến đổi khiacute hậu Kết quả thuật toaacuten di truyền lagrave từ giao phối 2 caacute thể trong quần thế để tạo
ra con caacutei đocirci khi tốt hơn so với bậc cha mẹ của chuacuteng 15Caacutec thagravenh phần cơ bản của thuật toaacuten di truyền
Toaacuten tử chọn lọc Caacutec caacute thể tốt được chọn lọc để đưa vagraveo thế hệ sau Sự chọn lọc nagravey căn cứ vagraveo độ thiacutech nghi với mocirci trường của mỗi caacute thể
Toaacuten tử lai gheacutep (crossover) Hai caacute thể cha vagrave mẹ trao đổi caacutec gen với nhau để tạo ra caacute thể con
Toaacuten tử đột biến (mutation) Một caacute thể thay đổi một số gen để biến đổi thagravenh một caacute thể mớiTất cả caacutec toaacuten tử trecircn khi thực hiện đều mang tiacutenh ngẫu nhiecircn
16Quaacute trigravenh cơ bản của một thuật toaacuten di truyền Khởi tạo
Đaacutenh giaacute quần thể
Lựa chọn NST thiacutech hợp nhất vagrave loại bỏ NST yếu nhất
Quy trigravenh giao nhau vagrave cải thiện quần thể
đột biến tiến trigravenh để khaacutem phaacute ra NST mới
17Ưu nhược điểm của việc kết hợp với thuật toaacuten di truyền Kiacutech thước quần thể lagrave 1 yếu tố quan trọng trong tốc độ của việc tigravem
kiếmnhưng noacute tương đối dễ dagraveng để dự đoaacuten tốc độ nagravey Giao nhau hoặc đột biến lagrave khocircng necircn đc sử dụng quaacute thường xuyecircn Luocircn coacute được iacutet nhất 1 giải phaacutep hợp lyacute Necircn coacute thể aacutep dụng chuacuteng cho caacutec vấn đề magrave chuacuteng ta khocircng coacute hướng
về caacutech giải quyết Sức mạnh của thuật toaacuten xuất phaacutet từ khaacutei niệm đơn giảnkhocircng phải từ
một thủ tục thuật toaacuten phức tạp 18Tương lai của học maacutey
Mạng lưới thần kinh nhacircn tạo vượt quaacute năng lực của con người trong caacutec trường hợp bị cocirc lập
Về mặt lyacute thuyếtmột maacutey tiacutenh coacute thể xử lyacute dũ liệu nhanh hơn hagraveng triệu lần so với 1 con người
May mắn thay cho chuacuteng tacon người tốt hơn nhiều khi magrave coacute được dữ liệumaacutey tiacutenh khocircng coacute 1 số thứ như lagrave 5 giaacutec quan
CHƯƠNG 10 KHO DỮ LIỆU
1 Kho dữ liệu Kho dữ liệu lagrave tuyển tập caacutec cơ sở dữ liệu tiacutech hợp hướng chủ đề được
thiết kế để trợ giuacutep cho một hệ hỗ trợ quyết định
Theo John Ladley Cocircng nghệ kho dữ liệu lagrave tập caacutec phương phaacutep kỹ thuật vagrave caacutec cocircng cụ coacute thể kết hợp hỗ trợ nhau để cung cấp thocircng tin cho người sử dụng trecircn cơ sở tiacutech hợp từ nhiều nguồn dữ liệu nhiều mocirci trường khaacutec nhau
Kho dữ liệu thường rất lớn tới hagraveng trăm GB hay thậm chiacute hagraveng Terabyte
2 Kho dữ liệu vận hagravenh (ODS) Một kho dữ liệu vận hagravenh Aacutep dụng kỹ thuật kho dữ liệu vagraveo caacutec hệ xử
lyacute giao taacutec lưu trữ dữ liệu cho một ứng dụng đặc thugrave Noacute đưa vagraveo kho dữ liệu một dograveng caacutec dữ liệu thocirc được thiết kế
3 So saacutenh
Kho dữ liệu vận hagravenh Kho dữ liệu
Dữ liệu theo chủ đề Dữ liệu theo chủ đề
Dữ liệu tiacutech hợp Dữ liệu tiacutech hợp
Dữ liệu thay đổi Dữ liệu khocircng thay đổi
Dữ liệu được cập nhật khi thay đổi
Dữ liệu giữ nguyecircn
Chỉ coacute dữ liệu hiện tạiDữliệu hiện tại vagrave dữ liệu lịch sử
Chu kỳ lagravem tươi dữ liệu ngắn Chu kỳ lagravem tươi dữ liệu dagravei
Chỉ coacute dữ liệu chi tiết Dữ liệu chi tiết vagrave dữ liệu tổng kết
Dugraveng cho caacutec quyết định ngắn hạn
Dugraveng cho hoạch định dagravei hạn
4 Kho dữ liệu cục bộ (Data Mart - DM)
Kho dữ liệu cục bộ lagrave CSDL coacute những đặc điểm giống với kho dữ liệu nhưng với quy mocirc nhỏ hơn vagrave lưu trữ dữ liệu về một lĩnh vực một chuyecircn ngagravenh
Data mart phụ thuộc Chứa những dữ liệu được lấy từ DW vagrave những dữ liệu nagravey sẽ được triacutech lọc vagrave tinh chế tiacutech hợp lại ở mức cao hơn để phục vụ một chủ đề nhất định của Datamart
Data mart độc lập Khocircng giống như Datamart phụ thuộc Data mart độc lập được xacircy dựng trước DW vagrave dữ liệu được trực tiếp lấy từ caacutec nguồn khaacutec nhau
5 Siecircu dữ liệu Metadata lagrave dữ liệu để mocirc tả dữ liệu Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột
một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi Metadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu
6 Mocirci trường kho dữ liệu Hệ thống của tổ chức vagrave kho cung cấp dữ liệu để xacircy dựng kho dữ liệu Trong quaacute trigravenh chuyển dữ liệu từ caacutec nguồn khaacutec nhau dữ liệu coacute thể
được lagravem sạch hoặc chuyển đổi vagrave vigrave thế DW được xem như lagrave một chuẩn cho việc lưu trữ
Đồng thời siecircu dữ liệu được ghi lại Cuối cugraveng DW hoặc siecircu thị coacute thể được sử dụng để tạo ra một kho dữ
liệu ldquocaacute nhacircnrdquo 7 Caacutec đặc điểm của kho dữ liệu
Đặc điểm Mocirc tả
Hướng chủ đề - DL tổ chức theo caacutech thức người dugraveng tham chiếu
Tiacutech hợp - Dữ liệu ldquosạchrdquo loại bỏ tiacutenh thiếu nhất quaacuten
Khocircng thay đổi - DL ldquochỉ đọcrdquo người dugraveng khocircng thay đổi được
Chuỗi thời gian - DL lagrave chuỗi thời gian khocircng phải lagrave trạng thaacutei hiện tại
Được tổng kết - DL vận hagravenhthao taacutec khi cần thiết
được kết hợp lại thagravenh dạng coacute thể dugraveng được cho quyết định
Kiacutech cỡ lớn hơn - Lưu giữ theo chuỗi thời gian tức lagrave giữ lại nhiều DL
Khocircng được chuẩn hoacutea - Coacute thể dư thừa DLSiecircu dữ liệu - Dữ liệu của dữ liệu được lưu trữNguồn dữ liệu - DL vận hagravenh (caacutec hệ sẵn coacute) cugraveng
với caacutec nguồn ngoagravei 8 Kho dữ liệu hướng chủ đề
Hướng chủ để coacute nghĩa lagrave kho dữ liệu được tổ chức xung quanh caacutec chủ đề chiacutenh như khaacutech hagraveng sản phẩm sản xuất Tập trung vagraveo việc mocirc higravenh hoacutea vagrave phacircn tiacutech dữ liệu cho caacutec nhagrave ra quyết định magrave khocircng tập trung vagraveo caacutec xử lyacute thocircng thường Cung cấp cho người dugraveng một khung nhigraven toagraven vẹn đơn giản vagrave đầy đủ về caacutec sự kiện quanh caacutec chủ đề
9 Dữ liệu trong DW được tiacutech hợp Dữ liệu trong kho dữ liệu được xacircy dựng bằng caacutech tổng hợp dữ liệu từ
nhiều nguồn khaacutec nhau vagrave caacutec nguồn coacute tổ chức khaacutec nhau Cơ sở dữ liệu caacutec file excel caacutec flat file hoặc caacutec raw file Khi đưa vagraveo kho dữ liệu caacutec dữ liệu được lagravem sạch vagrave tiacutech hợp dữ liệu nhằm đảm bảo tiacutenh nhất quaacuten của dữ liệu
10Kiến truacutec kho dữ liệu Tầng cơ sở dữ liệu hoạt động Tầng truy xuất thocircng tin Tầng truy xuất dữ liệu Tầng siecircu dữ liệu Tầng quản lyacute tiến trigravenh Tầng thocircng điệp của ứng dụng Tầng vật liacute của kho dữ liệu Tầng trigravenh diễn dữ liệu
11Higravenh trạng kho dữ liệu Kho dữ liệu ảo - người dugraveng cuối coacute thể truy cập trực tiếp đến kho dữ liệu
sử dụng caacutec cocircng cụ cho pheacutep ở tầng truy xuất dữ liệu Kho dữ liệu trung tacircm-1 cơ sở dữ liệu vật lyacute chứa tất cả dữ liệu cho một
vugraveng chuyecircn dụng nagraveo đoacute
Kho dữ liệu phacircn taacuten- Thagravenh phần được phacircn taacuten qua nhiều hệ cơ sở dữ liệu vật lyacute
12METADATA- Siecircu dữ liệu Định nghĩa Siecircu dữ liệu lagrave dữ liệu về dữ liệu Lagrave 1 lưu trữ dugraveng để
Miecircu tả kho dữ liệu tổng thể Nhận dạng kiểu kho dữ liệu Quản liacute quaacute trigravenh tiacutech hợp dữ liệu Quản liacute quaacute trigravenh cập nhật kho dữ liệu Quản liacute bảo mật
Lagrave chigravea khoacutea quyết định sự thagravenh cocircng của kho dữ liệu luocircn được thay đổi vagrave cập nhật theo sự phaacutet triển của kho dữ liệu
Dugraveng để quản liacute điều khiển kho dữ liệu Sự ra đời của kho dữ liệu như 1 cấu truacutec hỗ trợ ra quyết định siecircu dữ liệu
được xem như nguồn tagravei nguyecircn dữ liệu Siecircu dữ liệu lagrave trừu tượng Chuacuteng lagrave dữ liệu bậc cao cung cấp mocirc tả ngắn
gọn caacutec dữ liệu bậc thấp hơn 13Hoạt động của Siecircu dữ liệu
Siecircu dữ liệu rất cần thiết trong việc chuyển hoacutea thocircng tin trở thagravenh tri thức Lagrave chigravea khoacutea giuacutep chuacuteng ta xử lyacute được dữ liệu thocirc Viacute dụ một dograveng dữ liệu baacuten hagraveng 1023 K596 11121 agraveNoacute sẽ khocircng coacute nghĩa gigrave cho đến khi chuacuteng ta đưa vagraveo siecircu dữ liệu (thư
mục chứa dữ liệu) agrave cửa hagraveng 1023 sản phẩm K596 vagrave số tiền baacuten được lagrave 11121 đocirc la
14Sự cần thiết phải nhất quaacuten trong kho dữ liệu Kho dữ liệu được xacircy dựng cho lợi iacutech của những nhagrave phacircn tiacutech kinh
doanh caacutec nhagrave quản trị cho tất cả caacutec khu vực chức năng Trong cơ sở dữ liệu riecircng caacutec khu vực khaacutec nhau coacute thể định nghĩa vagrave lưu
trữ dữ liệu thocircng qua phiecircn bản của chiacutenh noacute Khi dữ liệu được lấy từ những vugraveng khaacutec nhau đoacute vagrave được đặt vagraveo kho dữ
liệu Việc chuyển đổi vagrave lagravem sạch caacutec tiến trigravenh sẽ đảm bảo noacute lagrave duy nhất được tiacutech hợp tại một mức của tổ chức
15Ragrave soaacutet lại dữ liệu ndash Thực thi siecircu dữ liệu
Bất kể cấu truacutec tự nhiecircn của 1 cacircu truy vấn thế nagraveo thigrave caacutec thagravenh phần của siecircu dữ liệu rất quan trọng đối với người ra quyết định
Bảng thuộc tiacutenh khoacutea được lưu trữ bởi kho dữ liệu Tập hợp dữ liệu được lấy từ đacircu Những chuyển đổi nagraveo được thực thi với việc lagravem sạch
16Siecircu dữ liệu lagrave gigrave Metadata - lagrave thocircng tin mocirc tả nội dung của cơ sở dữ liệu (CSDL) Metadata baacuteo cho người dugraveng biết thời gian cập nhật sau cugraveng của dữ liệu
định dạng vagrave mục điacutech sử dụng của noacute Những thocircng tin nagravey coacute thể hướng dẫn người dugraveng duyệt qua CSDL vagrave
giuacutep họ hiểu được yacute nghĩa vagrave ngữ cảnh của dữ liệu Trong CSDL metadata lagrave caacutec dạng biểu diễn khaacutec nhau của caacutec đối tượng
trong CSDL Trong CSDL quan hệ metadata lagrave caacutec định nghĩa của bảng cột CSDL
view vagrave nhiều đối tượng khaacutec Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột
một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi -gtMetadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu
Bảng chuyển đổi Ghi lại những chuyển đổi đatilde được thực hiện
Lịch sử thực thi Ghi lại những dữ liệu đatilde được
phacircn tiacutech
Higravenh thaacutei kết nốiGhi lại những dữ liệu được kết nối vagrave tần suất
17Aacutenh xạ thocircng thường của siecircu dữ liệu Bản ghi aacutenh xạ chuyển đổi bao gồm
Định danh của nguồn gốc Chuyển đổi thuộc tiacutenh Chuyển đổi thuộc tiacutenh vật lyacute Matilde hoacutea tham chiếu bảng chuyển đổi Đổi tecircn Đổi khoacutea Gaacuten giaacute trị cho thuộc tiacutenh mặc định Chọn logic cho caacutec nguồn nhiều giaacute trị Đổi thuật toaacuten
18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để
phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai
lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave
tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec
Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm
Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo
19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua
caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau
SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được
Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra
một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức
Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ
Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ
Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech
CHƯƠNG 11 KHAI PHAacute DỮ LIỆU
1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn
ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993
Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng
2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd
1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều
2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP
3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn
4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng
5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server
6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo
7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động
8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời
9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều
10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện
11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech
12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP
3 Xử lyacute phacircn tiacutech trực tuyến OLAP
MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave
dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu
ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave
thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu
HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave
ROLAP4 Khai phaacute dữ liệu
Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh
khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn
Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan
5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp
6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại
Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp
Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec
Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt
Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra
Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh
vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho
Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec
Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm
Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục
Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng
gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp
Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn
Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec
Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper
Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2
Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25
Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước
Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng
Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện
trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp
Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute
độ hỗ trợ ge ngưỡng minsup
độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan
Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn
Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết
Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu
MOLAP ROLAP HOLAP
Lưu trữ dữ liệu cơ sở
Khối Bảng quan hệ Bảng quan hệ
Lưu trữ thocircng tin tổng hợp
Khối Bảng quan hệ Khối
Hiệu suất thực hiện truy vấn
Nhanh nhất Chậm nhất Nhanh
Tiecircu thụ khocircng gian lưu trữ
Nhiều Thấp Trung bigravenh
Chi phiacute bảo trigrave Cao Thấp Trung bigravenh
bull Quy hoạch toaacuten học (mathematical programming) lagrave họ caacutec cocircng cụ giải quyết caacutec bagravei toaacuten quản lyacute theo đoacute người ra quyết định phải cấp phaacutet caacutec tagravei nguyecircn khan hiếm cho caacutec hoạt động cạnh tranh nhau (caacutec phương aacuten) nhằm tối ưu hoacutea mục tiecircu coacute khả năng đo lường được bull Caacutec mocirc higravenh quy hoạch tuyến tiacutenh (linear programming) thocircng dụng nhất trong quy hoạch toaacuten coacute nhiều ứng dụng trong thực tế được dugraveng nhiều trong caacutec hệ hỗ trợ quyết định bull Bagravei toaacuten quy hoạch tuyến tiacutenh 1048713 Caacutec biến quyết định (cần tigravem giaacute trị) 1048713 Hagravem mục tiecircu (hagravem toaacuten học dạng tuyến tiacutenh xaacutec định quan hệ giữa biến quyết định vagrave mục tiecircu đo lường mức độ đạt đạt mục tiecircu vagrave cần được tối ưu hoacutea) 1048713 Caacutec hệ số của hagravem mục tiecircu (cho biết mức đoacuteng goacutep vagraveo mục tiecircu của 1 đơn vị biến quyết định) 1048713 Ragraveng buộc (biểu thức tuyến tiacutenh cho biết giới hạn tagravei nguyecircn vagravehay caacutec quan hệ giữa caacutec biến số) 1048713 Dung lượng (mocirc tả cận trecircn vagrave dưới của caacutec biến vagrave ragraveng buộc) 1048713 Hệ số (cocircng nghệ) vagraveo-ra (cho biết mức độ sử dụng tagravei nguyecircn của biến quyết định) bull Đặc điểm của bagravei toaacuten quy hoạch tuyến tiacutenh 1048713 Tagravei nguyecircn kinh tế của bagravei toaacuten lagrave coacute hạn vagrave sẵn sagraveng 1048713 Coacute nhiều caacutech (gt2 caacutech) sử dụng tagravei nguyecircn được gọi lagrave giải phaacutep hay chương trigravenh 1048713 Mỗi hoạt động dugraveng tagravei nguyecircn đều sinh ra kết quả dưới dạng mục tiecircu đatilde phaacutet biểu trước 1048713 Việc cấp phaacutet nằm trong caacutec ragraveng buộc cho trước bull Giả định của bagravei toaacuten quy hoạch tuyến tiacutenh 1048713 Caacutec kết quả của caacutec cấp phaacutet coacute thể đem so saacutenh với nhau coacute thể đo lường bằng một đơn vị chung
1048713 Caacutec cấp phaacutet độc lập với nhau về mặt kết quả 1048713 Kết quả cuối cugraveng lagrave tổng của caacutec kết quả từ caacutec hoạt động riecircng rẽ khaacutec nhau 1048713 Dữ liệu coacute tiacutenh chắc chắn 1048713 Tagravei nguyecircn được dugraveng một caacutech kinh tế nhất 1048713 Thường coacute một số lớn caacutec giải phaacutep với kết quả khaacutec nhau 1048713 Trong số caacutec giải phaacutep coacute thể coacute 1 giải phaacutep tốt nhất ndash mức độ đạt được mục tiecircu cao nhất ndash gọi lagrave giải phaacutep tối ưu được tigravem ra bằng một giải thuật đặc biệt MOcirc HIgraveNH HOacuteA BẰNG HEURISTIC bull Việc tigravem giải phaacutep tối ưu của một số bagravei toaacuten quyết định phức tạp coacute thể tốn nhiều thời gian chi phiacute hay khocircng thể tigravem ra được Cograven nếu dugraveng tiếp cận mocirc phỏng cũng coacute thể keacuteo dagravei phức tạp khocircng thiacutech hợp hay thậm chiacute khocircng chiacutenh xaacutec
bull Lagrave một tiếp cận giuacutep tigravem ra caacutec giải phaacutep khả thithỏa matildenđủ tốt cho caacutec bagravei toaacuten phức tạp Coacute thể coacute giải phaacutep đủ tốt (90-999 giaacute trị của lời giải tối ưu) nhanh choacuteng vagrave đỡ tốn keacutem hơn bằng caacutech dugraveng heuristics bull Quaacute trigravenh heuristic lagrave datildey caacutec bước xacircy dựng caacutec quy luật giải quyết vấn đề thocircng qua việc tigravem kiếm caacutec con đường hứa hẹn nhất dẫn đến lời giải tigravem kiếm caacutech thức thu thập vagrave phacircn giải thocircng tin theo quaacute trigravenh giải vagrave phaacutet triền caacutec phương phaacutep dẫn đến một giải thuật tiacutenh toaacuten hay một lời giải tổng quaacutet đatilde coacute bull Aacutep dụng chủ yếu cho bagravei toaacuten cấu truacutec yếu cũng dugraveng để tigravem ra giải phaacutep chấp nhận được cho bagravei toaacuten cấu truacutec chặt bull Khocircng đủ tổng quaacutet như caacutec giải thuật thường chỉ dugraveng cho tigravenh huống đặc thugrave đang xeacutet bull Coacute thể dẫn đến một giải phaacutep dở - caacutec thủ tục từng bước giải quyết vấn đề khocircng đảm bảo tigravem ra giải phaacutep tối ưu bull Heuristic coacute thể lagrave định lượng vigrave vậy coacute thể đoacuteng vai trograve quan trọng trong cơ sở mocirc higravenh của hệ hỗ trợ quyết định bull Heuristic coacute thể lagrave định tiacutenh vigrave vậy coacute thể đoacuteng vai trograve quan trọng trong cung ứng kiến thức cho hệ chuyecircn gia bull Quaacute trigravenh heuristic liecircn quan đến tigravem kiếm học tập ước lượng phacircn xử vagrave lặp lại caacutec hoạt động nagravey dọc theo tiến trigravenh bull Kiến thức thu được dugrave thagravenh cocircng hay thất bại trong quaacute trigravenh đều được phản hồi vagrave sửa đổi chiacutenh quaacute trigravenh nhờ đoacute coacute thể định nghĩa lại mục tiecircu hay bagravei toaacuten 1048713 Giải thuật di truyền bắt đầu bằng tập caacutec giải phaacutep được sinh ngẫu nhiecircn taacutei kết hợp caacutec cặp giải phaacutep một caacutech ngẫu nhiecircn bull Tigravenh huống necircn dugraveng heuristics 1048713 Dữ liệu đầu vagraveo khocircng chiacutenh xaacutec hay coacute giới hạn 1048713 Thực tế quaacute phức tạp đến nỗi khocircng dugraveng được caacutec mocirc higravenh tối ưu 1048713 Chưa coacute được giải thuật chiacutenh xaacutec vagrave đủ tin cậy 1048713 Bagravei toaacuten phức tạp necircn sẽ khocircng kinh tế nếu dugraveng tối ưu hay mocirc phỏng hoặc tốn quaacute nhiều thời gian tiacutenh toaacuten 1048713 Coacute thể cải thiện tiacutenh hiệu quả của quaacute trigravenh tối ưu (tức coacute thể sinh ra caacutec giải phaacutep ban đầu tương đối tốt) 1048713 Liecircn quan đến xử lyacute kyacute hiệu chứ khocircng phải xử lyacute kyacute số (như hệ chuyecircn gia) 1048713 Cần coacute quyết định nhanh vagrave caacutec xử lyacute dựa vagraveo maacutey tiacutenh đều khocircng khả thi (một số heuristic khocircng cần đến maacutey tiacutenh) bull Thuận lợi 1048713 Dễ hiểu dễ giải thiacutech vagrave dễ cagravei đặt 1048713 Nacircng cao tiacutenh saacuteng tạo vagrave năng lực heuristic cho caacutec vấn đề khaacutec 1048713 Tiết kiệm thời gian xaacutec lập vấn đề 1048713 Tiết kiệm yecircu cầu về bộ chứa vagrave xử lyacute maacutey tiacutenh
1048713 Tiết kiệm thời gian tiacutenh toaacuten vagrave do vậy tiết kiệm thời gian thực trong ra quyết định Một số vấn đề phức tạp đến nỗi chỉ coacute thể giải được bằng heuristics 1048713 Thường sinh ra nhiều giải phaacutep chấp nhận được 1048713 Thường coacute thể phaacutet biểu lyacute thuyết hay đo lường thực nghiệm về chất lượng của giải phaacutep (tức giaacute trị mục tiecircu của giải phaacutep gần với giaacute trị tồi ưu đến mức nagraveo dugrave giaacute trị tối ưu chưa biết được) 1048713 Coacute thể kết hợp tiacutenh thocircng minh vagraveo để hướng dẫn pheacutep tigravem kiếm (tigravem kiếm tabu) Năng lực thocircng minh đoacute coacute thể lagrave đặc thugrave theo bagravei toaacuten hoặc dựa trecircn yacute kiến chuyecircn gia được cấy trong hệ chuyecircn gia hoặc cơ chế tigravem kiếm 1048713 Coacute thể dugraveng heuristic hiệu quả vagraveo caacutec mocirc higravenh coacute thể giải bằng quy hoạch toaacuten học Đocirci khi heuristic lagrave phương phaacutep được ưa thiacutech hơn khi khaacutec giải phaacutep heuristics được dugraveng như giải phaacutep ban đầu cho caacutec phương phaacutep quy hoạch toaacuten học bull Hạn chế 1048713 Khocircng đảm bảo coacute được giải phaacutep tối ưu 1048713 Caacutec quy luật coacute rất nhiều ngoại lệ 1048713 Caacutec lựa chọn quyết định tuần tự coacute thể khocircng tiecircn đoaacuten được caacutec kết cục tương lai của mỗi chọn lựa 1048713 Sự liecircn thuộc giữa caacutec phần trong hệ thống đocirci khi coacute thể gacircy ra caacutec ảnh hưởng lớn lao lecircn toagraven hệ thống bull Phacircn loại caacutec giải thuật heuristic 1048713 Heuristic xacircy dựng xacircy dựng giải phaacutep khả thi bằng caacutech cộng thecircm từng thagravenh phần một VD bagravei toaacuten người baacuten hagraveng ndash luocircn gheacute thagravenh phố chưa viếng thăm kế tiếp gần nhất
1048713 Heuristic cải tiến bắt đầu bằng một giải phaacutep khả thi vagrave cố gắng cải tiến liecircn tục trecircn đoacute VD trecircn thử hoaacuten đổi 2 thagravenh phố 1048713 Quy hoạch toaacuten aacutep dụng vagraveo caacutec mocirc higravenh chứa iacutet ragraveng buộc nhằm coacute được thocircng tin về thỏa hiệp tốt nhất với mocirc higravenh nguyecircn gốc Thường được dugraveng trong tối ưu hoacutea nguyecircn (integer optimization) 1048713 Chia giai đoạn giải quyết một vấn đề theo từng giai đoạn VD ở PampG trecircn đacircy bagravei toaacuten phacircn phối được giải quyết trước sau đoacute dugraveng giải quyết bagravei toaacuten chiến lược sản phẩm 1048713 Phacircn ratilde chia bagravei toaacuten thagravenh caacutec phần nhỏ hơn coacute thể giải quyết được sau đoacute kết hợp caacutec giải phaacutep đoacute lại VD chia latildenh thổ baacuten hagraveng thagravenh 4 vugraveng khaacutec nhau giải quyết cho từng vugraveng sau đoacute kết nối caacutec giải phaacutep
21Mocirc phỏngbull Giả định caacutec đặc điểm của thực tạibull Lagrave kỹ thuật tiến triển caacutec thực nghiệm (như phacircn tiacutech ldquowhat-ifrdquo) - bằng maacutey tiacutenh -trecircn một mocirc higravenh của hệ thocircng tin quản lyacute
bull Khocircng thực sự lagrave một mocirc higravenh vigrave khocircng biểu diễn thực tại magrave lagrave cố gắng bắtchước thực tạibull Một trong những phương phaacutep thocircng dụng nhất trong HHTQĐbull HHTQĐ lagravem việc với caacutec bagravei toaacuten phi cấu truacutec vagrave cấu truacutec yếu tigravenh huống thực tếphức tạp ndash khocircng dễ biểu diễn bằng mocirc higravenh tối ưu hay caacutec dạng mocirc higravenh khaacutecnhưng lại thường coacute thể xử lyacute được bằng mocirc phỏngbull Đặc điểm1048713 Iacutet đưa ra caacutec đơn giản hoacutea về thực tại hơn caacutec mocirc higravenh khaacutec1048713 Do triển khai caacutec thực nghiệm necircn noacute coacute thể kiểm thử caacutec giaacute trị cụ thể của caacutecbiến quyết địnhbiến khocircng kiểm soaacutet được của mocirc higravenh vagrave xem xeacutet ảnh hưởnglecircn caacutec biến kết quả1048713 Phương phaacutep coacute tiacutenh mocirc tả (như vậy khaacutec với phương phaacutep danh định)1048713 Khocircng tự động tigravem kiếm giải phaacutep tối ưu ndash noacute mocirc tảtiecircn đoaacuten caacutec đặc tiacutenh của hệthống đatilde cho dưới caacutec điều kiện khaacutec nhau từ đoacute coacute thể chọn ra phương aacuten tốtnhất1048713 Quaacute trigravenh mocirc phỏng thường lặp lại một thực nghiệm nhiều lần để coacute được ướclượng về hiệu ứng tổng quaacutet của một số hagravenh động nhất định1048713 Mocirc phỏng maacutey tiacutenh thiacutech hợp cho hầu hết caacutec tigravenh huống mặc dugrave cũng coacute một sốmocirc phỏng thủ cocircng thagravenh cocircng1048713 Thường chỉ được dugraveng khi bagravei toaacuten quaacute phức tạp khocircng thể xem xeacutet bằng caacutec kỹthuật tối ưu dạng số Tiacutenh phức tạp theo nghĩa bagravei toaacuten khocircng thể cocircng thức hoacuteacho tối ưu (do khocircng thotildea caacutec giả định) hoặc cocircng thức quaacute lớn quaacute nhiều tươngtaacutec giữa caacutec biến hoặc về bản chất bagravei toaacuten lagrave bất định hay rủi roPhương phaacutep mocirc phỏng thiết lập mocirc higravenh của hệ thống thực vagrave tiến hagravenh caacutec thựcnghiệm lặp lại trecircn mocirc higravenh
bull Thuận lợi1048713 Lyacute thuyết tương đối trực tiếp hiệu ứng dagravei hạn của nhiều chiacutenh saacutech -gt neacuten thờigian lớn1048713 Do tiacutenh chất mocirc tả (khaacutec với danh định)1048713 Coacute thể thấy được nhanh choacuteng coacute thể đặt ra caacutec cacircu hỏi ldquowhat-ifrdquo coacute thể dugravengtiếp cận thử-vagrave-sai vagraveo giải quyết vấn đề một caacutech nhanh choacuteng rẻ chiacutenh xaacutec iacutetrủi ro hơn1048713 Thử nghiệm được biến quyết định phần nagraveo của mocirci trường thực sự quan trọngvới caacutec phương aacuten khaacutec nhau1048713 Yecircu cầu kiến thức riecircng biệt về bagravei toaacuten vigrave thế buộc người xacircy dựng mocirc higravenh phảilagravem việc thường xuyecircn với nhagrave quản lyacute ndash đối tượng mong muốn của HHTQĐ để
từ đoacute bản chất bagravei toaacuten vagrave caacutec quyết định được hiểu tốt hơn1048713 Mocirc higravenh được xacircy dựng từ viễn cảnhcaacutech nhigraven của nhagrave quản lyacute1048713 Mocirc higravenh chỉ cho một bagravei toaacuten riecircng biệt thường khocircng thể dugraveng giải caacutec bagravei toaacutenkhaacutec Như vậy mỗi thagravenh phần của mocirc higravenh ứng với một phần của hệ thống thựcdo đoacute sẽ khocircng yecircu cầu nhagrave quản lyacute phải tổng quaacutet hoacutea caacutec hiểu biết của migravenh1048713 Phổ bagravei toaacuten giải được rất rộng tồn kho nhacircn sự hoạch định chiến lược 1048713 Coacute thể chứa caacutec phức tạp thực sự của bagravei toaacuten khocircng cần caacutec đơn giản hoacutea (TDdugraveng caacutec phacircn phối xaacutec suất thực thay vigrave phacircn phối lyacute thuyết xấp xỉ)1048713 Coacute thể tự động sinh ra nhiều đo lường hiệu năng quan trọng1048713 Thường lagrave phương phaacutep duy nhất của HHTQĐ coacute thể xử lyacute caacutec bagravei toaacuten tương đốiphi cấu truacutec1048713 Coacute một số caacutec goacutei phần mềm mocirc phỏng (Monte Carlo) tương đối dễ dugravengbull Điểm yếu1048713 Tuy thường tigravem được caacutec phương aacuten đủ tốt nhưng khocircng đảm bảo lời giải tối ưu1048713 Quaacute trigravenh xacircy dựng mocirc higravenh thường dagravei vagrave tốn keacutem1048713 Giải phaacutep vagrave suy diễn từ nghiecircn cứu mocirc phỏng thường khocircng thể chuyển sang bagraveitoaacuten khaacutec vigrave mocirc higravenh kết hợp caacutec yếu tố đặc thugrave1048713 Đocirci khi do mocirc higravenh quaacute dễ giải thiacutech cho nhagrave quản lyacute necircn caacutec phương phaacutep phacircntiacutech thường xem nhẹ1048713 Phần mềm mocirc phỏng đocirci khi yecircu cầu caacutec kỹ năng đặc biệt do độ phức tạp củaphương phaacutep giải higravenh thứcbull Caacutec loại mocirc phỏng1048713 Mocirc phỏng xaacutec suất một hay nhiều biến độc lập mang tiacutenh xaacutec suất với 2 loạiphacircn phối ndash thường dugraveng kỹ thuật Monte Carlo1048713 Phacircn phối rời rạc tigravenh huống coacute một số giới hạn caacutec biến cố (biến) với hữu hạncaacutec giaacute trị cho mỗi biến cố (biến)1048713 Phacircn phối liecircn tục tigravenh huống coacute số lượng khocircng giới hạn caacutec biến cố tuacircn theocaacutec hagravem mật độ xaacutec suất như phacircn phối chuẩn1048713 Mocirc phỏng độc lậpphụ thuộc theo thời gian1048713 Độc lập khocircng cần thiết phải biết chiacutenh xaacutec thời điểm xảy ra biến cố (nhu cầutiecircu thụ lượng sản phẩm trong ngagravey khocircng biết chiacutenh xaacutec thời điểm tiecircu thụ)1048713 Phụ thuộc cần biết chiacutenh xaacutec thời điểm xảy ra sự kiện (bagravei toaacuten hagraveng đợi)1048713 Mocirc phỏng tương taacutec trực quan1048713 Mocirc phỏng hướng đối tượng dugraveng tiếp cận hướng đối tượng để xacircy dựng mocirc higravenhmocirc phỏng Chuacute yacute ngocircn ngữ mocirc higravenh hoacutea nhất thể UML (unified modelinglanguage) kể cả khi mocirc phỏng caacutec hệ thời gian thựcMOcirc HIgraveNH HOacuteA ĐA CHIỀU ndash XỬ LYacute PHAcircN TIacuteCH TRỰC TUYẾNbull Người ra quyết định thường phải xem xeacutet nhiều chiều của dữ liệu (TD caacutec chiềucủa dữ liệu baacuten hagraveng lagrave sản phẩm vugraveng thời gian người baacuten ) dữ liệu cần đượcphacircn tiacutech trực tiếp bằng caacutec cocircng cụ chuẩn hay phacircn tiacutech tự động bằng caacutec
phương phaacutep khai mỏ dữ liệu (data mining)bull Hầu hết caacutec hệ thống phacircn tiacutech đa chiều được nhuacuteng trong caacutec hệ xử lyacute phacircn tiacutechtrực tuyến (HXLPTTT ndash online analytic processing - OLAP)bull Mục tiecircu của XLPTTT nắm bắt cấu truacutec của dữ liệu thực để hỗ trợ ra quyết địnhbull Trong HHTQĐ coacute sự gắn nối tự nhiecircn giữa mocirc higravenh hoacutea dữ liệu mocirc higravenh hoacutea kyacutehiệu vagrave caacutec khiacutea cạnh của phacircn tiacutech ldquowhat-ifrdquobull Caacutec baacuteo caacuteo của HXLPTTT đều coacute tiacutenh tương taacutec dễ khai thaacutec sử dụng đặc biệtphugrave hợp cho caacutec baacuteo caacuteo về chỉ số hiệu năng chủ yếu (key performance indicators- KPI) baacuteo caacuteo về đo lường hiệu năng kinh doanh bull Thế hệ hiện tại của HXLPTTT vagrave hệ khai mỏ dữ liệu (data mining) tiacutech hợp caacutecđặc tiacutenh của hệ thocircng tin latildenh đạo (executive information system ndashEIS- nhiềucaacutech nhigraven dữ liệu chi tiết hoacutea theo nhu cầu) vagrave caacutec hệ đồ họa khaacutec ndash thường coacutegiao diện người dugraveng dạng kiểu WEBbull Caacutec hệ thống như trecircn cograven được gọi lagrave caacutec cocircng cụ triacute tuệ kinh doanh (businessintelligence - BI) vigrave coacute caacutec đặc trưng về mocirc higravenh hoacutea vagrave tối ưu hoacutea nhưng lạitrong suốt đối với ngươigrave dugravengbull Hiện caacutec cocircng cụ được đưa ra bởi caacutec nhagrave cung cấp về CSDL về hoạch định tagraveinguyecircn tổ chức (ERP) về nhagrave kho dữ liệu (data warehouse) về HXLPTTT MOcirc HIgraveNH HOacuteA VAgrave MOcirc PHỎNG TƯƠNG TAacuteC TRỰC QUANbull Iacutech lợi Người ra quyết định tham gia vagraveo quaacute trigravenh phaacutet triển mocirc higravenh vagrave thựcnghiệm mocirc phỏng vigrave vậy sẽ tin tưởng khi sử dụng mocirc higravenhbull Mocirc higravenh hoacutea tương taacutec trực quan (visual interactive modeling - VIM) dugraveng caacutecbiểu diễn đồ họa maacutey tiacutenh để trigravenh bagravey caacutec ảnh hưởng của caacutec quyết định quản lyacutekhaacutec nhau ở một thời điểm (tĩnh) hay tiến triển theo thời gian (động với kỹ thuậthoạt higravenh)bull Mocirc phỏng tương taacutec trực quan (visual interactive simulation - VIS) cho pheacutepngười dugraveng theo dotildei tiến trigravenh xacircy dựng vagrave sử dụng khai thaacutec mocirc higravenh mocirc phỏngdưới dạng hoạt higravenhbull Mocirc higravenh hoacutea tương taacutec trực quan coacute thể kết hợp với tiếp cận triacute tuệ nhacircn tạo đểđưa ra caacutec khả năng mới thay đổi từ xacircy dựng hệ thống dạng đồ họa đến tigravem hiểuvề động học của hệ thốngbull Cần đến caacutec hệ thống maacutey tiacutenh xử lyacute song song tốc độ cao để xacircy dựng caacutec mocircphỏng - phức tạp quy mocirc lớn dạng hoạt higravenh - mang tiacutenh khả thi ở thời gian thực
22Caacutec dạng hệ thống hỗ trợ ra quyết địnhHệ hỗ trợ quyết định nhoacutemRa quyết định nhoacutem giao tiếp vagrave cộng taacutec- Caacutec đặc điểm của cocircng việc nhoacutem+ Một nhoacutem thực hiện một nhiệm vụ thỉnh thoảng ra quyết định thỉnh thoảngkhocircng ra quyết định+ Caacutec thagravenh viecircn trong nhoacutem coacute thể ở những nơi khaacutec nhau
+ Caacutec thagravenh viecircn trong nhoacutem coacute thể lagravem việc ở những thời gian khaacutec nhau+ Caacutec thagravenh viecircn trong nhoacutem coacute thể lagravem việc cugraveng nhau hoặc ở caacutec tổ chức khaacutecnhau+ Nhoacutem coacute thể vĩnh viễn hoặc tạm thời+ Nhoacutem coacute thể ở bất kỳ mức quản lyacute nagraveo hoặc mức thời gian nagraveo+ Coacute sự điều phối (quaacute trigravenh vagrave nhiệm vụ đạt được) hoặc macircu thuẩn trongnhoacutem+ Coacute sự đạt được hoặcvagrave mất maacutet năng suất trong tổ chức+ Nhiệm vụ phải hoagraven thagravenh rất nhanh+ Khocircng thể hoặc quaacute đắt cho tất cả caacutec thagravenh viecircn trong nhoacutem cugraveng hợp ở mộtnơi+ Một số dữ liệu thocircng tin hoặc kiến thức cần thiết nằm ở nhiều nơi một sốkhaacutec ở ngoagravei tổ chức+ Chuyecircn mocircn của caacutec thagravenh viecircn khocircng coacute trong nhoacutem lagrave cần thiết- Caacutec hoạt động vagrave caacutec quaacute trigravenh miecircu tả caacutec cuộc họp+ Cuộc họp lagrave hoạt động chung liecircn quan bởi một nhoacutem người coacute địa vị bằngnhau hoặc gần bằng nhau+ Kết quả của cuộc họp phụ thuộc một phần vagraveo kiến thức yacute kiến caacutec đaacutenh giaacutecủa caacutec thagravenh viecircn+ Kết quả của cuộc họp cũng phụ thuộc vagraveo sự kết hợp của nhoacutem vagrave phụ thuộcvagraveo quaacute trigravenh ra quyết định được sử dụng bởi nhoacutem đoacute+ Giải quyết caacutec yacute kiến khaacutec nhau bởi người coacute quyền hạn hoặc thương lượnghoặc phacircn xửHỗ trợ giao tiếp- Giao tiếp lagrave thagravenh phần quan trọng cho hỗ trợ quyết định Khocircng coacute giao tiếp thigravekhocircng coacute cộng taacutec Những người ra quyết định caacute nhacircn phải giao tiếp với caacutecđồng nghiệp chuyecircn gia cơ quan chiacutenh phủ khaacutech hagraveng đối taacutec kinh doanh hellipHọ cũng cần dữ liệu vagrave thocircng tin (vagrave kiến thức) từ nhiều nơi trecircn thế giới Caacutecnhoacutem ra quyết định phải giao tiếp cộng taacutec vagrave thương lượng trong cocircng việcHầu hết caacutec tổ chức sẽ nhanh trở thagravenh khocircng coacute chức năng nếu khocircng coacute caacutec hệthống giao tiếp Thương mại điện tử coacute thể hiệu quả chỉ qua caacutec kỹ thuật giao tiếphiện đại- Caacutec kỹ thuật thocircng tin hiện đại cung cấp caacutec phương tiện hỗ trợ giao tiếp rẻnhanh coacute khả năng coacute thể tin cậy Nền tảng hỗ trợ giao tiếp lagrave caacutec hệ thống maacuteytiacutenh mạng+ Bắt đầu bằng điện baacuteo điện thoại radio vagrave ti vi+ Trong 100 năm chuacuteng ta phaacutet triển maacutey fax thư điện tử chương trigravenh chatnhoacutem tin tức hệ thống hội nghị truyền higravenh Hầu hết caacutec kỹ thuật nagravey đềuhoạt động trecircn internet+ Sự phaacutet triển giao tiếp sau cugraveng lagrave hệ thống họp điện tử caacutec dịch vụ vagrave hệ
thống hội nghị điện tử thường sử dụng internet để kết nối caacutec người ra quyếtđịnh- Caacutec thuận lợi aacutep dụng caacutec phương phaacutep giao tiếp cải tiến trong caacutec tổ chức+ Cải tiến năng suất của nhacircn viecircn+ Liecircn quan đến nhiều người ra quyết định chiacutenh+ Khocircng quan tacircm nhiều đến đường biecircn giới địa lyacute+ Tạo nền văn hoacutea hợp taacutec nhất quaacuten+ Cải tiến chất lượng cuộc sống của nhacircn viecircnHỗ trợ cộng taacutec Maacutey tiacutenh hỗ trợ cộng taacutec- Khung thời giannơi chốn+ Sự hiệu quả của kỹ thuật tiacutenh toaacuten cộng taacutec phụ thuộc vagraveo vị triacute của caacutec thagravenhviecircn trong nhoacutem vagrave phụ thuộc vagraveo thời gian chia sẽ thocircng tin gởi vagrave nhận+ Chia sự giao tiếp thagravenh bốn ocirc vagrave tổ chức bốn ocirc dọc theo 2 chiều thời gian vagravenơi chốn1048713 Thời gian Khi gởi vagrave nhận thocircng tin hầu như đồng thời giao tiếp lagrave đồngthời Viacute dụ Điện thoại ti vi vagrave caacutec cuộc họp gặp mặt nhau Giao tiếp bấtđồng bộ xảy ra khi người nhận nhận thocircng tin ở thời điểm khaacutec thời điểmgởi thocircng tin đoacute1048713 Nơi chốn Người gởi vagrave người nhận coacute thể ở cugraveng phograveng hoặc khocircng+ Bốn ocirc lagrave1048713 Cugraveng thời giancugraveng nơi chốn Caacutec thagravenh viecircn gặp mặt nhau cugraveng một luacutecgiống như phograveng quyết định hoặc gặp mặt truyền thống1048713 Cugraveng thời giankhaacutec nơi chốn Caacutec thagravenh viecircn ở caacutec nơi khaacutec nhau nhưnggiao tiếp cugraveng nhau Viacute dụ hội nghị truyền higravenh (videoconferencing)1048713 Khaacutec thời giancugraveng nơi chốn Nhiều người lagravem việc theo ca Ca nagravey để lạithocircng tin cho ca khaacutec1048713 Khaacutec thời giankhaacutec nơi chốn Caacutec thagravenh viecircn ở caacutec nơi khaacutec nhau Caacutecthagravenh viecircn nagravey gởi vagrave nhận thocircng tin ở những lần khaacutec nhau
23Thực thi hệ DSSHệ thống hỗ trợ quản lyacute (MSS) khocircng phải luacutec nagraveo cũng luocircn thagravenh cocircng Nhiều trường hợpthất bại của ES khocircng hoagraven toagraven lagrave lyacute do kỹ thuật Thực thi hệ thống lagrave một quaacute trigravenh liecircn tụcnhằm đảm bảo cho tổ chức chuẩn bị tiếp nhận một hệ thống mới vagrave đưa hệ thống vagraveo sử dụngthagravenh cocircngThực hiện cocircng nghệ hệ thống hỗ trợ quản lyacute lagrave việc phức tạp vigrave caacutec hệ thống nagravey khocircng đơnthuần lagrave hệ thống thocircng tin chỉ thu thập thao taacutec vagrave phacircn phối thocircng tin Magrave xa hơn chuacuteng
liecircn quan tới caacutec cocircng việc coacute thể lagravem thay đổi đaacuteng kể caacutech thức hoạt động của tổ chức Tuyvậy đa số caacutec yếu tố thực thi đều liecircn quan tới hệ thống thocircng tinThực thi MSS lagrave quaacute trigravenh liecircn tục diễn ra trong suốt thời gian phaacutet triển hệ thống từ đề xuấtban đầu đến nghiecircn cứu khả thi thiết kế vagrave phacircn tiacutech hệ thống lập trigravenh huấn luyện chuyểnđổi vagrave lắp đặt Caacutec chuyecircn gia hệ thống thocircng tin thường gọi thực thi lagrave giai đoạn cuối trongvograveng đời hệ thống Định nghĩa thực thi MSS phức tạp hơn vigrave bản chất lặp của sự phaacutet triểncaacutec hệ thống
THỰC THI KHOcircNG HOAgraveN CHỈNHCaacutec quyết định về tiacutenh khả thi thường coacute giả định về lợi iacutech đạt được khi kế hoạch thực thiđược thực hiện hoagraven toagraven Trong thực tế thường chỉ thực hiện 90 thậm chiacute 70 phần trăm sovới phacircn tiacutech khả thi Lyacute do lagrave sự thay đổi tại một nơi trong hệ thống coacute thể ảnh hưởng vagrave coacutethể taacutec động tiecircu cực đến chỗ khaacutec Do vậy cấp quản lyacute coacute thể bỏ những phần trong dự aacuten coacutethể gacircy ra taacutec động xấu Do đoacute dự aacuten sẽ thực hiện iacutet hơn 100 so với dự aacuten kế hoạch Caacutec lyacutedo khaacutec coacute thể lagrave do khấu trừ ngacircn saacutech hoặc vượt chi phiacuteĐAacuteNH GIAacute SỰ THAgraveNH COcircNG CỦA THỰC THI HỆ THỐNGPhải coacute caacutec chỉ số đo lường thigrave mới coacute thể đaacutenh giaacute sự thagravenh cocircng khi thực thi một hệ thốngDickson va Powers (1973) đề ra 5 tiecircu chuẩn độc lậpbull Tỷ lệ thời gian thực hiện dự aacuten với thời gian ước lượngbull Tỷ lệ chi phiacute thực tế vagrave ngacircn saacutech thực hiệnbull Thaacutei độ của cấp quản lyacute đối với hệ thốngbull Nhu cầu thocircng tin của caacutec nhagrave quản lyacute được đaacutep ứng như thế nagraveo qua hệ thốngbull Taacutec động của dự aacuten đối với những hoạt động maacutey tiacutenh trong cocircng tyCaacutec đo lường khaacutec để đaacutenh giaacute thagravenh cocircng của hệ hỗ trợ quản lyacute (MSS)bull Sự sử dụng hệ thống (dự định dugraveng hoặc thực sự dugraveng)bull Thỏa matilden của người dugravengbull Thaacutei độ taacuten thagravenhbull Mức độ hệ thống hoagraven thagravenh caacutec mục tiecircu ban đầubull Phần thưởng đối với tổ chức (giảm chi phiacute tăng doanh thuhellip)bull Tỷ số lợi iacutech chi phiacute
bull Mức độ thể chế hoacutea của MSS trong tổ chứcDo bởi tiacutenh đa dạng của DSS necircn việc đaacutenh giaacute sự thagravenh cocircng của hệ nagravey cũng khoacute khăn tuynhiecircn cũng coacute thể coacute một số yếu tố giuacutep cho DSS thagravenh cocircng như sự tham gia người dugravenghuấn luyện người dugraveng hỗ trợ quản lyacute cấp cao nguồn thocircng tin đặc điểm của những nhiệmvụ coacute liecircn quan (cấu truacutec bất định độ khoacute phụ thuộc)
Chương5Nhoacutem hỗ trợ quyết định vagrave nhoacutemcocircng nghệ phần mềm
51Nhoacutem tạo quyết định
MDM-Holsapple đatilde gợi yacute chuacuteng ta sử dụng giới hạn người tạo quyết định
Một nhoacutem lagrave kết cấu MDM nơi magrave nhiều người ra quyết định hoagraven toagraven tương taacutec
Một đội lagrave kết cấu MDM nơi caacutec thagravenh viecircn tư vấn cho người đưa ra quyết định nhưng khocircng tương taacutec
Một Ủy ban lagrave kết cấu MDM với một người tạo quyết định duy nhất vagrave sự tương taacutec giữa caacutec thagravenh viecircn
Mạng thocircng tin
Mạng lưới baacutenh xe mỗi người tham gia coacute thể giao tiếp với người đưa ra quyết định ở trung tacircm nhưng khocircng phải với người tham gia khaacutecCấu truacutec nagravey lagrave khocircng thỏa matilden tất cả những người tham gia ngoại trừ người ra quyết định
Mạng dacircy chuyền Tham gia chuyển tiếp thocircng tin chỉ để noacute luocircn liền kề nhau trong chuỗi
Thagravenh viecircn cuối cugraveng ko được đaacutep ứng
Mạng vograveng trograven Tương tự như chuỗi nhưng kết thuacutec được kết nối
Mạng kết nối hoagraven toagraven khocircng coacute hạn chế về giao tiếp vagrave tương taacutec giữa caacutec thagravenh viecircnNoacutei chungnoacute đaacutep ứng hầu hết caacutec kết nối của người tham gia nhưng truyền đạt thocircng tin mất nhiều thời gian vagrave coacute nhiều cơ hội xảy ra lỗi
Nhoacutem hagravenh vi vagrave chuẩn mực
MDMs thiết lập caacutec chỉ tiecircu hướng dẫn quaacute trigravenh ra quyết định
Một chuẩn mực quy định cụ thể những gigrave thagravenh viecircn trong nhoacutem dự kiến sẽ lagravem trong những hoagraven cảnh nhất định
Quy tắc gửi coacute thể được thocircng qua viacute dụ đaacutenh giaacute ngang hagraveng hoặc xử phạt
Lagravem thế nagraveo để đưa ra quyết định
Việc chọn lựa magrave trong đoacute việc sử dụng cấu truacutec MDM phải được dựa trecircn một số yếu tố liecircn quan với bối cảnh quyết định
Viacute dụmột cấu truacutec riecircng lẻ sẽ lagravem việc nơi magrave quyết định được cấu truacutec cao vagrave thocircng tin lagrave coacute sẵn
Một ủy ban cơ cấu sẽ lagrave sự lựa chọn khi người ra quyết định khocircng thể đưa ra quyết định một migravenh
52Caacutec vấn đề thường gặp trong nhoacutem
Kiacutech thước Noacutei chung sự nhất triacute vagrave gắn kết giữa caacutec thagravenh viecircn tỉ lệ nghịch với phạm vi nhoacutem Trong nhoacutem lớn rất dễ higravenh thagravenh caacutec nhoacutem nhỏ vagrave hoạt động rời rạc
Tư duy tập thể Trong nhoacutem lớn mọi người coacute xu hướng suy nghĩ đểđạtđược sự nhất triacute necircn khocircng phaacutet huy được sự saacuteng tạo
Caacutec vấn đề về xatilde hội
Xung đột Trong 1 nhoacutem ai cũng muốn migravenh lagrave giỏi nhất necircn dễ dẫn đến xung đột
Ẩn danh(Giấu tecircn) Đacircy lagrave phương phaacutep được sử dụng để kiểm soaacutet xung đột Cho caacutec thagravenh viecircn tham gia ẩn danh
Vấn đề giới tiacutenh Nam vagrave nữ thường coacute những thế mạnh khaacutec nhau điều nagravey coacute thể lagrave sức mạnh trong 1 thiết lập MDM
Đagravem phaacuten vagrave quyết định
Một quyết định coacute thể liecircn quan đến nhiều quan điểm khaacutec nhau vigrave thế cần phải coacute sự đagravem phaacuten
Caacutec thiết kế của cơ chế hỗ trợ cho MDM phải phugrave hợp với caacutec hoạt độngđagravemphaacuten
Những hoạt động nagravey bao gồm việc thu nhận yacute kiến của caacutec thagravenh viecircn 1 caacutech cocircng bằng
53Cocircng nghệ hỗ trợ MDM
Organizational DSSndash 1 hệ thống cung cấp caacutec quyết định hỗ trợ
Group Support Systemndash Cocircng nghệ sử dụng sự hỗ trợ của nhiều becircn tham gia
Group DSS ndash Lagrave 1 hệ thống được thiết kế đặc biệt để hỗ trợ cho MDM
DSS ndash Lagrave 1 hệ thống dưới sự kiểm soaacutet của 1 người quyết định hệ thống nagravey cung cấp 1 bộ cocircng cụ giuacutep phacircn tiacutech hoagraven cảnh đểđưa ra quyết định vagrave nacircng cao hiệu quả của quyết địnhđoacute
53Cocircng nghệ hỗ trợ MDM
Organizational DSSndash 1 hệ thống cung cấp caacutec quyết định hỗ trợ
Group Support Systemndash Cocircng nghệ sử dụng sự hỗ trợ của nhiều becircn tham gia
Group DSS ndash Lagrave 1 hệ thống được thiết kế đặc biệt để hỗ trợ cho MDM
DSS ndash Lagrave 1 hệ thống dưới sự kiểm soaacutet của 1 người quyết định hệ thống nagravey cung cấp 1 bộ cocircng cụ giuacutep phacircn tiacutech hoagraven cảnh đểđưa ra quyết định vagrave nacircng cao hiệu quả của quyết địnhđoacute
Mục tiecircu của cocircng nghệ hỗ trợ MDM
Quy trigravenh hỗ trợ tập trung vagraveo quaacute trigravenh tạo điều kiện thuận lợi cho sự tương taacutec
Cơ chế cấu truacutec quaacute trigravenh chi phối caacutec hoạt động truyền thocircng
Nhiệm vụ hỗ trợ cocircng việc coacute thể chọn lựa tổ chức hoặc lấy thocircng tin
Nhiệm vụ cấu truacutec cocircng việc cho pheacutep truy cập đến kỹ thuật lọc kết hợp phacircn tiacutech kiến thức liecircn quan đến cocircng việc
Caacutec lớp loại cocircng nghệ hỗ trợ MDM
Phacircn loại theo đặc điểm do DeSanctis vagrave Gallupe đưa ra đề xuất một chương trigravenh ba cấp dựa trecircn caacutec tiacutenh năng được cung cấp
Hệ thống cấp 1 Mục điacutech chiacutenh lagrave tạo điều kiện thocircng tin liecircn lạc giữa caacutec thagravenh viecircn
Hệ thống cấp 2 Thiết kế để giảm thiểu rủi ro
Hệ thống cấp 3 Giuacutep điều chỉnh xử lyacute quyết định
Phacircn loại theo cocircng nghệ -Kraemer vagrave King tập trung vagraveo cocircng nghệ aacutep dụng
Cocircng nghệ bảng mạch điện tử
Hội nghị trực tuyến
Mạng lưới tập đoagraven
Trung tacircm thocircng tin
Mocirci trường cộng taacutec
Phograveng quyết định
Nhoacutem phần mềm
Phần mềm được thiết kế để hỗ trợ sự hợp taacutec bao gồm việc thu huacutet vagrave lưu trữ thocircng tin
Caacutec tổ chức dẫn đầu thị trường hiện tại lagrave Lotus Notes and Domino Microsoft Exchange Novell GroupWise and Oracle Office
Caacutec cocircng cụ trong một bộ phần mềm bao gồm người quản lyacute hội nghị (Lotus Sametime) vagrave trao đổi thocircng điệp (Lotus Notes Mail)
Xếp hạng phần mềm cho nhoacutem
Ellis vv đề xuất một hệ thống xếp hạng dựa vagraveo kiểu sự hỗ trợ noacute Cung cấp
Hệ thocircng điệp
Hệ thống hội thảo truyền higravenh
Hệ thống cộng taacutec soạn thảo
Nhoacutem phacircn phối giải phaacutep phần mền
Hệ thống phối hợp
Hệ thống thocircng minh đại diện
Lực lượng điều khiển phaacutet triển phần mềm cho nhoacutem
Một số nhacircn tố chiacutenh bao gồm
Tăng năng suất
Giảm số lượng caacutec cuộc họp
Tăng cường tự động hoacutea caacutec quy trigravenh lagravem việc thường xuyecircn
Cần phối hợp toagraven cầu tốt hơn
Tiacutenh sẵn sagraveng của những mạng lan rộng
Coleman vagrave Khanna liệt kecirc 10 nhacircn tố khaacutec
54Quản lyacute hoạt động MDM (Mobile Device Management - Quản lyacute thiết bị di động)
Một số phương phaacutep phối hợp phổ biến hơnMDM lagrave
Kỹ thuật nhoacutem định danh
Kỹ thuật Delphi
Sự phacircn xử
Hệ thocircng tin dựa trecircn vấn đề
Nemawashi
Kỹ thuật nhoacutem định danh
1-Mỗi người tham gia viết ra những yacute tưởng về những gigrave necircn quyết định
2-Lần lượt mỗi người tham gia trigravenh bagravey yacute tưởng của migravenh được ghi lại trecircn bảng Khocircng thảo luận ở đacircy
3-Sau khi tất cả caacutec yacute tưởng được trigravenh bagravey caacutec đại biểu coacute thể chất vấn những người khaacutec
4-Mỗi người tham gia bỏ phiếu cho mỗi yacute tưởng
Kỹ thuật Delphi
Về cơ bản tương tự như kỹ thuật nhoacutem định danh ngoại trừ những người khocircng bao giờ tham gia cuộc họp
Một cocircng cụ khảo saacutet được sử dụng để thu thập đầu vagraveo ban đầu từ caacutec thagravenh viecircn
Một cuộc khảo saacutet thứ hai được gửi đi với một bản toacutem tắt caacutec kết quả chung
Những bước lặp lại cho đến khi đạt được một sự đồng thuận hoặc nhigraven nhận của đa số
Sự phacircn xử(Arbitration )
Thiacutech hợp nhất khi caacutec thagravenh viecircn của MDM đại diện cho caacutec yếu tố đối lập
Những người tham gia đồng yacute rằng nếu lựa chọn thay thế hai becircn thỏa thuận khocircng được tigravem thấy thigrave một trọng tagravei viecircn becircn ngoagravei sẽ tham gia
Trọng tagravei sau đoacute lựa chọn thay thế ocircng hoặc xeacutet thấy thiacutech hợp nhất
Hệ thống thocircng tin dựa trecircn vấn đề (IBIS)
Lagrave một phương phaacutep lập luận cấu truacutec
Một đại diện cho IBIS lagrave một đồ thị với caacutec nuacutet vagrave caacutec liecircn kết
IBIS bắt đầu với lựa chọn của một nuacutet vấn đề gốc sau đoacute caacutec nuacutet vị triacute khaacutec nhau được liecircn kết với nuacutet gốc
Caacutec nuacutet vị triacute nagravey sau đoacute được đaacutenh giaacute dựa trecircn những lập luận gắn liền với chuacuteng
Nemawashi (được sử dụng rộng ratildei tại Nhật Bản)
1-Một hoặc nhiều thagravenh viecircn của MDM được chỉ định lagrave điều phối viecircnCaacutec điều phối viecircn sau đoacute chọn người tham gia cograven lại
2-Điều phối viecircn xacircy dựng một tổng hợp caacutec sự lựa chọn vagrave sau đoacute caacutec chuyecircn gia đaacutenh giaacute caacutec lựa chọn
3-Điều phối viecircn lựa chọn một sự lựa chọn dựa trecircn kết quả ở trecircn(ở 2)
4-Sự thay thế được luacircn chuyển điều phối viecircn tigravem kiếm sự đồng thuận thocircng qua sự thuyết phục vagrave đagravem phaacuten
5-Nếu đạt được sự đồng thuận điều phối viecircn cho lưu thocircng một tagravei liệu magrave mỗi thagravenh viecircn MDM để lại dấu hiệu trecircn đoacute
55Nơi lagravem việc ảo
Nhiều tổ chức trecircn toagraven thế giới kinh doanh bất động sản cho cocircng nghệ hợp taacutec
Cocircng việc được trở thagravenh một điều bạn lagravem hơn lagrave một nơi bạn đi
Những thay đổi lớn nhất mang lại bởi nơi lagravem việc ảo coacute thể lagrave về văn hoaacute hay xatilde hội hơn lagrave về cocircng nghệ
Chương 6 Hệ thống thocircng tin điều hagravenh
61 Yacute nghĩa của EIS- Hệ thống thocircng tin điều hagravenh
- EIS lagrave một dạng đặc biệt của DSS được thiết kế để hỗ trợ ra quyết định ở cấp cao nhất của một tổ chức
- Lagrave một hệ thống thocircng tin hỗ trợ nhu cầu lập kế hoạch vagrave đaacutenh giaacute của caacutec nhagrave quản lyacute điều hagravenh
- EIS coacute thể giuacutep một CEO coacute được bức tranh tổng thể chiacutenh xaacutec nhất về caacutec hoạt động vagrave một bản toacutem tắt những gigrave magrave đối thủ cạnh tranh đang lagravem
- Caacutec hệ thống nagravey noacutei chung hoạt động dễ dagraveng vagrave trigravenh bagravey thocircng tin theo những caacutech dễ hiểu để việc tiếp thu được nhanh choacuteng (biểu đồ đồ thịhellip)
(Tagravei liệu thecircm EIS lagrave những loại hệ thống lagrave rất phức tạp trong tự nhiecircn Coacute thể noacutei hệ thống nagravey cũng cung cấp cho caacutec nhagrave quản lyacute với caacutec thiết bị coacute khả năng ra quyết định bằng caacutech sử dụng của noacute Hệ thống nagravey hoạt động trong điều kiện như vậy quan trọng như trong caacutec hệ thống khaacutec khocircng hỗ trợ Khả năng lưu trữ dữ liệu nặng lagravem cho noacute lyacute tưởng để được thocircng qua khocircng chỉ bởi caacutec doanh nghiệp lớn magrave cograven bởi caacutec doanh nghiệp nhỏ hơn Nhigraven chung hệ thống nagravey lagrave dagravenh cho caacutec nhacircn viecircn cấp cao hỗ trợ thagravenh thạo trong việc đưa ra caacutec quyết định quan trọng)
Caacutec phiecircn EIS tiecircu biểu- Phiecircn lagravem việc coacute thể bắt đầu với một baacuteo caacuteo về tigravenh higravenh tagravei chiacutenh vagrave kinh
doanh của một cocircng ty caacutec chỉ số hoạt động quan trọng được hiển thị rotilde ragraveng- EIS sẽ cho pheacutep caacutec giaacutem đốc điều hagravenh coacute thể đi sacircu vagraveo dữ liệu từ những con
số bất kỳ magrave noacute hỗ trợ- Việc điều hagravenh coacute thể lựa chọn một mức độ chi tiết ( VD danh số baacuten hagraveng) nếu
như cần điều tra thecircm- Lagrave một phương phaacutep tiếp cận coacute thể giuacutep việc ra quyết định tốt hơn
Những điều magrave EIS ko coacute- EIS khocircng phải lagrave sự thay thế cho caacutec hệ thống dựa trecircn caacutec maacutey tiacutenh khaacutec EIS
thực sự chỉ cung cấp dữ liệu cho caacutec hệ thống nagravey- Noacute khocircng thể biến caacutec bộ hệ điều hagravenh của maacutey tiacutenh thagravenh những ldquochuyecircn viecircn
giỏirdquo- Coacute thể được viacute một caacutech cao hơn như lagrave một trợ lyacute đaacuteng tin cậy coacute thể được gọi
đến bất khi nagraveo vagrave mỗi khi cần thiết
Tagravei liệu thecircm Sự khaacutec nhau giữa EIS vagrave DSS+ EIS thiết kế để hỗ trợ những người điều hagravenh cấp cao giuacutep họ khaacutem phaacute caacutec vấn đề vagrave caacutec cơ hội DSS hỗ trợ những nười phacircn tiacutech cố gắng trả lời cacircu hỏi caacutei gigrave coacute thể lagravem cugraveng với một cơ hội hoặc một vấn đề
Chiều EIS DSSNhững người sử dụng thocircng thường
Duyệt dữ liệu đi xuống truy xuất trạng thaacutei
Hỗ trợ phacircn tiacutech vagrave quyết định
Sự thuacutec đẩy Tiacutenh thiacutech hợp Tiacutenh hiệu quảỨng dụng Queacutet mocirci trường đaacutenh giaacute
hiệu suất nhận dạng caacutec vấn đề vagrave caacutec cơ hội
Caacutec quyết định quản lyacute trecircn caacutec lĩnh vực đa dạng
Hỗ trợ quyết định Caacutec chiacutenh saacutech caacutec quyết định khocircng coacute cấu truacutec ở mức cao vagrave hỗ trợ giaacuten tiếp
Hỗ trợ caacutec quyết định lặp lại caacutec quyết định khocircng thể đoaacuten trước ra quyết định khocircng coacute cấu truacutec vagrave baacuten cấu truacutec
Loại thocircng tin Caacutec thocircng tin tin tức thocircng tin becircn ngoagravei về khaacutech hagraveng đối thủ cạnh tranh mocirci trường caacutec baacuteo caacuteo theo yecircu cầu vagrave định thời về caacutec hoạt động becircn trong
Caacutec thocircng tin hỗ trợ caacutec tigravenh huống đặc biệt
Sử dụng coacute nguyecircn tắc
Dograve theo vết vagrave điều khiển nhận dạng cơ hội
Hoạch định tổ chức phacircn nhoacutem vagrave điều khiển
Khả năng phugrave hợp với những người sử dụng caacute nhacircn
Thiết kế loại ra quyết định cho mỗi người điều hagravenh caacute nhacircn bằng nhiều lựa chọn đầu ra
Cho pheacutep caacutec đaacutenh giaacute caacute nhacircn caacutec khả năng what-if lựa chọn loại hộp hội thoại
Đồ họa Phải coacute Lagrave một phần quan trọng của nhiều DSS
Thacircn thiện người sử dụng
Phải coacute Phải coacute nếu khocircng coacute người sử dụng trung gian
Xử lyacute thocircng tin Lọc neacuten thocircng tin dograve theo vết dữ liệu vagrave thocircng tin quan trọng
EIS kiacutech thiacutech caacutec cacircu hỏi caacutec cacircu trả lời bằng caacutech sử dụng DSS vagrave phản hồi lại EIS
Hỗ trợ caacutec thocircng tin chi tiết
Truy xuất thường xuyecircn caacutec mức chi tiết của bất kỳ thocircng tin tổng hợp nagraveo (duyệt dữ
Coacute thể coacute trong DSS nhưng khocircng thường
liệu chi tiết)Cơ sở mocirc higravenh Caacutec chức năng coacute sẵn bị hạn
chếLagrave điểm cốt lotildei của DSS
Cấu truacutec Theo người baacuten sản phẩm hoặc theo caacutec chuyecircn gia hệ thống thocircng tin
Theo người sử dụng hoặc caacute nhacircn hoặc caacutec chuyecircn gia từ caacutec trung tacircm thocircng tin hoặc phograveng ban hệ thống thocircng tin
Phần cứng Mainframe caacutec trạm RISC mạng LANs hoặc caacutec hệ thống phacircn bố
Mainframe caacutec trạm RISC caacutec maacutey PC hoặc caacutec hệ thống phacircn bố
Bản chất caacutec goacutei phần mềm
Truy xuất tương taacutec dễ dagraveng đến nhiều cơ sở dữ liệu truy xuất trực tuyến caacutec khả năng DBMS phức tạp caacutec liecircn kết phức tạp
Caacutec khả năng tiacutenh toaacuten lớn caacutec ngocircn ngữ mocirc higravenh mocirc phỏng ứng dụng vagrave caacutec bộ tạo DSS
Bản chất caacutec thocircng tin
Trigravenh bagravey thocircng tin được phaacutet sinh trước về quaacute khứ vagrave hiện tại tạo caacutec thocircng tin mới về quaacute khứ hiện tại tương lai
Tạo thocircng tin mới về quaacute khứ hiện tại tương lai
62 Lịch sử EIS- EIS xuất hiện lần đầu tiecircn tại MIT vagraveo những năm 1970
- Những EIS đầu tiecircn được phaacutet triển bởi caacutec doanh ngiệp lớn sẵn sagraveng chấp nhận rủi ro để đạt được lợi thế cạnh tranh
- Vagraveo những năm 1980 caacutec nhagrave cung cấp đatilde phaacutet triển một số cơ sở khaacutech hagraveng rộng vagrave cocircng nghệ EIS được tiếp tục phaacutet triển cho đến ngagravey nay
(Tagravei liệu thecircm Sử dụng DSSEIS cho phaacutet triển bền vững + Một số nghiecircn cứu đatilde được tiến hagravenh để kiểm tra việc thực hiện của EIS trong khu vực cocircng cộng vagrave chiacutenh phủ caacutec nước tổ chức kể từ khi chuacuteng được phaacutet triển theo định hướng lợi nhuận cho caacutec cocircng ty tư nhacircn (Hasan vagrave Hasan năm 1997) Theo một nghiecircn cứu tiến hagravenh tại Mỹ ở hơn 300 cocircng ty kết quả cho thấy sự khaacutec biệt của EIS giữa tư nhacircn vagrave chiacutenh phủ một số kết quả thuacute vị được phaacutet hiệnViacute dụ khoacute khăn hơn để chuyển tiền từ một tagravei khoản khaacutec trong một EIS của chiacutenh phủ cũng lagrave khoacute khăn hơn để biện giải thiacutech cho những chi phiacute phaacutet triển EIS của chiacutenh phủ Một nghiecircn cứu khaacutec được tiến hagravenh ở Australia
cho thấy rằng EIS cung cấp cho quản lyacute một higravenh ảnh chiacutenh xaacutec hơn về tổ chức thực hiện vagrave cung cấp hỗ trợ cho caacutec lợi iacutech chiến lược cải thiện khocircng chỉ cho caacutec nhagrave quản lyacute nhưng cograven cho phần cograven lại của tổ chức Dựa trecircn caacutec hệ thống được thiết kế cho caacutec cocircng ty tư nhacircn với một caacutech rotilde ragravengxaacutec định mục tiecircu EIS lagrave thiacutech hợp cho caacutec tổ chức cocircng cộng hiện đại nhưng cần phải được linh hoạt hơn vagrave kết thagravenh chugravem một phạm vi rộng hơn khả năng vagrave phương tiện hơn so với khu vực tư nhacircn ban đầu theo định hướng sản phẩm (Hasan vagrave Hasan năm 1997) Điều nagravey coacute thể lagrave do thực tế rằng caacutec hoạt động khu vực cocircng lagrave bắt buộc coacute taacutec động rộng phải đaacutep ứng sự mong đợi duy nhất cocircng cộng thường coacute mục tiecircu mơ hồ vagrave macircu thuẫn iacutet quyền tự chủ vagrave kiểm soaacutet việc ra quyết định vagrave nhacircn viecircn lagrave khoacute khăn hơn (Watson vagrave Carte2000) + Toacutem lại EIS lagrave một khaacutei niệm thagravenh cocircng noacute phaacutet triển qua nhiều năm tuy nhiecircn EIS khắc phục khiếm khuyết của migravenh bằng caacutech tiến hagravenh nghiecircn cứu liecircn tục)
63 Tại sao những người điều hagravenh hagraveng đầu lại khaacutec nhau- Họ lagrave những doanh nghiệp theo định hướng coacute suy nghĩ
- Coacute một khoảng khocircng gian rộng để kiểm soaacutet
- Họ chịu traacutech nhiệm cho việc thiết lập chiacutenh saacutech
- Họ đại diện cho tổ chức mocirci trường becircn ngoagravei
- Hagravenh động của họ tạo ra những kết quả đaacuteng kể về tagravei chiacutenh vagrave con người
Tần số caacutec hoạt động điều hagravenh- Xử lyacute xaacuteo trộn 42
- Hoạt động kinh doanh 32
- Phacircn bổ nguồn lực 17
- Đagravem phaacuten 3
- Những điều khaacutec 6
Handling Disturbances 42
Entrepreneurial Activites 32
Resource Allocation 17
Negotiation 3
Other 6
Những thocircng tin điều hagravenh cần thiết- Quản lyacute xaacuteo trộn coacute thể yecircu cầu sự chuacute yacute xung quanh đồng hồ
- Hoạt động kinh doanh yecircu cầu điều hagravenh để dự đoaacuten những thay đổi trong mocirci trường
- Nhiệm vụ phacircn bổ tagravei nguyecircn yecircu cầu lựa chọn người quản lyacute vagrave caacutec nguồn lực hạn chế được triển khai
- Đagravem phaacuten yecircu cầu cập nhật thocircng tin từng phuacutet để coacute thể xacircy dựng được sự đồng thuận
Caacutec loại thocircng tin điều hagravenh- Hệ thống kế toaacuten coacute liecircn quan đến việc tiacutenh toaacuten thu nhập hoạt động cho caacutec lĩnh
vực cụ thể lagrave quan trọng hơn so với caacutec hệ thống kế toaacuten truyền thocircng- Thocircng tin về thị trường khaacutech hagraveng cung cấp giaacute trị trong việc quyết định chiến
lược- Caacutec thocircng tin cần thiết thường được truyền đi trecircn một số hệ thống maacutey tiacutenh vagrave
nằm trong toagraven tổ chức- Caacutec thocircng tin được sử dụng thường lagrave ngắn hạn vagrave dễ thay đổi
Phương thức để xaacutec định thocircng tin cần thiết
Rockart xaacutec định được năm phương thức cơ bản để xaacutec định thocircng tin cần thiết
- Phương thức dựa trecircn kết quả- Phương thức rỗng- Phương thức chỉ số khoacutea- Phương thức tổng hợp nghiecircn cứu- Phương thức dựa vagraveo nhacircn tố then chốt dẫn đến thagravenh cocircng
64 Thagravenh phần EIS
- Sản phẩm EIS đầu tiecircn được phaacutet triển để sử dụng trecircn maacutey tiacutenh cấu higravenh cao nhưng caacutec sản phẩm hiện nay nhằm mục tiecircu lagrave nền tảng ClientServer
- Những nền tảng linh hoạt hơn coacute thể thiacutech ứng với thay đổi trong tổ chức vagrave cocircng nghệ
- Sử dụng dữ liệu thời gian thực dẫn đến quyết định nhanh hơn nhiều thocircng tin hơn
Thagravenh phần phần cứng- Một EIS khocircng đogravei hỏi coacute phần cứng cụ thể hoặc duy nhất nagraveo- Chigravea khoacutea của vấn đề lagrave để đảm bảo rằng caacutec thagravenh phần của EIS tối ưu hoacutea vagrave
phugrave hợp với tagravei nguyecircn maacutey tiacutenh của tổ chức- Hệ thống nagravey phải được cấu higravenh để caacutec nguồn tagravei nguyecircn phugrave hợp với những
người điều hagravenh chuacuteng
Thagravenh phần phần mềm- Traacutei ngược với phần cứng phần mềm thường được chuyecircn mocircn hoacutea cao cho caacutec
bagravei toaacuten về miền- Sự chuyecircn mocircn hoacutea nagravey thường đạt được bằng caacutech sử dụng thagravenh phần off-the-
shelf cho toagraven bộ EIS vagrave caacutec mocirc-đun tugravey chỉnh để đaacutep ứng nhu cầu cụ thể- Lotus Notes lagrave một viacute dụ điển higravenh Noacute coacute thể được sử dụng một migravenh hoặc coacute
thể phục vụ becircn thứ ba mocirc-đun plug-in
Cocircng nghệ EIS hiện nay
Dobrzeniecki đề xuấtphacircn loạitừng cấptheo bachức năng- Loại 1 sản phẩm bao gồmmột bộ đầy đủcaacutec ứng dụngtừ mộtnhagrave cung cấp- Loại 2 sản phẩm đượcthựchiệnở phần đầu củacaacutecsản phẩmDSS đượcphaacutet triển
bởicugravengmộtnhagrave cung cấp- Loại 3 sản phẩmkết hợp với nhautheo bất kỳ số lượngthuộc sở hữu củacocircng ty
65 Xacircy dựng EIS
- Xacircy dựngmộtEISgiống nhưxacircydựngmột số hệ thống khaacutec củamocirc higravenh hệ thống thocircng tin
- Việcphaacutet triểncấu truacutecnecircn được theo dotildeitừ quaacute trigravenh thiết kế đến quaacute trigravenhthực hiện
- Tuy nhiecircn một dự aacuten phaacutet triển EIScoacute xu hướnglagrave thống nhấtvagraveyecircu cầu hỗ trợ caacutec nhagrave quản lyacute latildenh đạo
- Xacircy dựng một EIScoacute thểphaacutet hiện ra đượccaacutectigravenh huống khoacute khănmagravemột nhagrave phaacutet triển chưabao giờ gặp phải
Mocirc higravenh EIS
Khung phaacutet triển một EIS
- Watson et al đề nghị xacircy dựngkhung với ba thagravenh phần+ Caacutech tiếp cận tập trung vagraveo yếu tốcon người vagrave dữ liệu coacute liecircn quan đến EIS+ Quaacute trigravenh phaacutet triển cần sự linh hoạt vagrave tương taacutec+ Người sử dụng - hệ thống hộp thoại bao gồm một ngocircn ngữ hagravenh động để xử lyacute caacutec lệnh
Lợi iacutech của EIS- Dễ duy trigrave caacutec mục tiecircu coacute tổ chức- Dễ truy xuất thocircng tin- Cho pheacutep người sử dụng nacircng cao hiệu suất hơn
- Tăng chất lượng ra quyết định- Cung cấp sự cải tiến cạnh tranh- Tiết kiệm thời gian của người sử dụng- Tăng khả năng vagrave chất lượng giao tiếp- Cung cấp khả năng điều khiển tốt hơn trong tổ chức- Cho pheacutep tham gia caacutec vấn đề vagrave caacutec cơ hội- Cho pheacutep hoạch định- Cho pheacutep tigravem kiếm nguyecircn nhacircn của một vấn đề- Thảo matilden caacutec yecircu cầu của người điều hagravenh
Hạn chế của EIS vagrave 1 số sai lầm cần traacutenh
- Chi phiacute một cuộc khảo saacutetnăm1991 chothấychi phiacute phaacutet triểntrungbigravenh365000USDvớichi phiacute vận hagravenhhagraveng năm lagrave$200000 (EIS)
- Cocircng nghệ hạn chếEIScần phảiđượctiacutech hợp hoagraven toagravenvagraveokiếntruacuteccủadoanh nghiệphiện tại do đoacute noacutelagrave một thaacutech thứclớn đối vớithiết kế
- Hạn chế tổ chức cơ cấu tổ chứccoacute thể khocircng phugrave hợp
Sự hạn chế về tổ chức- Chương trigravenh nghị sự vagrave thời gian chệch EIS mocirc tả một phần việc thực hiện một
chương trigravenh nghị sự vagrave coacute thể dễ dagraveng đạt được sự tin cậy một caacutech chắc chắn- Đồng bộ hoacutea việc quản lyacute sự tin cậy đuacuteng luacutec đặc biệt baacuteo caacuteo EIS coacute thể phaacute
vỡ sự ổn định thiết lập caacutec chu trigravenh baacuteo caacuteo một caacutech tốt nhất- Sự bất ổn EIS phản ứng nhanh coacute thể gacircy ra việc taacutec động trở lại một caacutech
nhanh choacuteng dẫn đến sự thiếu ổn định trong tổ chức
Sự thất bại lagrave thay thế khocircng thể chấp nhận được- Một số yếu tố lagravem EIS thất bại
+ Thiếu sự hỗ trợ về mặt quản lyacute+ Vấn đề chiacutenh trị+ Thất bại của nhagrave phaacutet triển+ Lỗi về cocircng nghệ+ Giaacute cả+ Thời gian
66 Ra quyết định điều hagravenh trong tương lai vagrave EIS
- Coacute một vagravei điều kiện sẽ được hợp nhất cho việc chuyển đổi cocircng nghệ Trong đoacute một vagravei điều kiện coacute thể dễ dự đoaacuten Hai điều kiện magrave ta coacute thể thấy lagrave+ Phaacutet triển cocircng nghệ maacutey tiacutenh trong việc điều hagravenh sẽ tạo ra sự chuyển đổi được chấp nhận một caacutech dễ dagraveng hơn+ Mở rộng traacutech nhiệm điều hagravenh sẽ mở rộng nhu cầu thocircng tin
Tương lai của EIS- EIS thocircng minh Những tiến bộ trong cocircng nghệ AI sẽ được triển khai trong caacutec
EIS- EIS đa phương tiện Cơ sở dữ liệu đa phương tiện sẽ cho pheacutep tiacutech hợp văn bản
giọng noacutei vagrave higravenh ảnh trong tương lai- EIS thocircng tin Tương lai EIS sẽ mở rộng hơn trong việc sử dụng dữ liệu becircn
ngoagravei doanh nghiệp- EIS kết nối Giao tiếp với băng thocircng rộng cho pheacutep kết nối liecircn thocircng lớn hơn
Chương 7 HỆ CHUYEcircN GIA VAgrave TRIacute TUỆ NHAcircN TẠO
71 Caacutec khaacutei niệm
72 Triacute thocircng minh của triacute tuệ nhacircn tạo
73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia
74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia
75 Lợi iacutech vagrave hạn chế của hệ chuyecircn gia
71 Caacutec khaacutei niệm
Chuyecircn mocircn (Expertise) sự hiểu biết rộng trong 1 lĩnh vực hẹp
Hệ chuyecircn gia (Expert Systems)1 chương trigravenh maacutey tiacutenh sử dụng 1 tập caacutec luật dựa trecircn tri thức của con người để giải quyết caacutec vấn đề đogravei hogravei phải coacute sự chuyecircn mocircn
Một số hệ chuyecircn gia nổi tiếng
DENDRAL (Standford 1960s Edward Feigenbaum)
MYCIN (Standford1970s Edward Shortliffe)
PROSPECTOR (MIT 1979)
Triacute tuệ nhacircn tạo (Artificial Intelligence ndash AI)
Triacute tuệ nhacircn tạo một bộ phacircn của ngagravenh khoa học maacutey tiacutenh quan tacircm đến việc thiết kế caacutec hệ thống maacutey tiacutenh thocircng minh đoacute lagrave caacutec hệ thống đưa ra caacutec đặc điểm magrave từ đoacute chuacuteng ta liecircn hệ với sự thocircng minh trong hagravenh động của con người (Barr vagrave Feigenbaum 1981)
Mục điacutech của AI
Mục điacutech khoa học xaacutec định caacutec gợi yacute để giải thiacutech caacutec loại khaacutec nhau của triacute tuệ thực
Mục điacutech kỹ thuật giải quyết caacutec vấn đề trong thế giới thực
Triacute tuệ nhacircn tạo kế thừa nhiều yacute tưởng quan điểm kỹ thuật từ caacutec ngagravenh khoa học khaacutec
- Triết học
- Logic Toaacuten học
- Tiacutenh toaacuten
- Khoa học tacircm lyacute Khoa học nhận thức
- Sinh học Thần kinh học
- Tiến hoacutea
Caacutec lĩnh vực ứng dụng trong Triacute tuệ nhacircn tạo
Mạng nơ ron thần kinh (Neural Networks)
Tiacutenh toaacuten sự tiến hoacutea
(Evolutionary Computation)
Hệ chuyecircn gia (Expert Systems)
Kỹ thuật xử lyacute tiếng noacutei (Speech Processing)
Kỹ thuật xử lyacute ngocircn ngữ tự nhiecircn
(Natural Language Processing)
Lập kế hoạch (Planning)
Robot (Robotics)
Khoa học higravenh ảnh (Vision)
Caacutec kỹ thuật thocircng dụng dugraveng trong AI
Biểu diễn(Representation)
Học (Learning)
Caacutec luật (Rules)
Tigravem kiếm (Search)
72 Triacute thocircng minh của triacute tuệ nhacircn tạo
Con người suy diễn như thế nagraveo
Phacircn loại (Categorization)
Caacutec quy tắc cụ thể
Heuristics
Kinh nghiệm trước đoacute
Dự tiacutenh trước
Maacutey tiacutenh suy diễn như thế nagraveo
Lập luận dựa trecircn luật IF-THEN mocirc tả tri thức được matilde hoacutea dưới dạng caacutec luật
Caacutec khung (Frames) lagrave caacutec đại diện mocirc tả caacutec tigravenh huống giống nhau lagrave điển higravenh của một vagravei phacircn loại
Lập luận dựa trecircn caacutec trường hợp mocirc phỏng giải phaacutep trước đoacute cho một vấn đề hiện tại
Nhận dạng mẫu phaacutet hiện acircm thanh higravenh dạng hoặc caacutec chuỗi dagravei
Caacutec dạng khaacutec của Triacute tuệ nhacircn tạo
Học maacutey- mạng nơron vagrave giải thuật di truyền
Lập trigravenh tự động ndash lagrave những kỹ thuật tạo ra caacutec chương trigravenh để lagravem 1 nhiệm vụ riecircng biệt (cho pheacutep những người khocircng phải lagrave người lập trigravenh coacute thể lập trigravenh được)
Cuộc sống nhacircn tạo ndash nỗ lực để taacutei tạo caacutec hiện tượng sinh học trong caacutec hệ thống dựa trecircn maacutey tiacutenh
73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia(Expert Systems- ES)
Theo Jackson (1999) Một hệ chuyecircn gia lagrave một chương trigravenh maacutey tiacutenh mocirc tả vagrave suy diễn với tri thức của một vagravei lĩnh vực để giải quyết vấn đề hay đưa ra caacutec lời khuyecircn
Cấu truacutec cơ bản của ES được dựa theo cấu truacutec chung của DSS Sự khaacutec biệt chiacutenh giữa ES vagraveDSS lagrave hệ ES thu thập caacutec kiến thức từ những
chuyecircn gia trong lĩnh vực quan tacircmĐặc trưng của hệ chuyecircn gia Hiệu quả cao Thời gian trả lời thỏa đaacuteng Độ tin cậy cao Dễ hiểu
Giao diện người dugraveng trong ES
Thiết kế giao diện người dugraveng tập trung vagraveo caacutec yếu tố như dễ dagraveng sử dụngcoacute độ tin cậy cao giảm tải những khoacute khăn khi sử dụng
Thiết kế necircn coacute một số tương taacutec (đầu vagraveo kiểm soaacutet vagrave truy vấn)
Cấu tạo giao diện người dugraveng gồm coacute magraven higravenh cảm ứng bagraven phiacutem buacutet saacuteng lệnh thoại caacutec phiacutem chuyecircn dụng
Cơ sở tri thức (Knowledge Base)
Chứa đựng caacutec tri thức cụ thể miền thu được từ caacutec chuyecircn gia miền
Coacute thể chứa caacutec mocirc tả caacutec hagravenh vi giải quyết vấn đề caacutec ragraveng buộc caacutec heuristics
Thagravenh cocircng của một ES dựa trecircn tiacutenh đầy đủ vagrave tiacutenh chiacutenh xaacutec của cơ sở tri thức
Mocirc tơ suy diễn (Inference Engine)
Ở đacircy tri thức được đặt để sử dụng tạo ra caacutec giải phaacutep để giải quyết vấn đề
Mocirc tơ nagravey coacute khả năng thực hiện diễn dịch hoặc suy diễn dựa trecircn caacutec luật hay caacutec caacutec sự kiện
Đồng thời cũng coacute khả năng sử dụng caacutec suy diễn mờ hay khocircng chiacutenh xaacutec dựa trecircn xaacutec suất hay aacutenh xạ mẫu
Vograveng điều khiển suy diễn
1 Aacutenh xạ caacutec luật với caacutec sự kiện đatilde được cho
2 Chọn luật để thực hiện
3 Thực hiện luật bằng caacutech thecircm caacutec sự kiện được suy diễn ra vagraveo bộ nhớ lagravem việc
Chuỗi suy diễn (Chaining)
Suy diễn tiến (forward chaining) maacutey suy diễn bắt đầu từ dữ liệu ban đầu vagrave thực hiện việc suy luận để đưa ra caacutec kết luận cuối cugraveng
Suy diễn lugravei (backward chaining) maacutey suy diễn bắt đầu từ dữ liệu điacutech vagrave tigravem ra tri thức hỗ trợ cho dữ liệu điacutech đoacute
Viacute dụ suy diễn lugravei
R1 Nếu coacute A vagrave B thigrave suy ra coacute D
R2 Nếu coacute B thigrave suy ra coacute C
R3 Nếu coacute C vagrave D thigrave suy ra coacute E
Ta coacute E ta xem trong 3 luật R1 R2 R3 luật nagraveo coacute E ta thấy R3 chứa E đồng thời chứa C vagrave D Xeacutet tiếp trong 2 luật R1 R2 luật nagraveo chứa C vagrave D R2 chứa C R3 chứa D Từ đoacute ta coacute được caacutec tri thức hỗ trợ suy diễn vagrave kết luận lagrave nếu coacute A vagrave B thigrave sẽ coacute E Hay nếu A vagrave B đuacuteng thigrave sẽ coacute E
Viacute dụ suy diễn tiến
Giả sử coacute tập chứa 3 luật sau
R1 Nếu coacute A vagrave B thigrave suy ra coacute D
R2 Nếu coacute B thigrave suy ra coacute C
R3 Nếu coacute C vagrave D thigrave suy ra coacute E
Nếu ta coacute A vagrave B thigrave chuacuteng ta suy ra được D từ R1 vagrave suy ra C từ R2 Với D vagrave C đatilde được suy ra ở trecircn giờ chuacuteng ta suy ra được E từ R3
Viacute dụ thực tế
Giả sử muốn biết magraveu của một con vật nuocirci tecircn lagrave Fred biết rằng noacute kecircu ộp ộp vagrave ăn ruồi
Coacute tập 4 luật ban đầu như sau
R1 Nếu X kecircu ộp ộp vagrave ăn ruồi thigrave X lagrave con ếch
R2 Nếu X kecircu chiecircm chiếp vagrave biết hoacutet thigrave X lagrave con chim
R3 Nếu X lagrave con ếch thigrave X coacute magraveu xanh
R4 Nếu X lagrave con chim thigrave X coacute magraveu vagraveng
74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia
Expert system shells lagrave một tập caacutec goacutei phần mềm vagrave caacutec cocircng cụ dugraveng để phaacutet triển caacutec hệ chuyecircn gia
Những Expert system shells đầu tiecircn thường rất rườm ragrave Mặc dugrave vậy noacute vẫn giuacutep cho người sử dụng sẽ khocircng phải bắt đầu lại từ đầu khi xacircy dựng một hệ chuyecircn gia mới
Những shell hiện đại bao gồm hai mocirc-đun chiacutenh lagrave cocircng cụ xacircy dựng một tập quy tắc vagrave mocirc tơ suy diễn
Xacircy dựng hệ chuyecircn gia
Bước 1 xacircy dựng mocirc higravenh bagravei toaacuten xaacutec định vấn đề nhiệm vụ magrave hệ thống sẽ thực hiện Caacutec dạng bagravei toaacuten cần hệ chuyecircn gia
Bagravei toaacuten diễn giải (InterPretation)
Bagravei toaacuten dự baacuteo (Prediction)
Bagravei toaacuten chuẩn đoaacuten (Diagnose)
Bagravei toaacuten gỡ rối (Debugging)
Bagravei toaacuten thiết kế
Tương tự như một dự aacuten phần mềm để xacircy dựng một hệ chuyecircn gia cần phải coacute caacutec yếu tố về nhacircn lực tagravei nguyecircn vagrave thời gian Những yếu tố nagravey ảnh hưởng đến giaacute thah của một hệ chuyecircn giaTrong phần nagravey cacircu hỏi thường được đặt ra lagrave tại sao cần phải xacircy dựng một hệ chuyecircn giaTrước khi bắt đầu phải xaacute định rotilde bagravei toaacuten đạt ra lagrave jiAi lagrave chuyecircn giaAi lagrave người sử dụng
1 Diễn giải (InterPretation) Nghiecircn cứu 1 vấn đề -gt Dựa trecircn những biểu hiện thuộc tiacutenh đặc trưng becircn ngoagravei -gt Tư vấn
(hoặc đưa ra kết luận hay mocirc tả dễ hiểu từ tập dữ liệu thocirc)
2 Bagravei toaacuten dự baacuteo (Prediction) Coacute thể dự đoaacuten được hagravenh vi kết quả dựa trecircn caacutec hiện tượng -gt dự baacuteo
VD Dự baacuteo thời tiết động đấthellip
3 Bagravei toaacuten chẩn đoaacuten (Diagnoss) Xaacutec định caacutec lỗi caacutec bộ phận hỏng hoacutec của hệ thống dựa trecircn caacutec dữ liệu quan saacutet được
4 Bagravei toaacuten gỡ rối (Debugging) Mocirc tả caacutec phương phaacutep khắc phục hệ thống khi gặp sự cố
5 Bagravei toaacuten thiết kế Lựa chọn cấu higravenh caacutec đối tượng nhằm thoả matilden một số ragraveng buộc nagraveo đoacute
6 Giảng dạy Phần mềm dạy học coacute thể chuẩn đoaacuten vagrave sủa lỗi của học sinh trong quaacute trigravenh học tập
Để xaacutec định đuacuteng bagravei toaacuten magrave chuacuteng ta cần giải quyết thigrave phải trả lời đc một số cacircu hỏi
- cần hệ chuyecircn gia
Bước 2 thu thập tri thức lựa chọn cocircng cụ vagrave aacutep dụng
Trong bước thu thập tri thức vấn đề quan trọng lagrave lựa chọn chuyecircn gia những người magrave sẽ đoacuteng goacutep tri thức cho hệ thống Thocircng thường trong suốt quaacute trigravenh phaacutet triển thigrave chuyecircn gia được xem như một thagravenh viecircn của đội phaacutet triển
Hiện nay coacute rất nhiều cocircng cụ để xacircy dựng một hệ chuyecircn gia Phổ biến nhất lagrave JESS CLIPS vagrave OPS5
Bước 3 Thiết kế cơ sở tri thức thiết kế hệ thốngTri thức được biểu diễn trường minh trong cơ sở tri thức
Caacutec chuyecircn gia vagrave kỹ sư tri thức sẽ đối thoại với nhau bằng caacutec kỹ thuật đối thoại Suy diễn (SD) bảng Mocirc higravenh hoacutea SD quy nạp phacircn loại
Vấn đề bagraveo trigrave vagrave phaacutet triển
Caacutec hệ chuyecircn gia đogravei hỏi phải bảo trigrave vagrave phaacutet triển nhiều hơn so với caacutec hệ thống khaacutec Phải thường xuyecircn bổ sung tri thức mới vagrave thay đổi caacutec tri thức cũ để đổi mới hệ chuyecircn gia
Thu thập vagrave khắc phục lỗi do người sử dụng phaacutet hiện để kịp thời khắc phục những sai soacutet của hệ chuyecircn gia
75 Lợi iacutech vagrave hạn chế của caacutec hệ chuyecircn gia
Một số lợi iacutech chiacutenh
Thời gian trả lời hợp lyacute bằng hoặc nhanh hơn so với chuyecircn gia (người) để đi đến cugraveng một quyết định Hệ chuyecircn gia lagrave một hệ thống thời gian thực (real time system)
Khả năng trả lời với mức độ tinh thocircng bằng hoặc cao hơn so với chuyecircn gia (người) trong cugraveng lĩnh vực
Hệ chuyecircn gia giuacutep cho hiệu quả lagravem việc tăng bằng việc sử dụng tập caacutec luật một caacutech nhanh choacuteng magrave ko bị nhầm lẫn chuyecircn gia lagrave người coacute thể quecircn đi một số tri thức cơ sở lyacute luậ nhưng HCG thigrave ko
Quyết định của một người chuyecircn gia coacute thể bị thay đổi vagrave ko coacute tiacutenh thống nhất như quyết định của một hệ chuyecircn gia tạo ra
Hệ chuyecircn gia giuacutep cho người sử dụng coacute thể trau dồi sự hiểu biết trecircn lĩnh vuej cụ thể magrave noacute giải quyết hỗ trợ người ra quyết định coacute trigravenh độ như 1 chuyecircn gia trong quaacute trigravenh gia quyết định
Kiến thức của rất nhiều chuyecircn gia về một lĩnh vực nagraveo đoacute được đưa vagraveo hệ chuyecircn gia lagravem cho CSTT cuat HCG phong phuacute vagrave rộng lớn hơn rất nhiều
HCG giải thiacutech caacutec bước suy luận một caacutech dễ hiểu nhất quaacuten luacutec nagraveo cũng coacute thể sử dụng ko như chuyecircn gia con người
Hạn chế của caacutec hệ chuyecircn gia
Nhược điểm lớn nhất của hệ chuyecircn gia lagrave những yacute kiến chuyecircn mocircn thường rất khoacute matilde hoacutea vagrave giải neacuten
Hệ chuyecircn gia khocircng coacute khả năng tự học tự cập nhật kiến thức mới như caacutec chuyecircn gia magrave cần phải được matilde hoacutea lại khi noacute được cập nhật
Hệ chuyecircn gia khocircng thể nhận ra được vấn đề khocircng nằm trong miền kiến thức của hệ thống
Chương 8 Tri thức vagrave tiếp nhận
1 Bao gồm caacutec vấn đề
Dữ liệu thực tế đo lường hoặc quan saacutet coacute hoặc khocircng coacute bối cảnh
Thocircng tin dữ liệu được tổng hợp một caacutech hữu iacutech để giải quyết những khoacute khăn trong việc đưa ra quyết định
Tri thức bao gồm caacutec ứng dụng quy tắc thocircng tin hướng dẫn của người ra quyết định
2 Những caacutei nhigraven về tri thức
Đại diện lagravem thế nagraveo để diễn tả tri thức viacute dụ như một quyển saacutech khocircng phải lagrave tri thức nhưng noacute lại lagrave một đại diện của tri thức
Sản xuất tri thức lagrave một tập hơp của hagraveng tồn kho coacute thể được sản xuất cũng như mua lại
Tri thức lagrave 1 trong 6 trạng thaacutei của hệ thống
1Dữ liệu 2Thocircng tin 3Cấu truacutec thocircng tin 4Sự thấu hiểu 5Yacute kiến 6 Quyết định
3 Caacutec loại tri thức Phổ biến mocirc tả dữ liệu thocircng tin thủ tục mọi thứ lagravem như thế nagraveo lập luận chiacutenh saacutech hoặc caacutec quy tắc
4 Thu thập Tri thức hệ chuyecircn gia Hầu hết caacutec phương phaacutep đều bắt đầu với mocirc higravenh của caacutec taacutec vụ trong đoacute
hệ chuyecircn gia được xacircy dựng Trong đoacute mocirc tả về caacutec lĩnh vực được tạo ra Caacutec kỹ sư sử dụng caacutec mocirc higravenh giả thuyết vagrave nhận thức về quaacute trigravenh phacircn
tiacutech để gợi ra caacutech giải quyết vấn đề về tri thức từ caacutec chuyecircn gia
5 Caacutec chiều của thu thập tri thức KE- driven caacutec kỹ sư trao đổi trực tiếp với caacutec chuyecircn gia Expert-driven Caacutec chuyecircn gia trực tiếp đưa chuyecircn mocircn của họ vagraveo hệ
thống maacutey tiacutenh Machine-driven Sử dụng caacutec cocircng cụ suy luận để triacutech xuất tri thức từ một
tập caacutec viacute dụ
6 Kỹ thuật thu thập tri thức Trao đổi gồm 2 loại cơ bản lagrave coacute cấu truacutec(coacute kịch bản) vagrave khocircng coacute cấu
truacutec( đối thoại trực tiếp) Giao thức phacircn tiacutech bằng lời Khi caacutec chuyecircn gia thực hiện một cocircng việc
của họ thigrave một bản ghi về cocircng việc đoacute được thực hiện Caacutec kỹ sư sẽ xacircy dựng mocirc higravenh cho những gigrave được ghi lại trong bản ghi
Phương phaacutep sagraveng lọc caacutec chuyecircn gia so saacutenh caacutec nhoacutem liecircn tiếp trong ba đối tượng vagrave cho biết tại sao nhoacutem thứ hai lại khaacutec nhoacutem thứ ba
7 Thu thập tri thức từ nhiều nguồn Thu thập tri thức từ nhiều nguồn lagrave cần thiết để coacute được đầy đủ caacutec tri thức
cho một vấn đề quan điểm yacute kiến traacutei ngược nhau thường phaacutet sinh Phương phaacutep đồng thuận sẽ giuacutep giải quyết được vấn đề macircu thuẫn Kỹ thuật phacircn tiacutech Meta lagrave kỹ thuật được aacutep dụng trong caacutec trường hợp
khaacutec Caacutech tiếp cận bằng định lượng đogravei hỏi caacutec kỹ sư cần cacircn nhắc yếu tố đầu vagraveo của caacutec chuyecircn gia khaacutec nhau
8 Xaacutec nhận hợp lệ vagrave kiểm tra tri thức Một khi thu thập tri thức noacute phải được đaacutenh giaacute về khả năng sử dụng vagrave độ
chiacutenh xaacutec Hai vấn đề cụ thể lagrave hiệu lực của những kiến thức vagrave kiểm tra việc xacircy dựng cơ sở của tri thức
Cần xaacutec nhận xem liệu hệ thống coacute thể hoạt động ở mức độ tối thiểu khocircng
Xaacutec minh liecircn quan đến việc so saacutenh từng chi tiết kỹ thuật của hệ thống những gigrave đatilde được thực hiện cuối cugraveng
9 Một số caacutec biện phaacutep xaacutec nhận Độ chiacutenh xaacutec Khả năng thiacutech nghi Mức độ đầy đủ Bề rộng Độ sacircu Hiệu lực Tổng quan Chiacutenh xaacutec Hiện thực Độ tin cậy Tiacutenh hữu dụng Mức độ
Chương 9 Học maacutey
1 Logic mờ vagrave ngocircn ngữ mờ(Fuzzy Logic and Linguistic Ambiguity)
Ngocircn ngữ tự nhiecircn gồm những khaacutei niệm mơ hồ vagrave khocircng chiacutenh xaacutectruyền tải ngữ nghĩa thocircng qua tiacutenh xấp xỉkhocircng rotilde ragraveng
Những xấp xỉ nagravey giuacutep con người coacute thể truyền tải hết được yacute nghĩa nhưng maacutey thigrave khocircng hiểu
Lagravem sao biểu diễn caacutec tri thức sử dụng caacutec khaacutei niệm khocircng rotilde ragraveng(mờ) hoặc khocircng chiacutenh xaacutec
2 Khaacutei niệm cơ bản của logic mờ tập mờ lagrave những tập hợp khocircng coacute một giới hạn rotilde Mỗi phần tử của noacute chỉ
chứa một mức độ hagravem liecircn thuộc của từng phần tử Vigrave vậy tập mờ khocircng giống như tập cổ điển Tập mờ coacute thể kết hợp với nhau qua những luật mờ magrave đặc trưng cho những hagravenh động trạng thaacutei vagrave thuộc tiacutenh của logic mờ được tận dụng khi thực hiện một bộ điều khiển mờ
Logic mờ dựa trecircn yacute tưởng mỗi phần tử thuộc vagraveo một tập hợp ở một mức độ nagraveo đấy
Locircgic mờ cho pheacutep độ liecircn thuộc (microA )coacute giaacute trị trong khoảng (01) Locircgic mờ coacute thể được coi lagrave mặt ứng dụng của lyacute thuyết tập mờ để xử lyacute caacutec
giaacute trị trong thế giới thực cho caacutec bagravei toaacuten phức tạp
3 So saacutenh tiacutenh đuacuteng đắn logic mờ vagrave xaacutec suất Xaacutec suất thigrave đề cập đến khả năng xảy ra một biến cố hay một điều gigrave đoacute Logic mờ đề cập đến cấp độ magrave đặc tiacutenh ở hiện tại
o viacute dụ1 người coacute chiều cao 6 feet thigrave coacute cấp độ lagrave 05 về chiều cao
4 Ưu điểm của logic mờ Caacutech tiếp cận rất tự nhiecircnkhocircng phức tạp Coacute thể mocirc higravenh hoacutea caacutec hagravem phi tuyến tugravey yacute phức tạp
Coacute thể tận dụng được kinh nghiệm từ những chuyecircn gia hagraveng đầu trong mọi lĩnh vực
Logic mờ được xacircy dựng dựa trecircn ngocircn ngữ tự nhiecircnNền tảng của logic mờ lagrave dựa trecircn cơ sở giao tiếp của con người
5 Nhược điểm của logic mờ Trong 1 hệ thống phức tạpsử dụng logic mờ coacute thể trở thagravenh trở ngại cho
việc xaacutec thực độ tin cậy của hệ thống Cơ chế lập luận mờ khocircng thể học hỏi từ những lỗi sai
6 Mạng noron nhacircn tạo(ANN) Mạng noron nhacircn tạo lagrave một mocirc phỏng xử lyacute thocircng tinđược nghiecircn cứu ra
từ hệ thống thần kinh của sinh vậtgiống như bộ natildeo để xử lyacute thocircng tin ANNs lagrave chương trigravenh dựa trecircn maacutey tiacutenh đơn giản coacute chức năng lagrave một mocirc
higravenh bagravei toaacuten khocircng gian dựa trecircn thử nghiệm vagrave baacuteo lỗi
7 Học từ kinh nghiệm Tiến trigravenh Một mẫu dữ liệu được biểu diễn như một mạng lưới noronANN ldquodự
đoaacutenrdquo 1 đầu radự đoaacuten được so saacutenh với giaacute trị thực tế hoặc giaacute trị chiacutenh xaacutecNếu đoaacuten được chiacutenh xaacutec thigrave khocircng coacute hagravenh động nagraveo được thực hiện
Nếu dự đoaacuten sai ANN kiểm tra lại vagrave xaacutec định lại thocircng số để điều chỉnh Một mẫu dữ liệu khaacutec được biểu diễn vagrave quaacute trigravenh nagravey được lặp lại
8 Nguyecircn tắc cơ bản của cocircng nghệ nơron Caacutec yếu tố xử lyacute cơ bản trong hệ thống thần kinh của con người lagrave tế bagraveo
thần kinhMạng lưới của tế bagraveo nagravey lagrave liecircn kết với nhau nhận được thocircng tin từ caacutec cảm biến trong mắt taihellip
Thocircng tin nhận được bởi tế bagraveo thần kinh hoặc lagrave sẽ kiacutech thiacutech noacute(sẽ được chuyển qua 1 thocircng điệp dọc theo mạng lưới) hoặc lagrave sẽ ngăn cản noacute(ngăn cản dograveng thocircng tin)
Độ nhạy coacute thể thay đổi qua thời gian hoặc sau khi coacute được kinh nghiệm
9 Cấu truacutec mạng Một ANN gồm 3 lớp cơ bản
Lớp đầu vagraveo nhận dữ liệu Lớp becircn trong hoặc lagrave lớp ẩn xử lyacute dữ liệu Lớp đầu ra chuyển tiếp kết quả cuối cugraveng của mạng
10Mạng nơ ron Thường coacute nhiều đầu vagraveo mỗi đầu vagraveo với mức ảnh hưởng vagrave tầm quan
trọng riecircng của noacute Một đầu vagraveo quan trọng coacute thể được sử dụng để khuếch đại đầu ra caacutec hagravem trạng thaacutei tổng hợp caacutec trọng số của caacutec yếu tố
đầuvagraveo khaacutec nhauvagraveo một giaacute trị duy nhất Caacutec hagravem chuyển giao xử lyacute caacutec giaacute trị trạng thaacutei vagrave tạo đầu ra
11Huấn luyện mạng nơ ron Trong mocirc higravenh coacute giaacutem saacutetANN được đến so saacutenh dự đoaacuten của chiacutenh
noacute với thocircng tin phản hồi coacute chứa caacutec kết quả mong muốn ANN sẽ phải tigravem caacutech thay đổi caacutec tham số becircn trong củamigravenh (caacutec trọng số vagrave caacutec ngưỡng) để tạo necircn một aacutenh xạ coacute khả năng aacutenh xạcaacutec đầu vagraveo thagravenh caacutec đầu ra mong muốn Sự thay đổi nagravey được tiến hagravenh nhờ việc so saacutenh giữa đầu ra thực sự vagrave đầu ra mong muốn
Trong mocirc higravenh khocircng coacute giaacutem saacutetANN nhận được dữ liệu vagraveo nhưng khocircng phải coacute bất kỳ thocircng tin phản hồi về kết quả mong muốn
Phần lớn caacutec ứng dụng nằm trong vugraveng của caacutec bagravei toaacuten ước lượng như mocirc higravenh hoacuteathống kecirc neacuten lọc phacircn cụm
12Lợi iacutech Liecircn kết với mạng noron Traacutenh caacutech lập trigravenh tường minh Giảm nhu cầu của chuyecircn gia ANNs thigrave thiacutech nghi với caacutec yếu tố đầu vagraveo thay đổi Khocircng cần thiết cho cơ sở tri thức tinh chế ANNs coacute tiacutenh động vagrave cải thiện với việc sử dụng Coacute khả năng xử lyacute dữ liệu khocircng chiacutenh xaacutec hoặc khocircng đầy đủ Cho pheacutep tổng quaacutet hoacutea từ thocircng tin cụ thể Cho pheacutep thu thập cảm giaacutec thocircng thường vagraveo miền giải quyết vấn đề
13Hạn chế của việc liecircn kết với mạng noron ANNs khocircng thể giải thiacutech được suy luận Bản chất hộp đen thường khiến cho vấn đề traacutech nhiệm vagrave độ tin cậy phaacutet
sinh lagrave khoacute khăn Lặp đi lặp lại quaacute trigravenh huấn luyện rất tốn thời gian Nguồn lực caacutec nhagrave phacircn tiacutech vagrave thiết kế coacute tay nghề cao vẫn lagrave đaacuteng lo
ngại Cocircng nghệ ANN thuacutec đẩy hạn chế của phần cứng hiện tại ANN yecircu cầu phải coacute sự tin tưởng ở đầu ra
14Giới thiệu về thuật toaacuten di truyền Cũng như mạng lưới thần kinh caacutec thuật toaacuten di truyền được dựa trecircn lyacute
thuyết sinh học Thuật toaacuten di truyền tigravem thấy nguồn gốc của chuacuteng trong caacutec lyacute thuyết
tiến hoacutea của chọn lọc tự nhiecircn vagrave thiacutech ứng với biến đổi khiacute hậu Kết quả thuật toaacuten di truyền lagrave từ giao phối 2 caacute thể trong quần thế để tạo
ra con caacutei đocirci khi tốt hơn so với bậc cha mẹ của chuacuteng 15Caacutec thagravenh phần cơ bản của thuật toaacuten di truyền
Toaacuten tử chọn lọc Caacutec caacute thể tốt được chọn lọc để đưa vagraveo thế hệ sau Sự chọn lọc nagravey căn cứ vagraveo độ thiacutech nghi với mocirci trường của mỗi caacute thể
Toaacuten tử lai gheacutep (crossover) Hai caacute thể cha vagrave mẹ trao đổi caacutec gen với nhau để tạo ra caacute thể con
Toaacuten tử đột biến (mutation) Một caacute thể thay đổi một số gen để biến đổi thagravenh một caacute thể mớiTất cả caacutec toaacuten tử trecircn khi thực hiện đều mang tiacutenh ngẫu nhiecircn
16Quaacute trigravenh cơ bản của một thuật toaacuten di truyền Khởi tạo
Đaacutenh giaacute quần thể
Lựa chọn NST thiacutech hợp nhất vagrave loại bỏ NST yếu nhất
Quy trigravenh giao nhau vagrave cải thiện quần thể
đột biến tiến trigravenh để khaacutem phaacute ra NST mới
17Ưu nhược điểm của việc kết hợp với thuật toaacuten di truyền Kiacutech thước quần thể lagrave 1 yếu tố quan trọng trong tốc độ của việc tigravem
kiếmnhưng noacute tương đối dễ dagraveng để dự đoaacuten tốc độ nagravey Giao nhau hoặc đột biến lagrave khocircng necircn đc sử dụng quaacute thường xuyecircn Luocircn coacute được iacutet nhất 1 giải phaacutep hợp lyacute Necircn coacute thể aacutep dụng chuacuteng cho caacutec vấn đề magrave chuacuteng ta khocircng coacute hướng
về caacutech giải quyết Sức mạnh của thuật toaacuten xuất phaacutet từ khaacutei niệm đơn giảnkhocircng phải từ
một thủ tục thuật toaacuten phức tạp 18Tương lai của học maacutey
Mạng lưới thần kinh nhacircn tạo vượt quaacute năng lực của con người trong caacutec trường hợp bị cocirc lập
Về mặt lyacute thuyếtmột maacutey tiacutenh coacute thể xử lyacute dũ liệu nhanh hơn hagraveng triệu lần so với 1 con người
May mắn thay cho chuacuteng tacon người tốt hơn nhiều khi magrave coacute được dữ liệumaacutey tiacutenh khocircng coacute 1 số thứ như lagrave 5 giaacutec quan
CHƯƠNG 10 KHO DỮ LIỆU
1 Kho dữ liệu Kho dữ liệu lagrave tuyển tập caacutec cơ sở dữ liệu tiacutech hợp hướng chủ đề được
thiết kế để trợ giuacutep cho một hệ hỗ trợ quyết định
Theo John Ladley Cocircng nghệ kho dữ liệu lagrave tập caacutec phương phaacutep kỹ thuật vagrave caacutec cocircng cụ coacute thể kết hợp hỗ trợ nhau để cung cấp thocircng tin cho người sử dụng trecircn cơ sở tiacutech hợp từ nhiều nguồn dữ liệu nhiều mocirci trường khaacutec nhau
Kho dữ liệu thường rất lớn tới hagraveng trăm GB hay thậm chiacute hagraveng Terabyte
2 Kho dữ liệu vận hagravenh (ODS) Một kho dữ liệu vận hagravenh Aacutep dụng kỹ thuật kho dữ liệu vagraveo caacutec hệ xử
lyacute giao taacutec lưu trữ dữ liệu cho một ứng dụng đặc thugrave Noacute đưa vagraveo kho dữ liệu một dograveng caacutec dữ liệu thocirc được thiết kế
3 So saacutenh
Kho dữ liệu vận hagravenh Kho dữ liệu
Dữ liệu theo chủ đề Dữ liệu theo chủ đề
Dữ liệu tiacutech hợp Dữ liệu tiacutech hợp
Dữ liệu thay đổi Dữ liệu khocircng thay đổi
Dữ liệu được cập nhật khi thay đổi
Dữ liệu giữ nguyecircn
Chỉ coacute dữ liệu hiện tạiDữliệu hiện tại vagrave dữ liệu lịch sử
Chu kỳ lagravem tươi dữ liệu ngắn Chu kỳ lagravem tươi dữ liệu dagravei
Chỉ coacute dữ liệu chi tiết Dữ liệu chi tiết vagrave dữ liệu tổng kết
Dugraveng cho caacutec quyết định ngắn hạn
Dugraveng cho hoạch định dagravei hạn
4 Kho dữ liệu cục bộ (Data Mart - DM)
Kho dữ liệu cục bộ lagrave CSDL coacute những đặc điểm giống với kho dữ liệu nhưng với quy mocirc nhỏ hơn vagrave lưu trữ dữ liệu về một lĩnh vực một chuyecircn ngagravenh
Data mart phụ thuộc Chứa những dữ liệu được lấy từ DW vagrave những dữ liệu nagravey sẽ được triacutech lọc vagrave tinh chế tiacutech hợp lại ở mức cao hơn để phục vụ một chủ đề nhất định của Datamart
Data mart độc lập Khocircng giống như Datamart phụ thuộc Data mart độc lập được xacircy dựng trước DW vagrave dữ liệu được trực tiếp lấy từ caacutec nguồn khaacutec nhau
5 Siecircu dữ liệu Metadata lagrave dữ liệu để mocirc tả dữ liệu Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột
một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi Metadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu
6 Mocirci trường kho dữ liệu Hệ thống của tổ chức vagrave kho cung cấp dữ liệu để xacircy dựng kho dữ liệu Trong quaacute trigravenh chuyển dữ liệu từ caacutec nguồn khaacutec nhau dữ liệu coacute thể
được lagravem sạch hoặc chuyển đổi vagrave vigrave thế DW được xem như lagrave một chuẩn cho việc lưu trữ
Đồng thời siecircu dữ liệu được ghi lại Cuối cugraveng DW hoặc siecircu thị coacute thể được sử dụng để tạo ra một kho dữ
liệu ldquocaacute nhacircnrdquo 7 Caacutec đặc điểm của kho dữ liệu
Đặc điểm Mocirc tả
Hướng chủ đề - DL tổ chức theo caacutech thức người dugraveng tham chiếu
Tiacutech hợp - Dữ liệu ldquosạchrdquo loại bỏ tiacutenh thiếu nhất quaacuten
Khocircng thay đổi - DL ldquochỉ đọcrdquo người dugraveng khocircng thay đổi được
Chuỗi thời gian - DL lagrave chuỗi thời gian khocircng phải lagrave trạng thaacutei hiện tại
Được tổng kết - DL vận hagravenhthao taacutec khi cần thiết
được kết hợp lại thagravenh dạng coacute thể dugraveng được cho quyết định
Kiacutech cỡ lớn hơn - Lưu giữ theo chuỗi thời gian tức lagrave giữ lại nhiều DL
Khocircng được chuẩn hoacutea - Coacute thể dư thừa DLSiecircu dữ liệu - Dữ liệu của dữ liệu được lưu trữNguồn dữ liệu - DL vận hagravenh (caacutec hệ sẵn coacute) cugraveng
với caacutec nguồn ngoagravei 8 Kho dữ liệu hướng chủ đề
Hướng chủ để coacute nghĩa lagrave kho dữ liệu được tổ chức xung quanh caacutec chủ đề chiacutenh như khaacutech hagraveng sản phẩm sản xuất Tập trung vagraveo việc mocirc higravenh hoacutea vagrave phacircn tiacutech dữ liệu cho caacutec nhagrave ra quyết định magrave khocircng tập trung vagraveo caacutec xử lyacute thocircng thường Cung cấp cho người dugraveng một khung nhigraven toagraven vẹn đơn giản vagrave đầy đủ về caacutec sự kiện quanh caacutec chủ đề
9 Dữ liệu trong DW được tiacutech hợp Dữ liệu trong kho dữ liệu được xacircy dựng bằng caacutech tổng hợp dữ liệu từ
nhiều nguồn khaacutec nhau vagrave caacutec nguồn coacute tổ chức khaacutec nhau Cơ sở dữ liệu caacutec file excel caacutec flat file hoặc caacutec raw file Khi đưa vagraveo kho dữ liệu caacutec dữ liệu được lagravem sạch vagrave tiacutech hợp dữ liệu nhằm đảm bảo tiacutenh nhất quaacuten của dữ liệu
10Kiến truacutec kho dữ liệu Tầng cơ sở dữ liệu hoạt động Tầng truy xuất thocircng tin Tầng truy xuất dữ liệu Tầng siecircu dữ liệu Tầng quản lyacute tiến trigravenh Tầng thocircng điệp của ứng dụng Tầng vật liacute của kho dữ liệu Tầng trigravenh diễn dữ liệu
11Higravenh trạng kho dữ liệu Kho dữ liệu ảo - người dugraveng cuối coacute thể truy cập trực tiếp đến kho dữ liệu
sử dụng caacutec cocircng cụ cho pheacutep ở tầng truy xuất dữ liệu Kho dữ liệu trung tacircm-1 cơ sở dữ liệu vật lyacute chứa tất cả dữ liệu cho một
vugraveng chuyecircn dụng nagraveo đoacute
Kho dữ liệu phacircn taacuten- Thagravenh phần được phacircn taacuten qua nhiều hệ cơ sở dữ liệu vật lyacute
12METADATA- Siecircu dữ liệu Định nghĩa Siecircu dữ liệu lagrave dữ liệu về dữ liệu Lagrave 1 lưu trữ dugraveng để
Miecircu tả kho dữ liệu tổng thể Nhận dạng kiểu kho dữ liệu Quản liacute quaacute trigravenh tiacutech hợp dữ liệu Quản liacute quaacute trigravenh cập nhật kho dữ liệu Quản liacute bảo mật
Lagrave chigravea khoacutea quyết định sự thagravenh cocircng của kho dữ liệu luocircn được thay đổi vagrave cập nhật theo sự phaacutet triển của kho dữ liệu
Dugraveng để quản liacute điều khiển kho dữ liệu Sự ra đời của kho dữ liệu như 1 cấu truacutec hỗ trợ ra quyết định siecircu dữ liệu
được xem như nguồn tagravei nguyecircn dữ liệu Siecircu dữ liệu lagrave trừu tượng Chuacuteng lagrave dữ liệu bậc cao cung cấp mocirc tả ngắn
gọn caacutec dữ liệu bậc thấp hơn 13Hoạt động của Siecircu dữ liệu
Siecircu dữ liệu rất cần thiết trong việc chuyển hoacutea thocircng tin trở thagravenh tri thức Lagrave chigravea khoacutea giuacutep chuacuteng ta xử lyacute được dữ liệu thocirc Viacute dụ một dograveng dữ liệu baacuten hagraveng 1023 K596 11121 agraveNoacute sẽ khocircng coacute nghĩa gigrave cho đến khi chuacuteng ta đưa vagraveo siecircu dữ liệu (thư
mục chứa dữ liệu) agrave cửa hagraveng 1023 sản phẩm K596 vagrave số tiền baacuten được lagrave 11121 đocirc la
14Sự cần thiết phải nhất quaacuten trong kho dữ liệu Kho dữ liệu được xacircy dựng cho lợi iacutech của những nhagrave phacircn tiacutech kinh
doanh caacutec nhagrave quản trị cho tất cả caacutec khu vực chức năng Trong cơ sở dữ liệu riecircng caacutec khu vực khaacutec nhau coacute thể định nghĩa vagrave lưu
trữ dữ liệu thocircng qua phiecircn bản của chiacutenh noacute Khi dữ liệu được lấy từ những vugraveng khaacutec nhau đoacute vagrave được đặt vagraveo kho dữ
liệu Việc chuyển đổi vagrave lagravem sạch caacutec tiến trigravenh sẽ đảm bảo noacute lagrave duy nhất được tiacutech hợp tại một mức của tổ chức
15Ragrave soaacutet lại dữ liệu ndash Thực thi siecircu dữ liệu
Bất kể cấu truacutec tự nhiecircn của 1 cacircu truy vấn thế nagraveo thigrave caacutec thagravenh phần của siecircu dữ liệu rất quan trọng đối với người ra quyết định
Bảng thuộc tiacutenh khoacutea được lưu trữ bởi kho dữ liệu Tập hợp dữ liệu được lấy từ đacircu Những chuyển đổi nagraveo được thực thi với việc lagravem sạch
16Siecircu dữ liệu lagrave gigrave Metadata - lagrave thocircng tin mocirc tả nội dung của cơ sở dữ liệu (CSDL) Metadata baacuteo cho người dugraveng biết thời gian cập nhật sau cugraveng của dữ liệu
định dạng vagrave mục điacutech sử dụng của noacute Những thocircng tin nagravey coacute thể hướng dẫn người dugraveng duyệt qua CSDL vagrave
giuacutep họ hiểu được yacute nghĩa vagrave ngữ cảnh của dữ liệu Trong CSDL metadata lagrave caacutec dạng biểu diễn khaacutec nhau của caacutec đối tượng
trong CSDL Trong CSDL quan hệ metadata lagrave caacutec định nghĩa của bảng cột CSDL
view vagrave nhiều đối tượng khaacutec Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột
một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi -gtMetadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu
Bảng chuyển đổi Ghi lại những chuyển đổi đatilde được thực hiện
Lịch sử thực thi Ghi lại những dữ liệu đatilde được
phacircn tiacutech
Higravenh thaacutei kết nốiGhi lại những dữ liệu được kết nối vagrave tần suất
17Aacutenh xạ thocircng thường của siecircu dữ liệu Bản ghi aacutenh xạ chuyển đổi bao gồm
Định danh của nguồn gốc Chuyển đổi thuộc tiacutenh Chuyển đổi thuộc tiacutenh vật lyacute Matilde hoacutea tham chiếu bảng chuyển đổi Đổi tecircn Đổi khoacutea Gaacuten giaacute trị cho thuộc tiacutenh mặc định Chọn logic cho caacutec nguồn nhiều giaacute trị Đổi thuật toaacuten
18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để
phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai
lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave
tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec
Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm
Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo
19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua
caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau
SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được
Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra
một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức
Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ
Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ
Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech
CHƯƠNG 11 KHAI PHAacute DỮ LIỆU
1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn
ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993
Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng
2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd
1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều
2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP
3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn
4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng
5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server
6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo
7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động
8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời
9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều
10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện
11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech
12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP
3 Xử lyacute phacircn tiacutech trực tuyến OLAP
MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave
dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu
ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave
thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu
HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave
ROLAP4 Khai phaacute dữ liệu
Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh
khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn
Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan
5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp
6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại
Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp
Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec
Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt
Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra
Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh
vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho
Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec
Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm
Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục
Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng
gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp
Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn
Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec
Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper
Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2
Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25
Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước
Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng
Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện
trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp
Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute
độ hỗ trợ ge ngưỡng minsup
độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan
Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn
Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết
Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu
MOLAP ROLAP HOLAP
Lưu trữ dữ liệu cơ sở
Khối Bảng quan hệ Bảng quan hệ
Lưu trữ thocircng tin tổng hợp
Khối Bảng quan hệ Khối
Hiệu suất thực hiện truy vấn
Nhanh nhất Chậm nhất Nhanh
Tiecircu thụ khocircng gian lưu trữ
Nhiều Thấp Trung bigravenh
Chi phiacute bảo trigrave Cao Thấp Trung bigravenh
bull Lagrave một tiếp cận giuacutep tigravem ra caacutec giải phaacutep khả thithỏa matildenđủ tốt cho caacutec bagravei toaacuten phức tạp Coacute thể coacute giải phaacutep đủ tốt (90-999 giaacute trị của lời giải tối ưu) nhanh choacuteng vagrave đỡ tốn keacutem hơn bằng caacutech dugraveng heuristics bull Quaacute trigravenh heuristic lagrave datildey caacutec bước xacircy dựng caacutec quy luật giải quyết vấn đề thocircng qua việc tigravem kiếm caacutec con đường hứa hẹn nhất dẫn đến lời giải tigravem kiếm caacutech thức thu thập vagrave phacircn giải thocircng tin theo quaacute trigravenh giải vagrave phaacutet triền caacutec phương phaacutep dẫn đến một giải thuật tiacutenh toaacuten hay một lời giải tổng quaacutet đatilde coacute bull Aacutep dụng chủ yếu cho bagravei toaacuten cấu truacutec yếu cũng dugraveng để tigravem ra giải phaacutep chấp nhận được cho bagravei toaacuten cấu truacutec chặt bull Khocircng đủ tổng quaacutet như caacutec giải thuật thường chỉ dugraveng cho tigravenh huống đặc thugrave đang xeacutet bull Coacute thể dẫn đến một giải phaacutep dở - caacutec thủ tục từng bước giải quyết vấn đề khocircng đảm bảo tigravem ra giải phaacutep tối ưu bull Heuristic coacute thể lagrave định lượng vigrave vậy coacute thể đoacuteng vai trograve quan trọng trong cơ sở mocirc higravenh của hệ hỗ trợ quyết định bull Heuristic coacute thể lagrave định tiacutenh vigrave vậy coacute thể đoacuteng vai trograve quan trọng trong cung ứng kiến thức cho hệ chuyecircn gia bull Quaacute trigravenh heuristic liecircn quan đến tigravem kiếm học tập ước lượng phacircn xử vagrave lặp lại caacutec hoạt động nagravey dọc theo tiến trigravenh bull Kiến thức thu được dugrave thagravenh cocircng hay thất bại trong quaacute trigravenh đều được phản hồi vagrave sửa đổi chiacutenh quaacute trigravenh nhờ đoacute coacute thể định nghĩa lại mục tiecircu hay bagravei toaacuten 1048713 Giải thuật di truyền bắt đầu bằng tập caacutec giải phaacutep được sinh ngẫu nhiecircn taacutei kết hợp caacutec cặp giải phaacutep một caacutech ngẫu nhiecircn bull Tigravenh huống necircn dugraveng heuristics 1048713 Dữ liệu đầu vagraveo khocircng chiacutenh xaacutec hay coacute giới hạn 1048713 Thực tế quaacute phức tạp đến nỗi khocircng dugraveng được caacutec mocirc higravenh tối ưu 1048713 Chưa coacute được giải thuật chiacutenh xaacutec vagrave đủ tin cậy 1048713 Bagravei toaacuten phức tạp necircn sẽ khocircng kinh tế nếu dugraveng tối ưu hay mocirc phỏng hoặc tốn quaacute nhiều thời gian tiacutenh toaacuten 1048713 Coacute thể cải thiện tiacutenh hiệu quả của quaacute trigravenh tối ưu (tức coacute thể sinh ra caacutec giải phaacutep ban đầu tương đối tốt) 1048713 Liecircn quan đến xử lyacute kyacute hiệu chứ khocircng phải xử lyacute kyacute số (như hệ chuyecircn gia) 1048713 Cần coacute quyết định nhanh vagrave caacutec xử lyacute dựa vagraveo maacutey tiacutenh đều khocircng khả thi (một số heuristic khocircng cần đến maacutey tiacutenh) bull Thuận lợi 1048713 Dễ hiểu dễ giải thiacutech vagrave dễ cagravei đặt 1048713 Nacircng cao tiacutenh saacuteng tạo vagrave năng lực heuristic cho caacutec vấn đề khaacutec 1048713 Tiết kiệm thời gian xaacutec lập vấn đề 1048713 Tiết kiệm yecircu cầu về bộ chứa vagrave xử lyacute maacutey tiacutenh
1048713 Tiết kiệm thời gian tiacutenh toaacuten vagrave do vậy tiết kiệm thời gian thực trong ra quyết định Một số vấn đề phức tạp đến nỗi chỉ coacute thể giải được bằng heuristics 1048713 Thường sinh ra nhiều giải phaacutep chấp nhận được 1048713 Thường coacute thể phaacutet biểu lyacute thuyết hay đo lường thực nghiệm về chất lượng của giải phaacutep (tức giaacute trị mục tiecircu của giải phaacutep gần với giaacute trị tồi ưu đến mức nagraveo dugrave giaacute trị tối ưu chưa biết được) 1048713 Coacute thể kết hợp tiacutenh thocircng minh vagraveo để hướng dẫn pheacutep tigravem kiếm (tigravem kiếm tabu) Năng lực thocircng minh đoacute coacute thể lagrave đặc thugrave theo bagravei toaacuten hoặc dựa trecircn yacute kiến chuyecircn gia được cấy trong hệ chuyecircn gia hoặc cơ chế tigravem kiếm 1048713 Coacute thể dugraveng heuristic hiệu quả vagraveo caacutec mocirc higravenh coacute thể giải bằng quy hoạch toaacuten học Đocirci khi heuristic lagrave phương phaacutep được ưa thiacutech hơn khi khaacutec giải phaacutep heuristics được dugraveng như giải phaacutep ban đầu cho caacutec phương phaacutep quy hoạch toaacuten học bull Hạn chế 1048713 Khocircng đảm bảo coacute được giải phaacutep tối ưu 1048713 Caacutec quy luật coacute rất nhiều ngoại lệ 1048713 Caacutec lựa chọn quyết định tuần tự coacute thể khocircng tiecircn đoaacuten được caacutec kết cục tương lai của mỗi chọn lựa 1048713 Sự liecircn thuộc giữa caacutec phần trong hệ thống đocirci khi coacute thể gacircy ra caacutec ảnh hưởng lớn lao lecircn toagraven hệ thống bull Phacircn loại caacutec giải thuật heuristic 1048713 Heuristic xacircy dựng xacircy dựng giải phaacutep khả thi bằng caacutech cộng thecircm từng thagravenh phần một VD bagravei toaacuten người baacuten hagraveng ndash luocircn gheacute thagravenh phố chưa viếng thăm kế tiếp gần nhất
1048713 Heuristic cải tiến bắt đầu bằng một giải phaacutep khả thi vagrave cố gắng cải tiến liecircn tục trecircn đoacute VD trecircn thử hoaacuten đổi 2 thagravenh phố 1048713 Quy hoạch toaacuten aacutep dụng vagraveo caacutec mocirc higravenh chứa iacutet ragraveng buộc nhằm coacute được thocircng tin về thỏa hiệp tốt nhất với mocirc higravenh nguyecircn gốc Thường được dugraveng trong tối ưu hoacutea nguyecircn (integer optimization) 1048713 Chia giai đoạn giải quyết một vấn đề theo từng giai đoạn VD ở PampG trecircn đacircy bagravei toaacuten phacircn phối được giải quyết trước sau đoacute dugraveng giải quyết bagravei toaacuten chiến lược sản phẩm 1048713 Phacircn ratilde chia bagravei toaacuten thagravenh caacutec phần nhỏ hơn coacute thể giải quyết được sau đoacute kết hợp caacutec giải phaacutep đoacute lại VD chia latildenh thổ baacuten hagraveng thagravenh 4 vugraveng khaacutec nhau giải quyết cho từng vugraveng sau đoacute kết nối caacutec giải phaacutep
21Mocirc phỏngbull Giả định caacutec đặc điểm của thực tạibull Lagrave kỹ thuật tiến triển caacutec thực nghiệm (như phacircn tiacutech ldquowhat-ifrdquo) - bằng maacutey tiacutenh -trecircn một mocirc higravenh của hệ thocircng tin quản lyacute
bull Khocircng thực sự lagrave một mocirc higravenh vigrave khocircng biểu diễn thực tại magrave lagrave cố gắng bắtchước thực tạibull Một trong những phương phaacutep thocircng dụng nhất trong HHTQĐbull HHTQĐ lagravem việc với caacutec bagravei toaacuten phi cấu truacutec vagrave cấu truacutec yếu tigravenh huống thực tếphức tạp ndash khocircng dễ biểu diễn bằng mocirc higravenh tối ưu hay caacutec dạng mocirc higravenh khaacutecnhưng lại thường coacute thể xử lyacute được bằng mocirc phỏngbull Đặc điểm1048713 Iacutet đưa ra caacutec đơn giản hoacutea về thực tại hơn caacutec mocirc higravenh khaacutec1048713 Do triển khai caacutec thực nghiệm necircn noacute coacute thể kiểm thử caacutec giaacute trị cụ thể của caacutecbiến quyết địnhbiến khocircng kiểm soaacutet được của mocirc higravenh vagrave xem xeacutet ảnh hưởnglecircn caacutec biến kết quả1048713 Phương phaacutep coacute tiacutenh mocirc tả (như vậy khaacutec với phương phaacutep danh định)1048713 Khocircng tự động tigravem kiếm giải phaacutep tối ưu ndash noacute mocirc tảtiecircn đoaacuten caacutec đặc tiacutenh của hệthống đatilde cho dưới caacutec điều kiện khaacutec nhau từ đoacute coacute thể chọn ra phương aacuten tốtnhất1048713 Quaacute trigravenh mocirc phỏng thường lặp lại một thực nghiệm nhiều lần để coacute được ướclượng về hiệu ứng tổng quaacutet của một số hagravenh động nhất định1048713 Mocirc phỏng maacutey tiacutenh thiacutech hợp cho hầu hết caacutec tigravenh huống mặc dugrave cũng coacute một sốmocirc phỏng thủ cocircng thagravenh cocircng1048713 Thường chỉ được dugraveng khi bagravei toaacuten quaacute phức tạp khocircng thể xem xeacutet bằng caacutec kỹthuật tối ưu dạng số Tiacutenh phức tạp theo nghĩa bagravei toaacuten khocircng thể cocircng thức hoacuteacho tối ưu (do khocircng thotildea caacutec giả định) hoặc cocircng thức quaacute lớn quaacute nhiều tươngtaacutec giữa caacutec biến hoặc về bản chất bagravei toaacuten lagrave bất định hay rủi roPhương phaacutep mocirc phỏng thiết lập mocirc higravenh của hệ thống thực vagrave tiến hagravenh caacutec thựcnghiệm lặp lại trecircn mocirc higravenh
bull Thuận lợi1048713 Lyacute thuyết tương đối trực tiếp hiệu ứng dagravei hạn của nhiều chiacutenh saacutech -gt neacuten thờigian lớn1048713 Do tiacutenh chất mocirc tả (khaacutec với danh định)1048713 Coacute thể thấy được nhanh choacuteng coacute thể đặt ra caacutec cacircu hỏi ldquowhat-ifrdquo coacute thể dugravengtiếp cận thử-vagrave-sai vagraveo giải quyết vấn đề một caacutech nhanh choacuteng rẻ chiacutenh xaacutec iacutetrủi ro hơn1048713 Thử nghiệm được biến quyết định phần nagraveo của mocirci trường thực sự quan trọngvới caacutec phương aacuten khaacutec nhau1048713 Yecircu cầu kiến thức riecircng biệt về bagravei toaacuten vigrave thế buộc người xacircy dựng mocirc higravenh phảilagravem việc thường xuyecircn với nhagrave quản lyacute ndash đối tượng mong muốn của HHTQĐ để
từ đoacute bản chất bagravei toaacuten vagrave caacutec quyết định được hiểu tốt hơn1048713 Mocirc higravenh được xacircy dựng từ viễn cảnhcaacutech nhigraven của nhagrave quản lyacute1048713 Mocirc higravenh chỉ cho một bagravei toaacuten riecircng biệt thường khocircng thể dugraveng giải caacutec bagravei toaacutenkhaacutec Như vậy mỗi thagravenh phần của mocirc higravenh ứng với một phần của hệ thống thựcdo đoacute sẽ khocircng yecircu cầu nhagrave quản lyacute phải tổng quaacutet hoacutea caacutec hiểu biết của migravenh1048713 Phổ bagravei toaacuten giải được rất rộng tồn kho nhacircn sự hoạch định chiến lược 1048713 Coacute thể chứa caacutec phức tạp thực sự của bagravei toaacuten khocircng cần caacutec đơn giản hoacutea (TDdugraveng caacutec phacircn phối xaacutec suất thực thay vigrave phacircn phối lyacute thuyết xấp xỉ)1048713 Coacute thể tự động sinh ra nhiều đo lường hiệu năng quan trọng1048713 Thường lagrave phương phaacutep duy nhất của HHTQĐ coacute thể xử lyacute caacutec bagravei toaacuten tương đốiphi cấu truacutec1048713 Coacute một số caacutec goacutei phần mềm mocirc phỏng (Monte Carlo) tương đối dễ dugravengbull Điểm yếu1048713 Tuy thường tigravem được caacutec phương aacuten đủ tốt nhưng khocircng đảm bảo lời giải tối ưu1048713 Quaacute trigravenh xacircy dựng mocirc higravenh thường dagravei vagrave tốn keacutem1048713 Giải phaacutep vagrave suy diễn từ nghiecircn cứu mocirc phỏng thường khocircng thể chuyển sang bagraveitoaacuten khaacutec vigrave mocirc higravenh kết hợp caacutec yếu tố đặc thugrave1048713 Đocirci khi do mocirc higravenh quaacute dễ giải thiacutech cho nhagrave quản lyacute necircn caacutec phương phaacutep phacircntiacutech thường xem nhẹ1048713 Phần mềm mocirc phỏng đocirci khi yecircu cầu caacutec kỹ năng đặc biệt do độ phức tạp củaphương phaacutep giải higravenh thứcbull Caacutec loại mocirc phỏng1048713 Mocirc phỏng xaacutec suất một hay nhiều biến độc lập mang tiacutenh xaacutec suất với 2 loạiphacircn phối ndash thường dugraveng kỹ thuật Monte Carlo1048713 Phacircn phối rời rạc tigravenh huống coacute một số giới hạn caacutec biến cố (biến) với hữu hạncaacutec giaacute trị cho mỗi biến cố (biến)1048713 Phacircn phối liecircn tục tigravenh huống coacute số lượng khocircng giới hạn caacutec biến cố tuacircn theocaacutec hagravem mật độ xaacutec suất như phacircn phối chuẩn1048713 Mocirc phỏng độc lậpphụ thuộc theo thời gian1048713 Độc lập khocircng cần thiết phải biết chiacutenh xaacutec thời điểm xảy ra biến cố (nhu cầutiecircu thụ lượng sản phẩm trong ngagravey khocircng biết chiacutenh xaacutec thời điểm tiecircu thụ)1048713 Phụ thuộc cần biết chiacutenh xaacutec thời điểm xảy ra sự kiện (bagravei toaacuten hagraveng đợi)1048713 Mocirc phỏng tương taacutec trực quan1048713 Mocirc phỏng hướng đối tượng dugraveng tiếp cận hướng đối tượng để xacircy dựng mocirc higravenhmocirc phỏng Chuacute yacute ngocircn ngữ mocirc higravenh hoacutea nhất thể UML (unified modelinglanguage) kể cả khi mocirc phỏng caacutec hệ thời gian thựcMOcirc HIgraveNH HOacuteA ĐA CHIỀU ndash XỬ LYacute PHAcircN TIacuteCH TRỰC TUYẾNbull Người ra quyết định thường phải xem xeacutet nhiều chiều của dữ liệu (TD caacutec chiềucủa dữ liệu baacuten hagraveng lagrave sản phẩm vugraveng thời gian người baacuten ) dữ liệu cần đượcphacircn tiacutech trực tiếp bằng caacutec cocircng cụ chuẩn hay phacircn tiacutech tự động bằng caacutec
phương phaacutep khai mỏ dữ liệu (data mining)bull Hầu hết caacutec hệ thống phacircn tiacutech đa chiều được nhuacuteng trong caacutec hệ xử lyacute phacircn tiacutechtrực tuyến (HXLPTTT ndash online analytic processing - OLAP)bull Mục tiecircu của XLPTTT nắm bắt cấu truacutec của dữ liệu thực để hỗ trợ ra quyết địnhbull Trong HHTQĐ coacute sự gắn nối tự nhiecircn giữa mocirc higravenh hoacutea dữ liệu mocirc higravenh hoacutea kyacutehiệu vagrave caacutec khiacutea cạnh của phacircn tiacutech ldquowhat-ifrdquobull Caacutec baacuteo caacuteo của HXLPTTT đều coacute tiacutenh tương taacutec dễ khai thaacutec sử dụng đặc biệtphugrave hợp cho caacutec baacuteo caacuteo về chỉ số hiệu năng chủ yếu (key performance indicators- KPI) baacuteo caacuteo về đo lường hiệu năng kinh doanh bull Thế hệ hiện tại của HXLPTTT vagrave hệ khai mỏ dữ liệu (data mining) tiacutech hợp caacutecđặc tiacutenh của hệ thocircng tin latildenh đạo (executive information system ndashEIS- nhiềucaacutech nhigraven dữ liệu chi tiết hoacutea theo nhu cầu) vagrave caacutec hệ đồ họa khaacutec ndash thường coacutegiao diện người dugraveng dạng kiểu WEBbull Caacutec hệ thống như trecircn cograven được gọi lagrave caacutec cocircng cụ triacute tuệ kinh doanh (businessintelligence - BI) vigrave coacute caacutec đặc trưng về mocirc higravenh hoacutea vagrave tối ưu hoacutea nhưng lạitrong suốt đối với ngươigrave dugravengbull Hiện caacutec cocircng cụ được đưa ra bởi caacutec nhagrave cung cấp về CSDL về hoạch định tagraveinguyecircn tổ chức (ERP) về nhagrave kho dữ liệu (data warehouse) về HXLPTTT MOcirc HIgraveNH HOacuteA VAgrave MOcirc PHỎNG TƯƠNG TAacuteC TRỰC QUANbull Iacutech lợi Người ra quyết định tham gia vagraveo quaacute trigravenh phaacutet triển mocirc higravenh vagrave thựcnghiệm mocirc phỏng vigrave vậy sẽ tin tưởng khi sử dụng mocirc higravenhbull Mocirc higravenh hoacutea tương taacutec trực quan (visual interactive modeling - VIM) dugraveng caacutecbiểu diễn đồ họa maacutey tiacutenh để trigravenh bagravey caacutec ảnh hưởng của caacutec quyết định quản lyacutekhaacutec nhau ở một thời điểm (tĩnh) hay tiến triển theo thời gian (động với kỹ thuậthoạt higravenh)bull Mocirc phỏng tương taacutec trực quan (visual interactive simulation - VIS) cho pheacutepngười dugraveng theo dotildei tiến trigravenh xacircy dựng vagrave sử dụng khai thaacutec mocirc higravenh mocirc phỏngdưới dạng hoạt higravenhbull Mocirc higravenh hoacutea tương taacutec trực quan coacute thể kết hợp với tiếp cận triacute tuệ nhacircn tạo đểđưa ra caacutec khả năng mới thay đổi từ xacircy dựng hệ thống dạng đồ họa đến tigravem hiểuvề động học của hệ thốngbull Cần đến caacutec hệ thống maacutey tiacutenh xử lyacute song song tốc độ cao để xacircy dựng caacutec mocircphỏng - phức tạp quy mocirc lớn dạng hoạt higravenh - mang tiacutenh khả thi ở thời gian thực
22Caacutec dạng hệ thống hỗ trợ ra quyết địnhHệ hỗ trợ quyết định nhoacutemRa quyết định nhoacutem giao tiếp vagrave cộng taacutec- Caacutec đặc điểm của cocircng việc nhoacutem+ Một nhoacutem thực hiện một nhiệm vụ thỉnh thoảng ra quyết định thỉnh thoảngkhocircng ra quyết định+ Caacutec thagravenh viecircn trong nhoacutem coacute thể ở những nơi khaacutec nhau
+ Caacutec thagravenh viecircn trong nhoacutem coacute thể lagravem việc ở những thời gian khaacutec nhau+ Caacutec thagravenh viecircn trong nhoacutem coacute thể lagravem việc cugraveng nhau hoặc ở caacutec tổ chức khaacutecnhau+ Nhoacutem coacute thể vĩnh viễn hoặc tạm thời+ Nhoacutem coacute thể ở bất kỳ mức quản lyacute nagraveo hoặc mức thời gian nagraveo+ Coacute sự điều phối (quaacute trigravenh vagrave nhiệm vụ đạt được) hoặc macircu thuẩn trongnhoacutem+ Coacute sự đạt được hoặcvagrave mất maacutet năng suất trong tổ chức+ Nhiệm vụ phải hoagraven thagravenh rất nhanh+ Khocircng thể hoặc quaacute đắt cho tất cả caacutec thagravenh viecircn trong nhoacutem cugraveng hợp ở mộtnơi+ Một số dữ liệu thocircng tin hoặc kiến thức cần thiết nằm ở nhiều nơi một sốkhaacutec ở ngoagravei tổ chức+ Chuyecircn mocircn của caacutec thagravenh viecircn khocircng coacute trong nhoacutem lagrave cần thiết- Caacutec hoạt động vagrave caacutec quaacute trigravenh miecircu tả caacutec cuộc họp+ Cuộc họp lagrave hoạt động chung liecircn quan bởi một nhoacutem người coacute địa vị bằngnhau hoặc gần bằng nhau+ Kết quả của cuộc họp phụ thuộc một phần vagraveo kiến thức yacute kiến caacutec đaacutenh giaacutecủa caacutec thagravenh viecircn+ Kết quả của cuộc họp cũng phụ thuộc vagraveo sự kết hợp của nhoacutem vagrave phụ thuộcvagraveo quaacute trigravenh ra quyết định được sử dụng bởi nhoacutem đoacute+ Giải quyết caacutec yacute kiến khaacutec nhau bởi người coacute quyền hạn hoặc thương lượnghoặc phacircn xửHỗ trợ giao tiếp- Giao tiếp lagrave thagravenh phần quan trọng cho hỗ trợ quyết định Khocircng coacute giao tiếp thigravekhocircng coacute cộng taacutec Những người ra quyết định caacute nhacircn phải giao tiếp với caacutecđồng nghiệp chuyecircn gia cơ quan chiacutenh phủ khaacutech hagraveng đối taacutec kinh doanh hellipHọ cũng cần dữ liệu vagrave thocircng tin (vagrave kiến thức) từ nhiều nơi trecircn thế giới Caacutecnhoacutem ra quyết định phải giao tiếp cộng taacutec vagrave thương lượng trong cocircng việcHầu hết caacutec tổ chức sẽ nhanh trở thagravenh khocircng coacute chức năng nếu khocircng coacute caacutec hệthống giao tiếp Thương mại điện tử coacute thể hiệu quả chỉ qua caacutec kỹ thuật giao tiếphiện đại- Caacutec kỹ thuật thocircng tin hiện đại cung cấp caacutec phương tiện hỗ trợ giao tiếp rẻnhanh coacute khả năng coacute thể tin cậy Nền tảng hỗ trợ giao tiếp lagrave caacutec hệ thống maacuteytiacutenh mạng+ Bắt đầu bằng điện baacuteo điện thoại radio vagrave ti vi+ Trong 100 năm chuacuteng ta phaacutet triển maacutey fax thư điện tử chương trigravenh chatnhoacutem tin tức hệ thống hội nghị truyền higravenh Hầu hết caacutec kỹ thuật nagravey đềuhoạt động trecircn internet+ Sự phaacutet triển giao tiếp sau cugraveng lagrave hệ thống họp điện tử caacutec dịch vụ vagrave hệ
thống hội nghị điện tử thường sử dụng internet để kết nối caacutec người ra quyếtđịnh- Caacutec thuận lợi aacutep dụng caacutec phương phaacutep giao tiếp cải tiến trong caacutec tổ chức+ Cải tiến năng suất của nhacircn viecircn+ Liecircn quan đến nhiều người ra quyết định chiacutenh+ Khocircng quan tacircm nhiều đến đường biecircn giới địa lyacute+ Tạo nền văn hoacutea hợp taacutec nhất quaacuten+ Cải tiến chất lượng cuộc sống của nhacircn viecircnHỗ trợ cộng taacutec Maacutey tiacutenh hỗ trợ cộng taacutec- Khung thời giannơi chốn+ Sự hiệu quả của kỹ thuật tiacutenh toaacuten cộng taacutec phụ thuộc vagraveo vị triacute của caacutec thagravenhviecircn trong nhoacutem vagrave phụ thuộc vagraveo thời gian chia sẽ thocircng tin gởi vagrave nhận+ Chia sự giao tiếp thagravenh bốn ocirc vagrave tổ chức bốn ocirc dọc theo 2 chiều thời gian vagravenơi chốn1048713 Thời gian Khi gởi vagrave nhận thocircng tin hầu như đồng thời giao tiếp lagrave đồngthời Viacute dụ Điện thoại ti vi vagrave caacutec cuộc họp gặp mặt nhau Giao tiếp bấtđồng bộ xảy ra khi người nhận nhận thocircng tin ở thời điểm khaacutec thời điểmgởi thocircng tin đoacute1048713 Nơi chốn Người gởi vagrave người nhận coacute thể ở cugraveng phograveng hoặc khocircng+ Bốn ocirc lagrave1048713 Cugraveng thời giancugraveng nơi chốn Caacutec thagravenh viecircn gặp mặt nhau cugraveng một luacutecgiống như phograveng quyết định hoặc gặp mặt truyền thống1048713 Cugraveng thời giankhaacutec nơi chốn Caacutec thagravenh viecircn ở caacutec nơi khaacutec nhau nhưnggiao tiếp cugraveng nhau Viacute dụ hội nghị truyền higravenh (videoconferencing)1048713 Khaacutec thời giancugraveng nơi chốn Nhiều người lagravem việc theo ca Ca nagravey để lạithocircng tin cho ca khaacutec1048713 Khaacutec thời giankhaacutec nơi chốn Caacutec thagravenh viecircn ở caacutec nơi khaacutec nhau Caacutecthagravenh viecircn nagravey gởi vagrave nhận thocircng tin ở những lần khaacutec nhau
23Thực thi hệ DSSHệ thống hỗ trợ quản lyacute (MSS) khocircng phải luacutec nagraveo cũng luocircn thagravenh cocircng Nhiều trường hợpthất bại của ES khocircng hoagraven toagraven lagrave lyacute do kỹ thuật Thực thi hệ thống lagrave một quaacute trigravenh liecircn tụcnhằm đảm bảo cho tổ chức chuẩn bị tiếp nhận một hệ thống mới vagrave đưa hệ thống vagraveo sử dụngthagravenh cocircngThực hiện cocircng nghệ hệ thống hỗ trợ quản lyacute lagrave việc phức tạp vigrave caacutec hệ thống nagravey khocircng đơnthuần lagrave hệ thống thocircng tin chỉ thu thập thao taacutec vagrave phacircn phối thocircng tin Magrave xa hơn chuacuteng
liecircn quan tới caacutec cocircng việc coacute thể lagravem thay đổi đaacuteng kể caacutech thức hoạt động của tổ chức Tuyvậy đa số caacutec yếu tố thực thi đều liecircn quan tới hệ thống thocircng tinThực thi MSS lagrave quaacute trigravenh liecircn tục diễn ra trong suốt thời gian phaacutet triển hệ thống từ đề xuấtban đầu đến nghiecircn cứu khả thi thiết kế vagrave phacircn tiacutech hệ thống lập trigravenh huấn luyện chuyểnđổi vagrave lắp đặt Caacutec chuyecircn gia hệ thống thocircng tin thường gọi thực thi lagrave giai đoạn cuối trongvograveng đời hệ thống Định nghĩa thực thi MSS phức tạp hơn vigrave bản chất lặp của sự phaacutet triểncaacutec hệ thống
THỰC THI KHOcircNG HOAgraveN CHỈNHCaacutec quyết định về tiacutenh khả thi thường coacute giả định về lợi iacutech đạt được khi kế hoạch thực thiđược thực hiện hoagraven toagraven Trong thực tế thường chỉ thực hiện 90 thậm chiacute 70 phần trăm sovới phacircn tiacutech khả thi Lyacute do lagrave sự thay đổi tại một nơi trong hệ thống coacute thể ảnh hưởng vagrave coacutethể taacutec động tiecircu cực đến chỗ khaacutec Do vậy cấp quản lyacute coacute thể bỏ những phần trong dự aacuten coacutethể gacircy ra taacutec động xấu Do đoacute dự aacuten sẽ thực hiện iacutet hơn 100 so với dự aacuten kế hoạch Caacutec lyacutedo khaacutec coacute thể lagrave do khấu trừ ngacircn saacutech hoặc vượt chi phiacuteĐAacuteNH GIAacute SỰ THAgraveNH COcircNG CỦA THỰC THI HỆ THỐNGPhải coacute caacutec chỉ số đo lường thigrave mới coacute thể đaacutenh giaacute sự thagravenh cocircng khi thực thi một hệ thốngDickson va Powers (1973) đề ra 5 tiecircu chuẩn độc lậpbull Tỷ lệ thời gian thực hiện dự aacuten với thời gian ước lượngbull Tỷ lệ chi phiacute thực tế vagrave ngacircn saacutech thực hiệnbull Thaacutei độ của cấp quản lyacute đối với hệ thốngbull Nhu cầu thocircng tin của caacutec nhagrave quản lyacute được đaacutep ứng như thế nagraveo qua hệ thốngbull Taacutec động của dự aacuten đối với những hoạt động maacutey tiacutenh trong cocircng tyCaacutec đo lường khaacutec để đaacutenh giaacute thagravenh cocircng của hệ hỗ trợ quản lyacute (MSS)bull Sự sử dụng hệ thống (dự định dugraveng hoặc thực sự dugraveng)bull Thỏa matilden của người dugravengbull Thaacutei độ taacuten thagravenhbull Mức độ hệ thống hoagraven thagravenh caacutec mục tiecircu ban đầubull Phần thưởng đối với tổ chức (giảm chi phiacute tăng doanh thuhellip)bull Tỷ số lợi iacutech chi phiacute
bull Mức độ thể chế hoacutea của MSS trong tổ chứcDo bởi tiacutenh đa dạng của DSS necircn việc đaacutenh giaacute sự thagravenh cocircng của hệ nagravey cũng khoacute khăn tuynhiecircn cũng coacute thể coacute một số yếu tố giuacutep cho DSS thagravenh cocircng như sự tham gia người dugravenghuấn luyện người dugraveng hỗ trợ quản lyacute cấp cao nguồn thocircng tin đặc điểm của những nhiệmvụ coacute liecircn quan (cấu truacutec bất định độ khoacute phụ thuộc)
Chương5Nhoacutem hỗ trợ quyết định vagrave nhoacutemcocircng nghệ phần mềm
51Nhoacutem tạo quyết định
MDM-Holsapple đatilde gợi yacute chuacuteng ta sử dụng giới hạn người tạo quyết định
Một nhoacutem lagrave kết cấu MDM nơi magrave nhiều người ra quyết định hoagraven toagraven tương taacutec
Một đội lagrave kết cấu MDM nơi caacutec thagravenh viecircn tư vấn cho người đưa ra quyết định nhưng khocircng tương taacutec
Một Ủy ban lagrave kết cấu MDM với một người tạo quyết định duy nhất vagrave sự tương taacutec giữa caacutec thagravenh viecircn
Mạng thocircng tin
Mạng lưới baacutenh xe mỗi người tham gia coacute thể giao tiếp với người đưa ra quyết định ở trung tacircm nhưng khocircng phải với người tham gia khaacutecCấu truacutec nagravey lagrave khocircng thỏa matilden tất cả những người tham gia ngoại trừ người ra quyết định
Mạng dacircy chuyền Tham gia chuyển tiếp thocircng tin chỉ để noacute luocircn liền kề nhau trong chuỗi
Thagravenh viecircn cuối cugraveng ko được đaacutep ứng
Mạng vograveng trograven Tương tự như chuỗi nhưng kết thuacutec được kết nối
Mạng kết nối hoagraven toagraven khocircng coacute hạn chế về giao tiếp vagrave tương taacutec giữa caacutec thagravenh viecircnNoacutei chungnoacute đaacutep ứng hầu hết caacutec kết nối của người tham gia nhưng truyền đạt thocircng tin mất nhiều thời gian vagrave coacute nhiều cơ hội xảy ra lỗi
Nhoacutem hagravenh vi vagrave chuẩn mực
MDMs thiết lập caacutec chỉ tiecircu hướng dẫn quaacute trigravenh ra quyết định
Một chuẩn mực quy định cụ thể những gigrave thagravenh viecircn trong nhoacutem dự kiến sẽ lagravem trong những hoagraven cảnh nhất định
Quy tắc gửi coacute thể được thocircng qua viacute dụ đaacutenh giaacute ngang hagraveng hoặc xử phạt
Lagravem thế nagraveo để đưa ra quyết định
Việc chọn lựa magrave trong đoacute việc sử dụng cấu truacutec MDM phải được dựa trecircn một số yếu tố liecircn quan với bối cảnh quyết định
Viacute dụmột cấu truacutec riecircng lẻ sẽ lagravem việc nơi magrave quyết định được cấu truacutec cao vagrave thocircng tin lagrave coacute sẵn
Một ủy ban cơ cấu sẽ lagrave sự lựa chọn khi người ra quyết định khocircng thể đưa ra quyết định một migravenh
52Caacutec vấn đề thường gặp trong nhoacutem
Kiacutech thước Noacutei chung sự nhất triacute vagrave gắn kết giữa caacutec thagravenh viecircn tỉ lệ nghịch với phạm vi nhoacutem Trong nhoacutem lớn rất dễ higravenh thagravenh caacutec nhoacutem nhỏ vagrave hoạt động rời rạc
Tư duy tập thể Trong nhoacutem lớn mọi người coacute xu hướng suy nghĩ đểđạtđược sự nhất triacute necircn khocircng phaacutet huy được sự saacuteng tạo
Caacutec vấn đề về xatilde hội
Xung đột Trong 1 nhoacutem ai cũng muốn migravenh lagrave giỏi nhất necircn dễ dẫn đến xung đột
Ẩn danh(Giấu tecircn) Đacircy lagrave phương phaacutep được sử dụng để kiểm soaacutet xung đột Cho caacutec thagravenh viecircn tham gia ẩn danh
Vấn đề giới tiacutenh Nam vagrave nữ thường coacute những thế mạnh khaacutec nhau điều nagravey coacute thể lagrave sức mạnh trong 1 thiết lập MDM
Đagravem phaacuten vagrave quyết định
Một quyết định coacute thể liecircn quan đến nhiều quan điểm khaacutec nhau vigrave thế cần phải coacute sự đagravem phaacuten
Caacutec thiết kế của cơ chế hỗ trợ cho MDM phải phugrave hợp với caacutec hoạt độngđagravemphaacuten
Những hoạt động nagravey bao gồm việc thu nhận yacute kiến của caacutec thagravenh viecircn 1 caacutech cocircng bằng
53Cocircng nghệ hỗ trợ MDM
Organizational DSSndash 1 hệ thống cung cấp caacutec quyết định hỗ trợ
Group Support Systemndash Cocircng nghệ sử dụng sự hỗ trợ của nhiều becircn tham gia
Group DSS ndash Lagrave 1 hệ thống được thiết kế đặc biệt để hỗ trợ cho MDM
DSS ndash Lagrave 1 hệ thống dưới sự kiểm soaacutet của 1 người quyết định hệ thống nagravey cung cấp 1 bộ cocircng cụ giuacutep phacircn tiacutech hoagraven cảnh đểđưa ra quyết định vagrave nacircng cao hiệu quả của quyết địnhđoacute
53Cocircng nghệ hỗ trợ MDM
Organizational DSSndash 1 hệ thống cung cấp caacutec quyết định hỗ trợ
Group Support Systemndash Cocircng nghệ sử dụng sự hỗ trợ của nhiều becircn tham gia
Group DSS ndash Lagrave 1 hệ thống được thiết kế đặc biệt để hỗ trợ cho MDM
DSS ndash Lagrave 1 hệ thống dưới sự kiểm soaacutet của 1 người quyết định hệ thống nagravey cung cấp 1 bộ cocircng cụ giuacutep phacircn tiacutech hoagraven cảnh đểđưa ra quyết định vagrave nacircng cao hiệu quả của quyết địnhđoacute
Mục tiecircu của cocircng nghệ hỗ trợ MDM
Quy trigravenh hỗ trợ tập trung vagraveo quaacute trigravenh tạo điều kiện thuận lợi cho sự tương taacutec
Cơ chế cấu truacutec quaacute trigravenh chi phối caacutec hoạt động truyền thocircng
Nhiệm vụ hỗ trợ cocircng việc coacute thể chọn lựa tổ chức hoặc lấy thocircng tin
Nhiệm vụ cấu truacutec cocircng việc cho pheacutep truy cập đến kỹ thuật lọc kết hợp phacircn tiacutech kiến thức liecircn quan đến cocircng việc
Caacutec lớp loại cocircng nghệ hỗ trợ MDM
Phacircn loại theo đặc điểm do DeSanctis vagrave Gallupe đưa ra đề xuất một chương trigravenh ba cấp dựa trecircn caacutec tiacutenh năng được cung cấp
Hệ thống cấp 1 Mục điacutech chiacutenh lagrave tạo điều kiện thocircng tin liecircn lạc giữa caacutec thagravenh viecircn
Hệ thống cấp 2 Thiết kế để giảm thiểu rủi ro
Hệ thống cấp 3 Giuacutep điều chỉnh xử lyacute quyết định
Phacircn loại theo cocircng nghệ -Kraemer vagrave King tập trung vagraveo cocircng nghệ aacutep dụng
Cocircng nghệ bảng mạch điện tử
Hội nghị trực tuyến
Mạng lưới tập đoagraven
Trung tacircm thocircng tin
Mocirci trường cộng taacutec
Phograveng quyết định
Nhoacutem phần mềm
Phần mềm được thiết kế để hỗ trợ sự hợp taacutec bao gồm việc thu huacutet vagrave lưu trữ thocircng tin
Caacutec tổ chức dẫn đầu thị trường hiện tại lagrave Lotus Notes and Domino Microsoft Exchange Novell GroupWise and Oracle Office
Caacutec cocircng cụ trong một bộ phần mềm bao gồm người quản lyacute hội nghị (Lotus Sametime) vagrave trao đổi thocircng điệp (Lotus Notes Mail)
Xếp hạng phần mềm cho nhoacutem
Ellis vv đề xuất một hệ thống xếp hạng dựa vagraveo kiểu sự hỗ trợ noacute Cung cấp
Hệ thocircng điệp
Hệ thống hội thảo truyền higravenh
Hệ thống cộng taacutec soạn thảo
Nhoacutem phacircn phối giải phaacutep phần mền
Hệ thống phối hợp
Hệ thống thocircng minh đại diện
Lực lượng điều khiển phaacutet triển phần mềm cho nhoacutem
Một số nhacircn tố chiacutenh bao gồm
Tăng năng suất
Giảm số lượng caacutec cuộc họp
Tăng cường tự động hoacutea caacutec quy trigravenh lagravem việc thường xuyecircn
Cần phối hợp toagraven cầu tốt hơn
Tiacutenh sẵn sagraveng của những mạng lan rộng
Coleman vagrave Khanna liệt kecirc 10 nhacircn tố khaacutec
54Quản lyacute hoạt động MDM (Mobile Device Management - Quản lyacute thiết bị di động)
Một số phương phaacutep phối hợp phổ biến hơnMDM lagrave
Kỹ thuật nhoacutem định danh
Kỹ thuật Delphi
Sự phacircn xử
Hệ thocircng tin dựa trecircn vấn đề
Nemawashi
Kỹ thuật nhoacutem định danh
1-Mỗi người tham gia viết ra những yacute tưởng về những gigrave necircn quyết định
2-Lần lượt mỗi người tham gia trigravenh bagravey yacute tưởng của migravenh được ghi lại trecircn bảng Khocircng thảo luận ở đacircy
3-Sau khi tất cả caacutec yacute tưởng được trigravenh bagravey caacutec đại biểu coacute thể chất vấn những người khaacutec
4-Mỗi người tham gia bỏ phiếu cho mỗi yacute tưởng
Kỹ thuật Delphi
Về cơ bản tương tự như kỹ thuật nhoacutem định danh ngoại trừ những người khocircng bao giờ tham gia cuộc họp
Một cocircng cụ khảo saacutet được sử dụng để thu thập đầu vagraveo ban đầu từ caacutec thagravenh viecircn
Một cuộc khảo saacutet thứ hai được gửi đi với một bản toacutem tắt caacutec kết quả chung
Những bước lặp lại cho đến khi đạt được một sự đồng thuận hoặc nhigraven nhận của đa số
Sự phacircn xử(Arbitration )
Thiacutech hợp nhất khi caacutec thagravenh viecircn của MDM đại diện cho caacutec yếu tố đối lập
Những người tham gia đồng yacute rằng nếu lựa chọn thay thế hai becircn thỏa thuận khocircng được tigravem thấy thigrave một trọng tagravei viecircn becircn ngoagravei sẽ tham gia
Trọng tagravei sau đoacute lựa chọn thay thế ocircng hoặc xeacutet thấy thiacutech hợp nhất
Hệ thống thocircng tin dựa trecircn vấn đề (IBIS)
Lagrave một phương phaacutep lập luận cấu truacutec
Một đại diện cho IBIS lagrave một đồ thị với caacutec nuacutet vagrave caacutec liecircn kết
IBIS bắt đầu với lựa chọn của một nuacutet vấn đề gốc sau đoacute caacutec nuacutet vị triacute khaacutec nhau được liecircn kết với nuacutet gốc
Caacutec nuacutet vị triacute nagravey sau đoacute được đaacutenh giaacute dựa trecircn những lập luận gắn liền với chuacuteng
Nemawashi (được sử dụng rộng ratildei tại Nhật Bản)
1-Một hoặc nhiều thagravenh viecircn của MDM được chỉ định lagrave điều phối viecircnCaacutec điều phối viecircn sau đoacute chọn người tham gia cograven lại
2-Điều phối viecircn xacircy dựng một tổng hợp caacutec sự lựa chọn vagrave sau đoacute caacutec chuyecircn gia đaacutenh giaacute caacutec lựa chọn
3-Điều phối viecircn lựa chọn một sự lựa chọn dựa trecircn kết quả ở trecircn(ở 2)
4-Sự thay thế được luacircn chuyển điều phối viecircn tigravem kiếm sự đồng thuận thocircng qua sự thuyết phục vagrave đagravem phaacuten
5-Nếu đạt được sự đồng thuận điều phối viecircn cho lưu thocircng một tagravei liệu magrave mỗi thagravenh viecircn MDM để lại dấu hiệu trecircn đoacute
55Nơi lagravem việc ảo
Nhiều tổ chức trecircn toagraven thế giới kinh doanh bất động sản cho cocircng nghệ hợp taacutec
Cocircng việc được trở thagravenh một điều bạn lagravem hơn lagrave một nơi bạn đi
Những thay đổi lớn nhất mang lại bởi nơi lagravem việc ảo coacute thể lagrave về văn hoaacute hay xatilde hội hơn lagrave về cocircng nghệ
Chương 6 Hệ thống thocircng tin điều hagravenh
61 Yacute nghĩa của EIS- Hệ thống thocircng tin điều hagravenh
- EIS lagrave một dạng đặc biệt của DSS được thiết kế để hỗ trợ ra quyết định ở cấp cao nhất của một tổ chức
- Lagrave một hệ thống thocircng tin hỗ trợ nhu cầu lập kế hoạch vagrave đaacutenh giaacute của caacutec nhagrave quản lyacute điều hagravenh
- EIS coacute thể giuacutep một CEO coacute được bức tranh tổng thể chiacutenh xaacutec nhất về caacutec hoạt động vagrave một bản toacutem tắt những gigrave magrave đối thủ cạnh tranh đang lagravem
- Caacutec hệ thống nagravey noacutei chung hoạt động dễ dagraveng vagrave trigravenh bagravey thocircng tin theo những caacutech dễ hiểu để việc tiếp thu được nhanh choacuteng (biểu đồ đồ thịhellip)
(Tagravei liệu thecircm EIS lagrave những loại hệ thống lagrave rất phức tạp trong tự nhiecircn Coacute thể noacutei hệ thống nagravey cũng cung cấp cho caacutec nhagrave quản lyacute với caacutec thiết bị coacute khả năng ra quyết định bằng caacutech sử dụng của noacute Hệ thống nagravey hoạt động trong điều kiện như vậy quan trọng như trong caacutec hệ thống khaacutec khocircng hỗ trợ Khả năng lưu trữ dữ liệu nặng lagravem cho noacute lyacute tưởng để được thocircng qua khocircng chỉ bởi caacutec doanh nghiệp lớn magrave cograven bởi caacutec doanh nghiệp nhỏ hơn Nhigraven chung hệ thống nagravey lagrave dagravenh cho caacutec nhacircn viecircn cấp cao hỗ trợ thagravenh thạo trong việc đưa ra caacutec quyết định quan trọng)
Caacutec phiecircn EIS tiecircu biểu- Phiecircn lagravem việc coacute thể bắt đầu với một baacuteo caacuteo về tigravenh higravenh tagravei chiacutenh vagrave kinh
doanh của một cocircng ty caacutec chỉ số hoạt động quan trọng được hiển thị rotilde ragraveng- EIS sẽ cho pheacutep caacutec giaacutem đốc điều hagravenh coacute thể đi sacircu vagraveo dữ liệu từ những con
số bất kỳ magrave noacute hỗ trợ- Việc điều hagravenh coacute thể lựa chọn một mức độ chi tiết ( VD danh số baacuten hagraveng) nếu
như cần điều tra thecircm- Lagrave một phương phaacutep tiếp cận coacute thể giuacutep việc ra quyết định tốt hơn
Những điều magrave EIS ko coacute- EIS khocircng phải lagrave sự thay thế cho caacutec hệ thống dựa trecircn caacutec maacutey tiacutenh khaacutec EIS
thực sự chỉ cung cấp dữ liệu cho caacutec hệ thống nagravey- Noacute khocircng thể biến caacutec bộ hệ điều hagravenh của maacutey tiacutenh thagravenh những ldquochuyecircn viecircn
giỏirdquo- Coacute thể được viacute một caacutech cao hơn như lagrave một trợ lyacute đaacuteng tin cậy coacute thể được gọi
đến bất khi nagraveo vagrave mỗi khi cần thiết
Tagravei liệu thecircm Sự khaacutec nhau giữa EIS vagrave DSS+ EIS thiết kế để hỗ trợ những người điều hagravenh cấp cao giuacutep họ khaacutem phaacute caacutec vấn đề vagrave caacutec cơ hội DSS hỗ trợ những nười phacircn tiacutech cố gắng trả lời cacircu hỏi caacutei gigrave coacute thể lagravem cugraveng với một cơ hội hoặc một vấn đề
Chiều EIS DSSNhững người sử dụng thocircng thường
Duyệt dữ liệu đi xuống truy xuất trạng thaacutei
Hỗ trợ phacircn tiacutech vagrave quyết định
Sự thuacutec đẩy Tiacutenh thiacutech hợp Tiacutenh hiệu quảỨng dụng Queacutet mocirci trường đaacutenh giaacute
hiệu suất nhận dạng caacutec vấn đề vagrave caacutec cơ hội
Caacutec quyết định quản lyacute trecircn caacutec lĩnh vực đa dạng
Hỗ trợ quyết định Caacutec chiacutenh saacutech caacutec quyết định khocircng coacute cấu truacutec ở mức cao vagrave hỗ trợ giaacuten tiếp
Hỗ trợ caacutec quyết định lặp lại caacutec quyết định khocircng thể đoaacuten trước ra quyết định khocircng coacute cấu truacutec vagrave baacuten cấu truacutec
Loại thocircng tin Caacutec thocircng tin tin tức thocircng tin becircn ngoagravei về khaacutech hagraveng đối thủ cạnh tranh mocirci trường caacutec baacuteo caacuteo theo yecircu cầu vagrave định thời về caacutec hoạt động becircn trong
Caacutec thocircng tin hỗ trợ caacutec tigravenh huống đặc biệt
Sử dụng coacute nguyecircn tắc
Dograve theo vết vagrave điều khiển nhận dạng cơ hội
Hoạch định tổ chức phacircn nhoacutem vagrave điều khiển
Khả năng phugrave hợp với những người sử dụng caacute nhacircn
Thiết kế loại ra quyết định cho mỗi người điều hagravenh caacute nhacircn bằng nhiều lựa chọn đầu ra
Cho pheacutep caacutec đaacutenh giaacute caacute nhacircn caacutec khả năng what-if lựa chọn loại hộp hội thoại
Đồ họa Phải coacute Lagrave một phần quan trọng của nhiều DSS
Thacircn thiện người sử dụng
Phải coacute Phải coacute nếu khocircng coacute người sử dụng trung gian
Xử lyacute thocircng tin Lọc neacuten thocircng tin dograve theo vết dữ liệu vagrave thocircng tin quan trọng
EIS kiacutech thiacutech caacutec cacircu hỏi caacutec cacircu trả lời bằng caacutech sử dụng DSS vagrave phản hồi lại EIS
Hỗ trợ caacutec thocircng tin chi tiết
Truy xuất thường xuyecircn caacutec mức chi tiết của bất kỳ thocircng tin tổng hợp nagraveo (duyệt dữ
Coacute thể coacute trong DSS nhưng khocircng thường
liệu chi tiết)Cơ sở mocirc higravenh Caacutec chức năng coacute sẵn bị hạn
chếLagrave điểm cốt lotildei của DSS
Cấu truacutec Theo người baacuten sản phẩm hoặc theo caacutec chuyecircn gia hệ thống thocircng tin
Theo người sử dụng hoặc caacute nhacircn hoặc caacutec chuyecircn gia từ caacutec trung tacircm thocircng tin hoặc phograveng ban hệ thống thocircng tin
Phần cứng Mainframe caacutec trạm RISC mạng LANs hoặc caacutec hệ thống phacircn bố
Mainframe caacutec trạm RISC caacutec maacutey PC hoặc caacutec hệ thống phacircn bố
Bản chất caacutec goacutei phần mềm
Truy xuất tương taacutec dễ dagraveng đến nhiều cơ sở dữ liệu truy xuất trực tuyến caacutec khả năng DBMS phức tạp caacutec liecircn kết phức tạp
Caacutec khả năng tiacutenh toaacuten lớn caacutec ngocircn ngữ mocirc higravenh mocirc phỏng ứng dụng vagrave caacutec bộ tạo DSS
Bản chất caacutec thocircng tin
Trigravenh bagravey thocircng tin được phaacutet sinh trước về quaacute khứ vagrave hiện tại tạo caacutec thocircng tin mới về quaacute khứ hiện tại tương lai
Tạo thocircng tin mới về quaacute khứ hiện tại tương lai
62 Lịch sử EIS- EIS xuất hiện lần đầu tiecircn tại MIT vagraveo những năm 1970
- Những EIS đầu tiecircn được phaacutet triển bởi caacutec doanh ngiệp lớn sẵn sagraveng chấp nhận rủi ro để đạt được lợi thế cạnh tranh
- Vagraveo những năm 1980 caacutec nhagrave cung cấp đatilde phaacutet triển một số cơ sở khaacutech hagraveng rộng vagrave cocircng nghệ EIS được tiếp tục phaacutet triển cho đến ngagravey nay
(Tagravei liệu thecircm Sử dụng DSSEIS cho phaacutet triển bền vững + Một số nghiecircn cứu đatilde được tiến hagravenh để kiểm tra việc thực hiện của EIS trong khu vực cocircng cộng vagrave chiacutenh phủ caacutec nước tổ chức kể từ khi chuacuteng được phaacutet triển theo định hướng lợi nhuận cho caacutec cocircng ty tư nhacircn (Hasan vagrave Hasan năm 1997) Theo một nghiecircn cứu tiến hagravenh tại Mỹ ở hơn 300 cocircng ty kết quả cho thấy sự khaacutec biệt của EIS giữa tư nhacircn vagrave chiacutenh phủ một số kết quả thuacute vị được phaacutet hiệnViacute dụ khoacute khăn hơn để chuyển tiền từ một tagravei khoản khaacutec trong một EIS của chiacutenh phủ cũng lagrave khoacute khăn hơn để biện giải thiacutech cho những chi phiacute phaacutet triển EIS của chiacutenh phủ Một nghiecircn cứu khaacutec được tiến hagravenh ở Australia
cho thấy rằng EIS cung cấp cho quản lyacute một higravenh ảnh chiacutenh xaacutec hơn về tổ chức thực hiện vagrave cung cấp hỗ trợ cho caacutec lợi iacutech chiến lược cải thiện khocircng chỉ cho caacutec nhagrave quản lyacute nhưng cograven cho phần cograven lại của tổ chức Dựa trecircn caacutec hệ thống được thiết kế cho caacutec cocircng ty tư nhacircn với một caacutech rotilde ragravengxaacutec định mục tiecircu EIS lagrave thiacutech hợp cho caacutec tổ chức cocircng cộng hiện đại nhưng cần phải được linh hoạt hơn vagrave kết thagravenh chugravem một phạm vi rộng hơn khả năng vagrave phương tiện hơn so với khu vực tư nhacircn ban đầu theo định hướng sản phẩm (Hasan vagrave Hasan năm 1997) Điều nagravey coacute thể lagrave do thực tế rằng caacutec hoạt động khu vực cocircng lagrave bắt buộc coacute taacutec động rộng phải đaacutep ứng sự mong đợi duy nhất cocircng cộng thường coacute mục tiecircu mơ hồ vagrave macircu thuẫn iacutet quyền tự chủ vagrave kiểm soaacutet việc ra quyết định vagrave nhacircn viecircn lagrave khoacute khăn hơn (Watson vagrave Carte2000) + Toacutem lại EIS lagrave một khaacutei niệm thagravenh cocircng noacute phaacutet triển qua nhiều năm tuy nhiecircn EIS khắc phục khiếm khuyết của migravenh bằng caacutech tiến hagravenh nghiecircn cứu liecircn tục)
63 Tại sao những người điều hagravenh hagraveng đầu lại khaacutec nhau- Họ lagrave những doanh nghiệp theo định hướng coacute suy nghĩ
- Coacute một khoảng khocircng gian rộng để kiểm soaacutet
- Họ chịu traacutech nhiệm cho việc thiết lập chiacutenh saacutech
- Họ đại diện cho tổ chức mocirci trường becircn ngoagravei
- Hagravenh động của họ tạo ra những kết quả đaacuteng kể về tagravei chiacutenh vagrave con người
Tần số caacutec hoạt động điều hagravenh- Xử lyacute xaacuteo trộn 42
- Hoạt động kinh doanh 32
- Phacircn bổ nguồn lực 17
- Đagravem phaacuten 3
- Những điều khaacutec 6
Handling Disturbances 42
Entrepreneurial Activites 32
Resource Allocation 17
Negotiation 3
Other 6
Những thocircng tin điều hagravenh cần thiết- Quản lyacute xaacuteo trộn coacute thể yecircu cầu sự chuacute yacute xung quanh đồng hồ
- Hoạt động kinh doanh yecircu cầu điều hagravenh để dự đoaacuten những thay đổi trong mocirci trường
- Nhiệm vụ phacircn bổ tagravei nguyecircn yecircu cầu lựa chọn người quản lyacute vagrave caacutec nguồn lực hạn chế được triển khai
- Đagravem phaacuten yecircu cầu cập nhật thocircng tin từng phuacutet để coacute thể xacircy dựng được sự đồng thuận
Caacutec loại thocircng tin điều hagravenh- Hệ thống kế toaacuten coacute liecircn quan đến việc tiacutenh toaacuten thu nhập hoạt động cho caacutec lĩnh
vực cụ thể lagrave quan trọng hơn so với caacutec hệ thống kế toaacuten truyền thocircng- Thocircng tin về thị trường khaacutech hagraveng cung cấp giaacute trị trong việc quyết định chiến
lược- Caacutec thocircng tin cần thiết thường được truyền đi trecircn một số hệ thống maacutey tiacutenh vagrave
nằm trong toagraven tổ chức- Caacutec thocircng tin được sử dụng thường lagrave ngắn hạn vagrave dễ thay đổi
Phương thức để xaacutec định thocircng tin cần thiết
Rockart xaacutec định được năm phương thức cơ bản để xaacutec định thocircng tin cần thiết
- Phương thức dựa trecircn kết quả- Phương thức rỗng- Phương thức chỉ số khoacutea- Phương thức tổng hợp nghiecircn cứu- Phương thức dựa vagraveo nhacircn tố then chốt dẫn đến thagravenh cocircng
64 Thagravenh phần EIS
- Sản phẩm EIS đầu tiecircn được phaacutet triển để sử dụng trecircn maacutey tiacutenh cấu higravenh cao nhưng caacutec sản phẩm hiện nay nhằm mục tiecircu lagrave nền tảng ClientServer
- Những nền tảng linh hoạt hơn coacute thể thiacutech ứng với thay đổi trong tổ chức vagrave cocircng nghệ
- Sử dụng dữ liệu thời gian thực dẫn đến quyết định nhanh hơn nhiều thocircng tin hơn
Thagravenh phần phần cứng- Một EIS khocircng đogravei hỏi coacute phần cứng cụ thể hoặc duy nhất nagraveo- Chigravea khoacutea của vấn đề lagrave để đảm bảo rằng caacutec thagravenh phần của EIS tối ưu hoacutea vagrave
phugrave hợp với tagravei nguyecircn maacutey tiacutenh của tổ chức- Hệ thống nagravey phải được cấu higravenh để caacutec nguồn tagravei nguyecircn phugrave hợp với những
người điều hagravenh chuacuteng
Thagravenh phần phần mềm- Traacutei ngược với phần cứng phần mềm thường được chuyecircn mocircn hoacutea cao cho caacutec
bagravei toaacuten về miền- Sự chuyecircn mocircn hoacutea nagravey thường đạt được bằng caacutech sử dụng thagravenh phần off-the-
shelf cho toagraven bộ EIS vagrave caacutec mocirc-đun tugravey chỉnh để đaacutep ứng nhu cầu cụ thể- Lotus Notes lagrave một viacute dụ điển higravenh Noacute coacute thể được sử dụng một migravenh hoặc coacute
thể phục vụ becircn thứ ba mocirc-đun plug-in
Cocircng nghệ EIS hiện nay
Dobrzeniecki đề xuấtphacircn loạitừng cấptheo bachức năng- Loại 1 sản phẩm bao gồmmột bộ đầy đủcaacutec ứng dụngtừ mộtnhagrave cung cấp- Loại 2 sản phẩm đượcthựchiệnở phần đầu củacaacutecsản phẩmDSS đượcphaacutet triển
bởicugravengmộtnhagrave cung cấp- Loại 3 sản phẩmkết hợp với nhautheo bất kỳ số lượngthuộc sở hữu củacocircng ty
65 Xacircy dựng EIS
- Xacircy dựngmộtEISgiống nhưxacircydựngmột số hệ thống khaacutec củamocirc higravenh hệ thống thocircng tin
- Việcphaacutet triểncấu truacutecnecircn được theo dotildeitừ quaacute trigravenh thiết kế đến quaacute trigravenhthực hiện
- Tuy nhiecircn một dự aacuten phaacutet triển EIScoacute xu hướnglagrave thống nhấtvagraveyecircu cầu hỗ trợ caacutec nhagrave quản lyacute latildenh đạo
- Xacircy dựng một EIScoacute thểphaacutet hiện ra đượccaacutectigravenh huống khoacute khănmagravemột nhagrave phaacutet triển chưabao giờ gặp phải
Mocirc higravenh EIS
Khung phaacutet triển một EIS
- Watson et al đề nghị xacircy dựngkhung với ba thagravenh phần+ Caacutech tiếp cận tập trung vagraveo yếu tốcon người vagrave dữ liệu coacute liecircn quan đến EIS+ Quaacute trigravenh phaacutet triển cần sự linh hoạt vagrave tương taacutec+ Người sử dụng - hệ thống hộp thoại bao gồm một ngocircn ngữ hagravenh động để xử lyacute caacutec lệnh
Lợi iacutech của EIS- Dễ duy trigrave caacutec mục tiecircu coacute tổ chức- Dễ truy xuất thocircng tin- Cho pheacutep người sử dụng nacircng cao hiệu suất hơn
- Tăng chất lượng ra quyết định- Cung cấp sự cải tiến cạnh tranh- Tiết kiệm thời gian của người sử dụng- Tăng khả năng vagrave chất lượng giao tiếp- Cung cấp khả năng điều khiển tốt hơn trong tổ chức- Cho pheacutep tham gia caacutec vấn đề vagrave caacutec cơ hội- Cho pheacutep hoạch định- Cho pheacutep tigravem kiếm nguyecircn nhacircn của một vấn đề- Thảo matilden caacutec yecircu cầu của người điều hagravenh
Hạn chế của EIS vagrave 1 số sai lầm cần traacutenh
- Chi phiacute một cuộc khảo saacutetnăm1991 chothấychi phiacute phaacutet triểntrungbigravenh365000USDvớichi phiacute vận hagravenhhagraveng năm lagrave$200000 (EIS)
- Cocircng nghệ hạn chếEIScần phảiđượctiacutech hợp hoagraven toagravenvagraveokiếntruacuteccủadoanh nghiệphiện tại do đoacute noacutelagrave một thaacutech thứclớn đối vớithiết kế
- Hạn chế tổ chức cơ cấu tổ chứccoacute thể khocircng phugrave hợp
Sự hạn chế về tổ chức- Chương trigravenh nghị sự vagrave thời gian chệch EIS mocirc tả một phần việc thực hiện một
chương trigravenh nghị sự vagrave coacute thể dễ dagraveng đạt được sự tin cậy một caacutech chắc chắn- Đồng bộ hoacutea việc quản lyacute sự tin cậy đuacuteng luacutec đặc biệt baacuteo caacuteo EIS coacute thể phaacute
vỡ sự ổn định thiết lập caacutec chu trigravenh baacuteo caacuteo một caacutech tốt nhất- Sự bất ổn EIS phản ứng nhanh coacute thể gacircy ra việc taacutec động trở lại một caacutech
nhanh choacuteng dẫn đến sự thiếu ổn định trong tổ chức
Sự thất bại lagrave thay thế khocircng thể chấp nhận được- Một số yếu tố lagravem EIS thất bại
+ Thiếu sự hỗ trợ về mặt quản lyacute+ Vấn đề chiacutenh trị+ Thất bại của nhagrave phaacutet triển+ Lỗi về cocircng nghệ+ Giaacute cả+ Thời gian
66 Ra quyết định điều hagravenh trong tương lai vagrave EIS
- Coacute một vagravei điều kiện sẽ được hợp nhất cho việc chuyển đổi cocircng nghệ Trong đoacute một vagravei điều kiện coacute thể dễ dự đoaacuten Hai điều kiện magrave ta coacute thể thấy lagrave+ Phaacutet triển cocircng nghệ maacutey tiacutenh trong việc điều hagravenh sẽ tạo ra sự chuyển đổi được chấp nhận một caacutech dễ dagraveng hơn+ Mở rộng traacutech nhiệm điều hagravenh sẽ mở rộng nhu cầu thocircng tin
Tương lai của EIS- EIS thocircng minh Những tiến bộ trong cocircng nghệ AI sẽ được triển khai trong caacutec
EIS- EIS đa phương tiện Cơ sở dữ liệu đa phương tiện sẽ cho pheacutep tiacutech hợp văn bản
giọng noacutei vagrave higravenh ảnh trong tương lai- EIS thocircng tin Tương lai EIS sẽ mở rộng hơn trong việc sử dụng dữ liệu becircn
ngoagravei doanh nghiệp- EIS kết nối Giao tiếp với băng thocircng rộng cho pheacutep kết nối liecircn thocircng lớn hơn
Chương 7 HỆ CHUYEcircN GIA VAgrave TRIacute TUỆ NHAcircN TẠO
71 Caacutec khaacutei niệm
72 Triacute thocircng minh của triacute tuệ nhacircn tạo
73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia
74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia
75 Lợi iacutech vagrave hạn chế của hệ chuyecircn gia
71 Caacutec khaacutei niệm
Chuyecircn mocircn (Expertise) sự hiểu biết rộng trong 1 lĩnh vực hẹp
Hệ chuyecircn gia (Expert Systems)1 chương trigravenh maacutey tiacutenh sử dụng 1 tập caacutec luật dựa trecircn tri thức của con người để giải quyết caacutec vấn đề đogravei hogravei phải coacute sự chuyecircn mocircn
Một số hệ chuyecircn gia nổi tiếng
DENDRAL (Standford 1960s Edward Feigenbaum)
MYCIN (Standford1970s Edward Shortliffe)
PROSPECTOR (MIT 1979)
Triacute tuệ nhacircn tạo (Artificial Intelligence ndash AI)
Triacute tuệ nhacircn tạo một bộ phacircn của ngagravenh khoa học maacutey tiacutenh quan tacircm đến việc thiết kế caacutec hệ thống maacutey tiacutenh thocircng minh đoacute lagrave caacutec hệ thống đưa ra caacutec đặc điểm magrave từ đoacute chuacuteng ta liecircn hệ với sự thocircng minh trong hagravenh động của con người (Barr vagrave Feigenbaum 1981)
Mục điacutech của AI
Mục điacutech khoa học xaacutec định caacutec gợi yacute để giải thiacutech caacutec loại khaacutec nhau của triacute tuệ thực
Mục điacutech kỹ thuật giải quyết caacutec vấn đề trong thế giới thực
Triacute tuệ nhacircn tạo kế thừa nhiều yacute tưởng quan điểm kỹ thuật từ caacutec ngagravenh khoa học khaacutec
- Triết học
- Logic Toaacuten học
- Tiacutenh toaacuten
- Khoa học tacircm lyacute Khoa học nhận thức
- Sinh học Thần kinh học
- Tiến hoacutea
Caacutec lĩnh vực ứng dụng trong Triacute tuệ nhacircn tạo
Mạng nơ ron thần kinh (Neural Networks)
Tiacutenh toaacuten sự tiến hoacutea
(Evolutionary Computation)
Hệ chuyecircn gia (Expert Systems)
Kỹ thuật xử lyacute tiếng noacutei (Speech Processing)
Kỹ thuật xử lyacute ngocircn ngữ tự nhiecircn
(Natural Language Processing)
Lập kế hoạch (Planning)
Robot (Robotics)
Khoa học higravenh ảnh (Vision)
Caacutec kỹ thuật thocircng dụng dugraveng trong AI
Biểu diễn(Representation)
Học (Learning)
Caacutec luật (Rules)
Tigravem kiếm (Search)
72 Triacute thocircng minh của triacute tuệ nhacircn tạo
Con người suy diễn như thế nagraveo
Phacircn loại (Categorization)
Caacutec quy tắc cụ thể
Heuristics
Kinh nghiệm trước đoacute
Dự tiacutenh trước
Maacutey tiacutenh suy diễn như thế nagraveo
Lập luận dựa trecircn luật IF-THEN mocirc tả tri thức được matilde hoacutea dưới dạng caacutec luật
Caacutec khung (Frames) lagrave caacutec đại diện mocirc tả caacutec tigravenh huống giống nhau lagrave điển higravenh của một vagravei phacircn loại
Lập luận dựa trecircn caacutec trường hợp mocirc phỏng giải phaacutep trước đoacute cho một vấn đề hiện tại
Nhận dạng mẫu phaacutet hiện acircm thanh higravenh dạng hoặc caacutec chuỗi dagravei
Caacutec dạng khaacutec của Triacute tuệ nhacircn tạo
Học maacutey- mạng nơron vagrave giải thuật di truyền
Lập trigravenh tự động ndash lagrave những kỹ thuật tạo ra caacutec chương trigravenh để lagravem 1 nhiệm vụ riecircng biệt (cho pheacutep những người khocircng phải lagrave người lập trigravenh coacute thể lập trigravenh được)
Cuộc sống nhacircn tạo ndash nỗ lực để taacutei tạo caacutec hiện tượng sinh học trong caacutec hệ thống dựa trecircn maacutey tiacutenh
73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia(Expert Systems- ES)
Theo Jackson (1999) Một hệ chuyecircn gia lagrave một chương trigravenh maacutey tiacutenh mocirc tả vagrave suy diễn với tri thức của một vagravei lĩnh vực để giải quyết vấn đề hay đưa ra caacutec lời khuyecircn
Cấu truacutec cơ bản của ES được dựa theo cấu truacutec chung của DSS Sự khaacutec biệt chiacutenh giữa ES vagraveDSS lagrave hệ ES thu thập caacutec kiến thức từ những
chuyecircn gia trong lĩnh vực quan tacircmĐặc trưng của hệ chuyecircn gia Hiệu quả cao Thời gian trả lời thỏa đaacuteng Độ tin cậy cao Dễ hiểu
Giao diện người dugraveng trong ES
Thiết kế giao diện người dugraveng tập trung vagraveo caacutec yếu tố như dễ dagraveng sử dụngcoacute độ tin cậy cao giảm tải những khoacute khăn khi sử dụng
Thiết kế necircn coacute một số tương taacutec (đầu vagraveo kiểm soaacutet vagrave truy vấn)
Cấu tạo giao diện người dugraveng gồm coacute magraven higravenh cảm ứng bagraven phiacutem buacutet saacuteng lệnh thoại caacutec phiacutem chuyecircn dụng
Cơ sở tri thức (Knowledge Base)
Chứa đựng caacutec tri thức cụ thể miền thu được từ caacutec chuyecircn gia miền
Coacute thể chứa caacutec mocirc tả caacutec hagravenh vi giải quyết vấn đề caacutec ragraveng buộc caacutec heuristics
Thagravenh cocircng của một ES dựa trecircn tiacutenh đầy đủ vagrave tiacutenh chiacutenh xaacutec của cơ sở tri thức
Mocirc tơ suy diễn (Inference Engine)
Ở đacircy tri thức được đặt để sử dụng tạo ra caacutec giải phaacutep để giải quyết vấn đề
Mocirc tơ nagravey coacute khả năng thực hiện diễn dịch hoặc suy diễn dựa trecircn caacutec luật hay caacutec caacutec sự kiện
Đồng thời cũng coacute khả năng sử dụng caacutec suy diễn mờ hay khocircng chiacutenh xaacutec dựa trecircn xaacutec suất hay aacutenh xạ mẫu
Vograveng điều khiển suy diễn
1 Aacutenh xạ caacutec luật với caacutec sự kiện đatilde được cho
2 Chọn luật để thực hiện
3 Thực hiện luật bằng caacutech thecircm caacutec sự kiện được suy diễn ra vagraveo bộ nhớ lagravem việc
Chuỗi suy diễn (Chaining)
Suy diễn tiến (forward chaining) maacutey suy diễn bắt đầu từ dữ liệu ban đầu vagrave thực hiện việc suy luận để đưa ra caacutec kết luận cuối cugraveng
Suy diễn lugravei (backward chaining) maacutey suy diễn bắt đầu từ dữ liệu điacutech vagrave tigravem ra tri thức hỗ trợ cho dữ liệu điacutech đoacute
Viacute dụ suy diễn lugravei
R1 Nếu coacute A vagrave B thigrave suy ra coacute D
R2 Nếu coacute B thigrave suy ra coacute C
R3 Nếu coacute C vagrave D thigrave suy ra coacute E
Ta coacute E ta xem trong 3 luật R1 R2 R3 luật nagraveo coacute E ta thấy R3 chứa E đồng thời chứa C vagrave D Xeacutet tiếp trong 2 luật R1 R2 luật nagraveo chứa C vagrave D R2 chứa C R3 chứa D Từ đoacute ta coacute được caacutec tri thức hỗ trợ suy diễn vagrave kết luận lagrave nếu coacute A vagrave B thigrave sẽ coacute E Hay nếu A vagrave B đuacuteng thigrave sẽ coacute E
Viacute dụ suy diễn tiến
Giả sử coacute tập chứa 3 luật sau
R1 Nếu coacute A vagrave B thigrave suy ra coacute D
R2 Nếu coacute B thigrave suy ra coacute C
R3 Nếu coacute C vagrave D thigrave suy ra coacute E
Nếu ta coacute A vagrave B thigrave chuacuteng ta suy ra được D từ R1 vagrave suy ra C từ R2 Với D vagrave C đatilde được suy ra ở trecircn giờ chuacuteng ta suy ra được E từ R3
Viacute dụ thực tế
Giả sử muốn biết magraveu của một con vật nuocirci tecircn lagrave Fred biết rằng noacute kecircu ộp ộp vagrave ăn ruồi
Coacute tập 4 luật ban đầu như sau
R1 Nếu X kecircu ộp ộp vagrave ăn ruồi thigrave X lagrave con ếch
R2 Nếu X kecircu chiecircm chiếp vagrave biết hoacutet thigrave X lagrave con chim
R3 Nếu X lagrave con ếch thigrave X coacute magraveu xanh
R4 Nếu X lagrave con chim thigrave X coacute magraveu vagraveng
74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia
Expert system shells lagrave một tập caacutec goacutei phần mềm vagrave caacutec cocircng cụ dugraveng để phaacutet triển caacutec hệ chuyecircn gia
Những Expert system shells đầu tiecircn thường rất rườm ragrave Mặc dugrave vậy noacute vẫn giuacutep cho người sử dụng sẽ khocircng phải bắt đầu lại từ đầu khi xacircy dựng một hệ chuyecircn gia mới
Những shell hiện đại bao gồm hai mocirc-đun chiacutenh lagrave cocircng cụ xacircy dựng một tập quy tắc vagrave mocirc tơ suy diễn
Xacircy dựng hệ chuyecircn gia
Bước 1 xacircy dựng mocirc higravenh bagravei toaacuten xaacutec định vấn đề nhiệm vụ magrave hệ thống sẽ thực hiện Caacutec dạng bagravei toaacuten cần hệ chuyecircn gia
Bagravei toaacuten diễn giải (InterPretation)
Bagravei toaacuten dự baacuteo (Prediction)
Bagravei toaacuten chuẩn đoaacuten (Diagnose)
Bagravei toaacuten gỡ rối (Debugging)
Bagravei toaacuten thiết kế
Tương tự như một dự aacuten phần mềm để xacircy dựng một hệ chuyecircn gia cần phải coacute caacutec yếu tố về nhacircn lực tagravei nguyecircn vagrave thời gian Những yếu tố nagravey ảnh hưởng đến giaacute thah của một hệ chuyecircn giaTrong phần nagravey cacircu hỏi thường được đặt ra lagrave tại sao cần phải xacircy dựng một hệ chuyecircn giaTrước khi bắt đầu phải xaacute định rotilde bagravei toaacuten đạt ra lagrave jiAi lagrave chuyecircn giaAi lagrave người sử dụng
1 Diễn giải (InterPretation) Nghiecircn cứu 1 vấn đề -gt Dựa trecircn những biểu hiện thuộc tiacutenh đặc trưng becircn ngoagravei -gt Tư vấn
(hoặc đưa ra kết luận hay mocirc tả dễ hiểu từ tập dữ liệu thocirc)
2 Bagravei toaacuten dự baacuteo (Prediction) Coacute thể dự đoaacuten được hagravenh vi kết quả dựa trecircn caacutec hiện tượng -gt dự baacuteo
VD Dự baacuteo thời tiết động đấthellip
3 Bagravei toaacuten chẩn đoaacuten (Diagnoss) Xaacutec định caacutec lỗi caacutec bộ phận hỏng hoacutec của hệ thống dựa trecircn caacutec dữ liệu quan saacutet được
4 Bagravei toaacuten gỡ rối (Debugging) Mocirc tả caacutec phương phaacutep khắc phục hệ thống khi gặp sự cố
5 Bagravei toaacuten thiết kế Lựa chọn cấu higravenh caacutec đối tượng nhằm thoả matilden một số ragraveng buộc nagraveo đoacute
6 Giảng dạy Phần mềm dạy học coacute thể chuẩn đoaacuten vagrave sủa lỗi của học sinh trong quaacute trigravenh học tập
Để xaacutec định đuacuteng bagravei toaacuten magrave chuacuteng ta cần giải quyết thigrave phải trả lời đc một số cacircu hỏi
- cần hệ chuyecircn gia
Bước 2 thu thập tri thức lựa chọn cocircng cụ vagrave aacutep dụng
Trong bước thu thập tri thức vấn đề quan trọng lagrave lựa chọn chuyecircn gia những người magrave sẽ đoacuteng goacutep tri thức cho hệ thống Thocircng thường trong suốt quaacute trigravenh phaacutet triển thigrave chuyecircn gia được xem như một thagravenh viecircn của đội phaacutet triển
Hiện nay coacute rất nhiều cocircng cụ để xacircy dựng một hệ chuyecircn gia Phổ biến nhất lagrave JESS CLIPS vagrave OPS5
Bước 3 Thiết kế cơ sở tri thức thiết kế hệ thốngTri thức được biểu diễn trường minh trong cơ sở tri thức
Caacutec chuyecircn gia vagrave kỹ sư tri thức sẽ đối thoại với nhau bằng caacutec kỹ thuật đối thoại Suy diễn (SD) bảng Mocirc higravenh hoacutea SD quy nạp phacircn loại
Vấn đề bagraveo trigrave vagrave phaacutet triển
Caacutec hệ chuyecircn gia đogravei hỏi phải bảo trigrave vagrave phaacutet triển nhiều hơn so với caacutec hệ thống khaacutec Phải thường xuyecircn bổ sung tri thức mới vagrave thay đổi caacutec tri thức cũ để đổi mới hệ chuyecircn gia
Thu thập vagrave khắc phục lỗi do người sử dụng phaacutet hiện để kịp thời khắc phục những sai soacutet của hệ chuyecircn gia
75 Lợi iacutech vagrave hạn chế của caacutec hệ chuyecircn gia
Một số lợi iacutech chiacutenh
Thời gian trả lời hợp lyacute bằng hoặc nhanh hơn so với chuyecircn gia (người) để đi đến cugraveng một quyết định Hệ chuyecircn gia lagrave một hệ thống thời gian thực (real time system)
Khả năng trả lời với mức độ tinh thocircng bằng hoặc cao hơn so với chuyecircn gia (người) trong cugraveng lĩnh vực
Hệ chuyecircn gia giuacutep cho hiệu quả lagravem việc tăng bằng việc sử dụng tập caacutec luật một caacutech nhanh choacuteng magrave ko bị nhầm lẫn chuyecircn gia lagrave người coacute thể quecircn đi một số tri thức cơ sở lyacute luậ nhưng HCG thigrave ko
Quyết định của một người chuyecircn gia coacute thể bị thay đổi vagrave ko coacute tiacutenh thống nhất như quyết định của một hệ chuyecircn gia tạo ra
Hệ chuyecircn gia giuacutep cho người sử dụng coacute thể trau dồi sự hiểu biết trecircn lĩnh vuej cụ thể magrave noacute giải quyết hỗ trợ người ra quyết định coacute trigravenh độ như 1 chuyecircn gia trong quaacute trigravenh gia quyết định
Kiến thức của rất nhiều chuyecircn gia về một lĩnh vực nagraveo đoacute được đưa vagraveo hệ chuyecircn gia lagravem cho CSTT cuat HCG phong phuacute vagrave rộng lớn hơn rất nhiều
HCG giải thiacutech caacutec bước suy luận một caacutech dễ hiểu nhất quaacuten luacutec nagraveo cũng coacute thể sử dụng ko như chuyecircn gia con người
Hạn chế của caacutec hệ chuyecircn gia
Nhược điểm lớn nhất của hệ chuyecircn gia lagrave những yacute kiến chuyecircn mocircn thường rất khoacute matilde hoacutea vagrave giải neacuten
Hệ chuyecircn gia khocircng coacute khả năng tự học tự cập nhật kiến thức mới như caacutec chuyecircn gia magrave cần phải được matilde hoacutea lại khi noacute được cập nhật
Hệ chuyecircn gia khocircng thể nhận ra được vấn đề khocircng nằm trong miền kiến thức của hệ thống
Chương 8 Tri thức vagrave tiếp nhận
1 Bao gồm caacutec vấn đề
Dữ liệu thực tế đo lường hoặc quan saacutet coacute hoặc khocircng coacute bối cảnh
Thocircng tin dữ liệu được tổng hợp một caacutech hữu iacutech để giải quyết những khoacute khăn trong việc đưa ra quyết định
Tri thức bao gồm caacutec ứng dụng quy tắc thocircng tin hướng dẫn của người ra quyết định
2 Những caacutei nhigraven về tri thức
Đại diện lagravem thế nagraveo để diễn tả tri thức viacute dụ như một quyển saacutech khocircng phải lagrave tri thức nhưng noacute lại lagrave một đại diện của tri thức
Sản xuất tri thức lagrave một tập hơp của hagraveng tồn kho coacute thể được sản xuất cũng như mua lại
Tri thức lagrave 1 trong 6 trạng thaacutei của hệ thống
1Dữ liệu 2Thocircng tin 3Cấu truacutec thocircng tin 4Sự thấu hiểu 5Yacute kiến 6 Quyết định
3 Caacutec loại tri thức Phổ biến mocirc tả dữ liệu thocircng tin thủ tục mọi thứ lagravem như thế nagraveo lập luận chiacutenh saacutech hoặc caacutec quy tắc
4 Thu thập Tri thức hệ chuyecircn gia Hầu hết caacutec phương phaacutep đều bắt đầu với mocirc higravenh của caacutec taacutec vụ trong đoacute
hệ chuyecircn gia được xacircy dựng Trong đoacute mocirc tả về caacutec lĩnh vực được tạo ra Caacutec kỹ sư sử dụng caacutec mocirc higravenh giả thuyết vagrave nhận thức về quaacute trigravenh phacircn
tiacutech để gợi ra caacutech giải quyết vấn đề về tri thức từ caacutec chuyecircn gia
5 Caacutec chiều của thu thập tri thức KE- driven caacutec kỹ sư trao đổi trực tiếp với caacutec chuyecircn gia Expert-driven Caacutec chuyecircn gia trực tiếp đưa chuyecircn mocircn của họ vagraveo hệ
thống maacutey tiacutenh Machine-driven Sử dụng caacutec cocircng cụ suy luận để triacutech xuất tri thức từ một
tập caacutec viacute dụ
6 Kỹ thuật thu thập tri thức Trao đổi gồm 2 loại cơ bản lagrave coacute cấu truacutec(coacute kịch bản) vagrave khocircng coacute cấu
truacutec( đối thoại trực tiếp) Giao thức phacircn tiacutech bằng lời Khi caacutec chuyecircn gia thực hiện một cocircng việc
của họ thigrave một bản ghi về cocircng việc đoacute được thực hiện Caacutec kỹ sư sẽ xacircy dựng mocirc higravenh cho những gigrave được ghi lại trong bản ghi
Phương phaacutep sagraveng lọc caacutec chuyecircn gia so saacutenh caacutec nhoacutem liecircn tiếp trong ba đối tượng vagrave cho biết tại sao nhoacutem thứ hai lại khaacutec nhoacutem thứ ba
7 Thu thập tri thức từ nhiều nguồn Thu thập tri thức từ nhiều nguồn lagrave cần thiết để coacute được đầy đủ caacutec tri thức
cho một vấn đề quan điểm yacute kiến traacutei ngược nhau thường phaacutet sinh Phương phaacutep đồng thuận sẽ giuacutep giải quyết được vấn đề macircu thuẫn Kỹ thuật phacircn tiacutech Meta lagrave kỹ thuật được aacutep dụng trong caacutec trường hợp
khaacutec Caacutech tiếp cận bằng định lượng đogravei hỏi caacutec kỹ sư cần cacircn nhắc yếu tố đầu vagraveo của caacutec chuyecircn gia khaacutec nhau
8 Xaacutec nhận hợp lệ vagrave kiểm tra tri thức Một khi thu thập tri thức noacute phải được đaacutenh giaacute về khả năng sử dụng vagrave độ
chiacutenh xaacutec Hai vấn đề cụ thể lagrave hiệu lực của những kiến thức vagrave kiểm tra việc xacircy dựng cơ sở của tri thức
Cần xaacutec nhận xem liệu hệ thống coacute thể hoạt động ở mức độ tối thiểu khocircng
Xaacutec minh liecircn quan đến việc so saacutenh từng chi tiết kỹ thuật của hệ thống những gigrave đatilde được thực hiện cuối cugraveng
9 Một số caacutec biện phaacutep xaacutec nhận Độ chiacutenh xaacutec Khả năng thiacutech nghi Mức độ đầy đủ Bề rộng Độ sacircu Hiệu lực Tổng quan Chiacutenh xaacutec Hiện thực Độ tin cậy Tiacutenh hữu dụng Mức độ
Chương 9 Học maacutey
1 Logic mờ vagrave ngocircn ngữ mờ(Fuzzy Logic and Linguistic Ambiguity)
Ngocircn ngữ tự nhiecircn gồm những khaacutei niệm mơ hồ vagrave khocircng chiacutenh xaacutectruyền tải ngữ nghĩa thocircng qua tiacutenh xấp xỉkhocircng rotilde ragraveng
Những xấp xỉ nagravey giuacutep con người coacute thể truyền tải hết được yacute nghĩa nhưng maacutey thigrave khocircng hiểu
Lagravem sao biểu diễn caacutec tri thức sử dụng caacutec khaacutei niệm khocircng rotilde ragraveng(mờ) hoặc khocircng chiacutenh xaacutec
2 Khaacutei niệm cơ bản của logic mờ tập mờ lagrave những tập hợp khocircng coacute một giới hạn rotilde Mỗi phần tử của noacute chỉ
chứa một mức độ hagravem liecircn thuộc của từng phần tử Vigrave vậy tập mờ khocircng giống như tập cổ điển Tập mờ coacute thể kết hợp với nhau qua những luật mờ magrave đặc trưng cho những hagravenh động trạng thaacutei vagrave thuộc tiacutenh của logic mờ được tận dụng khi thực hiện một bộ điều khiển mờ
Logic mờ dựa trecircn yacute tưởng mỗi phần tử thuộc vagraveo một tập hợp ở một mức độ nagraveo đấy
Locircgic mờ cho pheacutep độ liecircn thuộc (microA )coacute giaacute trị trong khoảng (01) Locircgic mờ coacute thể được coi lagrave mặt ứng dụng của lyacute thuyết tập mờ để xử lyacute caacutec
giaacute trị trong thế giới thực cho caacutec bagravei toaacuten phức tạp
3 So saacutenh tiacutenh đuacuteng đắn logic mờ vagrave xaacutec suất Xaacutec suất thigrave đề cập đến khả năng xảy ra một biến cố hay một điều gigrave đoacute Logic mờ đề cập đến cấp độ magrave đặc tiacutenh ở hiện tại
o viacute dụ1 người coacute chiều cao 6 feet thigrave coacute cấp độ lagrave 05 về chiều cao
4 Ưu điểm của logic mờ Caacutech tiếp cận rất tự nhiecircnkhocircng phức tạp Coacute thể mocirc higravenh hoacutea caacutec hagravem phi tuyến tugravey yacute phức tạp
Coacute thể tận dụng được kinh nghiệm từ những chuyecircn gia hagraveng đầu trong mọi lĩnh vực
Logic mờ được xacircy dựng dựa trecircn ngocircn ngữ tự nhiecircnNền tảng của logic mờ lagrave dựa trecircn cơ sở giao tiếp của con người
5 Nhược điểm của logic mờ Trong 1 hệ thống phức tạpsử dụng logic mờ coacute thể trở thagravenh trở ngại cho
việc xaacutec thực độ tin cậy của hệ thống Cơ chế lập luận mờ khocircng thể học hỏi từ những lỗi sai
6 Mạng noron nhacircn tạo(ANN) Mạng noron nhacircn tạo lagrave một mocirc phỏng xử lyacute thocircng tinđược nghiecircn cứu ra
từ hệ thống thần kinh của sinh vậtgiống như bộ natildeo để xử lyacute thocircng tin ANNs lagrave chương trigravenh dựa trecircn maacutey tiacutenh đơn giản coacute chức năng lagrave một mocirc
higravenh bagravei toaacuten khocircng gian dựa trecircn thử nghiệm vagrave baacuteo lỗi
7 Học từ kinh nghiệm Tiến trigravenh Một mẫu dữ liệu được biểu diễn như một mạng lưới noronANN ldquodự
đoaacutenrdquo 1 đầu radự đoaacuten được so saacutenh với giaacute trị thực tế hoặc giaacute trị chiacutenh xaacutecNếu đoaacuten được chiacutenh xaacutec thigrave khocircng coacute hagravenh động nagraveo được thực hiện
Nếu dự đoaacuten sai ANN kiểm tra lại vagrave xaacutec định lại thocircng số để điều chỉnh Một mẫu dữ liệu khaacutec được biểu diễn vagrave quaacute trigravenh nagravey được lặp lại
8 Nguyecircn tắc cơ bản của cocircng nghệ nơron Caacutec yếu tố xử lyacute cơ bản trong hệ thống thần kinh của con người lagrave tế bagraveo
thần kinhMạng lưới của tế bagraveo nagravey lagrave liecircn kết với nhau nhận được thocircng tin từ caacutec cảm biến trong mắt taihellip
Thocircng tin nhận được bởi tế bagraveo thần kinh hoặc lagrave sẽ kiacutech thiacutech noacute(sẽ được chuyển qua 1 thocircng điệp dọc theo mạng lưới) hoặc lagrave sẽ ngăn cản noacute(ngăn cản dograveng thocircng tin)
Độ nhạy coacute thể thay đổi qua thời gian hoặc sau khi coacute được kinh nghiệm
9 Cấu truacutec mạng Một ANN gồm 3 lớp cơ bản
Lớp đầu vagraveo nhận dữ liệu Lớp becircn trong hoặc lagrave lớp ẩn xử lyacute dữ liệu Lớp đầu ra chuyển tiếp kết quả cuối cugraveng của mạng
10Mạng nơ ron Thường coacute nhiều đầu vagraveo mỗi đầu vagraveo với mức ảnh hưởng vagrave tầm quan
trọng riecircng của noacute Một đầu vagraveo quan trọng coacute thể được sử dụng để khuếch đại đầu ra caacutec hagravem trạng thaacutei tổng hợp caacutec trọng số của caacutec yếu tố
đầuvagraveo khaacutec nhauvagraveo một giaacute trị duy nhất Caacutec hagravem chuyển giao xử lyacute caacutec giaacute trị trạng thaacutei vagrave tạo đầu ra
11Huấn luyện mạng nơ ron Trong mocirc higravenh coacute giaacutem saacutetANN được đến so saacutenh dự đoaacuten của chiacutenh
noacute với thocircng tin phản hồi coacute chứa caacutec kết quả mong muốn ANN sẽ phải tigravem caacutech thay đổi caacutec tham số becircn trong củamigravenh (caacutec trọng số vagrave caacutec ngưỡng) để tạo necircn một aacutenh xạ coacute khả năng aacutenh xạcaacutec đầu vagraveo thagravenh caacutec đầu ra mong muốn Sự thay đổi nagravey được tiến hagravenh nhờ việc so saacutenh giữa đầu ra thực sự vagrave đầu ra mong muốn
Trong mocirc higravenh khocircng coacute giaacutem saacutetANN nhận được dữ liệu vagraveo nhưng khocircng phải coacute bất kỳ thocircng tin phản hồi về kết quả mong muốn
Phần lớn caacutec ứng dụng nằm trong vugraveng của caacutec bagravei toaacuten ước lượng như mocirc higravenh hoacuteathống kecirc neacuten lọc phacircn cụm
12Lợi iacutech Liecircn kết với mạng noron Traacutenh caacutech lập trigravenh tường minh Giảm nhu cầu của chuyecircn gia ANNs thigrave thiacutech nghi với caacutec yếu tố đầu vagraveo thay đổi Khocircng cần thiết cho cơ sở tri thức tinh chế ANNs coacute tiacutenh động vagrave cải thiện với việc sử dụng Coacute khả năng xử lyacute dữ liệu khocircng chiacutenh xaacutec hoặc khocircng đầy đủ Cho pheacutep tổng quaacutet hoacutea từ thocircng tin cụ thể Cho pheacutep thu thập cảm giaacutec thocircng thường vagraveo miền giải quyết vấn đề
13Hạn chế của việc liecircn kết với mạng noron ANNs khocircng thể giải thiacutech được suy luận Bản chất hộp đen thường khiến cho vấn đề traacutech nhiệm vagrave độ tin cậy phaacutet
sinh lagrave khoacute khăn Lặp đi lặp lại quaacute trigravenh huấn luyện rất tốn thời gian Nguồn lực caacutec nhagrave phacircn tiacutech vagrave thiết kế coacute tay nghề cao vẫn lagrave đaacuteng lo
ngại Cocircng nghệ ANN thuacutec đẩy hạn chế của phần cứng hiện tại ANN yecircu cầu phải coacute sự tin tưởng ở đầu ra
14Giới thiệu về thuật toaacuten di truyền Cũng như mạng lưới thần kinh caacutec thuật toaacuten di truyền được dựa trecircn lyacute
thuyết sinh học Thuật toaacuten di truyền tigravem thấy nguồn gốc của chuacuteng trong caacutec lyacute thuyết
tiến hoacutea của chọn lọc tự nhiecircn vagrave thiacutech ứng với biến đổi khiacute hậu Kết quả thuật toaacuten di truyền lagrave từ giao phối 2 caacute thể trong quần thế để tạo
ra con caacutei đocirci khi tốt hơn so với bậc cha mẹ của chuacuteng 15Caacutec thagravenh phần cơ bản của thuật toaacuten di truyền
Toaacuten tử chọn lọc Caacutec caacute thể tốt được chọn lọc để đưa vagraveo thế hệ sau Sự chọn lọc nagravey căn cứ vagraveo độ thiacutech nghi với mocirci trường của mỗi caacute thể
Toaacuten tử lai gheacutep (crossover) Hai caacute thể cha vagrave mẹ trao đổi caacutec gen với nhau để tạo ra caacute thể con
Toaacuten tử đột biến (mutation) Một caacute thể thay đổi một số gen để biến đổi thagravenh một caacute thể mớiTất cả caacutec toaacuten tử trecircn khi thực hiện đều mang tiacutenh ngẫu nhiecircn
16Quaacute trigravenh cơ bản của một thuật toaacuten di truyền Khởi tạo
Đaacutenh giaacute quần thể
Lựa chọn NST thiacutech hợp nhất vagrave loại bỏ NST yếu nhất
Quy trigravenh giao nhau vagrave cải thiện quần thể
đột biến tiến trigravenh để khaacutem phaacute ra NST mới
17Ưu nhược điểm của việc kết hợp với thuật toaacuten di truyền Kiacutech thước quần thể lagrave 1 yếu tố quan trọng trong tốc độ của việc tigravem
kiếmnhưng noacute tương đối dễ dagraveng để dự đoaacuten tốc độ nagravey Giao nhau hoặc đột biến lagrave khocircng necircn đc sử dụng quaacute thường xuyecircn Luocircn coacute được iacutet nhất 1 giải phaacutep hợp lyacute Necircn coacute thể aacutep dụng chuacuteng cho caacutec vấn đề magrave chuacuteng ta khocircng coacute hướng
về caacutech giải quyết Sức mạnh của thuật toaacuten xuất phaacutet từ khaacutei niệm đơn giảnkhocircng phải từ
một thủ tục thuật toaacuten phức tạp 18Tương lai của học maacutey
Mạng lưới thần kinh nhacircn tạo vượt quaacute năng lực của con người trong caacutec trường hợp bị cocirc lập
Về mặt lyacute thuyếtmột maacutey tiacutenh coacute thể xử lyacute dũ liệu nhanh hơn hagraveng triệu lần so với 1 con người
May mắn thay cho chuacuteng tacon người tốt hơn nhiều khi magrave coacute được dữ liệumaacutey tiacutenh khocircng coacute 1 số thứ như lagrave 5 giaacutec quan
CHƯƠNG 10 KHO DỮ LIỆU
1 Kho dữ liệu Kho dữ liệu lagrave tuyển tập caacutec cơ sở dữ liệu tiacutech hợp hướng chủ đề được
thiết kế để trợ giuacutep cho một hệ hỗ trợ quyết định
Theo John Ladley Cocircng nghệ kho dữ liệu lagrave tập caacutec phương phaacutep kỹ thuật vagrave caacutec cocircng cụ coacute thể kết hợp hỗ trợ nhau để cung cấp thocircng tin cho người sử dụng trecircn cơ sở tiacutech hợp từ nhiều nguồn dữ liệu nhiều mocirci trường khaacutec nhau
Kho dữ liệu thường rất lớn tới hagraveng trăm GB hay thậm chiacute hagraveng Terabyte
2 Kho dữ liệu vận hagravenh (ODS) Một kho dữ liệu vận hagravenh Aacutep dụng kỹ thuật kho dữ liệu vagraveo caacutec hệ xử
lyacute giao taacutec lưu trữ dữ liệu cho một ứng dụng đặc thugrave Noacute đưa vagraveo kho dữ liệu một dograveng caacutec dữ liệu thocirc được thiết kế
3 So saacutenh
Kho dữ liệu vận hagravenh Kho dữ liệu
Dữ liệu theo chủ đề Dữ liệu theo chủ đề
Dữ liệu tiacutech hợp Dữ liệu tiacutech hợp
Dữ liệu thay đổi Dữ liệu khocircng thay đổi
Dữ liệu được cập nhật khi thay đổi
Dữ liệu giữ nguyecircn
Chỉ coacute dữ liệu hiện tạiDữliệu hiện tại vagrave dữ liệu lịch sử
Chu kỳ lagravem tươi dữ liệu ngắn Chu kỳ lagravem tươi dữ liệu dagravei
Chỉ coacute dữ liệu chi tiết Dữ liệu chi tiết vagrave dữ liệu tổng kết
Dugraveng cho caacutec quyết định ngắn hạn
Dugraveng cho hoạch định dagravei hạn
4 Kho dữ liệu cục bộ (Data Mart - DM)
Kho dữ liệu cục bộ lagrave CSDL coacute những đặc điểm giống với kho dữ liệu nhưng với quy mocirc nhỏ hơn vagrave lưu trữ dữ liệu về một lĩnh vực một chuyecircn ngagravenh
Data mart phụ thuộc Chứa những dữ liệu được lấy từ DW vagrave những dữ liệu nagravey sẽ được triacutech lọc vagrave tinh chế tiacutech hợp lại ở mức cao hơn để phục vụ một chủ đề nhất định của Datamart
Data mart độc lập Khocircng giống như Datamart phụ thuộc Data mart độc lập được xacircy dựng trước DW vagrave dữ liệu được trực tiếp lấy từ caacutec nguồn khaacutec nhau
5 Siecircu dữ liệu Metadata lagrave dữ liệu để mocirc tả dữ liệu Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột
một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi Metadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu
6 Mocirci trường kho dữ liệu Hệ thống của tổ chức vagrave kho cung cấp dữ liệu để xacircy dựng kho dữ liệu Trong quaacute trigravenh chuyển dữ liệu từ caacutec nguồn khaacutec nhau dữ liệu coacute thể
được lagravem sạch hoặc chuyển đổi vagrave vigrave thế DW được xem như lagrave một chuẩn cho việc lưu trữ
Đồng thời siecircu dữ liệu được ghi lại Cuối cugraveng DW hoặc siecircu thị coacute thể được sử dụng để tạo ra một kho dữ
liệu ldquocaacute nhacircnrdquo 7 Caacutec đặc điểm của kho dữ liệu
Đặc điểm Mocirc tả
Hướng chủ đề - DL tổ chức theo caacutech thức người dugraveng tham chiếu
Tiacutech hợp - Dữ liệu ldquosạchrdquo loại bỏ tiacutenh thiếu nhất quaacuten
Khocircng thay đổi - DL ldquochỉ đọcrdquo người dugraveng khocircng thay đổi được
Chuỗi thời gian - DL lagrave chuỗi thời gian khocircng phải lagrave trạng thaacutei hiện tại
Được tổng kết - DL vận hagravenhthao taacutec khi cần thiết
được kết hợp lại thagravenh dạng coacute thể dugraveng được cho quyết định
Kiacutech cỡ lớn hơn - Lưu giữ theo chuỗi thời gian tức lagrave giữ lại nhiều DL
Khocircng được chuẩn hoacutea - Coacute thể dư thừa DLSiecircu dữ liệu - Dữ liệu của dữ liệu được lưu trữNguồn dữ liệu - DL vận hagravenh (caacutec hệ sẵn coacute) cugraveng
với caacutec nguồn ngoagravei 8 Kho dữ liệu hướng chủ đề
Hướng chủ để coacute nghĩa lagrave kho dữ liệu được tổ chức xung quanh caacutec chủ đề chiacutenh như khaacutech hagraveng sản phẩm sản xuất Tập trung vagraveo việc mocirc higravenh hoacutea vagrave phacircn tiacutech dữ liệu cho caacutec nhagrave ra quyết định magrave khocircng tập trung vagraveo caacutec xử lyacute thocircng thường Cung cấp cho người dugraveng một khung nhigraven toagraven vẹn đơn giản vagrave đầy đủ về caacutec sự kiện quanh caacutec chủ đề
9 Dữ liệu trong DW được tiacutech hợp Dữ liệu trong kho dữ liệu được xacircy dựng bằng caacutech tổng hợp dữ liệu từ
nhiều nguồn khaacutec nhau vagrave caacutec nguồn coacute tổ chức khaacutec nhau Cơ sở dữ liệu caacutec file excel caacutec flat file hoặc caacutec raw file Khi đưa vagraveo kho dữ liệu caacutec dữ liệu được lagravem sạch vagrave tiacutech hợp dữ liệu nhằm đảm bảo tiacutenh nhất quaacuten của dữ liệu
10Kiến truacutec kho dữ liệu Tầng cơ sở dữ liệu hoạt động Tầng truy xuất thocircng tin Tầng truy xuất dữ liệu Tầng siecircu dữ liệu Tầng quản lyacute tiến trigravenh Tầng thocircng điệp của ứng dụng Tầng vật liacute của kho dữ liệu Tầng trigravenh diễn dữ liệu
11Higravenh trạng kho dữ liệu Kho dữ liệu ảo - người dugraveng cuối coacute thể truy cập trực tiếp đến kho dữ liệu
sử dụng caacutec cocircng cụ cho pheacutep ở tầng truy xuất dữ liệu Kho dữ liệu trung tacircm-1 cơ sở dữ liệu vật lyacute chứa tất cả dữ liệu cho một
vugraveng chuyecircn dụng nagraveo đoacute
Kho dữ liệu phacircn taacuten- Thagravenh phần được phacircn taacuten qua nhiều hệ cơ sở dữ liệu vật lyacute
12METADATA- Siecircu dữ liệu Định nghĩa Siecircu dữ liệu lagrave dữ liệu về dữ liệu Lagrave 1 lưu trữ dugraveng để
Miecircu tả kho dữ liệu tổng thể Nhận dạng kiểu kho dữ liệu Quản liacute quaacute trigravenh tiacutech hợp dữ liệu Quản liacute quaacute trigravenh cập nhật kho dữ liệu Quản liacute bảo mật
Lagrave chigravea khoacutea quyết định sự thagravenh cocircng của kho dữ liệu luocircn được thay đổi vagrave cập nhật theo sự phaacutet triển của kho dữ liệu
Dugraveng để quản liacute điều khiển kho dữ liệu Sự ra đời của kho dữ liệu như 1 cấu truacutec hỗ trợ ra quyết định siecircu dữ liệu
được xem như nguồn tagravei nguyecircn dữ liệu Siecircu dữ liệu lagrave trừu tượng Chuacuteng lagrave dữ liệu bậc cao cung cấp mocirc tả ngắn
gọn caacutec dữ liệu bậc thấp hơn 13Hoạt động của Siecircu dữ liệu
Siecircu dữ liệu rất cần thiết trong việc chuyển hoacutea thocircng tin trở thagravenh tri thức Lagrave chigravea khoacutea giuacutep chuacuteng ta xử lyacute được dữ liệu thocirc Viacute dụ một dograveng dữ liệu baacuten hagraveng 1023 K596 11121 agraveNoacute sẽ khocircng coacute nghĩa gigrave cho đến khi chuacuteng ta đưa vagraveo siecircu dữ liệu (thư
mục chứa dữ liệu) agrave cửa hagraveng 1023 sản phẩm K596 vagrave số tiền baacuten được lagrave 11121 đocirc la
14Sự cần thiết phải nhất quaacuten trong kho dữ liệu Kho dữ liệu được xacircy dựng cho lợi iacutech của những nhagrave phacircn tiacutech kinh
doanh caacutec nhagrave quản trị cho tất cả caacutec khu vực chức năng Trong cơ sở dữ liệu riecircng caacutec khu vực khaacutec nhau coacute thể định nghĩa vagrave lưu
trữ dữ liệu thocircng qua phiecircn bản của chiacutenh noacute Khi dữ liệu được lấy từ những vugraveng khaacutec nhau đoacute vagrave được đặt vagraveo kho dữ
liệu Việc chuyển đổi vagrave lagravem sạch caacutec tiến trigravenh sẽ đảm bảo noacute lagrave duy nhất được tiacutech hợp tại một mức của tổ chức
15Ragrave soaacutet lại dữ liệu ndash Thực thi siecircu dữ liệu
Bất kể cấu truacutec tự nhiecircn của 1 cacircu truy vấn thế nagraveo thigrave caacutec thagravenh phần của siecircu dữ liệu rất quan trọng đối với người ra quyết định
Bảng thuộc tiacutenh khoacutea được lưu trữ bởi kho dữ liệu Tập hợp dữ liệu được lấy từ đacircu Những chuyển đổi nagraveo được thực thi với việc lagravem sạch
16Siecircu dữ liệu lagrave gigrave Metadata - lagrave thocircng tin mocirc tả nội dung của cơ sở dữ liệu (CSDL) Metadata baacuteo cho người dugraveng biết thời gian cập nhật sau cugraveng của dữ liệu
định dạng vagrave mục điacutech sử dụng của noacute Những thocircng tin nagravey coacute thể hướng dẫn người dugraveng duyệt qua CSDL vagrave
giuacutep họ hiểu được yacute nghĩa vagrave ngữ cảnh của dữ liệu Trong CSDL metadata lagrave caacutec dạng biểu diễn khaacutec nhau của caacutec đối tượng
trong CSDL Trong CSDL quan hệ metadata lagrave caacutec định nghĩa của bảng cột CSDL
view vagrave nhiều đối tượng khaacutec Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột
một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi -gtMetadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu
Bảng chuyển đổi Ghi lại những chuyển đổi đatilde được thực hiện
Lịch sử thực thi Ghi lại những dữ liệu đatilde được
phacircn tiacutech
Higravenh thaacutei kết nốiGhi lại những dữ liệu được kết nối vagrave tần suất
17Aacutenh xạ thocircng thường của siecircu dữ liệu Bản ghi aacutenh xạ chuyển đổi bao gồm
Định danh của nguồn gốc Chuyển đổi thuộc tiacutenh Chuyển đổi thuộc tiacutenh vật lyacute Matilde hoacutea tham chiếu bảng chuyển đổi Đổi tecircn Đổi khoacutea Gaacuten giaacute trị cho thuộc tiacutenh mặc định Chọn logic cho caacutec nguồn nhiều giaacute trị Đổi thuật toaacuten
18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để
phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai
lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave
tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec
Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm
Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo
19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua
caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau
SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được
Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra
một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức
Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ
Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ
Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech
CHƯƠNG 11 KHAI PHAacute DỮ LIỆU
1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn
ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993
Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng
2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd
1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều
2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP
3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn
4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng
5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server
6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo
7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động
8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời
9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều
10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện
11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech
12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP
3 Xử lyacute phacircn tiacutech trực tuyến OLAP
MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave
dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu
ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave
thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu
HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave
ROLAP4 Khai phaacute dữ liệu
Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh
khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn
Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan
5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp
6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại
Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp
Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec
Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt
Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra
Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh
vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho
Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec
Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm
Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục
Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng
gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp
Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn
Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec
Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper
Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2
Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25
Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước
Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng
Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện
trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp
Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute
độ hỗ trợ ge ngưỡng minsup
độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan
Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn
Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết
Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu
MOLAP ROLAP HOLAP
Lưu trữ dữ liệu cơ sở
Khối Bảng quan hệ Bảng quan hệ
Lưu trữ thocircng tin tổng hợp
Khối Bảng quan hệ Khối
Hiệu suất thực hiện truy vấn
Nhanh nhất Chậm nhất Nhanh
Tiecircu thụ khocircng gian lưu trữ
Nhiều Thấp Trung bigravenh
Chi phiacute bảo trigrave Cao Thấp Trung bigravenh
1048713 Tiết kiệm thời gian tiacutenh toaacuten vagrave do vậy tiết kiệm thời gian thực trong ra quyết định Một số vấn đề phức tạp đến nỗi chỉ coacute thể giải được bằng heuristics 1048713 Thường sinh ra nhiều giải phaacutep chấp nhận được 1048713 Thường coacute thể phaacutet biểu lyacute thuyết hay đo lường thực nghiệm về chất lượng của giải phaacutep (tức giaacute trị mục tiecircu của giải phaacutep gần với giaacute trị tồi ưu đến mức nagraveo dugrave giaacute trị tối ưu chưa biết được) 1048713 Coacute thể kết hợp tiacutenh thocircng minh vagraveo để hướng dẫn pheacutep tigravem kiếm (tigravem kiếm tabu) Năng lực thocircng minh đoacute coacute thể lagrave đặc thugrave theo bagravei toaacuten hoặc dựa trecircn yacute kiến chuyecircn gia được cấy trong hệ chuyecircn gia hoặc cơ chế tigravem kiếm 1048713 Coacute thể dugraveng heuristic hiệu quả vagraveo caacutec mocirc higravenh coacute thể giải bằng quy hoạch toaacuten học Đocirci khi heuristic lagrave phương phaacutep được ưa thiacutech hơn khi khaacutec giải phaacutep heuristics được dugraveng như giải phaacutep ban đầu cho caacutec phương phaacutep quy hoạch toaacuten học bull Hạn chế 1048713 Khocircng đảm bảo coacute được giải phaacutep tối ưu 1048713 Caacutec quy luật coacute rất nhiều ngoại lệ 1048713 Caacutec lựa chọn quyết định tuần tự coacute thể khocircng tiecircn đoaacuten được caacutec kết cục tương lai của mỗi chọn lựa 1048713 Sự liecircn thuộc giữa caacutec phần trong hệ thống đocirci khi coacute thể gacircy ra caacutec ảnh hưởng lớn lao lecircn toagraven hệ thống bull Phacircn loại caacutec giải thuật heuristic 1048713 Heuristic xacircy dựng xacircy dựng giải phaacutep khả thi bằng caacutech cộng thecircm từng thagravenh phần một VD bagravei toaacuten người baacuten hagraveng ndash luocircn gheacute thagravenh phố chưa viếng thăm kế tiếp gần nhất
1048713 Heuristic cải tiến bắt đầu bằng một giải phaacutep khả thi vagrave cố gắng cải tiến liecircn tục trecircn đoacute VD trecircn thử hoaacuten đổi 2 thagravenh phố 1048713 Quy hoạch toaacuten aacutep dụng vagraveo caacutec mocirc higravenh chứa iacutet ragraveng buộc nhằm coacute được thocircng tin về thỏa hiệp tốt nhất với mocirc higravenh nguyecircn gốc Thường được dugraveng trong tối ưu hoacutea nguyecircn (integer optimization) 1048713 Chia giai đoạn giải quyết một vấn đề theo từng giai đoạn VD ở PampG trecircn đacircy bagravei toaacuten phacircn phối được giải quyết trước sau đoacute dugraveng giải quyết bagravei toaacuten chiến lược sản phẩm 1048713 Phacircn ratilde chia bagravei toaacuten thagravenh caacutec phần nhỏ hơn coacute thể giải quyết được sau đoacute kết hợp caacutec giải phaacutep đoacute lại VD chia latildenh thổ baacuten hagraveng thagravenh 4 vugraveng khaacutec nhau giải quyết cho từng vugraveng sau đoacute kết nối caacutec giải phaacutep
21Mocirc phỏngbull Giả định caacutec đặc điểm của thực tạibull Lagrave kỹ thuật tiến triển caacutec thực nghiệm (như phacircn tiacutech ldquowhat-ifrdquo) - bằng maacutey tiacutenh -trecircn một mocirc higravenh của hệ thocircng tin quản lyacute
bull Khocircng thực sự lagrave một mocirc higravenh vigrave khocircng biểu diễn thực tại magrave lagrave cố gắng bắtchước thực tạibull Một trong những phương phaacutep thocircng dụng nhất trong HHTQĐbull HHTQĐ lagravem việc với caacutec bagravei toaacuten phi cấu truacutec vagrave cấu truacutec yếu tigravenh huống thực tếphức tạp ndash khocircng dễ biểu diễn bằng mocirc higravenh tối ưu hay caacutec dạng mocirc higravenh khaacutecnhưng lại thường coacute thể xử lyacute được bằng mocirc phỏngbull Đặc điểm1048713 Iacutet đưa ra caacutec đơn giản hoacutea về thực tại hơn caacutec mocirc higravenh khaacutec1048713 Do triển khai caacutec thực nghiệm necircn noacute coacute thể kiểm thử caacutec giaacute trị cụ thể của caacutecbiến quyết địnhbiến khocircng kiểm soaacutet được của mocirc higravenh vagrave xem xeacutet ảnh hưởnglecircn caacutec biến kết quả1048713 Phương phaacutep coacute tiacutenh mocirc tả (như vậy khaacutec với phương phaacutep danh định)1048713 Khocircng tự động tigravem kiếm giải phaacutep tối ưu ndash noacute mocirc tảtiecircn đoaacuten caacutec đặc tiacutenh của hệthống đatilde cho dưới caacutec điều kiện khaacutec nhau từ đoacute coacute thể chọn ra phương aacuten tốtnhất1048713 Quaacute trigravenh mocirc phỏng thường lặp lại một thực nghiệm nhiều lần để coacute được ướclượng về hiệu ứng tổng quaacutet của một số hagravenh động nhất định1048713 Mocirc phỏng maacutey tiacutenh thiacutech hợp cho hầu hết caacutec tigravenh huống mặc dugrave cũng coacute một sốmocirc phỏng thủ cocircng thagravenh cocircng1048713 Thường chỉ được dugraveng khi bagravei toaacuten quaacute phức tạp khocircng thể xem xeacutet bằng caacutec kỹthuật tối ưu dạng số Tiacutenh phức tạp theo nghĩa bagravei toaacuten khocircng thể cocircng thức hoacuteacho tối ưu (do khocircng thotildea caacutec giả định) hoặc cocircng thức quaacute lớn quaacute nhiều tươngtaacutec giữa caacutec biến hoặc về bản chất bagravei toaacuten lagrave bất định hay rủi roPhương phaacutep mocirc phỏng thiết lập mocirc higravenh của hệ thống thực vagrave tiến hagravenh caacutec thựcnghiệm lặp lại trecircn mocirc higravenh
bull Thuận lợi1048713 Lyacute thuyết tương đối trực tiếp hiệu ứng dagravei hạn của nhiều chiacutenh saacutech -gt neacuten thờigian lớn1048713 Do tiacutenh chất mocirc tả (khaacutec với danh định)1048713 Coacute thể thấy được nhanh choacuteng coacute thể đặt ra caacutec cacircu hỏi ldquowhat-ifrdquo coacute thể dugravengtiếp cận thử-vagrave-sai vagraveo giải quyết vấn đề một caacutech nhanh choacuteng rẻ chiacutenh xaacutec iacutetrủi ro hơn1048713 Thử nghiệm được biến quyết định phần nagraveo của mocirci trường thực sự quan trọngvới caacutec phương aacuten khaacutec nhau1048713 Yecircu cầu kiến thức riecircng biệt về bagravei toaacuten vigrave thế buộc người xacircy dựng mocirc higravenh phảilagravem việc thường xuyecircn với nhagrave quản lyacute ndash đối tượng mong muốn của HHTQĐ để
từ đoacute bản chất bagravei toaacuten vagrave caacutec quyết định được hiểu tốt hơn1048713 Mocirc higravenh được xacircy dựng từ viễn cảnhcaacutech nhigraven của nhagrave quản lyacute1048713 Mocirc higravenh chỉ cho một bagravei toaacuten riecircng biệt thường khocircng thể dugraveng giải caacutec bagravei toaacutenkhaacutec Như vậy mỗi thagravenh phần của mocirc higravenh ứng với một phần của hệ thống thựcdo đoacute sẽ khocircng yecircu cầu nhagrave quản lyacute phải tổng quaacutet hoacutea caacutec hiểu biết của migravenh1048713 Phổ bagravei toaacuten giải được rất rộng tồn kho nhacircn sự hoạch định chiến lược 1048713 Coacute thể chứa caacutec phức tạp thực sự của bagravei toaacuten khocircng cần caacutec đơn giản hoacutea (TDdugraveng caacutec phacircn phối xaacutec suất thực thay vigrave phacircn phối lyacute thuyết xấp xỉ)1048713 Coacute thể tự động sinh ra nhiều đo lường hiệu năng quan trọng1048713 Thường lagrave phương phaacutep duy nhất của HHTQĐ coacute thể xử lyacute caacutec bagravei toaacuten tương đốiphi cấu truacutec1048713 Coacute một số caacutec goacutei phần mềm mocirc phỏng (Monte Carlo) tương đối dễ dugravengbull Điểm yếu1048713 Tuy thường tigravem được caacutec phương aacuten đủ tốt nhưng khocircng đảm bảo lời giải tối ưu1048713 Quaacute trigravenh xacircy dựng mocirc higravenh thường dagravei vagrave tốn keacutem1048713 Giải phaacutep vagrave suy diễn từ nghiecircn cứu mocirc phỏng thường khocircng thể chuyển sang bagraveitoaacuten khaacutec vigrave mocirc higravenh kết hợp caacutec yếu tố đặc thugrave1048713 Đocirci khi do mocirc higravenh quaacute dễ giải thiacutech cho nhagrave quản lyacute necircn caacutec phương phaacutep phacircntiacutech thường xem nhẹ1048713 Phần mềm mocirc phỏng đocirci khi yecircu cầu caacutec kỹ năng đặc biệt do độ phức tạp củaphương phaacutep giải higravenh thứcbull Caacutec loại mocirc phỏng1048713 Mocirc phỏng xaacutec suất một hay nhiều biến độc lập mang tiacutenh xaacutec suất với 2 loạiphacircn phối ndash thường dugraveng kỹ thuật Monte Carlo1048713 Phacircn phối rời rạc tigravenh huống coacute một số giới hạn caacutec biến cố (biến) với hữu hạncaacutec giaacute trị cho mỗi biến cố (biến)1048713 Phacircn phối liecircn tục tigravenh huống coacute số lượng khocircng giới hạn caacutec biến cố tuacircn theocaacutec hagravem mật độ xaacutec suất như phacircn phối chuẩn1048713 Mocirc phỏng độc lậpphụ thuộc theo thời gian1048713 Độc lập khocircng cần thiết phải biết chiacutenh xaacutec thời điểm xảy ra biến cố (nhu cầutiecircu thụ lượng sản phẩm trong ngagravey khocircng biết chiacutenh xaacutec thời điểm tiecircu thụ)1048713 Phụ thuộc cần biết chiacutenh xaacutec thời điểm xảy ra sự kiện (bagravei toaacuten hagraveng đợi)1048713 Mocirc phỏng tương taacutec trực quan1048713 Mocirc phỏng hướng đối tượng dugraveng tiếp cận hướng đối tượng để xacircy dựng mocirc higravenhmocirc phỏng Chuacute yacute ngocircn ngữ mocirc higravenh hoacutea nhất thể UML (unified modelinglanguage) kể cả khi mocirc phỏng caacutec hệ thời gian thựcMOcirc HIgraveNH HOacuteA ĐA CHIỀU ndash XỬ LYacute PHAcircN TIacuteCH TRỰC TUYẾNbull Người ra quyết định thường phải xem xeacutet nhiều chiều của dữ liệu (TD caacutec chiềucủa dữ liệu baacuten hagraveng lagrave sản phẩm vugraveng thời gian người baacuten ) dữ liệu cần đượcphacircn tiacutech trực tiếp bằng caacutec cocircng cụ chuẩn hay phacircn tiacutech tự động bằng caacutec
phương phaacutep khai mỏ dữ liệu (data mining)bull Hầu hết caacutec hệ thống phacircn tiacutech đa chiều được nhuacuteng trong caacutec hệ xử lyacute phacircn tiacutechtrực tuyến (HXLPTTT ndash online analytic processing - OLAP)bull Mục tiecircu của XLPTTT nắm bắt cấu truacutec của dữ liệu thực để hỗ trợ ra quyết địnhbull Trong HHTQĐ coacute sự gắn nối tự nhiecircn giữa mocirc higravenh hoacutea dữ liệu mocirc higravenh hoacutea kyacutehiệu vagrave caacutec khiacutea cạnh của phacircn tiacutech ldquowhat-ifrdquobull Caacutec baacuteo caacuteo của HXLPTTT đều coacute tiacutenh tương taacutec dễ khai thaacutec sử dụng đặc biệtphugrave hợp cho caacutec baacuteo caacuteo về chỉ số hiệu năng chủ yếu (key performance indicators- KPI) baacuteo caacuteo về đo lường hiệu năng kinh doanh bull Thế hệ hiện tại của HXLPTTT vagrave hệ khai mỏ dữ liệu (data mining) tiacutech hợp caacutecđặc tiacutenh của hệ thocircng tin latildenh đạo (executive information system ndashEIS- nhiềucaacutech nhigraven dữ liệu chi tiết hoacutea theo nhu cầu) vagrave caacutec hệ đồ họa khaacutec ndash thường coacutegiao diện người dugraveng dạng kiểu WEBbull Caacutec hệ thống như trecircn cograven được gọi lagrave caacutec cocircng cụ triacute tuệ kinh doanh (businessintelligence - BI) vigrave coacute caacutec đặc trưng về mocirc higravenh hoacutea vagrave tối ưu hoacutea nhưng lạitrong suốt đối với ngươigrave dugravengbull Hiện caacutec cocircng cụ được đưa ra bởi caacutec nhagrave cung cấp về CSDL về hoạch định tagraveinguyecircn tổ chức (ERP) về nhagrave kho dữ liệu (data warehouse) về HXLPTTT MOcirc HIgraveNH HOacuteA VAgrave MOcirc PHỎNG TƯƠNG TAacuteC TRỰC QUANbull Iacutech lợi Người ra quyết định tham gia vagraveo quaacute trigravenh phaacutet triển mocirc higravenh vagrave thựcnghiệm mocirc phỏng vigrave vậy sẽ tin tưởng khi sử dụng mocirc higravenhbull Mocirc higravenh hoacutea tương taacutec trực quan (visual interactive modeling - VIM) dugraveng caacutecbiểu diễn đồ họa maacutey tiacutenh để trigravenh bagravey caacutec ảnh hưởng của caacutec quyết định quản lyacutekhaacutec nhau ở một thời điểm (tĩnh) hay tiến triển theo thời gian (động với kỹ thuậthoạt higravenh)bull Mocirc phỏng tương taacutec trực quan (visual interactive simulation - VIS) cho pheacutepngười dugraveng theo dotildei tiến trigravenh xacircy dựng vagrave sử dụng khai thaacutec mocirc higravenh mocirc phỏngdưới dạng hoạt higravenhbull Mocirc higravenh hoacutea tương taacutec trực quan coacute thể kết hợp với tiếp cận triacute tuệ nhacircn tạo đểđưa ra caacutec khả năng mới thay đổi từ xacircy dựng hệ thống dạng đồ họa đến tigravem hiểuvề động học của hệ thốngbull Cần đến caacutec hệ thống maacutey tiacutenh xử lyacute song song tốc độ cao để xacircy dựng caacutec mocircphỏng - phức tạp quy mocirc lớn dạng hoạt higravenh - mang tiacutenh khả thi ở thời gian thực
22Caacutec dạng hệ thống hỗ trợ ra quyết địnhHệ hỗ trợ quyết định nhoacutemRa quyết định nhoacutem giao tiếp vagrave cộng taacutec- Caacutec đặc điểm của cocircng việc nhoacutem+ Một nhoacutem thực hiện một nhiệm vụ thỉnh thoảng ra quyết định thỉnh thoảngkhocircng ra quyết định+ Caacutec thagravenh viecircn trong nhoacutem coacute thể ở những nơi khaacutec nhau
+ Caacutec thagravenh viecircn trong nhoacutem coacute thể lagravem việc ở những thời gian khaacutec nhau+ Caacutec thagravenh viecircn trong nhoacutem coacute thể lagravem việc cugraveng nhau hoặc ở caacutec tổ chức khaacutecnhau+ Nhoacutem coacute thể vĩnh viễn hoặc tạm thời+ Nhoacutem coacute thể ở bất kỳ mức quản lyacute nagraveo hoặc mức thời gian nagraveo+ Coacute sự điều phối (quaacute trigravenh vagrave nhiệm vụ đạt được) hoặc macircu thuẩn trongnhoacutem+ Coacute sự đạt được hoặcvagrave mất maacutet năng suất trong tổ chức+ Nhiệm vụ phải hoagraven thagravenh rất nhanh+ Khocircng thể hoặc quaacute đắt cho tất cả caacutec thagravenh viecircn trong nhoacutem cugraveng hợp ở mộtnơi+ Một số dữ liệu thocircng tin hoặc kiến thức cần thiết nằm ở nhiều nơi một sốkhaacutec ở ngoagravei tổ chức+ Chuyecircn mocircn của caacutec thagravenh viecircn khocircng coacute trong nhoacutem lagrave cần thiết- Caacutec hoạt động vagrave caacutec quaacute trigravenh miecircu tả caacutec cuộc họp+ Cuộc họp lagrave hoạt động chung liecircn quan bởi một nhoacutem người coacute địa vị bằngnhau hoặc gần bằng nhau+ Kết quả của cuộc họp phụ thuộc một phần vagraveo kiến thức yacute kiến caacutec đaacutenh giaacutecủa caacutec thagravenh viecircn+ Kết quả của cuộc họp cũng phụ thuộc vagraveo sự kết hợp của nhoacutem vagrave phụ thuộcvagraveo quaacute trigravenh ra quyết định được sử dụng bởi nhoacutem đoacute+ Giải quyết caacutec yacute kiến khaacutec nhau bởi người coacute quyền hạn hoặc thương lượnghoặc phacircn xửHỗ trợ giao tiếp- Giao tiếp lagrave thagravenh phần quan trọng cho hỗ trợ quyết định Khocircng coacute giao tiếp thigravekhocircng coacute cộng taacutec Những người ra quyết định caacute nhacircn phải giao tiếp với caacutecđồng nghiệp chuyecircn gia cơ quan chiacutenh phủ khaacutech hagraveng đối taacutec kinh doanh hellipHọ cũng cần dữ liệu vagrave thocircng tin (vagrave kiến thức) từ nhiều nơi trecircn thế giới Caacutecnhoacutem ra quyết định phải giao tiếp cộng taacutec vagrave thương lượng trong cocircng việcHầu hết caacutec tổ chức sẽ nhanh trở thagravenh khocircng coacute chức năng nếu khocircng coacute caacutec hệthống giao tiếp Thương mại điện tử coacute thể hiệu quả chỉ qua caacutec kỹ thuật giao tiếphiện đại- Caacutec kỹ thuật thocircng tin hiện đại cung cấp caacutec phương tiện hỗ trợ giao tiếp rẻnhanh coacute khả năng coacute thể tin cậy Nền tảng hỗ trợ giao tiếp lagrave caacutec hệ thống maacuteytiacutenh mạng+ Bắt đầu bằng điện baacuteo điện thoại radio vagrave ti vi+ Trong 100 năm chuacuteng ta phaacutet triển maacutey fax thư điện tử chương trigravenh chatnhoacutem tin tức hệ thống hội nghị truyền higravenh Hầu hết caacutec kỹ thuật nagravey đềuhoạt động trecircn internet+ Sự phaacutet triển giao tiếp sau cugraveng lagrave hệ thống họp điện tử caacutec dịch vụ vagrave hệ
thống hội nghị điện tử thường sử dụng internet để kết nối caacutec người ra quyếtđịnh- Caacutec thuận lợi aacutep dụng caacutec phương phaacutep giao tiếp cải tiến trong caacutec tổ chức+ Cải tiến năng suất của nhacircn viecircn+ Liecircn quan đến nhiều người ra quyết định chiacutenh+ Khocircng quan tacircm nhiều đến đường biecircn giới địa lyacute+ Tạo nền văn hoacutea hợp taacutec nhất quaacuten+ Cải tiến chất lượng cuộc sống của nhacircn viecircnHỗ trợ cộng taacutec Maacutey tiacutenh hỗ trợ cộng taacutec- Khung thời giannơi chốn+ Sự hiệu quả của kỹ thuật tiacutenh toaacuten cộng taacutec phụ thuộc vagraveo vị triacute của caacutec thagravenhviecircn trong nhoacutem vagrave phụ thuộc vagraveo thời gian chia sẽ thocircng tin gởi vagrave nhận+ Chia sự giao tiếp thagravenh bốn ocirc vagrave tổ chức bốn ocirc dọc theo 2 chiều thời gian vagravenơi chốn1048713 Thời gian Khi gởi vagrave nhận thocircng tin hầu như đồng thời giao tiếp lagrave đồngthời Viacute dụ Điện thoại ti vi vagrave caacutec cuộc họp gặp mặt nhau Giao tiếp bấtđồng bộ xảy ra khi người nhận nhận thocircng tin ở thời điểm khaacutec thời điểmgởi thocircng tin đoacute1048713 Nơi chốn Người gởi vagrave người nhận coacute thể ở cugraveng phograveng hoặc khocircng+ Bốn ocirc lagrave1048713 Cugraveng thời giancugraveng nơi chốn Caacutec thagravenh viecircn gặp mặt nhau cugraveng một luacutecgiống như phograveng quyết định hoặc gặp mặt truyền thống1048713 Cugraveng thời giankhaacutec nơi chốn Caacutec thagravenh viecircn ở caacutec nơi khaacutec nhau nhưnggiao tiếp cugraveng nhau Viacute dụ hội nghị truyền higravenh (videoconferencing)1048713 Khaacutec thời giancugraveng nơi chốn Nhiều người lagravem việc theo ca Ca nagravey để lạithocircng tin cho ca khaacutec1048713 Khaacutec thời giankhaacutec nơi chốn Caacutec thagravenh viecircn ở caacutec nơi khaacutec nhau Caacutecthagravenh viecircn nagravey gởi vagrave nhận thocircng tin ở những lần khaacutec nhau
23Thực thi hệ DSSHệ thống hỗ trợ quản lyacute (MSS) khocircng phải luacutec nagraveo cũng luocircn thagravenh cocircng Nhiều trường hợpthất bại của ES khocircng hoagraven toagraven lagrave lyacute do kỹ thuật Thực thi hệ thống lagrave một quaacute trigravenh liecircn tụcnhằm đảm bảo cho tổ chức chuẩn bị tiếp nhận một hệ thống mới vagrave đưa hệ thống vagraveo sử dụngthagravenh cocircngThực hiện cocircng nghệ hệ thống hỗ trợ quản lyacute lagrave việc phức tạp vigrave caacutec hệ thống nagravey khocircng đơnthuần lagrave hệ thống thocircng tin chỉ thu thập thao taacutec vagrave phacircn phối thocircng tin Magrave xa hơn chuacuteng
liecircn quan tới caacutec cocircng việc coacute thể lagravem thay đổi đaacuteng kể caacutech thức hoạt động của tổ chức Tuyvậy đa số caacutec yếu tố thực thi đều liecircn quan tới hệ thống thocircng tinThực thi MSS lagrave quaacute trigravenh liecircn tục diễn ra trong suốt thời gian phaacutet triển hệ thống từ đề xuấtban đầu đến nghiecircn cứu khả thi thiết kế vagrave phacircn tiacutech hệ thống lập trigravenh huấn luyện chuyểnđổi vagrave lắp đặt Caacutec chuyecircn gia hệ thống thocircng tin thường gọi thực thi lagrave giai đoạn cuối trongvograveng đời hệ thống Định nghĩa thực thi MSS phức tạp hơn vigrave bản chất lặp của sự phaacutet triểncaacutec hệ thống
THỰC THI KHOcircNG HOAgraveN CHỈNHCaacutec quyết định về tiacutenh khả thi thường coacute giả định về lợi iacutech đạt được khi kế hoạch thực thiđược thực hiện hoagraven toagraven Trong thực tế thường chỉ thực hiện 90 thậm chiacute 70 phần trăm sovới phacircn tiacutech khả thi Lyacute do lagrave sự thay đổi tại một nơi trong hệ thống coacute thể ảnh hưởng vagrave coacutethể taacutec động tiecircu cực đến chỗ khaacutec Do vậy cấp quản lyacute coacute thể bỏ những phần trong dự aacuten coacutethể gacircy ra taacutec động xấu Do đoacute dự aacuten sẽ thực hiện iacutet hơn 100 so với dự aacuten kế hoạch Caacutec lyacutedo khaacutec coacute thể lagrave do khấu trừ ngacircn saacutech hoặc vượt chi phiacuteĐAacuteNH GIAacute SỰ THAgraveNH COcircNG CỦA THỰC THI HỆ THỐNGPhải coacute caacutec chỉ số đo lường thigrave mới coacute thể đaacutenh giaacute sự thagravenh cocircng khi thực thi một hệ thốngDickson va Powers (1973) đề ra 5 tiecircu chuẩn độc lậpbull Tỷ lệ thời gian thực hiện dự aacuten với thời gian ước lượngbull Tỷ lệ chi phiacute thực tế vagrave ngacircn saacutech thực hiệnbull Thaacutei độ của cấp quản lyacute đối với hệ thốngbull Nhu cầu thocircng tin của caacutec nhagrave quản lyacute được đaacutep ứng như thế nagraveo qua hệ thốngbull Taacutec động của dự aacuten đối với những hoạt động maacutey tiacutenh trong cocircng tyCaacutec đo lường khaacutec để đaacutenh giaacute thagravenh cocircng của hệ hỗ trợ quản lyacute (MSS)bull Sự sử dụng hệ thống (dự định dugraveng hoặc thực sự dugraveng)bull Thỏa matilden của người dugravengbull Thaacutei độ taacuten thagravenhbull Mức độ hệ thống hoagraven thagravenh caacutec mục tiecircu ban đầubull Phần thưởng đối với tổ chức (giảm chi phiacute tăng doanh thuhellip)bull Tỷ số lợi iacutech chi phiacute
bull Mức độ thể chế hoacutea của MSS trong tổ chứcDo bởi tiacutenh đa dạng của DSS necircn việc đaacutenh giaacute sự thagravenh cocircng của hệ nagravey cũng khoacute khăn tuynhiecircn cũng coacute thể coacute một số yếu tố giuacutep cho DSS thagravenh cocircng như sự tham gia người dugravenghuấn luyện người dugraveng hỗ trợ quản lyacute cấp cao nguồn thocircng tin đặc điểm của những nhiệmvụ coacute liecircn quan (cấu truacutec bất định độ khoacute phụ thuộc)
Chương5Nhoacutem hỗ trợ quyết định vagrave nhoacutemcocircng nghệ phần mềm
51Nhoacutem tạo quyết định
MDM-Holsapple đatilde gợi yacute chuacuteng ta sử dụng giới hạn người tạo quyết định
Một nhoacutem lagrave kết cấu MDM nơi magrave nhiều người ra quyết định hoagraven toagraven tương taacutec
Một đội lagrave kết cấu MDM nơi caacutec thagravenh viecircn tư vấn cho người đưa ra quyết định nhưng khocircng tương taacutec
Một Ủy ban lagrave kết cấu MDM với một người tạo quyết định duy nhất vagrave sự tương taacutec giữa caacutec thagravenh viecircn
Mạng thocircng tin
Mạng lưới baacutenh xe mỗi người tham gia coacute thể giao tiếp với người đưa ra quyết định ở trung tacircm nhưng khocircng phải với người tham gia khaacutecCấu truacutec nagravey lagrave khocircng thỏa matilden tất cả những người tham gia ngoại trừ người ra quyết định
Mạng dacircy chuyền Tham gia chuyển tiếp thocircng tin chỉ để noacute luocircn liền kề nhau trong chuỗi
Thagravenh viecircn cuối cugraveng ko được đaacutep ứng
Mạng vograveng trograven Tương tự như chuỗi nhưng kết thuacutec được kết nối
Mạng kết nối hoagraven toagraven khocircng coacute hạn chế về giao tiếp vagrave tương taacutec giữa caacutec thagravenh viecircnNoacutei chungnoacute đaacutep ứng hầu hết caacutec kết nối của người tham gia nhưng truyền đạt thocircng tin mất nhiều thời gian vagrave coacute nhiều cơ hội xảy ra lỗi
Nhoacutem hagravenh vi vagrave chuẩn mực
MDMs thiết lập caacutec chỉ tiecircu hướng dẫn quaacute trigravenh ra quyết định
Một chuẩn mực quy định cụ thể những gigrave thagravenh viecircn trong nhoacutem dự kiến sẽ lagravem trong những hoagraven cảnh nhất định
Quy tắc gửi coacute thể được thocircng qua viacute dụ đaacutenh giaacute ngang hagraveng hoặc xử phạt
Lagravem thế nagraveo để đưa ra quyết định
Việc chọn lựa magrave trong đoacute việc sử dụng cấu truacutec MDM phải được dựa trecircn một số yếu tố liecircn quan với bối cảnh quyết định
Viacute dụmột cấu truacutec riecircng lẻ sẽ lagravem việc nơi magrave quyết định được cấu truacutec cao vagrave thocircng tin lagrave coacute sẵn
Một ủy ban cơ cấu sẽ lagrave sự lựa chọn khi người ra quyết định khocircng thể đưa ra quyết định một migravenh
52Caacutec vấn đề thường gặp trong nhoacutem
Kiacutech thước Noacutei chung sự nhất triacute vagrave gắn kết giữa caacutec thagravenh viecircn tỉ lệ nghịch với phạm vi nhoacutem Trong nhoacutem lớn rất dễ higravenh thagravenh caacutec nhoacutem nhỏ vagrave hoạt động rời rạc
Tư duy tập thể Trong nhoacutem lớn mọi người coacute xu hướng suy nghĩ đểđạtđược sự nhất triacute necircn khocircng phaacutet huy được sự saacuteng tạo
Caacutec vấn đề về xatilde hội
Xung đột Trong 1 nhoacutem ai cũng muốn migravenh lagrave giỏi nhất necircn dễ dẫn đến xung đột
Ẩn danh(Giấu tecircn) Đacircy lagrave phương phaacutep được sử dụng để kiểm soaacutet xung đột Cho caacutec thagravenh viecircn tham gia ẩn danh
Vấn đề giới tiacutenh Nam vagrave nữ thường coacute những thế mạnh khaacutec nhau điều nagravey coacute thể lagrave sức mạnh trong 1 thiết lập MDM
Đagravem phaacuten vagrave quyết định
Một quyết định coacute thể liecircn quan đến nhiều quan điểm khaacutec nhau vigrave thế cần phải coacute sự đagravem phaacuten
Caacutec thiết kế của cơ chế hỗ trợ cho MDM phải phugrave hợp với caacutec hoạt độngđagravemphaacuten
Những hoạt động nagravey bao gồm việc thu nhận yacute kiến của caacutec thagravenh viecircn 1 caacutech cocircng bằng
53Cocircng nghệ hỗ trợ MDM
Organizational DSSndash 1 hệ thống cung cấp caacutec quyết định hỗ trợ
Group Support Systemndash Cocircng nghệ sử dụng sự hỗ trợ của nhiều becircn tham gia
Group DSS ndash Lagrave 1 hệ thống được thiết kế đặc biệt để hỗ trợ cho MDM
DSS ndash Lagrave 1 hệ thống dưới sự kiểm soaacutet của 1 người quyết định hệ thống nagravey cung cấp 1 bộ cocircng cụ giuacutep phacircn tiacutech hoagraven cảnh đểđưa ra quyết định vagrave nacircng cao hiệu quả của quyết địnhđoacute
53Cocircng nghệ hỗ trợ MDM
Organizational DSSndash 1 hệ thống cung cấp caacutec quyết định hỗ trợ
Group Support Systemndash Cocircng nghệ sử dụng sự hỗ trợ của nhiều becircn tham gia
Group DSS ndash Lagrave 1 hệ thống được thiết kế đặc biệt để hỗ trợ cho MDM
DSS ndash Lagrave 1 hệ thống dưới sự kiểm soaacutet của 1 người quyết định hệ thống nagravey cung cấp 1 bộ cocircng cụ giuacutep phacircn tiacutech hoagraven cảnh đểđưa ra quyết định vagrave nacircng cao hiệu quả của quyết địnhđoacute
Mục tiecircu của cocircng nghệ hỗ trợ MDM
Quy trigravenh hỗ trợ tập trung vagraveo quaacute trigravenh tạo điều kiện thuận lợi cho sự tương taacutec
Cơ chế cấu truacutec quaacute trigravenh chi phối caacutec hoạt động truyền thocircng
Nhiệm vụ hỗ trợ cocircng việc coacute thể chọn lựa tổ chức hoặc lấy thocircng tin
Nhiệm vụ cấu truacutec cocircng việc cho pheacutep truy cập đến kỹ thuật lọc kết hợp phacircn tiacutech kiến thức liecircn quan đến cocircng việc
Caacutec lớp loại cocircng nghệ hỗ trợ MDM
Phacircn loại theo đặc điểm do DeSanctis vagrave Gallupe đưa ra đề xuất một chương trigravenh ba cấp dựa trecircn caacutec tiacutenh năng được cung cấp
Hệ thống cấp 1 Mục điacutech chiacutenh lagrave tạo điều kiện thocircng tin liecircn lạc giữa caacutec thagravenh viecircn
Hệ thống cấp 2 Thiết kế để giảm thiểu rủi ro
Hệ thống cấp 3 Giuacutep điều chỉnh xử lyacute quyết định
Phacircn loại theo cocircng nghệ -Kraemer vagrave King tập trung vagraveo cocircng nghệ aacutep dụng
Cocircng nghệ bảng mạch điện tử
Hội nghị trực tuyến
Mạng lưới tập đoagraven
Trung tacircm thocircng tin
Mocirci trường cộng taacutec
Phograveng quyết định
Nhoacutem phần mềm
Phần mềm được thiết kế để hỗ trợ sự hợp taacutec bao gồm việc thu huacutet vagrave lưu trữ thocircng tin
Caacutec tổ chức dẫn đầu thị trường hiện tại lagrave Lotus Notes and Domino Microsoft Exchange Novell GroupWise and Oracle Office
Caacutec cocircng cụ trong một bộ phần mềm bao gồm người quản lyacute hội nghị (Lotus Sametime) vagrave trao đổi thocircng điệp (Lotus Notes Mail)
Xếp hạng phần mềm cho nhoacutem
Ellis vv đề xuất một hệ thống xếp hạng dựa vagraveo kiểu sự hỗ trợ noacute Cung cấp
Hệ thocircng điệp
Hệ thống hội thảo truyền higravenh
Hệ thống cộng taacutec soạn thảo
Nhoacutem phacircn phối giải phaacutep phần mền
Hệ thống phối hợp
Hệ thống thocircng minh đại diện
Lực lượng điều khiển phaacutet triển phần mềm cho nhoacutem
Một số nhacircn tố chiacutenh bao gồm
Tăng năng suất
Giảm số lượng caacutec cuộc họp
Tăng cường tự động hoacutea caacutec quy trigravenh lagravem việc thường xuyecircn
Cần phối hợp toagraven cầu tốt hơn
Tiacutenh sẵn sagraveng của những mạng lan rộng
Coleman vagrave Khanna liệt kecirc 10 nhacircn tố khaacutec
54Quản lyacute hoạt động MDM (Mobile Device Management - Quản lyacute thiết bị di động)
Một số phương phaacutep phối hợp phổ biến hơnMDM lagrave
Kỹ thuật nhoacutem định danh
Kỹ thuật Delphi
Sự phacircn xử
Hệ thocircng tin dựa trecircn vấn đề
Nemawashi
Kỹ thuật nhoacutem định danh
1-Mỗi người tham gia viết ra những yacute tưởng về những gigrave necircn quyết định
2-Lần lượt mỗi người tham gia trigravenh bagravey yacute tưởng của migravenh được ghi lại trecircn bảng Khocircng thảo luận ở đacircy
3-Sau khi tất cả caacutec yacute tưởng được trigravenh bagravey caacutec đại biểu coacute thể chất vấn những người khaacutec
4-Mỗi người tham gia bỏ phiếu cho mỗi yacute tưởng
Kỹ thuật Delphi
Về cơ bản tương tự như kỹ thuật nhoacutem định danh ngoại trừ những người khocircng bao giờ tham gia cuộc họp
Một cocircng cụ khảo saacutet được sử dụng để thu thập đầu vagraveo ban đầu từ caacutec thagravenh viecircn
Một cuộc khảo saacutet thứ hai được gửi đi với một bản toacutem tắt caacutec kết quả chung
Những bước lặp lại cho đến khi đạt được một sự đồng thuận hoặc nhigraven nhận của đa số
Sự phacircn xử(Arbitration )
Thiacutech hợp nhất khi caacutec thagravenh viecircn của MDM đại diện cho caacutec yếu tố đối lập
Những người tham gia đồng yacute rằng nếu lựa chọn thay thế hai becircn thỏa thuận khocircng được tigravem thấy thigrave một trọng tagravei viecircn becircn ngoagravei sẽ tham gia
Trọng tagravei sau đoacute lựa chọn thay thế ocircng hoặc xeacutet thấy thiacutech hợp nhất
Hệ thống thocircng tin dựa trecircn vấn đề (IBIS)
Lagrave một phương phaacutep lập luận cấu truacutec
Một đại diện cho IBIS lagrave một đồ thị với caacutec nuacutet vagrave caacutec liecircn kết
IBIS bắt đầu với lựa chọn của một nuacutet vấn đề gốc sau đoacute caacutec nuacutet vị triacute khaacutec nhau được liecircn kết với nuacutet gốc
Caacutec nuacutet vị triacute nagravey sau đoacute được đaacutenh giaacute dựa trecircn những lập luận gắn liền với chuacuteng
Nemawashi (được sử dụng rộng ratildei tại Nhật Bản)
1-Một hoặc nhiều thagravenh viecircn của MDM được chỉ định lagrave điều phối viecircnCaacutec điều phối viecircn sau đoacute chọn người tham gia cograven lại
2-Điều phối viecircn xacircy dựng một tổng hợp caacutec sự lựa chọn vagrave sau đoacute caacutec chuyecircn gia đaacutenh giaacute caacutec lựa chọn
3-Điều phối viecircn lựa chọn một sự lựa chọn dựa trecircn kết quả ở trecircn(ở 2)
4-Sự thay thế được luacircn chuyển điều phối viecircn tigravem kiếm sự đồng thuận thocircng qua sự thuyết phục vagrave đagravem phaacuten
5-Nếu đạt được sự đồng thuận điều phối viecircn cho lưu thocircng một tagravei liệu magrave mỗi thagravenh viecircn MDM để lại dấu hiệu trecircn đoacute
55Nơi lagravem việc ảo
Nhiều tổ chức trecircn toagraven thế giới kinh doanh bất động sản cho cocircng nghệ hợp taacutec
Cocircng việc được trở thagravenh một điều bạn lagravem hơn lagrave một nơi bạn đi
Những thay đổi lớn nhất mang lại bởi nơi lagravem việc ảo coacute thể lagrave về văn hoaacute hay xatilde hội hơn lagrave về cocircng nghệ
Chương 6 Hệ thống thocircng tin điều hagravenh
61 Yacute nghĩa của EIS- Hệ thống thocircng tin điều hagravenh
- EIS lagrave một dạng đặc biệt của DSS được thiết kế để hỗ trợ ra quyết định ở cấp cao nhất của một tổ chức
- Lagrave một hệ thống thocircng tin hỗ trợ nhu cầu lập kế hoạch vagrave đaacutenh giaacute của caacutec nhagrave quản lyacute điều hagravenh
- EIS coacute thể giuacutep một CEO coacute được bức tranh tổng thể chiacutenh xaacutec nhất về caacutec hoạt động vagrave một bản toacutem tắt những gigrave magrave đối thủ cạnh tranh đang lagravem
- Caacutec hệ thống nagravey noacutei chung hoạt động dễ dagraveng vagrave trigravenh bagravey thocircng tin theo những caacutech dễ hiểu để việc tiếp thu được nhanh choacuteng (biểu đồ đồ thịhellip)
(Tagravei liệu thecircm EIS lagrave những loại hệ thống lagrave rất phức tạp trong tự nhiecircn Coacute thể noacutei hệ thống nagravey cũng cung cấp cho caacutec nhagrave quản lyacute với caacutec thiết bị coacute khả năng ra quyết định bằng caacutech sử dụng của noacute Hệ thống nagravey hoạt động trong điều kiện như vậy quan trọng như trong caacutec hệ thống khaacutec khocircng hỗ trợ Khả năng lưu trữ dữ liệu nặng lagravem cho noacute lyacute tưởng để được thocircng qua khocircng chỉ bởi caacutec doanh nghiệp lớn magrave cograven bởi caacutec doanh nghiệp nhỏ hơn Nhigraven chung hệ thống nagravey lagrave dagravenh cho caacutec nhacircn viecircn cấp cao hỗ trợ thagravenh thạo trong việc đưa ra caacutec quyết định quan trọng)
Caacutec phiecircn EIS tiecircu biểu- Phiecircn lagravem việc coacute thể bắt đầu với một baacuteo caacuteo về tigravenh higravenh tagravei chiacutenh vagrave kinh
doanh của một cocircng ty caacutec chỉ số hoạt động quan trọng được hiển thị rotilde ragraveng- EIS sẽ cho pheacutep caacutec giaacutem đốc điều hagravenh coacute thể đi sacircu vagraveo dữ liệu từ những con
số bất kỳ magrave noacute hỗ trợ- Việc điều hagravenh coacute thể lựa chọn một mức độ chi tiết ( VD danh số baacuten hagraveng) nếu
như cần điều tra thecircm- Lagrave một phương phaacutep tiếp cận coacute thể giuacutep việc ra quyết định tốt hơn
Những điều magrave EIS ko coacute- EIS khocircng phải lagrave sự thay thế cho caacutec hệ thống dựa trecircn caacutec maacutey tiacutenh khaacutec EIS
thực sự chỉ cung cấp dữ liệu cho caacutec hệ thống nagravey- Noacute khocircng thể biến caacutec bộ hệ điều hagravenh của maacutey tiacutenh thagravenh những ldquochuyecircn viecircn
giỏirdquo- Coacute thể được viacute một caacutech cao hơn như lagrave một trợ lyacute đaacuteng tin cậy coacute thể được gọi
đến bất khi nagraveo vagrave mỗi khi cần thiết
Tagravei liệu thecircm Sự khaacutec nhau giữa EIS vagrave DSS+ EIS thiết kế để hỗ trợ những người điều hagravenh cấp cao giuacutep họ khaacutem phaacute caacutec vấn đề vagrave caacutec cơ hội DSS hỗ trợ những nười phacircn tiacutech cố gắng trả lời cacircu hỏi caacutei gigrave coacute thể lagravem cugraveng với một cơ hội hoặc một vấn đề
Chiều EIS DSSNhững người sử dụng thocircng thường
Duyệt dữ liệu đi xuống truy xuất trạng thaacutei
Hỗ trợ phacircn tiacutech vagrave quyết định
Sự thuacutec đẩy Tiacutenh thiacutech hợp Tiacutenh hiệu quảỨng dụng Queacutet mocirci trường đaacutenh giaacute
hiệu suất nhận dạng caacutec vấn đề vagrave caacutec cơ hội
Caacutec quyết định quản lyacute trecircn caacutec lĩnh vực đa dạng
Hỗ trợ quyết định Caacutec chiacutenh saacutech caacutec quyết định khocircng coacute cấu truacutec ở mức cao vagrave hỗ trợ giaacuten tiếp
Hỗ trợ caacutec quyết định lặp lại caacutec quyết định khocircng thể đoaacuten trước ra quyết định khocircng coacute cấu truacutec vagrave baacuten cấu truacutec
Loại thocircng tin Caacutec thocircng tin tin tức thocircng tin becircn ngoagravei về khaacutech hagraveng đối thủ cạnh tranh mocirci trường caacutec baacuteo caacuteo theo yecircu cầu vagrave định thời về caacutec hoạt động becircn trong
Caacutec thocircng tin hỗ trợ caacutec tigravenh huống đặc biệt
Sử dụng coacute nguyecircn tắc
Dograve theo vết vagrave điều khiển nhận dạng cơ hội
Hoạch định tổ chức phacircn nhoacutem vagrave điều khiển
Khả năng phugrave hợp với những người sử dụng caacute nhacircn
Thiết kế loại ra quyết định cho mỗi người điều hagravenh caacute nhacircn bằng nhiều lựa chọn đầu ra
Cho pheacutep caacutec đaacutenh giaacute caacute nhacircn caacutec khả năng what-if lựa chọn loại hộp hội thoại
Đồ họa Phải coacute Lagrave một phần quan trọng của nhiều DSS
Thacircn thiện người sử dụng
Phải coacute Phải coacute nếu khocircng coacute người sử dụng trung gian
Xử lyacute thocircng tin Lọc neacuten thocircng tin dograve theo vết dữ liệu vagrave thocircng tin quan trọng
EIS kiacutech thiacutech caacutec cacircu hỏi caacutec cacircu trả lời bằng caacutech sử dụng DSS vagrave phản hồi lại EIS
Hỗ trợ caacutec thocircng tin chi tiết
Truy xuất thường xuyecircn caacutec mức chi tiết của bất kỳ thocircng tin tổng hợp nagraveo (duyệt dữ
Coacute thể coacute trong DSS nhưng khocircng thường
liệu chi tiết)Cơ sở mocirc higravenh Caacutec chức năng coacute sẵn bị hạn
chếLagrave điểm cốt lotildei của DSS
Cấu truacutec Theo người baacuten sản phẩm hoặc theo caacutec chuyecircn gia hệ thống thocircng tin
Theo người sử dụng hoặc caacute nhacircn hoặc caacutec chuyecircn gia từ caacutec trung tacircm thocircng tin hoặc phograveng ban hệ thống thocircng tin
Phần cứng Mainframe caacutec trạm RISC mạng LANs hoặc caacutec hệ thống phacircn bố
Mainframe caacutec trạm RISC caacutec maacutey PC hoặc caacutec hệ thống phacircn bố
Bản chất caacutec goacutei phần mềm
Truy xuất tương taacutec dễ dagraveng đến nhiều cơ sở dữ liệu truy xuất trực tuyến caacutec khả năng DBMS phức tạp caacutec liecircn kết phức tạp
Caacutec khả năng tiacutenh toaacuten lớn caacutec ngocircn ngữ mocirc higravenh mocirc phỏng ứng dụng vagrave caacutec bộ tạo DSS
Bản chất caacutec thocircng tin
Trigravenh bagravey thocircng tin được phaacutet sinh trước về quaacute khứ vagrave hiện tại tạo caacutec thocircng tin mới về quaacute khứ hiện tại tương lai
Tạo thocircng tin mới về quaacute khứ hiện tại tương lai
62 Lịch sử EIS- EIS xuất hiện lần đầu tiecircn tại MIT vagraveo những năm 1970
- Những EIS đầu tiecircn được phaacutet triển bởi caacutec doanh ngiệp lớn sẵn sagraveng chấp nhận rủi ro để đạt được lợi thế cạnh tranh
- Vagraveo những năm 1980 caacutec nhagrave cung cấp đatilde phaacutet triển một số cơ sở khaacutech hagraveng rộng vagrave cocircng nghệ EIS được tiếp tục phaacutet triển cho đến ngagravey nay
(Tagravei liệu thecircm Sử dụng DSSEIS cho phaacutet triển bền vững + Một số nghiecircn cứu đatilde được tiến hagravenh để kiểm tra việc thực hiện của EIS trong khu vực cocircng cộng vagrave chiacutenh phủ caacutec nước tổ chức kể từ khi chuacuteng được phaacutet triển theo định hướng lợi nhuận cho caacutec cocircng ty tư nhacircn (Hasan vagrave Hasan năm 1997) Theo một nghiecircn cứu tiến hagravenh tại Mỹ ở hơn 300 cocircng ty kết quả cho thấy sự khaacutec biệt của EIS giữa tư nhacircn vagrave chiacutenh phủ một số kết quả thuacute vị được phaacutet hiệnViacute dụ khoacute khăn hơn để chuyển tiền từ một tagravei khoản khaacutec trong một EIS của chiacutenh phủ cũng lagrave khoacute khăn hơn để biện giải thiacutech cho những chi phiacute phaacutet triển EIS của chiacutenh phủ Một nghiecircn cứu khaacutec được tiến hagravenh ở Australia
cho thấy rằng EIS cung cấp cho quản lyacute một higravenh ảnh chiacutenh xaacutec hơn về tổ chức thực hiện vagrave cung cấp hỗ trợ cho caacutec lợi iacutech chiến lược cải thiện khocircng chỉ cho caacutec nhagrave quản lyacute nhưng cograven cho phần cograven lại của tổ chức Dựa trecircn caacutec hệ thống được thiết kế cho caacutec cocircng ty tư nhacircn với một caacutech rotilde ragravengxaacutec định mục tiecircu EIS lagrave thiacutech hợp cho caacutec tổ chức cocircng cộng hiện đại nhưng cần phải được linh hoạt hơn vagrave kết thagravenh chugravem một phạm vi rộng hơn khả năng vagrave phương tiện hơn so với khu vực tư nhacircn ban đầu theo định hướng sản phẩm (Hasan vagrave Hasan năm 1997) Điều nagravey coacute thể lagrave do thực tế rằng caacutec hoạt động khu vực cocircng lagrave bắt buộc coacute taacutec động rộng phải đaacutep ứng sự mong đợi duy nhất cocircng cộng thường coacute mục tiecircu mơ hồ vagrave macircu thuẫn iacutet quyền tự chủ vagrave kiểm soaacutet việc ra quyết định vagrave nhacircn viecircn lagrave khoacute khăn hơn (Watson vagrave Carte2000) + Toacutem lại EIS lagrave một khaacutei niệm thagravenh cocircng noacute phaacutet triển qua nhiều năm tuy nhiecircn EIS khắc phục khiếm khuyết của migravenh bằng caacutech tiến hagravenh nghiecircn cứu liecircn tục)
63 Tại sao những người điều hagravenh hagraveng đầu lại khaacutec nhau- Họ lagrave những doanh nghiệp theo định hướng coacute suy nghĩ
- Coacute một khoảng khocircng gian rộng để kiểm soaacutet
- Họ chịu traacutech nhiệm cho việc thiết lập chiacutenh saacutech
- Họ đại diện cho tổ chức mocirci trường becircn ngoagravei
- Hagravenh động của họ tạo ra những kết quả đaacuteng kể về tagravei chiacutenh vagrave con người
Tần số caacutec hoạt động điều hagravenh- Xử lyacute xaacuteo trộn 42
- Hoạt động kinh doanh 32
- Phacircn bổ nguồn lực 17
- Đagravem phaacuten 3
- Những điều khaacutec 6
Handling Disturbances 42
Entrepreneurial Activites 32
Resource Allocation 17
Negotiation 3
Other 6
Những thocircng tin điều hagravenh cần thiết- Quản lyacute xaacuteo trộn coacute thể yecircu cầu sự chuacute yacute xung quanh đồng hồ
- Hoạt động kinh doanh yecircu cầu điều hagravenh để dự đoaacuten những thay đổi trong mocirci trường
- Nhiệm vụ phacircn bổ tagravei nguyecircn yecircu cầu lựa chọn người quản lyacute vagrave caacutec nguồn lực hạn chế được triển khai
- Đagravem phaacuten yecircu cầu cập nhật thocircng tin từng phuacutet để coacute thể xacircy dựng được sự đồng thuận
Caacutec loại thocircng tin điều hagravenh- Hệ thống kế toaacuten coacute liecircn quan đến việc tiacutenh toaacuten thu nhập hoạt động cho caacutec lĩnh
vực cụ thể lagrave quan trọng hơn so với caacutec hệ thống kế toaacuten truyền thocircng- Thocircng tin về thị trường khaacutech hagraveng cung cấp giaacute trị trong việc quyết định chiến
lược- Caacutec thocircng tin cần thiết thường được truyền đi trecircn một số hệ thống maacutey tiacutenh vagrave
nằm trong toagraven tổ chức- Caacutec thocircng tin được sử dụng thường lagrave ngắn hạn vagrave dễ thay đổi
Phương thức để xaacutec định thocircng tin cần thiết
Rockart xaacutec định được năm phương thức cơ bản để xaacutec định thocircng tin cần thiết
- Phương thức dựa trecircn kết quả- Phương thức rỗng- Phương thức chỉ số khoacutea- Phương thức tổng hợp nghiecircn cứu- Phương thức dựa vagraveo nhacircn tố then chốt dẫn đến thagravenh cocircng
64 Thagravenh phần EIS
- Sản phẩm EIS đầu tiecircn được phaacutet triển để sử dụng trecircn maacutey tiacutenh cấu higravenh cao nhưng caacutec sản phẩm hiện nay nhằm mục tiecircu lagrave nền tảng ClientServer
- Những nền tảng linh hoạt hơn coacute thể thiacutech ứng với thay đổi trong tổ chức vagrave cocircng nghệ
- Sử dụng dữ liệu thời gian thực dẫn đến quyết định nhanh hơn nhiều thocircng tin hơn
Thagravenh phần phần cứng- Một EIS khocircng đogravei hỏi coacute phần cứng cụ thể hoặc duy nhất nagraveo- Chigravea khoacutea của vấn đề lagrave để đảm bảo rằng caacutec thagravenh phần của EIS tối ưu hoacutea vagrave
phugrave hợp với tagravei nguyecircn maacutey tiacutenh của tổ chức- Hệ thống nagravey phải được cấu higravenh để caacutec nguồn tagravei nguyecircn phugrave hợp với những
người điều hagravenh chuacuteng
Thagravenh phần phần mềm- Traacutei ngược với phần cứng phần mềm thường được chuyecircn mocircn hoacutea cao cho caacutec
bagravei toaacuten về miền- Sự chuyecircn mocircn hoacutea nagravey thường đạt được bằng caacutech sử dụng thagravenh phần off-the-
shelf cho toagraven bộ EIS vagrave caacutec mocirc-đun tugravey chỉnh để đaacutep ứng nhu cầu cụ thể- Lotus Notes lagrave một viacute dụ điển higravenh Noacute coacute thể được sử dụng một migravenh hoặc coacute
thể phục vụ becircn thứ ba mocirc-đun plug-in
Cocircng nghệ EIS hiện nay
Dobrzeniecki đề xuấtphacircn loạitừng cấptheo bachức năng- Loại 1 sản phẩm bao gồmmột bộ đầy đủcaacutec ứng dụngtừ mộtnhagrave cung cấp- Loại 2 sản phẩm đượcthựchiệnở phần đầu củacaacutecsản phẩmDSS đượcphaacutet triển
bởicugravengmộtnhagrave cung cấp- Loại 3 sản phẩmkết hợp với nhautheo bất kỳ số lượngthuộc sở hữu củacocircng ty
65 Xacircy dựng EIS
- Xacircy dựngmộtEISgiống nhưxacircydựngmột số hệ thống khaacutec củamocirc higravenh hệ thống thocircng tin
- Việcphaacutet triểncấu truacutecnecircn được theo dotildeitừ quaacute trigravenh thiết kế đến quaacute trigravenhthực hiện
- Tuy nhiecircn một dự aacuten phaacutet triển EIScoacute xu hướnglagrave thống nhấtvagraveyecircu cầu hỗ trợ caacutec nhagrave quản lyacute latildenh đạo
- Xacircy dựng một EIScoacute thểphaacutet hiện ra đượccaacutectigravenh huống khoacute khănmagravemột nhagrave phaacutet triển chưabao giờ gặp phải
Mocirc higravenh EIS
Khung phaacutet triển một EIS
- Watson et al đề nghị xacircy dựngkhung với ba thagravenh phần+ Caacutech tiếp cận tập trung vagraveo yếu tốcon người vagrave dữ liệu coacute liecircn quan đến EIS+ Quaacute trigravenh phaacutet triển cần sự linh hoạt vagrave tương taacutec+ Người sử dụng - hệ thống hộp thoại bao gồm một ngocircn ngữ hagravenh động để xử lyacute caacutec lệnh
Lợi iacutech của EIS- Dễ duy trigrave caacutec mục tiecircu coacute tổ chức- Dễ truy xuất thocircng tin- Cho pheacutep người sử dụng nacircng cao hiệu suất hơn
- Tăng chất lượng ra quyết định- Cung cấp sự cải tiến cạnh tranh- Tiết kiệm thời gian của người sử dụng- Tăng khả năng vagrave chất lượng giao tiếp- Cung cấp khả năng điều khiển tốt hơn trong tổ chức- Cho pheacutep tham gia caacutec vấn đề vagrave caacutec cơ hội- Cho pheacutep hoạch định- Cho pheacutep tigravem kiếm nguyecircn nhacircn của một vấn đề- Thảo matilden caacutec yecircu cầu của người điều hagravenh
Hạn chế của EIS vagrave 1 số sai lầm cần traacutenh
- Chi phiacute một cuộc khảo saacutetnăm1991 chothấychi phiacute phaacutet triểntrungbigravenh365000USDvớichi phiacute vận hagravenhhagraveng năm lagrave$200000 (EIS)
- Cocircng nghệ hạn chếEIScần phảiđượctiacutech hợp hoagraven toagravenvagraveokiếntruacuteccủadoanh nghiệphiện tại do đoacute noacutelagrave một thaacutech thứclớn đối vớithiết kế
- Hạn chế tổ chức cơ cấu tổ chứccoacute thể khocircng phugrave hợp
Sự hạn chế về tổ chức- Chương trigravenh nghị sự vagrave thời gian chệch EIS mocirc tả một phần việc thực hiện một
chương trigravenh nghị sự vagrave coacute thể dễ dagraveng đạt được sự tin cậy một caacutech chắc chắn- Đồng bộ hoacutea việc quản lyacute sự tin cậy đuacuteng luacutec đặc biệt baacuteo caacuteo EIS coacute thể phaacute
vỡ sự ổn định thiết lập caacutec chu trigravenh baacuteo caacuteo một caacutech tốt nhất- Sự bất ổn EIS phản ứng nhanh coacute thể gacircy ra việc taacutec động trở lại một caacutech
nhanh choacuteng dẫn đến sự thiếu ổn định trong tổ chức
Sự thất bại lagrave thay thế khocircng thể chấp nhận được- Một số yếu tố lagravem EIS thất bại
+ Thiếu sự hỗ trợ về mặt quản lyacute+ Vấn đề chiacutenh trị+ Thất bại của nhagrave phaacutet triển+ Lỗi về cocircng nghệ+ Giaacute cả+ Thời gian
66 Ra quyết định điều hagravenh trong tương lai vagrave EIS
- Coacute một vagravei điều kiện sẽ được hợp nhất cho việc chuyển đổi cocircng nghệ Trong đoacute một vagravei điều kiện coacute thể dễ dự đoaacuten Hai điều kiện magrave ta coacute thể thấy lagrave+ Phaacutet triển cocircng nghệ maacutey tiacutenh trong việc điều hagravenh sẽ tạo ra sự chuyển đổi được chấp nhận một caacutech dễ dagraveng hơn+ Mở rộng traacutech nhiệm điều hagravenh sẽ mở rộng nhu cầu thocircng tin
Tương lai của EIS- EIS thocircng minh Những tiến bộ trong cocircng nghệ AI sẽ được triển khai trong caacutec
EIS- EIS đa phương tiện Cơ sở dữ liệu đa phương tiện sẽ cho pheacutep tiacutech hợp văn bản
giọng noacutei vagrave higravenh ảnh trong tương lai- EIS thocircng tin Tương lai EIS sẽ mở rộng hơn trong việc sử dụng dữ liệu becircn
ngoagravei doanh nghiệp- EIS kết nối Giao tiếp với băng thocircng rộng cho pheacutep kết nối liecircn thocircng lớn hơn
Chương 7 HỆ CHUYEcircN GIA VAgrave TRIacute TUỆ NHAcircN TẠO
71 Caacutec khaacutei niệm
72 Triacute thocircng minh của triacute tuệ nhacircn tạo
73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia
74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia
75 Lợi iacutech vagrave hạn chế của hệ chuyecircn gia
71 Caacutec khaacutei niệm
Chuyecircn mocircn (Expertise) sự hiểu biết rộng trong 1 lĩnh vực hẹp
Hệ chuyecircn gia (Expert Systems)1 chương trigravenh maacutey tiacutenh sử dụng 1 tập caacutec luật dựa trecircn tri thức của con người để giải quyết caacutec vấn đề đogravei hogravei phải coacute sự chuyecircn mocircn
Một số hệ chuyecircn gia nổi tiếng
DENDRAL (Standford 1960s Edward Feigenbaum)
MYCIN (Standford1970s Edward Shortliffe)
PROSPECTOR (MIT 1979)
Triacute tuệ nhacircn tạo (Artificial Intelligence ndash AI)
Triacute tuệ nhacircn tạo một bộ phacircn của ngagravenh khoa học maacutey tiacutenh quan tacircm đến việc thiết kế caacutec hệ thống maacutey tiacutenh thocircng minh đoacute lagrave caacutec hệ thống đưa ra caacutec đặc điểm magrave từ đoacute chuacuteng ta liecircn hệ với sự thocircng minh trong hagravenh động của con người (Barr vagrave Feigenbaum 1981)
Mục điacutech của AI
Mục điacutech khoa học xaacutec định caacutec gợi yacute để giải thiacutech caacutec loại khaacutec nhau của triacute tuệ thực
Mục điacutech kỹ thuật giải quyết caacutec vấn đề trong thế giới thực
Triacute tuệ nhacircn tạo kế thừa nhiều yacute tưởng quan điểm kỹ thuật từ caacutec ngagravenh khoa học khaacutec
- Triết học
- Logic Toaacuten học
- Tiacutenh toaacuten
- Khoa học tacircm lyacute Khoa học nhận thức
- Sinh học Thần kinh học
- Tiến hoacutea
Caacutec lĩnh vực ứng dụng trong Triacute tuệ nhacircn tạo
Mạng nơ ron thần kinh (Neural Networks)
Tiacutenh toaacuten sự tiến hoacutea
(Evolutionary Computation)
Hệ chuyecircn gia (Expert Systems)
Kỹ thuật xử lyacute tiếng noacutei (Speech Processing)
Kỹ thuật xử lyacute ngocircn ngữ tự nhiecircn
(Natural Language Processing)
Lập kế hoạch (Planning)
Robot (Robotics)
Khoa học higravenh ảnh (Vision)
Caacutec kỹ thuật thocircng dụng dugraveng trong AI
Biểu diễn(Representation)
Học (Learning)
Caacutec luật (Rules)
Tigravem kiếm (Search)
72 Triacute thocircng minh của triacute tuệ nhacircn tạo
Con người suy diễn như thế nagraveo
Phacircn loại (Categorization)
Caacutec quy tắc cụ thể
Heuristics
Kinh nghiệm trước đoacute
Dự tiacutenh trước
Maacutey tiacutenh suy diễn như thế nagraveo
Lập luận dựa trecircn luật IF-THEN mocirc tả tri thức được matilde hoacutea dưới dạng caacutec luật
Caacutec khung (Frames) lagrave caacutec đại diện mocirc tả caacutec tigravenh huống giống nhau lagrave điển higravenh của một vagravei phacircn loại
Lập luận dựa trecircn caacutec trường hợp mocirc phỏng giải phaacutep trước đoacute cho một vấn đề hiện tại
Nhận dạng mẫu phaacutet hiện acircm thanh higravenh dạng hoặc caacutec chuỗi dagravei
Caacutec dạng khaacutec của Triacute tuệ nhacircn tạo
Học maacutey- mạng nơron vagrave giải thuật di truyền
Lập trigravenh tự động ndash lagrave những kỹ thuật tạo ra caacutec chương trigravenh để lagravem 1 nhiệm vụ riecircng biệt (cho pheacutep những người khocircng phải lagrave người lập trigravenh coacute thể lập trigravenh được)
Cuộc sống nhacircn tạo ndash nỗ lực để taacutei tạo caacutec hiện tượng sinh học trong caacutec hệ thống dựa trecircn maacutey tiacutenh
73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia(Expert Systems- ES)
Theo Jackson (1999) Một hệ chuyecircn gia lagrave một chương trigravenh maacutey tiacutenh mocirc tả vagrave suy diễn với tri thức của một vagravei lĩnh vực để giải quyết vấn đề hay đưa ra caacutec lời khuyecircn
Cấu truacutec cơ bản của ES được dựa theo cấu truacutec chung của DSS Sự khaacutec biệt chiacutenh giữa ES vagraveDSS lagrave hệ ES thu thập caacutec kiến thức từ những
chuyecircn gia trong lĩnh vực quan tacircmĐặc trưng của hệ chuyecircn gia Hiệu quả cao Thời gian trả lời thỏa đaacuteng Độ tin cậy cao Dễ hiểu
Giao diện người dugraveng trong ES
Thiết kế giao diện người dugraveng tập trung vagraveo caacutec yếu tố như dễ dagraveng sử dụngcoacute độ tin cậy cao giảm tải những khoacute khăn khi sử dụng
Thiết kế necircn coacute một số tương taacutec (đầu vagraveo kiểm soaacutet vagrave truy vấn)
Cấu tạo giao diện người dugraveng gồm coacute magraven higravenh cảm ứng bagraven phiacutem buacutet saacuteng lệnh thoại caacutec phiacutem chuyecircn dụng
Cơ sở tri thức (Knowledge Base)
Chứa đựng caacutec tri thức cụ thể miền thu được từ caacutec chuyecircn gia miền
Coacute thể chứa caacutec mocirc tả caacutec hagravenh vi giải quyết vấn đề caacutec ragraveng buộc caacutec heuristics
Thagravenh cocircng của một ES dựa trecircn tiacutenh đầy đủ vagrave tiacutenh chiacutenh xaacutec của cơ sở tri thức
Mocirc tơ suy diễn (Inference Engine)
Ở đacircy tri thức được đặt để sử dụng tạo ra caacutec giải phaacutep để giải quyết vấn đề
Mocirc tơ nagravey coacute khả năng thực hiện diễn dịch hoặc suy diễn dựa trecircn caacutec luật hay caacutec caacutec sự kiện
Đồng thời cũng coacute khả năng sử dụng caacutec suy diễn mờ hay khocircng chiacutenh xaacutec dựa trecircn xaacutec suất hay aacutenh xạ mẫu
Vograveng điều khiển suy diễn
1 Aacutenh xạ caacutec luật với caacutec sự kiện đatilde được cho
2 Chọn luật để thực hiện
3 Thực hiện luật bằng caacutech thecircm caacutec sự kiện được suy diễn ra vagraveo bộ nhớ lagravem việc
Chuỗi suy diễn (Chaining)
Suy diễn tiến (forward chaining) maacutey suy diễn bắt đầu từ dữ liệu ban đầu vagrave thực hiện việc suy luận để đưa ra caacutec kết luận cuối cugraveng
Suy diễn lugravei (backward chaining) maacutey suy diễn bắt đầu từ dữ liệu điacutech vagrave tigravem ra tri thức hỗ trợ cho dữ liệu điacutech đoacute
Viacute dụ suy diễn lugravei
R1 Nếu coacute A vagrave B thigrave suy ra coacute D
R2 Nếu coacute B thigrave suy ra coacute C
R3 Nếu coacute C vagrave D thigrave suy ra coacute E
Ta coacute E ta xem trong 3 luật R1 R2 R3 luật nagraveo coacute E ta thấy R3 chứa E đồng thời chứa C vagrave D Xeacutet tiếp trong 2 luật R1 R2 luật nagraveo chứa C vagrave D R2 chứa C R3 chứa D Từ đoacute ta coacute được caacutec tri thức hỗ trợ suy diễn vagrave kết luận lagrave nếu coacute A vagrave B thigrave sẽ coacute E Hay nếu A vagrave B đuacuteng thigrave sẽ coacute E
Viacute dụ suy diễn tiến
Giả sử coacute tập chứa 3 luật sau
R1 Nếu coacute A vagrave B thigrave suy ra coacute D
R2 Nếu coacute B thigrave suy ra coacute C
R3 Nếu coacute C vagrave D thigrave suy ra coacute E
Nếu ta coacute A vagrave B thigrave chuacuteng ta suy ra được D từ R1 vagrave suy ra C từ R2 Với D vagrave C đatilde được suy ra ở trecircn giờ chuacuteng ta suy ra được E từ R3
Viacute dụ thực tế
Giả sử muốn biết magraveu của một con vật nuocirci tecircn lagrave Fred biết rằng noacute kecircu ộp ộp vagrave ăn ruồi
Coacute tập 4 luật ban đầu như sau
R1 Nếu X kecircu ộp ộp vagrave ăn ruồi thigrave X lagrave con ếch
R2 Nếu X kecircu chiecircm chiếp vagrave biết hoacutet thigrave X lagrave con chim
R3 Nếu X lagrave con ếch thigrave X coacute magraveu xanh
R4 Nếu X lagrave con chim thigrave X coacute magraveu vagraveng
74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia
Expert system shells lagrave một tập caacutec goacutei phần mềm vagrave caacutec cocircng cụ dugraveng để phaacutet triển caacutec hệ chuyecircn gia
Những Expert system shells đầu tiecircn thường rất rườm ragrave Mặc dugrave vậy noacute vẫn giuacutep cho người sử dụng sẽ khocircng phải bắt đầu lại từ đầu khi xacircy dựng một hệ chuyecircn gia mới
Những shell hiện đại bao gồm hai mocirc-đun chiacutenh lagrave cocircng cụ xacircy dựng một tập quy tắc vagrave mocirc tơ suy diễn
Xacircy dựng hệ chuyecircn gia
Bước 1 xacircy dựng mocirc higravenh bagravei toaacuten xaacutec định vấn đề nhiệm vụ magrave hệ thống sẽ thực hiện Caacutec dạng bagravei toaacuten cần hệ chuyecircn gia
Bagravei toaacuten diễn giải (InterPretation)
Bagravei toaacuten dự baacuteo (Prediction)
Bagravei toaacuten chuẩn đoaacuten (Diagnose)
Bagravei toaacuten gỡ rối (Debugging)
Bagravei toaacuten thiết kế
Tương tự như một dự aacuten phần mềm để xacircy dựng một hệ chuyecircn gia cần phải coacute caacutec yếu tố về nhacircn lực tagravei nguyecircn vagrave thời gian Những yếu tố nagravey ảnh hưởng đến giaacute thah của một hệ chuyecircn giaTrong phần nagravey cacircu hỏi thường được đặt ra lagrave tại sao cần phải xacircy dựng một hệ chuyecircn giaTrước khi bắt đầu phải xaacute định rotilde bagravei toaacuten đạt ra lagrave jiAi lagrave chuyecircn giaAi lagrave người sử dụng
1 Diễn giải (InterPretation) Nghiecircn cứu 1 vấn đề -gt Dựa trecircn những biểu hiện thuộc tiacutenh đặc trưng becircn ngoagravei -gt Tư vấn
(hoặc đưa ra kết luận hay mocirc tả dễ hiểu từ tập dữ liệu thocirc)
2 Bagravei toaacuten dự baacuteo (Prediction) Coacute thể dự đoaacuten được hagravenh vi kết quả dựa trecircn caacutec hiện tượng -gt dự baacuteo
VD Dự baacuteo thời tiết động đấthellip
3 Bagravei toaacuten chẩn đoaacuten (Diagnoss) Xaacutec định caacutec lỗi caacutec bộ phận hỏng hoacutec của hệ thống dựa trecircn caacutec dữ liệu quan saacutet được
4 Bagravei toaacuten gỡ rối (Debugging) Mocirc tả caacutec phương phaacutep khắc phục hệ thống khi gặp sự cố
5 Bagravei toaacuten thiết kế Lựa chọn cấu higravenh caacutec đối tượng nhằm thoả matilden một số ragraveng buộc nagraveo đoacute
6 Giảng dạy Phần mềm dạy học coacute thể chuẩn đoaacuten vagrave sủa lỗi của học sinh trong quaacute trigravenh học tập
Để xaacutec định đuacuteng bagravei toaacuten magrave chuacuteng ta cần giải quyết thigrave phải trả lời đc một số cacircu hỏi
- cần hệ chuyecircn gia
Bước 2 thu thập tri thức lựa chọn cocircng cụ vagrave aacutep dụng
Trong bước thu thập tri thức vấn đề quan trọng lagrave lựa chọn chuyecircn gia những người magrave sẽ đoacuteng goacutep tri thức cho hệ thống Thocircng thường trong suốt quaacute trigravenh phaacutet triển thigrave chuyecircn gia được xem như một thagravenh viecircn của đội phaacutet triển
Hiện nay coacute rất nhiều cocircng cụ để xacircy dựng một hệ chuyecircn gia Phổ biến nhất lagrave JESS CLIPS vagrave OPS5
Bước 3 Thiết kế cơ sở tri thức thiết kế hệ thốngTri thức được biểu diễn trường minh trong cơ sở tri thức
Caacutec chuyecircn gia vagrave kỹ sư tri thức sẽ đối thoại với nhau bằng caacutec kỹ thuật đối thoại Suy diễn (SD) bảng Mocirc higravenh hoacutea SD quy nạp phacircn loại
Vấn đề bagraveo trigrave vagrave phaacutet triển
Caacutec hệ chuyecircn gia đogravei hỏi phải bảo trigrave vagrave phaacutet triển nhiều hơn so với caacutec hệ thống khaacutec Phải thường xuyecircn bổ sung tri thức mới vagrave thay đổi caacutec tri thức cũ để đổi mới hệ chuyecircn gia
Thu thập vagrave khắc phục lỗi do người sử dụng phaacutet hiện để kịp thời khắc phục những sai soacutet của hệ chuyecircn gia
75 Lợi iacutech vagrave hạn chế của caacutec hệ chuyecircn gia
Một số lợi iacutech chiacutenh
Thời gian trả lời hợp lyacute bằng hoặc nhanh hơn so với chuyecircn gia (người) để đi đến cugraveng một quyết định Hệ chuyecircn gia lagrave một hệ thống thời gian thực (real time system)
Khả năng trả lời với mức độ tinh thocircng bằng hoặc cao hơn so với chuyecircn gia (người) trong cugraveng lĩnh vực
Hệ chuyecircn gia giuacutep cho hiệu quả lagravem việc tăng bằng việc sử dụng tập caacutec luật một caacutech nhanh choacuteng magrave ko bị nhầm lẫn chuyecircn gia lagrave người coacute thể quecircn đi một số tri thức cơ sở lyacute luậ nhưng HCG thigrave ko
Quyết định của một người chuyecircn gia coacute thể bị thay đổi vagrave ko coacute tiacutenh thống nhất như quyết định của một hệ chuyecircn gia tạo ra
Hệ chuyecircn gia giuacutep cho người sử dụng coacute thể trau dồi sự hiểu biết trecircn lĩnh vuej cụ thể magrave noacute giải quyết hỗ trợ người ra quyết định coacute trigravenh độ như 1 chuyecircn gia trong quaacute trigravenh gia quyết định
Kiến thức của rất nhiều chuyecircn gia về một lĩnh vực nagraveo đoacute được đưa vagraveo hệ chuyecircn gia lagravem cho CSTT cuat HCG phong phuacute vagrave rộng lớn hơn rất nhiều
HCG giải thiacutech caacutec bước suy luận một caacutech dễ hiểu nhất quaacuten luacutec nagraveo cũng coacute thể sử dụng ko như chuyecircn gia con người
Hạn chế của caacutec hệ chuyecircn gia
Nhược điểm lớn nhất của hệ chuyecircn gia lagrave những yacute kiến chuyecircn mocircn thường rất khoacute matilde hoacutea vagrave giải neacuten
Hệ chuyecircn gia khocircng coacute khả năng tự học tự cập nhật kiến thức mới như caacutec chuyecircn gia magrave cần phải được matilde hoacutea lại khi noacute được cập nhật
Hệ chuyecircn gia khocircng thể nhận ra được vấn đề khocircng nằm trong miền kiến thức của hệ thống
Chương 8 Tri thức vagrave tiếp nhận
1 Bao gồm caacutec vấn đề
Dữ liệu thực tế đo lường hoặc quan saacutet coacute hoặc khocircng coacute bối cảnh
Thocircng tin dữ liệu được tổng hợp một caacutech hữu iacutech để giải quyết những khoacute khăn trong việc đưa ra quyết định
Tri thức bao gồm caacutec ứng dụng quy tắc thocircng tin hướng dẫn của người ra quyết định
2 Những caacutei nhigraven về tri thức
Đại diện lagravem thế nagraveo để diễn tả tri thức viacute dụ như một quyển saacutech khocircng phải lagrave tri thức nhưng noacute lại lagrave một đại diện của tri thức
Sản xuất tri thức lagrave một tập hơp của hagraveng tồn kho coacute thể được sản xuất cũng như mua lại
Tri thức lagrave 1 trong 6 trạng thaacutei của hệ thống
1Dữ liệu 2Thocircng tin 3Cấu truacutec thocircng tin 4Sự thấu hiểu 5Yacute kiến 6 Quyết định
3 Caacutec loại tri thức Phổ biến mocirc tả dữ liệu thocircng tin thủ tục mọi thứ lagravem như thế nagraveo lập luận chiacutenh saacutech hoặc caacutec quy tắc
4 Thu thập Tri thức hệ chuyecircn gia Hầu hết caacutec phương phaacutep đều bắt đầu với mocirc higravenh của caacutec taacutec vụ trong đoacute
hệ chuyecircn gia được xacircy dựng Trong đoacute mocirc tả về caacutec lĩnh vực được tạo ra Caacutec kỹ sư sử dụng caacutec mocirc higravenh giả thuyết vagrave nhận thức về quaacute trigravenh phacircn
tiacutech để gợi ra caacutech giải quyết vấn đề về tri thức từ caacutec chuyecircn gia
5 Caacutec chiều của thu thập tri thức KE- driven caacutec kỹ sư trao đổi trực tiếp với caacutec chuyecircn gia Expert-driven Caacutec chuyecircn gia trực tiếp đưa chuyecircn mocircn của họ vagraveo hệ
thống maacutey tiacutenh Machine-driven Sử dụng caacutec cocircng cụ suy luận để triacutech xuất tri thức từ một
tập caacutec viacute dụ
6 Kỹ thuật thu thập tri thức Trao đổi gồm 2 loại cơ bản lagrave coacute cấu truacutec(coacute kịch bản) vagrave khocircng coacute cấu
truacutec( đối thoại trực tiếp) Giao thức phacircn tiacutech bằng lời Khi caacutec chuyecircn gia thực hiện một cocircng việc
của họ thigrave một bản ghi về cocircng việc đoacute được thực hiện Caacutec kỹ sư sẽ xacircy dựng mocirc higravenh cho những gigrave được ghi lại trong bản ghi
Phương phaacutep sagraveng lọc caacutec chuyecircn gia so saacutenh caacutec nhoacutem liecircn tiếp trong ba đối tượng vagrave cho biết tại sao nhoacutem thứ hai lại khaacutec nhoacutem thứ ba
7 Thu thập tri thức từ nhiều nguồn Thu thập tri thức từ nhiều nguồn lagrave cần thiết để coacute được đầy đủ caacutec tri thức
cho một vấn đề quan điểm yacute kiến traacutei ngược nhau thường phaacutet sinh Phương phaacutep đồng thuận sẽ giuacutep giải quyết được vấn đề macircu thuẫn Kỹ thuật phacircn tiacutech Meta lagrave kỹ thuật được aacutep dụng trong caacutec trường hợp
khaacutec Caacutech tiếp cận bằng định lượng đogravei hỏi caacutec kỹ sư cần cacircn nhắc yếu tố đầu vagraveo của caacutec chuyecircn gia khaacutec nhau
8 Xaacutec nhận hợp lệ vagrave kiểm tra tri thức Một khi thu thập tri thức noacute phải được đaacutenh giaacute về khả năng sử dụng vagrave độ
chiacutenh xaacutec Hai vấn đề cụ thể lagrave hiệu lực của những kiến thức vagrave kiểm tra việc xacircy dựng cơ sở của tri thức
Cần xaacutec nhận xem liệu hệ thống coacute thể hoạt động ở mức độ tối thiểu khocircng
Xaacutec minh liecircn quan đến việc so saacutenh từng chi tiết kỹ thuật của hệ thống những gigrave đatilde được thực hiện cuối cugraveng
9 Một số caacutec biện phaacutep xaacutec nhận Độ chiacutenh xaacutec Khả năng thiacutech nghi Mức độ đầy đủ Bề rộng Độ sacircu Hiệu lực Tổng quan Chiacutenh xaacutec Hiện thực Độ tin cậy Tiacutenh hữu dụng Mức độ
Chương 9 Học maacutey
1 Logic mờ vagrave ngocircn ngữ mờ(Fuzzy Logic and Linguistic Ambiguity)
Ngocircn ngữ tự nhiecircn gồm những khaacutei niệm mơ hồ vagrave khocircng chiacutenh xaacutectruyền tải ngữ nghĩa thocircng qua tiacutenh xấp xỉkhocircng rotilde ragraveng
Những xấp xỉ nagravey giuacutep con người coacute thể truyền tải hết được yacute nghĩa nhưng maacutey thigrave khocircng hiểu
Lagravem sao biểu diễn caacutec tri thức sử dụng caacutec khaacutei niệm khocircng rotilde ragraveng(mờ) hoặc khocircng chiacutenh xaacutec
2 Khaacutei niệm cơ bản của logic mờ tập mờ lagrave những tập hợp khocircng coacute một giới hạn rotilde Mỗi phần tử của noacute chỉ
chứa một mức độ hagravem liecircn thuộc của từng phần tử Vigrave vậy tập mờ khocircng giống như tập cổ điển Tập mờ coacute thể kết hợp với nhau qua những luật mờ magrave đặc trưng cho những hagravenh động trạng thaacutei vagrave thuộc tiacutenh của logic mờ được tận dụng khi thực hiện một bộ điều khiển mờ
Logic mờ dựa trecircn yacute tưởng mỗi phần tử thuộc vagraveo một tập hợp ở một mức độ nagraveo đấy
Locircgic mờ cho pheacutep độ liecircn thuộc (microA )coacute giaacute trị trong khoảng (01) Locircgic mờ coacute thể được coi lagrave mặt ứng dụng của lyacute thuyết tập mờ để xử lyacute caacutec
giaacute trị trong thế giới thực cho caacutec bagravei toaacuten phức tạp
3 So saacutenh tiacutenh đuacuteng đắn logic mờ vagrave xaacutec suất Xaacutec suất thigrave đề cập đến khả năng xảy ra một biến cố hay một điều gigrave đoacute Logic mờ đề cập đến cấp độ magrave đặc tiacutenh ở hiện tại
o viacute dụ1 người coacute chiều cao 6 feet thigrave coacute cấp độ lagrave 05 về chiều cao
4 Ưu điểm của logic mờ Caacutech tiếp cận rất tự nhiecircnkhocircng phức tạp Coacute thể mocirc higravenh hoacutea caacutec hagravem phi tuyến tugravey yacute phức tạp
Coacute thể tận dụng được kinh nghiệm từ những chuyecircn gia hagraveng đầu trong mọi lĩnh vực
Logic mờ được xacircy dựng dựa trecircn ngocircn ngữ tự nhiecircnNền tảng của logic mờ lagrave dựa trecircn cơ sở giao tiếp của con người
5 Nhược điểm của logic mờ Trong 1 hệ thống phức tạpsử dụng logic mờ coacute thể trở thagravenh trở ngại cho
việc xaacutec thực độ tin cậy của hệ thống Cơ chế lập luận mờ khocircng thể học hỏi từ những lỗi sai
6 Mạng noron nhacircn tạo(ANN) Mạng noron nhacircn tạo lagrave một mocirc phỏng xử lyacute thocircng tinđược nghiecircn cứu ra
từ hệ thống thần kinh của sinh vậtgiống như bộ natildeo để xử lyacute thocircng tin ANNs lagrave chương trigravenh dựa trecircn maacutey tiacutenh đơn giản coacute chức năng lagrave một mocirc
higravenh bagravei toaacuten khocircng gian dựa trecircn thử nghiệm vagrave baacuteo lỗi
7 Học từ kinh nghiệm Tiến trigravenh Một mẫu dữ liệu được biểu diễn như một mạng lưới noronANN ldquodự
đoaacutenrdquo 1 đầu radự đoaacuten được so saacutenh với giaacute trị thực tế hoặc giaacute trị chiacutenh xaacutecNếu đoaacuten được chiacutenh xaacutec thigrave khocircng coacute hagravenh động nagraveo được thực hiện
Nếu dự đoaacuten sai ANN kiểm tra lại vagrave xaacutec định lại thocircng số để điều chỉnh Một mẫu dữ liệu khaacutec được biểu diễn vagrave quaacute trigravenh nagravey được lặp lại
8 Nguyecircn tắc cơ bản của cocircng nghệ nơron Caacutec yếu tố xử lyacute cơ bản trong hệ thống thần kinh của con người lagrave tế bagraveo
thần kinhMạng lưới của tế bagraveo nagravey lagrave liecircn kết với nhau nhận được thocircng tin từ caacutec cảm biến trong mắt taihellip
Thocircng tin nhận được bởi tế bagraveo thần kinh hoặc lagrave sẽ kiacutech thiacutech noacute(sẽ được chuyển qua 1 thocircng điệp dọc theo mạng lưới) hoặc lagrave sẽ ngăn cản noacute(ngăn cản dograveng thocircng tin)
Độ nhạy coacute thể thay đổi qua thời gian hoặc sau khi coacute được kinh nghiệm
9 Cấu truacutec mạng Một ANN gồm 3 lớp cơ bản
Lớp đầu vagraveo nhận dữ liệu Lớp becircn trong hoặc lagrave lớp ẩn xử lyacute dữ liệu Lớp đầu ra chuyển tiếp kết quả cuối cugraveng của mạng
10Mạng nơ ron Thường coacute nhiều đầu vagraveo mỗi đầu vagraveo với mức ảnh hưởng vagrave tầm quan
trọng riecircng của noacute Một đầu vagraveo quan trọng coacute thể được sử dụng để khuếch đại đầu ra caacutec hagravem trạng thaacutei tổng hợp caacutec trọng số của caacutec yếu tố
đầuvagraveo khaacutec nhauvagraveo một giaacute trị duy nhất Caacutec hagravem chuyển giao xử lyacute caacutec giaacute trị trạng thaacutei vagrave tạo đầu ra
11Huấn luyện mạng nơ ron Trong mocirc higravenh coacute giaacutem saacutetANN được đến so saacutenh dự đoaacuten của chiacutenh
noacute với thocircng tin phản hồi coacute chứa caacutec kết quả mong muốn ANN sẽ phải tigravem caacutech thay đổi caacutec tham số becircn trong củamigravenh (caacutec trọng số vagrave caacutec ngưỡng) để tạo necircn một aacutenh xạ coacute khả năng aacutenh xạcaacutec đầu vagraveo thagravenh caacutec đầu ra mong muốn Sự thay đổi nagravey được tiến hagravenh nhờ việc so saacutenh giữa đầu ra thực sự vagrave đầu ra mong muốn
Trong mocirc higravenh khocircng coacute giaacutem saacutetANN nhận được dữ liệu vagraveo nhưng khocircng phải coacute bất kỳ thocircng tin phản hồi về kết quả mong muốn
Phần lớn caacutec ứng dụng nằm trong vugraveng của caacutec bagravei toaacuten ước lượng như mocirc higravenh hoacuteathống kecirc neacuten lọc phacircn cụm
12Lợi iacutech Liecircn kết với mạng noron Traacutenh caacutech lập trigravenh tường minh Giảm nhu cầu của chuyecircn gia ANNs thigrave thiacutech nghi với caacutec yếu tố đầu vagraveo thay đổi Khocircng cần thiết cho cơ sở tri thức tinh chế ANNs coacute tiacutenh động vagrave cải thiện với việc sử dụng Coacute khả năng xử lyacute dữ liệu khocircng chiacutenh xaacutec hoặc khocircng đầy đủ Cho pheacutep tổng quaacutet hoacutea từ thocircng tin cụ thể Cho pheacutep thu thập cảm giaacutec thocircng thường vagraveo miền giải quyết vấn đề
13Hạn chế của việc liecircn kết với mạng noron ANNs khocircng thể giải thiacutech được suy luận Bản chất hộp đen thường khiến cho vấn đề traacutech nhiệm vagrave độ tin cậy phaacutet
sinh lagrave khoacute khăn Lặp đi lặp lại quaacute trigravenh huấn luyện rất tốn thời gian Nguồn lực caacutec nhagrave phacircn tiacutech vagrave thiết kế coacute tay nghề cao vẫn lagrave đaacuteng lo
ngại Cocircng nghệ ANN thuacutec đẩy hạn chế của phần cứng hiện tại ANN yecircu cầu phải coacute sự tin tưởng ở đầu ra
14Giới thiệu về thuật toaacuten di truyền Cũng như mạng lưới thần kinh caacutec thuật toaacuten di truyền được dựa trecircn lyacute
thuyết sinh học Thuật toaacuten di truyền tigravem thấy nguồn gốc của chuacuteng trong caacutec lyacute thuyết
tiến hoacutea của chọn lọc tự nhiecircn vagrave thiacutech ứng với biến đổi khiacute hậu Kết quả thuật toaacuten di truyền lagrave từ giao phối 2 caacute thể trong quần thế để tạo
ra con caacutei đocirci khi tốt hơn so với bậc cha mẹ của chuacuteng 15Caacutec thagravenh phần cơ bản của thuật toaacuten di truyền
Toaacuten tử chọn lọc Caacutec caacute thể tốt được chọn lọc để đưa vagraveo thế hệ sau Sự chọn lọc nagravey căn cứ vagraveo độ thiacutech nghi với mocirci trường của mỗi caacute thể
Toaacuten tử lai gheacutep (crossover) Hai caacute thể cha vagrave mẹ trao đổi caacutec gen với nhau để tạo ra caacute thể con
Toaacuten tử đột biến (mutation) Một caacute thể thay đổi một số gen để biến đổi thagravenh một caacute thể mớiTất cả caacutec toaacuten tử trecircn khi thực hiện đều mang tiacutenh ngẫu nhiecircn
16Quaacute trigravenh cơ bản của một thuật toaacuten di truyền Khởi tạo
Đaacutenh giaacute quần thể
Lựa chọn NST thiacutech hợp nhất vagrave loại bỏ NST yếu nhất
Quy trigravenh giao nhau vagrave cải thiện quần thể
đột biến tiến trigravenh để khaacutem phaacute ra NST mới
17Ưu nhược điểm của việc kết hợp với thuật toaacuten di truyền Kiacutech thước quần thể lagrave 1 yếu tố quan trọng trong tốc độ của việc tigravem
kiếmnhưng noacute tương đối dễ dagraveng để dự đoaacuten tốc độ nagravey Giao nhau hoặc đột biến lagrave khocircng necircn đc sử dụng quaacute thường xuyecircn Luocircn coacute được iacutet nhất 1 giải phaacutep hợp lyacute Necircn coacute thể aacutep dụng chuacuteng cho caacutec vấn đề magrave chuacuteng ta khocircng coacute hướng
về caacutech giải quyết Sức mạnh của thuật toaacuten xuất phaacutet từ khaacutei niệm đơn giảnkhocircng phải từ
một thủ tục thuật toaacuten phức tạp 18Tương lai của học maacutey
Mạng lưới thần kinh nhacircn tạo vượt quaacute năng lực của con người trong caacutec trường hợp bị cocirc lập
Về mặt lyacute thuyếtmột maacutey tiacutenh coacute thể xử lyacute dũ liệu nhanh hơn hagraveng triệu lần so với 1 con người
May mắn thay cho chuacuteng tacon người tốt hơn nhiều khi magrave coacute được dữ liệumaacutey tiacutenh khocircng coacute 1 số thứ như lagrave 5 giaacutec quan
CHƯƠNG 10 KHO DỮ LIỆU
1 Kho dữ liệu Kho dữ liệu lagrave tuyển tập caacutec cơ sở dữ liệu tiacutech hợp hướng chủ đề được
thiết kế để trợ giuacutep cho một hệ hỗ trợ quyết định
Theo John Ladley Cocircng nghệ kho dữ liệu lagrave tập caacutec phương phaacutep kỹ thuật vagrave caacutec cocircng cụ coacute thể kết hợp hỗ trợ nhau để cung cấp thocircng tin cho người sử dụng trecircn cơ sở tiacutech hợp từ nhiều nguồn dữ liệu nhiều mocirci trường khaacutec nhau
Kho dữ liệu thường rất lớn tới hagraveng trăm GB hay thậm chiacute hagraveng Terabyte
2 Kho dữ liệu vận hagravenh (ODS) Một kho dữ liệu vận hagravenh Aacutep dụng kỹ thuật kho dữ liệu vagraveo caacutec hệ xử
lyacute giao taacutec lưu trữ dữ liệu cho một ứng dụng đặc thugrave Noacute đưa vagraveo kho dữ liệu một dograveng caacutec dữ liệu thocirc được thiết kế
3 So saacutenh
Kho dữ liệu vận hagravenh Kho dữ liệu
Dữ liệu theo chủ đề Dữ liệu theo chủ đề
Dữ liệu tiacutech hợp Dữ liệu tiacutech hợp
Dữ liệu thay đổi Dữ liệu khocircng thay đổi
Dữ liệu được cập nhật khi thay đổi
Dữ liệu giữ nguyecircn
Chỉ coacute dữ liệu hiện tạiDữliệu hiện tại vagrave dữ liệu lịch sử
Chu kỳ lagravem tươi dữ liệu ngắn Chu kỳ lagravem tươi dữ liệu dagravei
Chỉ coacute dữ liệu chi tiết Dữ liệu chi tiết vagrave dữ liệu tổng kết
Dugraveng cho caacutec quyết định ngắn hạn
Dugraveng cho hoạch định dagravei hạn
4 Kho dữ liệu cục bộ (Data Mart - DM)
Kho dữ liệu cục bộ lagrave CSDL coacute những đặc điểm giống với kho dữ liệu nhưng với quy mocirc nhỏ hơn vagrave lưu trữ dữ liệu về một lĩnh vực một chuyecircn ngagravenh
Data mart phụ thuộc Chứa những dữ liệu được lấy từ DW vagrave những dữ liệu nagravey sẽ được triacutech lọc vagrave tinh chế tiacutech hợp lại ở mức cao hơn để phục vụ một chủ đề nhất định của Datamart
Data mart độc lập Khocircng giống như Datamart phụ thuộc Data mart độc lập được xacircy dựng trước DW vagrave dữ liệu được trực tiếp lấy từ caacutec nguồn khaacutec nhau
5 Siecircu dữ liệu Metadata lagrave dữ liệu để mocirc tả dữ liệu Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột
một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi Metadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu
6 Mocirci trường kho dữ liệu Hệ thống của tổ chức vagrave kho cung cấp dữ liệu để xacircy dựng kho dữ liệu Trong quaacute trigravenh chuyển dữ liệu từ caacutec nguồn khaacutec nhau dữ liệu coacute thể
được lagravem sạch hoặc chuyển đổi vagrave vigrave thế DW được xem như lagrave một chuẩn cho việc lưu trữ
Đồng thời siecircu dữ liệu được ghi lại Cuối cugraveng DW hoặc siecircu thị coacute thể được sử dụng để tạo ra một kho dữ
liệu ldquocaacute nhacircnrdquo 7 Caacutec đặc điểm của kho dữ liệu
Đặc điểm Mocirc tả
Hướng chủ đề - DL tổ chức theo caacutech thức người dugraveng tham chiếu
Tiacutech hợp - Dữ liệu ldquosạchrdquo loại bỏ tiacutenh thiếu nhất quaacuten
Khocircng thay đổi - DL ldquochỉ đọcrdquo người dugraveng khocircng thay đổi được
Chuỗi thời gian - DL lagrave chuỗi thời gian khocircng phải lagrave trạng thaacutei hiện tại
Được tổng kết - DL vận hagravenhthao taacutec khi cần thiết
được kết hợp lại thagravenh dạng coacute thể dugraveng được cho quyết định
Kiacutech cỡ lớn hơn - Lưu giữ theo chuỗi thời gian tức lagrave giữ lại nhiều DL
Khocircng được chuẩn hoacutea - Coacute thể dư thừa DLSiecircu dữ liệu - Dữ liệu của dữ liệu được lưu trữNguồn dữ liệu - DL vận hagravenh (caacutec hệ sẵn coacute) cugraveng
với caacutec nguồn ngoagravei 8 Kho dữ liệu hướng chủ đề
Hướng chủ để coacute nghĩa lagrave kho dữ liệu được tổ chức xung quanh caacutec chủ đề chiacutenh như khaacutech hagraveng sản phẩm sản xuất Tập trung vagraveo việc mocirc higravenh hoacutea vagrave phacircn tiacutech dữ liệu cho caacutec nhagrave ra quyết định magrave khocircng tập trung vagraveo caacutec xử lyacute thocircng thường Cung cấp cho người dugraveng một khung nhigraven toagraven vẹn đơn giản vagrave đầy đủ về caacutec sự kiện quanh caacutec chủ đề
9 Dữ liệu trong DW được tiacutech hợp Dữ liệu trong kho dữ liệu được xacircy dựng bằng caacutech tổng hợp dữ liệu từ
nhiều nguồn khaacutec nhau vagrave caacutec nguồn coacute tổ chức khaacutec nhau Cơ sở dữ liệu caacutec file excel caacutec flat file hoặc caacutec raw file Khi đưa vagraveo kho dữ liệu caacutec dữ liệu được lagravem sạch vagrave tiacutech hợp dữ liệu nhằm đảm bảo tiacutenh nhất quaacuten của dữ liệu
10Kiến truacutec kho dữ liệu Tầng cơ sở dữ liệu hoạt động Tầng truy xuất thocircng tin Tầng truy xuất dữ liệu Tầng siecircu dữ liệu Tầng quản lyacute tiến trigravenh Tầng thocircng điệp của ứng dụng Tầng vật liacute của kho dữ liệu Tầng trigravenh diễn dữ liệu
11Higravenh trạng kho dữ liệu Kho dữ liệu ảo - người dugraveng cuối coacute thể truy cập trực tiếp đến kho dữ liệu
sử dụng caacutec cocircng cụ cho pheacutep ở tầng truy xuất dữ liệu Kho dữ liệu trung tacircm-1 cơ sở dữ liệu vật lyacute chứa tất cả dữ liệu cho một
vugraveng chuyecircn dụng nagraveo đoacute
Kho dữ liệu phacircn taacuten- Thagravenh phần được phacircn taacuten qua nhiều hệ cơ sở dữ liệu vật lyacute
12METADATA- Siecircu dữ liệu Định nghĩa Siecircu dữ liệu lagrave dữ liệu về dữ liệu Lagrave 1 lưu trữ dugraveng để
Miecircu tả kho dữ liệu tổng thể Nhận dạng kiểu kho dữ liệu Quản liacute quaacute trigravenh tiacutech hợp dữ liệu Quản liacute quaacute trigravenh cập nhật kho dữ liệu Quản liacute bảo mật
Lagrave chigravea khoacutea quyết định sự thagravenh cocircng của kho dữ liệu luocircn được thay đổi vagrave cập nhật theo sự phaacutet triển của kho dữ liệu
Dugraveng để quản liacute điều khiển kho dữ liệu Sự ra đời của kho dữ liệu như 1 cấu truacutec hỗ trợ ra quyết định siecircu dữ liệu
được xem như nguồn tagravei nguyecircn dữ liệu Siecircu dữ liệu lagrave trừu tượng Chuacuteng lagrave dữ liệu bậc cao cung cấp mocirc tả ngắn
gọn caacutec dữ liệu bậc thấp hơn 13Hoạt động của Siecircu dữ liệu
Siecircu dữ liệu rất cần thiết trong việc chuyển hoacutea thocircng tin trở thagravenh tri thức Lagrave chigravea khoacutea giuacutep chuacuteng ta xử lyacute được dữ liệu thocirc Viacute dụ một dograveng dữ liệu baacuten hagraveng 1023 K596 11121 agraveNoacute sẽ khocircng coacute nghĩa gigrave cho đến khi chuacuteng ta đưa vagraveo siecircu dữ liệu (thư
mục chứa dữ liệu) agrave cửa hagraveng 1023 sản phẩm K596 vagrave số tiền baacuten được lagrave 11121 đocirc la
14Sự cần thiết phải nhất quaacuten trong kho dữ liệu Kho dữ liệu được xacircy dựng cho lợi iacutech của những nhagrave phacircn tiacutech kinh
doanh caacutec nhagrave quản trị cho tất cả caacutec khu vực chức năng Trong cơ sở dữ liệu riecircng caacutec khu vực khaacutec nhau coacute thể định nghĩa vagrave lưu
trữ dữ liệu thocircng qua phiecircn bản của chiacutenh noacute Khi dữ liệu được lấy từ những vugraveng khaacutec nhau đoacute vagrave được đặt vagraveo kho dữ
liệu Việc chuyển đổi vagrave lagravem sạch caacutec tiến trigravenh sẽ đảm bảo noacute lagrave duy nhất được tiacutech hợp tại một mức của tổ chức
15Ragrave soaacutet lại dữ liệu ndash Thực thi siecircu dữ liệu
Bất kể cấu truacutec tự nhiecircn của 1 cacircu truy vấn thế nagraveo thigrave caacutec thagravenh phần của siecircu dữ liệu rất quan trọng đối với người ra quyết định
Bảng thuộc tiacutenh khoacutea được lưu trữ bởi kho dữ liệu Tập hợp dữ liệu được lấy từ đacircu Những chuyển đổi nagraveo được thực thi với việc lagravem sạch
16Siecircu dữ liệu lagrave gigrave Metadata - lagrave thocircng tin mocirc tả nội dung của cơ sở dữ liệu (CSDL) Metadata baacuteo cho người dugraveng biết thời gian cập nhật sau cugraveng của dữ liệu
định dạng vagrave mục điacutech sử dụng của noacute Những thocircng tin nagravey coacute thể hướng dẫn người dugraveng duyệt qua CSDL vagrave
giuacutep họ hiểu được yacute nghĩa vagrave ngữ cảnh của dữ liệu Trong CSDL metadata lagrave caacutec dạng biểu diễn khaacutec nhau của caacutec đối tượng
trong CSDL Trong CSDL quan hệ metadata lagrave caacutec định nghĩa của bảng cột CSDL
view vagrave nhiều đối tượng khaacutec Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột
một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi -gtMetadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu
Bảng chuyển đổi Ghi lại những chuyển đổi đatilde được thực hiện
Lịch sử thực thi Ghi lại những dữ liệu đatilde được
phacircn tiacutech
Higravenh thaacutei kết nốiGhi lại những dữ liệu được kết nối vagrave tần suất
17Aacutenh xạ thocircng thường của siecircu dữ liệu Bản ghi aacutenh xạ chuyển đổi bao gồm
Định danh của nguồn gốc Chuyển đổi thuộc tiacutenh Chuyển đổi thuộc tiacutenh vật lyacute Matilde hoacutea tham chiếu bảng chuyển đổi Đổi tecircn Đổi khoacutea Gaacuten giaacute trị cho thuộc tiacutenh mặc định Chọn logic cho caacutec nguồn nhiều giaacute trị Đổi thuật toaacuten
18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để
phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai
lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave
tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec
Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm
Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo
19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua
caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau
SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được
Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra
một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức
Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ
Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ
Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech
CHƯƠNG 11 KHAI PHAacute DỮ LIỆU
1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn
ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993
Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng
2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd
1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều
2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP
3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn
4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng
5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server
6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo
7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động
8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời
9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều
10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện
11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech
12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP
3 Xử lyacute phacircn tiacutech trực tuyến OLAP
MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave
dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu
ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave
thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu
HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave
ROLAP4 Khai phaacute dữ liệu
Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh
khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn
Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan
5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp
6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại
Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp
Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec
Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt
Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra
Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh
vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho
Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec
Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm
Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục
Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng
gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp
Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn
Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec
Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper
Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2
Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25
Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước
Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng
Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện
trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp
Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute
độ hỗ trợ ge ngưỡng minsup
độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan
Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn
Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết
Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu
MOLAP ROLAP HOLAP
Lưu trữ dữ liệu cơ sở
Khối Bảng quan hệ Bảng quan hệ
Lưu trữ thocircng tin tổng hợp
Khối Bảng quan hệ Khối
Hiệu suất thực hiện truy vấn
Nhanh nhất Chậm nhất Nhanh
Tiecircu thụ khocircng gian lưu trữ
Nhiều Thấp Trung bigravenh
Chi phiacute bảo trigrave Cao Thấp Trung bigravenh
bull Khocircng thực sự lagrave một mocirc higravenh vigrave khocircng biểu diễn thực tại magrave lagrave cố gắng bắtchước thực tạibull Một trong những phương phaacutep thocircng dụng nhất trong HHTQĐbull HHTQĐ lagravem việc với caacutec bagravei toaacuten phi cấu truacutec vagrave cấu truacutec yếu tigravenh huống thực tếphức tạp ndash khocircng dễ biểu diễn bằng mocirc higravenh tối ưu hay caacutec dạng mocirc higravenh khaacutecnhưng lại thường coacute thể xử lyacute được bằng mocirc phỏngbull Đặc điểm1048713 Iacutet đưa ra caacutec đơn giản hoacutea về thực tại hơn caacutec mocirc higravenh khaacutec1048713 Do triển khai caacutec thực nghiệm necircn noacute coacute thể kiểm thử caacutec giaacute trị cụ thể của caacutecbiến quyết địnhbiến khocircng kiểm soaacutet được của mocirc higravenh vagrave xem xeacutet ảnh hưởnglecircn caacutec biến kết quả1048713 Phương phaacutep coacute tiacutenh mocirc tả (như vậy khaacutec với phương phaacutep danh định)1048713 Khocircng tự động tigravem kiếm giải phaacutep tối ưu ndash noacute mocirc tảtiecircn đoaacuten caacutec đặc tiacutenh của hệthống đatilde cho dưới caacutec điều kiện khaacutec nhau từ đoacute coacute thể chọn ra phương aacuten tốtnhất1048713 Quaacute trigravenh mocirc phỏng thường lặp lại một thực nghiệm nhiều lần để coacute được ướclượng về hiệu ứng tổng quaacutet của một số hagravenh động nhất định1048713 Mocirc phỏng maacutey tiacutenh thiacutech hợp cho hầu hết caacutec tigravenh huống mặc dugrave cũng coacute một sốmocirc phỏng thủ cocircng thagravenh cocircng1048713 Thường chỉ được dugraveng khi bagravei toaacuten quaacute phức tạp khocircng thể xem xeacutet bằng caacutec kỹthuật tối ưu dạng số Tiacutenh phức tạp theo nghĩa bagravei toaacuten khocircng thể cocircng thức hoacuteacho tối ưu (do khocircng thotildea caacutec giả định) hoặc cocircng thức quaacute lớn quaacute nhiều tươngtaacutec giữa caacutec biến hoặc về bản chất bagravei toaacuten lagrave bất định hay rủi roPhương phaacutep mocirc phỏng thiết lập mocirc higravenh của hệ thống thực vagrave tiến hagravenh caacutec thựcnghiệm lặp lại trecircn mocirc higravenh
bull Thuận lợi1048713 Lyacute thuyết tương đối trực tiếp hiệu ứng dagravei hạn của nhiều chiacutenh saacutech -gt neacuten thờigian lớn1048713 Do tiacutenh chất mocirc tả (khaacutec với danh định)1048713 Coacute thể thấy được nhanh choacuteng coacute thể đặt ra caacutec cacircu hỏi ldquowhat-ifrdquo coacute thể dugravengtiếp cận thử-vagrave-sai vagraveo giải quyết vấn đề một caacutech nhanh choacuteng rẻ chiacutenh xaacutec iacutetrủi ro hơn1048713 Thử nghiệm được biến quyết định phần nagraveo của mocirci trường thực sự quan trọngvới caacutec phương aacuten khaacutec nhau1048713 Yecircu cầu kiến thức riecircng biệt về bagravei toaacuten vigrave thế buộc người xacircy dựng mocirc higravenh phảilagravem việc thường xuyecircn với nhagrave quản lyacute ndash đối tượng mong muốn của HHTQĐ để
từ đoacute bản chất bagravei toaacuten vagrave caacutec quyết định được hiểu tốt hơn1048713 Mocirc higravenh được xacircy dựng từ viễn cảnhcaacutech nhigraven của nhagrave quản lyacute1048713 Mocirc higravenh chỉ cho một bagravei toaacuten riecircng biệt thường khocircng thể dugraveng giải caacutec bagravei toaacutenkhaacutec Như vậy mỗi thagravenh phần của mocirc higravenh ứng với một phần của hệ thống thựcdo đoacute sẽ khocircng yecircu cầu nhagrave quản lyacute phải tổng quaacutet hoacutea caacutec hiểu biết của migravenh1048713 Phổ bagravei toaacuten giải được rất rộng tồn kho nhacircn sự hoạch định chiến lược 1048713 Coacute thể chứa caacutec phức tạp thực sự của bagravei toaacuten khocircng cần caacutec đơn giản hoacutea (TDdugraveng caacutec phacircn phối xaacutec suất thực thay vigrave phacircn phối lyacute thuyết xấp xỉ)1048713 Coacute thể tự động sinh ra nhiều đo lường hiệu năng quan trọng1048713 Thường lagrave phương phaacutep duy nhất của HHTQĐ coacute thể xử lyacute caacutec bagravei toaacuten tương đốiphi cấu truacutec1048713 Coacute một số caacutec goacutei phần mềm mocirc phỏng (Monte Carlo) tương đối dễ dugravengbull Điểm yếu1048713 Tuy thường tigravem được caacutec phương aacuten đủ tốt nhưng khocircng đảm bảo lời giải tối ưu1048713 Quaacute trigravenh xacircy dựng mocirc higravenh thường dagravei vagrave tốn keacutem1048713 Giải phaacutep vagrave suy diễn từ nghiecircn cứu mocirc phỏng thường khocircng thể chuyển sang bagraveitoaacuten khaacutec vigrave mocirc higravenh kết hợp caacutec yếu tố đặc thugrave1048713 Đocirci khi do mocirc higravenh quaacute dễ giải thiacutech cho nhagrave quản lyacute necircn caacutec phương phaacutep phacircntiacutech thường xem nhẹ1048713 Phần mềm mocirc phỏng đocirci khi yecircu cầu caacutec kỹ năng đặc biệt do độ phức tạp củaphương phaacutep giải higravenh thứcbull Caacutec loại mocirc phỏng1048713 Mocirc phỏng xaacutec suất một hay nhiều biến độc lập mang tiacutenh xaacutec suất với 2 loạiphacircn phối ndash thường dugraveng kỹ thuật Monte Carlo1048713 Phacircn phối rời rạc tigravenh huống coacute một số giới hạn caacutec biến cố (biến) với hữu hạncaacutec giaacute trị cho mỗi biến cố (biến)1048713 Phacircn phối liecircn tục tigravenh huống coacute số lượng khocircng giới hạn caacutec biến cố tuacircn theocaacutec hagravem mật độ xaacutec suất như phacircn phối chuẩn1048713 Mocirc phỏng độc lậpphụ thuộc theo thời gian1048713 Độc lập khocircng cần thiết phải biết chiacutenh xaacutec thời điểm xảy ra biến cố (nhu cầutiecircu thụ lượng sản phẩm trong ngagravey khocircng biết chiacutenh xaacutec thời điểm tiecircu thụ)1048713 Phụ thuộc cần biết chiacutenh xaacutec thời điểm xảy ra sự kiện (bagravei toaacuten hagraveng đợi)1048713 Mocirc phỏng tương taacutec trực quan1048713 Mocirc phỏng hướng đối tượng dugraveng tiếp cận hướng đối tượng để xacircy dựng mocirc higravenhmocirc phỏng Chuacute yacute ngocircn ngữ mocirc higravenh hoacutea nhất thể UML (unified modelinglanguage) kể cả khi mocirc phỏng caacutec hệ thời gian thựcMOcirc HIgraveNH HOacuteA ĐA CHIỀU ndash XỬ LYacute PHAcircN TIacuteCH TRỰC TUYẾNbull Người ra quyết định thường phải xem xeacutet nhiều chiều của dữ liệu (TD caacutec chiềucủa dữ liệu baacuten hagraveng lagrave sản phẩm vugraveng thời gian người baacuten ) dữ liệu cần đượcphacircn tiacutech trực tiếp bằng caacutec cocircng cụ chuẩn hay phacircn tiacutech tự động bằng caacutec
phương phaacutep khai mỏ dữ liệu (data mining)bull Hầu hết caacutec hệ thống phacircn tiacutech đa chiều được nhuacuteng trong caacutec hệ xử lyacute phacircn tiacutechtrực tuyến (HXLPTTT ndash online analytic processing - OLAP)bull Mục tiecircu của XLPTTT nắm bắt cấu truacutec của dữ liệu thực để hỗ trợ ra quyết địnhbull Trong HHTQĐ coacute sự gắn nối tự nhiecircn giữa mocirc higravenh hoacutea dữ liệu mocirc higravenh hoacutea kyacutehiệu vagrave caacutec khiacutea cạnh của phacircn tiacutech ldquowhat-ifrdquobull Caacutec baacuteo caacuteo của HXLPTTT đều coacute tiacutenh tương taacutec dễ khai thaacutec sử dụng đặc biệtphugrave hợp cho caacutec baacuteo caacuteo về chỉ số hiệu năng chủ yếu (key performance indicators- KPI) baacuteo caacuteo về đo lường hiệu năng kinh doanh bull Thế hệ hiện tại của HXLPTTT vagrave hệ khai mỏ dữ liệu (data mining) tiacutech hợp caacutecđặc tiacutenh của hệ thocircng tin latildenh đạo (executive information system ndashEIS- nhiềucaacutech nhigraven dữ liệu chi tiết hoacutea theo nhu cầu) vagrave caacutec hệ đồ họa khaacutec ndash thường coacutegiao diện người dugraveng dạng kiểu WEBbull Caacutec hệ thống như trecircn cograven được gọi lagrave caacutec cocircng cụ triacute tuệ kinh doanh (businessintelligence - BI) vigrave coacute caacutec đặc trưng về mocirc higravenh hoacutea vagrave tối ưu hoacutea nhưng lạitrong suốt đối với ngươigrave dugravengbull Hiện caacutec cocircng cụ được đưa ra bởi caacutec nhagrave cung cấp về CSDL về hoạch định tagraveinguyecircn tổ chức (ERP) về nhagrave kho dữ liệu (data warehouse) về HXLPTTT MOcirc HIgraveNH HOacuteA VAgrave MOcirc PHỎNG TƯƠNG TAacuteC TRỰC QUANbull Iacutech lợi Người ra quyết định tham gia vagraveo quaacute trigravenh phaacutet triển mocirc higravenh vagrave thựcnghiệm mocirc phỏng vigrave vậy sẽ tin tưởng khi sử dụng mocirc higravenhbull Mocirc higravenh hoacutea tương taacutec trực quan (visual interactive modeling - VIM) dugraveng caacutecbiểu diễn đồ họa maacutey tiacutenh để trigravenh bagravey caacutec ảnh hưởng của caacutec quyết định quản lyacutekhaacutec nhau ở một thời điểm (tĩnh) hay tiến triển theo thời gian (động với kỹ thuậthoạt higravenh)bull Mocirc phỏng tương taacutec trực quan (visual interactive simulation - VIS) cho pheacutepngười dugraveng theo dotildei tiến trigravenh xacircy dựng vagrave sử dụng khai thaacutec mocirc higravenh mocirc phỏngdưới dạng hoạt higravenhbull Mocirc higravenh hoacutea tương taacutec trực quan coacute thể kết hợp với tiếp cận triacute tuệ nhacircn tạo đểđưa ra caacutec khả năng mới thay đổi từ xacircy dựng hệ thống dạng đồ họa đến tigravem hiểuvề động học của hệ thốngbull Cần đến caacutec hệ thống maacutey tiacutenh xử lyacute song song tốc độ cao để xacircy dựng caacutec mocircphỏng - phức tạp quy mocirc lớn dạng hoạt higravenh - mang tiacutenh khả thi ở thời gian thực
22Caacutec dạng hệ thống hỗ trợ ra quyết địnhHệ hỗ trợ quyết định nhoacutemRa quyết định nhoacutem giao tiếp vagrave cộng taacutec- Caacutec đặc điểm của cocircng việc nhoacutem+ Một nhoacutem thực hiện một nhiệm vụ thỉnh thoảng ra quyết định thỉnh thoảngkhocircng ra quyết định+ Caacutec thagravenh viecircn trong nhoacutem coacute thể ở những nơi khaacutec nhau
+ Caacutec thagravenh viecircn trong nhoacutem coacute thể lagravem việc ở những thời gian khaacutec nhau+ Caacutec thagravenh viecircn trong nhoacutem coacute thể lagravem việc cugraveng nhau hoặc ở caacutec tổ chức khaacutecnhau+ Nhoacutem coacute thể vĩnh viễn hoặc tạm thời+ Nhoacutem coacute thể ở bất kỳ mức quản lyacute nagraveo hoặc mức thời gian nagraveo+ Coacute sự điều phối (quaacute trigravenh vagrave nhiệm vụ đạt được) hoặc macircu thuẩn trongnhoacutem+ Coacute sự đạt được hoặcvagrave mất maacutet năng suất trong tổ chức+ Nhiệm vụ phải hoagraven thagravenh rất nhanh+ Khocircng thể hoặc quaacute đắt cho tất cả caacutec thagravenh viecircn trong nhoacutem cugraveng hợp ở mộtnơi+ Một số dữ liệu thocircng tin hoặc kiến thức cần thiết nằm ở nhiều nơi một sốkhaacutec ở ngoagravei tổ chức+ Chuyecircn mocircn của caacutec thagravenh viecircn khocircng coacute trong nhoacutem lagrave cần thiết- Caacutec hoạt động vagrave caacutec quaacute trigravenh miecircu tả caacutec cuộc họp+ Cuộc họp lagrave hoạt động chung liecircn quan bởi một nhoacutem người coacute địa vị bằngnhau hoặc gần bằng nhau+ Kết quả của cuộc họp phụ thuộc một phần vagraveo kiến thức yacute kiến caacutec đaacutenh giaacutecủa caacutec thagravenh viecircn+ Kết quả của cuộc họp cũng phụ thuộc vagraveo sự kết hợp của nhoacutem vagrave phụ thuộcvagraveo quaacute trigravenh ra quyết định được sử dụng bởi nhoacutem đoacute+ Giải quyết caacutec yacute kiến khaacutec nhau bởi người coacute quyền hạn hoặc thương lượnghoặc phacircn xửHỗ trợ giao tiếp- Giao tiếp lagrave thagravenh phần quan trọng cho hỗ trợ quyết định Khocircng coacute giao tiếp thigravekhocircng coacute cộng taacutec Những người ra quyết định caacute nhacircn phải giao tiếp với caacutecđồng nghiệp chuyecircn gia cơ quan chiacutenh phủ khaacutech hagraveng đối taacutec kinh doanh hellipHọ cũng cần dữ liệu vagrave thocircng tin (vagrave kiến thức) từ nhiều nơi trecircn thế giới Caacutecnhoacutem ra quyết định phải giao tiếp cộng taacutec vagrave thương lượng trong cocircng việcHầu hết caacutec tổ chức sẽ nhanh trở thagravenh khocircng coacute chức năng nếu khocircng coacute caacutec hệthống giao tiếp Thương mại điện tử coacute thể hiệu quả chỉ qua caacutec kỹ thuật giao tiếphiện đại- Caacutec kỹ thuật thocircng tin hiện đại cung cấp caacutec phương tiện hỗ trợ giao tiếp rẻnhanh coacute khả năng coacute thể tin cậy Nền tảng hỗ trợ giao tiếp lagrave caacutec hệ thống maacuteytiacutenh mạng+ Bắt đầu bằng điện baacuteo điện thoại radio vagrave ti vi+ Trong 100 năm chuacuteng ta phaacutet triển maacutey fax thư điện tử chương trigravenh chatnhoacutem tin tức hệ thống hội nghị truyền higravenh Hầu hết caacutec kỹ thuật nagravey đềuhoạt động trecircn internet+ Sự phaacutet triển giao tiếp sau cugraveng lagrave hệ thống họp điện tử caacutec dịch vụ vagrave hệ
thống hội nghị điện tử thường sử dụng internet để kết nối caacutec người ra quyếtđịnh- Caacutec thuận lợi aacutep dụng caacutec phương phaacutep giao tiếp cải tiến trong caacutec tổ chức+ Cải tiến năng suất của nhacircn viecircn+ Liecircn quan đến nhiều người ra quyết định chiacutenh+ Khocircng quan tacircm nhiều đến đường biecircn giới địa lyacute+ Tạo nền văn hoacutea hợp taacutec nhất quaacuten+ Cải tiến chất lượng cuộc sống của nhacircn viecircnHỗ trợ cộng taacutec Maacutey tiacutenh hỗ trợ cộng taacutec- Khung thời giannơi chốn+ Sự hiệu quả của kỹ thuật tiacutenh toaacuten cộng taacutec phụ thuộc vagraveo vị triacute của caacutec thagravenhviecircn trong nhoacutem vagrave phụ thuộc vagraveo thời gian chia sẽ thocircng tin gởi vagrave nhận+ Chia sự giao tiếp thagravenh bốn ocirc vagrave tổ chức bốn ocirc dọc theo 2 chiều thời gian vagravenơi chốn1048713 Thời gian Khi gởi vagrave nhận thocircng tin hầu như đồng thời giao tiếp lagrave đồngthời Viacute dụ Điện thoại ti vi vagrave caacutec cuộc họp gặp mặt nhau Giao tiếp bấtđồng bộ xảy ra khi người nhận nhận thocircng tin ở thời điểm khaacutec thời điểmgởi thocircng tin đoacute1048713 Nơi chốn Người gởi vagrave người nhận coacute thể ở cugraveng phograveng hoặc khocircng+ Bốn ocirc lagrave1048713 Cugraveng thời giancugraveng nơi chốn Caacutec thagravenh viecircn gặp mặt nhau cugraveng một luacutecgiống như phograveng quyết định hoặc gặp mặt truyền thống1048713 Cugraveng thời giankhaacutec nơi chốn Caacutec thagravenh viecircn ở caacutec nơi khaacutec nhau nhưnggiao tiếp cugraveng nhau Viacute dụ hội nghị truyền higravenh (videoconferencing)1048713 Khaacutec thời giancugraveng nơi chốn Nhiều người lagravem việc theo ca Ca nagravey để lạithocircng tin cho ca khaacutec1048713 Khaacutec thời giankhaacutec nơi chốn Caacutec thagravenh viecircn ở caacutec nơi khaacutec nhau Caacutecthagravenh viecircn nagravey gởi vagrave nhận thocircng tin ở những lần khaacutec nhau
23Thực thi hệ DSSHệ thống hỗ trợ quản lyacute (MSS) khocircng phải luacutec nagraveo cũng luocircn thagravenh cocircng Nhiều trường hợpthất bại của ES khocircng hoagraven toagraven lagrave lyacute do kỹ thuật Thực thi hệ thống lagrave một quaacute trigravenh liecircn tụcnhằm đảm bảo cho tổ chức chuẩn bị tiếp nhận một hệ thống mới vagrave đưa hệ thống vagraveo sử dụngthagravenh cocircngThực hiện cocircng nghệ hệ thống hỗ trợ quản lyacute lagrave việc phức tạp vigrave caacutec hệ thống nagravey khocircng đơnthuần lagrave hệ thống thocircng tin chỉ thu thập thao taacutec vagrave phacircn phối thocircng tin Magrave xa hơn chuacuteng
liecircn quan tới caacutec cocircng việc coacute thể lagravem thay đổi đaacuteng kể caacutech thức hoạt động của tổ chức Tuyvậy đa số caacutec yếu tố thực thi đều liecircn quan tới hệ thống thocircng tinThực thi MSS lagrave quaacute trigravenh liecircn tục diễn ra trong suốt thời gian phaacutet triển hệ thống từ đề xuấtban đầu đến nghiecircn cứu khả thi thiết kế vagrave phacircn tiacutech hệ thống lập trigravenh huấn luyện chuyểnđổi vagrave lắp đặt Caacutec chuyecircn gia hệ thống thocircng tin thường gọi thực thi lagrave giai đoạn cuối trongvograveng đời hệ thống Định nghĩa thực thi MSS phức tạp hơn vigrave bản chất lặp của sự phaacutet triểncaacutec hệ thống
THỰC THI KHOcircNG HOAgraveN CHỈNHCaacutec quyết định về tiacutenh khả thi thường coacute giả định về lợi iacutech đạt được khi kế hoạch thực thiđược thực hiện hoagraven toagraven Trong thực tế thường chỉ thực hiện 90 thậm chiacute 70 phần trăm sovới phacircn tiacutech khả thi Lyacute do lagrave sự thay đổi tại một nơi trong hệ thống coacute thể ảnh hưởng vagrave coacutethể taacutec động tiecircu cực đến chỗ khaacutec Do vậy cấp quản lyacute coacute thể bỏ những phần trong dự aacuten coacutethể gacircy ra taacutec động xấu Do đoacute dự aacuten sẽ thực hiện iacutet hơn 100 so với dự aacuten kế hoạch Caacutec lyacutedo khaacutec coacute thể lagrave do khấu trừ ngacircn saacutech hoặc vượt chi phiacuteĐAacuteNH GIAacute SỰ THAgraveNH COcircNG CỦA THỰC THI HỆ THỐNGPhải coacute caacutec chỉ số đo lường thigrave mới coacute thể đaacutenh giaacute sự thagravenh cocircng khi thực thi một hệ thốngDickson va Powers (1973) đề ra 5 tiecircu chuẩn độc lậpbull Tỷ lệ thời gian thực hiện dự aacuten với thời gian ước lượngbull Tỷ lệ chi phiacute thực tế vagrave ngacircn saacutech thực hiệnbull Thaacutei độ của cấp quản lyacute đối với hệ thốngbull Nhu cầu thocircng tin của caacutec nhagrave quản lyacute được đaacutep ứng như thế nagraveo qua hệ thốngbull Taacutec động của dự aacuten đối với những hoạt động maacutey tiacutenh trong cocircng tyCaacutec đo lường khaacutec để đaacutenh giaacute thagravenh cocircng của hệ hỗ trợ quản lyacute (MSS)bull Sự sử dụng hệ thống (dự định dugraveng hoặc thực sự dugraveng)bull Thỏa matilden của người dugravengbull Thaacutei độ taacuten thagravenhbull Mức độ hệ thống hoagraven thagravenh caacutec mục tiecircu ban đầubull Phần thưởng đối với tổ chức (giảm chi phiacute tăng doanh thuhellip)bull Tỷ số lợi iacutech chi phiacute
bull Mức độ thể chế hoacutea của MSS trong tổ chứcDo bởi tiacutenh đa dạng của DSS necircn việc đaacutenh giaacute sự thagravenh cocircng của hệ nagravey cũng khoacute khăn tuynhiecircn cũng coacute thể coacute một số yếu tố giuacutep cho DSS thagravenh cocircng như sự tham gia người dugravenghuấn luyện người dugraveng hỗ trợ quản lyacute cấp cao nguồn thocircng tin đặc điểm của những nhiệmvụ coacute liecircn quan (cấu truacutec bất định độ khoacute phụ thuộc)
Chương5Nhoacutem hỗ trợ quyết định vagrave nhoacutemcocircng nghệ phần mềm
51Nhoacutem tạo quyết định
MDM-Holsapple đatilde gợi yacute chuacuteng ta sử dụng giới hạn người tạo quyết định
Một nhoacutem lagrave kết cấu MDM nơi magrave nhiều người ra quyết định hoagraven toagraven tương taacutec
Một đội lagrave kết cấu MDM nơi caacutec thagravenh viecircn tư vấn cho người đưa ra quyết định nhưng khocircng tương taacutec
Một Ủy ban lagrave kết cấu MDM với một người tạo quyết định duy nhất vagrave sự tương taacutec giữa caacutec thagravenh viecircn
Mạng thocircng tin
Mạng lưới baacutenh xe mỗi người tham gia coacute thể giao tiếp với người đưa ra quyết định ở trung tacircm nhưng khocircng phải với người tham gia khaacutecCấu truacutec nagravey lagrave khocircng thỏa matilden tất cả những người tham gia ngoại trừ người ra quyết định
Mạng dacircy chuyền Tham gia chuyển tiếp thocircng tin chỉ để noacute luocircn liền kề nhau trong chuỗi
Thagravenh viecircn cuối cugraveng ko được đaacutep ứng
Mạng vograveng trograven Tương tự như chuỗi nhưng kết thuacutec được kết nối
Mạng kết nối hoagraven toagraven khocircng coacute hạn chế về giao tiếp vagrave tương taacutec giữa caacutec thagravenh viecircnNoacutei chungnoacute đaacutep ứng hầu hết caacutec kết nối của người tham gia nhưng truyền đạt thocircng tin mất nhiều thời gian vagrave coacute nhiều cơ hội xảy ra lỗi
Nhoacutem hagravenh vi vagrave chuẩn mực
MDMs thiết lập caacutec chỉ tiecircu hướng dẫn quaacute trigravenh ra quyết định
Một chuẩn mực quy định cụ thể những gigrave thagravenh viecircn trong nhoacutem dự kiến sẽ lagravem trong những hoagraven cảnh nhất định
Quy tắc gửi coacute thể được thocircng qua viacute dụ đaacutenh giaacute ngang hagraveng hoặc xử phạt
Lagravem thế nagraveo để đưa ra quyết định
Việc chọn lựa magrave trong đoacute việc sử dụng cấu truacutec MDM phải được dựa trecircn một số yếu tố liecircn quan với bối cảnh quyết định
Viacute dụmột cấu truacutec riecircng lẻ sẽ lagravem việc nơi magrave quyết định được cấu truacutec cao vagrave thocircng tin lagrave coacute sẵn
Một ủy ban cơ cấu sẽ lagrave sự lựa chọn khi người ra quyết định khocircng thể đưa ra quyết định một migravenh
52Caacutec vấn đề thường gặp trong nhoacutem
Kiacutech thước Noacutei chung sự nhất triacute vagrave gắn kết giữa caacutec thagravenh viecircn tỉ lệ nghịch với phạm vi nhoacutem Trong nhoacutem lớn rất dễ higravenh thagravenh caacutec nhoacutem nhỏ vagrave hoạt động rời rạc
Tư duy tập thể Trong nhoacutem lớn mọi người coacute xu hướng suy nghĩ đểđạtđược sự nhất triacute necircn khocircng phaacutet huy được sự saacuteng tạo
Caacutec vấn đề về xatilde hội
Xung đột Trong 1 nhoacutem ai cũng muốn migravenh lagrave giỏi nhất necircn dễ dẫn đến xung đột
Ẩn danh(Giấu tecircn) Đacircy lagrave phương phaacutep được sử dụng để kiểm soaacutet xung đột Cho caacutec thagravenh viecircn tham gia ẩn danh
Vấn đề giới tiacutenh Nam vagrave nữ thường coacute những thế mạnh khaacutec nhau điều nagravey coacute thể lagrave sức mạnh trong 1 thiết lập MDM
Đagravem phaacuten vagrave quyết định
Một quyết định coacute thể liecircn quan đến nhiều quan điểm khaacutec nhau vigrave thế cần phải coacute sự đagravem phaacuten
Caacutec thiết kế của cơ chế hỗ trợ cho MDM phải phugrave hợp với caacutec hoạt độngđagravemphaacuten
Những hoạt động nagravey bao gồm việc thu nhận yacute kiến của caacutec thagravenh viecircn 1 caacutech cocircng bằng
53Cocircng nghệ hỗ trợ MDM
Organizational DSSndash 1 hệ thống cung cấp caacutec quyết định hỗ trợ
Group Support Systemndash Cocircng nghệ sử dụng sự hỗ trợ của nhiều becircn tham gia
Group DSS ndash Lagrave 1 hệ thống được thiết kế đặc biệt để hỗ trợ cho MDM
DSS ndash Lagrave 1 hệ thống dưới sự kiểm soaacutet của 1 người quyết định hệ thống nagravey cung cấp 1 bộ cocircng cụ giuacutep phacircn tiacutech hoagraven cảnh đểđưa ra quyết định vagrave nacircng cao hiệu quả của quyết địnhđoacute
53Cocircng nghệ hỗ trợ MDM
Organizational DSSndash 1 hệ thống cung cấp caacutec quyết định hỗ trợ
Group Support Systemndash Cocircng nghệ sử dụng sự hỗ trợ của nhiều becircn tham gia
Group DSS ndash Lagrave 1 hệ thống được thiết kế đặc biệt để hỗ trợ cho MDM
DSS ndash Lagrave 1 hệ thống dưới sự kiểm soaacutet của 1 người quyết định hệ thống nagravey cung cấp 1 bộ cocircng cụ giuacutep phacircn tiacutech hoagraven cảnh đểđưa ra quyết định vagrave nacircng cao hiệu quả của quyết địnhđoacute
Mục tiecircu của cocircng nghệ hỗ trợ MDM
Quy trigravenh hỗ trợ tập trung vagraveo quaacute trigravenh tạo điều kiện thuận lợi cho sự tương taacutec
Cơ chế cấu truacutec quaacute trigravenh chi phối caacutec hoạt động truyền thocircng
Nhiệm vụ hỗ trợ cocircng việc coacute thể chọn lựa tổ chức hoặc lấy thocircng tin
Nhiệm vụ cấu truacutec cocircng việc cho pheacutep truy cập đến kỹ thuật lọc kết hợp phacircn tiacutech kiến thức liecircn quan đến cocircng việc
Caacutec lớp loại cocircng nghệ hỗ trợ MDM
Phacircn loại theo đặc điểm do DeSanctis vagrave Gallupe đưa ra đề xuất một chương trigravenh ba cấp dựa trecircn caacutec tiacutenh năng được cung cấp
Hệ thống cấp 1 Mục điacutech chiacutenh lagrave tạo điều kiện thocircng tin liecircn lạc giữa caacutec thagravenh viecircn
Hệ thống cấp 2 Thiết kế để giảm thiểu rủi ro
Hệ thống cấp 3 Giuacutep điều chỉnh xử lyacute quyết định
Phacircn loại theo cocircng nghệ -Kraemer vagrave King tập trung vagraveo cocircng nghệ aacutep dụng
Cocircng nghệ bảng mạch điện tử
Hội nghị trực tuyến
Mạng lưới tập đoagraven
Trung tacircm thocircng tin
Mocirci trường cộng taacutec
Phograveng quyết định
Nhoacutem phần mềm
Phần mềm được thiết kế để hỗ trợ sự hợp taacutec bao gồm việc thu huacutet vagrave lưu trữ thocircng tin
Caacutec tổ chức dẫn đầu thị trường hiện tại lagrave Lotus Notes and Domino Microsoft Exchange Novell GroupWise and Oracle Office
Caacutec cocircng cụ trong một bộ phần mềm bao gồm người quản lyacute hội nghị (Lotus Sametime) vagrave trao đổi thocircng điệp (Lotus Notes Mail)
Xếp hạng phần mềm cho nhoacutem
Ellis vv đề xuất một hệ thống xếp hạng dựa vagraveo kiểu sự hỗ trợ noacute Cung cấp
Hệ thocircng điệp
Hệ thống hội thảo truyền higravenh
Hệ thống cộng taacutec soạn thảo
Nhoacutem phacircn phối giải phaacutep phần mền
Hệ thống phối hợp
Hệ thống thocircng minh đại diện
Lực lượng điều khiển phaacutet triển phần mềm cho nhoacutem
Một số nhacircn tố chiacutenh bao gồm
Tăng năng suất
Giảm số lượng caacutec cuộc họp
Tăng cường tự động hoacutea caacutec quy trigravenh lagravem việc thường xuyecircn
Cần phối hợp toagraven cầu tốt hơn
Tiacutenh sẵn sagraveng của những mạng lan rộng
Coleman vagrave Khanna liệt kecirc 10 nhacircn tố khaacutec
54Quản lyacute hoạt động MDM (Mobile Device Management - Quản lyacute thiết bị di động)
Một số phương phaacutep phối hợp phổ biến hơnMDM lagrave
Kỹ thuật nhoacutem định danh
Kỹ thuật Delphi
Sự phacircn xử
Hệ thocircng tin dựa trecircn vấn đề
Nemawashi
Kỹ thuật nhoacutem định danh
1-Mỗi người tham gia viết ra những yacute tưởng về những gigrave necircn quyết định
2-Lần lượt mỗi người tham gia trigravenh bagravey yacute tưởng của migravenh được ghi lại trecircn bảng Khocircng thảo luận ở đacircy
3-Sau khi tất cả caacutec yacute tưởng được trigravenh bagravey caacutec đại biểu coacute thể chất vấn những người khaacutec
4-Mỗi người tham gia bỏ phiếu cho mỗi yacute tưởng
Kỹ thuật Delphi
Về cơ bản tương tự như kỹ thuật nhoacutem định danh ngoại trừ những người khocircng bao giờ tham gia cuộc họp
Một cocircng cụ khảo saacutet được sử dụng để thu thập đầu vagraveo ban đầu từ caacutec thagravenh viecircn
Một cuộc khảo saacutet thứ hai được gửi đi với một bản toacutem tắt caacutec kết quả chung
Những bước lặp lại cho đến khi đạt được một sự đồng thuận hoặc nhigraven nhận của đa số
Sự phacircn xử(Arbitration )
Thiacutech hợp nhất khi caacutec thagravenh viecircn của MDM đại diện cho caacutec yếu tố đối lập
Những người tham gia đồng yacute rằng nếu lựa chọn thay thế hai becircn thỏa thuận khocircng được tigravem thấy thigrave một trọng tagravei viecircn becircn ngoagravei sẽ tham gia
Trọng tagravei sau đoacute lựa chọn thay thế ocircng hoặc xeacutet thấy thiacutech hợp nhất
Hệ thống thocircng tin dựa trecircn vấn đề (IBIS)
Lagrave một phương phaacutep lập luận cấu truacutec
Một đại diện cho IBIS lagrave một đồ thị với caacutec nuacutet vagrave caacutec liecircn kết
IBIS bắt đầu với lựa chọn của một nuacutet vấn đề gốc sau đoacute caacutec nuacutet vị triacute khaacutec nhau được liecircn kết với nuacutet gốc
Caacutec nuacutet vị triacute nagravey sau đoacute được đaacutenh giaacute dựa trecircn những lập luận gắn liền với chuacuteng
Nemawashi (được sử dụng rộng ratildei tại Nhật Bản)
1-Một hoặc nhiều thagravenh viecircn của MDM được chỉ định lagrave điều phối viecircnCaacutec điều phối viecircn sau đoacute chọn người tham gia cograven lại
2-Điều phối viecircn xacircy dựng một tổng hợp caacutec sự lựa chọn vagrave sau đoacute caacutec chuyecircn gia đaacutenh giaacute caacutec lựa chọn
3-Điều phối viecircn lựa chọn một sự lựa chọn dựa trecircn kết quả ở trecircn(ở 2)
4-Sự thay thế được luacircn chuyển điều phối viecircn tigravem kiếm sự đồng thuận thocircng qua sự thuyết phục vagrave đagravem phaacuten
5-Nếu đạt được sự đồng thuận điều phối viecircn cho lưu thocircng một tagravei liệu magrave mỗi thagravenh viecircn MDM để lại dấu hiệu trecircn đoacute
55Nơi lagravem việc ảo
Nhiều tổ chức trecircn toagraven thế giới kinh doanh bất động sản cho cocircng nghệ hợp taacutec
Cocircng việc được trở thagravenh một điều bạn lagravem hơn lagrave một nơi bạn đi
Những thay đổi lớn nhất mang lại bởi nơi lagravem việc ảo coacute thể lagrave về văn hoaacute hay xatilde hội hơn lagrave về cocircng nghệ
Chương 6 Hệ thống thocircng tin điều hagravenh
61 Yacute nghĩa của EIS- Hệ thống thocircng tin điều hagravenh
- EIS lagrave một dạng đặc biệt của DSS được thiết kế để hỗ trợ ra quyết định ở cấp cao nhất của một tổ chức
- Lagrave một hệ thống thocircng tin hỗ trợ nhu cầu lập kế hoạch vagrave đaacutenh giaacute của caacutec nhagrave quản lyacute điều hagravenh
- EIS coacute thể giuacutep một CEO coacute được bức tranh tổng thể chiacutenh xaacutec nhất về caacutec hoạt động vagrave một bản toacutem tắt những gigrave magrave đối thủ cạnh tranh đang lagravem
- Caacutec hệ thống nagravey noacutei chung hoạt động dễ dagraveng vagrave trigravenh bagravey thocircng tin theo những caacutech dễ hiểu để việc tiếp thu được nhanh choacuteng (biểu đồ đồ thịhellip)
(Tagravei liệu thecircm EIS lagrave những loại hệ thống lagrave rất phức tạp trong tự nhiecircn Coacute thể noacutei hệ thống nagravey cũng cung cấp cho caacutec nhagrave quản lyacute với caacutec thiết bị coacute khả năng ra quyết định bằng caacutech sử dụng của noacute Hệ thống nagravey hoạt động trong điều kiện như vậy quan trọng như trong caacutec hệ thống khaacutec khocircng hỗ trợ Khả năng lưu trữ dữ liệu nặng lagravem cho noacute lyacute tưởng để được thocircng qua khocircng chỉ bởi caacutec doanh nghiệp lớn magrave cograven bởi caacutec doanh nghiệp nhỏ hơn Nhigraven chung hệ thống nagravey lagrave dagravenh cho caacutec nhacircn viecircn cấp cao hỗ trợ thagravenh thạo trong việc đưa ra caacutec quyết định quan trọng)
Caacutec phiecircn EIS tiecircu biểu- Phiecircn lagravem việc coacute thể bắt đầu với một baacuteo caacuteo về tigravenh higravenh tagravei chiacutenh vagrave kinh
doanh của một cocircng ty caacutec chỉ số hoạt động quan trọng được hiển thị rotilde ragraveng- EIS sẽ cho pheacutep caacutec giaacutem đốc điều hagravenh coacute thể đi sacircu vagraveo dữ liệu từ những con
số bất kỳ magrave noacute hỗ trợ- Việc điều hagravenh coacute thể lựa chọn một mức độ chi tiết ( VD danh số baacuten hagraveng) nếu
như cần điều tra thecircm- Lagrave một phương phaacutep tiếp cận coacute thể giuacutep việc ra quyết định tốt hơn
Những điều magrave EIS ko coacute- EIS khocircng phải lagrave sự thay thế cho caacutec hệ thống dựa trecircn caacutec maacutey tiacutenh khaacutec EIS
thực sự chỉ cung cấp dữ liệu cho caacutec hệ thống nagravey- Noacute khocircng thể biến caacutec bộ hệ điều hagravenh của maacutey tiacutenh thagravenh những ldquochuyecircn viecircn
giỏirdquo- Coacute thể được viacute một caacutech cao hơn như lagrave một trợ lyacute đaacuteng tin cậy coacute thể được gọi
đến bất khi nagraveo vagrave mỗi khi cần thiết
Tagravei liệu thecircm Sự khaacutec nhau giữa EIS vagrave DSS+ EIS thiết kế để hỗ trợ những người điều hagravenh cấp cao giuacutep họ khaacutem phaacute caacutec vấn đề vagrave caacutec cơ hội DSS hỗ trợ những nười phacircn tiacutech cố gắng trả lời cacircu hỏi caacutei gigrave coacute thể lagravem cugraveng với một cơ hội hoặc một vấn đề
Chiều EIS DSSNhững người sử dụng thocircng thường
Duyệt dữ liệu đi xuống truy xuất trạng thaacutei
Hỗ trợ phacircn tiacutech vagrave quyết định
Sự thuacutec đẩy Tiacutenh thiacutech hợp Tiacutenh hiệu quảỨng dụng Queacutet mocirci trường đaacutenh giaacute
hiệu suất nhận dạng caacutec vấn đề vagrave caacutec cơ hội
Caacutec quyết định quản lyacute trecircn caacutec lĩnh vực đa dạng
Hỗ trợ quyết định Caacutec chiacutenh saacutech caacutec quyết định khocircng coacute cấu truacutec ở mức cao vagrave hỗ trợ giaacuten tiếp
Hỗ trợ caacutec quyết định lặp lại caacutec quyết định khocircng thể đoaacuten trước ra quyết định khocircng coacute cấu truacutec vagrave baacuten cấu truacutec
Loại thocircng tin Caacutec thocircng tin tin tức thocircng tin becircn ngoagravei về khaacutech hagraveng đối thủ cạnh tranh mocirci trường caacutec baacuteo caacuteo theo yecircu cầu vagrave định thời về caacutec hoạt động becircn trong
Caacutec thocircng tin hỗ trợ caacutec tigravenh huống đặc biệt
Sử dụng coacute nguyecircn tắc
Dograve theo vết vagrave điều khiển nhận dạng cơ hội
Hoạch định tổ chức phacircn nhoacutem vagrave điều khiển
Khả năng phugrave hợp với những người sử dụng caacute nhacircn
Thiết kế loại ra quyết định cho mỗi người điều hagravenh caacute nhacircn bằng nhiều lựa chọn đầu ra
Cho pheacutep caacutec đaacutenh giaacute caacute nhacircn caacutec khả năng what-if lựa chọn loại hộp hội thoại
Đồ họa Phải coacute Lagrave một phần quan trọng của nhiều DSS
Thacircn thiện người sử dụng
Phải coacute Phải coacute nếu khocircng coacute người sử dụng trung gian
Xử lyacute thocircng tin Lọc neacuten thocircng tin dograve theo vết dữ liệu vagrave thocircng tin quan trọng
EIS kiacutech thiacutech caacutec cacircu hỏi caacutec cacircu trả lời bằng caacutech sử dụng DSS vagrave phản hồi lại EIS
Hỗ trợ caacutec thocircng tin chi tiết
Truy xuất thường xuyecircn caacutec mức chi tiết của bất kỳ thocircng tin tổng hợp nagraveo (duyệt dữ
Coacute thể coacute trong DSS nhưng khocircng thường
liệu chi tiết)Cơ sở mocirc higravenh Caacutec chức năng coacute sẵn bị hạn
chếLagrave điểm cốt lotildei của DSS
Cấu truacutec Theo người baacuten sản phẩm hoặc theo caacutec chuyecircn gia hệ thống thocircng tin
Theo người sử dụng hoặc caacute nhacircn hoặc caacutec chuyecircn gia từ caacutec trung tacircm thocircng tin hoặc phograveng ban hệ thống thocircng tin
Phần cứng Mainframe caacutec trạm RISC mạng LANs hoặc caacutec hệ thống phacircn bố
Mainframe caacutec trạm RISC caacutec maacutey PC hoặc caacutec hệ thống phacircn bố
Bản chất caacutec goacutei phần mềm
Truy xuất tương taacutec dễ dagraveng đến nhiều cơ sở dữ liệu truy xuất trực tuyến caacutec khả năng DBMS phức tạp caacutec liecircn kết phức tạp
Caacutec khả năng tiacutenh toaacuten lớn caacutec ngocircn ngữ mocirc higravenh mocirc phỏng ứng dụng vagrave caacutec bộ tạo DSS
Bản chất caacutec thocircng tin
Trigravenh bagravey thocircng tin được phaacutet sinh trước về quaacute khứ vagrave hiện tại tạo caacutec thocircng tin mới về quaacute khứ hiện tại tương lai
Tạo thocircng tin mới về quaacute khứ hiện tại tương lai
62 Lịch sử EIS- EIS xuất hiện lần đầu tiecircn tại MIT vagraveo những năm 1970
- Những EIS đầu tiecircn được phaacutet triển bởi caacutec doanh ngiệp lớn sẵn sagraveng chấp nhận rủi ro để đạt được lợi thế cạnh tranh
- Vagraveo những năm 1980 caacutec nhagrave cung cấp đatilde phaacutet triển một số cơ sở khaacutech hagraveng rộng vagrave cocircng nghệ EIS được tiếp tục phaacutet triển cho đến ngagravey nay
(Tagravei liệu thecircm Sử dụng DSSEIS cho phaacutet triển bền vững + Một số nghiecircn cứu đatilde được tiến hagravenh để kiểm tra việc thực hiện của EIS trong khu vực cocircng cộng vagrave chiacutenh phủ caacutec nước tổ chức kể từ khi chuacuteng được phaacutet triển theo định hướng lợi nhuận cho caacutec cocircng ty tư nhacircn (Hasan vagrave Hasan năm 1997) Theo một nghiecircn cứu tiến hagravenh tại Mỹ ở hơn 300 cocircng ty kết quả cho thấy sự khaacutec biệt của EIS giữa tư nhacircn vagrave chiacutenh phủ một số kết quả thuacute vị được phaacutet hiệnViacute dụ khoacute khăn hơn để chuyển tiền từ một tagravei khoản khaacutec trong một EIS của chiacutenh phủ cũng lagrave khoacute khăn hơn để biện giải thiacutech cho những chi phiacute phaacutet triển EIS của chiacutenh phủ Một nghiecircn cứu khaacutec được tiến hagravenh ở Australia
cho thấy rằng EIS cung cấp cho quản lyacute một higravenh ảnh chiacutenh xaacutec hơn về tổ chức thực hiện vagrave cung cấp hỗ trợ cho caacutec lợi iacutech chiến lược cải thiện khocircng chỉ cho caacutec nhagrave quản lyacute nhưng cograven cho phần cograven lại của tổ chức Dựa trecircn caacutec hệ thống được thiết kế cho caacutec cocircng ty tư nhacircn với một caacutech rotilde ragravengxaacutec định mục tiecircu EIS lagrave thiacutech hợp cho caacutec tổ chức cocircng cộng hiện đại nhưng cần phải được linh hoạt hơn vagrave kết thagravenh chugravem một phạm vi rộng hơn khả năng vagrave phương tiện hơn so với khu vực tư nhacircn ban đầu theo định hướng sản phẩm (Hasan vagrave Hasan năm 1997) Điều nagravey coacute thể lagrave do thực tế rằng caacutec hoạt động khu vực cocircng lagrave bắt buộc coacute taacutec động rộng phải đaacutep ứng sự mong đợi duy nhất cocircng cộng thường coacute mục tiecircu mơ hồ vagrave macircu thuẫn iacutet quyền tự chủ vagrave kiểm soaacutet việc ra quyết định vagrave nhacircn viecircn lagrave khoacute khăn hơn (Watson vagrave Carte2000) + Toacutem lại EIS lagrave một khaacutei niệm thagravenh cocircng noacute phaacutet triển qua nhiều năm tuy nhiecircn EIS khắc phục khiếm khuyết của migravenh bằng caacutech tiến hagravenh nghiecircn cứu liecircn tục)
63 Tại sao những người điều hagravenh hagraveng đầu lại khaacutec nhau- Họ lagrave những doanh nghiệp theo định hướng coacute suy nghĩ
- Coacute một khoảng khocircng gian rộng để kiểm soaacutet
- Họ chịu traacutech nhiệm cho việc thiết lập chiacutenh saacutech
- Họ đại diện cho tổ chức mocirci trường becircn ngoagravei
- Hagravenh động của họ tạo ra những kết quả đaacuteng kể về tagravei chiacutenh vagrave con người
Tần số caacutec hoạt động điều hagravenh- Xử lyacute xaacuteo trộn 42
- Hoạt động kinh doanh 32
- Phacircn bổ nguồn lực 17
- Đagravem phaacuten 3
- Những điều khaacutec 6
Handling Disturbances 42
Entrepreneurial Activites 32
Resource Allocation 17
Negotiation 3
Other 6
Những thocircng tin điều hagravenh cần thiết- Quản lyacute xaacuteo trộn coacute thể yecircu cầu sự chuacute yacute xung quanh đồng hồ
- Hoạt động kinh doanh yecircu cầu điều hagravenh để dự đoaacuten những thay đổi trong mocirci trường
- Nhiệm vụ phacircn bổ tagravei nguyecircn yecircu cầu lựa chọn người quản lyacute vagrave caacutec nguồn lực hạn chế được triển khai
- Đagravem phaacuten yecircu cầu cập nhật thocircng tin từng phuacutet để coacute thể xacircy dựng được sự đồng thuận
Caacutec loại thocircng tin điều hagravenh- Hệ thống kế toaacuten coacute liecircn quan đến việc tiacutenh toaacuten thu nhập hoạt động cho caacutec lĩnh
vực cụ thể lagrave quan trọng hơn so với caacutec hệ thống kế toaacuten truyền thocircng- Thocircng tin về thị trường khaacutech hagraveng cung cấp giaacute trị trong việc quyết định chiến
lược- Caacutec thocircng tin cần thiết thường được truyền đi trecircn một số hệ thống maacutey tiacutenh vagrave
nằm trong toagraven tổ chức- Caacutec thocircng tin được sử dụng thường lagrave ngắn hạn vagrave dễ thay đổi
Phương thức để xaacutec định thocircng tin cần thiết
Rockart xaacutec định được năm phương thức cơ bản để xaacutec định thocircng tin cần thiết
- Phương thức dựa trecircn kết quả- Phương thức rỗng- Phương thức chỉ số khoacutea- Phương thức tổng hợp nghiecircn cứu- Phương thức dựa vagraveo nhacircn tố then chốt dẫn đến thagravenh cocircng
64 Thagravenh phần EIS
- Sản phẩm EIS đầu tiecircn được phaacutet triển để sử dụng trecircn maacutey tiacutenh cấu higravenh cao nhưng caacutec sản phẩm hiện nay nhằm mục tiecircu lagrave nền tảng ClientServer
- Những nền tảng linh hoạt hơn coacute thể thiacutech ứng với thay đổi trong tổ chức vagrave cocircng nghệ
- Sử dụng dữ liệu thời gian thực dẫn đến quyết định nhanh hơn nhiều thocircng tin hơn
Thagravenh phần phần cứng- Một EIS khocircng đogravei hỏi coacute phần cứng cụ thể hoặc duy nhất nagraveo- Chigravea khoacutea của vấn đề lagrave để đảm bảo rằng caacutec thagravenh phần của EIS tối ưu hoacutea vagrave
phugrave hợp với tagravei nguyecircn maacutey tiacutenh của tổ chức- Hệ thống nagravey phải được cấu higravenh để caacutec nguồn tagravei nguyecircn phugrave hợp với những
người điều hagravenh chuacuteng
Thagravenh phần phần mềm- Traacutei ngược với phần cứng phần mềm thường được chuyecircn mocircn hoacutea cao cho caacutec
bagravei toaacuten về miền- Sự chuyecircn mocircn hoacutea nagravey thường đạt được bằng caacutech sử dụng thagravenh phần off-the-
shelf cho toagraven bộ EIS vagrave caacutec mocirc-đun tugravey chỉnh để đaacutep ứng nhu cầu cụ thể- Lotus Notes lagrave một viacute dụ điển higravenh Noacute coacute thể được sử dụng một migravenh hoặc coacute
thể phục vụ becircn thứ ba mocirc-đun plug-in
Cocircng nghệ EIS hiện nay
Dobrzeniecki đề xuấtphacircn loạitừng cấptheo bachức năng- Loại 1 sản phẩm bao gồmmột bộ đầy đủcaacutec ứng dụngtừ mộtnhagrave cung cấp- Loại 2 sản phẩm đượcthựchiệnở phần đầu củacaacutecsản phẩmDSS đượcphaacutet triển
bởicugravengmộtnhagrave cung cấp- Loại 3 sản phẩmkết hợp với nhautheo bất kỳ số lượngthuộc sở hữu củacocircng ty
65 Xacircy dựng EIS
- Xacircy dựngmộtEISgiống nhưxacircydựngmột số hệ thống khaacutec củamocirc higravenh hệ thống thocircng tin
- Việcphaacutet triểncấu truacutecnecircn được theo dotildeitừ quaacute trigravenh thiết kế đến quaacute trigravenhthực hiện
- Tuy nhiecircn một dự aacuten phaacutet triển EIScoacute xu hướnglagrave thống nhấtvagraveyecircu cầu hỗ trợ caacutec nhagrave quản lyacute latildenh đạo
- Xacircy dựng một EIScoacute thểphaacutet hiện ra đượccaacutectigravenh huống khoacute khănmagravemột nhagrave phaacutet triển chưabao giờ gặp phải
Mocirc higravenh EIS
Khung phaacutet triển một EIS
- Watson et al đề nghị xacircy dựngkhung với ba thagravenh phần+ Caacutech tiếp cận tập trung vagraveo yếu tốcon người vagrave dữ liệu coacute liecircn quan đến EIS+ Quaacute trigravenh phaacutet triển cần sự linh hoạt vagrave tương taacutec+ Người sử dụng - hệ thống hộp thoại bao gồm một ngocircn ngữ hagravenh động để xử lyacute caacutec lệnh
Lợi iacutech của EIS- Dễ duy trigrave caacutec mục tiecircu coacute tổ chức- Dễ truy xuất thocircng tin- Cho pheacutep người sử dụng nacircng cao hiệu suất hơn
- Tăng chất lượng ra quyết định- Cung cấp sự cải tiến cạnh tranh- Tiết kiệm thời gian của người sử dụng- Tăng khả năng vagrave chất lượng giao tiếp- Cung cấp khả năng điều khiển tốt hơn trong tổ chức- Cho pheacutep tham gia caacutec vấn đề vagrave caacutec cơ hội- Cho pheacutep hoạch định- Cho pheacutep tigravem kiếm nguyecircn nhacircn của một vấn đề- Thảo matilden caacutec yecircu cầu của người điều hagravenh
Hạn chế của EIS vagrave 1 số sai lầm cần traacutenh
- Chi phiacute một cuộc khảo saacutetnăm1991 chothấychi phiacute phaacutet triểntrungbigravenh365000USDvớichi phiacute vận hagravenhhagraveng năm lagrave$200000 (EIS)
- Cocircng nghệ hạn chếEIScần phảiđượctiacutech hợp hoagraven toagravenvagraveokiếntruacuteccủadoanh nghiệphiện tại do đoacute noacutelagrave một thaacutech thứclớn đối vớithiết kế
- Hạn chế tổ chức cơ cấu tổ chứccoacute thể khocircng phugrave hợp
Sự hạn chế về tổ chức- Chương trigravenh nghị sự vagrave thời gian chệch EIS mocirc tả một phần việc thực hiện một
chương trigravenh nghị sự vagrave coacute thể dễ dagraveng đạt được sự tin cậy một caacutech chắc chắn- Đồng bộ hoacutea việc quản lyacute sự tin cậy đuacuteng luacutec đặc biệt baacuteo caacuteo EIS coacute thể phaacute
vỡ sự ổn định thiết lập caacutec chu trigravenh baacuteo caacuteo một caacutech tốt nhất- Sự bất ổn EIS phản ứng nhanh coacute thể gacircy ra việc taacutec động trở lại một caacutech
nhanh choacuteng dẫn đến sự thiếu ổn định trong tổ chức
Sự thất bại lagrave thay thế khocircng thể chấp nhận được- Một số yếu tố lagravem EIS thất bại
+ Thiếu sự hỗ trợ về mặt quản lyacute+ Vấn đề chiacutenh trị+ Thất bại của nhagrave phaacutet triển+ Lỗi về cocircng nghệ+ Giaacute cả+ Thời gian
66 Ra quyết định điều hagravenh trong tương lai vagrave EIS
- Coacute một vagravei điều kiện sẽ được hợp nhất cho việc chuyển đổi cocircng nghệ Trong đoacute một vagravei điều kiện coacute thể dễ dự đoaacuten Hai điều kiện magrave ta coacute thể thấy lagrave+ Phaacutet triển cocircng nghệ maacutey tiacutenh trong việc điều hagravenh sẽ tạo ra sự chuyển đổi được chấp nhận một caacutech dễ dagraveng hơn+ Mở rộng traacutech nhiệm điều hagravenh sẽ mở rộng nhu cầu thocircng tin
Tương lai của EIS- EIS thocircng minh Những tiến bộ trong cocircng nghệ AI sẽ được triển khai trong caacutec
EIS- EIS đa phương tiện Cơ sở dữ liệu đa phương tiện sẽ cho pheacutep tiacutech hợp văn bản
giọng noacutei vagrave higravenh ảnh trong tương lai- EIS thocircng tin Tương lai EIS sẽ mở rộng hơn trong việc sử dụng dữ liệu becircn
ngoagravei doanh nghiệp- EIS kết nối Giao tiếp với băng thocircng rộng cho pheacutep kết nối liecircn thocircng lớn hơn
Chương 7 HỆ CHUYEcircN GIA VAgrave TRIacute TUỆ NHAcircN TẠO
71 Caacutec khaacutei niệm
72 Triacute thocircng minh của triacute tuệ nhacircn tạo
73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia
74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia
75 Lợi iacutech vagrave hạn chế của hệ chuyecircn gia
71 Caacutec khaacutei niệm
Chuyecircn mocircn (Expertise) sự hiểu biết rộng trong 1 lĩnh vực hẹp
Hệ chuyecircn gia (Expert Systems)1 chương trigravenh maacutey tiacutenh sử dụng 1 tập caacutec luật dựa trecircn tri thức của con người để giải quyết caacutec vấn đề đogravei hogravei phải coacute sự chuyecircn mocircn
Một số hệ chuyecircn gia nổi tiếng
DENDRAL (Standford 1960s Edward Feigenbaum)
MYCIN (Standford1970s Edward Shortliffe)
PROSPECTOR (MIT 1979)
Triacute tuệ nhacircn tạo (Artificial Intelligence ndash AI)
Triacute tuệ nhacircn tạo một bộ phacircn của ngagravenh khoa học maacutey tiacutenh quan tacircm đến việc thiết kế caacutec hệ thống maacutey tiacutenh thocircng minh đoacute lagrave caacutec hệ thống đưa ra caacutec đặc điểm magrave từ đoacute chuacuteng ta liecircn hệ với sự thocircng minh trong hagravenh động của con người (Barr vagrave Feigenbaum 1981)
Mục điacutech của AI
Mục điacutech khoa học xaacutec định caacutec gợi yacute để giải thiacutech caacutec loại khaacutec nhau của triacute tuệ thực
Mục điacutech kỹ thuật giải quyết caacutec vấn đề trong thế giới thực
Triacute tuệ nhacircn tạo kế thừa nhiều yacute tưởng quan điểm kỹ thuật từ caacutec ngagravenh khoa học khaacutec
- Triết học
- Logic Toaacuten học
- Tiacutenh toaacuten
- Khoa học tacircm lyacute Khoa học nhận thức
- Sinh học Thần kinh học
- Tiến hoacutea
Caacutec lĩnh vực ứng dụng trong Triacute tuệ nhacircn tạo
Mạng nơ ron thần kinh (Neural Networks)
Tiacutenh toaacuten sự tiến hoacutea
(Evolutionary Computation)
Hệ chuyecircn gia (Expert Systems)
Kỹ thuật xử lyacute tiếng noacutei (Speech Processing)
Kỹ thuật xử lyacute ngocircn ngữ tự nhiecircn
(Natural Language Processing)
Lập kế hoạch (Planning)
Robot (Robotics)
Khoa học higravenh ảnh (Vision)
Caacutec kỹ thuật thocircng dụng dugraveng trong AI
Biểu diễn(Representation)
Học (Learning)
Caacutec luật (Rules)
Tigravem kiếm (Search)
72 Triacute thocircng minh của triacute tuệ nhacircn tạo
Con người suy diễn như thế nagraveo
Phacircn loại (Categorization)
Caacutec quy tắc cụ thể
Heuristics
Kinh nghiệm trước đoacute
Dự tiacutenh trước
Maacutey tiacutenh suy diễn như thế nagraveo
Lập luận dựa trecircn luật IF-THEN mocirc tả tri thức được matilde hoacutea dưới dạng caacutec luật
Caacutec khung (Frames) lagrave caacutec đại diện mocirc tả caacutec tigravenh huống giống nhau lagrave điển higravenh của một vagravei phacircn loại
Lập luận dựa trecircn caacutec trường hợp mocirc phỏng giải phaacutep trước đoacute cho một vấn đề hiện tại
Nhận dạng mẫu phaacutet hiện acircm thanh higravenh dạng hoặc caacutec chuỗi dagravei
Caacutec dạng khaacutec của Triacute tuệ nhacircn tạo
Học maacutey- mạng nơron vagrave giải thuật di truyền
Lập trigravenh tự động ndash lagrave những kỹ thuật tạo ra caacutec chương trigravenh để lagravem 1 nhiệm vụ riecircng biệt (cho pheacutep những người khocircng phải lagrave người lập trigravenh coacute thể lập trigravenh được)
Cuộc sống nhacircn tạo ndash nỗ lực để taacutei tạo caacutec hiện tượng sinh học trong caacutec hệ thống dựa trecircn maacutey tiacutenh
73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia(Expert Systems- ES)
Theo Jackson (1999) Một hệ chuyecircn gia lagrave một chương trigravenh maacutey tiacutenh mocirc tả vagrave suy diễn với tri thức của một vagravei lĩnh vực để giải quyết vấn đề hay đưa ra caacutec lời khuyecircn
Cấu truacutec cơ bản của ES được dựa theo cấu truacutec chung của DSS Sự khaacutec biệt chiacutenh giữa ES vagraveDSS lagrave hệ ES thu thập caacutec kiến thức từ những
chuyecircn gia trong lĩnh vực quan tacircmĐặc trưng của hệ chuyecircn gia Hiệu quả cao Thời gian trả lời thỏa đaacuteng Độ tin cậy cao Dễ hiểu
Giao diện người dugraveng trong ES
Thiết kế giao diện người dugraveng tập trung vagraveo caacutec yếu tố như dễ dagraveng sử dụngcoacute độ tin cậy cao giảm tải những khoacute khăn khi sử dụng
Thiết kế necircn coacute một số tương taacutec (đầu vagraveo kiểm soaacutet vagrave truy vấn)
Cấu tạo giao diện người dugraveng gồm coacute magraven higravenh cảm ứng bagraven phiacutem buacutet saacuteng lệnh thoại caacutec phiacutem chuyecircn dụng
Cơ sở tri thức (Knowledge Base)
Chứa đựng caacutec tri thức cụ thể miền thu được từ caacutec chuyecircn gia miền
Coacute thể chứa caacutec mocirc tả caacutec hagravenh vi giải quyết vấn đề caacutec ragraveng buộc caacutec heuristics
Thagravenh cocircng của một ES dựa trecircn tiacutenh đầy đủ vagrave tiacutenh chiacutenh xaacutec của cơ sở tri thức
Mocirc tơ suy diễn (Inference Engine)
Ở đacircy tri thức được đặt để sử dụng tạo ra caacutec giải phaacutep để giải quyết vấn đề
Mocirc tơ nagravey coacute khả năng thực hiện diễn dịch hoặc suy diễn dựa trecircn caacutec luật hay caacutec caacutec sự kiện
Đồng thời cũng coacute khả năng sử dụng caacutec suy diễn mờ hay khocircng chiacutenh xaacutec dựa trecircn xaacutec suất hay aacutenh xạ mẫu
Vograveng điều khiển suy diễn
1 Aacutenh xạ caacutec luật với caacutec sự kiện đatilde được cho
2 Chọn luật để thực hiện
3 Thực hiện luật bằng caacutech thecircm caacutec sự kiện được suy diễn ra vagraveo bộ nhớ lagravem việc
Chuỗi suy diễn (Chaining)
Suy diễn tiến (forward chaining) maacutey suy diễn bắt đầu từ dữ liệu ban đầu vagrave thực hiện việc suy luận để đưa ra caacutec kết luận cuối cugraveng
Suy diễn lugravei (backward chaining) maacutey suy diễn bắt đầu từ dữ liệu điacutech vagrave tigravem ra tri thức hỗ trợ cho dữ liệu điacutech đoacute
Viacute dụ suy diễn lugravei
R1 Nếu coacute A vagrave B thigrave suy ra coacute D
R2 Nếu coacute B thigrave suy ra coacute C
R3 Nếu coacute C vagrave D thigrave suy ra coacute E
Ta coacute E ta xem trong 3 luật R1 R2 R3 luật nagraveo coacute E ta thấy R3 chứa E đồng thời chứa C vagrave D Xeacutet tiếp trong 2 luật R1 R2 luật nagraveo chứa C vagrave D R2 chứa C R3 chứa D Từ đoacute ta coacute được caacutec tri thức hỗ trợ suy diễn vagrave kết luận lagrave nếu coacute A vagrave B thigrave sẽ coacute E Hay nếu A vagrave B đuacuteng thigrave sẽ coacute E
Viacute dụ suy diễn tiến
Giả sử coacute tập chứa 3 luật sau
R1 Nếu coacute A vagrave B thigrave suy ra coacute D
R2 Nếu coacute B thigrave suy ra coacute C
R3 Nếu coacute C vagrave D thigrave suy ra coacute E
Nếu ta coacute A vagrave B thigrave chuacuteng ta suy ra được D từ R1 vagrave suy ra C từ R2 Với D vagrave C đatilde được suy ra ở trecircn giờ chuacuteng ta suy ra được E từ R3
Viacute dụ thực tế
Giả sử muốn biết magraveu của một con vật nuocirci tecircn lagrave Fred biết rằng noacute kecircu ộp ộp vagrave ăn ruồi
Coacute tập 4 luật ban đầu như sau
R1 Nếu X kecircu ộp ộp vagrave ăn ruồi thigrave X lagrave con ếch
R2 Nếu X kecircu chiecircm chiếp vagrave biết hoacutet thigrave X lagrave con chim
R3 Nếu X lagrave con ếch thigrave X coacute magraveu xanh
R4 Nếu X lagrave con chim thigrave X coacute magraveu vagraveng
74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia
Expert system shells lagrave một tập caacutec goacutei phần mềm vagrave caacutec cocircng cụ dugraveng để phaacutet triển caacutec hệ chuyecircn gia
Những Expert system shells đầu tiecircn thường rất rườm ragrave Mặc dugrave vậy noacute vẫn giuacutep cho người sử dụng sẽ khocircng phải bắt đầu lại từ đầu khi xacircy dựng một hệ chuyecircn gia mới
Những shell hiện đại bao gồm hai mocirc-đun chiacutenh lagrave cocircng cụ xacircy dựng một tập quy tắc vagrave mocirc tơ suy diễn
Xacircy dựng hệ chuyecircn gia
Bước 1 xacircy dựng mocirc higravenh bagravei toaacuten xaacutec định vấn đề nhiệm vụ magrave hệ thống sẽ thực hiện Caacutec dạng bagravei toaacuten cần hệ chuyecircn gia
Bagravei toaacuten diễn giải (InterPretation)
Bagravei toaacuten dự baacuteo (Prediction)
Bagravei toaacuten chuẩn đoaacuten (Diagnose)
Bagravei toaacuten gỡ rối (Debugging)
Bagravei toaacuten thiết kế
Tương tự như một dự aacuten phần mềm để xacircy dựng một hệ chuyecircn gia cần phải coacute caacutec yếu tố về nhacircn lực tagravei nguyecircn vagrave thời gian Những yếu tố nagravey ảnh hưởng đến giaacute thah của một hệ chuyecircn giaTrong phần nagravey cacircu hỏi thường được đặt ra lagrave tại sao cần phải xacircy dựng một hệ chuyecircn giaTrước khi bắt đầu phải xaacute định rotilde bagravei toaacuten đạt ra lagrave jiAi lagrave chuyecircn giaAi lagrave người sử dụng
1 Diễn giải (InterPretation) Nghiecircn cứu 1 vấn đề -gt Dựa trecircn những biểu hiện thuộc tiacutenh đặc trưng becircn ngoagravei -gt Tư vấn
(hoặc đưa ra kết luận hay mocirc tả dễ hiểu từ tập dữ liệu thocirc)
2 Bagravei toaacuten dự baacuteo (Prediction) Coacute thể dự đoaacuten được hagravenh vi kết quả dựa trecircn caacutec hiện tượng -gt dự baacuteo
VD Dự baacuteo thời tiết động đấthellip
3 Bagravei toaacuten chẩn đoaacuten (Diagnoss) Xaacutec định caacutec lỗi caacutec bộ phận hỏng hoacutec của hệ thống dựa trecircn caacutec dữ liệu quan saacutet được
4 Bagravei toaacuten gỡ rối (Debugging) Mocirc tả caacutec phương phaacutep khắc phục hệ thống khi gặp sự cố
5 Bagravei toaacuten thiết kế Lựa chọn cấu higravenh caacutec đối tượng nhằm thoả matilden một số ragraveng buộc nagraveo đoacute
6 Giảng dạy Phần mềm dạy học coacute thể chuẩn đoaacuten vagrave sủa lỗi của học sinh trong quaacute trigravenh học tập
Để xaacutec định đuacuteng bagravei toaacuten magrave chuacuteng ta cần giải quyết thigrave phải trả lời đc một số cacircu hỏi
- cần hệ chuyecircn gia
Bước 2 thu thập tri thức lựa chọn cocircng cụ vagrave aacutep dụng
Trong bước thu thập tri thức vấn đề quan trọng lagrave lựa chọn chuyecircn gia những người magrave sẽ đoacuteng goacutep tri thức cho hệ thống Thocircng thường trong suốt quaacute trigravenh phaacutet triển thigrave chuyecircn gia được xem như một thagravenh viecircn của đội phaacutet triển
Hiện nay coacute rất nhiều cocircng cụ để xacircy dựng một hệ chuyecircn gia Phổ biến nhất lagrave JESS CLIPS vagrave OPS5
Bước 3 Thiết kế cơ sở tri thức thiết kế hệ thốngTri thức được biểu diễn trường minh trong cơ sở tri thức
Caacutec chuyecircn gia vagrave kỹ sư tri thức sẽ đối thoại với nhau bằng caacutec kỹ thuật đối thoại Suy diễn (SD) bảng Mocirc higravenh hoacutea SD quy nạp phacircn loại
Vấn đề bagraveo trigrave vagrave phaacutet triển
Caacutec hệ chuyecircn gia đogravei hỏi phải bảo trigrave vagrave phaacutet triển nhiều hơn so với caacutec hệ thống khaacutec Phải thường xuyecircn bổ sung tri thức mới vagrave thay đổi caacutec tri thức cũ để đổi mới hệ chuyecircn gia
Thu thập vagrave khắc phục lỗi do người sử dụng phaacutet hiện để kịp thời khắc phục những sai soacutet của hệ chuyecircn gia
75 Lợi iacutech vagrave hạn chế của caacutec hệ chuyecircn gia
Một số lợi iacutech chiacutenh
Thời gian trả lời hợp lyacute bằng hoặc nhanh hơn so với chuyecircn gia (người) để đi đến cugraveng một quyết định Hệ chuyecircn gia lagrave một hệ thống thời gian thực (real time system)
Khả năng trả lời với mức độ tinh thocircng bằng hoặc cao hơn so với chuyecircn gia (người) trong cugraveng lĩnh vực
Hệ chuyecircn gia giuacutep cho hiệu quả lagravem việc tăng bằng việc sử dụng tập caacutec luật một caacutech nhanh choacuteng magrave ko bị nhầm lẫn chuyecircn gia lagrave người coacute thể quecircn đi một số tri thức cơ sở lyacute luậ nhưng HCG thigrave ko
Quyết định của một người chuyecircn gia coacute thể bị thay đổi vagrave ko coacute tiacutenh thống nhất như quyết định của một hệ chuyecircn gia tạo ra
Hệ chuyecircn gia giuacutep cho người sử dụng coacute thể trau dồi sự hiểu biết trecircn lĩnh vuej cụ thể magrave noacute giải quyết hỗ trợ người ra quyết định coacute trigravenh độ như 1 chuyecircn gia trong quaacute trigravenh gia quyết định
Kiến thức của rất nhiều chuyecircn gia về một lĩnh vực nagraveo đoacute được đưa vagraveo hệ chuyecircn gia lagravem cho CSTT cuat HCG phong phuacute vagrave rộng lớn hơn rất nhiều
HCG giải thiacutech caacutec bước suy luận một caacutech dễ hiểu nhất quaacuten luacutec nagraveo cũng coacute thể sử dụng ko như chuyecircn gia con người
Hạn chế của caacutec hệ chuyecircn gia
Nhược điểm lớn nhất của hệ chuyecircn gia lagrave những yacute kiến chuyecircn mocircn thường rất khoacute matilde hoacutea vagrave giải neacuten
Hệ chuyecircn gia khocircng coacute khả năng tự học tự cập nhật kiến thức mới như caacutec chuyecircn gia magrave cần phải được matilde hoacutea lại khi noacute được cập nhật
Hệ chuyecircn gia khocircng thể nhận ra được vấn đề khocircng nằm trong miền kiến thức của hệ thống
Chương 8 Tri thức vagrave tiếp nhận
1 Bao gồm caacutec vấn đề
Dữ liệu thực tế đo lường hoặc quan saacutet coacute hoặc khocircng coacute bối cảnh
Thocircng tin dữ liệu được tổng hợp một caacutech hữu iacutech để giải quyết những khoacute khăn trong việc đưa ra quyết định
Tri thức bao gồm caacutec ứng dụng quy tắc thocircng tin hướng dẫn của người ra quyết định
2 Những caacutei nhigraven về tri thức
Đại diện lagravem thế nagraveo để diễn tả tri thức viacute dụ như một quyển saacutech khocircng phải lagrave tri thức nhưng noacute lại lagrave một đại diện của tri thức
Sản xuất tri thức lagrave một tập hơp của hagraveng tồn kho coacute thể được sản xuất cũng như mua lại
Tri thức lagrave 1 trong 6 trạng thaacutei của hệ thống
1Dữ liệu 2Thocircng tin 3Cấu truacutec thocircng tin 4Sự thấu hiểu 5Yacute kiến 6 Quyết định
3 Caacutec loại tri thức Phổ biến mocirc tả dữ liệu thocircng tin thủ tục mọi thứ lagravem như thế nagraveo lập luận chiacutenh saacutech hoặc caacutec quy tắc
4 Thu thập Tri thức hệ chuyecircn gia Hầu hết caacutec phương phaacutep đều bắt đầu với mocirc higravenh của caacutec taacutec vụ trong đoacute
hệ chuyecircn gia được xacircy dựng Trong đoacute mocirc tả về caacutec lĩnh vực được tạo ra Caacutec kỹ sư sử dụng caacutec mocirc higravenh giả thuyết vagrave nhận thức về quaacute trigravenh phacircn
tiacutech để gợi ra caacutech giải quyết vấn đề về tri thức từ caacutec chuyecircn gia
5 Caacutec chiều của thu thập tri thức KE- driven caacutec kỹ sư trao đổi trực tiếp với caacutec chuyecircn gia Expert-driven Caacutec chuyecircn gia trực tiếp đưa chuyecircn mocircn của họ vagraveo hệ
thống maacutey tiacutenh Machine-driven Sử dụng caacutec cocircng cụ suy luận để triacutech xuất tri thức từ một
tập caacutec viacute dụ
6 Kỹ thuật thu thập tri thức Trao đổi gồm 2 loại cơ bản lagrave coacute cấu truacutec(coacute kịch bản) vagrave khocircng coacute cấu
truacutec( đối thoại trực tiếp) Giao thức phacircn tiacutech bằng lời Khi caacutec chuyecircn gia thực hiện một cocircng việc
của họ thigrave một bản ghi về cocircng việc đoacute được thực hiện Caacutec kỹ sư sẽ xacircy dựng mocirc higravenh cho những gigrave được ghi lại trong bản ghi
Phương phaacutep sagraveng lọc caacutec chuyecircn gia so saacutenh caacutec nhoacutem liecircn tiếp trong ba đối tượng vagrave cho biết tại sao nhoacutem thứ hai lại khaacutec nhoacutem thứ ba
7 Thu thập tri thức từ nhiều nguồn Thu thập tri thức từ nhiều nguồn lagrave cần thiết để coacute được đầy đủ caacutec tri thức
cho một vấn đề quan điểm yacute kiến traacutei ngược nhau thường phaacutet sinh Phương phaacutep đồng thuận sẽ giuacutep giải quyết được vấn đề macircu thuẫn Kỹ thuật phacircn tiacutech Meta lagrave kỹ thuật được aacutep dụng trong caacutec trường hợp
khaacutec Caacutech tiếp cận bằng định lượng đogravei hỏi caacutec kỹ sư cần cacircn nhắc yếu tố đầu vagraveo của caacutec chuyecircn gia khaacutec nhau
8 Xaacutec nhận hợp lệ vagrave kiểm tra tri thức Một khi thu thập tri thức noacute phải được đaacutenh giaacute về khả năng sử dụng vagrave độ
chiacutenh xaacutec Hai vấn đề cụ thể lagrave hiệu lực của những kiến thức vagrave kiểm tra việc xacircy dựng cơ sở của tri thức
Cần xaacutec nhận xem liệu hệ thống coacute thể hoạt động ở mức độ tối thiểu khocircng
Xaacutec minh liecircn quan đến việc so saacutenh từng chi tiết kỹ thuật của hệ thống những gigrave đatilde được thực hiện cuối cugraveng
9 Một số caacutec biện phaacutep xaacutec nhận Độ chiacutenh xaacutec Khả năng thiacutech nghi Mức độ đầy đủ Bề rộng Độ sacircu Hiệu lực Tổng quan Chiacutenh xaacutec Hiện thực Độ tin cậy Tiacutenh hữu dụng Mức độ
Chương 9 Học maacutey
1 Logic mờ vagrave ngocircn ngữ mờ(Fuzzy Logic and Linguistic Ambiguity)
Ngocircn ngữ tự nhiecircn gồm những khaacutei niệm mơ hồ vagrave khocircng chiacutenh xaacutectruyền tải ngữ nghĩa thocircng qua tiacutenh xấp xỉkhocircng rotilde ragraveng
Những xấp xỉ nagravey giuacutep con người coacute thể truyền tải hết được yacute nghĩa nhưng maacutey thigrave khocircng hiểu
Lagravem sao biểu diễn caacutec tri thức sử dụng caacutec khaacutei niệm khocircng rotilde ragraveng(mờ) hoặc khocircng chiacutenh xaacutec
2 Khaacutei niệm cơ bản của logic mờ tập mờ lagrave những tập hợp khocircng coacute một giới hạn rotilde Mỗi phần tử của noacute chỉ
chứa một mức độ hagravem liecircn thuộc của từng phần tử Vigrave vậy tập mờ khocircng giống như tập cổ điển Tập mờ coacute thể kết hợp với nhau qua những luật mờ magrave đặc trưng cho những hagravenh động trạng thaacutei vagrave thuộc tiacutenh của logic mờ được tận dụng khi thực hiện một bộ điều khiển mờ
Logic mờ dựa trecircn yacute tưởng mỗi phần tử thuộc vagraveo một tập hợp ở một mức độ nagraveo đấy
Locircgic mờ cho pheacutep độ liecircn thuộc (microA )coacute giaacute trị trong khoảng (01) Locircgic mờ coacute thể được coi lagrave mặt ứng dụng của lyacute thuyết tập mờ để xử lyacute caacutec
giaacute trị trong thế giới thực cho caacutec bagravei toaacuten phức tạp
3 So saacutenh tiacutenh đuacuteng đắn logic mờ vagrave xaacutec suất Xaacutec suất thigrave đề cập đến khả năng xảy ra một biến cố hay một điều gigrave đoacute Logic mờ đề cập đến cấp độ magrave đặc tiacutenh ở hiện tại
o viacute dụ1 người coacute chiều cao 6 feet thigrave coacute cấp độ lagrave 05 về chiều cao
4 Ưu điểm của logic mờ Caacutech tiếp cận rất tự nhiecircnkhocircng phức tạp Coacute thể mocirc higravenh hoacutea caacutec hagravem phi tuyến tugravey yacute phức tạp
Coacute thể tận dụng được kinh nghiệm từ những chuyecircn gia hagraveng đầu trong mọi lĩnh vực
Logic mờ được xacircy dựng dựa trecircn ngocircn ngữ tự nhiecircnNền tảng của logic mờ lagrave dựa trecircn cơ sở giao tiếp của con người
5 Nhược điểm của logic mờ Trong 1 hệ thống phức tạpsử dụng logic mờ coacute thể trở thagravenh trở ngại cho
việc xaacutec thực độ tin cậy của hệ thống Cơ chế lập luận mờ khocircng thể học hỏi từ những lỗi sai
6 Mạng noron nhacircn tạo(ANN) Mạng noron nhacircn tạo lagrave một mocirc phỏng xử lyacute thocircng tinđược nghiecircn cứu ra
từ hệ thống thần kinh của sinh vậtgiống như bộ natildeo để xử lyacute thocircng tin ANNs lagrave chương trigravenh dựa trecircn maacutey tiacutenh đơn giản coacute chức năng lagrave một mocirc
higravenh bagravei toaacuten khocircng gian dựa trecircn thử nghiệm vagrave baacuteo lỗi
7 Học từ kinh nghiệm Tiến trigravenh Một mẫu dữ liệu được biểu diễn như một mạng lưới noronANN ldquodự
đoaacutenrdquo 1 đầu radự đoaacuten được so saacutenh với giaacute trị thực tế hoặc giaacute trị chiacutenh xaacutecNếu đoaacuten được chiacutenh xaacutec thigrave khocircng coacute hagravenh động nagraveo được thực hiện
Nếu dự đoaacuten sai ANN kiểm tra lại vagrave xaacutec định lại thocircng số để điều chỉnh Một mẫu dữ liệu khaacutec được biểu diễn vagrave quaacute trigravenh nagravey được lặp lại
8 Nguyecircn tắc cơ bản của cocircng nghệ nơron Caacutec yếu tố xử lyacute cơ bản trong hệ thống thần kinh của con người lagrave tế bagraveo
thần kinhMạng lưới của tế bagraveo nagravey lagrave liecircn kết với nhau nhận được thocircng tin từ caacutec cảm biến trong mắt taihellip
Thocircng tin nhận được bởi tế bagraveo thần kinh hoặc lagrave sẽ kiacutech thiacutech noacute(sẽ được chuyển qua 1 thocircng điệp dọc theo mạng lưới) hoặc lagrave sẽ ngăn cản noacute(ngăn cản dograveng thocircng tin)
Độ nhạy coacute thể thay đổi qua thời gian hoặc sau khi coacute được kinh nghiệm
9 Cấu truacutec mạng Một ANN gồm 3 lớp cơ bản
Lớp đầu vagraveo nhận dữ liệu Lớp becircn trong hoặc lagrave lớp ẩn xử lyacute dữ liệu Lớp đầu ra chuyển tiếp kết quả cuối cugraveng của mạng
10Mạng nơ ron Thường coacute nhiều đầu vagraveo mỗi đầu vagraveo với mức ảnh hưởng vagrave tầm quan
trọng riecircng của noacute Một đầu vagraveo quan trọng coacute thể được sử dụng để khuếch đại đầu ra caacutec hagravem trạng thaacutei tổng hợp caacutec trọng số của caacutec yếu tố
đầuvagraveo khaacutec nhauvagraveo một giaacute trị duy nhất Caacutec hagravem chuyển giao xử lyacute caacutec giaacute trị trạng thaacutei vagrave tạo đầu ra
11Huấn luyện mạng nơ ron Trong mocirc higravenh coacute giaacutem saacutetANN được đến so saacutenh dự đoaacuten của chiacutenh
noacute với thocircng tin phản hồi coacute chứa caacutec kết quả mong muốn ANN sẽ phải tigravem caacutech thay đổi caacutec tham số becircn trong củamigravenh (caacutec trọng số vagrave caacutec ngưỡng) để tạo necircn một aacutenh xạ coacute khả năng aacutenh xạcaacutec đầu vagraveo thagravenh caacutec đầu ra mong muốn Sự thay đổi nagravey được tiến hagravenh nhờ việc so saacutenh giữa đầu ra thực sự vagrave đầu ra mong muốn
Trong mocirc higravenh khocircng coacute giaacutem saacutetANN nhận được dữ liệu vagraveo nhưng khocircng phải coacute bất kỳ thocircng tin phản hồi về kết quả mong muốn
Phần lớn caacutec ứng dụng nằm trong vugraveng của caacutec bagravei toaacuten ước lượng như mocirc higravenh hoacuteathống kecirc neacuten lọc phacircn cụm
12Lợi iacutech Liecircn kết với mạng noron Traacutenh caacutech lập trigravenh tường minh Giảm nhu cầu của chuyecircn gia ANNs thigrave thiacutech nghi với caacutec yếu tố đầu vagraveo thay đổi Khocircng cần thiết cho cơ sở tri thức tinh chế ANNs coacute tiacutenh động vagrave cải thiện với việc sử dụng Coacute khả năng xử lyacute dữ liệu khocircng chiacutenh xaacutec hoặc khocircng đầy đủ Cho pheacutep tổng quaacutet hoacutea từ thocircng tin cụ thể Cho pheacutep thu thập cảm giaacutec thocircng thường vagraveo miền giải quyết vấn đề
13Hạn chế của việc liecircn kết với mạng noron ANNs khocircng thể giải thiacutech được suy luận Bản chất hộp đen thường khiến cho vấn đề traacutech nhiệm vagrave độ tin cậy phaacutet
sinh lagrave khoacute khăn Lặp đi lặp lại quaacute trigravenh huấn luyện rất tốn thời gian Nguồn lực caacutec nhagrave phacircn tiacutech vagrave thiết kế coacute tay nghề cao vẫn lagrave đaacuteng lo
ngại Cocircng nghệ ANN thuacutec đẩy hạn chế của phần cứng hiện tại ANN yecircu cầu phải coacute sự tin tưởng ở đầu ra
14Giới thiệu về thuật toaacuten di truyền Cũng như mạng lưới thần kinh caacutec thuật toaacuten di truyền được dựa trecircn lyacute
thuyết sinh học Thuật toaacuten di truyền tigravem thấy nguồn gốc của chuacuteng trong caacutec lyacute thuyết
tiến hoacutea của chọn lọc tự nhiecircn vagrave thiacutech ứng với biến đổi khiacute hậu Kết quả thuật toaacuten di truyền lagrave từ giao phối 2 caacute thể trong quần thế để tạo
ra con caacutei đocirci khi tốt hơn so với bậc cha mẹ của chuacuteng 15Caacutec thagravenh phần cơ bản của thuật toaacuten di truyền
Toaacuten tử chọn lọc Caacutec caacute thể tốt được chọn lọc để đưa vagraveo thế hệ sau Sự chọn lọc nagravey căn cứ vagraveo độ thiacutech nghi với mocirci trường của mỗi caacute thể
Toaacuten tử lai gheacutep (crossover) Hai caacute thể cha vagrave mẹ trao đổi caacutec gen với nhau để tạo ra caacute thể con
Toaacuten tử đột biến (mutation) Một caacute thể thay đổi một số gen để biến đổi thagravenh một caacute thể mớiTất cả caacutec toaacuten tử trecircn khi thực hiện đều mang tiacutenh ngẫu nhiecircn
16Quaacute trigravenh cơ bản của một thuật toaacuten di truyền Khởi tạo
Đaacutenh giaacute quần thể
Lựa chọn NST thiacutech hợp nhất vagrave loại bỏ NST yếu nhất
Quy trigravenh giao nhau vagrave cải thiện quần thể
đột biến tiến trigravenh để khaacutem phaacute ra NST mới
17Ưu nhược điểm của việc kết hợp với thuật toaacuten di truyền Kiacutech thước quần thể lagrave 1 yếu tố quan trọng trong tốc độ của việc tigravem
kiếmnhưng noacute tương đối dễ dagraveng để dự đoaacuten tốc độ nagravey Giao nhau hoặc đột biến lagrave khocircng necircn đc sử dụng quaacute thường xuyecircn Luocircn coacute được iacutet nhất 1 giải phaacutep hợp lyacute Necircn coacute thể aacutep dụng chuacuteng cho caacutec vấn đề magrave chuacuteng ta khocircng coacute hướng
về caacutech giải quyết Sức mạnh của thuật toaacuten xuất phaacutet từ khaacutei niệm đơn giảnkhocircng phải từ
một thủ tục thuật toaacuten phức tạp 18Tương lai của học maacutey
Mạng lưới thần kinh nhacircn tạo vượt quaacute năng lực của con người trong caacutec trường hợp bị cocirc lập
Về mặt lyacute thuyếtmột maacutey tiacutenh coacute thể xử lyacute dũ liệu nhanh hơn hagraveng triệu lần so với 1 con người
May mắn thay cho chuacuteng tacon người tốt hơn nhiều khi magrave coacute được dữ liệumaacutey tiacutenh khocircng coacute 1 số thứ như lagrave 5 giaacutec quan
CHƯƠNG 10 KHO DỮ LIỆU
1 Kho dữ liệu Kho dữ liệu lagrave tuyển tập caacutec cơ sở dữ liệu tiacutech hợp hướng chủ đề được
thiết kế để trợ giuacutep cho một hệ hỗ trợ quyết định
Theo John Ladley Cocircng nghệ kho dữ liệu lagrave tập caacutec phương phaacutep kỹ thuật vagrave caacutec cocircng cụ coacute thể kết hợp hỗ trợ nhau để cung cấp thocircng tin cho người sử dụng trecircn cơ sở tiacutech hợp từ nhiều nguồn dữ liệu nhiều mocirci trường khaacutec nhau
Kho dữ liệu thường rất lớn tới hagraveng trăm GB hay thậm chiacute hagraveng Terabyte
2 Kho dữ liệu vận hagravenh (ODS) Một kho dữ liệu vận hagravenh Aacutep dụng kỹ thuật kho dữ liệu vagraveo caacutec hệ xử
lyacute giao taacutec lưu trữ dữ liệu cho một ứng dụng đặc thugrave Noacute đưa vagraveo kho dữ liệu một dograveng caacutec dữ liệu thocirc được thiết kế
3 So saacutenh
Kho dữ liệu vận hagravenh Kho dữ liệu
Dữ liệu theo chủ đề Dữ liệu theo chủ đề
Dữ liệu tiacutech hợp Dữ liệu tiacutech hợp
Dữ liệu thay đổi Dữ liệu khocircng thay đổi
Dữ liệu được cập nhật khi thay đổi
Dữ liệu giữ nguyecircn
Chỉ coacute dữ liệu hiện tạiDữliệu hiện tại vagrave dữ liệu lịch sử
Chu kỳ lagravem tươi dữ liệu ngắn Chu kỳ lagravem tươi dữ liệu dagravei
Chỉ coacute dữ liệu chi tiết Dữ liệu chi tiết vagrave dữ liệu tổng kết
Dugraveng cho caacutec quyết định ngắn hạn
Dugraveng cho hoạch định dagravei hạn
4 Kho dữ liệu cục bộ (Data Mart - DM)
Kho dữ liệu cục bộ lagrave CSDL coacute những đặc điểm giống với kho dữ liệu nhưng với quy mocirc nhỏ hơn vagrave lưu trữ dữ liệu về một lĩnh vực một chuyecircn ngagravenh
Data mart phụ thuộc Chứa những dữ liệu được lấy từ DW vagrave những dữ liệu nagravey sẽ được triacutech lọc vagrave tinh chế tiacutech hợp lại ở mức cao hơn để phục vụ một chủ đề nhất định của Datamart
Data mart độc lập Khocircng giống như Datamart phụ thuộc Data mart độc lập được xacircy dựng trước DW vagrave dữ liệu được trực tiếp lấy từ caacutec nguồn khaacutec nhau
5 Siecircu dữ liệu Metadata lagrave dữ liệu để mocirc tả dữ liệu Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột
một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi Metadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu
6 Mocirci trường kho dữ liệu Hệ thống của tổ chức vagrave kho cung cấp dữ liệu để xacircy dựng kho dữ liệu Trong quaacute trigravenh chuyển dữ liệu từ caacutec nguồn khaacutec nhau dữ liệu coacute thể
được lagravem sạch hoặc chuyển đổi vagrave vigrave thế DW được xem như lagrave một chuẩn cho việc lưu trữ
Đồng thời siecircu dữ liệu được ghi lại Cuối cugraveng DW hoặc siecircu thị coacute thể được sử dụng để tạo ra một kho dữ
liệu ldquocaacute nhacircnrdquo 7 Caacutec đặc điểm của kho dữ liệu
Đặc điểm Mocirc tả
Hướng chủ đề - DL tổ chức theo caacutech thức người dugraveng tham chiếu
Tiacutech hợp - Dữ liệu ldquosạchrdquo loại bỏ tiacutenh thiếu nhất quaacuten
Khocircng thay đổi - DL ldquochỉ đọcrdquo người dugraveng khocircng thay đổi được
Chuỗi thời gian - DL lagrave chuỗi thời gian khocircng phải lagrave trạng thaacutei hiện tại
Được tổng kết - DL vận hagravenhthao taacutec khi cần thiết
được kết hợp lại thagravenh dạng coacute thể dugraveng được cho quyết định
Kiacutech cỡ lớn hơn - Lưu giữ theo chuỗi thời gian tức lagrave giữ lại nhiều DL
Khocircng được chuẩn hoacutea - Coacute thể dư thừa DLSiecircu dữ liệu - Dữ liệu của dữ liệu được lưu trữNguồn dữ liệu - DL vận hagravenh (caacutec hệ sẵn coacute) cugraveng
với caacutec nguồn ngoagravei 8 Kho dữ liệu hướng chủ đề
Hướng chủ để coacute nghĩa lagrave kho dữ liệu được tổ chức xung quanh caacutec chủ đề chiacutenh như khaacutech hagraveng sản phẩm sản xuất Tập trung vagraveo việc mocirc higravenh hoacutea vagrave phacircn tiacutech dữ liệu cho caacutec nhagrave ra quyết định magrave khocircng tập trung vagraveo caacutec xử lyacute thocircng thường Cung cấp cho người dugraveng một khung nhigraven toagraven vẹn đơn giản vagrave đầy đủ về caacutec sự kiện quanh caacutec chủ đề
9 Dữ liệu trong DW được tiacutech hợp Dữ liệu trong kho dữ liệu được xacircy dựng bằng caacutech tổng hợp dữ liệu từ
nhiều nguồn khaacutec nhau vagrave caacutec nguồn coacute tổ chức khaacutec nhau Cơ sở dữ liệu caacutec file excel caacutec flat file hoặc caacutec raw file Khi đưa vagraveo kho dữ liệu caacutec dữ liệu được lagravem sạch vagrave tiacutech hợp dữ liệu nhằm đảm bảo tiacutenh nhất quaacuten của dữ liệu
10Kiến truacutec kho dữ liệu Tầng cơ sở dữ liệu hoạt động Tầng truy xuất thocircng tin Tầng truy xuất dữ liệu Tầng siecircu dữ liệu Tầng quản lyacute tiến trigravenh Tầng thocircng điệp của ứng dụng Tầng vật liacute của kho dữ liệu Tầng trigravenh diễn dữ liệu
11Higravenh trạng kho dữ liệu Kho dữ liệu ảo - người dugraveng cuối coacute thể truy cập trực tiếp đến kho dữ liệu
sử dụng caacutec cocircng cụ cho pheacutep ở tầng truy xuất dữ liệu Kho dữ liệu trung tacircm-1 cơ sở dữ liệu vật lyacute chứa tất cả dữ liệu cho một
vugraveng chuyecircn dụng nagraveo đoacute
Kho dữ liệu phacircn taacuten- Thagravenh phần được phacircn taacuten qua nhiều hệ cơ sở dữ liệu vật lyacute
12METADATA- Siecircu dữ liệu Định nghĩa Siecircu dữ liệu lagrave dữ liệu về dữ liệu Lagrave 1 lưu trữ dugraveng để
Miecircu tả kho dữ liệu tổng thể Nhận dạng kiểu kho dữ liệu Quản liacute quaacute trigravenh tiacutech hợp dữ liệu Quản liacute quaacute trigravenh cập nhật kho dữ liệu Quản liacute bảo mật
Lagrave chigravea khoacutea quyết định sự thagravenh cocircng của kho dữ liệu luocircn được thay đổi vagrave cập nhật theo sự phaacutet triển của kho dữ liệu
Dugraveng để quản liacute điều khiển kho dữ liệu Sự ra đời của kho dữ liệu như 1 cấu truacutec hỗ trợ ra quyết định siecircu dữ liệu
được xem như nguồn tagravei nguyecircn dữ liệu Siecircu dữ liệu lagrave trừu tượng Chuacuteng lagrave dữ liệu bậc cao cung cấp mocirc tả ngắn
gọn caacutec dữ liệu bậc thấp hơn 13Hoạt động của Siecircu dữ liệu
Siecircu dữ liệu rất cần thiết trong việc chuyển hoacutea thocircng tin trở thagravenh tri thức Lagrave chigravea khoacutea giuacutep chuacuteng ta xử lyacute được dữ liệu thocirc Viacute dụ một dograveng dữ liệu baacuten hagraveng 1023 K596 11121 agraveNoacute sẽ khocircng coacute nghĩa gigrave cho đến khi chuacuteng ta đưa vagraveo siecircu dữ liệu (thư
mục chứa dữ liệu) agrave cửa hagraveng 1023 sản phẩm K596 vagrave số tiền baacuten được lagrave 11121 đocirc la
14Sự cần thiết phải nhất quaacuten trong kho dữ liệu Kho dữ liệu được xacircy dựng cho lợi iacutech của những nhagrave phacircn tiacutech kinh
doanh caacutec nhagrave quản trị cho tất cả caacutec khu vực chức năng Trong cơ sở dữ liệu riecircng caacutec khu vực khaacutec nhau coacute thể định nghĩa vagrave lưu
trữ dữ liệu thocircng qua phiecircn bản của chiacutenh noacute Khi dữ liệu được lấy từ những vugraveng khaacutec nhau đoacute vagrave được đặt vagraveo kho dữ
liệu Việc chuyển đổi vagrave lagravem sạch caacutec tiến trigravenh sẽ đảm bảo noacute lagrave duy nhất được tiacutech hợp tại một mức của tổ chức
15Ragrave soaacutet lại dữ liệu ndash Thực thi siecircu dữ liệu
Bất kể cấu truacutec tự nhiecircn của 1 cacircu truy vấn thế nagraveo thigrave caacutec thagravenh phần của siecircu dữ liệu rất quan trọng đối với người ra quyết định
Bảng thuộc tiacutenh khoacutea được lưu trữ bởi kho dữ liệu Tập hợp dữ liệu được lấy từ đacircu Những chuyển đổi nagraveo được thực thi với việc lagravem sạch
16Siecircu dữ liệu lagrave gigrave Metadata - lagrave thocircng tin mocirc tả nội dung của cơ sở dữ liệu (CSDL) Metadata baacuteo cho người dugraveng biết thời gian cập nhật sau cugraveng của dữ liệu
định dạng vagrave mục điacutech sử dụng của noacute Những thocircng tin nagravey coacute thể hướng dẫn người dugraveng duyệt qua CSDL vagrave
giuacutep họ hiểu được yacute nghĩa vagrave ngữ cảnh của dữ liệu Trong CSDL metadata lagrave caacutec dạng biểu diễn khaacutec nhau của caacutec đối tượng
trong CSDL Trong CSDL quan hệ metadata lagrave caacutec định nghĩa của bảng cột CSDL
view vagrave nhiều đối tượng khaacutec Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột
một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi -gtMetadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu
Bảng chuyển đổi Ghi lại những chuyển đổi đatilde được thực hiện
Lịch sử thực thi Ghi lại những dữ liệu đatilde được
phacircn tiacutech
Higravenh thaacutei kết nốiGhi lại những dữ liệu được kết nối vagrave tần suất
17Aacutenh xạ thocircng thường của siecircu dữ liệu Bản ghi aacutenh xạ chuyển đổi bao gồm
Định danh của nguồn gốc Chuyển đổi thuộc tiacutenh Chuyển đổi thuộc tiacutenh vật lyacute Matilde hoacutea tham chiếu bảng chuyển đổi Đổi tecircn Đổi khoacutea Gaacuten giaacute trị cho thuộc tiacutenh mặc định Chọn logic cho caacutec nguồn nhiều giaacute trị Đổi thuật toaacuten
18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để
phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai
lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave
tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec
Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm
Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo
19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua
caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau
SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được
Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra
một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức
Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ
Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ
Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech
CHƯƠNG 11 KHAI PHAacute DỮ LIỆU
1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn
ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993
Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng
2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd
1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều
2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP
3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn
4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng
5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server
6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo
7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động
8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời
9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều
10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện
11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech
12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP
3 Xử lyacute phacircn tiacutech trực tuyến OLAP
MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave
dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu
ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave
thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu
HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave
ROLAP4 Khai phaacute dữ liệu
Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh
khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn
Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan
5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp
6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại
Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp
Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec
Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt
Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra
Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh
vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho
Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec
Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm
Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục
Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng
gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp
Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn
Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec
Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper
Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2
Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25
Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước
Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng
Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện
trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp
Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute
độ hỗ trợ ge ngưỡng minsup
độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan
Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn
Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết
Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu
MOLAP ROLAP HOLAP
Lưu trữ dữ liệu cơ sở
Khối Bảng quan hệ Bảng quan hệ
Lưu trữ thocircng tin tổng hợp
Khối Bảng quan hệ Khối
Hiệu suất thực hiện truy vấn
Nhanh nhất Chậm nhất Nhanh
Tiecircu thụ khocircng gian lưu trữ
Nhiều Thấp Trung bigravenh
Chi phiacute bảo trigrave Cao Thấp Trung bigravenh
từ đoacute bản chất bagravei toaacuten vagrave caacutec quyết định được hiểu tốt hơn1048713 Mocirc higravenh được xacircy dựng từ viễn cảnhcaacutech nhigraven của nhagrave quản lyacute1048713 Mocirc higravenh chỉ cho một bagravei toaacuten riecircng biệt thường khocircng thể dugraveng giải caacutec bagravei toaacutenkhaacutec Như vậy mỗi thagravenh phần của mocirc higravenh ứng với một phần của hệ thống thựcdo đoacute sẽ khocircng yecircu cầu nhagrave quản lyacute phải tổng quaacutet hoacutea caacutec hiểu biết của migravenh1048713 Phổ bagravei toaacuten giải được rất rộng tồn kho nhacircn sự hoạch định chiến lược 1048713 Coacute thể chứa caacutec phức tạp thực sự của bagravei toaacuten khocircng cần caacutec đơn giản hoacutea (TDdugraveng caacutec phacircn phối xaacutec suất thực thay vigrave phacircn phối lyacute thuyết xấp xỉ)1048713 Coacute thể tự động sinh ra nhiều đo lường hiệu năng quan trọng1048713 Thường lagrave phương phaacutep duy nhất của HHTQĐ coacute thể xử lyacute caacutec bagravei toaacuten tương đốiphi cấu truacutec1048713 Coacute một số caacutec goacutei phần mềm mocirc phỏng (Monte Carlo) tương đối dễ dugravengbull Điểm yếu1048713 Tuy thường tigravem được caacutec phương aacuten đủ tốt nhưng khocircng đảm bảo lời giải tối ưu1048713 Quaacute trigravenh xacircy dựng mocirc higravenh thường dagravei vagrave tốn keacutem1048713 Giải phaacutep vagrave suy diễn từ nghiecircn cứu mocirc phỏng thường khocircng thể chuyển sang bagraveitoaacuten khaacutec vigrave mocirc higravenh kết hợp caacutec yếu tố đặc thugrave1048713 Đocirci khi do mocirc higravenh quaacute dễ giải thiacutech cho nhagrave quản lyacute necircn caacutec phương phaacutep phacircntiacutech thường xem nhẹ1048713 Phần mềm mocirc phỏng đocirci khi yecircu cầu caacutec kỹ năng đặc biệt do độ phức tạp củaphương phaacutep giải higravenh thứcbull Caacutec loại mocirc phỏng1048713 Mocirc phỏng xaacutec suất một hay nhiều biến độc lập mang tiacutenh xaacutec suất với 2 loạiphacircn phối ndash thường dugraveng kỹ thuật Monte Carlo1048713 Phacircn phối rời rạc tigravenh huống coacute một số giới hạn caacutec biến cố (biến) với hữu hạncaacutec giaacute trị cho mỗi biến cố (biến)1048713 Phacircn phối liecircn tục tigravenh huống coacute số lượng khocircng giới hạn caacutec biến cố tuacircn theocaacutec hagravem mật độ xaacutec suất như phacircn phối chuẩn1048713 Mocirc phỏng độc lậpphụ thuộc theo thời gian1048713 Độc lập khocircng cần thiết phải biết chiacutenh xaacutec thời điểm xảy ra biến cố (nhu cầutiecircu thụ lượng sản phẩm trong ngagravey khocircng biết chiacutenh xaacutec thời điểm tiecircu thụ)1048713 Phụ thuộc cần biết chiacutenh xaacutec thời điểm xảy ra sự kiện (bagravei toaacuten hagraveng đợi)1048713 Mocirc phỏng tương taacutec trực quan1048713 Mocirc phỏng hướng đối tượng dugraveng tiếp cận hướng đối tượng để xacircy dựng mocirc higravenhmocirc phỏng Chuacute yacute ngocircn ngữ mocirc higravenh hoacutea nhất thể UML (unified modelinglanguage) kể cả khi mocirc phỏng caacutec hệ thời gian thựcMOcirc HIgraveNH HOacuteA ĐA CHIỀU ndash XỬ LYacute PHAcircN TIacuteCH TRỰC TUYẾNbull Người ra quyết định thường phải xem xeacutet nhiều chiều của dữ liệu (TD caacutec chiềucủa dữ liệu baacuten hagraveng lagrave sản phẩm vugraveng thời gian người baacuten ) dữ liệu cần đượcphacircn tiacutech trực tiếp bằng caacutec cocircng cụ chuẩn hay phacircn tiacutech tự động bằng caacutec
phương phaacutep khai mỏ dữ liệu (data mining)bull Hầu hết caacutec hệ thống phacircn tiacutech đa chiều được nhuacuteng trong caacutec hệ xử lyacute phacircn tiacutechtrực tuyến (HXLPTTT ndash online analytic processing - OLAP)bull Mục tiecircu của XLPTTT nắm bắt cấu truacutec của dữ liệu thực để hỗ trợ ra quyết địnhbull Trong HHTQĐ coacute sự gắn nối tự nhiecircn giữa mocirc higravenh hoacutea dữ liệu mocirc higravenh hoacutea kyacutehiệu vagrave caacutec khiacutea cạnh của phacircn tiacutech ldquowhat-ifrdquobull Caacutec baacuteo caacuteo của HXLPTTT đều coacute tiacutenh tương taacutec dễ khai thaacutec sử dụng đặc biệtphugrave hợp cho caacutec baacuteo caacuteo về chỉ số hiệu năng chủ yếu (key performance indicators- KPI) baacuteo caacuteo về đo lường hiệu năng kinh doanh bull Thế hệ hiện tại của HXLPTTT vagrave hệ khai mỏ dữ liệu (data mining) tiacutech hợp caacutecđặc tiacutenh của hệ thocircng tin latildenh đạo (executive information system ndashEIS- nhiềucaacutech nhigraven dữ liệu chi tiết hoacutea theo nhu cầu) vagrave caacutec hệ đồ họa khaacutec ndash thường coacutegiao diện người dugraveng dạng kiểu WEBbull Caacutec hệ thống như trecircn cograven được gọi lagrave caacutec cocircng cụ triacute tuệ kinh doanh (businessintelligence - BI) vigrave coacute caacutec đặc trưng về mocirc higravenh hoacutea vagrave tối ưu hoacutea nhưng lạitrong suốt đối với ngươigrave dugravengbull Hiện caacutec cocircng cụ được đưa ra bởi caacutec nhagrave cung cấp về CSDL về hoạch định tagraveinguyecircn tổ chức (ERP) về nhagrave kho dữ liệu (data warehouse) về HXLPTTT MOcirc HIgraveNH HOacuteA VAgrave MOcirc PHỎNG TƯƠNG TAacuteC TRỰC QUANbull Iacutech lợi Người ra quyết định tham gia vagraveo quaacute trigravenh phaacutet triển mocirc higravenh vagrave thựcnghiệm mocirc phỏng vigrave vậy sẽ tin tưởng khi sử dụng mocirc higravenhbull Mocirc higravenh hoacutea tương taacutec trực quan (visual interactive modeling - VIM) dugraveng caacutecbiểu diễn đồ họa maacutey tiacutenh để trigravenh bagravey caacutec ảnh hưởng của caacutec quyết định quản lyacutekhaacutec nhau ở một thời điểm (tĩnh) hay tiến triển theo thời gian (động với kỹ thuậthoạt higravenh)bull Mocirc phỏng tương taacutec trực quan (visual interactive simulation - VIS) cho pheacutepngười dugraveng theo dotildei tiến trigravenh xacircy dựng vagrave sử dụng khai thaacutec mocirc higravenh mocirc phỏngdưới dạng hoạt higravenhbull Mocirc higravenh hoacutea tương taacutec trực quan coacute thể kết hợp với tiếp cận triacute tuệ nhacircn tạo đểđưa ra caacutec khả năng mới thay đổi từ xacircy dựng hệ thống dạng đồ họa đến tigravem hiểuvề động học của hệ thốngbull Cần đến caacutec hệ thống maacutey tiacutenh xử lyacute song song tốc độ cao để xacircy dựng caacutec mocircphỏng - phức tạp quy mocirc lớn dạng hoạt higravenh - mang tiacutenh khả thi ở thời gian thực
22Caacutec dạng hệ thống hỗ trợ ra quyết địnhHệ hỗ trợ quyết định nhoacutemRa quyết định nhoacutem giao tiếp vagrave cộng taacutec- Caacutec đặc điểm của cocircng việc nhoacutem+ Một nhoacutem thực hiện một nhiệm vụ thỉnh thoảng ra quyết định thỉnh thoảngkhocircng ra quyết định+ Caacutec thagravenh viecircn trong nhoacutem coacute thể ở những nơi khaacutec nhau
+ Caacutec thagravenh viecircn trong nhoacutem coacute thể lagravem việc ở những thời gian khaacutec nhau+ Caacutec thagravenh viecircn trong nhoacutem coacute thể lagravem việc cugraveng nhau hoặc ở caacutec tổ chức khaacutecnhau+ Nhoacutem coacute thể vĩnh viễn hoặc tạm thời+ Nhoacutem coacute thể ở bất kỳ mức quản lyacute nagraveo hoặc mức thời gian nagraveo+ Coacute sự điều phối (quaacute trigravenh vagrave nhiệm vụ đạt được) hoặc macircu thuẩn trongnhoacutem+ Coacute sự đạt được hoặcvagrave mất maacutet năng suất trong tổ chức+ Nhiệm vụ phải hoagraven thagravenh rất nhanh+ Khocircng thể hoặc quaacute đắt cho tất cả caacutec thagravenh viecircn trong nhoacutem cugraveng hợp ở mộtnơi+ Một số dữ liệu thocircng tin hoặc kiến thức cần thiết nằm ở nhiều nơi một sốkhaacutec ở ngoagravei tổ chức+ Chuyecircn mocircn của caacutec thagravenh viecircn khocircng coacute trong nhoacutem lagrave cần thiết- Caacutec hoạt động vagrave caacutec quaacute trigravenh miecircu tả caacutec cuộc họp+ Cuộc họp lagrave hoạt động chung liecircn quan bởi một nhoacutem người coacute địa vị bằngnhau hoặc gần bằng nhau+ Kết quả của cuộc họp phụ thuộc một phần vagraveo kiến thức yacute kiến caacutec đaacutenh giaacutecủa caacutec thagravenh viecircn+ Kết quả của cuộc họp cũng phụ thuộc vagraveo sự kết hợp của nhoacutem vagrave phụ thuộcvagraveo quaacute trigravenh ra quyết định được sử dụng bởi nhoacutem đoacute+ Giải quyết caacutec yacute kiến khaacutec nhau bởi người coacute quyền hạn hoặc thương lượnghoặc phacircn xửHỗ trợ giao tiếp- Giao tiếp lagrave thagravenh phần quan trọng cho hỗ trợ quyết định Khocircng coacute giao tiếp thigravekhocircng coacute cộng taacutec Những người ra quyết định caacute nhacircn phải giao tiếp với caacutecđồng nghiệp chuyecircn gia cơ quan chiacutenh phủ khaacutech hagraveng đối taacutec kinh doanh hellipHọ cũng cần dữ liệu vagrave thocircng tin (vagrave kiến thức) từ nhiều nơi trecircn thế giới Caacutecnhoacutem ra quyết định phải giao tiếp cộng taacutec vagrave thương lượng trong cocircng việcHầu hết caacutec tổ chức sẽ nhanh trở thagravenh khocircng coacute chức năng nếu khocircng coacute caacutec hệthống giao tiếp Thương mại điện tử coacute thể hiệu quả chỉ qua caacutec kỹ thuật giao tiếphiện đại- Caacutec kỹ thuật thocircng tin hiện đại cung cấp caacutec phương tiện hỗ trợ giao tiếp rẻnhanh coacute khả năng coacute thể tin cậy Nền tảng hỗ trợ giao tiếp lagrave caacutec hệ thống maacuteytiacutenh mạng+ Bắt đầu bằng điện baacuteo điện thoại radio vagrave ti vi+ Trong 100 năm chuacuteng ta phaacutet triển maacutey fax thư điện tử chương trigravenh chatnhoacutem tin tức hệ thống hội nghị truyền higravenh Hầu hết caacutec kỹ thuật nagravey đềuhoạt động trecircn internet+ Sự phaacutet triển giao tiếp sau cugraveng lagrave hệ thống họp điện tử caacutec dịch vụ vagrave hệ
thống hội nghị điện tử thường sử dụng internet để kết nối caacutec người ra quyếtđịnh- Caacutec thuận lợi aacutep dụng caacutec phương phaacutep giao tiếp cải tiến trong caacutec tổ chức+ Cải tiến năng suất của nhacircn viecircn+ Liecircn quan đến nhiều người ra quyết định chiacutenh+ Khocircng quan tacircm nhiều đến đường biecircn giới địa lyacute+ Tạo nền văn hoacutea hợp taacutec nhất quaacuten+ Cải tiến chất lượng cuộc sống của nhacircn viecircnHỗ trợ cộng taacutec Maacutey tiacutenh hỗ trợ cộng taacutec- Khung thời giannơi chốn+ Sự hiệu quả của kỹ thuật tiacutenh toaacuten cộng taacutec phụ thuộc vagraveo vị triacute của caacutec thagravenhviecircn trong nhoacutem vagrave phụ thuộc vagraveo thời gian chia sẽ thocircng tin gởi vagrave nhận+ Chia sự giao tiếp thagravenh bốn ocirc vagrave tổ chức bốn ocirc dọc theo 2 chiều thời gian vagravenơi chốn1048713 Thời gian Khi gởi vagrave nhận thocircng tin hầu như đồng thời giao tiếp lagrave đồngthời Viacute dụ Điện thoại ti vi vagrave caacutec cuộc họp gặp mặt nhau Giao tiếp bấtđồng bộ xảy ra khi người nhận nhận thocircng tin ở thời điểm khaacutec thời điểmgởi thocircng tin đoacute1048713 Nơi chốn Người gởi vagrave người nhận coacute thể ở cugraveng phograveng hoặc khocircng+ Bốn ocirc lagrave1048713 Cugraveng thời giancugraveng nơi chốn Caacutec thagravenh viecircn gặp mặt nhau cugraveng một luacutecgiống như phograveng quyết định hoặc gặp mặt truyền thống1048713 Cugraveng thời giankhaacutec nơi chốn Caacutec thagravenh viecircn ở caacutec nơi khaacutec nhau nhưnggiao tiếp cugraveng nhau Viacute dụ hội nghị truyền higravenh (videoconferencing)1048713 Khaacutec thời giancugraveng nơi chốn Nhiều người lagravem việc theo ca Ca nagravey để lạithocircng tin cho ca khaacutec1048713 Khaacutec thời giankhaacutec nơi chốn Caacutec thagravenh viecircn ở caacutec nơi khaacutec nhau Caacutecthagravenh viecircn nagravey gởi vagrave nhận thocircng tin ở những lần khaacutec nhau
23Thực thi hệ DSSHệ thống hỗ trợ quản lyacute (MSS) khocircng phải luacutec nagraveo cũng luocircn thagravenh cocircng Nhiều trường hợpthất bại của ES khocircng hoagraven toagraven lagrave lyacute do kỹ thuật Thực thi hệ thống lagrave một quaacute trigravenh liecircn tụcnhằm đảm bảo cho tổ chức chuẩn bị tiếp nhận một hệ thống mới vagrave đưa hệ thống vagraveo sử dụngthagravenh cocircngThực hiện cocircng nghệ hệ thống hỗ trợ quản lyacute lagrave việc phức tạp vigrave caacutec hệ thống nagravey khocircng đơnthuần lagrave hệ thống thocircng tin chỉ thu thập thao taacutec vagrave phacircn phối thocircng tin Magrave xa hơn chuacuteng
liecircn quan tới caacutec cocircng việc coacute thể lagravem thay đổi đaacuteng kể caacutech thức hoạt động của tổ chức Tuyvậy đa số caacutec yếu tố thực thi đều liecircn quan tới hệ thống thocircng tinThực thi MSS lagrave quaacute trigravenh liecircn tục diễn ra trong suốt thời gian phaacutet triển hệ thống từ đề xuấtban đầu đến nghiecircn cứu khả thi thiết kế vagrave phacircn tiacutech hệ thống lập trigravenh huấn luyện chuyểnđổi vagrave lắp đặt Caacutec chuyecircn gia hệ thống thocircng tin thường gọi thực thi lagrave giai đoạn cuối trongvograveng đời hệ thống Định nghĩa thực thi MSS phức tạp hơn vigrave bản chất lặp của sự phaacutet triểncaacutec hệ thống
THỰC THI KHOcircNG HOAgraveN CHỈNHCaacutec quyết định về tiacutenh khả thi thường coacute giả định về lợi iacutech đạt được khi kế hoạch thực thiđược thực hiện hoagraven toagraven Trong thực tế thường chỉ thực hiện 90 thậm chiacute 70 phần trăm sovới phacircn tiacutech khả thi Lyacute do lagrave sự thay đổi tại một nơi trong hệ thống coacute thể ảnh hưởng vagrave coacutethể taacutec động tiecircu cực đến chỗ khaacutec Do vậy cấp quản lyacute coacute thể bỏ những phần trong dự aacuten coacutethể gacircy ra taacutec động xấu Do đoacute dự aacuten sẽ thực hiện iacutet hơn 100 so với dự aacuten kế hoạch Caacutec lyacutedo khaacutec coacute thể lagrave do khấu trừ ngacircn saacutech hoặc vượt chi phiacuteĐAacuteNH GIAacute SỰ THAgraveNH COcircNG CỦA THỰC THI HỆ THỐNGPhải coacute caacutec chỉ số đo lường thigrave mới coacute thể đaacutenh giaacute sự thagravenh cocircng khi thực thi một hệ thốngDickson va Powers (1973) đề ra 5 tiecircu chuẩn độc lậpbull Tỷ lệ thời gian thực hiện dự aacuten với thời gian ước lượngbull Tỷ lệ chi phiacute thực tế vagrave ngacircn saacutech thực hiệnbull Thaacutei độ của cấp quản lyacute đối với hệ thốngbull Nhu cầu thocircng tin của caacutec nhagrave quản lyacute được đaacutep ứng như thế nagraveo qua hệ thốngbull Taacutec động của dự aacuten đối với những hoạt động maacutey tiacutenh trong cocircng tyCaacutec đo lường khaacutec để đaacutenh giaacute thagravenh cocircng của hệ hỗ trợ quản lyacute (MSS)bull Sự sử dụng hệ thống (dự định dugraveng hoặc thực sự dugraveng)bull Thỏa matilden của người dugravengbull Thaacutei độ taacuten thagravenhbull Mức độ hệ thống hoagraven thagravenh caacutec mục tiecircu ban đầubull Phần thưởng đối với tổ chức (giảm chi phiacute tăng doanh thuhellip)bull Tỷ số lợi iacutech chi phiacute
bull Mức độ thể chế hoacutea của MSS trong tổ chứcDo bởi tiacutenh đa dạng của DSS necircn việc đaacutenh giaacute sự thagravenh cocircng của hệ nagravey cũng khoacute khăn tuynhiecircn cũng coacute thể coacute một số yếu tố giuacutep cho DSS thagravenh cocircng như sự tham gia người dugravenghuấn luyện người dugraveng hỗ trợ quản lyacute cấp cao nguồn thocircng tin đặc điểm của những nhiệmvụ coacute liecircn quan (cấu truacutec bất định độ khoacute phụ thuộc)
Chương5Nhoacutem hỗ trợ quyết định vagrave nhoacutemcocircng nghệ phần mềm
51Nhoacutem tạo quyết định
MDM-Holsapple đatilde gợi yacute chuacuteng ta sử dụng giới hạn người tạo quyết định
Một nhoacutem lagrave kết cấu MDM nơi magrave nhiều người ra quyết định hoagraven toagraven tương taacutec
Một đội lagrave kết cấu MDM nơi caacutec thagravenh viecircn tư vấn cho người đưa ra quyết định nhưng khocircng tương taacutec
Một Ủy ban lagrave kết cấu MDM với một người tạo quyết định duy nhất vagrave sự tương taacutec giữa caacutec thagravenh viecircn
Mạng thocircng tin
Mạng lưới baacutenh xe mỗi người tham gia coacute thể giao tiếp với người đưa ra quyết định ở trung tacircm nhưng khocircng phải với người tham gia khaacutecCấu truacutec nagravey lagrave khocircng thỏa matilden tất cả những người tham gia ngoại trừ người ra quyết định
Mạng dacircy chuyền Tham gia chuyển tiếp thocircng tin chỉ để noacute luocircn liền kề nhau trong chuỗi
Thagravenh viecircn cuối cugraveng ko được đaacutep ứng
Mạng vograveng trograven Tương tự như chuỗi nhưng kết thuacutec được kết nối
Mạng kết nối hoagraven toagraven khocircng coacute hạn chế về giao tiếp vagrave tương taacutec giữa caacutec thagravenh viecircnNoacutei chungnoacute đaacutep ứng hầu hết caacutec kết nối của người tham gia nhưng truyền đạt thocircng tin mất nhiều thời gian vagrave coacute nhiều cơ hội xảy ra lỗi
Nhoacutem hagravenh vi vagrave chuẩn mực
MDMs thiết lập caacutec chỉ tiecircu hướng dẫn quaacute trigravenh ra quyết định
Một chuẩn mực quy định cụ thể những gigrave thagravenh viecircn trong nhoacutem dự kiến sẽ lagravem trong những hoagraven cảnh nhất định
Quy tắc gửi coacute thể được thocircng qua viacute dụ đaacutenh giaacute ngang hagraveng hoặc xử phạt
Lagravem thế nagraveo để đưa ra quyết định
Việc chọn lựa magrave trong đoacute việc sử dụng cấu truacutec MDM phải được dựa trecircn một số yếu tố liecircn quan với bối cảnh quyết định
Viacute dụmột cấu truacutec riecircng lẻ sẽ lagravem việc nơi magrave quyết định được cấu truacutec cao vagrave thocircng tin lagrave coacute sẵn
Một ủy ban cơ cấu sẽ lagrave sự lựa chọn khi người ra quyết định khocircng thể đưa ra quyết định một migravenh
52Caacutec vấn đề thường gặp trong nhoacutem
Kiacutech thước Noacutei chung sự nhất triacute vagrave gắn kết giữa caacutec thagravenh viecircn tỉ lệ nghịch với phạm vi nhoacutem Trong nhoacutem lớn rất dễ higravenh thagravenh caacutec nhoacutem nhỏ vagrave hoạt động rời rạc
Tư duy tập thể Trong nhoacutem lớn mọi người coacute xu hướng suy nghĩ đểđạtđược sự nhất triacute necircn khocircng phaacutet huy được sự saacuteng tạo
Caacutec vấn đề về xatilde hội
Xung đột Trong 1 nhoacutem ai cũng muốn migravenh lagrave giỏi nhất necircn dễ dẫn đến xung đột
Ẩn danh(Giấu tecircn) Đacircy lagrave phương phaacutep được sử dụng để kiểm soaacutet xung đột Cho caacutec thagravenh viecircn tham gia ẩn danh
Vấn đề giới tiacutenh Nam vagrave nữ thường coacute những thế mạnh khaacutec nhau điều nagravey coacute thể lagrave sức mạnh trong 1 thiết lập MDM
Đagravem phaacuten vagrave quyết định
Một quyết định coacute thể liecircn quan đến nhiều quan điểm khaacutec nhau vigrave thế cần phải coacute sự đagravem phaacuten
Caacutec thiết kế của cơ chế hỗ trợ cho MDM phải phugrave hợp với caacutec hoạt độngđagravemphaacuten
Những hoạt động nagravey bao gồm việc thu nhận yacute kiến của caacutec thagravenh viecircn 1 caacutech cocircng bằng
53Cocircng nghệ hỗ trợ MDM
Organizational DSSndash 1 hệ thống cung cấp caacutec quyết định hỗ trợ
Group Support Systemndash Cocircng nghệ sử dụng sự hỗ trợ của nhiều becircn tham gia
Group DSS ndash Lagrave 1 hệ thống được thiết kế đặc biệt để hỗ trợ cho MDM
DSS ndash Lagrave 1 hệ thống dưới sự kiểm soaacutet của 1 người quyết định hệ thống nagravey cung cấp 1 bộ cocircng cụ giuacutep phacircn tiacutech hoagraven cảnh đểđưa ra quyết định vagrave nacircng cao hiệu quả của quyết địnhđoacute
53Cocircng nghệ hỗ trợ MDM
Organizational DSSndash 1 hệ thống cung cấp caacutec quyết định hỗ trợ
Group Support Systemndash Cocircng nghệ sử dụng sự hỗ trợ của nhiều becircn tham gia
Group DSS ndash Lagrave 1 hệ thống được thiết kế đặc biệt để hỗ trợ cho MDM
DSS ndash Lagrave 1 hệ thống dưới sự kiểm soaacutet của 1 người quyết định hệ thống nagravey cung cấp 1 bộ cocircng cụ giuacutep phacircn tiacutech hoagraven cảnh đểđưa ra quyết định vagrave nacircng cao hiệu quả của quyết địnhđoacute
Mục tiecircu của cocircng nghệ hỗ trợ MDM
Quy trigravenh hỗ trợ tập trung vagraveo quaacute trigravenh tạo điều kiện thuận lợi cho sự tương taacutec
Cơ chế cấu truacutec quaacute trigravenh chi phối caacutec hoạt động truyền thocircng
Nhiệm vụ hỗ trợ cocircng việc coacute thể chọn lựa tổ chức hoặc lấy thocircng tin
Nhiệm vụ cấu truacutec cocircng việc cho pheacutep truy cập đến kỹ thuật lọc kết hợp phacircn tiacutech kiến thức liecircn quan đến cocircng việc
Caacutec lớp loại cocircng nghệ hỗ trợ MDM
Phacircn loại theo đặc điểm do DeSanctis vagrave Gallupe đưa ra đề xuất một chương trigravenh ba cấp dựa trecircn caacutec tiacutenh năng được cung cấp
Hệ thống cấp 1 Mục điacutech chiacutenh lagrave tạo điều kiện thocircng tin liecircn lạc giữa caacutec thagravenh viecircn
Hệ thống cấp 2 Thiết kế để giảm thiểu rủi ro
Hệ thống cấp 3 Giuacutep điều chỉnh xử lyacute quyết định
Phacircn loại theo cocircng nghệ -Kraemer vagrave King tập trung vagraveo cocircng nghệ aacutep dụng
Cocircng nghệ bảng mạch điện tử
Hội nghị trực tuyến
Mạng lưới tập đoagraven
Trung tacircm thocircng tin
Mocirci trường cộng taacutec
Phograveng quyết định
Nhoacutem phần mềm
Phần mềm được thiết kế để hỗ trợ sự hợp taacutec bao gồm việc thu huacutet vagrave lưu trữ thocircng tin
Caacutec tổ chức dẫn đầu thị trường hiện tại lagrave Lotus Notes and Domino Microsoft Exchange Novell GroupWise and Oracle Office
Caacutec cocircng cụ trong một bộ phần mềm bao gồm người quản lyacute hội nghị (Lotus Sametime) vagrave trao đổi thocircng điệp (Lotus Notes Mail)
Xếp hạng phần mềm cho nhoacutem
Ellis vv đề xuất một hệ thống xếp hạng dựa vagraveo kiểu sự hỗ trợ noacute Cung cấp
Hệ thocircng điệp
Hệ thống hội thảo truyền higravenh
Hệ thống cộng taacutec soạn thảo
Nhoacutem phacircn phối giải phaacutep phần mền
Hệ thống phối hợp
Hệ thống thocircng minh đại diện
Lực lượng điều khiển phaacutet triển phần mềm cho nhoacutem
Một số nhacircn tố chiacutenh bao gồm
Tăng năng suất
Giảm số lượng caacutec cuộc họp
Tăng cường tự động hoacutea caacutec quy trigravenh lagravem việc thường xuyecircn
Cần phối hợp toagraven cầu tốt hơn
Tiacutenh sẵn sagraveng của những mạng lan rộng
Coleman vagrave Khanna liệt kecirc 10 nhacircn tố khaacutec
54Quản lyacute hoạt động MDM (Mobile Device Management - Quản lyacute thiết bị di động)
Một số phương phaacutep phối hợp phổ biến hơnMDM lagrave
Kỹ thuật nhoacutem định danh
Kỹ thuật Delphi
Sự phacircn xử
Hệ thocircng tin dựa trecircn vấn đề
Nemawashi
Kỹ thuật nhoacutem định danh
1-Mỗi người tham gia viết ra những yacute tưởng về những gigrave necircn quyết định
2-Lần lượt mỗi người tham gia trigravenh bagravey yacute tưởng của migravenh được ghi lại trecircn bảng Khocircng thảo luận ở đacircy
3-Sau khi tất cả caacutec yacute tưởng được trigravenh bagravey caacutec đại biểu coacute thể chất vấn những người khaacutec
4-Mỗi người tham gia bỏ phiếu cho mỗi yacute tưởng
Kỹ thuật Delphi
Về cơ bản tương tự như kỹ thuật nhoacutem định danh ngoại trừ những người khocircng bao giờ tham gia cuộc họp
Một cocircng cụ khảo saacutet được sử dụng để thu thập đầu vagraveo ban đầu từ caacutec thagravenh viecircn
Một cuộc khảo saacutet thứ hai được gửi đi với một bản toacutem tắt caacutec kết quả chung
Những bước lặp lại cho đến khi đạt được một sự đồng thuận hoặc nhigraven nhận của đa số
Sự phacircn xử(Arbitration )
Thiacutech hợp nhất khi caacutec thagravenh viecircn của MDM đại diện cho caacutec yếu tố đối lập
Những người tham gia đồng yacute rằng nếu lựa chọn thay thế hai becircn thỏa thuận khocircng được tigravem thấy thigrave một trọng tagravei viecircn becircn ngoagravei sẽ tham gia
Trọng tagravei sau đoacute lựa chọn thay thế ocircng hoặc xeacutet thấy thiacutech hợp nhất
Hệ thống thocircng tin dựa trecircn vấn đề (IBIS)
Lagrave một phương phaacutep lập luận cấu truacutec
Một đại diện cho IBIS lagrave một đồ thị với caacutec nuacutet vagrave caacutec liecircn kết
IBIS bắt đầu với lựa chọn của một nuacutet vấn đề gốc sau đoacute caacutec nuacutet vị triacute khaacutec nhau được liecircn kết với nuacutet gốc
Caacutec nuacutet vị triacute nagravey sau đoacute được đaacutenh giaacute dựa trecircn những lập luận gắn liền với chuacuteng
Nemawashi (được sử dụng rộng ratildei tại Nhật Bản)
1-Một hoặc nhiều thagravenh viecircn của MDM được chỉ định lagrave điều phối viecircnCaacutec điều phối viecircn sau đoacute chọn người tham gia cograven lại
2-Điều phối viecircn xacircy dựng một tổng hợp caacutec sự lựa chọn vagrave sau đoacute caacutec chuyecircn gia đaacutenh giaacute caacutec lựa chọn
3-Điều phối viecircn lựa chọn một sự lựa chọn dựa trecircn kết quả ở trecircn(ở 2)
4-Sự thay thế được luacircn chuyển điều phối viecircn tigravem kiếm sự đồng thuận thocircng qua sự thuyết phục vagrave đagravem phaacuten
5-Nếu đạt được sự đồng thuận điều phối viecircn cho lưu thocircng một tagravei liệu magrave mỗi thagravenh viecircn MDM để lại dấu hiệu trecircn đoacute
55Nơi lagravem việc ảo
Nhiều tổ chức trecircn toagraven thế giới kinh doanh bất động sản cho cocircng nghệ hợp taacutec
Cocircng việc được trở thagravenh một điều bạn lagravem hơn lagrave một nơi bạn đi
Những thay đổi lớn nhất mang lại bởi nơi lagravem việc ảo coacute thể lagrave về văn hoaacute hay xatilde hội hơn lagrave về cocircng nghệ
Chương 6 Hệ thống thocircng tin điều hagravenh
61 Yacute nghĩa của EIS- Hệ thống thocircng tin điều hagravenh
- EIS lagrave một dạng đặc biệt của DSS được thiết kế để hỗ trợ ra quyết định ở cấp cao nhất của một tổ chức
- Lagrave một hệ thống thocircng tin hỗ trợ nhu cầu lập kế hoạch vagrave đaacutenh giaacute của caacutec nhagrave quản lyacute điều hagravenh
- EIS coacute thể giuacutep một CEO coacute được bức tranh tổng thể chiacutenh xaacutec nhất về caacutec hoạt động vagrave một bản toacutem tắt những gigrave magrave đối thủ cạnh tranh đang lagravem
- Caacutec hệ thống nagravey noacutei chung hoạt động dễ dagraveng vagrave trigravenh bagravey thocircng tin theo những caacutech dễ hiểu để việc tiếp thu được nhanh choacuteng (biểu đồ đồ thịhellip)
(Tagravei liệu thecircm EIS lagrave những loại hệ thống lagrave rất phức tạp trong tự nhiecircn Coacute thể noacutei hệ thống nagravey cũng cung cấp cho caacutec nhagrave quản lyacute với caacutec thiết bị coacute khả năng ra quyết định bằng caacutech sử dụng của noacute Hệ thống nagravey hoạt động trong điều kiện như vậy quan trọng như trong caacutec hệ thống khaacutec khocircng hỗ trợ Khả năng lưu trữ dữ liệu nặng lagravem cho noacute lyacute tưởng để được thocircng qua khocircng chỉ bởi caacutec doanh nghiệp lớn magrave cograven bởi caacutec doanh nghiệp nhỏ hơn Nhigraven chung hệ thống nagravey lagrave dagravenh cho caacutec nhacircn viecircn cấp cao hỗ trợ thagravenh thạo trong việc đưa ra caacutec quyết định quan trọng)
Caacutec phiecircn EIS tiecircu biểu- Phiecircn lagravem việc coacute thể bắt đầu với một baacuteo caacuteo về tigravenh higravenh tagravei chiacutenh vagrave kinh
doanh của một cocircng ty caacutec chỉ số hoạt động quan trọng được hiển thị rotilde ragraveng- EIS sẽ cho pheacutep caacutec giaacutem đốc điều hagravenh coacute thể đi sacircu vagraveo dữ liệu từ những con
số bất kỳ magrave noacute hỗ trợ- Việc điều hagravenh coacute thể lựa chọn một mức độ chi tiết ( VD danh số baacuten hagraveng) nếu
như cần điều tra thecircm- Lagrave một phương phaacutep tiếp cận coacute thể giuacutep việc ra quyết định tốt hơn
Những điều magrave EIS ko coacute- EIS khocircng phải lagrave sự thay thế cho caacutec hệ thống dựa trecircn caacutec maacutey tiacutenh khaacutec EIS
thực sự chỉ cung cấp dữ liệu cho caacutec hệ thống nagravey- Noacute khocircng thể biến caacutec bộ hệ điều hagravenh của maacutey tiacutenh thagravenh những ldquochuyecircn viecircn
giỏirdquo- Coacute thể được viacute một caacutech cao hơn như lagrave một trợ lyacute đaacuteng tin cậy coacute thể được gọi
đến bất khi nagraveo vagrave mỗi khi cần thiết
Tagravei liệu thecircm Sự khaacutec nhau giữa EIS vagrave DSS+ EIS thiết kế để hỗ trợ những người điều hagravenh cấp cao giuacutep họ khaacutem phaacute caacutec vấn đề vagrave caacutec cơ hội DSS hỗ trợ những nười phacircn tiacutech cố gắng trả lời cacircu hỏi caacutei gigrave coacute thể lagravem cugraveng với một cơ hội hoặc một vấn đề
Chiều EIS DSSNhững người sử dụng thocircng thường
Duyệt dữ liệu đi xuống truy xuất trạng thaacutei
Hỗ trợ phacircn tiacutech vagrave quyết định
Sự thuacutec đẩy Tiacutenh thiacutech hợp Tiacutenh hiệu quảỨng dụng Queacutet mocirci trường đaacutenh giaacute
hiệu suất nhận dạng caacutec vấn đề vagrave caacutec cơ hội
Caacutec quyết định quản lyacute trecircn caacutec lĩnh vực đa dạng
Hỗ trợ quyết định Caacutec chiacutenh saacutech caacutec quyết định khocircng coacute cấu truacutec ở mức cao vagrave hỗ trợ giaacuten tiếp
Hỗ trợ caacutec quyết định lặp lại caacutec quyết định khocircng thể đoaacuten trước ra quyết định khocircng coacute cấu truacutec vagrave baacuten cấu truacutec
Loại thocircng tin Caacutec thocircng tin tin tức thocircng tin becircn ngoagravei về khaacutech hagraveng đối thủ cạnh tranh mocirci trường caacutec baacuteo caacuteo theo yecircu cầu vagrave định thời về caacutec hoạt động becircn trong
Caacutec thocircng tin hỗ trợ caacutec tigravenh huống đặc biệt
Sử dụng coacute nguyecircn tắc
Dograve theo vết vagrave điều khiển nhận dạng cơ hội
Hoạch định tổ chức phacircn nhoacutem vagrave điều khiển
Khả năng phugrave hợp với những người sử dụng caacute nhacircn
Thiết kế loại ra quyết định cho mỗi người điều hagravenh caacute nhacircn bằng nhiều lựa chọn đầu ra
Cho pheacutep caacutec đaacutenh giaacute caacute nhacircn caacutec khả năng what-if lựa chọn loại hộp hội thoại
Đồ họa Phải coacute Lagrave một phần quan trọng của nhiều DSS
Thacircn thiện người sử dụng
Phải coacute Phải coacute nếu khocircng coacute người sử dụng trung gian
Xử lyacute thocircng tin Lọc neacuten thocircng tin dograve theo vết dữ liệu vagrave thocircng tin quan trọng
EIS kiacutech thiacutech caacutec cacircu hỏi caacutec cacircu trả lời bằng caacutech sử dụng DSS vagrave phản hồi lại EIS
Hỗ trợ caacutec thocircng tin chi tiết
Truy xuất thường xuyecircn caacutec mức chi tiết của bất kỳ thocircng tin tổng hợp nagraveo (duyệt dữ
Coacute thể coacute trong DSS nhưng khocircng thường
liệu chi tiết)Cơ sở mocirc higravenh Caacutec chức năng coacute sẵn bị hạn
chếLagrave điểm cốt lotildei của DSS
Cấu truacutec Theo người baacuten sản phẩm hoặc theo caacutec chuyecircn gia hệ thống thocircng tin
Theo người sử dụng hoặc caacute nhacircn hoặc caacutec chuyecircn gia từ caacutec trung tacircm thocircng tin hoặc phograveng ban hệ thống thocircng tin
Phần cứng Mainframe caacutec trạm RISC mạng LANs hoặc caacutec hệ thống phacircn bố
Mainframe caacutec trạm RISC caacutec maacutey PC hoặc caacutec hệ thống phacircn bố
Bản chất caacutec goacutei phần mềm
Truy xuất tương taacutec dễ dagraveng đến nhiều cơ sở dữ liệu truy xuất trực tuyến caacutec khả năng DBMS phức tạp caacutec liecircn kết phức tạp
Caacutec khả năng tiacutenh toaacuten lớn caacutec ngocircn ngữ mocirc higravenh mocirc phỏng ứng dụng vagrave caacutec bộ tạo DSS
Bản chất caacutec thocircng tin
Trigravenh bagravey thocircng tin được phaacutet sinh trước về quaacute khứ vagrave hiện tại tạo caacutec thocircng tin mới về quaacute khứ hiện tại tương lai
Tạo thocircng tin mới về quaacute khứ hiện tại tương lai
62 Lịch sử EIS- EIS xuất hiện lần đầu tiecircn tại MIT vagraveo những năm 1970
- Những EIS đầu tiecircn được phaacutet triển bởi caacutec doanh ngiệp lớn sẵn sagraveng chấp nhận rủi ro để đạt được lợi thế cạnh tranh
- Vagraveo những năm 1980 caacutec nhagrave cung cấp đatilde phaacutet triển một số cơ sở khaacutech hagraveng rộng vagrave cocircng nghệ EIS được tiếp tục phaacutet triển cho đến ngagravey nay
(Tagravei liệu thecircm Sử dụng DSSEIS cho phaacutet triển bền vững + Một số nghiecircn cứu đatilde được tiến hagravenh để kiểm tra việc thực hiện của EIS trong khu vực cocircng cộng vagrave chiacutenh phủ caacutec nước tổ chức kể từ khi chuacuteng được phaacutet triển theo định hướng lợi nhuận cho caacutec cocircng ty tư nhacircn (Hasan vagrave Hasan năm 1997) Theo một nghiecircn cứu tiến hagravenh tại Mỹ ở hơn 300 cocircng ty kết quả cho thấy sự khaacutec biệt của EIS giữa tư nhacircn vagrave chiacutenh phủ một số kết quả thuacute vị được phaacutet hiệnViacute dụ khoacute khăn hơn để chuyển tiền từ một tagravei khoản khaacutec trong một EIS của chiacutenh phủ cũng lagrave khoacute khăn hơn để biện giải thiacutech cho những chi phiacute phaacutet triển EIS của chiacutenh phủ Một nghiecircn cứu khaacutec được tiến hagravenh ở Australia
cho thấy rằng EIS cung cấp cho quản lyacute một higravenh ảnh chiacutenh xaacutec hơn về tổ chức thực hiện vagrave cung cấp hỗ trợ cho caacutec lợi iacutech chiến lược cải thiện khocircng chỉ cho caacutec nhagrave quản lyacute nhưng cograven cho phần cograven lại của tổ chức Dựa trecircn caacutec hệ thống được thiết kế cho caacutec cocircng ty tư nhacircn với một caacutech rotilde ragravengxaacutec định mục tiecircu EIS lagrave thiacutech hợp cho caacutec tổ chức cocircng cộng hiện đại nhưng cần phải được linh hoạt hơn vagrave kết thagravenh chugravem một phạm vi rộng hơn khả năng vagrave phương tiện hơn so với khu vực tư nhacircn ban đầu theo định hướng sản phẩm (Hasan vagrave Hasan năm 1997) Điều nagravey coacute thể lagrave do thực tế rằng caacutec hoạt động khu vực cocircng lagrave bắt buộc coacute taacutec động rộng phải đaacutep ứng sự mong đợi duy nhất cocircng cộng thường coacute mục tiecircu mơ hồ vagrave macircu thuẫn iacutet quyền tự chủ vagrave kiểm soaacutet việc ra quyết định vagrave nhacircn viecircn lagrave khoacute khăn hơn (Watson vagrave Carte2000) + Toacutem lại EIS lagrave một khaacutei niệm thagravenh cocircng noacute phaacutet triển qua nhiều năm tuy nhiecircn EIS khắc phục khiếm khuyết của migravenh bằng caacutech tiến hagravenh nghiecircn cứu liecircn tục)
63 Tại sao những người điều hagravenh hagraveng đầu lại khaacutec nhau- Họ lagrave những doanh nghiệp theo định hướng coacute suy nghĩ
- Coacute một khoảng khocircng gian rộng để kiểm soaacutet
- Họ chịu traacutech nhiệm cho việc thiết lập chiacutenh saacutech
- Họ đại diện cho tổ chức mocirci trường becircn ngoagravei
- Hagravenh động của họ tạo ra những kết quả đaacuteng kể về tagravei chiacutenh vagrave con người
Tần số caacutec hoạt động điều hagravenh- Xử lyacute xaacuteo trộn 42
- Hoạt động kinh doanh 32
- Phacircn bổ nguồn lực 17
- Đagravem phaacuten 3
- Những điều khaacutec 6
Handling Disturbances 42
Entrepreneurial Activites 32
Resource Allocation 17
Negotiation 3
Other 6
Những thocircng tin điều hagravenh cần thiết- Quản lyacute xaacuteo trộn coacute thể yecircu cầu sự chuacute yacute xung quanh đồng hồ
- Hoạt động kinh doanh yecircu cầu điều hagravenh để dự đoaacuten những thay đổi trong mocirci trường
- Nhiệm vụ phacircn bổ tagravei nguyecircn yecircu cầu lựa chọn người quản lyacute vagrave caacutec nguồn lực hạn chế được triển khai
- Đagravem phaacuten yecircu cầu cập nhật thocircng tin từng phuacutet để coacute thể xacircy dựng được sự đồng thuận
Caacutec loại thocircng tin điều hagravenh- Hệ thống kế toaacuten coacute liecircn quan đến việc tiacutenh toaacuten thu nhập hoạt động cho caacutec lĩnh
vực cụ thể lagrave quan trọng hơn so với caacutec hệ thống kế toaacuten truyền thocircng- Thocircng tin về thị trường khaacutech hagraveng cung cấp giaacute trị trong việc quyết định chiến
lược- Caacutec thocircng tin cần thiết thường được truyền đi trecircn một số hệ thống maacutey tiacutenh vagrave
nằm trong toagraven tổ chức- Caacutec thocircng tin được sử dụng thường lagrave ngắn hạn vagrave dễ thay đổi
Phương thức để xaacutec định thocircng tin cần thiết
Rockart xaacutec định được năm phương thức cơ bản để xaacutec định thocircng tin cần thiết
- Phương thức dựa trecircn kết quả- Phương thức rỗng- Phương thức chỉ số khoacutea- Phương thức tổng hợp nghiecircn cứu- Phương thức dựa vagraveo nhacircn tố then chốt dẫn đến thagravenh cocircng
64 Thagravenh phần EIS
- Sản phẩm EIS đầu tiecircn được phaacutet triển để sử dụng trecircn maacutey tiacutenh cấu higravenh cao nhưng caacutec sản phẩm hiện nay nhằm mục tiecircu lagrave nền tảng ClientServer
- Những nền tảng linh hoạt hơn coacute thể thiacutech ứng với thay đổi trong tổ chức vagrave cocircng nghệ
- Sử dụng dữ liệu thời gian thực dẫn đến quyết định nhanh hơn nhiều thocircng tin hơn
Thagravenh phần phần cứng- Một EIS khocircng đogravei hỏi coacute phần cứng cụ thể hoặc duy nhất nagraveo- Chigravea khoacutea của vấn đề lagrave để đảm bảo rằng caacutec thagravenh phần của EIS tối ưu hoacutea vagrave
phugrave hợp với tagravei nguyecircn maacutey tiacutenh của tổ chức- Hệ thống nagravey phải được cấu higravenh để caacutec nguồn tagravei nguyecircn phugrave hợp với những
người điều hagravenh chuacuteng
Thagravenh phần phần mềm- Traacutei ngược với phần cứng phần mềm thường được chuyecircn mocircn hoacutea cao cho caacutec
bagravei toaacuten về miền- Sự chuyecircn mocircn hoacutea nagravey thường đạt được bằng caacutech sử dụng thagravenh phần off-the-
shelf cho toagraven bộ EIS vagrave caacutec mocirc-đun tugravey chỉnh để đaacutep ứng nhu cầu cụ thể- Lotus Notes lagrave một viacute dụ điển higravenh Noacute coacute thể được sử dụng một migravenh hoặc coacute
thể phục vụ becircn thứ ba mocirc-đun plug-in
Cocircng nghệ EIS hiện nay
Dobrzeniecki đề xuấtphacircn loạitừng cấptheo bachức năng- Loại 1 sản phẩm bao gồmmột bộ đầy đủcaacutec ứng dụngtừ mộtnhagrave cung cấp- Loại 2 sản phẩm đượcthựchiệnở phần đầu củacaacutecsản phẩmDSS đượcphaacutet triển
bởicugravengmộtnhagrave cung cấp- Loại 3 sản phẩmkết hợp với nhautheo bất kỳ số lượngthuộc sở hữu củacocircng ty
65 Xacircy dựng EIS
- Xacircy dựngmộtEISgiống nhưxacircydựngmột số hệ thống khaacutec củamocirc higravenh hệ thống thocircng tin
- Việcphaacutet triểncấu truacutecnecircn được theo dotildeitừ quaacute trigravenh thiết kế đến quaacute trigravenhthực hiện
- Tuy nhiecircn một dự aacuten phaacutet triển EIScoacute xu hướnglagrave thống nhấtvagraveyecircu cầu hỗ trợ caacutec nhagrave quản lyacute latildenh đạo
- Xacircy dựng một EIScoacute thểphaacutet hiện ra đượccaacutectigravenh huống khoacute khănmagravemột nhagrave phaacutet triển chưabao giờ gặp phải
Mocirc higravenh EIS
Khung phaacutet triển một EIS
- Watson et al đề nghị xacircy dựngkhung với ba thagravenh phần+ Caacutech tiếp cận tập trung vagraveo yếu tốcon người vagrave dữ liệu coacute liecircn quan đến EIS+ Quaacute trigravenh phaacutet triển cần sự linh hoạt vagrave tương taacutec+ Người sử dụng - hệ thống hộp thoại bao gồm một ngocircn ngữ hagravenh động để xử lyacute caacutec lệnh
Lợi iacutech của EIS- Dễ duy trigrave caacutec mục tiecircu coacute tổ chức- Dễ truy xuất thocircng tin- Cho pheacutep người sử dụng nacircng cao hiệu suất hơn
- Tăng chất lượng ra quyết định- Cung cấp sự cải tiến cạnh tranh- Tiết kiệm thời gian của người sử dụng- Tăng khả năng vagrave chất lượng giao tiếp- Cung cấp khả năng điều khiển tốt hơn trong tổ chức- Cho pheacutep tham gia caacutec vấn đề vagrave caacutec cơ hội- Cho pheacutep hoạch định- Cho pheacutep tigravem kiếm nguyecircn nhacircn của một vấn đề- Thảo matilden caacutec yecircu cầu của người điều hagravenh
Hạn chế của EIS vagrave 1 số sai lầm cần traacutenh
- Chi phiacute một cuộc khảo saacutetnăm1991 chothấychi phiacute phaacutet triểntrungbigravenh365000USDvớichi phiacute vận hagravenhhagraveng năm lagrave$200000 (EIS)
- Cocircng nghệ hạn chếEIScần phảiđượctiacutech hợp hoagraven toagravenvagraveokiếntruacuteccủadoanh nghiệphiện tại do đoacute noacutelagrave một thaacutech thứclớn đối vớithiết kế
- Hạn chế tổ chức cơ cấu tổ chứccoacute thể khocircng phugrave hợp
Sự hạn chế về tổ chức- Chương trigravenh nghị sự vagrave thời gian chệch EIS mocirc tả một phần việc thực hiện một
chương trigravenh nghị sự vagrave coacute thể dễ dagraveng đạt được sự tin cậy một caacutech chắc chắn- Đồng bộ hoacutea việc quản lyacute sự tin cậy đuacuteng luacutec đặc biệt baacuteo caacuteo EIS coacute thể phaacute
vỡ sự ổn định thiết lập caacutec chu trigravenh baacuteo caacuteo một caacutech tốt nhất- Sự bất ổn EIS phản ứng nhanh coacute thể gacircy ra việc taacutec động trở lại một caacutech
nhanh choacuteng dẫn đến sự thiếu ổn định trong tổ chức
Sự thất bại lagrave thay thế khocircng thể chấp nhận được- Một số yếu tố lagravem EIS thất bại
+ Thiếu sự hỗ trợ về mặt quản lyacute+ Vấn đề chiacutenh trị+ Thất bại của nhagrave phaacutet triển+ Lỗi về cocircng nghệ+ Giaacute cả+ Thời gian
66 Ra quyết định điều hagravenh trong tương lai vagrave EIS
- Coacute một vagravei điều kiện sẽ được hợp nhất cho việc chuyển đổi cocircng nghệ Trong đoacute một vagravei điều kiện coacute thể dễ dự đoaacuten Hai điều kiện magrave ta coacute thể thấy lagrave+ Phaacutet triển cocircng nghệ maacutey tiacutenh trong việc điều hagravenh sẽ tạo ra sự chuyển đổi được chấp nhận một caacutech dễ dagraveng hơn+ Mở rộng traacutech nhiệm điều hagravenh sẽ mở rộng nhu cầu thocircng tin
Tương lai của EIS- EIS thocircng minh Những tiến bộ trong cocircng nghệ AI sẽ được triển khai trong caacutec
EIS- EIS đa phương tiện Cơ sở dữ liệu đa phương tiện sẽ cho pheacutep tiacutech hợp văn bản
giọng noacutei vagrave higravenh ảnh trong tương lai- EIS thocircng tin Tương lai EIS sẽ mở rộng hơn trong việc sử dụng dữ liệu becircn
ngoagravei doanh nghiệp- EIS kết nối Giao tiếp với băng thocircng rộng cho pheacutep kết nối liecircn thocircng lớn hơn
Chương 7 HỆ CHUYEcircN GIA VAgrave TRIacute TUỆ NHAcircN TẠO
71 Caacutec khaacutei niệm
72 Triacute thocircng minh của triacute tuệ nhacircn tạo
73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia
74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia
75 Lợi iacutech vagrave hạn chế của hệ chuyecircn gia
71 Caacutec khaacutei niệm
Chuyecircn mocircn (Expertise) sự hiểu biết rộng trong 1 lĩnh vực hẹp
Hệ chuyecircn gia (Expert Systems)1 chương trigravenh maacutey tiacutenh sử dụng 1 tập caacutec luật dựa trecircn tri thức của con người để giải quyết caacutec vấn đề đogravei hogravei phải coacute sự chuyecircn mocircn
Một số hệ chuyecircn gia nổi tiếng
DENDRAL (Standford 1960s Edward Feigenbaum)
MYCIN (Standford1970s Edward Shortliffe)
PROSPECTOR (MIT 1979)
Triacute tuệ nhacircn tạo (Artificial Intelligence ndash AI)
Triacute tuệ nhacircn tạo một bộ phacircn của ngagravenh khoa học maacutey tiacutenh quan tacircm đến việc thiết kế caacutec hệ thống maacutey tiacutenh thocircng minh đoacute lagrave caacutec hệ thống đưa ra caacutec đặc điểm magrave từ đoacute chuacuteng ta liecircn hệ với sự thocircng minh trong hagravenh động của con người (Barr vagrave Feigenbaum 1981)
Mục điacutech của AI
Mục điacutech khoa học xaacutec định caacutec gợi yacute để giải thiacutech caacutec loại khaacutec nhau của triacute tuệ thực
Mục điacutech kỹ thuật giải quyết caacutec vấn đề trong thế giới thực
Triacute tuệ nhacircn tạo kế thừa nhiều yacute tưởng quan điểm kỹ thuật từ caacutec ngagravenh khoa học khaacutec
- Triết học
- Logic Toaacuten học
- Tiacutenh toaacuten
- Khoa học tacircm lyacute Khoa học nhận thức
- Sinh học Thần kinh học
- Tiến hoacutea
Caacutec lĩnh vực ứng dụng trong Triacute tuệ nhacircn tạo
Mạng nơ ron thần kinh (Neural Networks)
Tiacutenh toaacuten sự tiến hoacutea
(Evolutionary Computation)
Hệ chuyecircn gia (Expert Systems)
Kỹ thuật xử lyacute tiếng noacutei (Speech Processing)
Kỹ thuật xử lyacute ngocircn ngữ tự nhiecircn
(Natural Language Processing)
Lập kế hoạch (Planning)
Robot (Robotics)
Khoa học higravenh ảnh (Vision)
Caacutec kỹ thuật thocircng dụng dugraveng trong AI
Biểu diễn(Representation)
Học (Learning)
Caacutec luật (Rules)
Tigravem kiếm (Search)
72 Triacute thocircng minh của triacute tuệ nhacircn tạo
Con người suy diễn như thế nagraveo
Phacircn loại (Categorization)
Caacutec quy tắc cụ thể
Heuristics
Kinh nghiệm trước đoacute
Dự tiacutenh trước
Maacutey tiacutenh suy diễn như thế nagraveo
Lập luận dựa trecircn luật IF-THEN mocirc tả tri thức được matilde hoacutea dưới dạng caacutec luật
Caacutec khung (Frames) lagrave caacutec đại diện mocirc tả caacutec tigravenh huống giống nhau lagrave điển higravenh của một vagravei phacircn loại
Lập luận dựa trecircn caacutec trường hợp mocirc phỏng giải phaacutep trước đoacute cho một vấn đề hiện tại
Nhận dạng mẫu phaacutet hiện acircm thanh higravenh dạng hoặc caacutec chuỗi dagravei
Caacutec dạng khaacutec của Triacute tuệ nhacircn tạo
Học maacutey- mạng nơron vagrave giải thuật di truyền
Lập trigravenh tự động ndash lagrave những kỹ thuật tạo ra caacutec chương trigravenh để lagravem 1 nhiệm vụ riecircng biệt (cho pheacutep những người khocircng phải lagrave người lập trigravenh coacute thể lập trigravenh được)
Cuộc sống nhacircn tạo ndash nỗ lực để taacutei tạo caacutec hiện tượng sinh học trong caacutec hệ thống dựa trecircn maacutey tiacutenh
73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia(Expert Systems- ES)
Theo Jackson (1999) Một hệ chuyecircn gia lagrave một chương trigravenh maacutey tiacutenh mocirc tả vagrave suy diễn với tri thức của một vagravei lĩnh vực để giải quyết vấn đề hay đưa ra caacutec lời khuyecircn
Cấu truacutec cơ bản của ES được dựa theo cấu truacutec chung của DSS Sự khaacutec biệt chiacutenh giữa ES vagraveDSS lagrave hệ ES thu thập caacutec kiến thức từ những
chuyecircn gia trong lĩnh vực quan tacircmĐặc trưng của hệ chuyecircn gia Hiệu quả cao Thời gian trả lời thỏa đaacuteng Độ tin cậy cao Dễ hiểu
Giao diện người dugraveng trong ES
Thiết kế giao diện người dugraveng tập trung vagraveo caacutec yếu tố như dễ dagraveng sử dụngcoacute độ tin cậy cao giảm tải những khoacute khăn khi sử dụng
Thiết kế necircn coacute một số tương taacutec (đầu vagraveo kiểm soaacutet vagrave truy vấn)
Cấu tạo giao diện người dugraveng gồm coacute magraven higravenh cảm ứng bagraven phiacutem buacutet saacuteng lệnh thoại caacutec phiacutem chuyecircn dụng
Cơ sở tri thức (Knowledge Base)
Chứa đựng caacutec tri thức cụ thể miền thu được từ caacutec chuyecircn gia miền
Coacute thể chứa caacutec mocirc tả caacutec hagravenh vi giải quyết vấn đề caacutec ragraveng buộc caacutec heuristics
Thagravenh cocircng của một ES dựa trecircn tiacutenh đầy đủ vagrave tiacutenh chiacutenh xaacutec của cơ sở tri thức
Mocirc tơ suy diễn (Inference Engine)
Ở đacircy tri thức được đặt để sử dụng tạo ra caacutec giải phaacutep để giải quyết vấn đề
Mocirc tơ nagravey coacute khả năng thực hiện diễn dịch hoặc suy diễn dựa trecircn caacutec luật hay caacutec caacutec sự kiện
Đồng thời cũng coacute khả năng sử dụng caacutec suy diễn mờ hay khocircng chiacutenh xaacutec dựa trecircn xaacutec suất hay aacutenh xạ mẫu
Vograveng điều khiển suy diễn
1 Aacutenh xạ caacutec luật với caacutec sự kiện đatilde được cho
2 Chọn luật để thực hiện
3 Thực hiện luật bằng caacutech thecircm caacutec sự kiện được suy diễn ra vagraveo bộ nhớ lagravem việc
Chuỗi suy diễn (Chaining)
Suy diễn tiến (forward chaining) maacutey suy diễn bắt đầu từ dữ liệu ban đầu vagrave thực hiện việc suy luận để đưa ra caacutec kết luận cuối cugraveng
Suy diễn lugravei (backward chaining) maacutey suy diễn bắt đầu từ dữ liệu điacutech vagrave tigravem ra tri thức hỗ trợ cho dữ liệu điacutech đoacute
Viacute dụ suy diễn lugravei
R1 Nếu coacute A vagrave B thigrave suy ra coacute D
R2 Nếu coacute B thigrave suy ra coacute C
R3 Nếu coacute C vagrave D thigrave suy ra coacute E
Ta coacute E ta xem trong 3 luật R1 R2 R3 luật nagraveo coacute E ta thấy R3 chứa E đồng thời chứa C vagrave D Xeacutet tiếp trong 2 luật R1 R2 luật nagraveo chứa C vagrave D R2 chứa C R3 chứa D Từ đoacute ta coacute được caacutec tri thức hỗ trợ suy diễn vagrave kết luận lagrave nếu coacute A vagrave B thigrave sẽ coacute E Hay nếu A vagrave B đuacuteng thigrave sẽ coacute E
Viacute dụ suy diễn tiến
Giả sử coacute tập chứa 3 luật sau
R1 Nếu coacute A vagrave B thigrave suy ra coacute D
R2 Nếu coacute B thigrave suy ra coacute C
R3 Nếu coacute C vagrave D thigrave suy ra coacute E
Nếu ta coacute A vagrave B thigrave chuacuteng ta suy ra được D từ R1 vagrave suy ra C từ R2 Với D vagrave C đatilde được suy ra ở trecircn giờ chuacuteng ta suy ra được E từ R3
Viacute dụ thực tế
Giả sử muốn biết magraveu của một con vật nuocirci tecircn lagrave Fred biết rằng noacute kecircu ộp ộp vagrave ăn ruồi
Coacute tập 4 luật ban đầu như sau
R1 Nếu X kecircu ộp ộp vagrave ăn ruồi thigrave X lagrave con ếch
R2 Nếu X kecircu chiecircm chiếp vagrave biết hoacutet thigrave X lagrave con chim
R3 Nếu X lagrave con ếch thigrave X coacute magraveu xanh
R4 Nếu X lagrave con chim thigrave X coacute magraveu vagraveng
74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia
Expert system shells lagrave một tập caacutec goacutei phần mềm vagrave caacutec cocircng cụ dugraveng để phaacutet triển caacutec hệ chuyecircn gia
Những Expert system shells đầu tiecircn thường rất rườm ragrave Mặc dugrave vậy noacute vẫn giuacutep cho người sử dụng sẽ khocircng phải bắt đầu lại từ đầu khi xacircy dựng một hệ chuyecircn gia mới
Những shell hiện đại bao gồm hai mocirc-đun chiacutenh lagrave cocircng cụ xacircy dựng một tập quy tắc vagrave mocirc tơ suy diễn
Xacircy dựng hệ chuyecircn gia
Bước 1 xacircy dựng mocirc higravenh bagravei toaacuten xaacutec định vấn đề nhiệm vụ magrave hệ thống sẽ thực hiện Caacutec dạng bagravei toaacuten cần hệ chuyecircn gia
Bagravei toaacuten diễn giải (InterPretation)
Bagravei toaacuten dự baacuteo (Prediction)
Bagravei toaacuten chuẩn đoaacuten (Diagnose)
Bagravei toaacuten gỡ rối (Debugging)
Bagravei toaacuten thiết kế
Tương tự như một dự aacuten phần mềm để xacircy dựng một hệ chuyecircn gia cần phải coacute caacutec yếu tố về nhacircn lực tagravei nguyecircn vagrave thời gian Những yếu tố nagravey ảnh hưởng đến giaacute thah của một hệ chuyecircn giaTrong phần nagravey cacircu hỏi thường được đặt ra lagrave tại sao cần phải xacircy dựng một hệ chuyecircn giaTrước khi bắt đầu phải xaacute định rotilde bagravei toaacuten đạt ra lagrave jiAi lagrave chuyecircn giaAi lagrave người sử dụng
1 Diễn giải (InterPretation) Nghiecircn cứu 1 vấn đề -gt Dựa trecircn những biểu hiện thuộc tiacutenh đặc trưng becircn ngoagravei -gt Tư vấn
(hoặc đưa ra kết luận hay mocirc tả dễ hiểu từ tập dữ liệu thocirc)
2 Bagravei toaacuten dự baacuteo (Prediction) Coacute thể dự đoaacuten được hagravenh vi kết quả dựa trecircn caacutec hiện tượng -gt dự baacuteo
VD Dự baacuteo thời tiết động đấthellip
3 Bagravei toaacuten chẩn đoaacuten (Diagnoss) Xaacutec định caacutec lỗi caacutec bộ phận hỏng hoacutec của hệ thống dựa trecircn caacutec dữ liệu quan saacutet được
4 Bagravei toaacuten gỡ rối (Debugging) Mocirc tả caacutec phương phaacutep khắc phục hệ thống khi gặp sự cố
5 Bagravei toaacuten thiết kế Lựa chọn cấu higravenh caacutec đối tượng nhằm thoả matilden một số ragraveng buộc nagraveo đoacute
6 Giảng dạy Phần mềm dạy học coacute thể chuẩn đoaacuten vagrave sủa lỗi của học sinh trong quaacute trigravenh học tập
Để xaacutec định đuacuteng bagravei toaacuten magrave chuacuteng ta cần giải quyết thigrave phải trả lời đc một số cacircu hỏi
- cần hệ chuyecircn gia
Bước 2 thu thập tri thức lựa chọn cocircng cụ vagrave aacutep dụng
Trong bước thu thập tri thức vấn đề quan trọng lagrave lựa chọn chuyecircn gia những người magrave sẽ đoacuteng goacutep tri thức cho hệ thống Thocircng thường trong suốt quaacute trigravenh phaacutet triển thigrave chuyecircn gia được xem như một thagravenh viecircn của đội phaacutet triển
Hiện nay coacute rất nhiều cocircng cụ để xacircy dựng một hệ chuyecircn gia Phổ biến nhất lagrave JESS CLIPS vagrave OPS5
Bước 3 Thiết kế cơ sở tri thức thiết kế hệ thốngTri thức được biểu diễn trường minh trong cơ sở tri thức
Caacutec chuyecircn gia vagrave kỹ sư tri thức sẽ đối thoại với nhau bằng caacutec kỹ thuật đối thoại Suy diễn (SD) bảng Mocirc higravenh hoacutea SD quy nạp phacircn loại
Vấn đề bagraveo trigrave vagrave phaacutet triển
Caacutec hệ chuyecircn gia đogravei hỏi phải bảo trigrave vagrave phaacutet triển nhiều hơn so với caacutec hệ thống khaacutec Phải thường xuyecircn bổ sung tri thức mới vagrave thay đổi caacutec tri thức cũ để đổi mới hệ chuyecircn gia
Thu thập vagrave khắc phục lỗi do người sử dụng phaacutet hiện để kịp thời khắc phục những sai soacutet của hệ chuyecircn gia
75 Lợi iacutech vagrave hạn chế của caacutec hệ chuyecircn gia
Một số lợi iacutech chiacutenh
Thời gian trả lời hợp lyacute bằng hoặc nhanh hơn so với chuyecircn gia (người) để đi đến cugraveng một quyết định Hệ chuyecircn gia lagrave một hệ thống thời gian thực (real time system)
Khả năng trả lời với mức độ tinh thocircng bằng hoặc cao hơn so với chuyecircn gia (người) trong cugraveng lĩnh vực
Hệ chuyecircn gia giuacutep cho hiệu quả lagravem việc tăng bằng việc sử dụng tập caacutec luật một caacutech nhanh choacuteng magrave ko bị nhầm lẫn chuyecircn gia lagrave người coacute thể quecircn đi một số tri thức cơ sở lyacute luậ nhưng HCG thigrave ko
Quyết định của một người chuyecircn gia coacute thể bị thay đổi vagrave ko coacute tiacutenh thống nhất như quyết định của một hệ chuyecircn gia tạo ra
Hệ chuyecircn gia giuacutep cho người sử dụng coacute thể trau dồi sự hiểu biết trecircn lĩnh vuej cụ thể magrave noacute giải quyết hỗ trợ người ra quyết định coacute trigravenh độ như 1 chuyecircn gia trong quaacute trigravenh gia quyết định
Kiến thức của rất nhiều chuyecircn gia về một lĩnh vực nagraveo đoacute được đưa vagraveo hệ chuyecircn gia lagravem cho CSTT cuat HCG phong phuacute vagrave rộng lớn hơn rất nhiều
HCG giải thiacutech caacutec bước suy luận một caacutech dễ hiểu nhất quaacuten luacutec nagraveo cũng coacute thể sử dụng ko như chuyecircn gia con người
Hạn chế của caacutec hệ chuyecircn gia
Nhược điểm lớn nhất của hệ chuyecircn gia lagrave những yacute kiến chuyecircn mocircn thường rất khoacute matilde hoacutea vagrave giải neacuten
Hệ chuyecircn gia khocircng coacute khả năng tự học tự cập nhật kiến thức mới như caacutec chuyecircn gia magrave cần phải được matilde hoacutea lại khi noacute được cập nhật
Hệ chuyecircn gia khocircng thể nhận ra được vấn đề khocircng nằm trong miền kiến thức của hệ thống
Chương 8 Tri thức vagrave tiếp nhận
1 Bao gồm caacutec vấn đề
Dữ liệu thực tế đo lường hoặc quan saacutet coacute hoặc khocircng coacute bối cảnh
Thocircng tin dữ liệu được tổng hợp một caacutech hữu iacutech để giải quyết những khoacute khăn trong việc đưa ra quyết định
Tri thức bao gồm caacutec ứng dụng quy tắc thocircng tin hướng dẫn của người ra quyết định
2 Những caacutei nhigraven về tri thức
Đại diện lagravem thế nagraveo để diễn tả tri thức viacute dụ như một quyển saacutech khocircng phải lagrave tri thức nhưng noacute lại lagrave một đại diện của tri thức
Sản xuất tri thức lagrave một tập hơp của hagraveng tồn kho coacute thể được sản xuất cũng như mua lại
Tri thức lagrave 1 trong 6 trạng thaacutei của hệ thống
1Dữ liệu 2Thocircng tin 3Cấu truacutec thocircng tin 4Sự thấu hiểu 5Yacute kiến 6 Quyết định
3 Caacutec loại tri thức Phổ biến mocirc tả dữ liệu thocircng tin thủ tục mọi thứ lagravem như thế nagraveo lập luận chiacutenh saacutech hoặc caacutec quy tắc
4 Thu thập Tri thức hệ chuyecircn gia Hầu hết caacutec phương phaacutep đều bắt đầu với mocirc higravenh của caacutec taacutec vụ trong đoacute
hệ chuyecircn gia được xacircy dựng Trong đoacute mocirc tả về caacutec lĩnh vực được tạo ra Caacutec kỹ sư sử dụng caacutec mocirc higravenh giả thuyết vagrave nhận thức về quaacute trigravenh phacircn
tiacutech để gợi ra caacutech giải quyết vấn đề về tri thức từ caacutec chuyecircn gia
5 Caacutec chiều của thu thập tri thức KE- driven caacutec kỹ sư trao đổi trực tiếp với caacutec chuyecircn gia Expert-driven Caacutec chuyecircn gia trực tiếp đưa chuyecircn mocircn của họ vagraveo hệ
thống maacutey tiacutenh Machine-driven Sử dụng caacutec cocircng cụ suy luận để triacutech xuất tri thức từ một
tập caacutec viacute dụ
6 Kỹ thuật thu thập tri thức Trao đổi gồm 2 loại cơ bản lagrave coacute cấu truacutec(coacute kịch bản) vagrave khocircng coacute cấu
truacutec( đối thoại trực tiếp) Giao thức phacircn tiacutech bằng lời Khi caacutec chuyecircn gia thực hiện một cocircng việc
của họ thigrave một bản ghi về cocircng việc đoacute được thực hiện Caacutec kỹ sư sẽ xacircy dựng mocirc higravenh cho những gigrave được ghi lại trong bản ghi
Phương phaacutep sagraveng lọc caacutec chuyecircn gia so saacutenh caacutec nhoacutem liecircn tiếp trong ba đối tượng vagrave cho biết tại sao nhoacutem thứ hai lại khaacutec nhoacutem thứ ba
7 Thu thập tri thức từ nhiều nguồn Thu thập tri thức từ nhiều nguồn lagrave cần thiết để coacute được đầy đủ caacutec tri thức
cho một vấn đề quan điểm yacute kiến traacutei ngược nhau thường phaacutet sinh Phương phaacutep đồng thuận sẽ giuacutep giải quyết được vấn đề macircu thuẫn Kỹ thuật phacircn tiacutech Meta lagrave kỹ thuật được aacutep dụng trong caacutec trường hợp
khaacutec Caacutech tiếp cận bằng định lượng đogravei hỏi caacutec kỹ sư cần cacircn nhắc yếu tố đầu vagraveo của caacutec chuyecircn gia khaacutec nhau
8 Xaacutec nhận hợp lệ vagrave kiểm tra tri thức Một khi thu thập tri thức noacute phải được đaacutenh giaacute về khả năng sử dụng vagrave độ
chiacutenh xaacutec Hai vấn đề cụ thể lagrave hiệu lực của những kiến thức vagrave kiểm tra việc xacircy dựng cơ sở của tri thức
Cần xaacutec nhận xem liệu hệ thống coacute thể hoạt động ở mức độ tối thiểu khocircng
Xaacutec minh liecircn quan đến việc so saacutenh từng chi tiết kỹ thuật của hệ thống những gigrave đatilde được thực hiện cuối cugraveng
9 Một số caacutec biện phaacutep xaacutec nhận Độ chiacutenh xaacutec Khả năng thiacutech nghi Mức độ đầy đủ Bề rộng Độ sacircu Hiệu lực Tổng quan Chiacutenh xaacutec Hiện thực Độ tin cậy Tiacutenh hữu dụng Mức độ
Chương 9 Học maacutey
1 Logic mờ vagrave ngocircn ngữ mờ(Fuzzy Logic and Linguistic Ambiguity)
Ngocircn ngữ tự nhiecircn gồm những khaacutei niệm mơ hồ vagrave khocircng chiacutenh xaacutectruyền tải ngữ nghĩa thocircng qua tiacutenh xấp xỉkhocircng rotilde ragraveng
Những xấp xỉ nagravey giuacutep con người coacute thể truyền tải hết được yacute nghĩa nhưng maacutey thigrave khocircng hiểu
Lagravem sao biểu diễn caacutec tri thức sử dụng caacutec khaacutei niệm khocircng rotilde ragraveng(mờ) hoặc khocircng chiacutenh xaacutec
2 Khaacutei niệm cơ bản của logic mờ tập mờ lagrave những tập hợp khocircng coacute một giới hạn rotilde Mỗi phần tử của noacute chỉ
chứa một mức độ hagravem liecircn thuộc của từng phần tử Vigrave vậy tập mờ khocircng giống như tập cổ điển Tập mờ coacute thể kết hợp với nhau qua những luật mờ magrave đặc trưng cho những hagravenh động trạng thaacutei vagrave thuộc tiacutenh của logic mờ được tận dụng khi thực hiện một bộ điều khiển mờ
Logic mờ dựa trecircn yacute tưởng mỗi phần tử thuộc vagraveo một tập hợp ở một mức độ nagraveo đấy
Locircgic mờ cho pheacutep độ liecircn thuộc (microA )coacute giaacute trị trong khoảng (01) Locircgic mờ coacute thể được coi lagrave mặt ứng dụng của lyacute thuyết tập mờ để xử lyacute caacutec
giaacute trị trong thế giới thực cho caacutec bagravei toaacuten phức tạp
3 So saacutenh tiacutenh đuacuteng đắn logic mờ vagrave xaacutec suất Xaacutec suất thigrave đề cập đến khả năng xảy ra một biến cố hay một điều gigrave đoacute Logic mờ đề cập đến cấp độ magrave đặc tiacutenh ở hiện tại
o viacute dụ1 người coacute chiều cao 6 feet thigrave coacute cấp độ lagrave 05 về chiều cao
4 Ưu điểm của logic mờ Caacutech tiếp cận rất tự nhiecircnkhocircng phức tạp Coacute thể mocirc higravenh hoacutea caacutec hagravem phi tuyến tugravey yacute phức tạp
Coacute thể tận dụng được kinh nghiệm từ những chuyecircn gia hagraveng đầu trong mọi lĩnh vực
Logic mờ được xacircy dựng dựa trecircn ngocircn ngữ tự nhiecircnNền tảng của logic mờ lagrave dựa trecircn cơ sở giao tiếp của con người
5 Nhược điểm của logic mờ Trong 1 hệ thống phức tạpsử dụng logic mờ coacute thể trở thagravenh trở ngại cho
việc xaacutec thực độ tin cậy của hệ thống Cơ chế lập luận mờ khocircng thể học hỏi từ những lỗi sai
6 Mạng noron nhacircn tạo(ANN) Mạng noron nhacircn tạo lagrave một mocirc phỏng xử lyacute thocircng tinđược nghiecircn cứu ra
từ hệ thống thần kinh của sinh vậtgiống như bộ natildeo để xử lyacute thocircng tin ANNs lagrave chương trigravenh dựa trecircn maacutey tiacutenh đơn giản coacute chức năng lagrave một mocirc
higravenh bagravei toaacuten khocircng gian dựa trecircn thử nghiệm vagrave baacuteo lỗi
7 Học từ kinh nghiệm Tiến trigravenh Một mẫu dữ liệu được biểu diễn như một mạng lưới noronANN ldquodự
đoaacutenrdquo 1 đầu radự đoaacuten được so saacutenh với giaacute trị thực tế hoặc giaacute trị chiacutenh xaacutecNếu đoaacuten được chiacutenh xaacutec thigrave khocircng coacute hagravenh động nagraveo được thực hiện
Nếu dự đoaacuten sai ANN kiểm tra lại vagrave xaacutec định lại thocircng số để điều chỉnh Một mẫu dữ liệu khaacutec được biểu diễn vagrave quaacute trigravenh nagravey được lặp lại
8 Nguyecircn tắc cơ bản của cocircng nghệ nơron Caacutec yếu tố xử lyacute cơ bản trong hệ thống thần kinh của con người lagrave tế bagraveo
thần kinhMạng lưới của tế bagraveo nagravey lagrave liecircn kết với nhau nhận được thocircng tin từ caacutec cảm biến trong mắt taihellip
Thocircng tin nhận được bởi tế bagraveo thần kinh hoặc lagrave sẽ kiacutech thiacutech noacute(sẽ được chuyển qua 1 thocircng điệp dọc theo mạng lưới) hoặc lagrave sẽ ngăn cản noacute(ngăn cản dograveng thocircng tin)
Độ nhạy coacute thể thay đổi qua thời gian hoặc sau khi coacute được kinh nghiệm
9 Cấu truacutec mạng Một ANN gồm 3 lớp cơ bản
Lớp đầu vagraveo nhận dữ liệu Lớp becircn trong hoặc lagrave lớp ẩn xử lyacute dữ liệu Lớp đầu ra chuyển tiếp kết quả cuối cugraveng của mạng
10Mạng nơ ron Thường coacute nhiều đầu vagraveo mỗi đầu vagraveo với mức ảnh hưởng vagrave tầm quan
trọng riecircng của noacute Một đầu vagraveo quan trọng coacute thể được sử dụng để khuếch đại đầu ra caacutec hagravem trạng thaacutei tổng hợp caacutec trọng số của caacutec yếu tố
đầuvagraveo khaacutec nhauvagraveo một giaacute trị duy nhất Caacutec hagravem chuyển giao xử lyacute caacutec giaacute trị trạng thaacutei vagrave tạo đầu ra
11Huấn luyện mạng nơ ron Trong mocirc higravenh coacute giaacutem saacutetANN được đến so saacutenh dự đoaacuten của chiacutenh
noacute với thocircng tin phản hồi coacute chứa caacutec kết quả mong muốn ANN sẽ phải tigravem caacutech thay đổi caacutec tham số becircn trong củamigravenh (caacutec trọng số vagrave caacutec ngưỡng) để tạo necircn một aacutenh xạ coacute khả năng aacutenh xạcaacutec đầu vagraveo thagravenh caacutec đầu ra mong muốn Sự thay đổi nagravey được tiến hagravenh nhờ việc so saacutenh giữa đầu ra thực sự vagrave đầu ra mong muốn
Trong mocirc higravenh khocircng coacute giaacutem saacutetANN nhận được dữ liệu vagraveo nhưng khocircng phải coacute bất kỳ thocircng tin phản hồi về kết quả mong muốn
Phần lớn caacutec ứng dụng nằm trong vugraveng của caacutec bagravei toaacuten ước lượng như mocirc higravenh hoacuteathống kecirc neacuten lọc phacircn cụm
12Lợi iacutech Liecircn kết với mạng noron Traacutenh caacutech lập trigravenh tường minh Giảm nhu cầu của chuyecircn gia ANNs thigrave thiacutech nghi với caacutec yếu tố đầu vagraveo thay đổi Khocircng cần thiết cho cơ sở tri thức tinh chế ANNs coacute tiacutenh động vagrave cải thiện với việc sử dụng Coacute khả năng xử lyacute dữ liệu khocircng chiacutenh xaacutec hoặc khocircng đầy đủ Cho pheacutep tổng quaacutet hoacutea từ thocircng tin cụ thể Cho pheacutep thu thập cảm giaacutec thocircng thường vagraveo miền giải quyết vấn đề
13Hạn chế của việc liecircn kết với mạng noron ANNs khocircng thể giải thiacutech được suy luận Bản chất hộp đen thường khiến cho vấn đề traacutech nhiệm vagrave độ tin cậy phaacutet
sinh lagrave khoacute khăn Lặp đi lặp lại quaacute trigravenh huấn luyện rất tốn thời gian Nguồn lực caacutec nhagrave phacircn tiacutech vagrave thiết kế coacute tay nghề cao vẫn lagrave đaacuteng lo
ngại Cocircng nghệ ANN thuacutec đẩy hạn chế của phần cứng hiện tại ANN yecircu cầu phải coacute sự tin tưởng ở đầu ra
14Giới thiệu về thuật toaacuten di truyền Cũng như mạng lưới thần kinh caacutec thuật toaacuten di truyền được dựa trecircn lyacute
thuyết sinh học Thuật toaacuten di truyền tigravem thấy nguồn gốc của chuacuteng trong caacutec lyacute thuyết
tiến hoacutea của chọn lọc tự nhiecircn vagrave thiacutech ứng với biến đổi khiacute hậu Kết quả thuật toaacuten di truyền lagrave từ giao phối 2 caacute thể trong quần thế để tạo
ra con caacutei đocirci khi tốt hơn so với bậc cha mẹ của chuacuteng 15Caacutec thagravenh phần cơ bản của thuật toaacuten di truyền
Toaacuten tử chọn lọc Caacutec caacute thể tốt được chọn lọc để đưa vagraveo thế hệ sau Sự chọn lọc nagravey căn cứ vagraveo độ thiacutech nghi với mocirci trường của mỗi caacute thể
Toaacuten tử lai gheacutep (crossover) Hai caacute thể cha vagrave mẹ trao đổi caacutec gen với nhau để tạo ra caacute thể con
Toaacuten tử đột biến (mutation) Một caacute thể thay đổi một số gen để biến đổi thagravenh một caacute thể mớiTất cả caacutec toaacuten tử trecircn khi thực hiện đều mang tiacutenh ngẫu nhiecircn
16Quaacute trigravenh cơ bản của một thuật toaacuten di truyền Khởi tạo
Đaacutenh giaacute quần thể
Lựa chọn NST thiacutech hợp nhất vagrave loại bỏ NST yếu nhất
Quy trigravenh giao nhau vagrave cải thiện quần thể
đột biến tiến trigravenh để khaacutem phaacute ra NST mới
17Ưu nhược điểm của việc kết hợp với thuật toaacuten di truyền Kiacutech thước quần thể lagrave 1 yếu tố quan trọng trong tốc độ của việc tigravem
kiếmnhưng noacute tương đối dễ dagraveng để dự đoaacuten tốc độ nagravey Giao nhau hoặc đột biến lagrave khocircng necircn đc sử dụng quaacute thường xuyecircn Luocircn coacute được iacutet nhất 1 giải phaacutep hợp lyacute Necircn coacute thể aacutep dụng chuacuteng cho caacutec vấn đề magrave chuacuteng ta khocircng coacute hướng
về caacutech giải quyết Sức mạnh của thuật toaacuten xuất phaacutet từ khaacutei niệm đơn giảnkhocircng phải từ
một thủ tục thuật toaacuten phức tạp 18Tương lai của học maacutey
Mạng lưới thần kinh nhacircn tạo vượt quaacute năng lực của con người trong caacutec trường hợp bị cocirc lập
Về mặt lyacute thuyếtmột maacutey tiacutenh coacute thể xử lyacute dũ liệu nhanh hơn hagraveng triệu lần so với 1 con người
May mắn thay cho chuacuteng tacon người tốt hơn nhiều khi magrave coacute được dữ liệumaacutey tiacutenh khocircng coacute 1 số thứ như lagrave 5 giaacutec quan
CHƯƠNG 10 KHO DỮ LIỆU
1 Kho dữ liệu Kho dữ liệu lagrave tuyển tập caacutec cơ sở dữ liệu tiacutech hợp hướng chủ đề được
thiết kế để trợ giuacutep cho một hệ hỗ trợ quyết định
Theo John Ladley Cocircng nghệ kho dữ liệu lagrave tập caacutec phương phaacutep kỹ thuật vagrave caacutec cocircng cụ coacute thể kết hợp hỗ trợ nhau để cung cấp thocircng tin cho người sử dụng trecircn cơ sở tiacutech hợp từ nhiều nguồn dữ liệu nhiều mocirci trường khaacutec nhau
Kho dữ liệu thường rất lớn tới hagraveng trăm GB hay thậm chiacute hagraveng Terabyte
2 Kho dữ liệu vận hagravenh (ODS) Một kho dữ liệu vận hagravenh Aacutep dụng kỹ thuật kho dữ liệu vagraveo caacutec hệ xử
lyacute giao taacutec lưu trữ dữ liệu cho một ứng dụng đặc thugrave Noacute đưa vagraveo kho dữ liệu một dograveng caacutec dữ liệu thocirc được thiết kế
3 So saacutenh
Kho dữ liệu vận hagravenh Kho dữ liệu
Dữ liệu theo chủ đề Dữ liệu theo chủ đề
Dữ liệu tiacutech hợp Dữ liệu tiacutech hợp
Dữ liệu thay đổi Dữ liệu khocircng thay đổi
Dữ liệu được cập nhật khi thay đổi
Dữ liệu giữ nguyecircn
Chỉ coacute dữ liệu hiện tạiDữliệu hiện tại vagrave dữ liệu lịch sử
Chu kỳ lagravem tươi dữ liệu ngắn Chu kỳ lagravem tươi dữ liệu dagravei
Chỉ coacute dữ liệu chi tiết Dữ liệu chi tiết vagrave dữ liệu tổng kết
Dugraveng cho caacutec quyết định ngắn hạn
Dugraveng cho hoạch định dagravei hạn
4 Kho dữ liệu cục bộ (Data Mart - DM)
Kho dữ liệu cục bộ lagrave CSDL coacute những đặc điểm giống với kho dữ liệu nhưng với quy mocirc nhỏ hơn vagrave lưu trữ dữ liệu về một lĩnh vực một chuyecircn ngagravenh
Data mart phụ thuộc Chứa những dữ liệu được lấy từ DW vagrave những dữ liệu nagravey sẽ được triacutech lọc vagrave tinh chế tiacutech hợp lại ở mức cao hơn để phục vụ một chủ đề nhất định của Datamart
Data mart độc lập Khocircng giống như Datamart phụ thuộc Data mart độc lập được xacircy dựng trước DW vagrave dữ liệu được trực tiếp lấy từ caacutec nguồn khaacutec nhau
5 Siecircu dữ liệu Metadata lagrave dữ liệu để mocirc tả dữ liệu Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột
một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi Metadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu
6 Mocirci trường kho dữ liệu Hệ thống của tổ chức vagrave kho cung cấp dữ liệu để xacircy dựng kho dữ liệu Trong quaacute trigravenh chuyển dữ liệu từ caacutec nguồn khaacutec nhau dữ liệu coacute thể
được lagravem sạch hoặc chuyển đổi vagrave vigrave thế DW được xem như lagrave một chuẩn cho việc lưu trữ
Đồng thời siecircu dữ liệu được ghi lại Cuối cugraveng DW hoặc siecircu thị coacute thể được sử dụng để tạo ra một kho dữ
liệu ldquocaacute nhacircnrdquo 7 Caacutec đặc điểm của kho dữ liệu
Đặc điểm Mocirc tả
Hướng chủ đề - DL tổ chức theo caacutech thức người dugraveng tham chiếu
Tiacutech hợp - Dữ liệu ldquosạchrdquo loại bỏ tiacutenh thiếu nhất quaacuten
Khocircng thay đổi - DL ldquochỉ đọcrdquo người dugraveng khocircng thay đổi được
Chuỗi thời gian - DL lagrave chuỗi thời gian khocircng phải lagrave trạng thaacutei hiện tại
Được tổng kết - DL vận hagravenhthao taacutec khi cần thiết
được kết hợp lại thagravenh dạng coacute thể dugraveng được cho quyết định
Kiacutech cỡ lớn hơn - Lưu giữ theo chuỗi thời gian tức lagrave giữ lại nhiều DL
Khocircng được chuẩn hoacutea - Coacute thể dư thừa DLSiecircu dữ liệu - Dữ liệu của dữ liệu được lưu trữNguồn dữ liệu - DL vận hagravenh (caacutec hệ sẵn coacute) cugraveng
với caacutec nguồn ngoagravei 8 Kho dữ liệu hướng chủ đề
Hướng chủ để coacute nghĩa lagrave kho dữ liệu được tổ chức xung quanh caacutec chủ đề chiacutenh như khaacutech hagraveng sản phẩm sản xuất Tập trung vagraveo việc mocirc higravenh hoacutea vagrave phacircn tiacutech dữ liệu cho caacutec nhagrave ra quyết định magrave khocircng tập trung vagraveo caacutec xử lyacute thocircng thường Cung cấp cho người dugraveng một khung nhigraven toagraven vẹn đơn giản vagrave đầy đủ về caacutec sự kiện quanh caacutec chủ đề
9 Dữ liệu trong DW được tiacutech hợp Dữ liệu trong kho dữ liệu được xacircy dựng bằng caacutech tổng hợp dữ liệu từ
nhiều nguồn khaacutec nhau vagrave caacutec nguồn coacute tổ chức khaacutec nhau Cơ sở dữ liệu caacutec file excel caacutec flat file hoặc caacutec raw file Khi đưa vagraveo kho dữ liệu caacutec dữ liệu được lagravem sạch vagrave tiacutech hợp dữ liệu nhằm đảm bảo tiacutenh nhất quaacuten của dữ liệu
10Kiến truacutec kho dữ liệu Tầng cơ sở dữ liệu hoạt động Tầng truy xuất thocircng tin Tầng truy xuất dữ liệu Tầng siecircu dữ liệu Tầng quản lyacute tiến trigravenh Tầng thocircng điệp của ứng dụng Tầng vật liacute của kho dữ liệu Tầng trigravenh diễn dữ liệu
11Higravenh trạng kho dữ liệu Kho dữ liệu ảo - người dugraveng cuối coacute thể truy cập trực tiếp đến kho dữ liệu
sử dụng caacutec cocircng cụ cho pheacutep ở tầng truy xuất dữ liệu Kho dữ liệu trung tacircm-1 cơ sở dữ liệu vật lyacute chứa tất cả dữ liệu cho một
vugraveng chuyecircn dụng nagraveo đoacute
Kho dữ liệu phacircn taacuten- Thagravenh phần được phacircn taacuten qua nhiều hệ cơ sở dữ liệu vật lyacute
12METADATA- Siecircu dữ liệu Định nghĩa Siecircu dữ liệu lagrave dữ liệu về dữ liệu Lagrave 1 lưu trữ dugraveng để
Miecircu tả kho dữ liệu tổng thể Nhận dạng kiểu kho dữ liệu Quản liacute quaacute trigravenh tiacutech hợp dữ liệu Quản liacute quaacute trigravenh cập nhật kho dữ liệu Quản liacute bảo mật
Lagrave chigravea khoacutea quyết định sự thagravenh cocircng của kho dữ liệu luocircn được thay đổi vagrave cập nhật theo sự phaacutet triển của kho dữ liệu
Dugraveng để quản liacute điều khiển kho dữ liệu Sự ra đời của kho dữ liệu như 1 cấu truacutec hỗ trợ ra quyết định siecircu dữ liệu
được xem như nguồn tagravei nguyecircn dữ liệu Siecircu dữ liệu lagrave trừu tượng Chuacuteng lagrave dữ liệu bậc cao cung cấp mocirc tả ngắn
gọn caacutec dữ liệu bậc thấp hơn 13Hoạt động của Siecircu dữ liệu
Siecircu dữ liệu rất cần thiết trong việc chuyển hoacutea thocircng tin trở thagravenh tri thức Lagrave chigravea khoacutea giuacutep chuacuteng ta xử lyacute được dữ liệu thocirc Viacute dụ một dograveng dữ liệu baacuten hagraveng 1023 K596 11121 agraveNoacute sẽ khocircng coacute nghĩa gigrave cho đến khi chuacuteng ta đưa vagraveo siecircu dữ liệu (thư
mục chứa dữ liệu) agrave cửa hagraveng 1023 sản phẩm K596 vagrave số tiền baacuten được lagrave 11121 đocirc la
14Sự cần thiết phải nhất quaacuten trong kho dữ liệu Kho dữ liệu được xacircy dựng cho lợi iacutech của những nhagrave phacircn tiacutech kinh
doanh caacutec nhagrave quản trị cho tất cả caacutec khu vực chức năng Trong cơ sở dữ liệu riecircng caacutec khu vực khaacutec nhau coacute thể định nghĩa vagrave lưu
trữ dữ liệu thocircng qua phiecircn bản của chiacutenh noacute Khi dữ liệu được lấy từ những vugraveng khaacutec nhau đoacute vagrave được đặt vagraveo kho dữ
liệu Việc chuyển đổi vagrave lagravem sạch caacutec tiến trigravenh sẽ đảm bảo noacute lagrave duy nhất được tiacutech hợp tại một mức của tổ chức
15Ragrave soaacutet lại dữ liệu ndash Thực thi siecircu dữ liệu
Bất kể cấu truacutec tự nhiecircn của 1 cacircu truy vấn thế nagraveo thigrave caacutec thagravenh phần của siecircu dữ liệu rất quan trọng đối với người ra quyết định
Bảng thuộc tiacutenh khoacutea được lưu trữ bởi kho dữ liệu Tập hợp dữ liệu được lấy từ đacircu Những chuyển đổi nagraveo được thực thi với việc lagravem sạch
16Siecircu dữ liệu lagrave gigrave Metadata - lagrave thocircng tin mocirc tả nội dung của cơ sở dữ liệu (CSDL) Metadata baacuteo cho người dugraveng biết thời gian cập nhật sau cugraveng của dữ liệu
định dạng vagrave mục điacutech sử dụng của noacute Những thocircng tin nagravey coacute thể hướng dẫn người dugraveng duyệt qua CSDL vagrave
giuacutep họ hiểu được yacute nghĩa vagrave ngữ cảnh của dữ liệu Trong CSDL metadata lagrave caacutec dạng biểu diễn khaacutec nhau của caacutec đối tượng
trong CSDL Trong CSDL quan hệ metadata lagrave caacutec định nghĩa của bảng cột CSDL
view vagrave nhiều đối tượng khaacutec Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột
một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi -gtMetadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu
Bảng chuyển đổi Ghi lại những chuyển đổi đatilde được thực hiện
Lịch sử thực thi Ghi lại những dữ liệu đatilde được
phacircn tiacutech
Higravenh thaacutei kết nốiGhi lại những dữ liệu được kết nối vagrave tần suất
17Aacutenh xạ thocircng thường của siecircu dữ liệu Bản ghi aacutenh xạ chuyển đổi bao gồm
Định danh của nguồn gốc Chuyển đổi thuộc tiacutenh Chuyển đổi thuộc tiacutenh vật lyacute Matilde hoacutea tham chiếu bảng chuyển đổi Đổi tecircn Đổi khoacutea Gaacuten giaacute trị cho thuộc tiacutenh mặc định Chọn logic cho caacutec nguồn nhiều giaacute trị Đổi thuật toaacuten
18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để
phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai
lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave
tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec
Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm
Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo
19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua
caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau
SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được
Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra
một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức
Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ
Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ
Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech
CHƯƠNG 11 KHAI PHAacute DỮ LIỆU
1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn
ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993
Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng
2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd
1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều
2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP
3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn
4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng
5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server
6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo
7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động
8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời
9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều
10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện
11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech
12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP
3 Xử lyacute phacircn tiacutech trực tuyến OLAP
MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave
dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu
ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave
thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu
HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave
ROLAP4 Khai phaacute dữ liệu
Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh
khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn
Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan
5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp
6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại
Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp
Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec
Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt
Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra
Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh
vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho
Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec
Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm
Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục
Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng
gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp
Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn
Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec
Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper
Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2
Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25
Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước
Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng
Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện
trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp
Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute
độ hỗ trợ ge ngưỡng minsup
độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan
Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn
Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết
Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu
MOLAP ROLAP HOLAP
Lưu trữ dữ liệu cơ sở
Khối Bảng quan hệ Bảng quan hệ
Lưu trữ thocircng tin tổng hợp
Khối Bảng quan hệ Khối
Hiệu suất thực hiện truy vấn
Nhanh nhất Chậm nhất Nhanh
Tiecircu thụ khocircng gian lưu trữ
Nhiều Thấp Trung bigravenh
Chi phiacute bảo trigrave Cao Thấp Trung bigravenh
phương phaacutep khai mỏ dữ liệu (data mining)bull Hầu hết caacutec hệ thống phacircn tiacutech đa chiều được nhuacuteng trong caacutec hệ xử lyacute phacircn tiacutechtrực tuyến (HXLPTTT ndash online analytic processing - OLAP)bull Mục tiecircu của XLPTTT nắm bắt cấu truacutec của dữ liệu thực để hỗ trợ ra quyết địnhbull Trong HHTQĐ coacute sự gắn nối tự nhiecircn giữa mocirc higravenh hoacutea dữ liệu mocirc higravenh hoacutea kyacutehiệu vagrave caacutec khiacutea cạnh của phacircn tiacutech ldquowhat-ifrdquobull Caacutec baacuteo caacuteo của HXLPTTT đều coacute tiacutenh tương taacutec dễ khai thaacutec sử dụng đặc biệtphugrave hợp cho caacutec baacuteo caacuteo về chỉ số hiệu năng chủ yếu (key performance indicators- KPI) baacuteo caacuteo về đo lường hiệu năng kinh doanh bull Thế hệ hiện tại của HXLPTTT vagrave hệ khai mỏ dữ liệu (data mining) tiacutech hợp caacutecđặc tiacutenh của hệ thocircng tin latildenh đạo (executive information system ndashEIS- nhiềucaacutech nhigraven dữ liệu chi tiết hoacutea theo nhu cầu) vagrave caacutec hệ đồ họa khaacutec ndash thường coacutegiao diện người dugraveng dạng kiểu WEBbull Caacutec hệ thống như trecircn cograven được gọi lagrave caacutec cocircng cụ triacute tuệ kinh doanh (businessintelligence - BI) vigrave coacute caacutec đặc trưng về mocirc higravenh hoacutea vagrave tối ưu hoacutea nhưng lạitrong suốt đối với ngươigrave dugravengbull Hiện caacutec cocircng cụ được đưa ra bởi caacutec nhagrave cung cấp về CSDL về hoạch định tagraveinguyecircn tổ chức (ERP) về nhagrave kho dữ liệu (data warehouse) về HXLPTTT MOcirc HIgraveNH HOacuteA VAgrave MOcirc PHỎNG TƯƠNG TAacuteC TRỰC QUANbull Iacutech lợi Người ra quyết định tham gia vagraveo quaacute trigravenh phaacutet triển mocirc higravenh vagrave thựcnghiệm mocirc phỏng vigrave vậy sẽ tin tưởng khi sử dụng mocirc higravenhbull Mocirc higravenh hoacutea tương taacutec trực quan (visual interactive modeling - VIM) dugraveng caacutecbiểu diễn đồ họa maacutey tiacutenh để trigravenh bagravey caacutec ảnh hưởng của caacutec quyết định quản lyacutekhaacutec nhau ở một thời điểm (tĩnh) hay tiến triển theo thời gian (động với kỹ thuậthoạt higravenh)bull Mocirc phỏng tương taacutec trực quan (visual interactive simulation - VIS) cho pheacutepngười dugraveng theo dotildei tiến trigravenh xacircy dựng vagrave sử dụng khai thaacutec mocirc higravenh mocirc phỏngdưới dạng hoạt higravenhbull Mocirc higravenh hoacutea tương taacutec trực quan coacute thể kết hợp với tiếp cận triacute tuệ nhacircn tạo đểđưa ra caacutec khả năng mới thay đổi từ xacircy dựng hệ thống dạng đồ họa đến tigravem hiểuvề động học của hệ thốngbull Cần đến caacutec hệ thống maacutey tiacutenh xử lyacute song song tốc độ cao để xacircy dựng caacutec mocircphỏng - phức tạp quy mocirc lớn dạng hoạt higravenh - mang tiacutenh khả thi ở thời gian thực
22Caacutec dạng hệ thống hỗ trợ ra quyết địnhHệ hỗ trợ quyết định nhoacutemRa quyết định nhoacutem giao tiếp vagrave cộng taacutec- Caacutec đặc điểm của cocircng việc nhoacutem+ Một nhoacutem thực hiện một nhiệm vụ thỉnh thoảng ra quyết định thỉnh thoảngkhocircng ra quyết định+ Caacutec thagravenh viecircn trong nhoacutem coacute thể ở những nơi khaacutec nhau
+ Caacutec thagravenh viecircn trong nhoacutem coacute thể lagravem việc ở những thời gian khaacutec nhau+ Caacutec thagravenh viecircn trong nhoacutem coacute thể lagravem việc cugraveng nhau hoặc ở caacutec tổ chức khaacutecnhau+ Nhoacutem coacute thể vĩnh viễn hoặc tạm thời+ Nhoacutem coacute thể ở bất kỳ mức quản lyacute nagraveo hoặc mức thời gian nagraveo+ Coacute sự điều phối (quaacute trigravenh vagrave nhiệm vụ đạt được) hoặc macircu thuẩn trongnhoacutem+ Coacute sự đạt được hoặcvagrave mất maacutet năng suất trong tổ chức+ Nhiệm vụ phải hoagraven thagravenh rất nhanh+ Khocircng thể hoặc quaacute đắt cho tất cả caacutec thagravenh viecircn trong nhoacutem cugraveng hợp ở mộtnơi+ Một số dữ liệu thocircng tin hoặc kiến thức cần thiết nằm ở nhiều nơi một sốkhaacutec ở ngoagravei tổ chức+ Chuyecircn mocircn của caacutec thagravenh viecircn khocircng coacute trong nhoacutem lagrave cần thiết- Caacutec hoạt động vagrave caacutec quaacute trigravenh miecircu tả caacutec cuộc họp+ Cuộc họp lagrave hoạt động chung liecircn quan bởi một nhoacutem người coacute địa vị bằngnhau hoặc gần bằng nhau+ Kết quả của cuộc họp phụ thuộc một phần vagraveo kiến thức yacute kiến caacutec đaacutenh giaacutecủa caacutec thagravenh viecircn+ Kết quả của cuộc họp cũng phụ thuộc vagraveo sự kết hợp của nhoacutem vagrave phụ thuộcvagraveo quaacute trigravenh ra quyết định được sử dụng bởi nhoacutem đoacute+ Giải quyết caacutec yacute kiến khaacutec nhau bởi người coacute quyền hạn hoặc thương lượnghoặc phacircn xửHỗ trợ giao tiếp- Giao tiếp lagrave thagravenh phần quan trọng cho hỗ trợ quyết định Khocircng coacute giao tiếp thigravekhocircng coacute cộng taacutec Những người ra quyết định caacute nhacircn phải giao tiếp với caacutecđồng nghiệp chuyecircn gia cơ quan chiacutenh phủ khaacutech hagraveng đối taacutec kinh doanh hellipHọ cũng cần dữ liệu vagrave thocircng tin (vagrave kiến thức) từ nhiều nơi trecircn thế giới Caacutecnhoacutem ra quyết định phải giao tiếp cộng taacutec vagrave thương lượng trong cocircng việcHầu hết caacutec tổ chức sẽ nhanh trở thagravenh khocircng coacute chức năng nếu khocircng coacute caacutec hệthống giao tiếp Thương mại điện tử coacute thể hiệu quả chỉ qua caacutec kỹ thuật giao tiếphiện đại- Caacutec kỹ thuật thocircng tin hiện đại cung cấp caacutec phương tiện hỗ trợ giao tiếp rẻnhanh coacute khả năng coacute thể tin cậy Nền tảng hỗ trợ giao tiếp lagrave caacutec hệ thống maacuteytiacutenh mạng+ Bắt đầu bằng điện baacuteo điện thoại radio vagrave ti vi+ Trong 100 năm chuacuteng ta phaacutet triển maacutey fax thư điện tử chương trigravenh chatnhoacutem tin tức hệ thống hội nghị truyền higravenh Hầu hết caacutec kỹ thuật nagravey đềuhoạt động trecircn internet+ Sự phaacutet triển giao tiếp sau cugraveng lagrave hệ thống họp điện tử caacutec dịch vụ vagrave hệ
thống hội nghị điện tử thường sử dụng internet để kết nối caacutec người ra quyếtđịnh- Caacutec thuận lợi aacutep dụng caacutec phương phaacutep giao tiếp cải tiến trong caacutec tổ chức+ Cải tiến năng suất của nhacircn viecircn+ Liecircn quan đến nhiều người ra quyết định chiacutenh+ Khocircng quan tacircm nhiều đến đường biecircn giới địa lyacute+ Tạo nền văn hoacutea hợp taacutec nhất quaacuten+ Cải tiến chất lượng cuộc sống của nhacircn viecircnHỗ trợ cộng taacutec Maacutey tiacutenh hỗ trợ cộng taacutec- Khung thời giannơi chốn+ Sự hiệu quả của kỹ thuật tiacutenh toaacuten cộng taacutec phụ thuộc vagraveo vị triacute của caacutec thagravenhviecircn trong nhoacutem vagrave phụ thuộc vagraveo thời gian chia sẽ thocircng tin gởi vagrave nhận+ Chia sự giao tiếp thagravenh bốn ocirc vagrave tổ chức bốn ocirc dọc theo 2 chiều thời gian vagravenơi chốn1048713 Thời gian Khi gởi vagrave nhận thocircng tin hầu như đồng thời giao tiếp lagrave đồngthời Viacute dụ Điện thoại ti vi vagrave caacutec cuộc họp gặp mặt nhau Giao tiếp bấtđồng bộ xảy ra khi người nhận nhận thocircng tin ở thời điểm khaacutec thời điểmgởi thocircng tin đoacute1048713 Nơi chốn Người gởi vagrave người nhận coacute thể ở cugraveng phograveng hoặc khocircng+ Bốn ocirc lagrave1048713 Cugraveng thời giancugraveng nơi chốn Caacutec thagravenh viecircn gặp mặt nhau cugraveng một luacutecgiống như phograveng quyết định hoặc gặp mặt truyền thống1048713 Cugraveng thời giankhaacutec nơi chốn Caacutec thagravenh viecircn ở caacutec nơi khaacutec nhau nhưnggiao tiếp cugraveng nhau Viacute dụ hội nghị truyền higravenh (videoconferencing)1048713 Khaacutec thời giancugraveng nơi chốn Nhiều người lagravem việc theo ca Ca nagravey để lạithocircng tin cho ca khaacutec1048713 Khaacutec thời giankhaacutec nơi chốn Caacutec thagravenh viecircn ở caacutec nơi khaacutec nhau Caacutecthagravenh viecircn nagravey gởi vagrave nhận thocircng tin ở những lần khaacutec nhau
23Thực thi hệ DSSHệ thống hỗ trợ quản lyacute (MSS) khocircng phải luacutec nagraveo cũng luocircn thagravenh cocircng Nhiều trường hợpthất bại của ES khocircng hoagraven toagraven lagrave lyacute do kỹ thuật Thực thi hệ thống lagrave một quaacute trigravenh liecircn tụcnhằm đảm bảo cho tổ chức chuẩn bị tiếp nhận một hệ thống mới vagrave đưa hệ thống vagraveo sử dụngthagravenh cocircngThực hiện cocircng nghệ hệ thống hỗ trợ quản lyacute lagrave việc phức tạp vigrave caacutec hệ thống nagravey khocircng đơnthuần lagrave hệ thống thocircng tin chỉ thu thập thao taacutec vagrave phacircn phối thocircng tin Magrave xa hơn chuacuteng
liecircn quan tới caacutec cocircng việc coacute thể lagravem thay đổi đaacuteng kể caacutech thức hoạt động của tổ chức Tuyvậy đa số caacutec yếu tố thực thi đều liecircn quan tới hệ thống thocircng tinThực thi MSS lagrave quaacute trigravenh liecircn tục diễn ra trong suốt thời gian phaacutet triển hệ thống từ đề xuấtban đầu đến nghiecircn cứu khả thi thiết kế vagrave phacircn tiacutech hệ thống lập trigravenh huấn luyện chuyểnđổi vagrave lắp đặt Caacutec chuyecircn gia hệ thống thocircng tin thường gọi thực thi lagrave giai đoạn cuối trongvograveng đời hệ thống Định nghĩa thực thi MSS phức tạp hơn vigrave bản chất lặp của sự phaacutet triểncaacutec hệ thống
THỰC THI KHOcircNG HOAgraveN CHỈNHCaacutec quyết định về tiacutenh khả thi thường coacute giả định về lợi iacutech đạt được khi kế hoạch thực thiđược thực hiện hoagraven toagraven Trong thực tế thường chỉ thực hiện 90 thậm chiacute 70 phần trăm sovới phacircn tiacutech khả thi Lyacute do lagrave sự thay đổi tại một nơi trong hệ thống coacute thể ảnh hưởng vagrave coacutethể taacutec động tiecircu cực đến chỗ khaacutec Do vậy cấp quản lyacute coacute thể bỏ những phần trong dự aacuten coacutethể gacircy ra taacutec động xấu Do đoacute dự aacuten sẽ thực hiện iacutet hơn 100 so với dự aacuten kế hoạch Caacutec lyacutedo khaacutec coacute thể lagrave do khấu trừ ngacircn saacutech hoặc vượt chi phiacuteĐAacuteNH GIAacute SỰ THAgraveNH COcircNG CỦA THỰC THI HỆ THỐNGPhải coacute caacutec chỉ số đo lường thigrave mới coacute thể đaacutenh giaacute sự thagravenh cocircng khi thực thi một hệ thốngDickson va Powers (1973) đề ra 5 tiecircu chuẩn độc lậpbull Tỷ lệ thời gian thực hiện dự aacuten với thời gian ước lượngbull Tỷ lệ chi phiacute thực tế vagrave ngacircn saacutech thực hiệnbull Thaacutei độ của cấp quản lyacute đối với hệ thốngbull Nhu cầu thocircng tin của caacutec nhagrave quản lyacute được đaacutep ứng như thế nagraveo qua hệ thốngbull Taacutec động của dự aacuten đối với những hoạt động maacutey tiacutenh trong cocircng tyCaacutec đo lường khaacutec để đaacutenh giaacute thagravenh cocircng của hệ hỗ trợ quản lyacute (MSS)bull Sự sử dụng hệ thống (dự định dugraveng hoặc thực sự dugraveng)bull Thỏa matilden của người dugravengbull Thaacutei độ taacuten thagravenhbull Mức độ hệ thống hoagraven thagravenh caacutec mục tiecircu ban đầubull Phần thưởng đối với tổ chức (giảm chi phiacute tăng doanh thuhellip)bull Tỷ số lợi iacutech chi phiacute
bull Mức độ thể chế hoacutea của MSS trong tổ chứcDo bởi tiacutenh đa dạng của DSS necircn việc đaacutenh giaacute sự thagravenh cocircng của hệ nagravey cũng khoacute khăn tuynhiecircn cũng coacute thể coacute một số yếu tố giuacutep cho DSS thagravenh cocircng như sự tham gia người dugravenghuấn luyện người dugraveng hỗ trợ quản lyacute cấp cao nguồn thocircng tin đặc điểm của những nhiệmvụ coacute liecircn quan (cấu truacutec bất định độ khoacute phụ thuộc)
Chương5Nhoacutem hỗ trợ quyết định vagrave nhoacutemcocircng nghệ phần mềm
51Nhoacutem tạo quyết định
MDM-Holsapple đatilde gợi yacute chuacuteng ta sử dụng giới hạn người tạo quyết định
Một nhoacutem lagrave kết cấu MDM nơi magrave nhiều người ra quyết định hoagraven toagraven tương taacutec
Một đội lagrave kết cấu MDM nơi caacutec thagravenh viecircn tư vấn cho người đưa ra quyết định nhưng khocircng tương taacutec
Một Ủy ban lagrave kết cấu MDM với một người tạo quyết định duy nhất vagrave sự tương taacutec giữa caacutec thagravenh viecircn
Mạng thocircng tin
Mạng lưới baacutenh xe mỗi người tham gia coacute thể giao tiếp với người đưa ra quyết định ở trung tacircm nhưng khocircng phải với người tham gia khaacutecCấu truacutec nagravey lagrave khocircng thỏa matilden tất cả những người tham gia ngoại trừ người ra quyết định
Mạng dacircy chuyền Tham gia chuyển tiếp thocircng tin chỉ để noacute luocircn liền kề nhau trong chuỗi
Thagravenh viecircn cuối cugraveng ko được đaacutep ứng
Mạng vograveng trograven Tương tự như chuỗi nhưng kết thuacutec được kết nối
Mạng kết nối hoagraven toagraven khocircng coacute hạn chế về giao tiếp vagrave tương taacutec giữa caacutec thagravenh viecircnNoacutei chungnoacute đaacutep ứng hầu hết caacutec kết nối của người tham gia nhưng truyền đạt thocircng tin mất nhiều thời gian vagrave coacute nhiều cơ hội xảy ra lỗi
Nhoacutem hagravenh vi vagrave chuẩn mực
MDMs thiết lập caacutec chỉ tiecircu hướng dẫn quaacute trigravenh ra quyết định
Một chuẩn mực quy định cụ thể những gigrave thagravenh viecircn trong nhoacutem dự kiến sẽ lagravem trong những hoagraven cảnh nhất định
Quy tắc gửi coacute thể được thocircng qua viacute dụ đaacutenh giaacute ngang hagraveng hoặc xử phạt
Lagravem thế nagraveo để đưa ra quyết định
Việc chọn lựa magrave trong đoacute việc sử dụng cấu truacutec MDM phải được dựa trecircn một số yếu tố liecircn quan với bối cảnh quyết định
Viacute dụmột cấu truacutec riecircng lẻ sẽ lagravem việc nơi magrave quyết định được cấu truacutec cao vagrave thocircng tin lagrave coacute sẵn
Một ủy ban cơ cấu sẽ lagrave sự lựa chọn khi người ra quyết định khocircng thể đưa ra quyết định một migravenh
52Caacutec vấn đề thường gặp trong nhoacutem
Kiacutech thước Noacutei chung sự nhất triacute vagrave gắn kết giữa caacutec thagravenh viecircn tỉ lệ nghịch với phạm vi nhoacutem Trong nhoacutem lớn rất dễ higravenh thagravenh caacutec nhoacutem nhỏ vagrave hoạt động rời rạc
Tư duy tập thể Trong nhoacutem lớn mọi người coacute xu hướng suy nghĩ đểđạtđược sự nhất triacute necircn khocircng phaacutet huy được sự saacuteng tạo
Caacutec vấn đề về xatilde hội
Xung đột Trong 1 nhoacutem ai cũng muốn migravenh lagrave giỏi nhất necircn dễ dẫn đến xung đột
Ẩn danh(Giấu tecircn) Đacircy lagrave phương phaacutep được sử dụng để kiểm soaacutet xung đột Cho caacutec thagravenh viecircn tham gia ẩn danh
Vấn đề giới tiacutenh Nam vagrave nữ thường coacute những thế mạnh khaacutec nhau điều nagravey coacute thể lagrave sức mạnh trong 1 thiết lập MDM
Đagravem phaacuten vagrave quyết định
Một quyết định coacute thể liecircn quan đến nhiều quan điểm khaacutec nhau vigrave thế cần phải coacute sự đagravem phaacuten
Caacutec thiết kế của cơ chế hỗ trợ cho MDM phải phugrave hợp với caacutec hoạt độngđagravemphaacuten
Những hoạt động nagravey bao gồm việc thu nhận yacute kiến của caacutec thagravenh viecircn 1 caacutech cocircng bằng
53Cocircng nghệ hỗ trợ MDM
Organizational DSSndash 1 hệ thống cung cấp caacutec quyết định hỗ trợ
Group Support Systemndash Cocircng nghệ sử dụng sự hỗ trợ của nhiều becircn tham gia
Group DSS ndash Lagrave 1 hệ thống được thiết kế đặc biệt để hỗ trợ cho MDM
DSS ndash Lagrave 1 hệ thống dưới sự kiểm soaacutet của 1 người quyết định hệ thống nagravey cung cấp 1 bộ cocircng cụ giuacutep phacircn tiacutech hoagraven cảnh đểđưa ra quyết định vagrave nacircng cao hiệu quả của quyết địnhđoacute
53Cocircng nghệ hỗ trợ MDM
Organizational DSSndash 1 hệ thống cung cấp caacutec quyết định hỗ trợ
Group Support Systemndash Cocircng nghệ sử dụng sự hỗ trợ của nhiều becircn tham gia
Group DSS ndash Lagrave 1 hệ thống được thiết kế đặc biệt để hỗ trợ cho MDM
DSS ndash Lagrave 1 hệ thống dưới sự kiểm soaacutet của 1 người quyết định hệ thống nagravey cung cấp 1 bộ cocircng cụ giuacutep phacircn tiacutech hoagraven cảnh đểđưa ra quyết định vagrave nacircng cao hiệu quả của quyết địnhđoacute
Mục tiecircu của cocircng nghệ hỗ trợ MDM
Quy trigravenh hỗ trợ tập trung vagraveo quaacute trigravenh tạo điều kiện thuận lợi cho sự tương taacutec
Cơ chế cấu truacutec quaacute trigravenh chi phối caacutec hoạt động truyền thocircng
Nhiệm vụ hỗ trợ cocircng việc coacute thể chọn lựa tổ chức hoặc lấy thocircng tin
Nhiệm vụ cấu truacutec cocircng việc cho pheacutep truy cập đến kỹ thuật lọc kết hợp phacircn tiacutech kiến thức liecircn quan đến cocircng việc
Caacutec lớp loại cocircng nghệ hỗ trợ MDM
Phacircn loại theo đặc điểm do DeSanctis vagrave Gallupe đưa ra đề xuất một chương trigravenh ba cấp dựa trecircn caacutec tiacutenh năng được cung cấp
Hệ thống cấp 1 Mục điacutech chiacutenh lagrave tạo điều kiện thocircng tin liecircn lạc giữa caacutec thagravenh viecircn
Hệ thống cấp 2 Thiết kế để giảm thiểu rủi ro
Hệ thống cấp 3 Giuacutep điều chỉnh xử lyacute quyết định
Phacircn loại theo cocircng nghệ -Kraemer vagrave King tập trung vagraveo cocircng nghệ aacutep dụng
Cocircng nghệ bảng mạch điện tử
Hội nghị trực tuyến
Mạng lưới tập đoagraven
Trung tacircm thocircng tin
Mocirci trường cộng taacutec
Phograveng quyết định
Nhoacutem phần mềm
Phần mềm được thiết kế để hỗ trợ sự hợp taacutec bao gồm việc thu huacutet vagrave lưu trữ thocircng tin
Caacutec tổ chức dẫn đầu thị trường hiện tại lagrave Lotus Notes and Domino Microsoft Exchange Novell GroupWise and Oracle Office
Caacutec cocircng cụ trong một bộ phần mềm bao gồm người quản lyacute hội nghị (Lotus Sametime) vagrave trao đổi thocircng điệp (Lotus Notes Mail)
Xếp hạng phần mềm cho nhoacutem
Ellis vv đề xuất một hệ thống xếp hạng dựa vagraveo kiểu sự hỗ trợ noacute Cung cấp
Hệ thocircng điệp
Hệ thống hội thảo truyền higravenh
Hệ thống cộng taacutec soạn thảo
Nhoacutem phacircn phối giải phaacutep phần mền
Hệ thống phối hợp
Hệ thống thocircng minh đại diện
Lực lượng điều khiển phaacutet triển phần mềm cho nhoacutem
Một số nhacircn tố chiacutenh bao gồm
Tăng năng suất
Giảm số lượng caacutec cuộc họp
Tăng cường tự động hoacutea caacutec quy trigravenh lagravem việc thường xuyecircn
Cần phối hợp toagraven cầu tốt hơn
Tiacutenh sẵn sagraveng của những mạng lan rộng
Coleman vagrave Khanna liệt kecirc 10 nhacircn tố khaacutec
54Quản lyacute hoạt động MDM (Mobile Device Management - Quản lyacute thiết bị di động)
Một số phương phaacutep phối hợp phổ biến hơnMDM lagrave
Kỹ thuật nhoacutem định danh
Kỹ thuật Delphi
Sự phacircn xử
Hệ thocircng tin dựa trecircn vấn đề
Nemawashi
Kỹ thuật nhoacutem định danh
1-Mỗi người tham gia viết ra những yacute tưởng về những gigrave necircn quyết định
2-Lần lượt mỗi người tham gia trigravenh bagravey yacute tưởng của migravenh được ghi lại trecircn bảng Khocircng thảo luận ở đacircy
3-Sau khi tất cả caacutec yacute tưởng được trigravenh bagravey caacutec đại biểu coacute thể chất vấn những người khaacutec
4-Mỗi người tham gia bỏ phiếu cho mỗi yacute tưởng
Kỹ thuật Delphi
Về cơ bản tương tự như kỹ thuật nhoacutem định danh ngoại trừ những người khocircng bao giờ tham gia cuộc họp
Một cocircng cụ khảo saacutet được sử dụng để thu thập đầu vagraveo ban đầu từ caacutec thagravenh viecircn
Một cuộc khảo saacutet thứ hai được gửi đi với một bản toacutem tắt caacutec kết quả chung
Những bước lặp lại cho đến khi đạt được một sự đồng thuận hoặc nhigraven nhận của đa số
Sự phacircn xử(Arbitration )
Thiacutech hợp nhất khi caacutec thagravenh viecircn của MDM đại diện cho caacutec yếu tố đối lập
Những người tham gia đồng yacute rằng nếu lựa chọn thay thế hai becircn thỏa thuận khocircng được tigravem thấy thigrave một trọng tagravei viecircn becircn ngoagravei sẽ tham gia
Trọng tagravei sau đoacute lựa chọn thay thế ocircng hoặc xeacutet thấy thiacutech hợp nhất
Hệ thống thocircng tin dựa trecircn vấn đề (IBIS)
Lagrave một phương phaacutep lập luận cấu truacutec
Một đại diện cho IBIS lagrave một đồ thị với caacutec nuacutet vagrave caacutec liecircn kết
IBIS bắt đầu với lựa chọn của một nuacutet vấn đề gốc sau đoacute caacutec nuacutet vị triacute khaacutec nhau được liecircn kết với nuacutet gốc
Caacutec nuacutet vị triacute nagravey sau đoacute được đaacutenh giaacute dựa trecircn những lập luận gắn liền với chuacuteng
Nemawashi (được sử dụng rộng ratildei tại Nhật Bản)
1-Một hoặc nhiều thagravenh viecircn của MDM được chỉ định lagrave điều phối viecircnCaacutec điều phối viecircn sau đoacute chọn người tham gia cograven lại
2-Điều phối viecircn xacircy dựng một tổng hợp caacutec sự lựa chọn vagrave sau đoacute caacutec chuyecircn gia đaacutenh giaacute caacutec lựa chọn
3-Điều phối viecircn lựa chọn một sự lựa chọn dựa trecircn kết quả ở trecircn(ở 2)
4-Sự thay thế được luacircn chuyển điều phối viecircn tigravem kiếm sự đồng thuận thocircng qua sự thuyết phục vagrave đagravem phaacuten
5-Nếu đạt được sự đồng thuận điều phối viecircn cho lưu thocircng một tagravei liệu magrave mỗi thagravenh viecircn MDM để lại dấu hiệu trecircn đoacute
55Nơi lagravem việc ảo
Nhiều tổ chức trecircn toagraven thế giới kinh doanh bất động sản cho cocircng nghệ hợp taacutec
Cocircng việc được trở thagravenh một điều bạn lagravem hơn lagrave một nơi bạn đi
Những thay đổi lớn nhất mang lại bởi nơi lagravem việc ảo coacute thể lagrave về văn hoaacute hay xatilde hội hơn lagrave về cocircng nghệ
Chương 6 Hệ thống thocircng tin điều hagravenh
61 Yacute nghĩa của EIS- Hệ thống thocircng tin điều hagravenh
- EIS lagrave một dạng đặc biệt của DSS được thiết kế để hỗ trợ ra quyết định ở cấp cao nhất của một tổ chức
- Lagrave một hệ thống thocircng tin hỗ trợ nhu cầu lập kế hoạch vagrave đaacutenh giaacute của caacutec nhagrave quản lyacute điều hagravenh
- EIS coacute thể giuacutep một CEO coacute được bức tranh tổng thể chiacutenh xaacutec nhất về caacutec hoạt động vagrave một bản toacutem tắt những gigrave magrave đối thủ cạnh tranh đang lagravem
- Caacutec hệ thống nagravey noacutei chung hoạt động dễ dagraveng vagrave trigravenh bagravey thocircng tin theo những caacutech dễ hiểu để việc tiếp thu được nhanh choacuteng (biểu đồ đồ thịhellip)
(Tagravei liệu thecircm EIS lagrave những loại hệ thống lagrave rất phức tạp trong tự nhiecircn Coacute thể noacutei hệ thống nagravey cũng cung cấp cho caacutec nhagrave quản lyacute với caacutec thiết bị coacute khả năng ra quyết định bằng caacutech sử dụng của noacute Hệ thống nagravey hoạt động trong điều kiện như vậy quan trọng như trong caacutec hệ thống khaacutec khocircng hỗ trợ Khả năng lưu trữ dữ liệu nặng lagravem cho noacute lyacute tưởng để được thocircng qua khocircng chỉ bởi caacutec doanh nghiệp lớn magrave cograven bởi caacutec doanh nghiệp nhỏ hơn Nhigraven chung hệ thống nagravey lagrave dagravenh cho caacutec nhacircn viecircn cấp cao hỗ trợ thagravenh thạo trong việc đưa ra caacutec quyết định quan trọng)
Caacutec phiecircn EIS tiecircu biểu- Phiecircn lagravem việc coacute thể bắt đầu với một baacuteo caacuteo về tigravenh higravenh tagravei chiacutenh vagrave kinh
doanh của một cocircng ty caacutec chỉ số hoạt động quan trọng được hiển thị rotilde ragraveng- EIS sẽ cho pheacutep caacutec giaacutem đốc điều hagravenh coacute thể đi sacircu vagraveo dữ liệu từ những con
số bất kỳ magrave noacute hỗ trợ- Việc điều hagravenh coacute thể lựa chọn một mức độ chi tiết ( VD danh số baacuten hagraveng) nếu
như cần điều tra thecircm- Lagrave một phương phaacutep tiếp cận coacute thể giuacutep việc ra quyết định tốt hơn
Những điều magrave EIS ko coacute- EIS khocircng phải lagrave sự thay thế cho caacutec hệ thống dựa trecircn caacutec maacutey tiacutenh khaacutec EIS
thực sự chỉ cung cấp dữ liệu cho caacutec hệ thống nagravey- Noacute khocircng thể biến caacutec bộ hệ điều hagravenh của maacutey tiacutenh thagravenh những ldquochuyecircn viecircn
giỏirdquo- Coacute thể được viacute một caacutech cao hơn như lagrave một trợ lyacute đaacuteng tin cậy coacute thể được gọi
đến bất khi nagraveo vagrave mỗi khi cần thiết
Tagravei liệu thecircm Sự khaacutec nhau giữa EIS vagrave DSS+ EIS thiết kế để hỗ trợ những người điều hagravenh cấp cao giuacutep họ khaacutem phaacute caacutec vấn đề vagrave caacutec cơ hội DSS hỗ trợ những nười phacircn tiacutech cố gắng trả lời cacircu hỏi caacutei gigrave coacute thể lagravem cugraveng với một cơ hội hoặc một vấn đề
Chiều EIS DSSNhững người sử dụng thocircng thường
Duyệt dữ liệu đi xuống truy xuất trạng thaacutei
Hỗ trợ phacircn tiacutech vagrave quyết định
Sự thuacutec đẩy Tiacutenh thiacutech hợp Tiacutenh hiệu quảỨng dụng Queacutet mocirci trường đaacutenh giaacute
hiệu suất nhận dạng caacutec vấn đề vagrave caacutec cơ hội
Caacutec quyết định quản lyacute trecircn caacutec lĩnh vực đa dạng
Hỗ trợ quyết định Caacutec chiacutenh saacutech caacutec quyết định khocircng coacute cấu truacutec ở mức cao vagrave hỗ trợ giaacuten tiếp
Hỗ trợ caacutec quyết định lặp lại caacutec quyết định khocircng thể đoaacuten trước ra quyết định khocircng coacute cấu truacutec vagrave baacuten cấu truacutec
Loại thocircng tin Caacutec thocircng tin tin tức thocircng tin becircn ngoagravei về khaacutech hagraveng đối thủ cạnh tranh mocirci trường caacutec baacuteo caacuteo theo yecircu cầu vagrave định thời về caacutec hoạt động becircn trong
Caacutec thocircng tin hỗ trợ caacutec tigravenh huống đặc biệt
Sử dụng coacute nguyecircn tắc
Dograve theo vết vagrave điều khiển nhận dạng cơ hội
Hoạch định tổ chức phacircn nhoacutem vagrave điều khiển
Khả năng phugrave hợp với những người sử dụng caacute nhacircn
Thiết kế loại ra quyết định cho mỗi người điều hagravenh caacute nhacircn bằng nhiều lựa chọn đầu ra
Cho pheacutep caacutec đaacutenh giaacute caacute nhacircn caacutec khả năng what-if lựa chọn loại hộp hội thoại
Đồ họa Phải coacute Lagrave một phần quan trọng của nhiều DSS
Thacircn thiện người sử dụng
Phải coacute Phải coacute nếu khocircng coacute người sử dụng trung gian
Xử lyacute thocircng tin Lọc neacuten thocircng tin dograve theo vết dữ liệu vagrave thocircng tin quan trọng
EIS kiacutech thiacutech caacutec cacircu hỏi caacutec cacircu trả lời bằng caacutech sử dụng DSS vagrave phản hồi lại EIS
Hỗ trợ caacutec thocircng tin chi tiết
Truy xuất thường xuyecircn caacutec mức chi tiết của bất kỳ thocircng tin tổng hợp nagraveo (duyệt dữ
Coacute thể coacute trong DSS nhưng khocircng thường
liệu chi tiết)Cơ sở mocirc higravenh Caacutec chức năng coacute sẵn bị hạn
chếLagrave điểm cốt lotildei của DSS
Cấu truacutec Theo người baacuten sản phẩm hoặc theo caacutec chuyecircn gia hệ thống thocircng tin
Theo người sử dụng hoặc caacute nhacircn hoặc caacutec chuyecircn gia từ caacutec trung tacircm thocircng tin hoặc phograveng ban hệ thống thocircng tin
Phần cứng Mainframe caacutec trạm RISC mạng LANs hoặc caacutec hệ thống phacircn bố
Mainframe caacutec trạm RISC caacutec maacutey PC hoặc caacutec hệ thống phacircn bố
Bản chất caacutec goacutei phần mềm
Truy xuất tương taacutec dễ dagraveng đến nhiều cơ sở dữ liệu truy xuất trực tuyến caacutec khả năng DBMS phức tạp caacutec liecircn kết phức tạp
Caacutec khả năng tiacutenh toaacuten lớn caacutec ngocircn ngữ mocirc higravenh mocirc phỏng ứng dụng vagrave caacutec bộ tạo DSS
Bản chất caacutec thocircng tin
Trigravenh bagravey thocircng tin được phaacutet sinh trước về quaacute khứ vagrave hiện tại tạo caacutec thocircng tin mới về quaacute khứ hiện tại tương lai
Tạo thocircng tin mới về quaacute khứ hiện tại tương lai
62 Lịch sử EIS- EIS xuất hiện lần đầu tiecircn tại MIT vagraveo những năm 1970
- Những EIS đầu tiecircn được phaacutet triển bởi caacutec doanh ngiệp lớn sẵn sagraveng chấp nhận rủi ro để đạt được lợi thế cạnh tranh
- Vagraveo những năm 1980 caacutec nhagrave cung cấp đatilde phaacutet triển một số cơ sở khaacutech hagraveng rộng vagrave cocircng nghệ EIS được tiếp tục phaacutet triển cho đến ngagravey nay
(Tagravei liệu thecircm Sử dụng DSSEIS cho phaacutet triển bền vững + Một số nghiecircn cứu đatilde được tiến hagravenh để kiểm tra việc thực hiện của EIS trong khu vực cocircng cộng vagrave chiacutenh phủ caacutec nước tổ chức kể từ khi chuacuteng được phaacutet triển theo định hướng lợi nhuận cho caacutec cocircng ty tư nhacircn (Hasan vagrave Hasan năm 1997) Theo một nghiecircn cứu tiến hagravenh tại Mỹ ở hơn 300 cocircng ty kết quả cho thấy sự khaacutec biệt của EIS giữa tư nhacircn vagrave chiacutenh phủ một số kết quả thuacute vị được phaacutet hiệnViacute dụ khoacute khăn hơn để chuyển tiền từ một tagravei khoản khaacutec trong một EIS của chiacutenh phủ cũng lagrave khoacute khăn hơn để biện giải thiacutech cho những chi phiacute phaacutet triển EIS của chiacutenh phủ Một nghiecircn cứu khaacutec được tiến hagravenh ở Australia
cho thấy rằng EIS cung cấp cho quản lyacute một higravenh ảnh chiacutenh xaacutec hơn về tổ chức thực hiện vagrave cung cấp hỗ trợ cho caacutec lợi iacutech chiến lược cải thiện khocircng chỉ cho caacutec nhagrave quản lyacute nhưng cograven cho phần cograven lại của tổ chức Dựa trecircn caacutec hệ thống được thiết kế cho caacutec cocircng ty tư nhacircn với một caacutech rotilde ragravengxaacutec định mục tiecircu EIS lagrave thiacutech hợp cho caacutec tổ chức cocircng cộng hiện đại nhưng cần phải được linh hoạt hơn vagrave kết thagravenh chugravem một phạm vi rộng hơn khả năng vagrave phương tiện hơn so với khu vực tư nhacircn ban đầu theo định hướng sản phẩm (Hasan vagrave Hasan năm 1997) Điều nagravey coacute thể lagrave do thực tế rằng caacutec hoạt động khu vực cocircng lagrave bắt buộc coacute taacutec động rộng phải đaacutep ứng sự mong đợi duy nhất cocircng cộng thường coacute mục tiecircu mơ hồ vagrave macircu thuẫn iacutet quyền tự chủ vagrave kiểm soaacutet việc ra quyết định vagrave nhacircn viecircn lagrave khoacute khăn hơn (Watson vagrave Carte2000) + Toacutem lại EIS lagrave một khaacutei niệm thagravenh cocircng noacute phaacutet triển qua nhiều năm tuy nhiecircn EIS khắc phục khiếm khuyết của migravenh bằng caacutech tiến hagravenh nghiecircn cứu liecircn tục)
63 Tại sao những người điều hagravenh hagraveng đầu lại khaacutec nhau- Họ lagrave những doanh nghiệp theo định hướng coacute suy nghĩ
- Coacute một khoảng khocircng gian rộng để kiểm soaacutet
- Họ chịu traacutech nhiệm cho việc thiết lập chiacutenh saacutech
- Họ đại diện cho tổ chức mocirci trường becircn ngoagravei
- Hagravenh động của họ tạo ra những kết quả đaacuteng kể về tagravei chiacutenh vagrave con người
Tần số caacutec hoạt động điều hagravenh- Xử lyacute xaacuteo trộn 42
- Hoạt động kinh doanh 32
- Phacircn bổ nguồn lực 17
- Đagravem phaacuten 3
- Những điều khaacutec 6
Handling Disturbances 42
Entrepreneurial Activites 32
Resource Allocation 17
Negotiation 3
Other 6
Những thocircng tin điều hagravenh cần thiết- Quản lyacute xaacuteo trộn coacute thể yecircu cầu sự chuacute yacute xung quanh đồng hồ
- Hoạt động kinh doanh yecircu cầu điều hagravenh để dự đoaacuten những thay đổi trong mocirci trường
- Nhiệm vụ phacircn bổ tagravei nguyecircn yecircu cầu lựa chọn người quản lyacute vagrave caacutec nguồn lực hạn chế được triển khai
- Đagravem phaacuten yecircu cầu cập nhật thocircng tin từng phuacutet để coacute thể xacircy dựng được sự đồng thuận
Caacutec loại thocircng tin điều hagravenh- Hệ thống kế toaacuten coacute liecircn quan đến việc tiacutenh toaacuten thu nhập hoạt động cho caacutec lĩnh
vực cụ thể lagrave quan trọng hơn so với caacutec hệ thống kế toaacuten truyền thocircng- Thocircng tin về thị trường khaacutech hagraveng cung cấp giaacute trị trong việc quyết định chiến
lược- Caacutec thocircng tin cần thiết thường được truyền đi trecircn một số hệ thống maacutey tiacutenh vagrave
nằm trong toagraven tổ chức- Caacutec thocircng tin được sử dụng thường lagrave ngắn hạn vagrave dễ thay đổi
Phương thức để xaacutec định thocircng tin cần thiết
Rockart xaacutec định được năm phương thức cơ bản để xaacutec định thocircng tin cần thiết
- Phương thức dựa trecircn kết quả- Phương thức rỗng- Phương thức chỉ số khoacutea- Phương thức tổng hợp nghiecircn cứu- Phương thức dựa vagraveo nhacircn tố then chốt dẫn đến thagravenh cocircng
64 Thagravenh phần EIS
- Sản phẩm EIS đầu tiecircn được phaacutet triển để sử dụng trecircn maacutey tiacutenh cấu higravenh cao nhưng caacutec sản phẩm hiện nay nhằm mục tiecircu lagrave nền tảng ClientServer
- Những nền tảng linh hoạt hơn coacute thể thiacutech ứng với thay đổi trong tổ chức vagrave cocircng nghệ
- Sử dụng dữ liệu thời gian thực dẫn đến quyết định nhanh hơn nhiều thocircng tin hơn
Thagravenh phần phần cứng- Một EIS khocircng đogravei hỏi coacute phần cứng cụ thể hoặc duy nhất nagraveo- Chigravea khoacutea của vấn đề lagrave để đảm bảo rằng caacutec thagravenh phần của EIS tối ưu hoacutea vagrave
phugrave hợp với tagravei nguyecircn maacutey tiacutenh của tổ chức- Hệ thống nagravey phải được cấu higravenh để caacutec nguồn tagravei nguyecircn phugrave hợp với những
người điều hagravenh chuacuteng
Thagravenh phần phần mềm- Traacutei ngược với phần cứng phần mềm thường được chuyecircn mocircn hoacutea cao cho caacutec
bagravei toaacuten về miền- Sự chuyecircn mocircn hoacutea nagravey thường đạt được bằng caacutech sử dụng thagravenh phần off-the-
shelf cho toagraven bộ EIS vagrave caacutec mocirc-đun tugravey chỉnh để đaacutep ứng nhu cầu cụ thể- Lotus Notes lagrave một viacute dụ điển higravenh Noacute coacute thể được sử dụng một migravenh hoặc coacute
thể phục vụ becircn thứ ba mocirc-đun plug-in
Cocircng nghệ EIS hiện nay
Dobrzeniecki đề xuấtphacircn loạitừng cấptheo bachức năng- Loại 1 sản phẩm bao gồmmột bộ đầy đủcaacutec ứng dụngtừ mộtnhagrave cung cấp- Loại 2 sản phẩm đượcthựchiệnở phần đầu củacaacutecsản phẩmDSS đượcphaacutet triển
bởicugravengmộtnhagrave cung cấp- Loại 3 sản phẩmkết hợp với nhautheo bất kỳ số lượngthuộc sở hữu củacocircng ty
65 Xacircy dựng EIS
- Xacircy dựngmộtEISgiống nhưxacircydựngmột số hệ thống khaacutec củamocirc higravenh hệ thống thocircng tin
- Việcphaacutet triểncấu truacutecnecircn được theo dotildeitừ quaacute trigravenh thiết kế đến quaacute trigravenhthực hiện
- Tuy nhiecircn một dự aacuten phaacutet triển EIScoacute xu hướnglagrave thống nhấtvagraveyecircu cầu hỗ trợ caacutec nhagrave quản lyacute latildenh đạo
- Xacircy dựng một EIScoacute thểphaacutet hiện ra đượccaacutectigravenh huống khoacute khănmagravemột nhagrave phaacutet triển chưabao giờ gặp phải
Mocirc higravenh EIS
Khung phaacutet triển một EIS
- Watson et al đề nghị xacircy dựngkhung với ba thagravenh phần+ Caacutech tiếp cận tập trung vagraveo yếu tốcon người vagrave dữ liệu coacute liecircn quan đến EIS+ Quaacute trigravenh phaacutet triển cần sự linh hoạt vagrave tương taacutec+ Người sử dụng - hệ thống hộp thoại bao gồm một ngocircn ngữ hagravenh động để xử lyacute caacutec lệnh
Lợi iacutech của EIS- Dễ duy trigrave caacutec mục tiecircu coacute tổ chức- Dễ truy xuất thocircng tin- Cho pheacutep người sử dụng nacircng cao hiệu suất hơn
- Tăng chất lượng ra quyết định- Cung cấp sự cải tiến cạnh tranh- Tiết kiệm thời gian của người sử dụng- Tăng khả năng vagrave chất lượng giao tiếp- Cung cấp khả năng điều khiển tốt hơn trong tổ chức- Cho pheacutep tham gia caacutec vấn đề vagrave caacutec cơ hội- Cho pheacutep hoạch định- Cho pheacutep tigravem kiếm nguyecircn nhacircn của một vấn đề- Thảo matilden caacutec yecircu cầu của người điều hagravenh
Hạn chế của EIS vagrave 1 số sai lầm cần traacutenh
- Chi phiacute một cuộc khảo saacutetnăm1991 chothấychi phiacute phaacutet triểntrungbigravenh365000USDvớichi phiacute vận hagravenhhagraveng năm lagrave$200000 (EIS)
- Cocircng nghệ hạn chếEIScần phảiđượctiacutech hợp hoagraven toagravenvagraveokiếntruacuteccủadoanh nghiệphiện tại do đoacute noacutelagrave một thaacutech thứclớn đối vớithiết kế
- Hạn chế tổ chức cơ cấu tổ chứccoacute thể khocircng phugrave hợp
Sự hạn chế về tổ chức- Chương trigravenh nghị sự vagrave thời gian chệch EIS mocirc tả một phần việc thực hiện một
chương trigravenh nghị sự vagrave coacute thể dễ dagraveng đạt được sự tin cậy một caacutech chắc chắn- Đồng bộ hoacutea việc quản lyacute sự tin cậy đuacuteng luacutec đặc biệt baacuteo caacuteo EIS coacute thể phaacute
vỡ sự ổn định thiết lập caacutec chu trigravenh baacuteo caacuteo một caacutech tốt nhất- Sự bất ổn EIS phản ứng nhanh coacute thể gacircy ra việc taacutec động trở lại một caacutech
nhanh choacuteng dẫn đến sự thiếu ổn định trong tổ chức
Sự thất bại lagrave thay thế khocircng thể chấp nhận được- Một số yếu tố lagravem EIS thất bại
+ Thiếu sự hỗ trợ về mặt quản lyacute+ Vấn đề chiacutenh trị+ Thất bại của nhagrave phaacutet triển+ Lỗi về cocircng nghệ+ Giaacute cả+ Thời gian
66 Ra quyết định điều hagravenh trong tương lai vagrave EIS
- Coacute một vagravei điều kiện sẽ được hợp nhất cho việc chuyển đổi cocircng nghệ Trong đoacute một vagravei điều kiện coacute thể dễ dự đoaacuten Hai điều kiện magrave ta coacute thể thấy lagrave+ Phaacutet triển cocircng nghệ maacutey tiacutenh trong việc điều hagravenh sẽ tạo ra sự chuyển đổi được chấp nhận một caacutech dễ dagraveng hơn+ Mở rộng traacutech nhiệm điều hagravenh sẽ mở rộng nhu cầu thocircng tin
Tương lai của EIS- EIS thocircng minh Những tiến bộ trong cocircng nghệ AI sẽ được triển khai trong caacutec
EIS- EIS đa phương tiện Cơ sở dữ liệu đa phương tiện sẽ cho pheacutep tiacutech hợp văn bản
giọng noacutei vagrave higravenh ảnh trong tương lai- EIS thocircng tin Tương lai EIS sẽ mở rộng hơn trong việc sử dụng dữ liệu becircn
ngoagravei doanh nghiệp- EIS kết nối Giao tiếp với băng thocircng rộng cho pheacutep kết nối liecircn thocircng lớn hơn
Chương 7 HỆ CHUYEcircN GIA VAgrave TRIacute TUỆ NHAcircN TẠO
71 Caacutec khaacutei niệm
72 Triacute thocircng minh của triacute tuệ nhacircn tạo
73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia
74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia
75 Lợi iacutech vagrave hạn chế của hệ chuyecircn gia
71 Caacutec khaacutei niệm
Chuyecircn mocircn (Expertise) sự hiểu biết rộng trong 1 lĩnh vực hẹp
Hệ chuyecircn gia (Expert Systems)1 chương trigravenh maacutey tiacutenh sử dụng 1 tập caacutec luật dựa trecircn tri thức của con người để giải quyết caacutec vấn đề đogravei hogravei phải coacute sự chuyecircn mocircn
Một số hệ chuyecircn gia nổi tiếng
DENDRAL (Standford 1960s Edward Feigenbaum)
MYCIN (Standford1970s Edward Shortliffe)
PROSPECTOR (MIT 1979)
Triacute tuệ nhacircn tạo (Artificial Intelligence ndash AI)
Triacute tuệ nhacircn tạo một bộ phacircn của ngagravenh khoa học maacutey tiacutenh quan tacircm đến việc thiết kế caacutec hệ thống maacutey tiacutenh thocircng minh đoacute lagrave caacutec hệ thống đưa ra caacutec đặc điểm magrave từ đoacute chuacuteng ta liecircn hệ với sự thocircng minh trong hagravenh động của con người (Barr vagrave Feigenbaum 1981)
Mục điacutech của AI
Mục điacutech khoa học xaacutec định caacutec gợi yacute để giải thiacutech caacutec loại khaacutec nhau của triacute tuệ thực
Mục điacutech kỹ thuật giải quyết caacutec vấn đề trong thế giới thực
Triacute tuệ nhacircn tạo kế thừa nhiều yacute tưởng quan điểm kỹ thuật từ caacutec ngagravenh khoa học khaacutec
- Triết học
- Logic Toaacuten học
- Tiacutenh toaacuten
- Khoa học tacircm lyacute Khoa học nhận thức
- Sinh học Thần kinh học
- Tiến hoacutea
Caacutec lĩnh vực ứng dụng trong Triacute tuệ nhacircn tạo
Mạng nơ ron thần kinh (Neural Networks)
Tiacutenh toaacuten sự tiến hoacutea
(Evolutionary Computation)
Hệ chuyecircn gia (Expert Systems)
Kỹ thuật xử lyacute tiếng noacutei (Speech Processing)
Kỹ thuật xử lyacute ngocircn ngữ tự nhiecircn
(Natural Language Processing)
Lập kế hoạch (Planning)
Robot (Robotics)
Khoa học higravenh ảnh (Vision)
Caacutec kỹ thuật thocircng dụng dugraveng trong AI
Biểu diễn(Representation)
Học (Learning)
Caacutec luật (Rules)
Tigravem kiếm (Search)
72 Triacute thocircng minh của triacute tuệ nhacircn tạo
Con người suy diễn như thế nagraveo
Phacircn loại (Categorization)
Caacutec quy tắc cụ thể
Heuristics
Kinh nghiệm trước đoacute
Dự tiacutenh trước
Maacutey tiacutenh suy diễn như thế nagraveo
Lập luận dựa trecircn luật IF-THEN mocirc tả tri thức được matilde hoacutea dưới dạng caacutec luật
Caacutec khung (Frames) lagrave caacutec đại diện mocirc tả caacutec tigravenh huống giống nhau lagrave điển higravenh của một vagravei phacircn loại
Lập luận dựa trecircn caacutec trường hợp mocirc phỏng giải phaacutep trước đoacute cho một vấn đề hiện tại
Nhận dạng mẫu phaacutet hiện acircm thanh higravenh dạng hoặc caacutec chuỗi dagravei
Caacutec dạng khaacutec của Triacute tuệ nhacircn tạo
Học maacutey- mạng nơron vagrave giải thuật di truyền
Lập trigravenh tự động ndash lagrave những kỹ thuật tạo ra caacutec chương trigravenh để lagravem 1 nhiệm vụ riecircng biệt (cho pheacutep những người khocircng phải lagrave người lập trigravenh coacute thể lập trigravenh được)
Cuộc sống nhacircn tạo ndash nỗ lực để taacutei tạo caacutec hiện tượng sinh học trong caacutec hệ thống dựa trecircn maacutey tiacutenh
73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia(Expert Systems- ES)
Theo Jackson (1999) Một hệ chuyecircn gia lagrave một chương trigravenh maacutey tiacutenh mocirc tả vagrave suy diễn với tri thức của một vagravei lĩnh vực để giải quyết vấn đề hay đưa ra caacutec lời khuyecircn
Cấu truacutec cơ bản của ES được dựa theo cấu truacutec chung của DSS Sự khaacutec biệt chiacutenh giữa ES vagraveDSS lagrave hệ ES thu thập caacutec kiến thức từ những
chuyecircn gia trong lĩnh vực quan tacircmĐặc trưng của hệ chuyecircn gia Hiệu quả cao Thời gian trả lời thỏa đaacuteng Độ tin cậy cao Dễ hiểu
Giao diện người dugraveng trong ES
Thiết kế giao diện người dugraveng tập trung vagraveo caacutec yếu tố như dễ dagraveng sử dụngcoacute độ tin cậy cao giảm tải những khoacute khăn khi sử dụng
Thiết kế necircn coacute một số tương taacutec (đầu vagraveo kiểm soaacutet vagrave truy vấn)
Cấu tạo giao diện người dugraveng gồm coacute magraven higravenh cảm ứng bagraven phiacutem buacutet saacuteng lệnh thoại caacutec phiacutem chuyecircn dụng
Cơ sở tri thức (Knowledge Base)
Chứa đựng caacutec tri thức cụ thể miền thu được từ caacutec chuyecircn gia miền
Coacute thể chứa caacutec mocirc tả caacutec hagravenh vi giải quyết vấn đề caacutec ragraveng buộc caacutec heuristics
Thagravenh cocircng của một ES dựa trecircn tiacutenh đầy đủ vagrave tiacutenh chiacutenh xaacutec của cơ sở tri thức
Mocirc tơ suy diễn (Inference Engine)
Ở đacircy tri thức được đặt để sử dụng tạo ra caacutec giải phaacutep để giải quyết vấn đề
Mocirc tơ nagravey coacute khả năng thực hiện diễn dịch hoặc suy diễn dựa trecircn caacutec luật hay caacutec caacutec sự kiện
Đồng thời cũng coacute khả năng sử dụng caacutec suy diễn mờ hay khocircng chiacutenh xaacutec dựa trecircn xaacutec suất hay aacutenh xạ mẫu
Vograveng điều khiển suy diễn
1 Aacutenh xạ caacutec luật với caacutec sự kiện đatilde được cho
2 Chọn luật để thực hiện
3 Thực hiện luật bằng caacutech thecircm caacutec sự kiện được suy diễn ra vagraveo bộ nhớ lagravem việc
Chuỗi suy diễn (Chaining)
Suy diễn tiến (forward chaining) maacutey suy diễn bắt đầu từ dữ liệu ban đầu vagrave thực hiện việc suy luận để đưa ra caacutec kết luận cuối cugraveng
Suy diễn lugravei (backward chaining) maacutey suy diễn bắt đầu từ dữ liệu điacutech vagrave tigravem ra tri thức hỗ trợ cho dữ liệu điacutech đoacute
Viacute dụ suy diễn lugravei
R1 Nếu coacute A vagrave B thigrave suy ra coacute D
R2 Nếu coacute B thigrave suy ra coacute C
R3 Nếu coacute C vagrave D thigrave suy ra coacute E
Ta coacute E ta xem trong 3 luật R1 R2 R3 luật nagraveo coacute E ta thấy R3 chứa E đồng thời chứa C vagrave D Xeacutet tiếp trong 2 luật R1 R2 luật nagraveo chứa C vagrave D R2 chứa C R3 chứa D Từ đoacute ta coacute được caacutec tri thức hỗ trợ suy diễn vagrave kết luận lagrave nếu coacute A vagrave B thigrave sẽ coacute E Hay nếu A vagrave B đuacuteng thigrave sẽ coacute E
Viacute dụ suy diễn tiến
Giả sử coacute tập chứa 3 luật sau
R1 Nếu coacute A vagrave B thigrave suy ra coacute D
R2 Nếu coacute B thigrave suy ra coacute C
R3 Nếu coacute C vagrave D thigrave suy ra coacute E
Nếu ta coacute A vagrave B thigrave chuacuteng ta suy ra được D từ R1 vagrave suy ra C từ R2 Với D vagrave C đatilde được suy ra ở trecircn giờ chuacuteng ta suy ra được E từ R3
Viacute dụ thực tế
Giả sử muốn biết magraveu của một con vật nuocirci tecircn lagrave Fred biết rằng noacute kecircu ộp ộp vagrave ăn ruồi
Coacute tập 4 luật ban đầu như sau
R1 Nếu X kecircu ộp ộp vagrave ăn ruồi thigrave X lagrave con ếch
R2 Nếu X kecircu chiecircm chiếp vagrave biết hoacutet thigrave X lagrave con chim
R3 Nếu X lagrave con ếch thigrave X coacute magraveu xanh
R4 Nếu X lagrave con chim thigrave X coacute magraveu vagraveng
74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia
Expert system shells lagrave một tập caacutec goacutei phần mềm vagrave caacutec cocircng cụ dugraveng để phaacutet triển caacutec hệ chuyecircn gia
Những Expert system shells đầu tiecircn thường rất rườm ragrave Mặc dugrave vậy noacute vẫn giuacutep cho người sử dụng sẽ khocircng phải bắt đầu lại từ đầu khi xacircy dựng một hệ chuyecircn gia mới
Những shell hiện đại bao gồm hai mocirc-đun chiacutenh lagrave cocircng cụ xacircy dựng một tập quy tắc vagrave mocirc tơ suy diễn
Xacircy dựng hệ chuyecircn gia
Bước 1 xacircy dựng mocirc higravenh bagravei toaacuten xaacutec định vấn đề nhiệm vụ magrave hệ thống sẽ thực hiện Caacutec dạng bagravei toaacuten cần hệ chuyecircn gia
Bagravei toaacuten diễn giải (InterPretation)
Bagravei toaacuten dự baacuteo (Prediction)
Bagravei toaacuten chuẩn đoaacuten (Diagnose)
Bagravei toaacuten gỡ rối (Debugging)
Bagravei toaacuten thiết kế
Tương tự như một dự aacuten phần mềm để xacircy dựng một hệ chuyecircn gia cần phải coacute caacutec yếu tố về nhacircn lực tagravei nguyecircn vagrave thời gian Những yếu tố nagravey ảnh hưởng đến giaacute thah của một hệ chuyecircn giaTrong phần nagravey cacircu hỏi thường được đặt ra lagrave tại sao cần phải xacircy dựng một hệ chuyecircn giaTrước khi bắt đầu phải xaacute định rotilde bagravei toaacuten đạt ra lagrave jiAi lagrave chuyecircn giaAi lagrave người sử dụng
1 Diễn giải (InterPretation) Nghiecircn cứu 1 vấn đề -gt Dựa trecircn những biểu hiện thuộc tiacutenh đặc trưng becircn ngoagravei -gt Tư vấn
(hoặc đưa ra kết luận hay mocirc tả dễ hiểu từ tập dữ liệu thocirc)
2 Bagravei toaacuten dự baacuteo (Prediction) Coacute thể dự đoaacuten được hagravenh vi kết quả dựa trecircn caacutec hiện tượng -gt dự baacuteo
VD Dự baacuteo thời tiết động đấthellip
3 Bagravei toaacuten chẩn đoaacuten (Diagnoss) Xaacutec định caacutec lỗi caacutec bộ phận hỏng hoacutec của hệ thống dựa trecircn caacutec dữ liệu quan saacutet được
4 Bagravei toaacuten gỡ rối (Debugging) Mocirc tả caacutec phương phaacutep khắc phục hệ thống khi gặp sự cố
5 Bagravei toaacuten thiết kế Lựa chọn cấu higravenh caacutec đối tượng nhằm thoả matilden một số ragraveng buộc nagraveo đoacute
6 Giảng dạy Phần mềm dạy học coacute thể chuẩn đoaacuten vagrave sủa lỗi của học sinh trong quaacute trigravenh học tập
Để xaacutec định đuacuteng bagravei toaacuten magrave chuacuteng ta cần giải quyết thigrave phải trả lời đc một số cacircu hỏi
- cần hệ chuyecircn gia
Bước 2 thu thập tri thức lựa chọn cocircng cụ vagrave aacutep dụng
Trong bước thu thập tri thức vấn đề quan trọng lagrave lựa chọn chuyecircn gia những người magrave sẽ đoacuteng goacutep tri thức cho hệ thống Thocircng thường trong suốt quaacute trigravenh phaacutet triển thigrave chuyecircn gia được xem như một thagravenh viecircn của đội phaacutet triển
Hiện nay coacute rất nhiều cocircng cụ để xacircy dựng một hệ chuyecircn gia Phổ biến nhất lagrave JESS CLIPS vagrave OPS5
Bước 3 Thiết kế cơ sở tri thức thiết kế hệ thốngTri thức được biểu diễn trường minh trong cơ sở tri thức
Caacutec chuyecircn gia vagrave kỹ sư tri thức sẽ đối thoại với nhau bằng caacutec kỹ thuật đối thoại Suy diễn (SD) bảng Mocirc higravenh hoacutea SD quy nạp phacircn loại
Vấn đề bagraveo trigrave vagrave phaacutet triển
Caacutec hệ chuyecircn gia đogravei hỏi phải bảo trigrave vagrave phaacutet triển nhiều hơn so với caacutec hệ thống khaacutec Phải thường xuyecircn bổ sung tri thức mới vagrave thay đổi caacutec tri thức cũ để đổi mới hệ chuyecircn gia
Thu thập vagrave khắc phục lỗi do người sử dụng phaacutet hiện để kịp thời khắc phục những sai soacutet của hệ chuyecircn gia
75 Lợi iacutech vagrave hạn chế của caacutec hệ chuyecircn gia
Một số lợi iacutech chiacutenh
Thời gian trả lời hợp lyacute bằng hoặc nhanh hơn so với chuyecircn gia (người) để đi đến cugraveng một quyết định Hệ chuyecircn gia lagrave một hệ thống thời gian thực (real time system)
Khả năng trả lời với mức độ tinh thocircng bằng hoặc cao hơn so với chuyecircn gia (người) trong cugraveng lĩnh vực
Hệ chuyecircn gia giuacutep cho hiệu quả lagravem việc tăng bằng việc sử dụng tập caacutec luật một caacutech nhanh choacuteng magrave ko bị nhầm lẫn chuyecircn gia lagrave người coacute thể quecircn đi một số tri thức cơ sở lyacute luậ nhưng HCG thigrave ko
Quyết định của một người chuyecircn gia coacute thể bị thay đổi vagrave ko coacute tiacutenh thống nhất như quyết định của một hệ chuyecircn gia tạo ra
Hệ chuyecircn gia giuacutep cho người sử dụng coacute thể trau dồi sự hiểu biết trecircn lĩnh vuej cụ thể magrave noacute giải quyết hỗ trợ người ra quyết định coacute trigravenh độ như 1 chuyecircn gia trong quaacute trigravenh gia quyết định
Kiến thức của rất nhiều chuyecircn gia về một lĩnh vực nagraveo đoacute được đưa vagraveo hệ chuyecircn gia lagravem cho CSTT cuat HCG phong phuacute vagrave rộng lớn hơn rất nhiều
HCG giải thiacutech caacutec bước suy luận một caacutech dễ hiểu nhất quaacuten luacutec nagraveo cũng coacute thể sử dụng ko như chuyecircn gia con người
Hạn chế của caacutec hệ chuyecircn gia
Nhược điểm lớn nhất của hệ chuyecircn gia lagrave những yacute kiến chuyecircn mocircn thường rất khoacute matilde hoacutea vagrave giải neacuten
Hệ chuyecircn gia khocircng coacute khả năng tự học tự cập nhật kiến thức mới như caacutec chuyecircn gia magrave cần phải được matilde hoacutea lại khi noacute được cập nhật
Hệ chuyecircn gia khocircng thể nhận ra được vấn đề khocircng nằm trong miền kiến thức của hệ thống
Chương 8 Tri thức vagrave tiếp nhận
1 Bao gồm caacutec vấn đề
Dữ liệu thực tế đo lường hoặc quan saacutet coacute hoặc khocircng coacute bối cảnh
Thocircng tin dữ liệu được tổng hợp một caacutech hữu iacutech để giải quyết những khoacute khăn trong việc đưa ra quyết định
Tri thức bao gồm caacutec ứng dụng quy tắc thocircng tin hướng dẫn của người ra quyết định
2 Những caacutei nhigraven về tri thức
Đại diện lagravem thế nagraveo để diễn tả tri thức viacute dụ như một quyển saacutech khocircng phải lagrave tri thức nhưng noacute lại lagrave một đại diện của tri thức
Sản xuất tri thức lagrave một tập hơp của hagraveng tồn kho coacute thể được sản xuất cũng như mua lại
Tri thức lagrave 1 trong 6 trạng thaacutei của hệ thống
1Dữ liệu 2Thocircng tin 3Cấu truacutec thocircng tin 4Sự thấu hiểu 5Yacute kiến 6 Quyết định
3 Caacutec loại tri thức Phổ biến mocirc tả dữ liệu thocircng tin thủ tục mọi thứ lagravem như thế nagraveo lập luận chiacutenh saacutech hoặc caacutec quy tắc
4 Thu thập Tri thức hệ chuyecircn gia Hầu hết caacutec phương phaacutep đều bắt đầu với mocirc higravenh của caacutec taacutec vụ trong đoacute
hệ chuyecircn gia được xacircy dựng Trong đoacute mocirc tả về caacutec lĩnh vực được tạo ra Caacutec kỹ sư sử dụng caacutec mocirc higravenh giả thuyết vagrave nhận thức về quaacute trigravenh phacircn
tiacutech để gợi ra caacutech giải quyết vấn đề về tri thức từ caacutec chuyecircn gia
5 Caacutec chiều của thu thập tri thức KE- driven caacutec kỹ sư trao đổi trực tiếp với caacutec chuyecircn gia Expert-driven Caacutec chuyecircn gia trực tiếp đưa chuyecircn mocircn của họ vagraveo hệ
thống maacutey tiacutenh Machine-driven Sử dụng caacutec cocircng cụ suy luận để triacutech xuất tri thức từ một
tập caacutec viacute dụ
6 Kỹ thuật thu thập tri thức Trao đổi gồm 2 loại cơ bản lagrave coacute cấu truacutec(coacute kịch bản) vagrave khocircng coacute cấu
truacutec( đối thoại trực tiếp) Giao thức phacircn tiacutech bằng lời Khi caacutec chuyecircn gia thực hiện một cocircng việc
của họ thigrave một bản ghi về cocircng việc đoacute được thực hiện Caacutec kỹ sư sẽ xacircy dựng mocirc higravenh cho những gigrave được ghi lại trong bản ghi
Phương phaacutep sagraveng lọc caacutec chuyecircn gia so saacutenh caacutec nhoacutem liecircn tiếp trong ba đối tượng vagrave cho biết tại sao nhoacutem thứ hai lại khaacutec nhoacutem thứ ba
7 Thu thập tri thức từ nhiều nguồn Thu thập tri thức từ nhiều nguồn lagrave cần thiết để coacute được đầy đủ caacutec tri thức
cho một vấn đề quan điểm yacute kiến traacutei ngược nhau thường phaacutet sinh Phương phaacutep đồng thuận sẽ giuacutep giải quyết được vấn đề macircu thuẫn Kỹ thuật phacircn tiacutech Meta lagrave kỹ thuật được aacutep dụng trong caacutec trường hợp
khaacutec Caacutech tiếp cận bằng định lượng đogravei hỏi caacutec kỹ sư cần cacircn nhắc yếu tố đầu vagraveo của caacutec chuyecircn gia khaacutec nhau
8 Xaacutec nhận hợp lệ vagrave kiểm tra tri thức Một khi thu thập tri thức noacute phải được đaacutenh giaacute về khả năng sử dụng vagrave độ
chiacutenh xaacutec Hai vấn đề cụ thể lagrave hiệu lực của những kiến thức vagrave kiểm tra việc xacircy dựng cơ sở của tri thức
Cần xaacutec nhận xem liệu hệ thống coacute thể hoạt động ở mức độ tối thiểu khocircng
Xaacutec minh liecircn quan đến việc so saacutenh từng chi tiết kỹ thuật của hệ thống những gigrave đatilde được thực hiện cuối cugraveng
9 Một số caacutec biện phaacutep xaacutec nhận Độ chiacutenh xaacutec Khả năng thiacutech nghi Mức độ đầy đủ Bề rộng Độ sacircu Hiệu lực Tổng quan Chiacutenh xaacutec Hiện thực Độ tin cậy Tiacutenh hữu dụng Mức độ
Chương 9 Học maacutey
1 Logic mờ vagrave ngocircn ngữ mờ(Fuzzy Logic and Linguistic Ambiguity)
Ngocircn ngữ tự nhiecircn gồm những khaacutei niệm mơ hồ vagrave khocircng chiacutenh xaacutectruyền tải ngữ nghĩa thocircng qua tiacutenh xấp xỉkhocircng rotilde ragraveng
Những xấp xỉ nagravey giuacutep con người coacute thể truyền tải hết được yacute nghĩa nhưng maacutey thigrave khocircng hiểu
Lagravem sao biểu diễn caacutec tri thức sử dụng caacutec khaacutei niệm khocircng rotilde ragraveng(mờ) hoặc khocircng chiacutenh xaacutec
2 Khaacutei niệm cơ bản của logic mờ tập mờ lagrave những tập hợp khocircng coacute một giới hạn rotilde Mỗi phần tử của noacute chỉ
chứa một mức độ hagravem liecircn thuộc của từng phần tử Vigrave vậy tập mờ khocircng giống như tập cổ điển Tập mờ coacute thể kết hợp với nhau qua những luật mờ magrave đặc trưng cho những hagravenh động trạng thaacutei vagrave thuộc tiacutenh của logic mờ được tận dụng khi thực hiện một bộ điều khiển mờ
Logic mờ dựa trecircn yacute tưởng mỗi phần tử thuộc vagraveo một tập hợp ở một mức độ nagraveo đấy
Locircgic mờ cho pheacutep độ liecircn thuộc (microA )coacute giaacute trị trong khoảng (01) Locircgic mờ coacute thể được coi lagrave mặt ứng dụng của lyacute thuyết tập mờ để xử lyacute caacutec
giaacute trị trong thế giới thực cho caacutec bagravei toaacuten phức tạp
3 So saacutenh tiacutenh đuacuteng đắn logic mờ vagrave xaacutec suất Xaacutec suất thigrave đề cập đến khả năng xảy ra một biến cố hay một điều gigrave đoacute Logic mờ đề cập đến cấp độ magrave đặc tiacutenh ở hiện tại
o viacute dụ1 người coacute chiều cao 6 feet thigrave coacute cấp độ lagrave 05 về chiều cao
4 Ưu điểm của logic mờ Caacutech tiếp cận rất tự nhiecircnkhocircng phức tạp Coacute thể mocirc higravenh hoacutea caacutec hagravem phi tuyến tugravey yacute phức tạp
Coacute thể tận dụng được kinh nghiệm từ những chuyecircn gia hagraveng đầu trong mọi lĩnh vực
Logic mờ được xacircy dựng dựa trecircn ngocircn ngữ tự nhiecircnNền tảng của logic mờ lagrave dựa trecircn cơ sở giao tiếp của con người
5 Nhược điểm của logic mờ Trong 1 hệ thống phức tạpsử dụng logic mờ coacute thể trở thagravenh trở ngại cho
việc xaacutec thực độ tin cậy của hệ thống Cơ chế lập luận mờ khocircng thể học hỏi từ những lỗi sai
6 Mạng noron nhacircn tạo(ANN) Mạng noron nhacircn tạo lagrave một mocirc phỏng xử lyacute thocircng tinđược nghiecircn cứu ra
từ hệ thống thần kinh của sinh vậtgiống như bộ natildeo để xử lyacute thocircng tin ANNs lagrave chương trigravenh dựa trecircn maacutey tiacutenh đơn giản coacute chức năng lagrave một mocirc
higravenh bagravei toaacuten khocircng gian dựa trecircn thử nghiệm vagrave baacuteo lỗi
7 Học từ kinh nghiệm Tiến trigravenh Một mẫu dữ liệu được biểu diễn như một mạng lưới noronANN ldquodự
đoaacutenrdquo 1 đầu radự đoaacuten được so saacutenh với giaacute trị thực tế hoặc giaacute trị chiacutenh xaacutecNếu đoaacuten được chiacutenh xaacutec thigrave khocircng coacute hagravenh động nagraveo được thực hiện
Nếu dự đoaacuten sai ANN kiểm tra lại vagrave xaacutec định lại thocircng số để điều chỉnh Một mẫu dữ liệu khaacutec được biểu diễn vagrave quaacute trigravenh nagravey được lặp lại
8 Nguyecircn tắc cơ bản của cocircng nghệ nơron Caacutec yếu tố xử lyacute cơ bản trong hệ thống thần kinh của con người lagrave tế bagraveo
thần kinhMạng lưới của tế bagraveo nagravey lagrave liecircn kết với nhau nhận được thocircng tin từ caacutec cảm biến trong mắt taihellip
Thocircng tin nhận được bởi tế bagraveo thần kinh hoặc lagrave sẽ kiacutech thiacutech noacute(sẽ được chuyển qua 1 thocircng điệp dọc theo mạng lưới) hoặc lagrave sẽ ngăn cản noacute(ngăn cản dograveng thocircng tin)
Độ nhạy coacute thể thay đổi qua thời gian hoặc sau khi coacute được kinh nghiệm
9 Cấu truacutec mạng Một ANN gồm 3 lớp cơ bản
Lớp đầu vagraveo nhận dữ liệu Lớp becircn trong hoặc lagrave lớp ẩn xử lyacute dữ liệu Lớp đầu ra chuyển tiếp kết quả cuối cugraveng của mạng
10Mạng nơ ron Thường coacute nhiều đầu vagraveo mỗi đầu vagraveo với mức ảnh hưởng vagrave tầm quan
trọng riecircng của noacute Một đầu vagraveo quan trọng coacute thể được sử dụng để khuếch đại đầu ra caacutec hagravem trạng thaacutei tổng hợp caacutec trọng số của caacutec yếu tố
đầuvagraveo khaacutec nhauvagraveo một giaacute trị duy nhất Caacutec hagravem chuyển giao xử lyacute caacutec giaacute trị trạng thaacutei vagrave tạo đầu ra
11Huấn luyện mạng nơ ron Trong mocirc higravenh coacute giaacutem saacutetANN được đến so saacutenh dự đoaacuten của chiacutenh
noacute với thocircng tin phản hồi coacute chứa caacutec kết quả mong muốn ANN sẽ phải tigravem caacutech thay đổi caacutec tham số becircn trong củamigravenh (caacutec trọng số vagrave caacutec ngưỡng) để tạo necircn một aacutenh xạ coacute khả năng aacutenh xạcaacutec đầu vagraveo thagravenh caacutec đầu ra mong muốn Sự thay đổi nagravey được tiến hagravenh nhờ việc so saacutenh giữa đầu ra thực sự vagrave đầu ra mong muốn
Trong mocirc higravenh khocircng coacute giaacutem saacutetANN nhận được dữ liệu vagraveo nhưng khocircng phải coacute bất kỳ thocircng tin phản hồi về kết quả mong muốn
Phần lớn caacutec ứng dụng nằm trong vugraveng của caacutec bagravei toaacuten ước lượng như mocirc higravenh hoacuteathống kecirc neacuten lọc phacircn cụm
12Lợi iacutech Liecircn kết với mạng noron Traacutenh caacutech lập trigravenh tường minh Giảm nhu cầu của chuyecircn gia ANNs thigrave thiacutech nghi với caacutec yếu tố đầu vagraveo thay đổi Khocircng cần thiết cho cơ sở tri thức tinh chế ANNs coacute tiacutenh động vagrave cải thiện với việc sử dụng Coacute khả năng xử lyacute dữ liệu khocircng chiacutenh xaacutec hoặc khocircng đầy đủ Cho pheacutep tổng quaacutet hoacutea từ thocircng tin cụ thể Cho pheacutep thu thập cảm giaacutec thocircng thường vagraveo miền giải quyết vấn đề
13Hạn chế của việc liecircn kết với mạng noron ANNs khocircng thể giải thiacutech được suy luận Bản chất hộp đen thường khiến cho vấn đề traacutech nhiệm vagrave độ tin cậy phaacutet
sinh lagrave khoacute khăn Lặp đi lặp lại quaacute trigravenh huấn luyện rất tốn thời gian Nguồn lực caacutec nhagrave phacircn tiacutech vagrave thiết kế coacute tay nghề cao vẫn lagrave đaacuteng lo
ngại Cocircng nghệ ANN thuacutec đẩy hạn chế của phần cứng hiện tại ANN yecircu cầu phải coacute sự tin tưởng ở đầu ra
14Giới thiệu về thuật toaacuten di truyền Cũng như mạng lưới thần kinh caacutec thuật toaacuten di truyền được dựa trecircn lyacute
thuyết sinh học Thuật toaacuten di truyền tigravem thấy nguồn gốc của chuacuteng trong caacutec lyacute thuyết
tiến hoacutea của chọn lọc tự nhiecircn vagrave thiacutech ứng với biến đổi khiacute hậu Kết quả thuật toaacuten di truyền lagrave từ giao phối 2 caacute thể trong quần thế để tạo
ra con caacutei đocirci khi tốt hơn so với bậc cha mẹ của chuacuteng 15Caacutec thagravenh phần cơ bản của thuật toaacuten di truyền
Toaacuten tử chọn lọc Caacutec caacute thể tốt được chọn lọc để đưa vagraveo thế hệ sau Sự chọn lọc nagravey căn cứ vagraveo độ thiacutech nghi với mocirci trường của mỗi caacute thể
Toaacuten tử lai gheacutep (crossover) Hai caacute thể cha vagrave mẹ trao đổi caacutec gen với nhau để tạo ra caacute thể con
Toaacuten tử đột biến (mutation) Một caacute thể thay đổi một số gen để biến đổi thagravenh một caacute thể mớiTất cả caacutec toaacuten tử trecircn khi thực hiện đều mang tiacutenh ngẫu nhiecircn
16Quaacute trigravenh cơ bản của một thuật toaacuten di truyền Khởi tạo
Đaacutenh giaacute quần thể
Lựa chọn NST thiacutech hợp nhất vagrave loại bỏ NST yếu nhất
Quy trigravenh giao nhau vagrave cải thiện quần thể
đột biến tiến trigravenh để khaacutem phaacute ra NST mới
17Ưu nhược điểm của việc kết hợp với thuật toaacuten di truyền Kiacutech thước quần thể lagrave 1 yếu tố quan trọng trong tốc độ của việc tigravem
kiếmnhưng noacute tương đối dễ dagraveng để dự đoaacuten tốc độ nagravey Giao nhau hoặc đột biến lagrave khocircng necircn đc sử dụng quaacute thường xuyecircn Luocircn coacute được iacutet nhất 1 giải phaacutep hợp lyacute Necircn coacute thể aacutep dụng chuacuteng cho caacutec vấn đề magrave chuacuteng ta khocircng coacute hướng
về caacutech giải quyết Sức mạnh của thuật toaacuten xuất phaacutet từ khaacutei niệm đơn giảnkhocircng phải từ
một thủ tục thuật toaacuten phức tạp 18Tương lai của học maacutey
Mạng lưới thần kinh nhacircn tạo vượt quaacute năng lực của con người trong caacutec trường hợp bị cocirc lập
Về mặt lyacute thuyếtmột maacutey tiacutenh coacute thể xử lyacute dũ liệu nhanh hơn hagraveng triệu lần so với 1 con người
May mắn thay cho chuacuteng tacon người tốt hơn nhiều khi magrave coacute được dữ liệumaacutey tiacutenh khocircng coacute 1 số thứ như lagrave 5 giaacutec quan
CHƯƠNG 10 KHO DỮ LIỆU
1 Kho dữ liệu Kho dữ liệu lagrave tuyển tập caacutec cơ sở dữ liệu tiacutech hợp hướng chủ đề được
thiết kế để trợ giuacutep cho một hệ hỗ trợ quyết định
Theo John Ladley Cocircng nghệ kho dữ liệu lagrave tập caacutec phương phaacutep kỹ thuật vagrave caacutec cocircng cụ coacute thể kết hợp hỗ trợ nhau để cung cấp thocircng tin cho người sử dụng trecircn cơ sở tiacutech hợp từ nhiều nguồn dữ liệu nhiều mocirci trường khaacutec nhau
Kho dữ liệu thường rất lớn tới hagraveng trăm GB hay thậm chiacute hagraveng Terabyte
2 Kho dữ liệu vận hagravenh (ODS) Một kho dữ liệu vận hagravenh Aacutep dụng kỹ thuật kho dữ liệu vagraveo caacutec hệ xử
lyacute giao taacutec lưu trữ dữ liệu cho một ứng dụng đặc thugrave Noacute đưa vagraveo kho dữ liệu một dograveng caacutec dữ liệu thocirc được thiết kế
3 So saacutenh
Kho dữ liệu vận hagravenh Kho dữ liệu
Dữ liệu theo chủ đề Dữ liệu theo chủ đề
Dữ liệu tiacutech hợp Dữ liệu tiacutech hợp
Dữ liệu thay đổi Dữ liệu khocircng thay đổi
Dữ liệu được cập nhật khi thay đổi
Dữ liệu giữ nguyecircn
Chỉ coacute dữ liệu hiện tạiDữliệu hiện tại vagrave dữ liệu lịch sử
Chu kỳ lagravem tươi dữ liệu ngắn Chu kỳ lagravem tươi dữ liệu dagravei
Chỉ coacute dữ liệu chi tiết Dữ liệu chi tiết vagrave dữ liệu tổng kết
Dugraveng cho caacutec quyết định ngắn hạn
Dugraveng cho hoạch định dagravei hạn
4 Kho dữ liệu cục bộ (Data Mart - DM)
Kho dữ liệu cục bộ lagrave CSDL coacute những đặc điểm giống với kho dữ liệu nhưng với quy mocirc nhỏ hơn vagrave lưu trữ dữ liệu về một lĩnh vực một chuyecircn ngagravenh
Data mart phụ thuộc Chứa những dữ liệu được lấy từ DW vagrave những dữ liệu nagravey sẽ được triacutech lọc vagrave tinh chế tiacutech hợp lại ở mức cao hơn để phục vụ một chủ đề nhất định của Datamart
Data mart độc lập Khocircng giống như Datamart phụ thuộc Data mart độc lập được xacircy dựng trước DW vagrave dữ liệu được trực tiếp lấy từ caacutec nguồn khaacutec nhau
5 Siecircu dữ liệu Metadata lagrave dữ liệu để mocirc tả dữ liệu Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột
một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi Metadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu
6 Mocirci trường kho dữ liệu Hệ thống của tổ chức vagrave kho cung cấp dữ liệu để xacircy dựng kho dữ liệu Trong quaacute trigravenh chuyển dữ liệu từ caacutec nguồn khaacutec nhau dữ liệu coacute thể
được lagravem sạch hoặc chuyển đổi vagrave vigrave thế DW được xem như lagrave một chuẩn cho việc lưu trữ
Đồng thời siecircu dữ liệu được ghi lại Cuối cugraveng DW hoặc siecircu thị coacute thể được sử dụng để tạo ra một kho dữ
liệu ldquocaacute nhacircnrdquo 7 Caacutec đặc điểm của kho dữ liệu
Đặc điểm Mocirc tả
Hướng chủ đề - DL tổ chức theo caacutech thức người dugraveng tham chiếu
Tiacutech hợp - Dữ liệu ldquosạchrdquo loại bỏ tiacutenh thiếu nhất quaacuten
Khocircng thay đổi - DL ldquochỉ đọcrdquo người dugraveng khocircng thay đổi được
Chuỗi thời gian - DL lagrave chuỗi thời gian khocircng phải lagrave trạng thaacutei hiện tại
Được tổng kết - DL vận hagravenhthao taacutec khi cần thiết
được kết hợp lại thagravenh dạng coacute thể dugraveng được cho quyết định
Kiacutech cỡ lớn hơn - Lưu giữ theo chuỗi thời gian tức lagrave giữ lại nhiều DL
Khocircng được chuẩn hoacutea - Coacute thể dư thừa DLSiecircu dữ liệu - Dữ liệu của dữ liệu được lưu trữNguồn dữ liệu - DL vận hagravenh (caacutec hệ sẵn coacute) cugraveng
với caacutec nguồn ngoagravei 8 Kho dữ liệu hướng chủ đề
Hướng chủ để coacute nghĩa lagrave kho dữ liệu được tổ chức xung quanh caacutec chủ đề chiacutenh như khaacutech hagraveng sản phẩm sản xuất Tập trung vagraveo việc mocirc higravenh hoacutea vagrave phacircn tiacutech dữ liệu cho caacutec nhagrave ra quyết định magrave khocircng tập trung vagraveo caacutec xử lyacute thocircng thường Cung cấp cho người dugraveng một khung nhigraven toagraven vẹn đơn giản vagrave đầy đủ về caacutec sự kiện quanh caacutec chủ đề
9 Dữ liệu trong DW được tiacutech hợp Dữ liệu trong kho dữ liệu được xacircy dựng bằng caacutech tổng hợp dữ liệu từ
nhiều nguồn khaacutec nhau vagrave caacutec nguồn coacute tổ chức khaacutec nhau Cơ sở dữ liệu caacutec file excel caacutec flat file hoặc caacutec raw file Khi đưa vagraveo kho dữ liệu caacutec dữ liệu được lagravem sạch vagrave tiacutech hợp dữ liệu nhằm đảm bảo tiacutenh nhất quaacuten của dữ liệu
10Kiến truacutec kho dữ liệu Tầng cơ sở dữ liệu hoạt động Tầng truy xuất thocircng tin Tầng truy xuất dữ liệu Tầng siecircu dữ liệu Tầng quản lyacute tiến trigravenh Tầng thocircng điệp của ứng dụng Tầng vật liacute của kho dữ liệu Tầng trigravenh diễn dữ liệu
11Higravenh trạng kho dữ liệu Kho dữ liệu ảo - người dugraveng cuối coacute thể truy cập trực tiếp đến kho dữ liệu
sử dụng caacutec cocircng cụ cho pheacutep ở tầng truy xuất dữ liệu Kho dữ liệu trung tacircm-1 cơ sở dữ liệu vật lyacute chứa tất cả dữ liệu cho một
vugraveng chuyecircn dụng nagraveo đoacute
Kho dữ liệu phacircn taacuten- Thagravenh phần được phacircn taacuten qua nhiều hệ cơ sở dữ liệu vật lyacute
12METADATA- Siecircu dữ liệu Định nghĩa Siecircu dữ liệu lagrave dữ liệu về dữ liệu Lagrave 1 lưu trữ dugraveng để
Miecircu tả kho dữ liệu tổng thể Nhận dạng kiểu kho dữ liệu Quản liacute quaacute trigravenh tiacutech hợp dữ liệu Quản liacute quaacute trigravenh cập nhật kho dữ liệu Quản liacute bảo mật
Lagrave chigravea khoacutea quyết định sự thagravenh cocircng của kho dữ liệu luocircn được thay đổi vagrave cập nhật theo sự phaacutet triển của kho dữ liệu
Dugraveng để quản liacute điều khiển kho dữ liệu Sự ra đời của kho dữ liệu như 1 cấu truacutec hỗ trợ ra quyết định siecircu dữ liệu
được xem như nguồn tagravei nguyecircn dữ liệu Siecircu dữ liệu lagrave trừu tượng Chuacuteng lagrave dữ liệu bậc cao cung cấp mocirc tả ngắn
gọn caacutec dữ liệu bậc thấp hơn 13Hoạt động của Siecircu dữ liệu
Siecircu dữ liệu rất cần thiết trong việc chuyển hoacutea thocircng tin trở thagravenh tri thức Lagrave chigravea khoacutea giuacutep chuacuteng ta xử lyacute được dữ liệu thocirc Viacute dụ một dograveng dữ liệu baacuten hagraveng 1023 K596 11121 agraveNoacute sẽ khocircng coacute nghĩa gigrave cho đến khi chuacuteng ta đưa vagraveo siecircu dữ liệu (thư
mục chứa dữ liệu) agrave cửa hagraveng 1023 sản phẩm K596 vagrave số tiền baacuten được lagrave 11121 đocirc la
14Sự cần thiết phải nhất quaacuten trong kho dữ liệu Kho dữ liệu được xacircy dựng cho lợi iacutech của những nhagrave phacircn tiacutech kinh
doanh caacutec nhagrave quản trị cho tất cả caacutec khu vực chức năng Trong cơ sở dữ liệu riecircng caacutec khu vực khaacutec nhau coacute thể định nghĩa vagrave lưu
trữ dữ liệu thocircng qua phiecircn bản của chiacutenh noacute Khi dữ liệu được lấy từ những vugraveng khaacutec nhau đoacute vagrave được đặt vagraveo kho dữ
liệu Việc chuyển đổi vagrave lagravem sạch caacutec tiến trigravenh sẽ đảm bảo noacute lagrave duy nhất được tiacutech hợp tại một mức của tổ chức
15Ragrave soaacutet lại dữ liệu ndash Thực thi siecircu dữ liệu
Bất kể cấu truacutec tự nhiecircn của 1 cacircu truy vấn thế nagraveo thigrave caacutec thagravenh phần của siecircu dữ liệu rất quan trọng đối với người ra quyết định
Bảng thuộc tiacutenh khoacutea được lưu trữ bởi kho dữ liệu Tập hợp dữ liệu được lấy từ đacircu Những chuyển đổi nagraveo được thực thi với việc lagravem sạch
16Siecircu dữ liệu lagrave gigrave Metadata - lagrave thocircng tin mocirc tả nội dung của cơ sở dữ liệu (CSDL) Metadata baacuteo cho người dugraveng biết thời gian cập nhật sau cugraveng của dữ liệu
định dạng vagrave mục điacutech sử dụng của noacute Những thocircng tin nagravey coacute thể hướng dẫn người dugraveng duyệt qua CSDL vagrave
giuacutep họ hiểu được yacute nghĩa vagrave ngữ cảnh của dữ liệu Trong CSDL metadata lagrave caacutec dạng biểu diễn khaacutec nhau của caacutec đối tượng
trong CSDL Trong CSDL quan hệ metadata lagrave caacutec định nghĩa của bảng cột CSDL
view vagrave nhiều đối tượng khaacutec Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột
một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi -gtMetadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu
Bảng chuyển đổi Ghi lại những chuyển đổi đatilde được thực hiện
Lịch sử thực thi Ghi lại những dữ liệu đatilde được
phacircn tiacutech
Higravenh thaacutei kết nốiGhi lại những dữ liệu được kết nối vagrave tần suất
17Aacutenh xạ thocircng thường của siecircu dữ liệu Bản ghi aacutenh xạ chuyển đổi bao gồm
Định danh của nguồn gốc Chuyển đổi thuộc tiacutenh Chuyển đổi thuộc tiacutenh vật lyacute Matilde hoacutea tham chiếu bảng chuyển đổi Đổi tecircn Đổi khoacutea Gaacuten giaacute trị cho thuộc tiacutenh mặc định Chọn logic cho caacutec nguồn nhiều giaacute trị Đổi thuật toaacuten
18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để
phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai
lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave
tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec
Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm
Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo
19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua
caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau
SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được
Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra
một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức
Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ
Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ
Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech
CHƯƠNG 11 KHAI PHAacute DỮ LIỆU
1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn
ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993
Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng
2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd
1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều
2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP
3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn
4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng
5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server
6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo
7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động
8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời
9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều
10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện
11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech
12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP
3 Xử lyacute phacircn tiacutech trực tuyến OLAP
MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave
dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu
ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave
thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu
HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave
ROLAP4 Khai phaacute dữ liệu
Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh
khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn
Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan
5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp
6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại
Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp
Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec
Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt
Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra
Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh
vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho
Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec
Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm
Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục
Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng
gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp
Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn
Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec
Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper
Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2
Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25
Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước
Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng
Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện
trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp
Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute
độ hỗ trợ ge ngưỡng minsup
độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan
Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn
Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết
Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu
MOLAP ROLAP HOLAP
Lưu trữ dữ liệu cơ sở
Khối Bảng quan hệ Bảng quan hệ
Lưu trữ thocircng tin tổng hợp
Khối Bảng quan hệ Khối
Hiệu suất thực hiện truy vấn
Nhanh nhất Chậm nhất Nhanh
Tiecircu thụ khocircng gian lưu trữ
Nhiều Thấp Trung bigravenh
Chi phiacute bảo trigrave Cao Thấp Trung bigravenh
+ Caacutec thagravenh viecircn trong nhoacutem coacute thể lagravem việc ở những thời gian khaacutec nhau+ Caacutec thagravenh viecircn trong nhoacutem coacute thể lagravem việc cugraveng nhau hoặc ở caacutec tổ chức khaacutecnhau+ Nhoacutem coacute thể vĩnh viễn hoặc tạm thời+ Nhoacutem coacute thể ở bất kỳ mức quản lyacute nagraveo hoặc mức thời gian nagraveo+ Coacute sự điều phối (quaacute trigravenh vagrave nhiệm vụ đạt được) hoặc macircu thuẩn trongnhoacutem+ Coacute sự đạt được hoặcvagrave mất maacutet năng suất trong tổ chức+ Nhiệm vụ phải hoagraven thagravenh rất nhanh+ Khocircng thể hoặc quaacute đắt cho tất cả caacutec thagravenh viecircn trong nhoacutem cugraveng hợp ở mộtnơi+ Một số dữ liệu thocircng tin hoặc kiến thức cần thiết nằm ở nhiều nơi một sốkhaacutec ở ngoagravei tổ chức+ Chuyecircn mocircn của caacutec thagravenh viecircn khocircng coacute trong nhoacutem lagrave cần thiết- Caacutec hoạt động vagrave caacutec quaacute trigravenh miecircu tả caacutec cuộc họp+ Cuộc họp lagrave hoạt động chung liecircn quan bởi một nhoacutem người coacute địa vị bằngnhau hoặc gần bằng nhau+ Kết quả của cuộc họp phụ thuộc một phần vagraveo kiến thức yacute kiến caacutec đaacutenh giaacutecủa caacutec thagravenh viecircn+ Kết quả của cuộc họp cũng phụ thuộc vagraveo sự kết hợp của nhoacutem vagrave phụ thuộcvagraveo quaacute trigravenh ra quyết định được sử dụng bởi nhoacutem đoacute+ Giải quyết caacutec yacute kiến khaacutec nhau bởi người coacute quyền hạn hoặc thương lượnghoặc phacircn xửHỗ trợ giao tiếp- Giao tiếp lagrave thagravenh phần quan trọng cho hỗ trợ quyết định Khocircng coacute giao tiếp thigravekhocircng coacute cộng taacutec Những người ra quyết định caacute nhacircn phải giao tiếp với caacutecđồng nghiệp chuyecircn gia cơ quan chiacutenh phủ khaacutech hagraveng đối taacutec kinh doanh hellipHọ cũng cần dữ liệu vagrave thocircng tin (vagrave kiến thức) từ nhiều nơi trecircn thế giới Caacutecnhoacutem ra quyết định phải giao tiếp cộng taacutec vagrave thương lượng trong cocircng việcHầu hết caacutec tổ chức sẽ nhanh trở thagravenh khocircng coacute chức năng nếu khocircng coacute caacutec hệthống giao tiếp Thương mại điện tử coacute thể hiệu quả chỉ qua caacutec kỹ thuật giao tiếphiện đại- Caacutec kỹ thuật thocircng tin hiện đại cung cấp caacutec phương tiện hỗ trợ giao tiếp rẻnhanh coacute khả năng coacute thể tin cậy Nền tảng hỗ trợ giao tiếp lagrave caacutec hệ thống maacuteytiacutenh mạng+ Bắt đầu bằng điện baacuteo điện thoại radio vagrave ti vi+ Trong 100 năm chuacuteng ta phaacutet triển maacutey fax thư điện tử chương trigravenh chatnhoacutem tin tức hệ thống hội nghị truyền higravenh Hầu hết caacutec kỹ thuật nagravey đềuhoạt động trecircn internet+ Sự phaacutet triển giao tiếp sau cugraveng lagrave hệ thống họp điện tử caacutec dịch vụ vagrave hệ
thống hội nghị điện tử thường sử dụng internet để kết nối caacutec người ra quyếtđịnh- Caacutec thuận lợi aacutep dụng caacutec phương phaacutep giao tiếp cải tiến trong caacutec tổ chức+ Cải tiến năng suất của nhacircn viecircn+ Liecircn quan đến nhiều người ra quyết định chiacutenh+ Khocircng quan tacircm nhiều đến đường biecircn giới địa lyacute+ Tạo nền văn hoacutea hợp taacutec nhất quaacuten+ Cải tiến chất lượng cuộc sống của nhacircn viecircnHỗ trợ cộng taacutec Maacutey tiacutenh hỗ trợ cộng taacutec- Khung thời giannơi chốn+ Sự hiệu quả của kỹ thuật tiacutenh toaacuten cộng taacutec phụ thuộc vagraveo vị triacute của caacutec thagravenhviecircn trong nhoacutem vagrave phụ thuộc vagraveo thời gian chia sẽ thocircng tin gởi vagrave nhận+ Chia sự giao tiếp thagravenh bốn ocirc vagrave tổ chức bốn ocirc dọc theo 2 chiều thời gian vagravenơi chốn1048713 Thời gian Khi gởi vagrave nhận thocircng tin hầu như đồng thời giao tiếp lagrave đồngthời Viacute dụ Điện thoại ti vi vagrave caacutec cuộc họp gặp mặt nhau Giao tiếp bấtđồng bộ xảy ra khi người nhận nhận thocircng tin ở thời điểm khaacutec thời điểmgởi thocircng tin đoacute1048713 Nơi chốn Người gởi vagrave người nhận coacute thể ở cugraveng phograveng hoặc khocircng+ Bốn ocirc lagrave1048713 Cugraveng thời giancugraveng nơi chốn Caacutec thagravenh viecircn gặp mặt nhau cugraveng một luacutecgiống như phograveng quyết định hoặc gặp mặt truyền thống1048713 Cugraveng thời giankhaacutec nơi chốn Caacutec thagravenh viecircn ở caacutec nơi khaacutec nhau nhưnggiao tiếp cugraveng nhau Viacute dụ hội nghị truyền higravenh (videoconferencing)1048713 Khaacutec thời giancugraveng nơi chốn Nhiều người lagravem việc theo ca Ca nagravey để lạithocircng tin cho ca khaacutec1048713 Khaacutec thời giankhaacutec nơi chốn Caacutec thagravenh viecircn ở caacutec nơi khaacutec nhau Caacutecthagravenh viecircn nagravey gởi vagrave nhận thocircng tin ở những lần khaacutec nhau
23Thực thi hệ DSSHệ thống hỗ trợ quản lyacute (MSS) khocircng phải luacutec nagraveo cũng luocircn thagravenh cocircng Nhiều trường hợpthất bại của ES khocircng hoagraven toagraven lagrave lyacute do kỹ thuật Thực thi hệ thống lagrave một quaacute trigravenh liecircn tụcnhằm đảm bảo cho tổ chức chuẩn bị tiếp nhận một hệ thống mới vagrave đưa hệ thống vagraveo sử dụngthagravenh cocircngThực hiện cocircng nghệ hệ thống hỗ trợ quản lyacute lagrave việc phức tạp vigrave caacutec hệ thống nagravey khocircng đơnthuần lagrave hệ thống thocircng tin chỉ thu thập thao taacutec vagrave phacircn phối thocircng tin Magrave xa hơn chuacuteng
liecircn quan tới caacutec cocircng việc coacute thể lagravem thay đổi đaacuteng kể caacutech thức hoạt động của tổ chức Tuyvậy đa số caacutec yếu tố thực thi đều liecircn quan tới hệ thống thocircng tinThực thi MSS lagrave quaacute trigravenh liecircn tục diễn ra trong suốt thời gian phaacutet triển hệ thống từ đề xuấtban đầu đến nghiecircn cứu khả thi thiết kế vagrave phacircn tiacutech hệ thống lập trigravenh huấn luyện chuyểnđổi vagrave lắp đặt Caacutec chuyecircn gia hệ thống thocircng tin thường gọi thực thi lagrave giai đoạn cuối trongvograveng đời hệ thống Định nghĩa thực thi MSS phức tạp hơn vigrave bản chất lặp của sự phaacutet triểncaacutec hệ thống
THỰC THI KHOcircNG HOAgraveN CHỈNHCaacutec quyết định về tiacutenh khả thi thường coacute giả định về lợi iacutech đạt được khi kế hoạch thực thiđược thực hiện hoagraven toagraven Trong thực tế thường chỉ thực hiện 90 thậm chiacute 70 phần trăm sovới phacircn tiacutech khả thi Lyacute do lagrave sự thay đổi tại một nơi trong hệ thống coacute thể ảnh hưởng vagrave coacutethể taacutec động tiecircu cực đến chỗ khaacutec Do vậy cấp quản lyacute coacute thể bỏ những phần trong dự aacuten coacutethể gacircy ra taacutec động xấu Do đoacute dự aacuten sẽ thực hiện iacutet hơn 100 so với dự aacuten kế hoạch Caacutec lyacutedo khaacutec coacute thể lagrave do khấu trừ ngacircn saacutech hoặc vượt chi phiacuteĐAacuteNH GIAacute SỰ THAgraveNH COcircNG CỦA THỰC THI HỆ THỐNGPhải coacute caacutec chỉ số đo lường thigrave mới coacute thể đaacutenh giaacute sự thagravenh cocircng khi thực thi một hệ thốngDickson va Powers (1973) đề ra 5 tiecircu chuẩn độc lậpbull Tỷ lệ thời gian thực hiện dự aacuten với thời gian ước lượngbull Tỷ lệ chi phiacute thực tế vagrave ngacircn saacutech thực hiệnbull Thaacutei độ của cấp quản lyacute đối với hệ thốngbull Nhu cầu thocircng tin của caacutec nhagrave quản lyacute được đaacutep ứng như thế nagraveo qua hệ thốngbull Taacutec động của dự aacuten đối với những hoạt động maacutey tiacutenh trong cocircng tyCaacutec đo lường khaacutec để đaacutenh giaacute thagravenh cocircng của hệ hỗ trợ quản lyacute (MSS)bull Sự sử dụng hệ thống (dự định dugraveng hoặc thực sự dugraveng)bull Thỏa matilden của người dugravengbull Thaacutei độ taacuten thagravenhbull Mức độ hệ thống hoagraven thagravenh caacutec mục tiecircu ban đầubull Phần thưởng đối với tổ chức (giảm chi phiacute tăng doanh thuhellip)bull Tỷ số lợi iacutech chi phiacute
bull Mức độ thể chế hoacutea của MSS trong tổ chứcDo bởi tiacutenh đa dạng của DSS necircn việc đaacutenh giaacute sự thagravenh cocircng của hệ nagravey cũng khoacute khăn tuynhiecircn cũng coacute thể coacute một số yếu tố giuacutep cho DSS thagravenh cocircng như sự tham gia người dugravenghuấn luyện người dugraveng hỗ trợ quản lyacute cấp cao nguồn thocircng tin đặc điểm của những nhiệmvụ coacute liecircn quan (cấu truacutec bất định độ khoacute phụ thuộc)
Chương5Nhoacutem hỗ trợ quyết định vagrave nhoacutemcocircng nghệ phần mềm
51Nhoacutem tạo quyết định
MDM-Holsapple đatilde gợi yacute chuacuteng ta sử dụng giới hạn người tạo quyết định
Một nhoacutem lagrave kết cấu MDM nơi magrave nhiều người ra quyết định hoagraven toagraven tương taacutec
Một đội lagrave kết cấu MDM nơi caacutec thagravenh viecircn tư vấn cho người đưa ra quyết định nhưng khocircng tương taacutec
Một Ủy ban lagrave kết cấu MDM với một người tạo quyết định duy nhất vagrave sự tương taacutec giữa caacutec thagravenh viecircn
Mạng thocircng tin
Mạng lưới baacutenh xe mỗi người tham gia coacute thể giao tiếp với người đưa ra quyết định ở trung tacircm nhưng khocircng phải với người tham gia khaacutecCấu truacutec nagravey lagrave khocircng thỏa matilden tất cả những người tham gia ngoại trừ người ra quyết định
Mạng dacircy chuyền Tham gia chuyển tiếp thocircng tin chỉ để noacute luocircn liền kề nhau trong chuỗi
Thagravenh viecircn cuối cugraveng ko được đaacutep ứng
Mạng vograveng trograven Tương tự như chuỗi nhưng kết thuacutec được kết nối
Mạng kết nối hoagraven toagraven khocircng coacute hạn chế về giao tiếp vagrave tương taacutec giữa caacutec thagravenh viecircnNoacutei chungnoacute đaacutep ứng hầu hết caacutec kết nối của người tham gia nhưng truyền đạt thocircng tin mất nhiều thời gian vagrave coacute nhiều cơ hội xảy ra lỗi
Nhoacutem hagravenh vi vagrave chuẩn mực
MDMs thiết lập caacutec chỉ tiecircu hướng dẫn quaacute trigravenh ra quyết định
Một chuẩn mực quy định cụ thể những gigrave thagravenh viecircn trong nhoacutem dự kiến sẽ lagravem trong những hoagraven cảnh nhất định
Quy tắc gửi coacute thể được thocircng qua viacute dụ đaacutenh giaacute ngang hagraveng hoặc xử phạt
Lagravem thế nagraveo để đưa ra quyết định
Việc chọn lựa magrave trong đoacute việc sử dụng cấu truacutec MDM phải được dựa trecircn một số yếu tố liecircn quan với bối cảnh quyết định
Viacute dụmột cấu truacutec riecircng lẻ sẽ lagravem việc nơi magrave quyết định được cấu truacutec cao vagrave thocircng tin lagrave coacute sẵn
Một ủy ban cơ cấu sẽ lagrave sự lựa chọn khi người ra quyết định khocircng thể đưa ra quyết định một migravenh
52Caacutec vấn đề thường gặp trong nhoacutem
Kiacutech thước Noacutei chung sự nhất triacute vagrave gắn kết giữa caacutec thagravenh viecircn tỉ lệ nghịch với phạm vi nhoacutem Trong nhoacutem lớn rất dễ higravenh thagravenh caacutec nhoacutem nhỏ vagrave hoạt động rời rạc
Tư duy tập thể Trong nhoacutem lớn mọi người coacute xu hướng suy nghĩ đểđạtđược sự nhất triacute necircn khocircng phaacutet huy được sự saacuteng tạo
Caacutec vấn đề về xatilde hội
Xung đột Trong 1 nhoacutem ai cũng muốn migravenh lagrave giỏi nhất necircn dễ dẫn đến xung đột
Ẩn danh(Giấu tecircn) Đacircy lagrave phương phaacutep được sử dụng để kiểm soaacutet xung đột Cho caacutec thagravenh viecircn tham gia ẩn danh
Vấn đề giới tiacutenh Nam vagrave nữ thường coacute những thế mạnh khaacutec nhau điều nagravey coacute thể lagrave sức mạnh trong 1 thiết lập MDM
Đagravem phaacuten vagrave quyết định
Một quyết định coacute thể liecircn quan đến nhiều quan điểm khaacutec nhau vigrave thế cần phải coacute sự đagravem phaacuten
Caacutec thiết kế của cơ chế hỗ trợ cho MDM phải phugrave hợp với caacutec hoạt độngđagravemphaacuten
Những hoạt động nagravey bao gồm việc thu nhận yacute kiến của caacutec thagravenh viecircn 1 caacutech cocircng bằng
53Cocircng nghệ hỗ trợ MDM
Organizational DSSndash 1 hệ thống cung cấp caacutec quyết định hỗ trợ
Group Support Systemndash Cocircng nghệ sử dụng sự hỗ trợ của nhiều becircn tham gia
Group DSS ndash Lagrave 1 hệ thống được thiết kế đặc biệt để hỗ trợ cho MDM
DSS ndash Lagrave 1 hệ thống dưới sự kiểm soaacutet của 1 người quyết định hệ thống nagravey cung cấp 1 bộ cocircng cụ giuacutep phacircn tiacutech hoagraven cảnh đểđưa ra quyết định vagrave nacircng cao hiệu quả của quyết địnhđoacute
53Cocircng nghệ hỗ trợ MDM
Organizational DSSndash 1 hệ thống cung cấp caacutec quyết định hỗ trợ
Group Support Systemndash Cocircng nghệ sử dụng sự hỗ trợ của nhiều becircn tham gia
Group DSS ndash Lagrave 1 hệ thống được thiết kế đặc biệt để hỗ trợ cho MDM
DSS ndash Lagrave 1 hệ thống dưới sự kiểm soaacutet của 1 người quyết định hệ thống nagravey cung cấp 1 bộ cocircng cụ giuacutep phacircn tiacutech hoagraven cảnh đểđưa ra quyết định vagrave nacircng cao hiệu quả của quyết địnhđoacute
Mục tiecircu của cocircng nghệ hỗ trợ MDM
Quy trigravenh hỗ trợ tập trung vagraveo quaacute trigravenh tạo điều kiện thuận lợi cho sự tương taacutec
Cơ chế cấu truacutec quaacute trigravenh chi phối caacutec hoạt động truyền thocircng
Nhiệm vụ hỗ trợ cocircng việc coacute thể chọn lựa tổ chức hoặc lấy thocircng tin
Nhiệm vụ cấu truacutec cocircng việc cho pheacutep truy cập đến kỹ thuật lọc kết hợp phacircn tiacutech kiến thức liecircn quan đến cocircng việc
Caacutec lớp loại cocircng nghệ hỗ trợ MDM
Phacircn loại theo đặc điểm do DeSanctis vagrave Gallupe đưa ra đề xuất một chương trigravenh ba cấp dựa trecircn caacutec tiacutenh năng được cung cấp
Hệ thống cấp 1 Mục điacutech chiacutenh lagrave tạo điều kiện thocircng tin liecircn lạc giữa caacutec thagravenh viecircn
Hệ thống cấp 2 Thiết kế để giảm thiểu rủi ro
Hệ thống cấp 3 Giuacutep điều chỉnh xử lyacute quyết định
Phacircn loại theo cocircng nghệ -Kraemer vagrave King tập trung vagraveo cocircng nghệ aacutep dụng
Cocircng nghệ bảng mạch điện tử
Hội nghị trực tuyến
Mạng lưới tập đoagraven
Trung tacircm thocircng tin
Mocirci trường cộng taacutec
Phograveng quyết định
Nhoacutem phần mềm
Phần mềm được thiết kế để hỗ trợ sự hợp taacutec bao gồm việc thu huacutet vagrave lưu trữ thocircng tin
Caacutec tổ chức dẫn đầu thị trường hiện tại lagrave Lotus Notes and Domino Microsoft Exchange Novell GroupWise and Oracle Office
Caacutec cocircng cụ trong một bộ phần mềm bao gồm người quản lyacute hội nghị (Lotus Sametime) vagrave trao đổi thocircng điệp (Lotus Notes Mail)
Xếp hạng phần mềm cho nhoacutem
Ellis vv đề xuất một hệ thống xếp hạng dựa vagraveo kiểu sự hỗ trợ noacute Cung cấp
Hệ thocircng điệp
Hệ thống hội thảo truyền higravenh
Hệ thống cộng taacutec soạn thảo
Nhoacutem phacircn phối giải phaacutep phần mền
Hệ thống phối hợp
Hệ thống thocircng minh đại diện
Lực lượng điều khiển phaacutet triển phần mềm cho nhoacutem
Một số nhacircn tố chiacutenh bao gồm
Tăng năng suất
Giảm số lượng caacutec cuộc họp
Tăng cường tự động hoacutea caacutec quy trigravenh lagravem việc thường xuyecircn
Cần phối hợp toagraven cầu tốt hơn
Tiacutenh sẵn sagraveng của những mạng lan rộng
Coleman vagrave Khanna liệt kecirc 10 nhacircn tố khaacutec
54Quản lyacute hoạt động MDM (Mobile Device Management - Quản lyacute thiết bị di động)
Một số phương phaacutep phối hợp phổ biến hơnMDM lagrave
Kỹ thuật nhoacutem định danh
Kỹ thuật Delphi
Sự phacircn xử
Hệ thocircng tin dựa trecircn vấn đề
Nemawashi
Kỹ thuật nhoacutem định danh
1-Mỗi người tham gia viết ra những yacute tưởng về những gigrave necircn quyết định
2-Lần lượt mỗi người tham gia trigravenh bagravey yacute tưởng của migravenh được ghi lại trecircn bảng Khocircng thảo luận ở đacircy
3-Sau khi tất cả caacutec yacute tưởng được trigravenh bagravey caacutec đại biểu coacute thể chất vấn những người khaacutec
4-Mỗi người tham gia bỏ phiếu cho mỗi yacute tưởng
Kỹ thuật Delphi
Về cơ bản tương tự như kỹ thuật nhoacutem định danh ngoại trừ những người khocircng bao giờ tham gia cuộc họp
Một cocircng cụ khảo saacutet được sử dụng để thu thập đầu vagraveo ban đầu từ caacutec thagravenh viecircn
Một cuộc khảo saacutet thứ hai được gửi đi với một bản toacutem tắt caacutec kết quả chung
Những bước lặp lại cho đến khi đạt được một sự đồng thuận hoặc nhigraven nhận của đa số
Sự phacircn xử(Arbitration )
Thiacutech hợp nhất khi caacutec thagravenh viecircn của MDM đại diện cho caacutec yếu tố đối lập
Những người tham gia đồng yacute rằng nếu lựa chọn thay thế hai becircn thỏa thuận khocircng được tigravem thấy thigrave một trọng tagravei viecircn becircn ngoagravei sẽ tham gia
Trọng tagravei sau đoacute lựa chọn thay thế ocircng hoặc xeacutet thấy thiacutech hợp nhất
Hệ thống thocircng tin dựa trecircn vấn đề (IBIS)
Lagrave một phương phaacutep lập luận cấu truacutec
Một đại diện cho IBIS lagrave một đồ thị với caacutec nuacutet vagrave caacutec liecircn kết
IBIS bắt đầu với lựa chọn của một nuacutet vấn đề gốc sau đoacute caacutec nuacutet vị triacute khaacutec nhau được liecircn kết với nuacutet gốc
Caacutec nuacutet vị triacute nagravey sau đoacute được đaacutenh giaacute dựa trecircn những lập luận gắn liền với chuacuteng
Nemawashi (được sử dụng rộng ratildei tại Nhật Bản)
1-Một hoặc nhiều thagravenh viecircn của MDM được chỉ định lagrave điều phối viecircnCaacutec điều phối viecircn sau đoacute chọn người tham gia cograven lại
2-Điều phối viecircn xacircy dựng một tổng hợp caacutec sự lựa chọn vagrave sau đoacute caacutec chuyecircn gia đaacutenh giaacute caacutec lựa chọn
3-Điều phối viecircn lựa chọn một sự lựa chọn dựa trecircn kết quả ở trecircn(ở 2)
4-Sự thay thế được luacircn chuyển điều phối viecircn tigravem kiếm sự đồng thuận thocircng qua sự thuyết phục vagrave đagravem phaacuten
5-Nếu đạt được sự đồng thuận điều phối viecircn cho lưu thocircng một tagravei liệu magrave mỗi thagravenh viecircn MDM để lại dấu hiệu trecircn đoacute
55Nơi lagravem việc ảo
Nhiều tổ chức trecircn toagraven thế giới kinh doanh bất động sản cho cocircng nghệ hợp taacutec
Cocircng việc được trở thagravenh một điều bạn lagravem hơn lagrave một nơi bạn đi
Những thay đổi lớn nhất mang lại bởi nơi lagravem việc ảo coacute thể lagrave về văn hoaacute hay xatilde hội hơn lagrave về cocircng nghệ
Chương 6 Hệ thống thocircng tin điều hagravenh
61 Yacute nghĩa của EIS- Hệ thống thocircng tin điều hagravenh
- EIS lagrave một dạng đặc biệt của DSS được thiết kế để hỗ trợ ra quyết định ở cấp cao nhất của một tổ chức
- Lagrave một hệ thống thocircng tin hỗ trợ nhu cầu lập kế hoạch vagrave đaacutenh giaacute của caacutec nhagrave quản lyacute điều hagravenh
- EIS coacute thể giuacutep một CEO coacute được bức tranh tổng thể chiacutenh xaacutec nhất về caacutec hoạt động vagrave một bản toacutem tắt những gigrave magrave đối thủ cạnh tranh đang lagravem
- Caacutec hệ thống nagravey noacutei chung hoạt động dễ dagraveng vagrave trigravenh bagravey thocircng tin theo những caacutech dễ hiểu để việc tiếp thu được nhanh choacuteng (biểu đồ đồ thịhellip)
(Tagravei liệu thecircm EIS lagrave những loại hệ thống lagrave rất phức tạp trong tự nhiecircn Coacute thể noacutei hệ thống nagravey cũng cung cấp cho caacutec nhagrave quản lyacute với caacutec thiết bị coacute khả năng ra quyết định bằng caacutech sử dụng của noacute Hệ thống nagravey hoạt động trong điều kiện như vậy quan trọng như trong caacutec hệ thống khaacutec khocircng hỗ trợ Khả năng lưu trữ dữ liệu nặng lagravem cho noacute lyacute tưởng để được thocircng qua khocircng chỉ bởi caacutec doanh nghiệp lớn magrave cograven bởi caacutec doanh nghiệp nhỏ hơn Nhigraven chung hệ thống nagravey lagrave dagravenh cho caacutec nhacircn viecircn cấp cao hỗ trợ thagravenh thạo trong việc đưa ra caacutec quyết định quan trọng)
Caacutec phiecircn EIS tiecircu biểu- Phiecircn lagravem việc coacute thể bắt đầu với một baacuteo caacuteo về tigravenh higravenh tagravei chiacutenh vagrave kinh
doanh của một cocircng ty caacutec chỉ số hoạt động quan trọng được hiển thị rotilde ragraveng- EIS sẽ cho pheacutep caacutec giaacutem đốc điều hagravenh coacute thể đi sacircu vagraveo dữ liệu từ những con
số bất kỳ magrave noacute hỗ trợ- Việc điều hagravenh coacute thể lựa chọn một mức độ chi tiết ( VD danh số baacuten hagraveng) nếu
như cần điều tra thecircm- Lagrave một phương phaacutep tiếp cận coacute thể giuacutep việc ra quyết định tốt hơn
Những điều magrave EIS ko coacute- EIS khocircng phải lagrave sự thay thế cho caacutec hệ thống dựa trecircn caacutec maacutey tiacutenh khaacutec EIS
thực sự chỉ cung cấp dữ liệu cho caacutec hệ thống nagravey- Noacute khocircng thể biến caacutec bộ hệ điều hagravenh của maacutey tiacutenh thagravenh những ldquochuyecircn viecircn
giỏirdquo- Coacute thể được viacute một caacutech cao hơn như lagrave một trợ lyacute đaacuteng tin cậy coacute thể được gọi
đến bất khi nagraveo vagrave mỗi khi cần thiết
Tagravei liệu thecircm Sự khaacutec nhau giữa EIS vagrave DSS+ EIS thiết kế để hỗ trợ những người điều hagravenh cấp cao giuacutep họ khaacutem phaacute caacutec vấn đề vagrave caacutec cơ hội DSS hỗ trợ những nười phacircn tiacutech cố gắng trả lời cacircu hỏi caacutei gigrave coacute thể lagravem cugraveng với một cơ hội hoặc một vấn đề
Chiều EIS DSSNhững người sử dụng thocircng thường
Duyệt dữ liệu đi xuống truy xuất trạng thaacutei
Hỗ trợ phacircn tiacutech vagrave quyết định
Sự thuacutec đẩy Tiacutenh thiacutech hợp Tiacutenh hiệu quảỨng dụng Queacutet mocirci trường đaacutenh giaacute
hiệu suất nhận dạng caacutec vấn đề vagrave caacutec cơ hội
Caacutec quyết định quản lyacute trecircn caacutec lĩnh vực đa dạng
Hỗ trợ quyết định Caacutec chiacutenh saacutech caacutec quyết định khocircng coacute cấu truacutec ở mức cao vagrave hỗ trợ giaacuten tiếp
Hỗ trợ caacutec quyết định lặp lại caacutec quyết định khocircng thể đoaacuten trước ra quyết định khocircng coacute cấu truacutec vagrave baacuten cấu truacutec
Loại thocircng tin Caacutec thocircng tin tin tức thocircng tin becircn ngoagravei về khaacutech hagraveng đối thủ cạnh tranh mocirci trường caacutec baacuteo caacuteo theo yecircu cầu vagrave định thời về caacutec hoạt động becircn trong
Caacutec thocircng tin hỗ trợ caacutec tigravenh huống đặc biệt
Sử dụng coacute nguyecircn tắc
Dograve theo vết vagrave điều khiển nhận dạng cơ hội
Hoạch định tổ chức phacircn nhoacutem vagrave điều khiển
Khả năng phugrave hợp với những người sử dụng caacute nhacircn
Thiết kế loại ra quyết định cho mỗi người điều hagravenh caacute nhacircn bằng nhiều lựa chọn đầu ra
Cho pheacutep caacutec đaacutenh giaacute caacute nhacircn caacutec khả năng what-if lựa chọn loại hộp hội thoại
Đồ họa Phải coacute Lagrave một phần quan trọng của nhiều DSS
Thacircn thiện người sử dụng
Phải coacute Phải coacute nếu khocircng coacute người sử dụng trung gian
Xử lyacute thocircng tin Lọc neacuten thocircng tin dograve theo vết dữ liệu vagrave thocircng tin quan trọng
EIS kiacutech thiacutech caacutec cacircu hỏi caacutec cacircu trả lời bằng caacutech sử dụng DSS vagrave phản hồi lại EIS
Hỗ trợ caacutec thocircng tin chi tiết
Truy xuất thường xuyecircn caacutec mức chi tiết của bất kỳ thocircng tin tổng hợp nagraveo (duyệt dữ
Coacute thể coacute trong DSS nhưng khocircng thường
liệu chi tiết)Cơ sở mocirc higravenh Caacutec chức năng coacute sẵn bị hạn
chếLagrave điểm cốt lotildei của DSS
Cấu truacutec Theo người baacuten sản phẩm hoặc theo caacutec chuyecircn gia hệ thống thocircng tin
Theo người sử dụng hoặc caacute nhacircn hoặc caacutec chuyecircn gia từ caacutec trung tacircm thocircng tin hoặc phograveng ban hệ thống thocircng tin
Phần cứng Mainframe caacutec trạm RISC mạng LANs hoặc caacutec hệ thống phacircn bố
Mainframe caacutec trạm RISC caacutec maacutey PC hoặc caacutec hệ thống phacircn bố
Bản chất caacutec goacutei phần mềm
Truy xuất tương taacutec dễ dagraveng đến nhiều cơ sở dữ liệu truy xuất trực tuyến caacutec khả năng DBMS phức tạp caacutec liecircn kết phức tạp
Caacutec khả năng tiacutenh toaacuten lớn caacutec ngocircn ngữ mocirc higravenh mocirc phỏng ứng dụng vagrave caacutec bộ tạo DSS
Bản chất caacutec thocircng tin
Trigravenh bagravey thocircng tin được phaacutet sinh trước về quaacute khứ vagrave hiện tại tạo caacutec thocircng tin mới về quaacute khứ hiện tại tương lai
Tạo thocircng tin mới về quaacute khứ hiện tại tương lai
62 Lịch sử EIS- EIS xuất hiện lần đầu tiecircn tại MIT vagraveo những năm 1970
- Những EIS đầu tiecircn được phaacutet triển bởi caacutec doanh ngiệp lớn sẵn sagraveng chấp nhận rủi ro để đạt được lợi thế cạnh tranh
- Vagraveo những năm 1980 caacutec nhagrave cung cấp đatilde phaacutet triển một số cơ sở khaacutech hagraveng rộng vagrave cocircng nghệ EIS được tiếp tục phaacutet triển cho đến ngagravey nay
(Tagravei liệu thecircm Sử dụng DSSEIS cho phaacutet triển bền vững + Một số nghiecircn cứu đatilde được tiến hagravenh để kiểm tra việc thực hiện của EIS trong khu vực cocircng cộng vagrave chiacutenh phủ caacutec nước tổ chức kể từ khi chuacuteng được phaacutet triển theo định hướng lợi nhuận cho caacutec cocircng ty tư nhacircn (Hasan vagrave Hasan năm 1997) Theo một nghiecircn cứu tiến hagravenh tại Mỹ ở hơn 300 cocircng ty kết quả cho thấy sự khaacutec biệt của EIS giữa tư nhacircn vagrave chiacutenh phủ một số kết quả thuacute vị được phaacutet hiệnViacute dụ khoacute khăn hơn để chuyển tiền từ một tagravei khoản khaacutec trong một EIS của chiacutenh phủ cũng lagrave khoacute khăn hơn để biện giải thiacutech cho những chi phiacute phaacutet triển EIS của chiacutenh phủ Một nghiecircn cứu khaacutec được tiến hagravenh ở Australia
cho thấy rằng EIS cung cấp cho quản lyacute một higravenh ảnh chiacutenh xaacutec hơn về tổ chức thực hiện vagrave cung cấp hỗ trợ cho caacutec lợi iacutech chiến lược cải thiện khocircng chỉ cho caacutec nhagrave quản lyacute nhưng cograven cho phần cograven lại của tổ chức Dựa trecircn caacutec hệ thống được thiết kế cho caacutec cocircng ty tư nhacircn với một caacutech rotilde ragravengxaacutec định mục tiecircu EIS lagrave thiacutech hợp cho caacutec tổ chức cocircng cộng hiện đại nhưng cần phải được linh hoạt hơn vagrave kết thagravenh chugravem một phạm vi rộng hơn khả năng vagrave phương tiện hơn so với khu vực tư nhacircn ban đầu theo định hướng sản phẩm (Hasan vagrave Hasan năm 1997) Điều nagravey coacute thể lagrave do thực tế rằng caacutec hoạt động khu vực cocircng lagrave bắt buộc coacute taacutec động rộng phải đaacutep ứng sự mong đợi duy nhất cocircng cộng thường coacute mục tiecircu mơ hồ vagrave macircu thuẫn iacutet quyền tự chủ vagrave kiểm soaacutet việc ra quyết định vagrave nhacircn viecircn lagrave khoacute khăn hơn (Watson vagrave Carte2000) + Toacutem lại EIS lagrave một khaacutei niệm thagravenh cocircng noacute phaacutet triển qua nhiều năm tuy nhiecircn EIS khắc phục khiếm khuyết của migravenh bằng caacutech tiến hagravenh nghiecircn cứu liecircn tục)
63 Tại sao những người điều hagravenh hagraveng đầu lại khaacutec nhau- Họ lagrave những doanh nghiệp theo định hướng coacute suy nghĩ
- Coacute một khoảng khocircng gian rộng để kiểm soaacutet
- Họ chịu traacutech nhiệm cho việc thiết lập chiacutenh saacutech
- Họ đại diện cho tổ chức mocirci trường becircn ngoagravei
- Hagravenh động của họ tạo ra những kết quả đaacuteng kể về tagravei chiacutenh vagrave con người
Tần số caacutec hoạt động điều hagravenh- Xử lyacute xaacuteo trộn 42
- Hoạt động kinh doanh 32
- Phacircn bổ nguồn lực 17
- Đagravem phaacuten 3
- Những điều khaacutec 6
Handling Disturbances 42
Entrepreneurial Activites 32
Resource Allocation 17
Negotiation 3
Other 6
Những thocircng tin điều hagravenh cần thiết- Quản lyacute xaacuteo trộn coacute thể yecircu cầu sự chuacute yacute xung quanh đồng hồ
- Hoạt động kinh doanh yecircu cầu điều hagravenh để dự đoaacuten những thay đổi trong mocirci trường
- Nhiệm vụ phacircn bổ tagravei nguyecircn yecircu cầu lựa chọn người quản lyacute vagrave caacutec nguồn lực hạn chế được triển khai
- Đagravem phaacuten yecircu cầu cập nhật thocircng tin từng phuacutet để coacute thể xacircy dựng được sự đồng thuận
Caacutec loại thocircng tin điều hagravenh- Hệ thống kế toaacuten coacute liecircn quan đến việc tiacutenh toaacuten thu nhập hoạt động cho caacutec lĩnh
vực cụ thể lagrave quan trọng hơn so với caacutec hệ thống kế toaacuten truyền thocircng- Thocircng tin về thị trường khaacutech hagraveng cung cấp giaacute trị trong việc quyết định chiến
lược- Caacutec thocircng tin cần thiết thường được truyền đi trecircn một số hệ thống maacutey tiacutenh vagrave
nằm trong toagraven tổ chức- Caacutec thocircng tin được sử dụng thường lagrave ngắn hạn vagrave dễ thay đổi
Phương thức để xaacutec định thocircng tin cần thiết
Rockart xaacutec định được năm phương thức cơ bản để xaacutec định thocircng tin cần thiết
- Phương thức dựa trecircn kết quả- Phương thức rỗng- Phương thức chỉ số khoacutea- Phương thức tổng hợp nghiecircn cứu- Phương thức dựa vagraveo nhacircn tố then chốt dẫn đến thagravenh cocircng
64 Thagravenh phần EIS
- Sản phẩm EIS đầu tiecircn được phaacutet triển để sử dụng trecircn maacutey tiacutenh cấu higravenh cao nhưng caacutec sản phẩm hiện nay nhằm mục tiecircu lagrave nền tảng ClientServer
- Những nền tảng linh hoạt hơn coacute thể thiacutech ứng với thay đổi trong tổ chức vagrave cocircng nghệ
- Sử dụng dữ liệu thời gian thực dẫn đến quyết định nhanh hơn nhiều thocircng tin hơn
Thagravenh phần phần cứng- Một EIS khocircng đogravei hỏi coacute phần cứng cụ thể hoặc duy nhất nagraveo- Chigravea khoacutea của vấn đề lagrave để đảm bảo rằng caacutec thagravenh phần của EIS tối ưu hoacutea vagrave
phugrave hợp với tagravei nguyecircn maacutey tiacutenh của tổ chức- Hệ thống nagravey phải được cấu higravenh để caacutec nguồn tagravei nguyecircn phugrave hợp với những
người điều hagravenh chuacuteng
Thagravenh phần phần mềm- Traacutei ngược với phần cứng phần mềm thường được chuyecircn mocircn hoacutea cao cho caacutec
bagravei toaacuten về miền- Sự chuyecircn mocircn hoacutea nagravey thường đạt được bằng caacutech sử dụng thagravenh phần off-the-
shelf cho toagraven bộ EIS vagrave caacutec mocirc-đun tugravey chỉnh để đaacutep ứng nhu cầu cụ thể- Lotus Notes lagrave một viacute dụ điển higravenh Noacute coacute thể được sử dụng một migravenh hoặc coacute
thể phục vụ becircn thứ ba mocirc-đun plug-in
Cocircng nghệ EIS hiện nay
Dobrzeniecki đề xuấtphacircn loạitừng cấptheo bachức năng- Loại 1 sản phẩm bao gồmmột bộ đầy đủcaacutec ứng dụngtừ mộtnhagrave cung cấp- Loại 2 sản phẩm đượcthựchiệnở phần đầu củacaacutecsản phẩmDSS đượcphaacutet triển
bởicugravengmộtnhagrave cung cấp- Loại 3 sản phẩmkết hợp với nhautheo bất kỳ số lượngthuộc sở hữu củacocircng ty
65 Xacircy dựng EIS
- Xacircy dựngmộtEISgiống nhưxacircydựngmột số hệ thống khaacutec củamocirc higravenh hệ thống thocircng tin
- Việcphaacutet triểncấu truacutecnecircn được theo dotildeitừ quaacute trigravenh thiết kế đến quaacute trigravenhthực hiện
- Tuy nhiecircn một dự aacuten phaacutet triển EIScoacute xu hướnglagrave thống nhấtvagraveyecircu cầu hỗ trợ caacutec nhagrave quản lyacute latildenh đạo
- Xacircy dựng một EIScoacute thểphaacutet hiện ra đượccaacutectigravenh huống khoacute khănmagravemột nhagrave phaacutet triển chưabao giờ gặp phải
Mocirc higravenh EIS
Khung phaacutet triển một EIS
- Watson et al đề nghị xacircy dựngkhung với ba thagravenh phần+ Caacutech tiếp cận tập trung vagraveo yếu tốcon người vagrave dữ liệu coacute liecircn quan đến EIS+ Quaacute trigravenh phaacutet triển cần sự linh hoạt vagrave tương taacutec+ Người sử dụng - hệ thống hộp thoại bao gồm một ngocircn ngữ hagravenh động để xử lyacute caacutec lệnh
Lợi iacutech của EIS- Dễ duy trigrave caacutec mục tiecircu coacute tổ chức- Dễ truy xuất thocircng tin- Cho pheacutep người sử dụng nacircng cao hiệu suất hơn
- Tăng chất lượng ra quyết định- Cung cấp sự cải tiến cạnh tranh- Tiết kiệm thời gian của người sử dụng- Tăng khả năng vagrave chất lượng giao tiếp- Cung cấp khả năng điều khiển tốt hơn trong tổ chức- Cho pheacutep tham gia caacutec vấn đề vagrave caacutec cơ hội- Cho pheacutep hoạch định- Cho pheacutep tigravem kiếm nguyecircn nhacircn của một vấn đề- Thảo matilden caacutec yecircu cầu của người điều hagravenh
Hạn chế của EIS vagrave 1 số sai lầm cần traacutenh
- Chi phiacute một cuộc khảo saacutetnăm1991 chothấychi phiacute phaacutet triểntrungbigravenh365000USDvớichi phiacute vận hagravenhhagraveng năm lagrave$200000 (EIS)
- Cocircng nghệ hạn chếEIScần phảiđượctiacutech hợp hoagraven toagravenvagraveokiếntruacuteccủadoanh nghiệphiện tại do đoacute noacutelagrave một thaacutech thứclớn đối vớithiết kế
- Hạn chế tổ chức cơ cấu tổ chứccoacute thể khocircng phugrave hợp
Sự hạn chế về tổ chức- Chương trigravenh nghị sự vagrave thời gian chệch EIS mocirc tả một phần việc thực hiện một
chương trigravenh nghị sự vagrave coacute thể dễ dagraveng đạt được sự tin cậy một caacutech chắc chắn- Đồng bộ hoacutea việc quản lyacute sự tin cậy đuacuteng luacutec đặc biệt baacuteo caacuteo EIS coacute thể phaacute
vỡ sự ổn định thiết lập caacutec chu trigravenh baacuteo caacuteo một caacutech tốt nhất- Sự bất ổn EIS phản ứng nhanh coacute thể gacircy ra việc taacutec động trở lại một caacutech
nhanh choacuteng dẫn đến sự thiếu ổn định trong tổ chức
Sự thất bại lagrave thay thế khocircng thể chấp nhận được- Một số yếu tố lagravem EIS thất bại
+ Thiếu sự hỗ trợ về mặt quản lyacute+ Vấn đề chiacutenh trị+ Thất bại của nhagrave phaacutet triển+ Lỗi về cocircng nghệ+ Giaacute cả+ Thời gian
66 Ra quyết định điều hagravenh trong tương lai vagrave EIS
- Coacute một vagravei điều kiện sẽ được hợp nhất cho việc chuyển đổi cocircng nghệ Trong đoacute một vagravei điều kiện coacute thể dễ dự đoaacuten Hai điều kiện magrave ta coacute thể thấy lagrave+ Phaacutet triển cocircng nghệ maacutey tiacutenh trong việc điều hagravenh sẽ tạo ra sự chuyển đổi được chấp nhận một caacutech dễ dagraveng hơn+ Mở rộng traacutech nhiệm điều hagravenh sẽ mở rộng nhu cầu thocircng tin
Tương lai của EIS- EIS thocircng minh Những tiến bộ trong cocircng nghệ AI sẽ được triển khai trong caacutec
EIS- EIS đa phương tiện Cơ sở dữ liệu đa phương tiện sẽ cho pheacutep tiacutech hợp văn bản
giọng noacutei vagrave higravenh ảnh trong tương lai- EIS thocircng tin Tương lai EIS sẽ mở rộng hơn trong việc sử dụng dữ liệu becircn
ngoagravei doanh nghiệp- EIS kết nối Giao tiếp với băng thocircng rộng cho pheacutep kết nối liecircn thocircng lớn hơn
Chương 7 HỆ CHUYEcircN GIA VAgrave TRIacute TUỆ NHAcircN TẠO
71 Caacutec khaacutei niệm
72 Triacute thocircng minh của triacute tuệ nhacircn tạo
73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia
74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia
75 Lợi iacutech vagrave hạn chế của hệ chuyecircn gia
71 Caacutec khaacutei niệm
Chuyecircn mocircn (Expertise) sự hiểu biết rộng trong 1 lĩnh vực hẹp
Hệ chuyecircn gia (Expert Systems)1 chương trigravenh maacutey tiacutenh sử dụng 1 tập caacutec luật dựa trecircn tri thức của con người để giải quyết caacutec vấn đề đogravei hogravei phải coacute sự chuyecircn mocircn
Một số hệ chuyecircn gia nổi tiếng
DENDRAL (Standford 1960s Edward Feigenbaum)
MYCIN (Standford1970s Edward Shortliffe)
PROSPECTOR (MIT 1979)
Triacute tuệ nhacircn tạo (Artificial Intelligence ndash AI)
Triacute tuệ nhacircn tạo một bộ phacircn của ngagravenh khoa học maacutey tiacutenh quan tacircm đến việc thiết kế caacutec hệ thống maacutey tiacutenh thocircng minh đoacute lagrave caacutec hệ thống đưa ra caacutec đặc điểm magrave từ đoacute chuacuteng ta liecircn hệ với sự thocircng minh trong hagravenh động của con người (Barr vagrave Feigenbaum 1981)
Mục điacutech của AI
Mục điacutech khoa học xaacutec định caacutec gợi yacute để giải thiacutech caacutec loại khaacutec nhau của triacute tuệ thực
Mục điacutech kỹ thuật giải quyết caacutec vấn đề trong thế giới thực
Triacute tuệ nhacircn tạo kế thừa nhiều yacute tưởng quan điểm kỹ thuật từ caacutec ngagravenh khoa học khaacutec
- Triết học
- Logic Toaacuten học
- Tiacutenh toaacuten
- Khoa học tacircm lyacute Khoa học nhận thức
- Sinh học Thần kinh học
- Tiến hoacutea
Caacutec lĩnh vực ứng dụng trong Triacute tuệ nhacircn tạo
Mạng nơ ron thần kinh (Neural Networks)
Tiacutenh toaacuten sự tiến hoacutea
(Evolutionary Computation)
Hệ chuyecircn gia (Expert Systems)
Kỹ thuật xử lyacute tiếng noacutei (Speech Processing)
Kỹ thuật xử lyacute ngocircn ngữ tự nhiecircn
(Natural Language Processing)
Lập kế hoạch (Planning)
Robot (Robotics)
Khoa học higravenh ảnh (Vision)
Caacutec kỹ thuật thocircng dụng dugraveng trong AI
Biểu diễn(Representation)
Học (Learning)
Caacutec luật (Rules)
Tigravem kiếm (Search)
72 Triacute thocircng minh của triacute tuệ nhacircn tạo
Con người suy diễn như thế nagraveo
Phacircn loại (Categorization)
Caacutec quy tắc cụ thể
Heuristics
Kinh nghiệm trước đoacute
Dự tiacutenh trước
Maacutey tiacutenh suy diễn như thế nagraveo
Lập luận dựa trecircn luật IF-THEN mocirc tả tri thức được matilde hoacutea dưới dạng caacutec luật
Caacutec khung (Frames) lagrave caacutec đại diện mocirc tả caacutec tigravenh huống giống nhau lagrave điển higravenh của một vagravei phacircn loại
Lập luận dựa trecircn caacutec trường hợp mocirc phỏng giải phaacutep trước đoacute cho một vấn đề hiện tại
Nhận dạng mẫu phaacutet hiện acircm thanh higravenh dạng hoặc caacutec chuỗi dagravei
Caacutec dạng khaacutec của Triacute tuệ nhacircn tạo
Học maacutey- mạng nơron vagrave giải thuật di truyền
Lập trigravenh tự động ndash lagrave những kỹ thuật tạo ra caacutec chương trigravenh để lagravem 1 nhiệm vụ riecircng biệt (cho pheacutep những người khocircng phải lagrave người lập trigravenh coacute thể lập trigravenh được)
Cuộc sống nhacircn tạo ndash nỗ lực để taacutei tạo caacutec hiện tượng sinh học trong caacutec hệ thống dựa trecircn maacutey tiacutenh
73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia(Expert Systems- ES)
Theo Jackson (1999) Một hệ chuyecircn gia lagrave một chương trigravenh maacutey tiacutenh mocirc tả vagrave suy diễn với tri thức của một vagravei lĩnh vực để giải quyết vấn đề hay đưa ra caacutec lời khuyecircn
Cấu truacutec cơ bản của ES được dựa theo cấu truacutec chung của DSS Sự khaacutec biệt chiacutenh giữa ES vagraveDSS lagrave hệ ES thu thập caacutec kiến thức từ những
chuyecircn gia trong lĩnh vực quan tacircmĐặc trưng của hệ chuyecircn gia Hiệu quả cao Thời gian trả lời thỏa đaacuteng Độ tin cậy cao Dễ hiểu
Giao diện người dugraveng trong ES
Thiết kế giao diện người dugraveng tập trung vagraveo caacutec yếu tố như dễ dagraveng sử dụngcoacute độ tin cậy cao giảm tải những khoacute khăn khi sử dụng
Thiết kế necircn coacute một số tương taacutec (đầu vagraveo kiểm soaacutet vagrave truy vấn)
Cấu tạo giao diện người dugraveng gồm coacute magraven higravenh cảm ứng bagraven phiacutem buacutet saacuteng lệnh thoại caacutec phiacutem chuyecircn dụng
Cơ sở tri thức (Knowledge Base)
Chứa đựng caacutec tri thức cụ thể miền thu được từ caacutec chuyecircn gia miền
Coacute thể chứa caacutec mocirc tả caacutec hagravenh vi giải quyết vấn đề caacutec ragraveng buộc caacutec heuristics
Thagravenh cocircng của một ES dựa trecircn tiacutenh đầy đủ vagrave tiacutenh chiacutenh xaacutec của cơ sở tri thức
Mocirc tơ suy diễn (Inference Engine)
Ở đacircy tri thức được đặt để sử dụng tạo ra caacutec giải phaacutep để giải quyết vấn đề
Mocirc tơ nagravey coacute khả năng thực hiện diễn dịch hoặc suy diễn dựa trecircn caacutec luật hay caacutec caacutec sự kiện
Đồng thời cũng coacute khả năng sử dụng caacutec suy diễn mờ hay khocircng chiacutenh xaacutec dựa trecircn xaacutec suất hay aacutenh xạ mẫu
Vograveng điều khiển suy diễn
1 Aacutenh xạ caacutec luật với caacutec sự kiện đatilde được cho
2 Chọn luật để thực hiện
3 Thực hiện luật bằng caacutech thecircm caacutec sự kiện được suy diễn ra vagraveo bộ nhớ lagravem việc
Chuỗi suy diễn (Chaining)
Suy diễn tiến (forward chaining) maacutey suy diễn bắt đầu từ dữ liệu ban đầu vagrave thực hiện việc suy luận để đưa ra caacutec kết luận cuối cugraveng
Suy diễn lugravei (backward chaining) maacutey suy diễn bắt đầu từ dữ liệu điacutech vagrave tigravem ra tri thức hỗ trợ cho dữ liệu điacutech đoacute
Viacute dụ suy diễn lugravei
R1 Nếu coacute A vagrave B thigrave suy ra coacute D
R2 Nếu coacute B thigrave suy ra coacute C
R3 Nếu coacute C vagrave D thigrave suy ra coacute E
Ta coacute E ta xem trong 3 luật R1 R2 R3 luật nagraveo coacute E ta thấy R3 chứa E đồng thời chứa C vagrave D Xeacutet tiếp trong 2 luật R1 R2 luật nagraveo chứa C vagrave D R2 chứa C R3 chứa D Từ đoacute ta coacute được caacutec tri thức hỗ trợ suy diễn vagrave kết luận lagrave nếu coacute A vagrave B thigrave sẽ coacute E Hay nếu A vagrave B đuacuteng thigrave sẽ coacute E
Viacute dụ suy diễn tiến
Giả sử coacute tập chứa 3 luật sau
R1 Nếu coacute A vagrave B thigrave suy ra coacute D
R2 Nếu coacute B thigrave suy ra coacute C
R3 Nếu coacute C vagrave D thigrave suy ra coacute E
Nếu ta coacute A vagrave B thigrave chuacuteng ta suy ra được D từ R1 vagrave suy ra C từ R2 Với D vagrave C đatilde được suy ra ở trecircn giờ chuacuteng ta suy ra được E từ R3
Viacute dụ thực tế
Giả sử muốn biết magraveu của một con vật nuocirci tecircn lagrave Fred biết rằng noacute kecircu ộp ộp vagrave ăn ruồi
Coacute tập 4 luật ban đầu như sau
R1 Nếu X kecircu ộp ộp vagrave ăn ruồi thigrave X lagrave con ếch
R2 Nếu X kecircu chiecircm chiếp vagrave biết hoacutet thigrave X lagrave con chim
R3 Nếu X lagrave con ếch thigrave X coacute magraveu xanh
R4 Nếu X lagrave con chim thigrave X coacute magraveu vagraveng
74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia
Expert system shells lagrave một tập caacutec goacutei phần mềm vagrave caacutec cocircng cụ dugraveng để phaacutet triển caacutec hệ chuyecircn gia
Những Expert system shells đầu tiecircn thường rất rườm ragrave Mặc dugrave vậy noacute vẫn giuacutep cho người sử dụng sẽ khocircng phải bắt đầu lại từ đầu khi xacircy dựng một hệ chuyecircn gia mới
Những shell hiện đại bao gồm hai mocirc-đun chiacutenh lagrave cocircng cụ xacircy dựng một tập quy tắc vagrave mocirc tơ suy diễn
Xacircy dựng hệ chuyecircn gia
Bước 1 xacircy dựng mocirc higravenh bagravei toaacuten xaacutec định vấn đề nhiệm vụ magrave hệ thống sẽ thực hiện Caacutec dạng bagravei toaacuten cần hệ chuyecircn gia
Bagravei toaacuten diễn giải (InterPretation)
Bagravei toaacuten dự baacuteo (Prediction)
Bagravei toaacuten chuẩn đoaacuten (Diagnose)
Bagravei toaacuten gỡ rối (Debugging)
Bagravei toaacuten thiết kế
Tương tự như một dự aacuten phần mềm để xacircy dựng một hệ chuyecircn gia cần phải coacute caacutec yếu tố về nhacircn lực tagravei nguyecircn vagrave thời gian Những yếu tố nagravey ảnh hưởng đến giaacute thah của một hệ chuyecircn giaTrong phần nagravey cacircu hỏi thường được đặt ra lagrave tại sao cần phải xacircy dựng một hệ chuyecircn giaTrước khi bắt đầu phải xaacute định rotilde bagravei toaacuten đạt ra lagrave jiAi lagrave chuyecircn giaAi lagrave người sử dụng
1 Diễn giải (InterPretation) Nghiecircn cứu 1 vấn đề -gt Dựa trecircn những biểu hiện thuộc tiacutenh đặc trưng becircn ngoagravei -gt Tư vấn
(hoặc đưa ra kết luận hay mocirc tả dễ hiểu từ tập dữ liệu thocirc)
2 Bagravei toaacuten dự baacuteo (Prediction) Coacute thể dự đoaacuten được hagravenh vi kết quả dựa trecircn caacutec hiện tượng -gt dự baacuteo
VD Dự baacuteo thời tiết động đấthellip
3 Bagravei toaacuten chẩn đoaacuten (Diagnoss) Xaacutec định caacutec lỗi caacutec bộ phận hỏng hoacutec của hệ thống dựa trecircn caacutec dữ liệu quan saacutet được
4 Bagravei toaacuten gỡ rối (Debugging) Mocirc tả caacutec phương phaacutep khắc phục hệ thống khi gặp sự cố
5 Bagravei toaacuten thiết kế Lựa chọn cấu higravenh caacutec đối tượng nhằm thoả matilden một số ragraveng buộc nagraveo đoacute
6 Giảng dạy Phần mềm dạy học coacute thể chuẩn đoaacuten vagrave sủa lỗi của học sinh trong quaacute trigravenh học tập
Để xaacutec định đuacuteng bagravei toaacuten magrave chuacuteng ta cần giải quyết thigrave phải trả lời đc một số cacircu hỏi
- cần hệ chuyecircn gia
Bước 2 thu thập tri thức lựa chọn cocircng cụ vagrave aacutep dụng
Trong bước thu thập tri thức vấn đề quan trọng lagrave lựa chọn chuyecircn gia những người magrave sẽ đoacuteng goacutep tri thức cho hệ thống Thocircng thường trong suốt quaacute trigravenh phaacutet triển thigrave chuyecircn gia được xem như một thagravenh viecircn của đội phaacutet triển
Hiện nay coacute rất nhiều cocircng cụ để xacircy dựng một hệ chuyecircn gia Phổ biến nhất lagrave JESS CLIPS vagrave OPS5
Bước 3 Thiết kế cơ sở tri thức thiết kế hệ thốngTri thức được biểu diễn trường minh trong cơ sở tri thức
Caacutec chuyecircn gia vagrave kỹ sư tri thức sẽ đối thoại với nhau bằng caacutec kỹ thuật đối thoại Suy diễn (SD) bảng Mocirc higravenh hoacutea SD quy nạp phacircn loại
Vấn đề bagraveo trigrave vagrave phaacutet triển
Caacutec hệ chuyecircn gia đogravei hỏi phải bảo trigrave vagrave phaacutet triển nhiều hơn so với caacutec hệ thống khaacutec Phải thường xuyecircn bổ sung tri thức mới vagrave thay đổi caacutec tri thức cũ để đổi mới hệ chuyecircn gia
Thu thập vagrave khắc phục lỗi do người sử dụng phaacutet hiện để kịp thời khắc phục những sai soacutet của hệ chuyecircn gia
75 Lợi iacutech vagrave hạn chế của caacutec hệ chuyecircn gia
Một số lợi iacutech chiacutenh
Thời gian trả lời hợp lyacute bằng hoặc nhanh hơn so với chuyecircn gia (người) để đi đến cugraveng một quyết định Hệ chuyecircn gia lagrave một hệ thống thời gian thực (real time system)
Khả năng trả lời với mức độ tinh thocircng bằng hoặc cao hơn so với chuyecircn gia (người) trong cugraveng lĩnh vực
Hệ chuyecircn gia giuacutep cho hiệu quả lagravem việc tăng bằng việc sử dụng tập caacutec luật một caacutech nhanh choacuteng magrave ko bị nhầm lẫn chuyecircn gia lagrave người coacute thể quecircn đi một số tri thức cơ sở lyacute luậ nhưng HCG thigrave ko
Quyết định của một người chuyecircn gia coacute thể bị thay đổi vagrave ko coacute tiacutenh thống nhất như quyết định của một hệ chuyecircn gia tạo ra
Hệ chuyecircn gia giuacutep cho người sử dụng coacute thể trau dồi sự hiểu biết trecircn lĩnh vuej cụ thể magrave noacute giải quyết hỗ trợ người ra quyết định coacute trigravenh độ như 1 chuyecircn gia trong quaacute trigravenh gia quyết định
Kiến thức của rất nhiều chuyecircn gia về một lĩnh vực nagraveo đoacute được đưa vagraveo hệ chuyecircn gia lagravem cho CSTT cuat HCG phong phuacute vagrave rộng lớn hơn rất nhiều
HCG giải thiacutech caacutec bước suy luận một caacutech dễ hiểu nhất quaacuten luacutec nagraveo cũng coacute thể sử dụng ko như chuyecircn gia con người
Hạn chế của caacutec hệ chuyecircn gia
Nhược điểm lớn nhất của hệ chuyecircn gia lagrave những yacute kiến chuyecircn mocircn thường rất khoacute matilde hoacutea vagrave giải neacuten
Hệ chuyecircn gia khocircng coacute khả năng tự học tự cập nhật kiến thức mới như caacutec chuyecircn gia magrave cần phải được matilde hoacutea lại khi noacute được cập nhật
Hệ chuyecircn gia khocircng thể nhận ra được vấn đề khocircng nằm trong miền kiến thức của hệ thống
Chương 8 Tri thức vagrave tiếp nhận
1 Bao gồm caacutec vấn đề
Dữ liệu thực tế đo lường hoặc quan saacutet coacute hoặc khocircng coacute bối cảnh
Thocircng tin dữ liệu được tổng hợp một caacutech hữu iacutech để giải quyết những khoacute khăn trong việc đưa ra quyết định
Tri thức bao gồm caacutec ứng dụng quy tắc thocircng tin hướng dẫn của người ra quyết định
2 Những caacutei nhigraven về tri thức
Đại diện lagravem thế nagraveo để diễn tả tri thức viacute dụ như một quyển saacutech khocircng phải lagrave tri thức nhưng noacute lại lagrave một đại diện của tri thức
Sản xuất tri thức lagrave một tập hơp của hagraveng tồn kho coacute thể được sản xuất cũng như mua lại
Tri thức lagrave 1 trong 6 trạng thaacutei của hệ thống
1Dữ liệu 2Thocircng tin 3Cấu truacutec thocircng tin 4Sự thấu hiểu 5Yacute kiến 6 Quyết định
3 Caacutec loại tri thức Phổ biến mocirc tả dữ liệu thocircng tin thủ tục mọi thứ lagravem như thế nagraveo lập luận chiacutenh saacutech hoặc caacutec quy tắc
4 Thu thập Tri thức hệ chuyecircn gia Hầu hết caacutec phương phaacutep đều bắt đầu với mocirc higravenh của caacutec taacutec vụ trong đoacute
hệ chuyecircn gia được xacircy dựng Trong đoacute mocirc tả về caacutec lĩnh vực được tạo ra Caacutec kỹ sư sử dụng caacutec mocirc higravenh giả thuyết vagrave nhận thức về quaacute trigravenh phacircn
tiacutech để gợi ra caacutech giải quyết vấn đề về tri thức từ caacutec chuyecircn gia
5 Caacutec chiều của thu thập tri thức KE- driven caacutec kỹ sư trao đổi trực tiếp với caacutec chuyecircn gia Expert-driven Caacutec chuyecircn gia trực tiếp đưa chuyecircn mocircn của họ vagraveo hệ
thống maacutey tiacutenh Machine-driven Sử dụng caacutec cocircng cụ suy luận để triacutech xuất tri thức từ một
tập caacutec viacute dụ
6 Kỹ thuật thu thập tri thức Trao đổi gồm 2 loại cơ bản lagrave coacute cấu truacutec(coacute kịch bản) vagrave khocircng coacute cấu
truacutec( đối thoại trực tiếp) Giao thức phacircn tiacutech bằng lời Khi caacutec chuyecircn gia thực hiện một cocircng việc
của họ thigrave một bản ghi về cocircng việc đoacute được thực hiện Caacutec kỹ sư sẽ xacircy dựng mocirc higravenh cho những gigrave được ghi lại trong bản ghi
Phương phaacutep sagraveng lọc caacutec chuyecircn gia so saacutenh caacutec nhoacutem liecircn tiếp trong ba đối tượng vagrave cho biết tại sao nhoacutem thứ hai lại khaacutec nhoacutem thứ ba
7 Thu thập tri thức từ nhiều nguồn Thu thập tri thức từ nhiều nguồn lagrave cần thiết để coacute được đầy đủ caacutec tri thức
cho một vấn đề quan điểm yacute kiến traacutei ngược nhau thường phaacutet sinh Phương phaacutep đồng thuận sẽ giuacutep giải quyết được vấn đề macircu thuẫn Kỹ thuật phacircn tiacutech Meta lagrave kỹ thuật được aacutep dụng trong caacutec trường hợp
khaacutec Caacutech tiếp cận bằng định lượng đogravei hỏi caacutec kỹ sư cần cacircn nhắc yếu tố đầu vagraveo của caacutec chuyecircn gia khaacutec nhau
8 Xaacutec nhận hợp lệ vagrave kiểm tra tri thức Một khi thu thập tri thức noacute phải được đaacutenh giaacute về khả năng sử dụng vagrave độ
chiacutenh xaacutec Hai vấn đề cụ thể lagrave hiệu lực của những kiến thức vagrave kiểm tra việc xacircy dựng cơ sở của tri thức
Cần xaacutec nhận xem liệu hệ thống coacute thể hoạt động ở mức độ tối thiểu khocircng
Xaacutec minh liecircn quan đến việc so saacutenh từng chi tiết kỹ thuật của hệ thống những gigrave đatilde được thực hiện cuối cugraveng
9 Một số caacutec biện phaacutep xaacutec nhận Độ chiacutenh xaacutec Khả năng thiacutech nghi Mức độ đầy đủ Bề rộng Độ sacircu Hiệu lực Tổng quan Chiacutenh xaacutec Hiện thực Độ tin cậy Tiacutenh hữu dụng Mức độ
Chương 9 Học maacutey
1 Logic mờ vagrave ngocircn ngữ mờ(Fuzzy Logic and Linguistic Ambiguity)
Ngocircn ngữ tự nhiecircn gồm những khaacutei niệm mơ hồ vagrave khocircng chiacutenh xaacutectruyền tải ngữ nghĩa thocircng qua tiacutenh xấp xỉkhocircng rotilde ragraveng
Những xấp xỉ nagravey giuacutep con người coacute thể truyền tải hết được yacute nghĩa nhưng maacutey thigrave khocircng hiểu
Lagravem sao biểu diễn caacutec tri thức sử dụng caacutec khaacutei niệm khocircng rotilde ragraveng(mờ) hoặc khocircng chiacutenh xaacutec
2 Khaacutei niệm cơ bản của logic mờ tập mờ lagrave những tập hợp khocircng coacute một giới hạn rotilde Mỗi phần tử của noacute chỉ
chứa một mức độ hagravem liecircn thuộc của từng phần tử Vigrave vậy tập mờ khocircng giống như tập cổ điển Tập mờ coacute thể kết hợp với nhau qua những luật mờ magrave đặc trưng cho những hagravenh động trạng thaacutei vagrave thuộc tiacutenh của logic mờ được tận dụng khi thực hiện một bộ điều khiển mờ
Logic mờ dựa trecircn yacute tưởng mỗi phần tử thuộc vagraveo một tập hợp ở một mức độ nagraveo đấy
Locircgic mờ cho pheacutep độ liecircn thuộc (microA )coacute giaacute trị trong khoảng (01) Locircgic mờ coacute thể được coi lagrave mặt ứng dụng của lyacute thuyết tập mờ để xử lyacute caacutec
giaacute trị trong thế giới thực cho caacutec bagravei toaacuten phức tạp
3 So saacutenh tiacutenh đuacuteng đắn logic mờ vagrave xaacutec suất Xaacutec suất thigrave đề cập đến khả năng xảy ra một biến cố hay một điều gigrave đoacute Logic mờ đề cập đến cấp độ magrave đặc tiacutenh ở hiện tại
o viacute dụ1 người coacute chiều cao 6 feet thigrave coacute cấp độ lagrave 05 về chiều cao
4 Ưu điểm của logic mờ Caacutech tiếp cận rất tự nhiecircnkhocircng phức tạp Coacute thể mocirc higravenh hoacutea caacutec hagravem phi tuyến tugravey yacute phức tạp
Coacute thể tận dụng được kinh nghiệm từ những chuyecircn gia hagraveng đầu trong mọi lĩnh vực
Logic mờ được xacircy dựng dựa trecircn ngocircn ngữ tự nhiecircnNền tảng của logic mờ lagrave dựa trecircn cơ sở giao tiếp của con người
5 Nhược điểm của logic mờ Trong 1 hệ thống phức tạpsử dụng logic mờ coacute thể trở thagravenh trở ngại cho
việc xaacutec thực độ tin cậy của hệ thống Cơ chế lập luận mờ khocircng thể học hỏi từ những lỗi sai
6 Mạng noron nhacircn tạo(ANN) Mạng noron nhacircn tạo lagrave một mocirc phỏng xử lyacute thocircng tinđược nghiecircn cứu ra
từ hệ thống thần kinh của sinh vậtgiống như bộ natildeo để xử lyacute thocircng tin ANNs lagrave chương trigravenh dựa trecircn maacutey tiacutenh đơn giản coacute chức năng lagrave một mocirc
higravenh bagravei toaacuten khocircng gian dựa trecircn thử nghiệm vagrave baacuteo lỗi
7 Học từ kinh nghiệm Tiến trigravenh Một mẫu dữ liệu được biểu diễn như một mạng lưới noronANN ldquodự
đoaacutenrdquo 1 đầu radự đoaacuten được so saacutenh với giaacute trị thực tế hoặc giaacute trị chiacutenh xaacutecNếu đoaacuten được chiacutenh xaacutec thigrave khocircng coacute hagravenh động nagraveo được thực hiện
Nếu dự đoaacuten sai ANN kiểm tra lại vagrave xaacutec định lại thocircng số để điều chỉnh Một mẫu dữ liệu khaacutec được biểu diễn vagrave quaacute trigravenh nagravey được lặp lại
8 Nguyecircn tắc cơ bản của cocircng nghệ nơron Caacutec yếu tố xử lyacute cơ bản trong hệ thống thần kinh của con người lagrave tế bagraveo
thần kinhMạng lưới của tế bagraveo nagravey lagrave liecircn kết với nhau nhận được thocircng tin từ caacutec cảm biến trong mắt taihellip
Thocircng tin nhận được bởi tế bagraveo thần kinh hoặc lagrave sẽ kiacutech thiacutech noacute(sẽ được chuyển qua 1 thocircng điệp dọc theo mạng lưới) hoặc lagrave sẽ ngăn cản noacute(ngăn cản dograveng thocircng tin)
Độ nhạy coacute thể thay đổi qua thời gian hoặc sau khi coacute được kinh nghiệm
9 Cấu truacutec mạng Một ANN gồm 3 lớp cơ bản
Lớp đầu vagraveo nhận dữ liệu Lớp becircn trong hoặc lagrave lớp ẩn xử lyacute dữ liệu Lớp đầu ra chuyển tiếp kết quả cuối cugraveng của mạng
10Mạng nơ ron Thường coacute nhiều đầu vagraveo mỗi đầu vagraveo với mức ảnh hưởng vagrave tầm quan
trọng riecircng của noacute Một đầu vagraveo quan trọng coacute thể được sử dụng để khuếch đại đầu ra caacutec hagravem trạng thaacutei tổng hợp caacutec trọng số của caacutec yếu tố
đầuvagraveo khaacutec nhauvagraveo một giaacute trị duy nhất Caacutec hagravem chuyển giao xử lyacute caacutec giaacute trị trạng thaacutei vagrave tạo đầu ra
11Huấn luyện mạng nơ ron Trong mocirc higravenh coacute giaacutem saacutetANN được đến so saacutenh dự đoaacuten của chiacutenh
noacute với thocircng tin phản hồi coacute chứa caacutec kết quả mong muốn ANN sẽ phải tigravem caacutech thay đổi caacutec tham số becircn trong củamigravenh (caacutec trọng số vagrave caacutec ngưỡng) để tạo necircn một aacutenh xạ coacute khả năng aacutenh xạcaacutec đầu vagraveo thagravenh caacutec đầu ra mong muốn Sự thay đổi nagravey được tiến hagravenh nhờ việc so saacutenh giữa đầu ra thực sự vagrave đầu ra mong muốn
Trong mocirc higravenh khocircng coacute giaacutem saacutetANN nhận được dữ liệu vagraveo nhưng khocircng phải coacute bất kỳ thocircng tin phản hồi về kết quả mong muốn
Phần lớn caacutec ứng dụng nằm trong vugraveng của caacutec bagravei toaacuten ước lượng như mocirc higravenh hoacuteathống kecirc neacuten lọc phacircn cụm
12Lợi iacutech Liecircn kết với mạng noron Traacutenh caacutech lập trigravenh tường minh Giảm nhu cầu của chuyecircn gia ANNs thigrave thiacutech nghi với caacutec yếu tố đầu vagraveo thay đổi Khocircng cần thiết cho cơ sở tri thức tinh chế ANNs coacute tiacutenh động vagrave cải thiện với việc sử dụng Coacute khả năng xử lyacute dữ liệu khocircng chiacutenh xaacutec hoặc khocircng đầy đủ Cho pheacutep tổng quaacutet hoacutea từ thocircng tin cụ thể Cho pheacutep thu thập cảm giaacutec thocircng thường vagraveo miền giải quyết vấn đề
13Hạn chế của việc liecircn kết với mạng noron ANNs khocircng thể giải thiacutech được suy luận Bản chất hộp đen thường khiến cho vấn đề traacutech nhiệm vagrave độ tin cậy phaacutet
sinh lagrave khoacute khăn Lặp đi lặp lại quaacute trigravenh huấn luyện rất tốn thời gian Nguồn lực caacutec nhagrave phacircn tiacutech vagrave thiết kế coacute tay nghề cao vẫn lagrave đaacuteng lo
ngại Cocircng nghệ ANN thuacutec đẩy hạn chế của phần cứng hiện tại ANN yecircu cầu phải coacute sự tin tưởng ở đầu ra
14Giới thiệu về thuật toaacuten di truyền Cũng như mạng lưới thần kinh caacutec thuật toaacuten di truyền được dựa trecircn lyacute
thuyết sinh học Thuật toaacuten di truyền tigravem thấy nguồn gốc của chuacuteng trong caacutec lyacute thuyết
tiến hoacutea của chọn lọc tự nhiecircn vagrave thiacutech ứng với biến đổi khiacute hậu Kết quả thuật toaacuten di truyền lagrave từ giao phối 2 caacute thể trong quần thế để tạo
ra con caacutei đocirci khi tốt hơn so với bậc cha mẹ của chuacuteng 15Caacutec thagravenh phần cơ bản của thuật toaacuten di truyền
Toaacuten tử chọn lọc Caacutec caacute thể tốt được chọn lọc để đưa vagraveo thế hệ sau Sự chọn lọc nagravey căn cứ vagraveo độ thiacutech nghi với mocirci trường của mỗi caacute thể
Toaacuten tử lai gheacutep (crossover) Hai caacute thể cha vagrave mẹ trao đổi caacutec gen với nhau để tạo ra caacute thể con
Toaacuten tử đột biến (mutation) Một caacute thể thay đổi một số gen để biến đổi thagravenh một caacute thể mớiTất cả caacutec toaacuten tử trecircn khi thực hiện đều mang tiacutenh ngẫu nhiecircn
16Quaacute trigravenh cơ bản của một thuật toaacuten di truyền Khởi tạo
Đaacutenh giaacute quần thể
Lựa chọn NST thiacutech hợp nhất vagrave loại bỏ NST yếu nhất
Quy trigravenh giao nhau vagrave cải thiện quần thể
đột biến tiến trigravenh để khaacutem phaacute ra NST mới
17Ưu nhược điểm của việc kết hợp với thuật toaacuten di truyền Kiacutech thước quần thể lagrave 1 yếu tố quan trọng trong tốc độ của việc tigravem
kiếmnhưng noacute tương đối dễ dagraveng để dự đoaacuten tốc độ nagravey Giao nhau hoặc đột biến lagrave khocircng necircn đc sử dụng quaacute thường xuyecircn Luocircn coacute được iacutet nhất 1 giải phaacutep hợp lyacute Necircn coacute thể aacutep dụng chuacuteng cho caacutec vấn đề magrave chuacuteng ta khocircng coacute hướng
về caacutech giải quyết Sức mạnh của thuật toaacuten xuất phaacutet từ khaacutei niệm đơn giảnkhocircng phải từ
một thủ tục thuật toaacuten phức tạp 18Tương lai của học maacutey
Mạng lưới thần kinh nhacircn tạo vượt quaacute năng lực của con người trong caacutec trường hợp bị cocirc lập
Về mặt lyacute thuyếtmột maacutey tiacutenh coacute thể xử lyacute dũ liệu nhanh hơn hagraveng triệu lần so với 1 con người
May mắn thay cho chuacuteng tacon người tốt hơn nhiều khi magrave coacute được dữ liệumaacutey tiacutenh khocircng coacute 1 số thứ như lagrave 5 giaacutec quan
CHƯƠNG 10 KHO DỮ LIỆU
1 Kho dữ liệu Kho dữ liệu lagrave tuyển tập caacutec cơ sở dữ liệu tiacutech hợp hướng chủ đề được
thiết kế để trợ giuacutep cho một hệ hỗ trợ quyết định
Theo John Ladley Cocircng nghệ kho dữ liệu lagrave tập caacutec phương phaacutep kỹ thuật vagrave caacutec cocircng cụ coacute thể kết hợp hỗ trợ nhau để cung cấp thocircng tin cho người sử dụng trecircn cơ sở tiacutech hợp từ nhiều nguồn dữ liệu nhiều mocirci trường khaacutec nhau
Kho dữ liệu thường rất lớn tới hagraveng trăm GB hay thậm chiacute hagraveng Terabyte
2 Kho dữ liệu vận hagravenh (ODS) Một kho dữ liệu vận hagravenh Aacutep dụng kỹ thuật kho dữ liệu vagraveo caacutec hệ xử
lyacute giao taacutec lưu trữ dữ liệu cho một ứng dụng đặc thugrave Noacute đưa vagraveo kho dữ liệu một dograveng caacutec dữ liệu thocirc được thiết kế
3 So saacutenh
Kho dữ liệu vận hagravenh Kho dữ liệu
Dữ liệu theo chủ đề Dữ liệu theo chủ đề
Dữ liệu tiacutech hợp Dữ liệu tiacutech hợp
Dữ liệu thay đổi Dữ liệu khocircng thay đổi
Dữ liệu được cập nhật khi thay đổi
Dữ liệu giữ nguyecircn
Chỉ coacute dữ liệu hiện tạiDữliệu hiện tại vagrave dữ liệu lịch sử
Chu kỳ lagravem tươi dữ liệu ngắn Chu kỳ lagravem tươi dữ liệu dagravei
Chỉ coacute dữ liệu chi tiết Dữ liệu chi tiết vagrave dữ liệu tổng kết
Dugraveng cho caacutec quyết định ngắn hạn
Dugraveng cho hoạch định dagravei hạn
4 Kho dữ liệu cục bộ (Data Mart - DM)
Kho dữ liệu cục bộ lagrave CSDL coacute những đặc điểm giống với kho dữ liệu nhưng với quy mocirc nhỏ hơn vagrave lưu trữ dữ liệu về một lĩnh vực một chuyecircn ngagravenh
Data mart phụ thuộc Chứa những dữ liệu được lấy từ DW vagrave những dữ liệu nagravey sẽ được triacutech lọc vagrave tinh chế tiacutech hợp lại ở mức cao hơn để phục vụ một chủ đề nhất định của Datamart
Data mart độc lập Khocircng giống như Datamart phụ thuộc Data mart độc lập được xacircy dựng trước DW vagrave dữ liệu được trực tiếp lấy từ caacutec nguồn khaacutec nhau
5 Siecircu dữ liệu Metadata lagrave dữ liệu để mocirc tả dữ liệu Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột
một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi Metadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu
6 Mocirci trường kho dữ liệu Hệ thống của tổ chức vagrave kho cung cấp dữ liệu để xacircy dựng kho dữ liệu Trong quaacute trigravenh chuyển dữ liệu từ caacutec nguồn khaacutec nhau dữ liệu coacute thể
được lagravem sạch hoặc chuyển đổi vagrave vigrave thế DW được xem như lagrave một chuẩn cho việc lưu trữ
Đồng thời siecircu dữ liệu được ghi lại Cuối cugraveng DW hoặc siecircu thị coacute thể được sử dụng để tạo ra một kho dữ
liệu ldquocaacute nhacircnrdquo 7 Caacutec đặc điểm của kho dữ liệu
Đặc điểm Mocirc tả
Hướng chủ đề - DL tổ chức theo caacutech thức người dugraveng tham chiếu
Tiacutech hợp - Dữ liệu ldquosạchrdquo loại bỏ tiacutenh thiếu nhất quaacuten
Khocircng thay đổi - DL ldquochỉ đọcrdquo người dugraveng khocircng thay đổi được
Chuỗi thời gian - DL lagrave chuỗi thời gian khocircng phải lagrave trạng thaacutei hiện tại
Được tổng kết - DL vận hagravenhthao taacutec khi cần thiết
được kết hợp lại thagravenh dạng coacute thể dugraveng được cho quyết định
Kiacutech cỡ lớn hơn - Lưu giữ theo chuỗi thời gian tức lagrave giữ lại nhiều DL
Khocircng được chuẩn hoacutea - Coacute thể dư thừa DLSiecircu dữ liệu - Dữ liệu của dữ liệu được lưu trữNguồn dữ liệu - DL vận hagravenh (caacutec hệ sẵn coacute) cugraveng
với caacutec nguồn ngoagravei 8 Kho dữ liệu hướng chủ đề
Hướng chủ để coacute nghĩa lagrave kho dữ liệu được tổ chức xung quanh caacutec chủ đề chiacutenh như khaacutech hagraveng sản phẩm sản xuất Tập trung vagraveo việc mocirc higravenh hoacutea vagrave phacircn tiacutech dữ liệu cho caacutec nhagrave ra quyết định magrave khocircng tập trung vagraveo caacutec xử lyacute thocircng thường Cung cấp cho người dugraveng một khung nhigraven toagraven vẹn đơn giản vagrave đầy đủ về caacutec sự kiện quanh caacutec chủ đề
9 Dữ liệu trong DW được tiacutech hợp Dữ liệu trong kho dữ liệu được xacircy dựng bằng caacutech tổng hợp dữ liệu từ
nhiều nguồn khaacutec nhau vagrave caacutec nguồn coacute tổ chức khaacutec nhau Cơ sở dữ liệu caacutec file excel caacutec flat file hoặc caacutec raw file Khi đưa vagraveo kho dữ liệu caacutec dữ liệu được lagravem sạch vagrave tiacutech hợp dữ liệu nhằm đảm bảo tiacutenh nhất quaacuten của dữ liệu
10Kiến truacutec kho dữ liệu Tầng cơ sở dữ liệu hoạt động Tầng truy xuất thocircng tin Tầng truy xuất dữ liệu Tầng siecircu dữ liệu Tầng quản lyacute tiến trigravenh Tầng thocircng điệp của ứng dụng Tầng vật liacute của kho dữ liệu Tầng trigravenh diễn dữ liệu
11Higravenh trạng kho dữ liệu Kho dữ liệu ảo - người dugraveng cuối coacute thể truy cập trực tiếp đến kho dữ liệu
sử dụng caacutec cocircng cụ cho pheacutep ở tầng truy xuất dữ liệu Kho dữ liệu trung tacircm-1 cơ sở dữ liệu vật lyacute chứa tất cả dữ liệu cho một
vugraveng chuyecircn dụng nagraveo đoacute
Kho dữ liệu phacircn taacuten- Thagravenh phần được phacircn taacuten qua nhiều hệ cơ sở dữ liệu vật lyacute
12METADATA- Siecircu dữ liệu Định nghĩa Siecircu dữ liệu lagrave dữ liệu về dữ liệu Lagrave 1 lưu trữ dugraveng để
Miecircu tả kho dữ liệu tổng thể Nhận dạng kiểu kho dữ liệu Quản liacute quaacute trigravenh tiacutech hợp dữ liệu Quản liacute quaacute trigravenh cập nhật kho dữ liệu Quản liacute bảo mật
Lagrave chigravea khoacutea quyết định sự thagravenh cocircng của kho dữ liệu luocircn được thay đổi vagrave cập nhật theo sự phaacutet triển của kho dữ liệu
Dugraveng để quản liacute điều khiển kho dữ liệu Sự ra đời của kho dữ liệu như 1 cấu truacutec hỗ trợ ra quyết định siecircu dữ liệu
được xem như nguồn tagravei nguyecircn dữ liệu Siecircu dữ liệu lagrave trừu tượng Chuacuteng lagrave dữ liệu bậc cao cung cấp mocirc tả ngắn
gọn caacutec dữ liệu bậc thấp hơn 13Hoạt động của Siecircu dữ liệu
Siecircu dữ liệu rất cần thiết trong việc chuyển hoacutea thocircng tin trở thagravenh tri thức Lagrave chigravea khoacutea giuacutep chuacuteng ta xử lyacute được dữ liệu thocirc Viacute dụ một dograveng dữ liệu baacuten hagraveng 1023 K596 11121 agraveNoacute sẽ khocircng coacute nghĩa gigrave cho đến khi chuacuteng ta đưa vagraveo siecircu dữ liệu (thư
mục chứa dữ liệu) agrave cửa hagraveng 1023 sản phẩm K596 vagrave số tiền baacuten được lagrave 11121 đocirc la
14Sự cần thiết phải nhất quaacuten trong kho dữ liệu Kho dữ liệu được xacircy dựng cho lợi iacutech của những nhagrave phacircn tiacutech kinh
doanh caacutec nhagrave quản trị cho tất cả caacutec khu vực chức năng Trong cơ sở dữ liệu riecircng caacutec khu vực khaacutec nhau coacute thể định nghĩa vagrave lưu
trữ dữ liệu thocircng qua phiecircn bản của chiacutenh noacute Khi dữ liệu được lấy từ những vugraveng khaacutec nhau đoacute vagrave được đặt vagraveo kho dữ
liệu Việc chuyển đổi vagrave lagravem sạch caacutec tiến trigravenh sẽ đảm bảo noacute lagrave duy nhất được tiacutech hợp tại một mức của tổ chức
15Ragrave soaacutet lại dữ liệu ndash Thực thi siecircu dữ liệu
Bất kể cấu truacutec tự nhiecircn của 1 cacircu truy vấn thế nagraveo thigrave caacutec thagravenh phần của siecircu dữ liệu rất quan trọng đối với người ra quyết định
Bảng thuộc tiacutenh khoacutea được lưu trữ bởi kho dữ liệu Tập hợp dữ liệu được lấy từ đacircu Những chuyển đổi nagraveo được thực thi với việc lagravem sạch
16Siecircu dữ liệu lagrave gigrave Metadata - lagrave thocircng tin mocirc tả nội dung của cơ sở dữ liệu (CSDL) Metadata baacuteo cho người dugraveng biết thời gian cập nhật sau cugraveng của dữ liệu
định dạng vagrave mục điacutech sử dụng của noacute Những thocircng tin nagravey coacute thể hướng dẫn người dugraveng duyệt qua CSDL vagrave
giuacutep họ hiểu được yacute nghĩa vagrave ngữ cảnh của dữ liệu Trong CSDL metadata lagrave caacutec dạng biểu diễn khaacutec nhau của caacutec đối tượng
trong CSDL Trong CSDL quan hệ metadata lagrave caacutec định nghĩa của bảng cột CSDL
view vagrave nhiều đối tượng khaacutec Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột
một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi -gtMetadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu
Bảng chuyển đổi Ghi lại những chuyển đổi đatilde được thực hiện
Lịch sử thực thi Ghi lại những dữ liệu đatilde được
phacircn tiacutech
Higravenh thaacutei kết nốiGhi lại những dữ liệu được kết nối vagrave tần suất
17Aacutenh xạ thocircng thường của siecircu dữ liệu Bản ghi aacutenh xạ chuyển đổi bao gồm
Định danh của nguồn gốc Chuyển đổi thuộc tiacutenh Chuyển đổi thuộc tiacutenh vật lyacute Matilde hoacutea tham chiếu bảng chuyển đổi Đổi tecircn Đổi khoacutea Gaacuten giaacute trị cho thuộc tiacutenh mặc định Chọn logic cho caacutec nguồn nhiều giaacute trị Đổi thuật toaacuten
18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để
phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai
lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave
tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec
Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm
Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo
19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua
caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau
SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được
Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra
một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức
Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ
Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ
Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech
CHƯƠNG 11 KHAI PHAacute DỮ LIỆU
1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn
ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993
Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng
2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd
1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều
2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP
3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn
4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng
5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server
6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo
7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động
8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời
9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều
10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện
11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech
12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP
3 Xử lyacute phacircn tiacutech trực tuyến OLAP
MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave
dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu
ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave
thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu
HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave
ROLAP4 Khai phaacute dữ liệu
Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh
khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn
Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan
5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp
6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại
Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp
Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec
Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt
Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra
Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh
vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho
Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec
Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm
Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục
Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng
gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp
Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn
Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec
Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper
Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2
Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25
Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước
Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng
Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện
trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp
Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute
độ hỗ trợ ge ngưỡng minsup
độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan
Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn
Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết
Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu
MOLAP ROLAP HOLAP
Lưu trữ dữ liệu cơ sở
Khối Bảng quan hệ Bảng quan hệ
Lưu trữ thocircng tin tổng hợp
Khối Bảng quan hệ Khối
Hiệu suất thực hiện truy vấn
Nhanh nhất Chậm nhất Nhanh
Tiecircu thụ khocircng gian lưu trữ
Nhiều Thấp Trung bigravenh
Chi phiacute bảo trigrave Cao Thấp Trung bigravenh
thống hội nghị điện tử thường sử dụng internet để kết nối caacutec người ra quyếtđịnh- Caacutec thuận lợi aacutep dụng caacutec phương phaacutep giao tiếp cải tiến trong caacutec tổ chức+ Cải tiến năng suất của nhacircn viecircn+ Liecircn quan đến nhiều người ra quyết định chiacutenh+ Khocircng quan tacircm nhiều đến đường biecircn giới địa lyacute+ Tạo nền văn hoacutea hợp taacutec nhất quaacuten+ Cải tiến chất lượng cuộc sống của nhacircn viecircnHỗ trợ cộng taacutec Maacutey tiacutenh hỗ trợ cộng taacutec- Khung thời giannơi chốn+ Sự hiệu quả của kỹ thuật tiacutenh toaacuten cộng taacutec phụ thuộc vagraveo vị triacute của caacutec thagravenhviecircn trong nhoacutem vagrave phụ thuộc vagraveo thời gian chia sẽ thocircng tin gởi vagrave nhận+ Chia sự giao tiếp thagravenh bốn ocirc vagrave tổ chức bốn ocirc dọc theo 2 chiều thời gian vagravenơi chốn1048713 Thời gian Khi gởi vagrave nhận thocircng tin hầu như đồng thời giao tiếp lagrave đồngthời Viacute dụ Điện thoại ti vi vagrave caacutec cuộc họp gặp mặt nhau Giao tiếp bấtđồng bộ xảy ra khi người nhận nhận thocircng tin ở thời điểm khaacutec thời điểmgởi thocircng tin đoacute1048713 Nơi chốn Người gởi vagrave người nhận coacute thể ở cugraveng phograveng hoặc khocircng+ Bốn ocirc lagrave1048713 Cugraveng thời giancugraveng nơi chốn Caacutec thagravenh viecircn gặp mặt nhau cugraveng một luacutecgiống như phograveng quyết định hoặc gặp mặt truyền thống1048713 Cugraveng thời giankhaacutec nơi chốn Caacutec thagravenh viecircn ở caacutec nơi khaacutec nhau nhưnggiao tiếp cugraveng nhau Viacute dụ hội nghị truyền higravenh (videoconferencing)1048713 Khaacutec thời giancugraveng nơi chốn Nhiều người lagravem việc theo ca Ca nagravey để lạithocircng tin cho ca khaacutec1048713 Khaacutec thời giankhaacutec nơi chốn Caacutec thagravenh viecircn ở caacutec nơi khaacutec nhau Caacutecthagravenh viecircn nagravey gởi vagrave nhận thocircng tin ở những lần khaacutec nhau
23Thực thi hệ DSSHệ thống hỗ trợ quản lyacute (MSS) khocircng phải luacutec nagraveo cũng luocircn thagravenh cocircng Nhiều trường hợpthất bại của ES khocircng hoagraven toagraven lagrave lyacute do kỹ thuật Thực thi hệ thống lagrave một quaacute trigravenh liecircn tụcnhằm đảm bảo cho tổ chức chuẩn bị tiếp nhận một hệ thống mới vagrave đưa hệ thống vagraveo sử dụngthagravenh cocircngThực hiện cocircng nghệ hệ thống hỗ trợ quản lyacute lagrave việc phức tạp vigrave caacutec hệ thống nagravey khocircng đơnthuần lagrave hệ thống thocircng tin chỉ thu thập thao taacutec vagrave phacircn phối thocircng tin Magrave xa hơn chuacuteng
liecircn quan tới caacutec cocircng việc coacute thể lagravem thay đổi đaacuteng kể caacutech thức hoạt động của tổ chức Tuyvậy đa số caacutec yếu tố thực thi đều liecircn quan tới hệ thống thocircng tinThực thi MSS lagrave quaacute trigravenh liecircn tục diễn ra trong suốt thời gian phaacutet triển hệ thống từ đề xuấtban đầu đến nghiecircn cứu khả thi thiết kế vagrave phacircn tiacutech hệ thống lập trigravenh huấn luyện chuyểnđổi vagrave lắp đặt Caacutec chuyecircn gia hệ thống thocircng tin thường gọi thực thi lagrave giai đoạn cuối trongvograveng đời hệ thống Định nghĩa thực thi MSS phức tạp hơn vigrave bản chất lặp của sự phaacutet triểncaacutec hệ thống
THỰC THI KHOcircNG HOAgraveN CHỈNHCaacutec quyết định về tiacutenh khả thi thường coacute giả định về lợi iacutech đạt được khi kế hoạch thực thiđược thực hiện hoagraven toagraven Trong thực tế thường chỉ thực hiện 90 thậm chiacute 70 phần trăm sovới phacircn tiacutech khả thi Lyacute do lagrave sự thay đổi tại một nơi trong hệ thống coacute thể ảnh hưởng vagrave coacutethể taacutec động tiecircu cực đến chỗ khaacutec Do vậy cấp quản lyacute coacute thể bỏ những phần trong dự aacuten coacutethể gacircy ra taacutec động xấu Do đoacute dự aacuten sẽ thực hiện iacutet hơn 100 so với dự aacuten kế hoạch Caacutec lyacutedo khaacutec coacute thể lagrave do khấu trừ ngacircn saacutech hoặc vượt chi phiacuteĐAacuteNH GIAacute SỰ THAgraveNH COcircNG CỦA THỰC THI HỆ THỐNGPhải coacute caacutec chỉ số đo lường thigrave mới coacute thể đaacutenh giaacute sự thagravenh cocircng khi thực thi một hệ thốngDickson va Powers (1973) đề ra 5 tiecircu chuẩn độc lậpbull Tỷ lệ thời gian thực hiện dự aacuten với thời gian ước lượngbull Tỷ lệ chi phiacute thực tế vagrave ngacircn saacutech thực hiệnbull Thaacutei độ của cấp quản lyacute đối với hệ thốngbull Nhu cầu thocircng tin của caacutec nhagrave quản lyacute được đaacutep ứng như thế nagraveo qua hệ thốngbull Taacutec động của dự aacuten đối với những hoạt động maacutey tiacutenh trong cocircng tyCaacutec đo lường khaacutec để đaacutenh giaacute thagravenh cocircng của hệ hỗ trợ quản lyacute (MSS)bull Sự sử dụng hệ thống (dự định dugraveng hoặc thực sự dugraveng)bull Thỏa matilden của người dugravengbull Thaacutei độ taacuten thagravenhbull Mức độ hệ thống hoagraven thagravenh caacutec mục tiecircu ban đầubull Phần thưởng đối với tổ chức (giảm chi phiacute tăng doanh thuhellip)bull Tỷ số lợi iacutech chi phiacute
bull Mức độ thể chế hoacutea của MSS trong tổ chứcDo bởi tiacutenh đa dạng của DSS necircn việc đaacutenh giaacute sự thagravenh cocircng của hệ nagravey cũng khoacute khăn tuynhiecircn cũng coacute thể coacute một số yếu tố giuacutep cho DSS thagravenh cocircng như sự tham gia người dugravenghuấn luyện người dugraveng hỗ trợ quản lyacute cấp cao nguồn thocircng tin đặc điểm của những nhiệmvụ coacute liecircn quan (cấu truacutec bất định độ khoacute phụ thuộc)
Chương5Nhoacutem hỗ trợ quyết định vagrave nhoacutemcocircng nghệ phần mềm
51Nhoacutem tạo quyết định
MDM-Holsapple đatilde gợi yacute chuacuteng ta sử dụng giới hạn người tạo quyết định
Một nhoacutem lagrave kết cấu MDM nơi magrave nhiều người ra quyết định hoagraven toagraven tương taacutec
Một đội lagrave kết cấu MDM nơi caacutec thagravenh viecircn tư vấn cho người đưa ra quyết định nhưng khocircng tương taacutec
Một Ủy ban lagrave kết cấu MDM với một người tạo quyết định duy nhất vagrave sự tương taacutec giữa caacutec thagravenh viecircn
Mạng thocircng tin
Mạng lưới baacutenh xe mỗi người tham gia coacute thể giao tiếp với người đưa ra quyết định ở trung tacircm nhưng khocircng phải với người tham gia khaacutecCấu truacutec nagravey lagrave khocircng thỏa matilden tất cả những người tham gia ngoại trừ người ra quyết định
Mạng dacircy chuyền Tham gia chuyển tiếp thocircng tin chỉ để noacute luocircn liền kề nhau trong chuỗi
Thagravenh viecircn cuối cugraveng ko được đaacutep ứng
Mạng vograveng trograven Tương tự như chuỗi nhưng kết thuacutec được kết nối
Mạng kết nối hoagraven toagraven khocircng coacute hạn chế về giao tiếp vagrave tương taacutec giữa caacutec thagravenh viecircnNoacutei chungnoacute đaacutep ứng hầu hết caacutec kết nối của người tham gia nhưng truyền đạt thocircng tin mất nhiều thời gian vagrave coacute nhiều cơ hội xảy ra lỗi
Nhoacutem hagravenh vi vagrave chuẩn mực
MDMs thiết lập caacutec chỉ tiecircu hướng dẫn quaacute trigravenh ra quyết định
Một chuẩn mực quy định cụ thể những gigrave thagravenh viecircn trong nhoacutem dự kiến sẽ lagravem trong những hoagraven cảnh nhất định
Quy tắc gửi coacute thể được thocircng qua viacute dụ đaacutenh giaacute ngang hagraveng hoặc xử phạt
Lagravem thế nagraveo để đưa ra quyết định
Việc chọn lựa magrave trong đoacute việc sử dụng cấu truacutec MDM phải được dựa trecircn một số yếu tố liecircn quan với bối cảnh quyết định
Viacute dụmột cấu truacutec riecircng lẻ sẽ lagravem việc nơi magrave quyết định được cấu truacutec cao vagrave thocircng tin lagrave coacute sẵn
Một ủy ban cơ cấu sẽ lagrave sự lựa chọn khi người ra quyết định khocircng thể đưa ra quyết định một migravenh
52Caacutec vấn đề thường gặp trong nhoacutem
Kiacutech thước Noacutei chung sự nhất triacute vagrave gắn kết giữa caacutec thagravenh viecircn tỉ lệ nghịch với phạm vi nhoacutem Trong nhoacutem lớn rất dễ higravenh thagravenh caacutec nhoacutem nhỏ vagrave hoạt động rời rạc
Tư duy tập thể Trong nhoacutem lớn mọi người coacute xu hướng suy nghĩ đểđạtđược sự nhất triacute necircn khocircng phaacutet huy được sự saacuteng tạo
Caacutec vấn đề về xatilde hội
Xung đột Trong 1 nhoacutem ai cũng muốn migravenh lagrave giỏi nhất necircn dễ dẫn đến xung đột
Ẩn danh(Giấu tecircn) Đacircy lagrave phương phaacutep được sử dụng để kiểm soaacutet xung đột Cho caacutec thagravenh viecircn tham gia ẩn danh
Vấn đề giới tiacutenh Nam vagrave nữ thường coacute những thế mạnh khaacutec nhau điều nagravey coacute thể lagrave sức mạnh trong 1 thiết lập MDM
Đagravem phaacuten vagrave quyết định
Một quyết định coacute thể liecircn quan đến nhiều quan điểm khaacutec nhau vigrave thế cần phải coacute sự đagravem phaacuten
Caacutec thiết kế của cơ chế hỗ trợ cho MDM phải phugrave hợp với caacutec hoạt độngđagravemphaacuten
Những hoạt động nagravey bao gồm việc thu nhận yacute kiến của caacutec thagravenh viecircn 1 caacutech cocircng bằng
53Cocircng nghệ hỗ trợ MDM
Organizational DSSndash 1 hệ thống cung cấp caacutec quyết định hỗ trợ
Group Support Systemndash Cocircng nghệ sử dụng sự hỗ trợ của nhiều becircn tham gia
Group DSS ndash Lagrave 1 hệ thống được thiết kế đặc biệt để hỗ trợ cho MDM
DSS ndash Lagrave 1 hệ thống dưới sự kiểm soaacutet của 1 người quyết định hệ thống nagravey cung cấp 1 bộ cocircng cụ giuacutep phacircn tiacutech hoagraven cảnh đểđưa ra quyết định vagrave nacircng cao hiệu quả của quyết địnhđoacute
53Cocircng nghệ hỗ trợ MDM
Organizational DSSndash 1 hệ thống cung cấp caacutec quyết định hỗ trợ
Group Support Systemndash Cocircng nghệ sử dụng sự hỗ trợ của nhiều becircn tham gia
Group DSS ndash Lagrave 1 hệ thống được thiết kế đặc biệt để hỗ trợ cho MDM
DSS ndash Lagrave 1 hệ thống dưới sự kiểm soaacutet của 1 người quyết định hệ thống nagravey cung cấp 1 bộ cocircng cụ giuacutep phacircn tiacutech hoagraven cảnh đểđưa ra quyết định vagrave nacircng cao hiệu quả của quyết địnhđoacute
Mục tiecircu của cocircng nghệ hỗ trợ MDM
Quy trigravenh hỗ trợ tập trung vagraveo quaacute trigravenh tạo điều kiện thuận lợi cho sự tương taacutec
Cơ chế cấu truacutec quaacute trigravenh chi phối caacutec hoạt động truyền thocircng
Nhiệm vụ hỗ trợ cocircng việc coacute thể chọn lựa tổ chức hoặc lấy thocircng tin
Nhiệm vụ cấu truacutec cocircng việc cho pheacutep truy cập đến kỹ thuật lọc kết hợp phacircn tiacutech kiến thức liecircn quan đến cocircng việc
Caacutec lớp loại cocircng nghệ hỗ trợ MDM
Phacircn loại theo đặc điểm do DeSanctis vagrave Gallupe đưa ra đề xuất một chương trigravenh ba cấp dựa trecircn caacutec tiacutenh năng được cung cấp
Hệ thống cấp 1 Mục điacutech chiacutenh lagrave tạo điều kiện thocircng tin liecircn lạc giữa caacutec thagravenh viecircn
Hệ thống cấp 2 Thiết kế để giảm thiểu rủi ro
Hệ thống cấp 3 Giuacutep điều chỉnh xử lyacute quyết định
Phacircn loại theo cocircng nghệ -Kraemer vagrave King tập trung vagraveo cocircng nghệ aacutep dụng
Cocircng nghệ bảng mạch điện tử
Hội nghị trực tuyến
Mạng lưới tập đoagraven
Trung tacircm thocircng tin
Mocirci trường cộng taacutec
Phograveng quyết định
Nhoacutem phần mềm
Phần mềm được thiết kế để hỗ trợ sự hợp taacutec bao gồm việc thu huacutet vagrave lưu trữ thocircng tin
Caacutec tổ chức dẫn đầu thị trường hiện tại lagrave Lotus Notes and Domino Microsoft Exchange Novell GroupWise and Oracle Office
Caacutec cocircng cụ trong một bộ phần mềm bao gồm người quản lyacute hội nghị (Lotus Sametime) vagrave trao đổi thocircng điệp (Lotus Notes Mail)
Xếp hạng phần mềm cho nhoacutem
Ellis vv đề xuất một hệ thống xếp hạng dựa vagraveo kiểu sự hỗ trợ noacute Cung cấp
Hệ thocircng điệp
Hệ thống hội thảo truyền higravenh
Hệ thống cộng taacutec soạn thảo
Nhoacutem phacircn phối giải phaacutep phần mền
Hệ thống phối hợp
Hệ thống thocircng minh đại diện
Lực lượng điều khiển phaacutet triển phần mềm cho nhoacutem
Một số nhacircn tố chiacutenh bao gồm
Tăng năng suất
Giảm số lượng caacutec cuộc họp
Tăng cường tự động hoacutea caacutec quy trigravenh lagravem việc thường xuyecircn
Cần phối hợp toagraven cầu tốt hơn
Tiacutenh sẵn sagraveng của những mạng lan rộng
Coleman vagrave Khanna liệt kecirc 10 nhacircn tố khaacutec
54Quản lyacute hoạt động MDM (Mobile Device Management - Quản lyacute thiết bị di động)
Một số phương phaacutep phối hợp phổ biến hơnMDM lagrave
Kỹ thuật nhoacutem định danh
Kỹ thuật Delphi
Sự phacircn xử
Hệ thocircng tin dựa trecircn vấn đề
Nemawashi
Kỹ thuật nhoacutem định danh
1-Mỗi người tham gia viết ra những yacute tưởng về những gigrave necircn quyết định
2-Lần lượt mỗi người tham gia trigravenh bagravey yacute tưởng của migravenh được ghi lại trecircn bảng Khocircng thảo luận ở đacircy
3-Sau khi tất cả caacutec yacute tưởng được trigravenh bagravey caacutec đại biểu coacute thể chất vấn những người khaacutec
4-Mỗi người tham gia bỏ phiếu cho mỗi yacute tưởng
Kỹ thuật Delphi
Về cơ bản tương tự như kỹ thuật nhoacutem định danh ngoại trừ những người khocircng bao giờ tham gia cuộc họp
Một cocircng cụ khảo saacutet được sử dụng để thu thập đầu vagraveo ban đầu từ caacutec thagravenh viecircn
Một cuộc khảo saacutet thứ hai được gửi đi với một bản toacutem tắt caacutec kết quả chung
Những bước lặp lại cho đến khi đạt được một sự đồng thuận hoặc nhigraven nhận của đa số
Sự phacircn xử(Arbitration )
Thiacutech hợp nhất khi caacutec thagravenh viecircn của MDM đại diện cho caacutec yếu tố đối lập
Những người tham gia đồng yacute rằng nếu lựa chọn thay thế hai becircn thỏa thuận khocircng được tigravem thấy thigrave một trọng tagravei viecircn becircn ngoagravei sẽ tham gia
Trọng tagravei sau đoacute lựa chọn thay thế ocircng hoặc xeacutet thấy thiacutech hợp nhất
Hệ thống thocircng tin dựa trecircn vấn đề (IBIS)
Lagrave một phương phaacutep lập luận cấu truacutec
Một đại diện cho IBIS lagrave một đồ thị với caacutec nuacutet vagrave caacutec liecircn kết
IBIS bắt đầu với lựa chọn của một nuacutet vấn đề gốc sau đoacute caacutec nuacutet vị triacute khaacutec nhau được liecircn kết với nuacutet gốc
Caacutec nuacutet vị triacute nagravey sau đoacute được đaacutenh giaacute dựa trecircn những lập luận gắn liền với chuacuteng
Nemawashi (được sử dụng rộng ratildei tại Nhật Bản)
1-Một hoặc nhiều thagravenh viecircn của MDM được chỉ định lagrave điều phối viecircnCaacutec điều phối viecircn sau đoacute chọn người tham gia cograven lại
2-Điều phối viecircn xacircy dựng một tổng hợp caacutec sự lựa chọn vagrave sau đoacute caacutec chuyecircn gia đaacutenh giaacute caacutec lựa chọn
3-Điều phối viecircn lựa chọn một sự lựa chọn dựa trecircn kết quả ở trecircn(ở 2)
4-Sự thay thế được luacircn chuyển điều phối viecircn tigravem kiếm sự đồng thuận thocircng qua sự thuyết phục vagrave đagravem phaacuten
5-Nếu đạt được sự đồng thuận điều phối viecircn cho lưu thocircng một tagravei liệu magrave mỗi thagravenh viecircn MDM để lại dấu hiệu trecircn đoacute
55Nơi lagravem việc ảo
Nhiều tổ chức trecircn toagraven thế giới kinh doanh bất động sản cho cocircng nghệ hợp taacutec
Cocircng việc được trở thagravenh một điều bạn lagravem hơn lagrave một nơi bạn đi
Những thay đổi lớn nhất mang lại bởi nơi lagravem việc ảo coacute thể lagrave về văn hoaacute hay xatilde hội hơn lagrave về cocircng nghệ
Chương 6 Hệ thống thocircng tin điều hagravenh
61 Yacute nghĩa của EIS- Hệ thống thocircng tin điều hagravenh
- EIS lagrave một dạng đặc biệt của DSS được thiết kế để hỗ trợ ra quyết định ở cấp cao nhất của một tổ chức
- Lagrave một hệ thống thocircng tin hỗ trợ nhu cầu lập kế hoạch vagrave đaacutenh giaacute của caacutec nhagrave quản lyacute điều hagravenh
- EIS coacute thể giuacutep một CEO coacute được bức tranh tổng thể chiacutenh xaacutec nhất về caacutec hoạt động vagrave một bản toacutem tắt những gigrave magrave đối thủ cạnh tranh đang lagravem
- Caacutec hệ thống nagravey noacutei chung hoạt động dễ dagraveng vagrave trigravenh bagravey thocircng tin theo những caacutech dễ hiểu để việc tiếp thu được nhanh choacuteng (biểu đồ đồ thịhellip)
(Tagravei liệu thecircm EIS lagrave những loại hệ thống lagrave rất phức tạp trong tự nhiecircn Coacute thể noacutei hệ thống nagravey cũng cung cấp cho caacutec nhagrave quản lyacute với caacutec thiết bị coacute khả năng ra quyết định bằng caacutech sử dụng của noacute Hệ thống nagravey hoạt động trong điều kiện như vậy quan trọng như trong caacutec hệ thống khaacutec khocircng hỗ trợ Khả năng lưu trữ dữ liệu nặng lagravem cho noacute lyacute tưởng để được thocircng qua khocircng chỉ bởi caacutec doanh nghiệp lớn magrave cograven bởi caacutec doanh nghiệp nhỏ hơn Nhigraven chung hệ thống nagravey lagrave dagravenh cho caacutec nhacircn viecircn cấp cao hỗ trợ thagravenh thạo trong việc đưa ra caacutec quyết định quan trọng)
Caacutec phiecircn EIS tiecircu biểu- Phiecircn lagravem việc coacute thể bắt đầu với một baacuteo caacuteo về tigravenh higravenh tagravei chiacutenh vagrave kinh
doanh của một cocircng ty caacutec chỉ số hoạt động quan trọng được hiển thị rotilde ragraveng- EIS sẽ cho pheacutep caacutec giaacutem đốc điều hagravenh coacute thể đi sacircu vagraveo dữ liệu từ những con
số bất kỳ magrave noacute hỗ trợ- Việc điều hagravenh coacute thể lựa chọn một mức độ chi tiết ( VD danh số baacuten hagraveng) nếu
như cần điều tra thecircm- Lagrave một phương phaacutep tiếp cận coacute thể giuacutep việc ra quyết định tốt hơn
Những điều magrave EIS ko coacute- EIS khocircng phải lagrave sự thay thế cho caacutec hệ thống dựa trecircn caacutec maacutey tiacutenh khaacutec EIS
thực sự chỉ cung cấp dữ liệu cho caacutec hệ thống nagravey- Noacute khocircng thể biến caacutec bộ hệ điều hagravenh của maacutey tiacutenh thagravenh những ldquochuyecircn viecircn
giỏirdquo- Coacute thể được viacute một caacutech cao hơn như lagrave một trợ lyacute đaacuteng tin cậy coacute thể được gọi
đến bất khi nagraveo vagrave mỗi khi cần thiết
Tagravei liệu thecircm Sự khaacutec nhau giữa EIS vagrave DSS+ EIS thiết kế để hỗ trợ những người điều hagravenh cấp cao giuacutep họ khaacutem phaacute caacutec vấn đề vagrave caacutec cơ hội DSS hỗ trợ những nười phacircn tiacutech cố gắng trả lời cacircu hỏi caacutei gigrave coacute thể lagravem cugraveng với một cơ hội hoặc một vấn đề
Chiều EIS DSSNhững người sử dụng thocircng thường
Duyệt dữ liệu đi xuống truy xuất trạng thaacutei
Hỗ trợ phacircn tiacutech vagrave quyết định
Sự thuacutec đẩy Tiacutenh thiacutech hợp Tiacutenh hiệu quảỨng dụng Queacutet mocirci trường đaacutenh giaacute
hiệu suất nhận dạng caacutec vấn đề vagrave caacutec cơ hội
Caacutec quyết định quản lyacute trecircn caacutec lĩnh vực đa dạng
Hỗ trợ quyết định Caacutec chiacutenh saacutech caacutec quyết định khocircng coacute cấu truacutec ở mức cao vagrave hỗ trợ giaacuten tiếp
Hỗ trợ caacutec quyết định lặp lại caacutec quyết định khocircng thể đoaacuten trước ra quyết định khocircng coacute cấu truacutec vagrave baacuten cấu truacutec
Loại thocircng tin Caacutec thocircng tin tin tức thocircng tin becircn ngoagravei về khaacutech hagraveng đối thủ cạnh tranh mocirci trường caacutec baacuteo caacuteo theo yecircu cầu vagrave định thời về caacutec hoạt động becircn trong
Caacutec thocircng tin hỗ trợ caacutec tigravenh huống đặc biệt
Sử dụng coacute nguyecircn tắc
Dograve theo vết vagrave điều khiển nhận dạng cơ hội
Hoạch định tổ chức phacircn nhoacutem vagrave điều khiển
Khả năng phugrave hợp với những người sử dụng caacute nhacircn
Thiết kế loại ra quyết định cho mỗi người điều hagravenh caacute nhacircn bằng nhiều lựa chọn đầu ra
Cho pheacutep caacutec đaacutenh giaacute caacute nhacircn caacutec khả năng what-if lựa chọn loại hộp hội thoại
Đồ họa Phải coacute Lagrave một phần quan trọng của nhiều DSS
Thacircn thiện người sử dụng
Phải coacute Phải coacute nếu khocircng coacute người sử dụng trung gian
Xử lyacute thocircng tin Lọc neacuten thocircng tin dograve theo vết dữ liệu vagrave thocircng tin quan trọng
EIS kiacutech thiacutech caacutec cacircu hỏi caacutec cacircu trả lời bằng caacutech sử dụng DSS vagrave phản hồi lại EIS
Hỗ trợ caacutec thocircng tin chi tiết
Truy xuất thường xuyecircn caacutec mức chi tiết của bất kỳ thocircng tin tổng hợp nagraveo (duyệt dữ
Coacute thể coacute trong DSS nhưng khocircng thường
liệu chi tiết)Cơ sở mocirc higravenh Caacutec chức năng coacute sẵn bị hạn
chếLagrave điểm cốt lotildei của DSS
Cấu truacutec Theo người baacuten sản phẩm hoặc theo caacutec chuyecircn gia hệ thống thocircng tin
Theo người sử dụng hoặc caacute nhacircn hoặc caacutec chuyecircn gia từ caacutec trung tacircm thocircng tin hoặc phograveng ban hệ thống thocircng tin
Phần cứng Mainframe caacutec trạm RISC mạng LANs hoặc caacutec hệ thống phacircn bố
Mainframe caacutec trạm RISC caacutec maacutey PC hoặc caacutec hệ thống phacircn bố
Bản chất caacutec goacutei phần mềm
Truy xuất tương taacutec dễ dagraveng đến nhiều cơ sở dữ liệu truy xuất trực tuyến caacutec khả năng DBMS phức tạp caacutec liecircn kết phức tạp
Caacutec khả năng tiacutenh toaacuten lớn caacutec ngocircn ngữ mocirc higravenh mocirc phỏng ứng dụng vagrave caacutec bộ tạo DSS
Bản chất caacutec thocircng tin
Trigravenh bagravey thocircng tin được phaacutet sinh trước về quaacute khứ vagrave hiện tại tạo caacutec thocircng tin mới về quaacute khứ hiện tại tương lai
Tạo thocircng tin mới về quaacute khứ hiện tại tương lai
62 Lịch sử EIS- EIS xuất hiện lần đầu tiecircn tại MIT vagraveo những năm 1970
- Những EIS đầu tiecircn được phaacutet triển bởi caacutec doanh ngiệp lớn sẵn sagraveng chấp nhận rủi ro để đạt được lợi thế cạnh tranh
- Vagraveo những năm 1980 caacutec nhagrave cung cấp đatilde phaacutet triển một số cơ sở khaacutech hagraveng rộng vagrave cocircng nghệ EIS được tiếp tục phaacutet triển cho đến ngagravey nay
(Tagravei liệu thecircm Sử dụng DSSEIS cho phaacutet triển bền vững + Một số nghiecircn cứu đatilde được tiến hagravenh để kiểm tra việc thực hiện của EIS trong khu vực cocircng cộng vagrave chiacutenh phủ caacutec nước tổ chức kể từ khi chuacuteng được phaacutet triển theo định hướng lợi nhuận cho caacutec cocircng ty tư nhacircn (Hasan vagrave Hasan năm 1997) Theo một nghiecircn cứu tiến hagravenh tại Mỹ ở hơn 300 cocircng ty kết quả cho thấy sự khaacutec biệt của EIS giữa tư nhacircn vagrave chiacutenh phủ một số kết quả thuacute vị được phaacutet hiệnViacute dụ khoacute khăn hơn để chuyển tiền từ một tagravei khoản khaacutec trong một EIS của chiacutenh phủ cũng lagrave khoacute khăn hơn để biện giải thiacutech cho những chi phiacute phaacutet triển EIS của chiacutenh phủ Một nghiecircn cứu khaacutec được tiến hagravenh ở Australia
cho thấy rằng EIS cung cấp cho quản lyacute một higravenh ảnh chiacutenh xaacutec hơn về tổ chức thực hiện vagrave cung cấp hỗ trợ cho caacutec lợi iacutech chiến lược cải thiện khocircng chỉ cho caacutec nhagrave quản lyacute nhưng cograven cho phần cograven lại của tổ chức Dựa trecircn caacutec hệ thống được thiết kế cho caacutec cocircng ty tư nhacircn với một caacutech rotilde ragravengxaacutec định mục tiecircu EIS lagrave thiacutech hợp cho caacutec tổ chức cocircng cộng hiện đại nhưng cần phải được linh hoạt hơn vagrave kết thagravenh chugravem một phạm vi rộng hơn khả năng vagrave phương tiện hơn so với khu vực tư nhacircn ban đầu theo định hướng sản phẩm (Hasan vagrave Hasan năm 1997) Điều nagravey coacute thể lagrave do thực tế rằng caacutec hoạt động khu vực cocircng lagrave bắt buộc coacute taacutec động rộng phải đaacutep ứng sự mong đợi duy nhất cocircng cộng thường coacute mục tiecircu mơ hồ vagrave macircu thuẫn iacutet quyền tự chủ vagrave kiểm soaacutet việc ra quyết định vagrave nhacircn viecircn lagrave khoacute khăn hơn (Watson vagrave Carte2000) + Toacutem lại EIS lagrave một khaacutei niệm thagravenh cocircng noacute phaacutet triển qua nhiều năm tuy nhiecircn EIS khắc phục khiếm khuyết của migravenh bằng caacutech tiến hagravenh nghiecircn cứu liecircn tục)
63 Tại sao những người điều hagravenh hagraveng đầu lại khaacutec nhau- Họ lagrave những doanh nghiệp theo định hướng coacute suy nghĩ
- Coacute một khoảng khocircng gian rộng để kiểm soaacutet
- Họ chịu traacutech nhiệm cho việc thiết lập chiacutenh saacutech
- Họ đại diện cho tổ chức mocirci trường becircn ngoagravei
- Hagravenh động của họ tạo ra những kết quả đaacuteng kể về tagravei chiacutenh vagrave con người
Tần số caacutec hoạt động điều hagravenh- Xử lyacute xaacuteo trộn 42
- Hoạt động kinh doanh 32
- Phacircn bổ nguồn lực 17
- Đagravem phaacuten 3
- Những điều khaacutec 6
Handling Disturbances 42
Entrepreneurial Activites 32
Resource Allocation 17
Negotiation 3
Other 6
Những thocircng tin điều hagravenh cần thiết- Quản lyacute xaacuteo trộn coacute thể yecircu cầu sự chuacute yacute xung quanh đồng hồ
- Hoạt động kinh doanh yecircu cầu điều hagravenh để dự đoaacuten những thay đổi trong mocirci trường
- Nhiệm vụ phacircn bổ tagravei nguyecircn yecircu cầu lựa chọn người quản lyacute vagrave caacutec nguồn lực hạn chế được triển khai
- Đagravem phaacuten yecircu cầu cập nhật thocircng tin từng phuacutet để coacute thể xacircy dựng được sự đồng thuận
Caacutec loại thocircng tin điều hagravenh- Hệ thống kế toaacuten coacute liecircn quan đến việc tiacutenh toaacuten thu nhập hoạt động cho caacutec lĩnh
vực cụ thể lagrave quan trọng hơn so với caacutec hệ thống kế toaacuten truyền thocircng- Thocircng tin về thị trường khaacutech hagraveng cung cấp giaacute trị trong việc quyết định chiến
lược- Caacutec thocircng tin cần thiết thường được truyền đi trecircn một số hệ thống maacutey tiacutenh vagrave
nằm trong toagraven tổ chức- Caacutec thocircng tin được sử dụng thường lagrave ngắn hạn vagrave dễ thay đổi
Phương thức để xaacutec định thocircng tin cần thiết
Rockart xaacutec định được năm phương thức cơ bản để xaacutec định thocircng tin cần thiết
- Phương thức dựa trecircn kết quả- Phương thức rỗng- Phương thức chỉ số khoacutea- Phương thức tổng hợp nghiecircn cứu- Phương thức dựa vagraveo nhacircn tố then chốt dẫn đến thagravenh cocircng
64 Thagravenh phần EIS
- Sản phẩm EIS đầu tiecircn được phaacutet triển để sử dụng trecircn maacutey tiacutenh cấu higravenh cao nhưng caacutec sản phẩm hiện nay nhằm mục tiecircu lagrave nền tảng ClientServer
- Những nền tảng linh hoạt hơn coacute thể thiacutech ứng với thay đổi trong tổ chức vagrave cocircng nghệ
- Sử dụng dữ liệu thời gian thực dẫn đến quyết định nhanh hơn nhiều thocircng tin hơn
Thagravenh phần phần cứng- Một EIS khocircng đogravei hỏi coacute phần cứng cụ thể hoặc duy nhất nagraveo- Chigravea khoacutea của vấn đề lagrave để đảm bảo rằng caacutec thagravenh phần của EIS tối ưu hoacutea vagrave
phugrave hợp với tagravei nguyecircn maacutey tiacutenh của tổ chức- Hệ thống nagravey phải được cấu higravenh để caacutec nguồn tagravei nguyecircn phugrave hợp với những
người điều hagravenh chuacuteng
Thagravenh phần phần mềm- Traacutei ngược với phần cứng phần mềm thường được chuyecircn mocircn hoacutea cao cho caacutec
bagravei toaacuten về miền- Sự chuyecircn mocircn hoacutea nagravey thường đạt được bằng caacutech sử dụng thagravenh phần off-the-
shelf cho toagraven bộ EIS vagrave caacutec mocirc-đun tugravey chỉnh để đaacutep ứng nhu cầu cụ thể- Lotus Notes lagrave một viacute dụ điển higravenh Noacute coacute thể được sử dụng một migravenh hoặc coacute
thể phục vụ becircn thứ ba mocirc-đun plug-in
Cocircng nghệ EIS hiện nay
Dobrzeniecki đề xuấtphacircn loạitừng cấptheo bachức năng- Loại 1 sản phẩm bao gồmmột bộ đầy đủcaacutec ứng dụngtừ mộtnhagrave cung cấp- Loại 2 sản phẩm đượcthựchiệnở phần đầu củacaacutecsản phẩmDSS đượcphaacutet triển
bởicugravengmộtnhagrave cung cấp- Loại 3 sản phẩmkết hợp với nhautheo bất kỳ số lượngthuộc sở hữu củacocircng ty
65 Xacircy dựng EIS
- Xacircy dựngmộtEISgiống nhưxacircydựngmột số hệ thống khaacutec củamocirc higravenh hệ thống thocircng tin
- Việcphaacutet triểncấu truacutecnecircn được theo dotildeitừ quaacute trigravenh thiết kế đến quaacute trigravenhthực hiện
- Tuy nhiecircn một dự aacuten phaacutet triển EIScoacute xu hướnglagrave thống nhấtvagraveyecircu cầu hỗ trợ caacutec nhagrave quản lyacute latildenh đạo
- Xacircy dựng một EIScoacute thểphaacutet hiện ra đượccaacutectigravenh huống khoacute khănmagravemột nhagrave phaacutet triển chưabao giờ gặp phải
Mocirc higravenh EIS
Khung phaacutet triển một EIS
- Watson et al đề nghị xacircy dựngkhung với ba thagravenh phần+ Caacutech tiếp cận tập trung vagraveo yếu tốcon người vagrave dữ liệu coacute liecircn quan đến EIS+ Quaacute trigravenh phaacutet triển cần sự linh hoạt vagrave tương taacutec+ Người sử dụng - hệ thống hộp thoại bao gồm một ngocircn ngữ hagravenh động để xử lyacute caacutec lệnh
Lợi iacutech của EIS- Dễ duy trigrave caacutec mục tiecircu coacute tổ chức- Dễ truy xuất thocircng tin- Cho pheacutep người sử dụng nacircng cao hiệu suất hơn
- Tăng chất lượng ra quyết định- Cung cấp sự cải tiến cạnh tranh- Tiết kiệm thời gian của người sử dụng- Tăng khả năng vagrave chất lượng giao tiếp- Cung cấp khả năng điều khiển tốt hơn trong tổ chức- Cho pheacutep tham gia caacutec vấn đề vagrave caacutec cơ hội- Cho pheacutep hoạch định- Cho pheacutep tigravem kiếm nguyecircn nhacircn của một vấn đề- Thảo matilden caacutec yecircu cầu của người điều hagravenh
Hạn chế của EIS vagrave 1 số sai lầm cần traacutenh
- Chi phiacute một cuộc khảo saacutetnăm1991 chothấychi phiacute phaacutet triểntrungbigravenh365000USDvớichi phiacute vận hagravenhhagraveng năm lagrave$200000 (EIS)
- Cocircng nghệ hạn chếEIScần phảiđượctiacutech hợp hoagraven toagravenvagraveokiếntruacuteccủadoanh nghiệphiện tại do đoacute noacutelagrave một thaacutech thứclớn đối vớithiết kế
- Hạn chế tổ chức cơ cấu tổ chứccoacute thể khocircng phugrave hợp
Sự hạn chế về tổ chức- Chương trigravenh nghị sự vagrave thời gian chệch EIS mocirc tả một phần việc thực hiện một
chương trigravenh nghị sự vagrave coacute thể dễ dagraveng đạt được sự tin cậy một caacutech chắc chắn- Đồng bộ hoacutea việc quản lyacute sự tin cậy đuacuteng luacutec đặc biệt baacuteo caacuteo EIS coacute thể phaacute
vỡ sự ổn định thiết lập caacutec chu trigravenh baacuteo caacuteo một caacutech tốt nhất- Sự bất ổn EIS phản ứng nhanh coacute thể gacircy ra việc taacutec động trở lại một caacutech
nhanh choacuteng dẫn đến sự thiếu ổn định trong tổ chức
Sự thất bại lagrave thay thế khocircng thể chấp nhận được- Một số yếu tố lagravem EIS thất bại
+ Thiếu sự hỗ trợ về mặt quản lyacute+ Vấn đề chiacutenh trị+ Thất bại của nhagrave phaacutet triển+ Lỗi về cocircng nghệ+ Giaacute cả+ Thời gian
66 Ra quyết định điều hagravenh trong tương lai vagrave EIS
- Coacute một vagravei điều kiện sẽ được hợp nhất cho việc chuyển đổi cocircng nghệ Trong đoacute một vagravei điều kiện coacute thể dễ dự đoaacuten Hai điều kiện magrave ta coacute thể thấy lagrave+ Phaacutet triển cocircng nghệ maacutey tiacutenh trong việc điều hagravenh sẽ tạo ra sự chuyển đổi được chấp nhận một caacutech dễ dagraveng hơn+ Mở rộng traacutech nhiệm điều hagravenh sẽ mở rộng nhu cầu thocircng tin
Tương lai của EIS- EIS thocircng minh Những tiến bộ trong cocircng nghệ AI sẽ được triển khai trong caacutec
EIS- EIS đa phương tiện Cơ sở dữ liệu đa phương tiện sẽ cho pheacutep tiacutech hợp văn bản
giọng noacutei vagrave higravenh ảnh trong tương lai- EIS thocircng tin Tương lai EIS sẽ mở rộng hơn trong việc sử dụng dữ liệu becircn
ngoagravei doanh nghiệp- EIS kết nối Giao tiếp với băng thocircng rộng cho pheacutep kết nối liecircn thocircng lớn hơn
Chương 7 HỆ CHUYEcircN GIA VAgrave TRIacute TUỆ NHAcircN TẠO
71 Caacutec khaacutei niệm
72 Triacute thocircng minh của triacute tuệ nhacircn tạo
73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia
74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia
75 Lợi iacutech vagrave hạn chế của hệ chuyecircn gia
71 Caacutec khaacutei niệm
Chuyecircn mocircn (Expertise) sự hiểu biết rộng trong 1 lĩnh vực hẹp
Hệ chuyecircn gia (Expert Systems)1 chương trigravenh maacutey tiacutenh sử dụng 1 tập caacutec luật dựa trecircn tri thức của con người để giải quyết caacutec vấn đề đogravei hogravei phải coacute sự chuyecircn mocircn
Một số hệ chuyecircn gia nổi tiếng
DENDRAL (Standford 1960s Edward Feigenbaum)
MYCIN (Standford1970s Edward Shortliffe)
PROSPECTOR (MIT 1979)
Triacute tuệ nhacircn tạo (Artificial Intelligence ndash AI)
Triacute tuệ nhacircn tạo một bộ phacircn của ngagravenh khoa học maacutey tiacutenh quan tacircm đến việc thiết kế caacutec hệ thống maacutey tiacutenh thocircng minh đoacute lagrave caacutec hệ thống đưa ra caacutec đặc điểm magrave từ đoacute chuacuteng ta liecircn hệ với sự thocircng minh trong hagravenh động của con người (Barr vagrave Feigenbaum 1981)
Mục điacutech của AI
Mục điacutech khoa học xaacutec định caacutec gợi yacute để giải thiacutech caacutec loại khaacutec nhau của triacute tuệ thực
Mục điacutech kỹ thuật giải quyết caacutec vấn đề trong thế giới thực
Triacute tuệ nhacircn tạo kế thừa nhiều yacute tưởng quan điểm kỹ thuật từ caacutec ngagravenh khoa học khaacutec
- Triết học
- Logic Toaacuten học
- Tiacutenh toaacuten
- Khoa học tacircm lyacute Khoa học nhận thức
- Sinh học Thần kinh học
- Tiến hoacutea
Caacutec lĩnh vực ứng dụng trong Triacute tuệ nhacircn tạo
Mạng nơ ron thần kinh (Neural Networks)
Tiacutenh toaacuten sự tiến hoacutea
(Evolutionary Computation)
Hệ chuyecircn gia (Expert Systems)
Kỹ thuật xử lyacute tiếng noacutei (Speech Processing)
Kỹ thuật xử lyacute ngocircn ngữ tự nhiecircn
(Natural Language Processing)
Lập kế hoạch (Planning)
Robot (Robotics)
Khoa học higravenh ảnh (Vision)
Caacutec kỹ thuật thocircng dụng dugraveng trong AI
Biểu diễn(Representation)
Học (Learning)
Caacutec luật (Rules)
Tigravem kiếm (Search)
72 Triacute thocircng minh của triacute tuệ nhacircn tạo
Con người suy diễn như thế nagraveo
Phacircn loại (Categorization)
Caacutec quy tắc cụ thể
Heuristics
Kinh nghiệm trước đoacute
Dự tiacutenh trước
Maacutey tiacutenh suy diễn như thế nagraveo
Lập luận dựa trecircn luật IF-THEN mocirc tả tri thức được matilde hoacutea dưới dạng caacutec luật
Caacutec khung (Frames) lagrave caacutec đại diện mocirc tả caacutec tigravenh huống giống nhau lagrave điển higravenh của một vagravei phacircn loại
Lập luận dựa trecircn caacutec trường hợp mocirc phỏng giải phaacutep trước đoacute cho một vấn đề hiện tại
Nhận dạng mẫu phaacutet hiện acircm thanh higravenh dạng hoặc caacutec chuỗi dagravei
Caacutec dạng khaacutec của Triacute tuệ nhacircn tạo
Học maacutey- mạng nơron vagrave giải thuật di truyền
Lập trigravenh tự động ndash lagrave những kỹ thuật tạo ra caacutec chương trigravenh để lagravem 1 nhiệm vụ riecircng biệt (cho pheacutep những người khocircng phải lagrave người lập trigravenh coacute thể lập trigravenh được)
Cuộc sống nhacircn tạo ndash nỗ lực để taacutei tạo caacutec hiện tượng sinh học trong caacutec hệ thống dựa trecircn maacutey tiacutenh
73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia(Expert Systems- ES)
Theo Jackson (1999) Một hệ chuyecircn gia lagrave một chương trigravenh maacutey tiacutenh mocirc tả vagrave suy diễn với tri thức của một vagravei lĩnh vực để giải quyết vấn đề hay đưa ra caacutec lời khuyecircn
Cấu truacutec cơ bản của ES được dựa theo cấu truacutec chung của DSS Sự khaacutec biệt chiacutenh giữa ES vagraveDSS lagrave hệ ES thu thập caacutec kiến thức từ những
chuyecircn gia trong lĩnh vực quan tacircmĐặc trưng của hệ chuyecircn gia Hiệu quả cao Thời gian trả lời thỏa đaacuteng Độ tin cậy cao Dễ hiểu
Giao diện người dugraveng trong ES
Thiết kế giao diện người dugraveng tập trung vagraveo caacutec yếu tố như dễ dagraveng sử dụngcoacute độ tin cậy cao giảm tải những khoacute khăn khi sử dụng
Thiết kế necircn coacute một số tương taacutec (đầu vagraveo kiểm soaacutet vagrave truy vấn)
Cấu tạo giao diện người dugraveng gồm coacute magraven higravenh cảm ứng bagraven phiacutem buacutet saacuteng lệnh thoại caacutec phiacutem chuyecircn dụng
Cơ sở tri thức (Knowledge Base)
Chứa đựng caacutec tri thức cụ thể miền thu được từ caacutec chuyecircn gia miền
Coacute thể chứa caacutec mocirc tả caacutec hagravenh vi giải quyết vấn đề caacutec ragraveng buộc caacutec heuristics
Thagravenh cocircng của một ES dựa trecircn tiacutenh đầy đủ vagrave tiacutenh chiacutenh xaacutec của cơ sở tri thức
Mocirc tơ suy diễn (Inference Engine)
Ở đacircy tri thức được đặt để sử dụng tạo ra caacutec giải phaacutep để giải quyết vấn đề
Mocirc tơ nagravey coacute khả năng thực hiện diễn dịch hoặc suy diễn dựa trecircn caacutec luật hay caacutec caacutec sự kiện
Đồng thời cũng coacute khả năng sử dụng caacutec suy diễn mờ hay khocircng chiacutenh xaacutec dựa trecircn xaacutec suất hay aacutenh xạ mẫu
Vograveng điều khiển suy diễn
1 Aacutenh xạ caacutec luật với caacutec sự kiện đatilde được cho
2 Chọn luật để thực hiện
3 Thực hiện luật bằng caacutech thecircm caacutec sự kiện được suy diễn ra vagraveo bộ nhớ lagravem việc
Chuỗi suy diễn (Chaining)
Suy diễn tiến (forward chaining) maacutey suy diễn bắt đầu từ dữ liệu ban đầu vagrave thực hiện việc suy luận để đưa ra caacutec kết luận cuối cugraveng
Suy diễn lugravei (backward chaining) maacutey suy diễn bắt đầu từ dữ liệu điacutech vagrave tigravem ra tri thức hỗ trợ cho dữ liệu điacutech đoacute
Viacute dụ suy diễn lugravei
R1 Nếu coacute A vagrave B thigrave suy ra coacute D
R2 Nếu coacute B thigrave suy ra coacute C
R3 Nếu coacute C vagrave D thigrave suy ra coacute E
Ta coacute E ta xem trong 3 luật R1 R2 R3 luật nagraveo coacute E ta thấy R3 chứa E đồng thời chứa C vagrave D Xeacutet tiếp trong 2 luật R1 R2 luật nagraveo chứa C vagrave D R2 chứa C R3 chứa D Từ đoacute ta coacute được caacutec tri thức hỗ trợ suy diễn vagrave kết luận lagrave nếu coacute A vagrave B thigrave sẽ coacute E Hay nếu A vagrave B đuacuteng thigrave sẽ coacute E
Viacute dụ suy diễn tiến
Giả sử coacute tập chứa 3 luật sau
R1 Nếu coacute A vagrave B thigrave suy ra coacute D
R2 Nếu coacute B thigrave suy ra coacute C
R3 Nếu coacute C vagrave D thigrave suy ra coacute E
Nếu ta coacute A vagrave B thigrave chuacuteng ta suy ra được D từ R1 vagrave suy ra C từ R2 Với D vagrave C đatilde được suy ra ở trecircn giờ chuacuteng ta suy ra được E từ R3
Viacute dụ thực tế
Giả sử muốn biết magraveu của một con vật nuocirci tecircn lagrave Fred biết rằng noacute kecircu ộp ộp vagrave ăn ruồi
Coacute tập 4 luật ban đầu như sau
R1 Nếu X kecircu ộp ộp vagrave ăn ruồi thigrave X lagrave con ếch
R2 Nếu X kecircu chiecircm chiếp vagrave biết hoacutet thigrave X lagrave con chim
R3 Nếu X lagrave con ếch thigrave X coacute magraveu xanh
R4 Nếu X lagrave con chim thigrave X coacute magraveu vagraveng
74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia
Expert system shells lagrave một tập caacutec goacutei phần mềm vagrave caacutec cocircng cụ dugraveng để phaacutet triển caacutec hệ chuyecircn gia
Những Expert system shells đầu tiecircn thường rất rườm ragrave Mặc dugrave vậy noacute vẫn giuacutep cho người sử dụng sẽ khocircng phải bắt đầu lại từ đầu khi xacircy dựng một hệ chuyecircn gia mới
Những shell hiện đại bao gồm hai mocirc-đun chiacutenh lagrave cocircng cụ xacircy dựng một tập quy tắc vagrave mocirc tơ suy diễn
Xacircy dựng hệ chuyecircn gia
Bước 1 xacircy dựng mocirc higravenh bagravei toaacuten xaacutec định vấn đề nhiệm vụ magrave hệ thống sẽ thực hiện Caacutec dạng bagravei toaacuten cần hệ chuyecircn gia
Bagravei toaacuten diễn giải (InterPretation)
Bagravei toaacuten dự baacuteo (Prediction)
Bagravei toaacuten chuẩn đoaacuten (Diagnose)
Bagravei toaacuten gỡ rối (Debugging)
Bagravei toaacuten thiết kế
Tương tự như một dự aacuten phần mềm để xacircy dựng một hệ chuyecircn gia cần phải coacute caacutec yếu tố về nhacircn lực tagravei nguyecircn vagrave thời gian Những yếu tố nagravey ảnh hưởng đến giaacute thah của một hệ chuyecircn giaTrong phần nagravey cacircu hỏi thường được đặt ra lagrave tại sao cần phải xacircy dựng một hệ chuyecircn giaTrước khi bắt đầu phải xaacute định rotilde bagravei toaacuten đạt ra lagrave jiAi lagrave chuyecircn giaAi lagrave người sử dụng
1 Diễn giải (InterPretation) Nghiecircn cứu 1 vấn đề -gt Dựa trecircn những biểu hiện thuộc tiacutenh đặc trưng becircn ngoagravei -gt Tư vấn
(hoặc đưa ra kết luận hay mocirc tả dễ hiểu từ tập dữ liệu thocirc)
2 Bagravei toaacuten dự baacuteo (Prediction) Coacute thể dự đoaacuten được hagravenh vi kết quả dựa trecircn caacutec hiện tượng -gt dự baacuteo
VD Dự baacuteo thời tiết động đấthellip
3 Bagravei toaacuten chẩn đoaacuten (Diagnoss) Xaacutec định caacutec lỗi caacutec bộ phận hỏng hoacutec của hệ thống dựa trecircn caacutec dữ liệu quan saacutet được
4 Bagravei toaacuten gỡ rối (Debugging) Mocirc tả caacutec phương phaacutep khắc phục hệ thống khi gặp sự cố
5 Bagravei toaacuten thiết kế Lựa chọn cấu higravenh caacutec đối tượng nhằm thoả matilden một số ragraveng buộc nagraveo đoacute
6 Giảng dạy Phần mềm dạy học coacute thể chuẩn đoaacuten vagrave sủa lỗi của học sinh trong quaacute trigravenh học tập
Để xaacutec định đuacuteng bagravei toaacuten magrave chuacuteng ta cần giải quyết thigrave phải trả lời đc một số cacircu hỏi
- cần hệ chuyecircn gia
Bước 2 thu thập tri thức lựa chọn cocircng cụ vagrave aacutep dụng
Trong bước thu thập tri thức vấn đề quan trọng lagrave lựa chọn chuyecircn gia những người magrave sẽ đoacuteng goacutep tri thức cho hệ thống Thocircng thường trong suốt quaacute trigravenh phaacutet triển thigrave chuyecircn gia được xem như một thagravenh viecircn của đội phaacutet triển
Hiện nay coacute rất nhiều cocircng cụ để xacircy dựng một hệ chuyecircn gia Phổ biến nhất lagrave JESS CLIPS vagrave OPS5
Bước 3 Thiết kế cơ sở tri thức thiết kế hệ thốngTri thức được biểu diễn trường minh trong cơ sở tri thức
Caacutec chuyecircn gia vagrave kỹ sư tri thức sẽ đối thoại với nhau bằng caacutec kỹ thuật đối thoại Suy diễn (SD) bảng Mocirc higravenh hoacutea SD quy nạp phacircn loại
Vấn đề bagraveo trigrave vagrave phaacutet triển
Caacutec hệ chuyecircn gia đogravei hỏi phải bảo trigrave vagrave phaacutet triển nhiều hơn so với caacutec hệ thống khaacutec Phải thường xuyecircn bổ sung tri thức mới vagrave thay đổi caacutec tri thức cũ để đổi mới hệ chuyecircn gia
Thu thập vagrave khắc phục lỗi do người sử dụng phaacutet hiện để kịp thời khắc phục những sai soacutet của hệ chuyecircn gia
75 Lợi iacutech vagrave hạn chế của caacutec hệ chuyecircn gia
Một số lợi iacutech chiacutenh
Thời gian trả lời hợp lyacute bằng hoặc nhanh hơn so với chuyecircn gia (người) để đi đến cugraveng một quyết định Hệ chuyecircn gia lagrave một hệ thống thời gian thực (real time system)
Khả năng trả lời với mức độ tinh thocircng bằng hoặc cao hơn so với chuyecircn gia (người) trong cugraveng lĩnh vực
Hệ chuyecircn gia giuacutep cho hiệu quả lagravem việc tăng bằng việc sử dụng tập caacutec luật một caacutech nhanh choacuteng magrave ko bị nhầm lẫn chuyecircn gia lagrave người coacute thể quecircn đi một số tri thức cơ sở lyacute luậ nhưng HCG thigrave ko
Quyết định của một người chuyecircn gia coacute thể bị thay đổi vagrave ko coacute tiacutenh thống nhất như quyết định của một hệ chuyecircn gia tạo ra
Hệ chuyecircn gia giuacutep cho người sử dụng coacute thể trau dồi sự hiểu biết trecircn lĩnh vuej cụ thể magrave noacute giải quyết hỗ trợ người ra quyết định coacute trigravenh độ như 1 chuyecircn gia trong quaacute trigravenh gia quyết định
Kiến thức của rất nhiều chuyecircn gia về một lĩnh vực nagraveo đoacute được đưa vagraveo hệ chuyecircn gia lagravem cho CSTT cuat HCG phong phuacute vagrave rộng lớn hơn rất nhiều
HCG giải thiacutech caacutec bước suy luận một caacutech dễ hiểu nhất quaacuten luacutec nagraveo cũng coacute thể sử dụng ko như chuyecircn gia con người
Hạn chế của caacutec hệ chuyecircn gia
Nhược điểm lớn nhất của hệ chuyecircn gia lagrave những yacute kiến chuyecircn mocircn thường rất khoacute matilde hoacutea vagrave giải neacuten
Hệ chuyecircn gia khocircng coacute khả năng tự học tự cập nhật kiến thức mới như caacutec chuyecircn gia magrave cần phải được matilde hoacutea lại khi noacute được cập nhật
Hệ chuyecircn gia khocircng thể nhận ra được vấn đề khocircng nằm trong miền kiến thức của hệ thống
Chương 8 Tri thức vagrave tiếp nhận
1 Bao gồm caacutec vấn đề
Dữ liệu thực tế đo lường hoặc quan saacutet coacute hoặc khocircng coacute bối cảnh
Thocircng tin dữ liệu được tổng hợp một caacutech hữu iacutech để giải quyết những khoacute khăn trong việc đưa ra quyết định
Tri thức bao gồm caacutec ứng dụng quy tắc thocircng tin hướng dẫn của người ra quyết định
2 Những caacutei nhigraven về tri thức
Đại diện lagravem thế nagraveo để diễn tả tri thức viacute dụ như một quyển saacutech khocircng phải lagrave tri thức nhưng noacute lại lagrave một đại diện của tri thức
Sản xuất tri thức lagrave một tập hơp của hagraveng tồn kho coacute thể được sản xuất cũng như mua lại
Tri thức lagrave 1 trong 6 trạng thaacutei của hệ thống
1Dữ liệu 2Thocircng tin 3Cấu truacutec thocircng tin 4Sự thấu hiểu 5Yacute kiến 6 Quyết định
3 Caacutec loại tri thức Phổ biến mocirc tả dữ liệu thocircng tin thủ tục mọi thứ lagravem như thế nagraveo lập luận chiacutenh saacutech hoặc caacutec quy tắc
4 Thu thập Tri thức hệ chuyecircn gia Hầu hết caacutec phương phaacutep đều bắt đầu với mocirc higravenh của caacutec taacutec vụ trong đoacute
hệ chuyecircn gia được xacircy dựng Trong đoacute mocirc tả về caacutec lĩnh vực được tạo ra Caacutec kỹ sư sử dụng caacutec mocirc higravenh giả thuyết vagrave nhận thức về quaacute trigravenh phacircn
tiacutech để gợi ra caacutech giải quyết vấn đề về tri thức từ caacutec chuyecircn gia
5 Caacutec chiều của thu thập tri thức KE- driven caacutec kỹ sư trao đổi trực tiếp với caacutec chuyecircn gia Expert-driven Caacutec chuyecircn gia trực tiếp đưa chuyecircn mocircn của họ vagraveo hệ
thống maacutey tiacutenh Machine-driven Sử dụng caacutec cocircng cụ suy luận để triacutech xuất tri thức từ một
tập caacutec viacute dụ
6 Kỹ thuật thu thập tri thức Trao đổi gồm 2 loại cơ bản lagrave coacute cấu truacutec(coacute kịch bản) vagrave khocircng coacute cấu
truacutec( đối thoại trực tiếp) Giao thức phacircn tiacutech bằng lời Khi caacutec chuyecircn gia thực hiện một cocircng việc
của họ thigrave một bản ghi về cocircng việc đoacute được thực hiện Caacutec kỹ sư sẽ xacircy dựng mocirc higravenh cho những gigrave được ghi lại trong bản ghi
Phương phaacutep sagraveng lọc caacutec chuyecircn gia so saacutenh caacutec nhoacutem liecircn tiếp trong ba đối tượng vagrave cho biết tại sao nhoacutem thứ hai lại khaacutec nhoacutem thứ ba
7 Thu thập tri thức từ nhiều nguồn Thu thập tri thức từ nhiều nguồn lagrave cần thiết để coacute được đầy đủ caacutec tri thức
cho một vấn đề quan điểm yacute kiến traacutei ngược nhau thường phaacutet sinh Phương phaacutep đồng thuận sẽ giuacutep giải quyết được vấn đề macircu thuẫn Kỹ thuật phacircn tiacutech Meta lagrave kỹ thuật được aacutep dụng trong caacutec trường hợp
khaacutec Caacutech tiếp cận bằng định lượng đogravei hỏi caacutec kỹ sư cần cacircn nhắc yếu tố đầu vagraveo của caacutec chuyecircn gia khaacutec nhau
8 Xaacutec nhận hợp lệ vagrave kiểm tra tri thức Một khi thu thập tri thức noacute phải được đaacutenh giaacute về khả năng sử dụng vagrave độ
chiacutenh xaacutec Hai vấn đề cụ thể lagrave hiệu lực của những kiến thức vagrave kiểm tra việc xacircy dựng cơ sở của tri thức
Cần xaacutec nhận xem liệu hệ thống coacute thể hoạt động ở mức độ tối thiểu khocircng
Xaacutec minh liecircn quan đến việc so saacutenh từng chi tiết kỹ thuật của hệ thống những gigrave đatilde được thực hiện cuối cugraveng
9 Một số caacutec biện phaacutep xaacutec nhận Độ chiacutenh xaacutec Khả năng thiacutech nghi Mức độ đầy đủ Bề rộng Độ sacircu Hiệu lực Tổng quan Chiacutenh xaacutec Hiện thực Độ tin cậy Tiacutenh hữu dụng Mức độ
Chương 9 Học maacutey
1 Logic mờ vagrave ngocircn ngữ mờ(Fuzzy Logic and Linguistic Ambiguity)
Ngocircn ngữ tự nhiecircn gồm những khaacutei niệm mơ hồ vagrave khocircng chiacutenh xaacutectruyền tải ngữ nghĩa thocircng qua tiacutenh xấp xỉkhocircng rotilde ragraveng
Những xấp xỉ nagravey giuacutep con người coacute thể truyền tải hết được yacute nghĩa nhưng maacutey thigrave khocircng hiểu
Lagravem sao biểu diễn caacutec tri thức sử dụng caacutec khaacutei niệm khocircng rotilde ragraveng(mờ) hoặc khocircng chiacutenh xaacutec
2 Khaacutei niệm cơ bản của logic mờ tập mờ lagrave những tập hợp khocircng coacute một giới hạn rotilde Mỗi phần tử của noacute chỉ
chứa một mức độ hagravem liecircn thuộc của từng phần tử Vigrave vậy tập mờ khocircng giống như tập cổ điển Tập mờ coacute thể kết hợp với nhau qua những luật mờ magrave đặc trưng cho những hagravenh động trạng thaacutei vagrave thuộc tiacutenh của logic mờ được tận dụng khi thực hiện một bộ điều khiển mờ
Logic mờ dựa trecircn yacute tưởng mỗi phần tử thuộc vagraveo một tập hợp ở một mức độ nagraveo đấy
Locircgic mờ cho pheacutep độ liecircn thuộc (microA )coacute giaacute trị trong khoảng (01) Locircgic mờ coacute thể được coi lagrave mặt ứng dụng của lyacute thuyết tập mờ để xử lyacute caacutec
giaacute trị trong thế giới thực cho caacutec bagravei toaacuten phức tạp
3 So saacutenh tiacutenh đuacuteng đắn logic mờ vagrave xaacutec suất Xaacutec suất thigrave đề cập đến khả năng xảy ra một biến cố hay một điều gigrave đoacute Logic mờ đề cập đến cấp độ magrave đặc tiacutenh ở hiện tại
o viacute dụ1 người coacute chiều cao 6 feet thigrave coacute cấp độ lagrave 05 về chiều cao
4 Ưu điểm của logic mờ Caacutech tiếp cận rất tự nhiecircnkhocircng phức tạp Coacute thể mocirc higravenh hoacutea caacutec hagravem phi tuyến tugravey yacute phức tạp
Coacute thể tận dụng được kinh nghiệm từ những chuyecircn gia hagraveng đầu trong mọi lĩnh vực
Logic mờ được xacircy dựng dựa trecircn ngocircn ngữ tự nhiecircnNền tảng của logic mờ lagrave dựa trecircn cơ sở giao tiếp của con người
5 Nhược điểm của logic mờ Trong 1 hệ thống phức tạpsử dụng logic mờ coacute thể trở thagravenh trở ngại cho
việc xaacutec thực độ tin cậy của hệ thống Cơ chế lập luận mờ khocircng thể học hỏi từ những lỗi sai
6 Mạng noron nhacircn tạo(ANN) Mạng noron nhacircn tạo lagrave một mocirc phỏng xử lyacute thocircng tinđược nghiecircn cứu ra
từ hệ thống thần kinh của sinh vậtgiống như bộ natildeo để xử lyacute thocircng tin ANNs lagrave chương trigravenh dựa trecircn maacutey tiacutenh đơn giản coacute chức năng lagrave một mocirc
higravenh bagravei toaacuten khocircng gian dựa trecircn thử nghiệm vagrave baacuteo lỗi
7 Học từ kinh nghiệm Tiến trigravenh Một mẫu dữ liệu được biểu diễn như một mạng lưới noronANN ldquodự
đoaacutenrdquo 1 đầu radự đoaacuten được so saacutenh với giaacute trị thực tế hoặc giaacute trị chiacutenh xaacutecNếu đoaacuten được chiacutenh xaacutec thigrave khocircng coacute hagravenh động nagraveo được thực hiện
Nếu dự đoaacuten sai ANN kiểm tra lại vagrave xaacutec định lại thocircng số để điều chỉnh Một mẫu dữ liệu khaacutec được biểu diễn vagrave quaacute trigravenh nagravey được lặp lại
8 Nguyecircn tắc cơ bản của cocircng nghệ nơron Caacutec yếu tố xử lyacute cơ bản trong hệ thống thần kinh của con người lagrave tế bagraveo
thần kinhMạng lưới của tế bagraveo nagravey lagrave liecircn kết với nhau nhận được thocircng tin từ caacutec cảm biến trong mắt taihellip
Thocircng tin nhận được bởi tế bagraveo thần kinh hoặc lagrave sẽ kiacutech thiacutech noacute(sẽ được chuyển qua 1 thocircng điệp dọc theo mạng lưới) hoặc lagrave sẽ ngăn cản noacute(ngăn cản dograveng thocircng tin)
Độ nhạy coacute thể thay đổi qua thời gian hoặc sau khi coacute được kinh nghiệm
9 Cấu truacutec mạng Một ANN gồm 3 lớp cơ bản
Lớp đầu vagraveo nhận dữ liệu Lớp becircn trong hoặc lagrave lớp ẩn xử lyacute dữ liệu Lớp đầu ra chuyển tiếp kết quả cuối cugraveng của mạng
10Mạng nơ ron Thường coacute nhiều đầu vagraveo mỗi đầu vagraveo với mức ảnh hưởng vagrave tầm quan
trọng riecircng của noacute Một đầu vagraveo quan trọng coacute thể được sử dụng để khuếch đại đầu ra caacutec hagravem trạng thaacutei tổng hợp caacutec trọng số của caacutec yếu tố
đầuvagraveo khaacutec nhauvagraveo một giaacute trị duy nhất Caacutec hagravem chuyển giao xử lyacute caacutec giaacute trị trạng thaacutei vagrave tạo đầu ra
11Huấn luyện mạng nơ ron Trong mocirc higravenh coacute giaacutem saacutetANN được đến so saacutenh dự đoaacuten của chiacutenh
noacute với thocircng tin phản hồi coacute chứa caacutec kết quả mong muốn ANN sẽ phải tigravem caacutech thay đổi caacutec tham số becircn trong củamigravenh (caacutec trọng số vagrave caacutec ngưỡng) để tạo necircn một aacutenh xạ coacute khả năng aacutenh xạcaacutec đầu vagraveo thagravenh caacutec đầu ra mong muốn Sự thay đổi nagravey được tiến hagravenh nhờ việc so saacutenh giữa đầu ra thực sự vagrave đầu ra mong muốn
Trong mocirc higravenh khocircng coacute giaacutem saacutetANN nhận được dữ liệu vagraveo nhưng khocircng phải coacute bất kỳ thocircng tin phản hồi về kết quả mong muốn
Phần lớn caacutec ứng dụng nằm trong vugraveng của caacutec bagravei toaacuten ước lượng như mocirc higravenh hoacuteathống kecirc neacuten lọc phacircn cụm
12Lợi iacutech Liecircn kết với mạng noron Traacutenh caacutech lập trigravenh tường minh Giảm nhu cầu của chuyecircn gia ANNs thigrave thiacutech nghi với caacutec yếu tố đầu vagraveo thay đổi Khocircng cần thiết cho cơ sở tri thức tinh chế ANNs coacute tiacutenh động vagrave cải thiện với việc sử dụng Coacute khả năng xử lyacute dữ liệu khocircng chiacutenh xaacutec hoặc khocircng đầy đủ Cho pheacutep tổng quaacutet hoacutea từ thocircng tin cụ thể Cho pheacutep thu thập cảm giaacutec thocircng thường vagraveo miền giải quyết vấn đề
13Hạn chế của việc liecircn kết với mạng noron ANNs khocircng thể giải thiacutech được suy luận Bản chất hộp đen thường khiến cho vấn đề traacutech nhiệm vagrave độ tin cậy phaacutet
sinh lagrave khoacute khăn Lặp đi lặp lại quaacute trigravenh huấn luyện rất tốn thời gian Nguồn lực caacutec nhagrave phacircn tiacutech vagrave thiết kế coacute tay nghề cao vẫn lagrave đaacuteng lo
ngại Cocircng nghệ ANN thuacutec đẩy hạn chế của phần cứng hiện tại ANN yecircu cầu phải coacute sự tin tưởng ở đầu ra
14Giới thiệu về thuật toaacuten di truyền Cũng như mạng lưới thần kinh caacutec thuật toaacuten di truyền được dựa trecircn lyacute
thuyết sinh học Thuật toaacuten di truyền tigravem thấy nguồn gốc của chuacuteng trong caacutec lyacute thuyết
tiến hoacutea của chọn lọc tự nhiecircn vagrave thiacutech ứng với biến đổi khiacute hậu Kết quả thuật toaacuten di truyền lagrave từ giao phối 2 caacute thể trong quần thế để tạo
ra con caacutei đocirci khi tốt hơn so với bậc cha mẹ của chuacuteng 15Caacutec thagravenh phần cơ bản của thuật toaacuten di truyền
Toaacuten tử chọn lọc Caacutec caacute thể tốt được chọn lọc để đưa vagraveo thế hệ sau Sự chọn lọc nagravey căn cứ vagraveo độ thiacutech nghi với mocirci trường của mỗi caacute thể
Toaacuten tử lai gheacutep (crossover) Hai caacute thể cha vagrave mẹ trao đổi caacutec gen với nhau để tạo ra caacute thể con
Toaacuten tử đột biến (mutation) Một caacute thể thay đổi một số gen để biến đổi thagravenh một caacute thể mớiTất cả caacutec toaacuten tử trecircn khi thực hiện đều mang tiacutenh ngẫu nhiecircn
16Quaacute trigravenh cơ bản của một thuật toaacuten di truyền Khởi tạo
Đaacutenh giaacute quần thể
Lựa chọn NST thiacutech hợp nhất vagrave loại bỏ NST yếu nhất
Quy trigravenh giao nhau vagrave cải thiện quần thể
đột biến tiến trigravenh để khaacutem phaacute ra NST mới
17Ưu nhược điểm của việc kết hợp với thuật toaacuten di truyền Kiacutech thước quần thể lagrave 1 yếu tố quan trọng trong tốc độ của việc tigravem
kiếmnhưng noacute tương đối dễ dagraveng để dự đoaacuten tốc độ nagravey Giao nhau hoặc đột biến lagrave khocircng necircn đc sử dụng quaacute thường xuyecircn Luocircn coacute được iacutet nhất 1 giải phaacutep hợp lyacute Necircn coacute thể aacutep dụng chuacuteng cho caacutec vấn đề magrave chuacuteng ta khocircng coacute hướng
về caacutech giải quyết Sức mạnh của thuật toaacuten xuất phaacutet từ khaacutei niệm đơn giảnkhocircng phải từ
một thủ tục thuật toaacuten phức tạp 18Tương lai của học maacutey
Mạng lưới thần kinh nhacircn tạo vượt quaacute năng lực của con người trong caacutec trường hợp bị cocirc lập
Về mặt lyacute thuyếtmột maacutey tiacutenh coacute thể xử lyacute dũ liệu nhanh hơn hagraveng triệu lần so với 1 con người
May mắn thay cho chuacuteng tacon người tốt hơn nhiều khi magrave coacute được dữ liệumaacutey tiacutenh khocircng coacute 1 số thứ như lagrave 5 giaacutec quan
CHƯƠNG 10 KHO DỮ LIỆU
1 Kho dữ liệu Kho dữ liệu lagrave tuyển tập caacutec cơ sở dữ liệu tiacutech hợp hướng chủ đề được
thiết kế để trợ giuacutep cho một hệ hỗ trợ quyết định
Theo John Ladley Cocircng nghệ kho dữ liệu lagrave tập caacutec phương phaacutep kỹ thuật vagrave caacutec cocircng cụ coacute thể kết hợp hỗ trợ nhau để cung cấp thocircng tin cho người sử dụng trecircn cơ sở tiacutech hợp từ nhiều nguồn dữ liệu nhiều mocirci trường khaacutec nhau
Kho dữ liệu thường rất lớn tới hagraveng trăm GB hay thậm chiacute hagraveng Terabyte
2 Kho dữ liệu vận hagravenh (ODS) Một kho dữ liệu vận hagravenh Aacutep dụng kỹ thuật kho dữ liệu vagraveo caacutec hệ xử
lyacute giao taacutec lưu trữ dữ liệu cho một ứng dụng đặc thugrave Noacute đưa vagraveo kho dữ liệu một dograveng caacutec dữ liệu thocirc được thiết kế
3 So saacutenh
Kho dữ liệu vận hagravenh Kho dữ liệu
Dữ liệu theo chủ đề Dữ liệu theo chủ đề
Dữ liệu tiacutech hợp Dữ liệu tiacutech hợp
Dữ liệu thay đổi Dữ liệu khocircng thay đổi
Dữ liệu được cập nhật khi thay đổi
Dữ liệu giữ nguyecircn
Chỉ coacute dữ liệu hiện tạiDữliệu hiện tại vagrave dữ liệu lịch sử
Chu kỳ lagravem tươi dữ liệu ngắn Chu kỳ lagravem tươi dữ liệu dagravei
Chỉ coacute dữ liệu chi tiết Dữ liệu chi tiết vagrave dữ liệu tổng kết
Dugraveng cho caacutec quyết định ngắn hạn
Dugraveng cho hoạch định dagravei hạn
4 Kho dữ liệu cục bộ (Data Mart - DM)
Kho dữ liệu cục bộ lagrave CSDL coacute những đặc điểm giống với kho dữ liệu nhưng với quy mocirc nhỏ hơn vagrave lưu trữ dữ liệu về một lĩnh vực một chuyecircn ngagravenh
Data mart phụ thuộc Chứa những dữ liệu được lấy từ DW vagrave những dữ liệu nagravey sẽ được triacutech lọc vagrave tinh chế tiacutech hợp lại ở mức cao hơn để phục vụ một chủ đề nhất định của Datamart
Data mart độc lập Khocircng giống như Datamart phụ thuộc Data mart độc lập được xacircy dựng trước DW vagrave dữ liệu được trực tiếp lấy từ caacutec nguồn khaacutec nhau
5 Siecircu dữ liệu Metadata lagrave dữ liệu để mocirc tả dữ liệu Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột
một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi Metadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu
6 Mocirci trường kho dữ liệu Hệ thống của tổ chức vagrave kho cung cấp dữ liệu để xacircy dựng kho dữ liệu Trong quaacute trigravenh chuyển dữ liệu từ caacutec nguồn khaacutec nhau dữ liệu coacute thể
được lagravem sạch hoặc chuyển đổi vagrave vigrave thế DW được xem như lagrave một chuẩn cho việc lưu trữ
Đồng thời siecircu dữ liệu được ghi lại Cuối cugraveng DW hoặc siecircu thị coacute thể được sử dụng để tạo ra một kho dữ
liệu ldquocaacute nhacircnrdquo 7 Caacutec đặc điểm của kho dữ liệu
Đặc điểm Mocirc tả
Hướng chủ đề - DL tổ chức theo caacutech thức người dugraveng tham chiếu
Tiacutech hợp - Dữ liệu ldquosạchrdquo loại bỏ tiacutenh thiếu nhất quaacuten
Khocircng thay đổi - DL ldquochỉ đọcrdquo người dugraveng khocircng thay đổi được
Chuỗi thời gian - DL lagrave chuỗi thời gian khocircng phải lagrave trạng thaacutei hiện tại
Được tổng kết - DL vận hagravenhthao taacutec khi cần thiết
được kết hợp lại thagravenh dạng coacute thể dugraveng được cho quyết định
Kiacutech cỡ lớn hơn - Lưu giữ theo chuỗi thời gian tức lagrave giữ lại nhiều DL
Khocircng được chuẩn hoacutea - Coacute thể dư thừa DLSiecircu dữ liệu - Dữ liệu của dữ liệu được lưu trữNguồn dữ liệu - DL vận hagravenh (caacutec hệ sẵn coacute) cugraveng
với caacutec nguồn ngoagravei 8 Kho dữ liệu hướng chủ đề
Hướng chủ để coacute nghĩa lagrave kho dữ liệu được tổ chức xung quanh caacutec chủ đề chiacutenh như khaacutech hagraveng sản phẩm sản xuất Tập trung vagraveo việc mocirc higravenh hoacutea vagrave phacircn tiacutech dữ liệu cho caacutec nhagrave ra quyết định magrave khocircng tập trung vagraveo caacutec xử lyacute thocircng thường Cung cấp cho người dugraveng một khung nhigraven toagraven vẹn đơn giản vagrave đầy đủ về caacutec sự kiện quanh caacutec chủ đề
9 Dữ liệu trong DW được tiacutech hợp Dữ liệu trong kho dữ liệu được xacircy dựng bằng caacutech tổng hợp dữ liệu từ
nhiều nguồn khaacutec nhau vagrave caacutec nguồn coacute tổ chức khaacutec nhau Cơ sở dữ liệu caacutec file excel caacutec flat file hoặc caacutec raw file Khi đưa vagraveo kho dữ liệu caacutec dữ liệu được lagravem sạch vagrave tiacutech hợp dữ liệu nhằm đảm bảo tiacutenh nhất quaacuten của dữ liệu
10Kiến truacutec kho dữ liệu Tầng cơ sở dữ liệu hoạt động Tầng truy xuất thocircng tin Tầng truy xuất dữ liệu Tầng siecircu dữ liệu Tầng quản lyacute tiến trigravenh Tầng thocircng điệp của ứng dụng Tầng vật liacute của kho dữ liệu Tầng trigravenh diễn dữ liệu
11Higravenh trạng kho dữ liệu Kho dữ liệu ảo - người dugraveng cuối coacute thể truy cập trực tiếp đến kho dữ liệu
sử dụng caacutec cocircng cụ cho pheacutep ở tầng truy xuất dữ liệu Kho dữ liệu trung tacircm-1 cơ sở dữ liệu vật lyacute chứa tất cả dữ liệu cho một
vugraveng chuyecircn dụng nagraveo đoacute
Kho dữ liệu phacircn taacuten- Thagravenh phần được phacircn taacuten qua nhiều hệ cơ sở dữ liệu vật lyacute
12METADATA- Siecircu dữ liệu Định nghĩa Siecircu dữ liệu lagrave dữ liệu về dữ liệu Lagrave 1 lưu trữ dugraveng để
Miecircu tả kho dữ liệu tổng thể Nhận dạng kiểu kho dữ liệu Quản liacute quaacute trigravenh tiacutech hợp dữ liệu Quản liacute quaacute trigravenh cập nhật kho dữ liệu Quản liacute bảo mật
Lagrave chigravea khoacutea quyết định sự thagravenh cocircng của kho dữ liệu luocircn được thay đổi vagrave cập nhật theo sự phaacutet triển của kho dữ liệu
Dugraveng để quản liacute điều khiển kho dữ liệu Sự ra đời của kho dữ liệu như 1 cấu truacutec hỗ trợ ra quyết định siecircu dữ liệu
được xem như nguồn tagravei nguyecircn dữ liệu Siecircu dữ liệu lagrave trừu tượng Chuacuteng lagrave dữ liệu bậc cao cung cấp mocirc tả ngắn
gọn caacutec dữ liệu bậc thấp hơn 13Hoạt động của Siecircu dữ liệu
Siecircu dữ liệu rất cần thiết trong việc chuyển hoacutea thocircng tin trở thagravenh tri thức Lagrave chigravea khoacutea giuacutep chuacuteng ta xử lyacute được dữ liệu thocirc Viacute dụ một dograveng dữ liệu baacuten hagraveng 1023 K596 11121 agraveNoacute sẽ khocircng coacute nghĩa gigrave cho đến khi chuacuteng ta đưa vagraveo siecircu dữ liệu (thư
mục chứa dữ liệu) agrave cửa hagraveng 1023 sản phẩm K596 vagrave số tiền baacuten được lagrave 11121 đocirc la
14Sự cần thiết phải nhất quaacuten trong kho dữ liệu Kho dữ liệu được xacircy dựng cho lợi iacutech của những nhagrave phacircn tiacutech kinh
doanh caacutec nhagrave quản trị cho tất cả caacutec khu vực chức năng Trong cơ sở dữ liệu riecircng caacutec khu vực khaacutec nhau coacute thể định nghĩa vagrave lưu
trữ dữ liệu thocircng qua phiecircn bản của chiacutenh noacute Khi dữ liệu được lấy từ những vugraveng khaacutec nhau đoacute vagrave được đặt vagraveo kho dữ
liệu Việc chuyển đổi vagrave lagravem sạch caacutec tiến trigravenh sẽ đảm bảo noacute lagrave duy nhất được tiacutech hợp tại một mức của tổ chức
15Ragrave soaacutet lại dữ liệu ndash Thực thi siecircu dữ liệu
Bất kể cấu truacutec tự nhiecircn của 1 cacircu truy vấn thế nagraveo thigrave caacutec thagravenh phần của siecircu dữ liệu rất quan trọng đối với người ra quyết định
Bảng thuộc tiacutenh khoacutea được lưu trữ bởi kho dữ liệu Tập hợp dữ liệu được lấy từ đacircu Những chuyển đổi nagraveo được thực thi với việc lagravem sạch
16Siecircu dữ liệu lagrave gigrave Metadata - lagrave thocircng tin mocirc tả nội dung của cơ sở dữ liệu (CSDL) Metadata baacuteo cho người dugraveng biết thời gian cập nhật sau cugraveng của dữ liệu
định dạng vagrave mục điacutech sử dụng của noacute Những thocircng tin nagravey coacute thể hướng dẫn người dugraveng duyệt qua CSDL vagrave
giuacutep họ hiểu được yacute nghĩa vagrave ngữ cảnh của dữ liệu Trong CSDL metadata lagrave caacutec dạng biểu diễn khaacutec nhau của caacutec đối tượng
trong CSDL Trong CSDL quan hệ metadata lagrave caacutec định nghĩa của bảng cột CSDL
view vagrave nhiều đối tượng khaacutec Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột
một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi -gtMetadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu
Bảng chuyển đổi Ghi lại những chuyển đổi đatilde được thực hiện
Lịch sử thực thi Ghi lại những dữ liệu đatilde được
phacircn tiacutech
Higravenh thaacutei kết nốiGhi lại những dữ liệu được kết nối vagrave tần suất
17Aacutenh xạ thocircng thường của siecircu dữ liệu Bản ghi aacutenh xạ chuyển đổi bao gồm
Định danh của nguồn gốc Chuyển đổi thuộc tiacutenh Chuyển đổi thuộc tiacutenh vật lyacute Matilde hoacutea tham chiếu bảng chuyển đổi Đổi tecircn Đổi khoacutea Gaacuten giaacute trị cho thuộc tiacutenh mặc định Chọn logic cho caacutec nguồn nhiều giaacute trị Đổi thuật toaacuten
18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để
phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai
lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave
tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec
Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm
Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo
19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua
caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau
SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được
Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra
một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức
Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ
Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ
Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech
CHƯƠNG 11 KHAI PHAacute DỮ LIỆU
1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn
ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993
Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng
2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd
1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều
2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP
3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn
4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng
5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server
6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo
7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động
8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời
9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều
10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện
11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech
12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP
3 Xử lyacute phacircn tiacutech trực tuyến OLAP
MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave
dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu
ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave
thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu
HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave
ROLAP4 Khai phaacute dữ liệu
Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh
khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn
Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan
5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp
6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại
Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp
Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec
Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt
Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra
Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh
vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho
Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec
Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm
Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục
Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng
gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp
Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn
Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec
Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper
Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2
Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25
Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước
Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng
Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện
trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp
Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute
độ hỗ trợ ge ngưỡng minsup
độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan
Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn
Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết
Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu
MOLAP ROLAP HOLAP
Lưu trữ dữ liệu cơ sở
Khối Bảng quan hệ Bảng quan hệ
Lưu trữ thocircng tin tổng hợp
Khối Bảng quan hệ Khối
Hiệu suất thực hiện truy vấn
Nhanh nhất Chậm nhất Nhanh
Tiecircu thụ khocircng gian lưu trữ
Nhiều Thấp Trung bigravenh
Chi phiacute bảo trigrave Cao Thấp Trung bigravenh
liecircn quan tới caacutec cocircng việc coacute thể lagravem thay đổi đaacuteng kể caacutech thức hoạt động của tổ chức Tuyvậy đa số caacutec yếu tố thực thi đều liecircn quan tới hệ thống thocircng tinThực thi MSS lagrave quaacute trigravenh liecircn tục diễn ra trong suốt thời gian phaacutet triển hệ thống từ đề xuấtban đầu đến nghiecircn cứu khả thi thiết kế vagrave phacircn tiacutech hệ thống lập trigravenh huấn luyện chuyểnđổi vagrave lắp đặt Caacutec chuyecircn gia hệ thống thocircng tin thường gọi thực thi lagrave giai đoạn cuối trongvograveng đời hệ thống Định nghĩa thực thi MSS phức tạp hơn vigrave bản chất lặp của sự phaacutet triểncaacutec hệ thống
THỰC THI KHOcircNG HOAgraveN CHỈNHCaacutec quyết định về tiacutenh khả thi thường coacute giả định về lợi iacutech đạt được khi kế hoạch thực thiđược thực hiện hoagraven toagraven Trong thực tế thường chỉ thực hiện 90 thậm chiacute 70 phần trăm sovới phacircn tiacutech khả thi Lyacute do lagrave sự thay đổi tại một nơi trong hệ thống coacute thể ảnh hưởng vagrave coacutethể taacutec động tiecircu cực đến chỗ khaacutec Do vậy cấp quản lyacute coacute thể bỏ những phần trong dự aacuten coacutethể gacircy ra taacutec động xấu Do đoacute dự aacuten sẽ thực hiện iacutet hơn 100 so với dự aacuten kế hoạch Caacutec lyacutedo khaacutec coacute thể lagrave do khấu trừ ngacircn saacutech hoặc vượt chi phiacuteĐAacuteNH GIAacute SỰ THAgraveNH COcircNG CỦA THỰC THI HỆ THỐNGPhải coacute caacutec chỉ số đo lường thigrave mới coacute thể đaacutenh giaacute sự thagravenh cocircng khi thực thi một hệ thốngDickson va Powers (1973) đề ra 5 tiecircu chuẩn độc lậpbull Tỷ lệ thời gian thực hiện dự aacuten với thời gian ước lượngbull Tỷ lệ chi phiacute thực tế vagrave ngacircn saacutech thực hiệnbull Thaacutei độ của cấp quản lyacute đối với hệ thốngbull Nhu cầu thocircng tin của caacutec nhagrave quản lyacute được đaacutep ứng như thế nagraveo qua hệ thốngbull Taacutec động của dự aacuten đối với những hoạt động maacutey tiacutenh trong cocircng tyCaacutec đo lường khaacutec để đaacutenh giaacute thagravenh cocircng của hệ hỗ trợ quản lyacute (MSS)bull Sự sử dụng hệ thống (dự định dugraveng hoặc thực sự dugraveng)bull Thỏa matilden của người dugravengbull Thaacutei độ taacuten thagravenhbull Mức độ hệ thống hoagraven thagravenh caacutec mục tiecircu ban đầubull Phần thưởng đối với tổ chức (giảm chi phiacute tăng doanh thuhellip)bull Tỷ số lợi iacutech chi phiacute
bull Mức độ thể chế hoacutea của MSS trong tổ chứcDo bởi tiacutenh đa dạng của DSS necircn việc đaacutenh giaacute sự thagravenh cocircng của hệ nagravey cũng khoacute khăn tuynhiecircn cũng coacute thể coacute một số yếu tố giuacutep cho DSS thagravenh cocircng như sự tham gia người dugravenghuấn luyện người dugraveng hỗ trợ quản lyacute cấp cao nguồn thocircng tin đặc điểm của những nhiệmvụ coacute liecircn quan (cấu truacutec bất định độ khoacute phụ thuộc)
Chương5Nhoacutem hỗ trợ quyết định vagrave nhoacutemcocircng nghệ phần mềm
51Nhoacutem tạo quyết định
MDM-Holsapple đatilde gợi yacute chuacuteng ta sử dụng giới hạn người tạo quyết định
Một nhoacutem lagrave kết cấu MDM nơi magrave nhiều người ra quyết định hoagraven toagraven tương taacutec
Một đội lagrave kết cấu MDM nơi caacutec thagravenh viecircn tư vấn cho người đưa ra quyết định nhưng khocircng tương taacutec
Một Ủy ban lagrave kết cấu MDM với một người tạo quyết định duy nhất vagrave sự tương taacutec giữa caacutec thagravenh viecircn
Mạng thocircng tin
Mạng lưới baacutenh xe mỗi người tham gia coacute thể giao tiếp với người đưa ra quyết định ở trung tacircm nhưng khocircng phải với người tham gia khaacutecCấu truacutec nagravey lagrave khocircng thỏa matilden tất cả những người tham gia ngoại trừ người ra quyết định
Mạng dacircy chuyền Tham gia chuyển tiếp thocircng tin chỉ để noacute luocircn liền kề nhau trong chuỗi
Thagravenh viecircn cuối cugraveng ko được đaacutep ứng
Mạng vograveng trograven Tương tự như chuỗi nhưng kết thuacutec được kết nối
Mạng kết nối hoagraven toagraven khocircng coacute hạn chế về giao tiếp vagrave tương taacutec giữa caacutec thagravenh viecircnNoacutei chungnoacute đaacutep ứng hầu hết caacutec kết nối của người tham gia nhưng truyền đạt thocircng tin mất nhiều thời gian vagrave coacute nhiều cơ hội xảy ra lỗi
Nhoacutem hagravenh vi vagrave chuẩn mực
MDMs thiết lập caacutec chỉ tiecircu hướng dẫn quaacute trigravenh ra quyết định
Một chuẩn mực quy định cụ thể những gigrave thagravenh viecircn trong nhoacutem dự kiến sẽ lagravem trong những hoagraven cảnh nhất định
Quy tắc gửi coacute thể được thocircng qua viacute dụ đaacutenh giaacute ngang hagraveng hoặc xử phạt
Lagravem thế nagraveo để đưa ra quyết định
Việc chọn lựa magrave trong đoacute việc sử dụng cấu truacutec MDM phải được dựa trecircn một số yếu tố liecircn quan với bối cảnh quyết định
Viacute dụmột cấu truacutec riecircng lẻ sẽ lagravem việc nơi magrave quyết định được cấu truacutec cao vagrave thocircng tin lagrave coacute sẵn
Một ủy ban cơ cấu sẽ lagrave sự lựa chọn khi người ra quyết định khocircng thể đưa ra quyết định một migravenh
52Caacutec vấn đề thường gặp trong nhoacutem
Kiacutech thước Noacutei chung sự nhất triacute vagrave gắn kết giữa caacutec thagravenh viecircn tỉ lệ nghịch với phạm vi nhoacutem Trong nhoacutem lớn rất dễ higravenh thagravenh caacutec nhoacutem nhỏ vagrave hoạt động rời rạc
Tư duy tập thể Trong nhoacutem lớn mọi người coacute xu hướng suy nghĩ đểđạtđược sự nhất triacute necircn khocircng phaacutet huy được sự saacuteng tạo
Caacutec vấn đề về xatilde hội
Xung đột Trong 1 nhoacutem ai cũng muốn migravenh lagrave giỏi nhất necircn dễ dẫn đến xung đột
Ẩn danh(Giấu tecircn) Đacircy lagrave phương phaacutep được sử dụng để kiểm soaacutet xung đột Cho caacutec thagravenh viecircn tham gia ẩn danh
Vấn đề giới tiacutenh Nam vagrave nữ thường coacute những thế mạnh khaacutec nhau điều nagravey coacute thể lagrave sức mạnh trong 1 thiết lập MDM
Đagravem phaacuten vagrave quyết định
Một quyết định coacute thể liecircn quan đến nhiều quan điểm khaacutec nhau vigrave thế cần phải coacute sự đagravem phaacuten
Caacutec thiết kế của cơ chế hỗ trợ cho MDM phải phugrave hợp với caacutec hoạt độngđagravemphaacuten
Những hoạt động nagravey bao gồm việc thu nhận yacute kiến của caacutec thagravenh viecircn 1 caacutech cocircng bằng
53Cocircng nghệ hỗ trợ MDM
Organizational DSSndash 1 hệ thống cung cấp caacutec quyết định hỗ trợ
Group Support Systemndash Cocircng nghệ sử dụng sự hỗ trợ của nhiều becircn tham gia
Group DSS ndash Lagrave 1 hệ thống được thiết kế đặc biệt để hỗ trợ cho MDM
DSS ndash Lagrave 1 hệ thống dưới sự kiểm soaacutet của 1 người quyết định hệ thống nagravey cung cấp 1 bộ cocircng cụ giuacutep phacircn tiacutech hoagraven cảnh đểđưa ra quyết định vagrave nacircng cao hiệu quả của quyết địnhđoacute
53Cocircng nghệ hỗ trợ MDM
Organizational DSSndash 1 hệ thống cung cấp caacutec quyết định hỗ trợ
Group Support Systemndash Cocircng nghệ sử dụng sự hỗ trợ của nhiều becircn tham gia
Group DSS ndash Lagrave 1 hệ thống được thiết kế đặc biệt để hỗ trợ cho MDM
DSS ndash Lagrave 1 hệ thống dưới sự kiểm soaacutet của 1 người quyết định hệ thống nagravey cung cấp 1 bộ cocircng cụ giuacutep phacircn tiacutech hoagraven cảnh đểđưa ra quyết định vagrave nacircng cao hiệu quả của quyết địnhđoacute
Mục tiecircu của cocircng nghệ hỗ trợ MDM
Quy trigravenh hỗ trợ tập trung vagraveo quaacute trigravenh tạo điều kiện thuận lợi cho sự tương taacutec
Cơ chế cấu truacutec quaacute trigravenh chi phối caacutec hoạt động truyền thocircng
Nhiệm vụ hỗ trợ cocircng việc coacute thể chọn lựa tổ chức hoặc lấy thocircng tin
Nhiệm vụ cấu truacutec cocircng việc cho pheacutep truy cập đến kỹ thuật lọc kết hợp phacircn tiacutech kiến thức liecircn quan đến cocircng việc
Caacutec lớp loại cocircng nghệ hỗ trợ MDM
Phacircn loại theo đặc điểm do DeSanctis vagrave Gallupe đưa ra đề xuất một chương trigravenh ba cấp dựa trecircn caacutec tiacutenh năng được cung cấp
Hệ thống cấp 1 Mục điacutech chiacutenh lagrave tạo điều kiện thocircng tin liecircn lạc giữa caacutec thagravenh viecircn
Hệ thống cấp 2 Thiết kế để giảm thiểu rủi ro
Hệ thống cấp 3 Giuacutep điều chỉnh xử lyacute quyết định
Phacircn loại theo cocircng nghệ -Kraemer vagrave King tập trung vagraveo cocircng nghệ aacutep dụng
Cocircng nghệ bảng mạch điện tử
Hội nghị trực tuyến
Mạng lưới tập đoagraven
Trung tacircm thocircng tin
Mocirci trường cộng taacutec
Phograveng quyết định
Nhoacutem phần mềm
Phần mềm được thiết kế để hỗ trợ sự hợp taacutec bao gồm việc thu huacutet vagrave lưu trữ thocircng tin
Caacutec tổ chức dẫn đầu thị trường hiện tại lagrave Lotus Notes and Domino Microsoft Exchange Novell GroupWise and Oracle Office
Caacutec cocircng cụ trong một bộ phần mềm bao gồm người quản lyacute hội nghị (Lotus Sametime) vagrave trao đổi thocircng điệp (Lotus Notes Mail)
Xếp hạng phần mềm cho nhoacutem
Ellis vv đề xuất một hệ thống xếp hạng dựa vagraveo kiểu sự hỗ trợ noacute Cung cấp
Hệ thocircng điệp
Hệ thống hội thảo truyền higravenh
Hệ thống cộng taacutec soạn thảo
Nhoacutem phacircn phối giải phaacutep phần mền
Hệ thống phối hợp
Hệ thống thocircng minh đại diện
Lực lượng điều khiển phaacutet triển phần mềm cho nhoacutem
Một số nhacircn tố chiacutenh bao gồm
Tăng năng suất
Giảm số lượng caacutec cuộc họp
Tăng cường tự động hoacutea caacutec quy trigravenh lagravem việc thường xuyecircn
Cần phối hợp toagraven cầu tốt hơn
Tiacutenh sẵn sagraveng của những mạng lan rộng
Coleman vagrave Khanna liệt kecirc 10 nhacircn tố khaacutec
54Quản lyacute hoạt động MDM (Mobile Device Management - Quản lyacute thiết bị di động)
Một số phương phaacutep phối hợp phổ biến hơnMDM lagrave
Kỹ thuật nhoacutem định danh
Kỹ thuật Delphi
Sự phacircn xử
Hệ thocircng tin dựa trecircn vấn đề
Nemawashi
Kỹ thuật nhoacutem định danh
1-Mỗi người tham gia viết ra những yacute tưởng về những gigrave necircn quyết định
2-Lần lượt mỗi người tham gia trigravenh bagravey yacute tưởng của migravenh được ghi lại trecircn bảng Khocircng thảo luận ở đacircy
3-Sau khi tất cả caacutec yacute tưởng được trigravenh bagravey caacutec đại biểu coacute thể chất vấn những người khaacutec
4-Mỗi người tham gia bỏ phiếu cho mỗi yacute tưởng
Kỹ thuật Delphi
Về cơ bản tương tự như kỹ thuật nhoacutem định danh ngoại trừ những người khocircng bao giờ tham gia cuộc họp
Một cocircng cụ khảo saacutet được sử dụng để thu thập đầu vagraveo ban đầu từ caacutec thagravenh viecircn
Một cuộc khảo saacutet thứ hai được gửi đi với một bản toacutem tắt caacutec kết quả chung
Những bước lặp lại cho đến khi đạt được một sự đồng thuận hoặc nhigraven nhận của đa số
Sự phacircn xử(Arbitration )
Thiacutech hợp nhất khi caacutec thagravenh viecircn của MDM đại diện cho caacutec yếu tố đối lập
Những người tham gia đồng yacute rằng nếu lựa chọn thay thế hai becircn thỏa thuận khocircng được tigravem thấy thigrave một trọng tagravei viecircn becircn ngoagravei sẽ tham gia
Trọng tagravei sau đoacute lựa chọn thay thế ocircng hoặc xeacutet thấy thiacutech hợp nhất
Hệ thống thocircng tin dựa trecircn vấn đề (IBIS)
Lagrave một phương phaacutep lập luận cấu truacutec
Một đại diện cho IBIS lagrave một đồ thị với caacutec nuacutet vagrave caacutec liecircn kết
IBIS bắt đầu với lựa chọn của một nuacutet vấn đề gốc sau đoacute caacutec nuacutet vị triacute khaacutec nhau được liecircn kết với nuacutet gốc
Caacutec nuacutet vị triacute nagravey sau đoacute được đaacutenh giaacute dựa trecircn những lập luận gắn liền với chuacuteng
Nemawashi (được sử dụng rộng ratildei tại Nhật Bản)
1-Một hoặc nhiều thagravenh viecircn của MDM được chỉ định lagrave điều phối viecircnCaacutec điều phối viecircn sau đoacute chọn người tham gia cograven lại
2-Điều phối viecircn xacircy dựng một tổng hợp caacutec sự lựa chọn vagrave sau đoacute caacutec chuyecircn gia đaacutenh giaacute caacutec lựa chọn
3-Điều phối viecircn lựa chọn một sự lựa chọn dựa trecircn kết quả ở trecircn(ở 2)
4-Sự thay thế được luacircn chuyển điều phối viecircn tigravem kiếm sự đồng thuận thocircng qua sự thuyết phục vagrave đagravem phaacuten
5-Nếu đạt được sự đồng thuận điều phối viecircn cho lưu thocircng một tagravei liệu magrave mỗi thagravenh viecircn MDM để lại dấu hiệu trecircn đoacute
55Nơi lagravem việc ảo
Nhiều tổ chức trecircn toagraven thế giới kinh doanh bất động sản cho cocircng nghệ hợp taacutec
Cocircng việc được trở thagravenh một điều bạn lagravem hơn lagrave một nơi bạn đi
Những thay đổi lớn nhất mang lại bởi nơi lagravem việc ảo coacute thể lagrave về văn hoaacute hay xatilde hội hơn lagrave về cocircng nghệ
Chương 6 Hệ thống thocircng tin điều hagravenh
61 Yacute nghĩa của EIS- Hệ thống thocircng tin điều hagravenh
- EIS lagrave một dạng đặc biệt của DSS được thiết kế để hỗ trợ ra quyết định ở cấp cao nhất của một tổ chức
- Lagrave một hệ thống thocircng tin hỗ trợ nhu cầu lập kế hoạch vagrave đaacutenh giaacute của caacutec nhagrave quản lyacute điều hagravenh
- EIS coacute thể giuacutep một CEO coacute được bức tranh tổng thể chiacutenh xaacutec nhất về caacutec hoạt động vagrave một bản toacutem tắt những gigrave magrave đối thủ cạnh tranh đang lagravem
- Caacutec hệ thống nagravey noacutei chung hoạt động dễ dagraveng vagrave trigravenh bagravey thocircng tin theo những caacutech dễ hiểu để việc tiếp thu được nhanh choacuteng (biểu đồ đồ thịhellip)
(Tagravei liệu thecircm EIS lagrave những loại hệ thống lagrave rất phức tạp trong tự nhiecircn Coacute thể noacutei hệ thống nagravey cũng cung cấp cho caacutec nhagrave quản lyacute với caacutec thiết bị coacute khả năng ra quyết định bằng caacutech sử dụng của noacute Hệ thống nagravey hoạt động trong điều kiện như vậy quan trọng như trong caacutec hệ thống khaacutec khocircng hỗ trợ Khả năng lưu trữ dữ liệu nặng lagravem cho noacute lyacute tưởng để được thocircng qua khocircng chỉ bởi caacutec doanh nghiệp lớn magrave cograven bởi caacutec doanh nghiệp nhỏ hơn Nhigraven chung hệ thống nagravey lagrave dagravenh cho caacutec nhacircn viecircn cấp cao hỗ trợ thagravenh thạo trong việc đưa ra caacutec quyết định quan trọng)
Caacutec phiecircn EIS tiecircu biểu- Phiecircn lagravem việc coacute thể bắt đầu với một baacuteo caacuteo về tigravenh higravenh tagravei chiacutenh vagrave kinh
doanh của một cocircng ty caacutec chỉ số hoạt động quan trọng được hiển thị rotilde ragraveng- EIS sẽ cho pheacutep caacutec giaacutem đốc điều hagravenh coacute thể đi sacircu vagraveo dữ liệu từ những con
số bất kỳ magrave noacute hỗ trợ- Việc điều hagravenh coacute thể lựa chọn một mức độ chi tiết ( VD danh số baacuten hagraveng) nếu
như cần điều tra thecircm- Lagrave một phương phaacutep tiếp cận coacute thể giuacutep việc ra quyết định tốt hơn
Những điều magrave EIS ko coacute- EIS khocircng phải lagrave sự thay thế cho caacutec hệ thống dựa trecircn caacutec maacutey tiacutenh khaacutec EIS
thực sự chỉ cung cấp dữ liệu cho caacutec hệ thống nagravey- Noacute khocircng thể biến caacutec bộ hệ điều hagravenh của maacutey tiacutenh thagravenh những ldquochuyecircn viecircn
giỏirdquo- Coacute thể được viacute một caacutech cao hơn như lagrave một trợ lyacute đaacuteng tin cậy coacute thể được gọi
đến bất khi nagraveo vagrave mỗi khi cần thiết
Tagravei liệu thecircm Sự khaacutec nhau giữa EIS vagrave DSS+ EIS thiết kế để hỗ trợ những người điều hagravenh cấp cao giuacutep họ khaacutem phaacute caacutec vấn đề vagrave caacutec cơ hội DSS hỗ trợ những nười phacircn tiacutech cố gắng trả lời cacircu hỏi caacutei gigrave coacute thể lagravem cugraveng với một cơ hội hoặc một vấn đề
Chiều EIS DSSNhững người sử dụng thocircng thường
Duyệt dữ liệu đi xuống truy xuất trạng thaacutei
Hỗ trợ phacircn tiacutech vagrave quyết định
Sự thuacutec đẩy Tiacutenh thiacutech hợp Tiacutenh hiệu quảỨng dụng Queacutet mocirci trường đaacutenh giaacute
hiệu suất nhận dạng caacutec vấn đề vagrave caacutec cơ hội
Caacutec quyết định quản lyacute trecircn caacutec lĩnh vực đa dạng
Hỗ trợ quyết định Caacutec chiacutenh saacutech caacutec quyết định khocircng coacute cấu truacutec ở mức cao vagrave hỗ trợ giaacuten tiếp
Hỗ trợ caacutec quyết định lặp lại caacutec quyết định khocircng thể đoaacuten trước ra quyết định khocircng coacute cấu truacutec vagrave baacuten cấu truacutec
Loại thocircng tin Caacutec thocircng tin tin tức thocircng tin becircn ngoagravei về khaacutech hagraveng đối thủ cạnh tranh mocirci trường caacutec baacuteo caacuteo theo yecircu cầu vagrave định thời về caacutec hoạt động becircn trong
Caacutec thocircng tin hỗ trợ caacutec tigravenh huống đặc biệt
Sử dụng coacute nguyecircn tắc
Dograve theo vết vagrave điều khiển nhận dạng cơ hội
Hoạch định tổ chức phacircn nhoacutem vagrave điều khiển
Khả năng phugrave hợp với những người sử dụng caacute nhacircn
Thiết kế loại ra quyết định cho mỗi người điều hagravenh caacute nhacircn bằng nhiều lựa chọn đầu ra
Cho pheacutep caacutec đaacutenh giaacute caacute nhacircn caacutec khả năng what-if lựa chọn loại hộp hội thoại
Đồ họa Phải coacute Lagrave một phần quan trọng của nhiều DSS
Thacircn thiện người sử dụng
Phải coacute Phải coacute nếu khocircng coacute người sử dụng trung gian
Xử lyacute thocircng tin Lọc neacuten thocircng tin dograve theo vết dữ liệu vagrave thocircng tin quan trọng
EIS kiacutech thiacutech caacutec cacircu hỏi caacutec cacircu trả lời bằng caacutech sử dụng DSS vagrave phản hồi lại EIS
Hỗ trợ caacutec thocircng tin chi tiết
Truy xuất thường xuyecircn caacutec mức chi tiết của bất kỳ thocircng tin tổng hợp nagraveo (duyệt dữ
Coacute thể coacute trong DSS nhưng khocircng thường
liệu chi tiết)Cơ sở mocirc higravenh Caacutec chức năng coacute sẵn bị hạn
chếLagrave điểm cốt lotildei của DSS
Cấu truacutec Theo người baacuten sản phẩm hoặc theo caacutec chuyecircn gia hệ thống thocircng tin
Theo người sử dụng hoặc caacute nhacircn hoặc caacutec chuyecircn gia từ caacutec trung tacircm thocircng tin hoặc phograveng ban hệ thống thocircng tin
Phần cứng Mainframe caacutec trạm RISC mạng LANs hoặc caacutec hệ thống phacircn bố
Mainframe caacutec trạm RISC caacutec maacutey PC hoặc caacutec hệ thống phacircn bố
Bản chất caacutec goacutei phần mềm
Truy xuất tương taacutec dễ dagraveng đến nhiều cơ sở dữ liệu truy xuất trực tuyến caacutec khả năng DBMS phức tạp caacutec liecircn kết phức tạp
Caacutec khả năng tiacutenh toaacuten lớn caacutec ngocircn ngữ mocirc higravenh mocirc phỏng ứng dụng vagrave caacutec bộ tạo DSS
Bản chất caacutec thocircng tin
Trigravenh bagravey thocircng tin được phaacutet sinh trước về quaacute khứ vagrave hiện tại tạo caacutec thocircng tin mới về quaacute khứ hiện tại tương lai
Tạo thocircng tin mới về quaacute khứ hiện tại tương lai
62 Lịch sử EIS- EIS xuất hiện lần đầu tiecircn tại MIT vagraveo những năm 1970
- Những EIS đầu tiecircn được phaacutet triển bởi caacutec doanh ngiệp lớn sẵn sagraveng chấp nhận rủi ro để đạt được lợi thế cạnh tranh
- Vagraveo những năm 1980 caacutec nhagrave cung cấp đatilde phaacutet triển một số cơ sở khaacutech hagraveng rộng vagrave cocircng nghệ EIS được tiếp tục phaacutet triển cho đến ngagravey nay
(Tagravei liệu thecircm Sử dụng DSSEIS cho phaacutet triển bền vững + Một số nghiecircn cứu đatilde được tiến hagravenh để kiểm tra việc thực hiện của EIS trong khu vực cocircng cộng vagrave chiacutenh phủ caacutec nước tổ chức kể từ khi chuacuteng được phaacutet triển theo định hướng lợi nhuận cho caacutec cocircng ty tư nhacircn (Hasan vagrave Hasan năm 1997) Theo một nghiecircn cứu tiến hagravenh tại Mỹ ở hơn 300 cocircng ty kết quả cho thấy sự khaacutec biệt của EIS giữa tư nhacircn vagrave chiacutenh phủ một số kết quả thuacute vị được phaacutet hiệnViacute dụ khoacute khăn hơn để chuyển tiền từ một tagravei khoản khaacutec trong một EIS của chiacutenh phủ cũng lagrave khoacute khăn hơn để biện giải thiacutech cho những chi phiacute phaacutet triển EIS của chiacutenh phủ Một nghiecircn cứu khaacutec được tiến hagravenh ở Australia
cho thấy rằng EIS cung cấp cho quản lyacute một higravenh ảnh chiacutenh xaacutec hơn về tổ chức thực hiện vagrave cung cấp hỗ trợ cho caacutec lợi iacutech chiến lược cải thiện khocircng chỉ cho caacutec nhagrave quản lyacute nhưng cograven cho phần cograven lại của tổ chức Dựa trecircn caacutec hệ thống được thiết kế cho caacutec cocircng ty tư nhacircn với một caacutech rotilde ragravengxaacutec định mục tiecircu EIS lagrave thiacutech hợp cho caacutec tổ chức cocircng cộng hiện đại nhưng cần phải được linh hoạt hơn vagrave kết thagravenh chugravem một phạm vi rộng hơn khả năng vagrave phương tiện hơn so với khu vực tư nhacircn ban đầu theo định hướng sản phẩm (Hasan vagrave Hasan năm 1997) Điều nagravey coacute thể lagrave do thực tế rằng caacutec hoạt động khu vực cocircng lagrave bắt buộc coacute taacutec động rộng phải đaacutep ứng sự mong đợi duy nhất cocircng cộng thường coacute mục tiecircu mơ hồ vagrave macircu thuẫn iacutet quyền tự chủ vagrave kiểm soaacutet việc ra quyết định vagrave nhacircn viecircn lagrave khoacute khăn hơn (Watson vagrave Carte2000) + Toacutem lại EIS lagrave một khaacutei niệm thagravenh cocircng noacute phaacutet triển qua nhiều năm tuy nhiecircn EIS khắc phục khiếm khuyết của migravenh bằng caacutech tiến hagravenh nghiecircn cứu liecircn tục)
63 Tại sao những người điều hagravenh hagraveng đầu lại khaacutec nhau- Họ lagrave những doanh nghiệp theo định hướng coacute suy nghĩ
- Coacute một khoảng khocircng gian rộng để kiểm soaacutet
- Họ chịu traacutech nhiệm cho việc thiết lập chiacutenh saacutech
- Họ đại diện cho tổ chức mocirci trường becircn ngoagravei
- Hagravenh động của họ tạo ra những kết quả đaacuteng kể về tagravei chiacutenh vagrave con người
Tần số caacutec hoạt động điều hagravenh- Xử lyacute xaacuteo trộn 42
- Hoạt động kinh doanh 32
- Phacircn bổ nguồn lực 17
- Đagravem phaacuten 3
- Những điều khaacutec 6
Handling Disturbances 42
Entrepreneurial Activites 32
Resource Allocation 17
Negotiation 3
Other 6
Những thocircng tin điều hagravenh cần thiết- Quản lyacute xaacuteo trộn coacute thể yecircu cầu sự chuacute yacute xung quanh đồng hồ
- Hoạt động kinh doanh yecircu cầu điều hagravenh để dự đoaacuten những thay đổi trong mocirci trường
- Nhiệm vụ phacircn bổ tagravei nguyecircn yecircu cầu lựa chọn người quản lyacute vagrave caacutec nguồn lực hạn chế được triển khai
- Đagravem phaacuten yecircu cầu cập nhật thocircng tin từng phuacutet để coacute thể xacircy dựng được sự đồng thuận
Caacutec loại thocircng tin điều hagravenh- Hệ thống kế toaacuten coacute liecircn quan đến việc tiacutenh toaacuten thu nhập hoạt động cho caacutec lĩnh
vực cụ thể lagrave quan trọng hơn so với caacutec hệ thống kế toaacuten truyền thocircng- Thocircng tin về thị trường khaacutech hagraveng cung cấp giaacute trị trong việc quyết định chiến
lược- Caacutec thocircng tin cần thiết thường được truyền đi trecircn một số hệ thống maacutey tiacutenh vagrave
nằm trong toagraven tổ chức- Caacutec thocircng tin được sử dụng thường lagrave ngắn hạn vagrave dễ thay đổi
Phương thức để xaacutec định thocircng tin cần thiết
Rockart xaacutec định được năm phương thức cơ bản để xaacutec định thocircng tin cần thiết
- Phương thức dựa trecircn kết quả- Phương thức rỗng- Phương thức chỉ số khoacutea- Phương thức tổng hợp nghiecircn cứu- Phương thức dựa vagraveo nhacircn tố then chốt dẫn đến thagravenh cocircng
64 Thagravenh phần EIS
- Sản phẩm EIS đầu tiecircn được phaacutet triển để sử dụng trecircn maacutey tiacutenh cấu higravenh cao nhưng caacutec sản phẩm hiện nay nhằm mục tiecircu lagrave nền tảng ClientServer
- Những nền tảng linh hoạt hơn coacute thể thiacutech ứng với thay đổi trong tổ chức vagrave cocircng nghệ
- Sử dụng dữ liệu thời gian thực dẫn đến quyết định nhanh hơn nhiều thocircng tin hơn
Thagravenh phần phần cứng- Một EIS khocircng đogravei hỏi coacute phần cứng cụ thể hoặc duy nhất nagraveo- Chigravea khoacutea của vấn đề lagrave để đảm bảo rằng caacutec thagravenh phần của EIS tối ưu hoacutea vagrave
phugrave hợp với tagravei nguyecircn maacutey tiacutenh của tổ chức- Hệ thống nagravey phải được cấu higravenh để caacutec nguồn tagravei nguyecircn phugrave hợp với những
người điều hagravenh chuacuteng
Thagravenh phần phần mềm- Traacutei ngược với phần cứng phần mềm thường được chuyecircn mocircn hoacutea cao cho caacutec
bagravei toaacuten về miền- Sự chuyecircn mocircn hoacutea nagravey thường đạt được bằng caacutech sử dụng thagravenh phần off-the-
shelf cho toagraven bộ EIS vagrave caacutec mocirc-đun tugravey chỉnh để đaacutep ứng nhu cầu cụ thể- Lotus Notes lagrave một viacute dụ điển higravenh Noacute coacute thể được sử dụng một migravenh hoặc coacute
thể phục vụ becircn thứ ba mocirc-đun plug-in
Cocircng nghệ EIS hiện nay
Dobrzeniecki đề xuấtphacircn loạitừng cấptheo bachức năng- Loại 1 sản phẩm bao gồmmột bộ đầy đủcaacutec ứng dụngtừ mộtnhagrave cung cấp- Loại 2 sản phẩm đượcthựchiệnở phần đầu củacaacutecsản phẩmDSS đượcphaacutet triển
bởicugravengmộtnhagrave cung cấp- Loại 3 sản phẩmkết hợp với nhautheo bất kỳ số lượngthuộc sở hữu củacocircng ty
65 Xacircy dựng EIS
- Xacircy dựngmộtEISgiống nhưxacircydựngmột số hệ thống khaacutec củamocirc higravenh hệ thống thocircng tin
- Việcphaacutet triểncấu truacutecnecircn được theo dotildeitừ quaacute trigravenh thiết kế đến quaacute trigravenhthực hiện
- Tuy nhiecircn một dự aacuten phaacutet triển EIScoacute xu hướnglagrave thống nhấtvagraveyecircu cầu hỗ trợ caacutec nhagrave quản lyacute latildenh đạo
- Xacircy dựng một EIScoacute thểphaacutet hiện ra đượccaacutectigravenh huống khoacute khănmagravemột nhagrave phaacutet triển chưabao giờ gặp phải
Mocirc higravenh EIS
Khung phaacutet triển một EIS
- Watson et al đề nghị xacircy dựngkhung với ba thagravenh phần+ Caacutech tiếp cận tập trung vagraveo yếu tốcon người vagrave dữ liệu coacute liecircn quan đến EIS+ Quaacute trigravenh phaacutet triển cần sự linh hoạt vagrave tương taacutec+ Người sử dụng - hệ thống hộp thoại bao gồm một ngocircn ngữ hagravenh động để xử lyacute caacutec lệnh
Lợi iacutech của EIS- Dễ duy trigrave caacutec mục tiecircu coacute tổ chức- Dễ truy xuất thocircng tin- Cho pheacutep người sử dụng nacircng cao hiệu suất hơn
- Tăng chất lượng ra quyết định- Cung cấp sự cải tiến cạnh tranh- Tiết kiệm thời gian của người sử dụng- Tăng khả năng vagrave chất lượng giao tiếp- Cung cấp khả năng điều khiển tốt hơn trong tổ chức- Cho pheacutep tham gia caacutec vấn đề vagrave caacutec cơ hội- Cho pheacutep hoạch định- Cho pheacutep tigravem kiếm nguyecircn nhacircn của một vấn đề- Thảo matilden caacutec yecircu cầu của người điều hagravenh
Hạn chế của EIS vagrave 1 số sai lầm cần traacutenh
- Chi phiacute một cuộc khảo saacutetnăm1991 chothấychi phiacute phaacutet triểntrungbigravenh365000USDvớichi phiacute vận hagravenhhagraveng năm lagrave$200000 (EIS)
- Cocircng nghệ hạn chếEIScần phảiđượctiacutech hợp hoagraven toagravenvagraveokiếntruacuteccủadoanh nghiệphiện tại do đoacute noacutelagrave một thaacutech thứclớn đối vớithiết kế
- Hạn chế tổ chức cơ cấu tổ chứccoacute thể khocircng phugrave hợp
Sự hạn chế về tổ chức- Chương trigravenh nghị sự vagrave thời gian chệch EIS mocirc tả một phần việc thực hiện một
chương trigravenh nghị sự vagrave coacute thể dễ dagraveng đạt được sự tin cậy một caacutech chắc chắn- Đồng bộ hoacutea việc quản lyacute sự tin cậy đuacuteng luacutec đặc biệt baacuteo caacuteo EIS coacute thể phaacute
vỡ sự ổn định thiết lập caacutec chu trigravenh baacuteo caacuteo một caacutech tốt nhất- Sự bất ổn EIS phản ứng nhanh coacute thể gacircy ra việc taacutec động trở lại một caacutech
nhanh choacuteng dẫn đến sự thiếu ổn định trong tổ chức
Sự thất bại lagrave thay thế khocircng thể chấp nhận được- Một số yếu tố lagravem EIS thất bại
+ Thiếu sự hỗ trợ về mặt quản lyacute+ Vấn đề chiacutenh trị+ Thất bại của nhagrave phaacutet triển+ Lỗi về cocircng nghệ+ Giaacute cả+ Thời gian
66 Ra quyết định điều hagravenh trong tương lai vagrave EIS
- Coacute một vagravei điều kiện sẽ được hợp nhất cho việc chuyển đổi cocircng nghệ Trong đoacute một vagravei điều kiện coacute thể dễ dự đoaacuten Hai điều kiện magrave ta coacute thể thấy lagrave+ Phaacutet triển cocircng nghệ maacutey tiacutenh trong việc điều hagravenh sẽ tạo ra sự chuyển đổi được chấp nhận một caacutech dễ dagraveng hơn+ Mở rộng traacutech nhiệm điều hagravenh sẽ mở rộng nhu cầu thocircng tin
Tương lai của EIS- EIS thocircng minh Những tiến bộ trong cocircng nghệ AI sẽ được triển khai trong caacutec
EIS- EIS đa phương tiện Cơ sở dữ liệu đa phương tiện sẽ cho pheacutep tiacutech hợp văn bản
giọng noacutei vagrave higravenh ảnh trong tương lai- EIS thocircng tin Tương lai EIS sẽ mở rộng hơn trong việc sử dụng dữ liệu becircn
ngoagravei doanh nghiệp- EIS kết nối Giao tiếp với băng thocircng rộng cho pheacutep kết nối liecircn thocircng lớn hơn
Chương 7 HỆ CHUYEcircN GIA VAgrave TRIacute TUỆ NHAcircN TẠO
71 Caacutec khaacutei niệm
72 Triacute thocircng minh của triacute tuệ nhacircn tạo
73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia
74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia
75 Lợi iacutech vagrave hạn chế của hệ chuyecircn gia
71 Caacutec khaacutei niệm
Chuyecircn mocircn (Expertise) sự hiểu biết rộng trong 1 lĩnh vực hẹp
Hệ chuyecircn gia (Expert Systems)1 chương trigravenh maacutey tiacutenh sử dụng 1 tập caacutec luật dựa trecircn tri thức của con người để giải quyết caacutec vấn đề đogravei hogravei phải coacute sự chuyecircn mocircn
Một số hệ chuyecircn gia nổi tiếng
DENDRAL (Standford 1960s Edward Feigenbaum)
MYCIN (Standford1970s Edward Shortliffe)
PROSPECTOR (MIT 1979)
Triacute tuệ nhacircn tạo (Artificial Intelligence ndash AI)
Triacute tuệ nhacircn tạo một bộ phacircn của ngagravenh khoa học maacutey tiacutenh quan tacircm đến việc thiết kế caacutec hệ thống maacutey tiacutenh thocircng minh đoacute lagrave caacutec hệ thống đưa ra caacutec đặc điểm magrave từ đoacute chuacuteng ta liecircn hệ với sự thocircng minh trong hagravenh động của con người (Barr vagrave Feigenbaum 1981)
Mục điacutech của AI
Mục điacutech khoa học xaacutec định caacutec gợi yacute để giải thiacutech caacutec loại khaacutec nhau của triacute tuệ thực
Mục điacutech kỹ thuật giải quyết caacutec vấn đề trong thế giới thực
Triacute tuệ nhacircn tạo kế thừa nhiều yacute tưởng quan điểm kỹ thuật từ caacutec ngagravenh khoa học khaacutec
- Triết học
- Logic Toaacuten học
- Tiacutenh toaacuten
- Khoa học tacircm lyacute Khoa học nhận thức
- Sinh học Thần kinh học
- Tiến hoacutea
Caacutec lĩnh vực ứng dụng trong Triacute tuệ nhacircn tạo
Mạng nơ ron thần kinh (Neural Networks)
Tiacutenh toaacuten sự tiến hoacutea
(Evolutionary Computation)
Hệ chuyecircn gia (Expert Systems)
Kỹ thuật xử lyacute tiếng noacutei (Speech Processing)
Kỹ thuật xử lyacute ngocircn ngữ tự nhiecircn
(Natural Language Processing)
Lập kế hoạch (Planning)
Robot (Robotics)
Khoa học higravenh ảnh (Vision)
Caacutec kỹ thuật thocircng dụng dugraveng trong AI
Biểu diễn(Representation)
Học (Learning)
Caacutec luật (Rules)
Tigravem kiếm (Search)
72 Triacute thocircng minh của triacute tuệ nhacircn tạo
Con người suy diễn như thế nagraveo
Phacircn loại (Categorization)
Caacutec quy tắc cụ thể
Heuristics
Kinh nghiệm trước đoacute
Dự tiacutenh trước
Maacutey tiacutenh suy diễn như thế nagraveo
Lập luận dựa trecircn luật IF-THEN mocirc tả tri thức được matilde hoacutea dưới dạng caacutec luật
Caacutec khung (Frames) lagrave caacutec đại diện mocirc tả caacutec tigravenh huống giống nhau lagrave điển higravenh của một vagravei phacircn loại
Lập luận dựa trecircn caacutec trường hợp mocirc phỏng giải phaacutep trước đoacute cho một vấn đề hiện tại
Nhận dạng mẫu phaacutet hiện acircm thanh higravenh dạng hoặc caacutec chuỗi dagravei
Caacutec dạng khaacutec của Triacute tuệ nhacircn tạo
Học maacutey- mạng nơron vagrave giải thuật di truyền
Lập trigravenh tự động ndash lagrave những kỹ thuật tạo ra caacutec chương trigravenh để lagravem 1 nhiệm vụ riecircng biệt (cho pheacutep những người khocircng phải lagrave người lập trigravenh coacute thể lập trigravenh được)
Cuộc sống nhacircn tạo ndash nỗ lực để taacutei tạo caacutec hiện tượng sinh học trong caacutec hệ thống dựa trecircn maacutey tiacutenh
73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia(Expert Systems- ES)
Theo Jackson (1999) Một hệ chuyecircn gia lagrave một chương trigravenh maacutey tiacutenh mocirc tả vagrave suy diễn với tri thức của một vagravei lĩnh vực để giải quyết vấn đề hay đưa ra caacutec lời khuyecircn
Cấu truacutec cơ bản của ES được dựa theo cấu truacutec chung của DSS Sự khaacutec biệt chiacutenh giữa ES vagraveDSS lagrave hệ ES thu thập caacutec kiến thức từ những
chuyecircn gia trong lĩnh vực quan tacircmĐặc trưng của hệ chuyecircn gia Hiệu quả cao Thời gian trả lời thỏa đaacuteng Độ tin cậy cao Dễ hiểu
Giao diện người dugraveng trong ES
Thiết kế giao diện người dugraveng tập trung vagraveo caacutec yếu tố như dễ dagraveng sử dụngcoacute độ tin cậy cao giảm tải những khoacute khăn khi sử dụng
Thiết kế necircn coacute một số tương taacutec (đầu vagraveo kiểm soaacutet vagrave truy vấn)
Cấu tạo giao diện người dugraveng gồm coacute magraven higravenh cảm ứng bagraven phiacutem buacutet saacuteng lệnh thoại caacutec phiacutem chuyecircn dụng
Cơ sở tri thức (Knowledge Base)
Chứa đựng caacutec tri thức cụ thể miền thu được từ caacutec chuyecircn gia miền
Coacute thể chứa caacutec mocirc tả caacutec hagravenh vi giải quyết vấn đề caacutec ragraveng buộc caacutec heuristics
Thagravenh cocircng của một ES dựa trecircn tiacutenh đầy đủ vagrave tiacutenh chiacutenh xaacutec của cơ sở tri thức
Mocirc tơ suy diễn (Inference Engine)
Ở đacircy tri thức được đặt để sử dụng tạo ra caacutec giải phaacutep để giải quyết vấn đề
Mocirc tơ nagravey coacute khả năng thực hiện diễn dịch hoặc suy diễn dựa trecircn caacutec luật hay caacutec caacutec sự kiện
Đồng thời cũng coacute khả năng sử dụng caacutec suy diễn mờ hay khocircng chiacutenh xaacutec dựa trecircn xaacutec suất hay aacutenh xạ mẫu
Vograveng điều khiển suy diễn
1 Aacutenh xạ caacutec luật với caacutec sự kiện đatilde được cho
2 Chọn luật để thực hiện
3 Thực hiện luật bằng caacutech thecircm caacutec sự kiện được suy diễn ra vagraveo bộ nhớ lagravem việc
Chuỗi suy diễn (Chaining)
Suy diễn tiến (forward chaining) maacutey suy diễn bắt đầu từ dữ liệu ban đầu vagrave thực hiện việc suy luận để đưa ra caacutec kết luận cuối cugraveng
Suy diễn lugravei (backward chaining) maacutey suy diễn bắt đầu từ dữ liệu điacutech vagrave tigravem ra tri thức hỗ trợ cho dữ liệu điacutech đoacute
Viacute dụ suy diễn lugravei
R1 Nếu coacute A vagrave B thigrave suy ra coacute D
R2 Nếu coacute B thigrave suy ra coacute C
R3 Nếu coacute C vagrave D thigrave suy ra coacute E
Ta coacute E ta xem trong 3 luật R1 R2 R3 luật nagraveo coacute E ta thấy R3 chứa E đồng thời chứa C vagrave D Xeacutet tiếp trong 2 luật R1 R2 luật nagraveo chứa C vagrave D R2 chứa C R3 chứa D Từ đoacute ta coacute được caacutec tri thức hỗ trợ suy diễn vagrave kết luận lagrave nếu coacute A vagrave B thigrave sẽ coacute E Hay nếu A vagrave B đuacuteng thigrave sẽ coacute E
Viacute dụ suy diễn tiến
Giả sử coacute tập chứa 3 luật sau
R1 Nếu coacute A vagrave B thigrave suy ra coacute D
R2 Nếu coacute B thigrave suy ra coacute C
R3 Nếu coacute C vagrave D thigrave suy ra coacute E
Nếu ta coacute A vagrave B thigrave chuacuteng ta suy ra được D từ R1 vagrave suy ra C từ R2 Với D vagrave C đatilde được suy ra ở trecircn giờ chuacuteng ta suy ra được E từ R3
Viacute dụ thực tế
Giả sử muốn biết magraveu của một con vật nuocirci tecircn lagrave Fred biết rằng noacute kecircu ộp ộp vagrave ăn ruồi
Coacute tập 4 luật ban đầu như sau
R1 Nếu X kecircu ộp ộp vagrave ăn ruồi thigrave X lagrave con ếch
R2 Nếu X kecircu chiecircm chiếp vagrave biết hoacutet thigrave X lagrave con chim
R3 Nếu X lagrave con ếch thigrave X coacute magraveu xanh
R4 Nếu X lagrave con chim thigrave X coacute magraveu vagraveng
74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia
Expert system shells lagrave một tập caacutec goacutei phần mềm vagrave caacutec cocircng cụ dugraveng để phaacutet triển caacutec hệ chuyecircn gia
Những Expert system shells đầu tiecircn thường rất rườm ragrave Mặc dugrave vậy noacute vẫn giuacutep cho người sử dụng sẽ khocircng phải bắt đầu lại từ đầu khi xacircy dựng một hệ chuyecircn gia mới
Những shell hiện đại bao gồm hai mocirc-đun chiacutenh lagrave cocircng cụ xacircy dựng một tập quy tắc vagrave mocirc tơ suy diễn
Xacircy dựng hệ chuyecircn gia
Bước 1 xacircy dựng mocirc higravenh bagravei toaacuten xaacutec định vấn đề nhiệm vụ magrave hệ thống sẽ thực hiện Caacutec dạng bagravei toaacuten cần hệ chuyecircn gia
Bagravei toaacuten diễn giải (InterPretation)
Bagravei toaacuten dự baacuteo (Prediction)
Bagravei toaacuten chuẩn đoaacuten (Diagnose)
Bagravei toaacuten gỡ rối (Debugging)
Bagravei toaacuten thiết kế
Tương tự như một dự aacuten phần mềm để xacircy dựng một hệ chuyecircn gia cần phải coacute caacutec yếu tố về nhacircn lực tagravei nguyecircn vagrave thời gian Những yếu tố nagravey ảnh hưởng đến giaacute thah của một hệ chuyecircn giaTrong phần nagravey cacircu hỏi thường được đặt ra lagrave tại sao cần phải xacircy dựng một hệ chuyecircn giaTrước khi bắt đầu phải xaacute định rotilde bagravei toaacuten đạt ra lagrave jiAi lagrave chuyecircn giaAi lagrave người sử dụng
1 Diễn giải (InterPretation) Nghiecircn cứu 1 vấn đề -gt Dựa trecircn những biểu hiện thuộc tiacutenh đặc trưng becircn ngoagravei -gt Tư vấn
(hoặc đưa ra kết luận hay mocirc tả dễ hiểu từ tập dữ liệu thocirc)
2 Bagravei toaacuten dự baacuteo (Prediction) Coacute thể dự đoaacuten được hagravenh vi kết quả dựa trecircn caacutec hiện tượng -gt dự baacuteo
VD Dự baacuteo thời tiết động đấthellip
3 Bagravei toaacuten chẩn đoaacuten (Diagnoss) Xaacutec định caacutec lỗi caacutec bộ phận hỏng hoacutec của hệ thống dựa trecircn caacutec dữ liệu quan saacutet được
4 Bagravei toaacuten gỡ rối (Debugging) Mocirc tả caacutec phương phaacutep khắc phục hệ thống khi gặp sự cố
5 Bagravei toaacuten thiết kế Lựa chọn cấu higravenh caacutec đối tượng nhằm thoả matilden một số ragraveng buộc nagraveo đoacute
6 Giảng dạy Phần mềm dạy học coacute thể chuẩn đoaacuten vagrave sủa lỗi của học sinh trong quaacute trigravenh học tập
Để xaacutec định đuacuteng bagravei toaacuten magrave chuacuteng ta cần giải quyết thigrave phải trả lời đc một số cacircu hỏi
- cần hệ chuyecircn gia
Bước 2 thu thập tri thức lựa chọn cocircng cụ vagrave aacutep dụng
Trong bước thu thập tri thức vấn đề quan trọng lagrave lựa chọn chuyecircn gia những người magrave sẽ đoacuteng goacutep tri thức cho hệ thống Thocircng thường trong suốt quaacute trigravenh phaacutet triển thigrave chuyecircn gia được xem như một thagravenh viecircn của đội phaacutet triển
Hiện nay coacute rất nhiều cocircng cụ để xacircy dựng một hệ chuyecircn gia Phổ biến nhất lagrave JESS CLIPS vagrave OPS5
Bước 3 Thiết kế cơ sở tri thức thiết kế hệ thốngTri thức được biểu diễn trường minh trong cơ sở tri thức
Caacutec chuyecircn gia vagrave kỹ sư tri thức sẽ đối thoại với nhau bằng caacutec kỹ thuật đối thoại Suy diễn (SD) bảng Mocirc higravenh hoacutea SD quy nạp phacircn loại
Vấn đề bagraveo trigrave vagrave phaacutet triển
Caacutec hệ chuyecircn gia đogravei hỏi phải bảo trigrave vagrave phaacutet triển nhiều hơn so với caacutec hệ thống khaacutec Phải thường xuyecircn bổ sung tri thức mới vagrave thay đổi caacutec tri thức cũ để đổi mới hệ chuyecircn gia
Thu thập vagrave khắc phục lỗi do người sử dụng phaacutet hiện để kịp thời khắc phục những sai soacutet của hệ chuyecircn gia
75 Lợi iacutech vagrave hạn chế của caacutec hệ chuyecircn gia
Một số lợi iacutech chiacutenh
Thời gian trả lời hợp lyacute bằng hoặc nhanh hơn so với chuyecircn gia (người) để đi đến cugraveng một quyết định Hệ chuyecircn gia lagrave một hệ thống thời gian thực (real time system)
Khả năng trả lời với mức độ tinh thocircng bằng hoặc cao hơn so với chuyecircn gia (người) trong cugraveng lĩnh vực
Hệ chuyecircn gia giuacutep cho hiệu quả lagravem việc tăng bằng việc sử dụng tập caacutec luật một caacutech nhanh choacuteng magrave ko bị nhầm lẫn chuyecircn gia lagrave người coacute thể quecircn đi một số tri thức cơ sở lyacute luậ nhưng HCG thigrave ko
Quyết định của một người chuyecircn gia coacute thể bị thay đổi vagrave ko coacute tiacutenh thống nhất như quyết định của một hệ chuyecircn gia tạo ra
Hệ chuyecircn gia giuacutep cho người sử dụng coacute thể trau dồi sự hiểu biết trecircn lĩnh vuej cụ thể magrave noacute giải quyết hỗ trợ người ra quyết định coacute trigravenh độ như 1 chuyecircn gia trong quaacute trigravenh gia quyết định
Kiến thức của rất nhiều chuyecircn gia về một lĩnh vực nagraveo đoacute được đưa vagraveo hệ chuyecircn gia lagravem cho CSTT cuat HCG phong phuacute vagrave rộng lớn hơn rất nhiều
HCG giải thiacutech caacutec bước suy luận một caacutech dễ hiểu nhất quaacuten luacutec nagraveo cũng coacute thể sử dụng ko như chuyecircn gia con người
Hạn chế của caacutec hệ chuyecircn gia
Nhược điểm lớn nhất của hệ chuyecircn gia lagrave những yacute kiến chuyecircn mocircn thường rất khoacute matilde hoacutea vagrave giải neacuten
Hệ chuyecircn gia khocircng coacute khả năng tự học tự cập nhật kiến thức mới như caacutec chuyecircn gia magrave cần phải được matilde hoacutea lại khi noacute được cập nhật
Hệ chuyecircn gia khocircng thể nhận ra được vấn đề khocircng nằm trong miền kiến thức của hệ thống
Chương 8 Tri thức vagrave tiếp nhận
1 Bao gồm caacutec vấn đề
Dữ liệu thực tế đo lường hoặc quan saacutet coacute hoặc khocircng coacute bối cảnh
Thocircng tin dữ liệu được tổng hợp một caacutech hữu iacutech để giải quyết những khoacute khăn trong việc đưa ra quyết định
Tri thức bao gồm caacutec ứng dụng quy tắc thocircng tin hướng dẫn của người ra quyết định
2 Những caacutei nhigraven về tri thức
Đại diện lagravem thế nagraveo để diễn tả tri thức viacute dụ như một quyển saacutech khocircng phải lagrave tri thức nhưng noacute lại lagrave một đại diện của tri thức
Sản xuất tri thức lagrave một tập hơp của hagraveng tồn kho coacute thể được sản xuất cũng như mua lại
Tri thức lagrave 1 trong 6 trạng thaacutei của hệ thống
1Dữ liệu 2Thocircng tin 3Cấu truacutec thocircng tin 4Sự thấu hiểu 5Yacute kiến 6 Quyết định
3 Caacutec loại tri thức Phổ biến mocirc tả dữ liệu thocircng tin thủ tục mọi thứ lagravem như thế nagraveo lập luận chiacutenh saacutech hoặc caacutec quy tắc
4 Thu thập Tri thức hệ chuyecircn gia Hầu hết caacutec phương phaacutep đều bắt đầu với mocirc higravenh của caacutec taacutec vụ trong đoacute
hệ chuyecircn gia được xacircy dựng Trong đoacute mocirc tả về caacutec lĩnh vực được tạo ra Caacutec kỹ sư sử dụng caacutec mocirc higravenh giả thuyết vagrave nhận thức về quaacute trigravenh phacircn
tiacutech để gợi ra caacutech giải quyết vấn đề về tri thức từ caacutec chuyecircn gia
5 Caacutec chiều của thu thập tri thức KE- driven caacutec kỹ sư trao đổi trực tiếp với caacutec chuyecircn gia Expert-driven Caacutec chuyecircn gia trực tiếp đưa chuyecircn mocircn của họ vagraveo hệ
thống maacutey tiacutenh Machine-driven Sử dụng caacutec cocircng cụ suy luận để triacutech xuất tri thức từ một
tập caacutec viacute dụ
6 Kỹ thuật thu thập tri thức Trao đổi gồm 2 loại cơ bản lagrave coacute cấu truacutec(coacute kịch bản) vagrave khocircng coacute cấu
truacutec( đối thoại trực tiếp) Giao thức phacircn tiacutech bằng lời Khi caacutec chuyecircn gia thực hiện một cocircng việc
của họ thigrave một bản ghi về cocircng việc đoacute được thực hiện Caacutec kỹ sư sẽ xacircy dựng mocirc higravenh cho những gigrave được ghi lại trong bản ghi
Phương phaacutep sagraveng lọc caacutec chuyecircn gia so saacutenh caacutec nhoacutem liecircn tiếp trong ba đối tượng vagrave cho biết tại sao nhoacutem thứ hai lại khaacutec nhoacutem thứ ba
7 Thu thập tri thức từ nhiều nguồn Thu thập tri thức từ nhiều nguồn lagrave cần thiết để coacute được đầy đủ caacutec tri thức
cho một vấn đề quan điểm yacute kiến traacutei ngược nhau thường phaacutet sinh Phương phaacutep đồng thuận sẽ giuacutep giải quyết được vấn đề macircu thuẫn Kỹ thuật phacircn tiacutech Meta lagrave kỹ thuật được aacutep dụng trong caacutec trường hợp
khaacutec Caacutech tiếp cận bằng định lượng đogravei hỏi caacutec kỹ sư cần cacircn nhắc yếu tố đầu vagraveo của caacutec chuyecircn gia khaacutec nhau
8 Xaacutec nhận hợp lệ vagrave kiểm tra tri thức Một khi thu thập tri thức noacute phải được đaacutenh giaacute về khả năng sử dụng vagrave độ
chiacutenh xaacutec Hai vấn đề cụ thể lagrave hiệu lực của những kiến thức vagrave kiểm tra việc xacircy dựng cơ sở của tri thức
Cần xaacutec nhận xem liệu hệ thống coacute thể hoạt động ở mức độ tối thiểu khocircng
Xaacutec minh liecircn quan đến việc so saacutenh từng chi tiết kỹ thuật của hệ thống những gigrave đatilde được thực hiện cuối cugraveng
9 Một số caacutec biện phaacutep xaacutec nhận Độ chiacutenh xaacutec Khả năng thiacutech nghi Mức độ đầy đủ Bề rộng Độ sacircu Hiệu lực Tổng quan Chiacutenh xaacutec Hiện thực Độ tin cậy Tiacutenh hữu dụng Mức độ
Chương 9 Học maacutey
1 Logic mờ vagrave ngocircn ngữ mờ(Fuzzy Logic and Linguistic Ambiguity)
Ngocircn ngữ tự nhiecircn gồm những khaacutei niệm mơ hồ vagrave khocircng chiacutenh xaacutectruyền tải ngữ nghĩa thocircng qua tiacutenh xấp xỉkhocircng rotilde ragraveng
Những xấp xỉ nagravey giuacutep con người coacute thể truyền tải hết được yacute nghĩa nhưng maacutey thigrave khocircng hiểu
Lagravem sao biểu diễn caacutec tri thức sử dụng caacutec khaacutei niệm khocircng rotilde ragraveng(mờ) hoặc khocircng chiacutenh xaacutec
2 Khaacutei niệm cơ bản của logic mờ tập mờ lagrave những tập hợp khocircng coacute một giới hạn rotilde Mỗi phần tử của noacute chỉ
chứa một mức độ hagravem liecircn thuộc của từng phần tử Vigrave vậy tập mờ khocircng giống như tập cổ điển Tập mờ coacute thể kết hợp với nhau qua những luật mờ magrave đặc trưng cho những hagravenh động trạng thaacutei vagrave thuộc tiacutenh của logic mờ được tận dụng khi thực hiện một bộ điều khiển mờ
Logic mờ dựa trecircn yacute tưởng mỗi phần tử thuộc vagraveo một tập hợp ở một mức độ nagraveo đấy
Locircgic mờ cho pheacutep độ liecircn thuộc (microA )coacute giaacute trị trong khoảng (01) Locircgic mờ coacute thể được coi lagrave mặt ứng dụng của lyacute thuyết tập mờ để xử lyacute caacutec
giaacute trị trong thế giới thực cho caacutec bagravei toaacuten phức tạp
3 So saacutenh tiacutenh đuacuteng đắn logic mờ vagrave xaacutec suất Xaacutec suất thigrave đề cập đến khả năng xảy ra một biến cố hay một điều gigrave đoacute Logic mờ đề cập đến cấp độ magrave đặc tiacutenh ở hiện tại
o viacute dụ1 người coacute chiều cao 6 feet thigrave coacute cấp độ lagrave 05 về chiều cao
4 Ưu điểm của logic mờ Caacutech tiếp cận rất tự nhiecircnkhocircng phức tạp Coacute thể mocirc higravenh hoacutea caacutec hagravem phi tuyến tugravey yacute phức tạp
Coacute thể tận dụng được kinh nghiệm từ những chuyecircn gia hagraveng đầu trong mọi lĩnh vực
Logic mờ được xacircy dựng dựa trecircn ngocircn ngữ tự nhiecircnNền tảng của logic mờ lagrave dựa trecircn cơ sở giao tiếp của con người
5 Nhược điểm của logic mờ Trong 1 hệ thống phức tạpsử dụng logic mờ coacute thể trở thagravenh trở ngại cho
việc xaacutec thực độ tin cậy của hệ thống Cơ chế lập luận mờ khocircng thể học hỏi từ những lỗi sai
6 Mạng noron nhacircn tạo(ANN) Mạng noron nhacircn tạo lagrave một mocirc phỏng xử lyacute thocircng tinđược nghiecircn cứu ra
từ hệ thống thần kinh của sinh vậtgiống như bộ natildeo để xử lyacute thocircng tin ANNs lagrave chương trigravenh dựa trecircn maacutey tiacutenh đơn giản coacute chức năng lagrave một mocirc
higravenh bagravei toaacuten khocircng gian dựa trecircn thử nghiệm vagrave baacuteo lỗi
7 Học từ kinh nghiệm Tiến trigravenh Một mẫu dữ liệu được biểu diễn như một mạng lưới noronANN ldquodự
đoaacutenrdquo 1 đầu radự đoaacuten được so saacutenh với giaacute trị thực tế hoặc giaacute trị chiacutenh xaacutecNếu đoaacuten được chiacutenh xaacutec thigrave khocircng coacute hagravenh động nagraveo được thực hiện
Nếu dự đoaacuten sai ANN kiểm tra lại vagrave xaacutec định lại thocircng số để điều chỉnh Một mẫu dữ liệu khaacutec được biểu diễn vagrave quaacute trigravenh nagravey được lặp lại
8 Nguyecircn tắc cơ bản của cocircng nghệ nơron Caacutec yếu tố xử lyacute cơ bản trong hệ thống thần kinh của con người lagrave tế bagraveo
thần kinhMạng lưới của tế bagraveo nagravey lagrave liecircn kết với nhau nhận được thocircng tin từ caacutec cảm biến trong mắt taihellip
Thocircng tin nhận được bởi tế bagraveo thần kinh hoặc lagrave sẽ kiacutech thiacutech noacute(sẽ được chuyển qua 1 thocircng điệp dọc theo mạng lưới) hoặc lagrave sẽ ngăn cản noacute(ngăn cản dograveng thocircng tin)
Độ nhạy coacute thể thay đổi qua thời gian hoặc sau khi coacute được kinh nghiệm
9 Cấu truacutec mạng Một ANN gồm 3 lớp cơ bản
Lớp đầu vagraveo nhận dữ liệu Lớp becircn trong hoặc lagrave lớp ẩn xử lyacute dữ liệu Lớp đầu ra chuyển tiếp kết quả cuối cugraveng của mạng
10Mạng nơ ron Thường coacute nhiều đầu vagraveo mỗi đầu vagraveo với mức ảnh hưởng vagrave tầm quan
trọng riecircng của noacute Một đầu vagraveo quan trọng coacute thể được sử dụng để khuếch đại đầu ra caacutec hagravem trạng thaacutei tổng hợp caacutec trọng số của caacutec yếu tố
đầuvagraveo khaacutec nhauvagraveo một giaacute trị duy nhất Caacutec hagravem chuyển giao xử lyacute caacutec giaacute trị trạng thaacutei vagrave tạo đầu ra
11Huấn luyện mạng nơ ron Trong mocirc higravenh coacute giaacutem saacutetANN được đến so saacutenh dự đoaacuten của chiacutenh
noacute với thocircng tin phản hồi coacute chứa caacutec kết quả mong muốn ANN sẽ phải tigravem caacutech thay đổi caacutec tham số becircn trong củamigravenh (caacutec trọng số vagrave caacutec ngưỡng) để tạo necircn một aacutenh xạ coacute khả năng aacutenh xạcaacutec đầu vagraveo thagravenh caacutec đầu ra mong muốn Sự thay đổi nagravey được tiến hagravenh nhờ việc so saacutenh giữa đầu ra thực sự vagrave đầu ra mong muốn
Trong mocirc higravenh khocircng coacute giaacutem saacutetANN nhận được dữ liệu vagraveo nhưng khocircng phải coacute bất kỳ thocircng tin phản hồi về kết quả mong muốn
Phần lớn caacutec ứng dụng nằm trong vugraveng của caacutec bagravei toaacuten ước lượng như mocirc higravenh hoacuteathống kecirc neacuten lọc phacircn cụm
12Lợi iacutech Liecircn kết với mạng noron Traacutenh caacutech lập trigravenh tường minh Giảm nhu cầu của chuyecircn gia ANNs thigrave thiacutech nghi với caacutec yếu tố đầu vagraveo thay đổi Khocircng cần thiết cho cơ sở tri thức tinh chế ANNs coacute tiacutenh động vagrave cải thiện với việc sử dụng Coacute khả năng xử lyacute dữ liệu khocircng chiacutenh xaacutec hoặc khocircng đầy đủ Cho pheacutep tổng quaacutet hoacutea từ thocircng tin cụ thể Cho pheacutep thu thập cảm giaacutec thocircng thường vagraveo miền giải quyết vấn đề
13Hạn chế của việc liecircn kết với mạng noron ANNs khocircng thể giải thiacutech được suy luận Bản chất hộp đen thường khiến cho vấn đề traacutech nhiệm vagrave độ tin cậy phaacutet
sinh lagrave khoacute khăn Lặp đi lặp lại quaacute trigravenh huấn luyện rất tốn thời gian Nguồn lực caacutec nhagrave phacircn tiacutech vagrave thiết kế coacute tay nghề cao vẫn lagrave đaacuteng lo
ngại Cocircng nghệ ANN thuacutec đẩy hạn chế của phần cứng hiện tại ANN yecircu cầu phải coacute sự tin tưởng ở đầu ra
14Giới thiệu về thuật toaacuten di truyền Cũng như mạng lưới thần kinh caacutec thuật toaacuten di truyền được dựa trecircn lyacute
thuyết sinh học Thuật toaacuten di truyền tigravem thấy nguồn gốc của chuacuteng trong caacutec lyacute thuyết
tiến hoacutea của chọn lọc tự nhiecircn vagrave thiacutech ứng với biến đổi khiacute hậu Kết quả thuật toaacuten di truyền lagrave từ giao phối 2 caacute thể trong quần thế để tạo
ra con caacutei đocirci khi tốt hơn so với bậc cha mẹ của chuacuteng 15Caacutec thagravenh phần cơ bản của thuật toaacuten di truyền
Toaacuten tử chọn lọc Caacutec caacute thể tốt được chọn lọc để đưa vagraveo thế hệ sau Sự chọn lọc nagravey căn cứ vagraveo độ thiacutech nghi với mocirci trường của mỗi caacute thể
Toaacuten tử lai gheacutep (crossover) Hai caacute thể cha vagrave mẹ trao đổi caacutec gen với nhau để tạo ra caacute thể con
Toaacuten tử đột biến (mutation) Một caacute thể thay đổi một số gen để biến đổi thagravenh một caacute thể mớiTất cả caacutec toaacuten tử trecircn khi thực hiện đều mang tiacutenh ngẫu nhiecircn
16Quaacute trigravenh cơ bản của một thuật toaacuten di truyền Khởi tạo
Đaacutenh giaacute quần thể
Lựa chọn NST thiacutech hợp nhất vagrave loại bỏ NST yếu nhất
Quy trigravenh giao nhau vagrave cải thiện quần thể
đột biến tiến trigravenh để khaacutem phaacute ra NST mới
17Ưu nhược điểm của việc kết hợp với thuật toaacuten di truyền Kiacutech thước quần thể lagrave 1 yếu tố quan trọng trong tốc độ của việc tigravem
kiếmnhưng noacute tương đối dễ dagraveng để dự đoaacuten tốc độ nagravey Giao nhau hoặc đột biến lagrave khocircng necircn đc sử dụng quaacute thường xuyecircn Luocircn coacute được iacutet nhất 1 giải phaacutep hợp lyacute Necircn coacute thể aacutep dụng chuacuteng cho caacutec vấn đề magrave chuacuteng ta khocircng coacute hướng
về caacutech giải quyết Sức mạnh của thuật toaacuten xuất phaacutet từ khaacutei niệm đơn giảnkhocircng phải từ
một thủ tục thuật toaacuten phức tạp 18Tương lai của học maacutey
Mạng lưới thần kinh nhacircn tạo vượt quaacute năng lực của con người trong caacutec trường hợp bị cocirc lập
Về mặt lyacute thuyếtmột maacutey tiacutenh coacute thể xử lyacute dũ liệu nhanh hơn hagraveng triệu lần so với 1 con người
May mắn thay cho chuacuteng tacon người tốt hơn nhiều khi magrave coacute được dữ liệumaacutey tiacutenh khocircng coacute 1 số thứ như lagrave 5 giaacutec quan
CHƯƠNG 10 KHO DỮ LIỆU
1 Kho dữ liệu Kho dữ liệu lagrave tuyển tập caacutec cơ sở dữ liệu tiacutech hợp hướng chủ đề được
thiết kế để trợ giuacutep cho một hệ hỗ trợ quyết định
Theo John Ladley Cocircng nghệ kho dữ liệu lagrave tập caacutec phương phaacutep kỹ thuật vagrave caacutec cocircng cụ coacute thể kết hợp hỗ trợ nhau để cung cấp thocircng tin cho người sử dụng trecircn cơ sở tiacutech hợp từ nhiều nguồn dữ liệu nhiều mocirci trường khaacutec nhau
Kho dữ liệu thường rất lớn tới hagraveng trăm GB hay thậm chiacute hagraveng Terabyte
2 Kho dữ liệu vận hagravenh (ODS) Một kho dữ liệu vận hagravenh Aacutep dụng kỹ thuật kho dữ liệu vagraveo caacutec hệ xử
lyacute giao taacutec lưu trữ dữ liệu cho một ứng dụng đặc thugrave Noacute đưa vagraveo kho dữ liệu một dograveng caacutec dữ liệu thocirc được thiết kế
3 So saacutenh
Kho dữ liệu vận hagravenh Kho dữ liệu
Dữ liệu theo chủ đề Dữ liệu theo chủ đề
Dữ liệu tiacutech hợp Dữ liệu tiacutech hợp
Dữ liệu thay đổi Dữ liệu khocircng thay đổi
Dữ liệu được cập nhật khi thay đổi
Dữ liệu giữ nguyecircn
Chỉ coacute dữ liệu hiện tạiDữliệu hiện tại vagrave dữ liệu lịch sử
Chu kỳ lagravem tươi dữ liệu ngắn Chu kỳ lagravem tươi dữ liệu dagravei
Chỉ coacute dữ liệu chi tiết Dữ liệu chi tiết vagrave dữ liệu tổng kết
Dugraveng cho caacutec quyết định ngắn hạn
Dugraveng cho hoạch định dagravei hạn
4 Kho dữ liệu cục bộ (Data Mart - DM)
Kho dữ liệu cục bộ lagrave CSDL coacute những đặc điểm giống với kho dữ liệu nhưng với quy mocirc nhỏ hơn vagrave lưu trữ dữ liệu về một lĩnh vực một chuyecircn ngagravenh
Data mart phụ thuộc Chứa những dữ liệu được lấy từ DW vagrave những dữ liệu nagravey sẽ được triacutech lọc vagrave tinh chế tiacutech hợp lại ở mức cao hơn để phục vụ một chủ đề nhất định của Datamart
Data mart độc lập Khocircng giống như Datamart phụ thuộc Data mart độc lập được xacircy dựng trước DW vagrave dữ liệu được trực tiếp lấy từ caacutec nguồn khaacutec nhau
5 Siecircu dữ liệu Metadata lagrave dữ liệu để mocirc tả dữ liệu Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột
một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi Metadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu
6 Mocirci trường kho dữ liệu Hệ thống của tổ chức vagrave kho cung cấp dữ liệu để xacircy dựng kho dữ liệu Trong quaacute trigravenh chuyển dữ liệu từ caacutec nguồn khaacutec nhau dữ liệu coacute thể
được lagravem sạch hoặc chuyển đổi vagrave vigrave thế DW được xem như lagrave một chuẩn cho việc lưu trữ
Đồng thời siecircu dữ liệu được ghi lại Cuối cugraveng DW hoặc siecircu thị coacute thể được sử dụng để tạo ra một kho dữ
liệu ldquocaacute nhacircnrdquo 7 Caacutec đặc điểm của kho dữ liệu
Đặc điểm Mocirc tả
Hướng chủ đề - DL tổ chức theo caacutech thức người dugraveng tham chiếu
Tiacutech hợp - Dữ liệu ldquosạchrdquo loại bỏ tiacutenh thiếu nhất quaacuten
Khocircng thay đổi - DL ldquochỉ đọcrdquo người dugraveng khocircng thay đổi được
Chuỗi thời gian - DL lagrave chuỗi thời gian khocircng phải lagrave trạng thaacutei hiện tại
Được tổng kết - DL vận hagravenhthao taacutec khi cần thiết
được kết hợp lại thagravenh dạng coacute thể dugraveng được cho quyết định
Kiacutech cỡ lớn hơn - Lưu giữ theo chuỗi thời gian tức lagrave giữ lại nhiều DL
Khocircng được chuẩn hoacutea - Coacute thể dư thừa DLSiecircu dữ liệu - Dữ liệu của dữ liệu được lưu trữNguồn dữ liệu - DL vận hagravenh (caacutec hệ sẵn coacute) cugraveng
với caacutec nguồn ngoagravei 8 Kho dữ liệu hướng chủ đề
Hướng chủ để coacute nghĩa lagrave kho dữ liệu được tổ chức xung quanh caacutec chủ đề chiacutenh như khaacutech hagraveng sản phẩm sản xuất Tập trung vagraveo việc mocirc higravenh hoacutea vagrave phacircn tiacutech dữ liệu cho caacutec nhagrave ra quyết định magrave khocircng tập trung vagraveo caacutec xử lyacute thocircng thường Cung cấp cho người dugraveng một khung nhigraven toagraven vẹn đơn giản vagrave đầy đủ về caacutec sự kiện quanh caacutec chủ đề
9 Dữ liệu trong DW được tiacutech hợp Dữ liệu trong kho dữ liệu được xacircy dựng bằng caacutech tổng hợp dữ liệu từ
nhiều nguồn khaacutec nhau vagrave caacutec nguồn coacute tổ chức khaacutec nhau Cơ sở dữ liệu caacutec file excel caacutec flat file hoặc caacutec raw file Khi đưa vagraveo kho dữ liệu caacutec dữ liệu được lagravem sạch vagrave tiacutech hợp dữ liệu nhằm đảm bảo tiacutenh nhất quaacuten của dữ liệu
10Kiến truacutec kho dữ liệu Tầng cơ sở dữ liệu hoạt động Tầng truy xuất thocircng tin Tầng truy xuất dữ liệu Tầng siecircu dữ liệu Tầng quản lyacute tiến trigravenh Tầng thocircng điệp của ứng dụng Tầng vật liacute của kho dữ liệu Tầng trigravenh diễn dữ liệu
11Higravenh trạng kho dữ liệu Kho dữ liệu ảo - người dugraveng cuối coacute thể truy cập trực tiếp đến kho dữ liệu
sử dụng caacutec cocircng cụ cho pheacutep ở tầng truy xuất dữ liệu Kho dữ liệu trung tacircm-1 cơ sở dữ liệu vật lyacute chứa tất cả dữ liệu cho một
vugraveng chuyecircn dụng nagraveo đoacute
Kho dữ liệu phacircn taacuten- Thagravenh phần được phacircn taacuten qua nhiều hệ cơ sở dữ liệu vật lyacute
12METADATA- Siecircu dữ liệu Định nghĩa Siecircu dữ liệu lagrave dữ liệu về dữ liệu Lagrave 1 lưu trữ dugraveng để
Miecircu tả kho dữ liệu tổng thể Nhận dạng kiểu kho dữ liệu Quản liacute quaacute trigravenh tiacutech hợp dữ liệu Quản liacute quaacute trigravenh cập nhật kho dữ liệu Quản liacute bảo mật
Lagrave chigravea khoacutea quyết định sự thagravenh cocircng của kho dữ liệu luocircn được thay đổi vagrave cập nhật theo sự phaacutet triển của kho dữ liệu
Dugraveng để quản liacute điều khiển kho dữ liệu Sự ra đời của kho dữ liệu như 1 cấu truacutec hỗ trợ ra quyết định siecircu dữ liệu
được xem như nguồn tagravei nguyecircn dữ liệu Siecircu dữ liệu lagrave trừu tượng Chuacuteng lagrave dữ liệu bậc cao cung cấp mocirc tả ngắn
gọn caacutec dữ liệu bậc thấp hơn 13Hoạt động của Siecircu dữ liệu
Siecircu dữ liệu rất cần thiết trong việc chuyển hoacutea thocircng tin trở thagravenh tri thức Lagrave chigravea khoacutea giuacutep chuacuteng ta xử lyacute được dữ liệu thocirc Viacute dụ một dograveng dữ liệu baacuten hagraveng 1023 K596 11121 agraveNoacute sẽ khocircng coacute nghĩa gigrave cho đến khi chuacuteng ta đưa vagraveo siecircu dữ liệu (thư
mục chứa dữ liệu) agrave cửa hagraveng 1023 sản phẩm K596 vagrave số tiền baacuten được lagrave 11121 đocirc la
14Sự cần thiết phải nhất quaacuten trong kho dữ liệu Kho dữ liệu được xacircy dựng cho lợi iacutech của những nhagrave phacircn tiacutech kinh
doanh caacutec nhagrave quản trị cho tất cả caacutec khu vực chức năng Trong cơ sở dữ liệu riecircng caacutec khu vực khaacutec nhau coacute thể định nghĩa vagrave lưu
trữ dữ liệu thocircng qua phiecircn bản của chiacutenh noacute Khi dữ liệu được lấy từ những vugraveng khaacutec nhau đoacute vagrave được đặt vagraveo kho dữ
liệu Việc chuyển đổi vagrave lagravem sạch caacutec tiến trigravenh sẽ đảm bảo noacute lagrave duy nhất được tiacutech hợp tại một mức của tổ chức
15Ragrave soaacutet lại dữ liệu ndash Thực thi siecircu dữ liệu
Bất kể cấu truacutec tự nhiecircn của 1 cacircu truy vấn thế nagraveo thigrave caacutec thagravenh phần của siecircu dữ liệu rất quan trọng đối với người ra quyết định
Bảng thuộc tiacutenh khoacutea được lưu trữ bởi kho dữ liệu Tập hợp dữ liệu được lấy từ đacircu Những chuyển đổi nagraveo được thực thi với việc lagravem sạch
16Siecircu dữ liệu lagrave gigrave Metadata - lagrave thocircng tin mocirc tả nội dung của cơ sở dữ liệu (CSDL) Metadata baacuteo cho người dugraveng biết thời gian cập nhật sau cugraveng của dữ liệu
định dạng vagrave mục điacutech sử dụng của noacute Những thocircng tin nagravey coacute thể hướng dẫn người dugraveng duyệt qua CSDL vagrave
giuacutep họ hiểu được yacute nghĩa vagrave ngữ cảnh của dữ liệu Trong CSDL metadata lagrave caacutec dạng biểu diễn khaacutec nhau của caacutec đối tượng
trong CSDL Trong CSDL quan hệ metadata lagrave caacutec định nghĩa của bảng cột CSDL
view vagrave nhiều đối tượng khaacutec Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột
một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi -gtMetadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu
Bảng chuyển đổi Ghi lại những chuyển đổi đatilde được thực hiện
Lịch sử thực thi Ghi lại những dữ liệu đatilde được
phacircn tiacutech
Higravenh thaacutei kết nốiGhi lại những dữ liệu được kết nối vagrave tần suất
17Aacutenh xạ thocircng thường của siecircu dữ liệu Bản ghi aacutenh xạ chuyển đổi bao gồm
Định danh của nguồn gốc Chuyển đổi thuộc tiacutenh Chuyển đổi thuộc tiacutenh vật lyacute Matilde hoacutea tham chiếu bảng chuyển đổi Đổi tecircn Đổi khoacutea Gaacuten giaacute trị cho thuộc tiacutenh mặc định Chọn logic cho caacutec nguồn nhiều giaacute trị Đổi thuật toaacuten
18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để
phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai
lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave
tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec
Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm
Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo
19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua
caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau
SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được
Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra
một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức
Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ
Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ
Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech
CHƯƠNG 11 KHAI PHAacute DỮ LIỆU
1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn
ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993
Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng
2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd
1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều
2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP
3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn
4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng
5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server
6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo
7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động
8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời
9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều
10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện
11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech
12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP
3 Xử lyacute phacircn tiacutech trực tuyến OLAP
MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave
dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu
ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave
thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu
HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave
ROLAP4 Khai phaacute dữ liệu
Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh
khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn
Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan
5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp
6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại
Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp
Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec
Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt
Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra
Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh
vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho
Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec
Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm
Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục
Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng
gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp
Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn
Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec
Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper
Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2
Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25
Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước
Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng
Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện
trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp
Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute
độ hỗ trợ ge ngưỡng minsup
độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan
Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn
Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết
Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu
MOLAP ROLAP HOLAP
Lưu trữ dữ liệu cơ sở
Khối Bảng quan hệ Bảng quan hệ
Lưu trữ thocircng tin tổng hợp
Khối Bảng quan hệ Khối
Hiệu suất thực hiện truy vấn
Nhanh nhất Chậm nhất Nhanh
Tiecircu thụ khocircng gian lưu trữ
Nhiều Thấp Trung bigravenh
Chi phiacute bảo trigrave Cao Thấp Trung bigravenh
bull Mức độ thể chế hoacutea của MSS trong tổ chứcDo bởi tiacutenh đa dạng của DSS necircn việc đaacutenh giaacute sự thagravenh cocircng của hệ nagravey cũng khoacute khăn tuynhiecircn cũng coacute thể coacute một số yếu tố giuacutep cho DSS thagravenh cocircng như sự tham gia người dugravenghuấn luyện người dugraveng hỗ trợ quản lyacute cấp cao nguồn thocircng tin đặc điểm của những nhiệmvụ coacute liecircn quan (cấu truacutec bất định độ khoacute phụ thuộc)
Chương5Nhoacutem hỗ trợ quyết định vagrave nhoacutemcocircng nghệ phần mềm
51Nhoacutem tạo quyết định
MDM-Holsapple đatilde gợi yacute chuacuteng ta sử dụng giới hạn người tạo quyết định
Một nhoacutem lagrave kết cấu MDM nơi magrave nhiều người ra quyết định hoagraven toagraven tương taacutec
Một đội lagrave kết cấu MDM nơi caacutec thagravenh viecircn tư vấn cho người đưa ra quyết định nhưng khocircng tương taacutec
Một Ủy ban lagrave kết cấu MDM với một người tạo quyết định duy nhất vagrave sự tương taacutec giữa caacutec thagravenh viecircn
Mạng thocircng tin
Mạng lưới baacutenh xe mỗi người tham gia coacute thể giao tiếp với người đưa ra quyết định ở trung tacircm nhưng khocircng phải với người tham gia khaacutecCấu truacutec nagravey lagrave khocircng thỏa matilden tất cả những người tham gia ngoại trừ người ra quyết định
Mạng dacircy chuyền Tham gia chuyển tiếp thocircng tin chỉ để noacute luocircn liền kề nhau trong chuỗi
Thagravenh viecircn cuối cugraveng ko được đaacutep ứng
Mạng vograveng trograven Tương tự như chuỗi nhưng kết thuacutec được kết nối
Mạng kết nối hoagraven toagraven khocircng coacute hạn chế về giao tiếp vagrave tương taacutec giữa caacutec thagravenh viecircnNoacutei chungnoacute đaacutep ứng hầu hết caacutec kết nối của người tham gia nhưng truyền đạt thocircng tin mất nhiều thời gian vagrave coacute nhiều cơ hội xảy ra lỗi
Nhoacutem hagravenh vi vagrave chuẩn mực
MDMs thiết lập caacutec chỉ tiecircu hướng dẫn quaacute trigravenh ra quyết định
Một chuẩn mực quy định cụ thể những gigrave thagravenh viecircn trong nhoacutem dự kiến sẽ lagravem trong những hoagraven cảnh nhất định
Quy tắc gửi coacute thể được thocircng qua viacute dụ đaacutenh giaacute ngang hagraveng hoặc xử phạt
Lagravem thế nagraveo để đưa ra quyết định
Việc chọn lựa magrave trong đoacute việc sử dụng cấu truacutec MDM phải được dựa trecircn một số yếu tố liecircn quan với bối cảnh quyết định
Viacute dụmột cấu truacutec riecircng lẻ sẽ lagravem việc nơi magrave quyết định được cấu truacutec cao vagrave thocircng tin lagrave coacute sẵn
Một ủy ban cơ cấu sẽ lagrave sự lựa chọn khi người ra quyết định khocircng thể đưa ra quyết định một migravenh
52Caacutec vấn đề thường gặp trong nhoacutem
Kiacutech thước Noacutei chung sự nhất triacute vagrave gắn kết giữa caacutec thagravenh viecircn tỉ lệ nghịch với phạm vi nhoacutem Trong nhoacutem lớn rất dễ higravenh thagravenh caacutec nhoacutem nhỏ vagrave hoạt động rời rạc
Tư duy tập thể Trong nhoacutem lớn mọi người coacute xu hướng suy nghĩ đểđạtđược sự nhất triacute necircn khocircng phaacutet huy được sự saacuteng tạo
Caacutec vấn đề về xatilde hội
Xung đột Trong 1 nhoacutem ai cũng muốn migravenh lagrave giỏi nhất necircn dễ dẫn đến xung đột
Ẩn danh(Giấu tecircn) Đacircy lagrave phương phaacutep được sử dụng để kiểm soaacutet xung đột Cho caacutec thagravenh viecircn tham gia ẩn danh
Vấn đề giới tiacutenh Nam vagrave nữ thường coacute những thế mạnh khaacutec nhau điều nagravey coacute thể lagrave sức mạnh trong 1 thiết lập MDM
Đagravem phaacuten vagrave quyết định
Một quyết định coacute thể liecircn quan đến nhiều quan điểm khaacutec nhau vigrave thế cần phải coacute sự đagravem phaacuten
Caacutec thiết kế của cơ chế hỗ trợ cho MDM phải phugrave hợp với caacutec hoạt độngđagravemphaacuten
Những hoạt động nagravey bao gồm việc thu nhận yacute kiến của caacutec thagravenh viecircn 1 caacutech cocircng bằng
53Cocircng nghệ hỗ trợ MDM
Organizational DSSndash 1 hệ thống cung cấp caacutec quyết định hỗ trợ
Group Support Systemndash Cocircng nghệ sử dụng sự hỗ trợ của nhiều becircn tham gia
Group DSS ndash Lagrave 1 hệ thống được thiết kế đặc biệt để hỗ trợ cho MDM
DSS ndash Lagrave 1 hệ thống dưới sự kiểm soaacutet của 1 người quyết định hệ thống nagravey cung cấp 1 bộ cocircng cụ giuacutep phacircn tiacutech hoagraven cảnh đểđưa ra quyết định vagrave nacircng cao hiệu quả của quyết địnhđoacute
53Cocircng nghệ hỗ trợ MDM
Organizational DSSndash 1 hệ thống cung cấp caacutec quyết định hỗ trợ
Group Support Systemndash Cocircng nghệ sử dụng sự hỗ trợ của nhiều becircn tham gia
Group DSS ndash Lagrave 1 hệ thống được thiết kế đặc biệt để hỗ trợ cho MDM
DSS ndash Lagrave 1 hệ thống dưới sự kiểm soaacutet của 1 người quyết định hệ thống nagravey cung cấp 1 bộ cocircng cụ giuacutep phacircn tiacutech hoagraven cảnh đểđưa ra quyết định vagrave nacircng cao hiệu quả của quyết địnhđoacute
Mục tiecircu của cocircng nghệ hỗ trợ MDM
Quy trigravenh hỗ trợ tập trung vagraveo quaacute trigravenh tạo điều kiện thuận lợi cho sự tương taacutec
Cơ chế cấu truacutec quaacute trigravenh chi phối caacutec hoạt động truyền thocircng
Nhiệm vụ hỗ trợ cocircng việc coacute thể chọn lựa tổ chức hoặc lấy thocircng tin
Nhiệm vụ cấu truacutec cocircng việc cho pheacutep truy cập đến kỹ thuật lọc kết hợp phacircn tiacutech kiến thức liecircn quan đến cocircng việc
Caacutec lớp loại cocircng nghệ hỗ trợ MDM
Phacircn loại theo đặc điểm do DeSanctis vagrave Gallupe đưa ra đề xuất một chương trigravenh ba cấp dựa trecircn caacutec tiacutenh năng được cung cấp
Hệ thống cấp 1 Mục điacutech chiacutenh lagrave tạo điều kiện thocircng tin liecircn lạc giữa caacutec thagravenh viecircn
Hệ thống cấp 2 Thiết kế để giảm thiểu rủi ro
Hệ thống cấp 3 Giuacutep điều chỉnh xử lyacute quyết định
Phacircn loại theo cocircng nghệ -Kraemer vagrave King tập trung vagraveo cocircng nghệ aacutep dụng
Cocircng nghệ bảng mạch điện tử
Hội nghị trực tuyến
Mạng lưới tập đoagraven
Trung tacircm thocircng tin
Mocirci trường cộng taacutec
Phograveng quyết định
Nhoacutem phần mềm
Phần mềm được thiết kế để hỗ trợ sự hợp taacutec bao gồm việc thu huacutet vagrave lưu trữ thocircng tin
Caacutec tổ chức dẫn đầu thị trường hiện tại lagrave Lotus Notes and Domino Microsoft Exchange Novell GroupWise and Oracle Office
Caacutec cocircng cụ trong một bộ phần mềm bao gồm người quản lyacute hội nghị (Lotus Sametime) vagrave trao đổi thocircng điệp (Lotus Notes Mail)
Xếp hạng phần mềm cho nhoacutem
Ellis vv đề xuất một hệ thống xếp hạng dựa vagraveo kiểu sự hỗ trợ noacute Cung cấp
Hệ thocircng điệp
Hệ thống hội thảo truyền higravenh
Hệ thống cộng taacutec soạn thảo
Nhoacutem phacircn phối giải phaacutep phần mền
Hệ thống phối hợp
Hệ thống thocircng minh đại diện
Lực lượng điều khiển phaacutet triển phần mềm cho nhoacutem
Một số nhacircn tố chiacutenh bao gồm
Tăng năng suất
Giảm số lượng caacutec cuộc họp
Tăng cường tự động hoacutea caacutec quy trigravenh lagravem việc thường xuyecircn
Cần phối hợp toagraven cầu tốt hơn
Tiacutenh sẵn sagraveng của những mạng lan rộng
Coleman vagrave Khanna liệt kecirc 10 nhacircn tố khaacutec
54Quản lyacute hoạt động MDM (Mobile Device Management - Quản lyacute thiết bị di động)
Một số phương phaacutep phối hợp phổ biến hơnMDM lagrave
Kỹ thuật nhoacutem định danh
Kỹ thuật Delphi
Sự phacircn xử
Hệ thocircng tin dựa trecircn vấn đề
Nemawashi
Kỹ thuật nhoacutem định danh
1-Mỗi người tham gia viết ra những yacute tưởng về những gigrave necircn quyết định
2-Lần lượt mỗi người tham gia trigravenh bagravey yacute tưởng của migravenh được ghi lại trecircn bảng Khocircng thảo luận ở đacircy
3-Sau khi tất cả caacutec yacute tưởng được trigravenh bagravey caacutec đại biểu coacute thể chất vấn những người khaacutec
4-Mỗi người tham gia bỏ phiếu cho mỗi yacute tưởng
Kỹ thuật Delphi
Về cơ bản tương tự như kỹ thuật nhoacutem định danh ngoại trừ những người khocircng bao giờ tham gia cuộc họp
Một cocircng cụ khảo saacutet được sử dụng để thu thập đầu vagraveo ban đầu từ caacutec thagravenh viecircn
Một cuộc khảo saacutet thứ hai được gửi đi với một bản toacutem tắt caacutec kết quả chung
Những bước lặp lại cho đến khi đạt được một sự đồng thuận hoặc nhigraven nhận của đa số
Sự phacircn xử(Arbitration )
Thiacutech hợp nhất khi caacutec thagravenh viecircn của MDM đại diện cho caacutec yếu tố đối lập
Những người tham gia đồng yacute rằng nếu lựa chọn thay thế hai becircn thỏa thuận khocircng được tigravem thấy thigrave một trọng tagravei viecircn becircn ngoagravei sẽ tham gia
Trọng tagravei sau đoacute lựa chọn thay thế ocircng hoặc xeacutet thấy thiacutech hợp nhất
Hệ thống thocircng tin dựa trecircn vấn đề (IBIS)
Lagrave một phương phaacutep lập luận cấu truacutec
Một đại diện cho IBIS lagrave một đồ thị với caacutec nuacutet vagrave caacutec liecircn kết
IBIS bắt đầu với lựa chọn của một nuacutet vấn đề gốc sau đoacute caacutec nuacutet vị triacute khaacutec nhau được liecircn kết với nuacutet gốc
Caacutec nuacutet vị triacute nagravey sau đoacute được đaacutenh giaacute dựa trecircn những lập luận gắn liền với chuacuteng
Nemawashi (được sử dụng rộng ratildei tại Nhật Bản)
1-Một hoặc nhiều thagravenh viecircn của MDM được chỉ định lagrave điều phối viecircnCaacutec điều phối viecircn sau đoacute chọn người tham gia cograven lại
2-Điều phối viecircn xacircy dựng một tổng hợp caacutec sự lựa chọn vagrave sau đoacute caacutec chuyecircn gia đaacutenh giaacute caacutec lựa chọn
3-Điều phối viecircn lựa chọn một sự lựa chọn dựa trecircn kết quả ở trecircn(ở 2)
4-Sự thay thế được luacircn chuyển điều phối viecircn tigravem kiếm sự đồng thuận thocircng qua sự thuyết phục vagrave đagravem phaacuten
5-Nếu đạt được sự đồng thuận điều phối viecircn cho lưu thocircng một tagravei liệu magrave mỗi thagravenh viecircn MDM để lại dấu hiệu trecircn đoacute
55Nơi lagravem việc ảo
Nhiều tổ chức trecircn toagraven thế giới kinh doanh bất động sản cho cocircng nghệ hợp taacutec
Cocircng việc được trở thagravenh một điều bạn lagravem hơn lagrave một nơi bạn đi
Những thay đổi lớn nhất mang lại bởi nơi lagravem việc ảo coacute thể lagrave về văn hoaacute hay xatilde hội hơn lagrave về cocircng nghệ
Chương 6 Hệ thống thocircng tin điều hagravenh
61 Yacute nghĩa của EIS- Hệ thống thocircng tin điều hagravenh
- EIS lagrave một dạng đặc biệt của DSS được thiết kế để hỗ trợ ra quyết định ở cấp cao nhất của một tổ chức
- Lagrave một hệ thống thocircng tin hỗ trợ nhu cầu lập kế hoạch vagrave đaacutenh giaacute của caacutec nhagrave quản lyacute điều hagravenh
- EIS coacute thể giuacutep một CEO coacute được bức tranh tổng thể chiacutenh xaacutec nhất về caacutec hoạt động vagrave một bản toacutem tắt những gigrave magrave đối thủ cạnh tranh đang lagravem
- Caacutec hệ thống nagravey noacutei chung hoạt động dễ dagraveng vagrave trigravenh bagravey thocircng tin theo những caacutech dễ hiểu để việc tiếp thu được nhanh choacuteng (biểu đồ đồ thịhellip)
(Tagravei liệu thecircm EIS lagrave những loại hệ thống lagrave rất phức tạp trong tự nhiecircn Coacute thể noacutei hệ thống nagravey cũng cung cấp cho caacutec nhagrave quản lyacute với caacutec thiết bị coacute khả năng ra quyết định bằng caacutech sử dụng của noacute Hệ thống nagravey hoạt động trong điều kiện như vậy quan trọng như trong caacutec hệ thống khaacutec khocircng hỗ trợ Khả năng lưu trữ dữ liệu nặng lagravem cho noacute lyacute tưởng để được thocircng qua khocircng chỉ bởi caacutec doanh nghiệp lớn magrave cograven bởi caacutec doanh nghiệp nhỏ hơn Nhigraven chung hệ thống nagravey lagrave dagravenh cho caacutec nhacircn viecircn cấp cao hỗ trợ thagravenh thạo trong việc đưa ra caacutec quyết định quan trọng)
Caacutec phiecircn EIS tiecircu biểu- Phiecircn lagravem việc coacute thể bắt đầu với một baacuteo caacuteo về tigravenh higravenh tagravei chiacutenh vagrave kinh
doanh của một cocircng ty caacutec chỉ số hoạt động quan trọng được hiển thị rotilde ragraveng- EIS sẽ cho pheacutep caacutec giaacutem đốc điều hagravenh coacute thể đi sacircu vagraveo dữ liệu từ những con
số bất kỳ magrave noacute hỗ trợ- Việc điều hagravenh coacute thể lựa chọn một mức độ chi tiết ( VD danh số baacuten hagraveng) nếu
như cần điều tra thecircm- Lagrave một phương phaacutep tiếp cận coacute thể giuacutep việc ra quyết định tốt hơn
Những điều magrave EIS ko coacute- EIS khocircng phải lagrave sự thay thế cho caacutec hệ thống dựa trecircn caacutec maacutey tiacutenh khaacutec EIS
thực sự chỉ cung cấp dữ liệu cho caacutec hệ thống nagravey- Noacute khocircng thể biến caacutec bộ hệ điều hagravenh của maacutey tiacutenh thagravenh những ldquochuyecircn viecircn
giỏirdquo- Coacute thể được viacute một caacutech cao hơn như lagrave một trợ lyacute đaacuteng tin cậy coacute thể được gọi
đến bất khi nagraveo vagrave mỗi khi cần thiết
Tagravei liệu thecircm Sự khaacutec nhau giữa EIS vagrave DSS+ EIS thiết kế để hỗ trợ những người điều hagravenh cấp cao giuacutep họ khaacutem phaacute caacutec vấn đề vagrave caacutec cơ hội DSS hỗ trợ những nười phacircn tiacutech cố gắng trả lời cacircu hỏi caacutei gigrave coacute thể lagravem cugraveng với một cơ hội hoặc một vấn đề
Chiều EIS DSSNhững người sử dụng thocircng thường
Duyệt dữ liệu đi xuống truy xuất trạng thaacutei
Hỗ trợ phacircn tiacutech vagrave quyết định
Sự thuacutec đẩy Tiacutenh thiacutech hợp Tiacutenh hiệu quảỨng dụng Queacutet mocirci trường đaacutenh giaacute
hiệu suất nhận dạng caacutec vấn đề vagrave caacutec cơ hội
Caacutec quyết định quản lyacute trecircn caacutec lĩnh vực đa dạng
Hỗ trợ quyết định Caacutec chiacutenh saacutech caacutec quyết định khocircng coacute cấu truacutec ở mức cao vagrave hỗ trợ giaacuten tiếp
Hỗ trợ caacutec quyết định lặp lại caacutec quyết định khocircng thể đoaacuten trước ra quyết định khocircng coacute cấu truacutec vagrave baacuten cấu truacutec
Loại thocircng tin Caacutec thocircng tin tin tức thocircng tin becircn ngoagravei về khaacutech hagraveng đối thủ cạnh tranh mocirci trường caacutec baacuteo caacuteo theo yecircu cầu vagrave định thời về caacutec hoạt động becircn trong
Caacutec thocircng tin hỗ trợ caacutec tigravenh huống đặc biệt
Sử dụng coacute nguyecircn tắc
Dograve theo vết vagrave điều khiển nhận dạng cơ hội
Hoạch định tổ chức phacircn nhoacutem vagrave điều khiển
Khả năng phugrave hợp với những người sử dụng caacute nhacircn
Thiết kế loại ra quyết định cho mỗi người điều hagravenh caacute nhacircn bằng nhiều lựa chọn đầu ra
Cho pheacutep caacutec đaacutenh giaacute caacute nhacircn caacutec khả năng what-if lựa chọn loại hộp hội thoại
Đồ họa Phải coacute Lagrave một phần quan trọng của nhiều DSS
Thacircn thiện người sử dụng
Phải coacute Phải coacute nếu khocircng coacute người sử dụng trung gian
Xử lyacute thocircng tin Lọc neacuten thocircng tin dograve theo vết dữ liệu vagrave thocircng tin quan trọng
EIS kiacutech thiacutech caacutec cacircu hỏi caacutec cacircu trả lời bằng caacutech sử dụng DSS vagrave phản hồi lại EIS
Hỗ trợ caacutec thocircng tin chi tiết
Truy xuất thường xuyecircn caacutec mức chi tiết của bất kỳ thocircng tin tổng hợp nagraveo (duyệt dữ
Coacute thể coacute trong DSS nhưng khocircng thường
liệu chi tiết)Cơ sở mocirc higravenh Caacutec chức năng coacute sẵn bị hạn
chếLagrave điểm cốt lotildei của DSS
Cấu truacutec Theo người baacuten sản phẩm hoặc theo caacutec chuyecircn gia hệ thống thocircng tin
Theo người sử dụng hoặc caacute nhacircn hoặc caacutec chuyecircn gia từ caacutec trung tacircm thocircng tin hoặc phograveng ban hệ thống thocircng tin
Phần cứng Mainframe caacutec trạm RISC mạng LANs hoặc caacutec hệ thống phacircn bố
Mainframe caacutec trạm RISC caacutec maacutey PC hoặc caacutec hệ thống phacircn bố
Bản chất caacutec goacutei phần mềm
Truy xuất tương taacutec dễ dagraveng đến nhiều cơ sở dữ liệu truy xuất trực tuyến caacutec khả năng DBMS phức tạp caacutec liecircn kết phức tạp
Caacutec khả năng tiacutenh toaacuten lớn caacutec ngocircn ngữ mocirc higravenh mocirc phỏng ứng dụng vagrave caacutec bộ tạo DSS
Bản chất caacutec thocircng tin
Trigravenh bagravey thocircng tin được phaacutet sinh trước về quaacute khứ vagrave hiện tại tạo caacutec thocircng tin mới về quaacute khứ hiện tại tương lai
Tạo thocircng tin mới về quaacute khứ hiện tại tương lai
62 Lịch sử EIS- EIS xuất hiện lần đầu tiecircn tại MIT vagraveo những năm 1970
- Những EIS đầu tiecircn được phaacutet triển bởi caacutec doanh ngiệp lớn sẵn sagraveng chấp nhận rủi ro để đạt được lợi thế cạnh tranh
- Vagraveo những năm 1980 caacutec nhagrave cung cấp đatilde phaacutet triển một số cơ sở khaacutech hagraveng rộng vagrave cocircng nghệ EIS được tiếp tục phaacutet triển cho đến ngagravey nay
(Tagravei liệu thecircm Sử dụng DSSEIS cho phaacutet triển bền vững + Một số nghiecircn cứu đatilde được tiến hagravenh để kiểm tra việc thực hiện của EIS trong khu vực cocircng cộng vagrave chiacutenh phủ caacutec nước tổ chức kể từ khi chuacuteng được phaacutet triển theo định hướng lợi nhuận cho caacutec cocircng ty tư nhacircn (Hasan vagrave Hasan năm 1997) Theo một nghiecircn cứu tiến hagravenh tại Mỹ ở hơn 300 cocircng ty kết quả cho thấy sự khaacutec biệt của EIS giữa tư nhacircn vagrave chiacutenh phủ một số kết quả thuacute vị được phaacutet hiệnViacute dụ khoacute khăn hơn để chuyển tiền từ một tagravei khoản khaacutec trong một EIS của chiacutenh phủ cũng lagrave khoacute khăn hơn để biện giải thiacutech cho những chi phiacute phaacutet triển EIS của chiacutenh phủ Một nghiecircn cứu khaacutec được tiến hagravenh ở Australia
cho thấy rằng EIS cung cấp cho quản lyacute một higravenh ảnh chiacutenh xaacutec hơn về tổ chức thực hiện vagrave cung cấp hỗ trợ cho caacutec lợi iacutech chiến lược cải thiện khocircng chỉ cho caacutec nhagrave quản lyacute nhưng cograven cho phần cograven lại của tổ chức Dựa trecircn caacutec hệ thống được thiết kế cho caacutec cocircng ty tư nhacircn với một caacutech rotilde ragravengxaacutec định mục tiecircu EIS lagrave thiacutech hợp cho caacutec tổ chức cocircng cộng hiện đại nhưng cần phải được linh hoạt hơn vagrave kết thagravenh chugravem một phạm vi rộng hơn khả năng vagrave phương tiện hơn so với khu vực tư nhacircn ban đầu theo định hướng sản phẩm (Hasan vagrave Hasan năm 1997) Điều nagravey coacute thể lagrave do thực tế rằng caacutec hoạt động khu vực cocircng lagrave bắt buộc coacute taacutec động rộng phải đaacutep ứng sự mong đợi duy nhất cocircng cộng thường coacute mục tiecircu mơ hồ vagrave macircu thuẫn iacutet quyền tự chủ vagrave kiểm soaacutet việc ra quyết định vagrave nhacircn viecircn lagrave khoacute khăn hơn (Watson vagrave Carte2000) + Toacutem lại EIS lagrave một khaacutei niệm thagravenh cocircng noacute phaacutet triển qua nhiều năm tuy nhiecircn EIS khắc phục khiếm khuyết của migravenh bằng caacutech tiến hagravenh nghiecircn cứu liecircn tục)
63 Tại sao những người điều hagravenh hagraveng đầu lại khaacutec nhau- Họ lagrave những doanh nghiệp theo định hướng coacute suy nghĩ
- Coacute một khoảng khocircng gian rộng để kiểm soaacutet
- Họ chịu traacutech nhiệm cho việc thiết lập chiacutenh saacutech
- Họ đại diện cho tổ chức mocirci trường becircn ngoagravei
- Hagravenh động của họ tạo ra những kết quả đaacuteng kể về tagravei chiacutenh vagrave con người
Tần số caacutec hoạt động điều hagravenh- Xử lyacute xaacuteo trộn 42
- Hoạt động kinh doanh 32
- Phacircn bổ nguồn lực 17
- Đagravem phaacuten 3
- Những điều khaacutec 6
Handling Disturbances 42
Entrepreneurial Activites 32
Resource Allocation 17
Negotiation 3
Other 6
Những thocircng tin điều hagravenh cần thiết- Quản lyacute xaacuteo trộn coacute thể yecircu cầu sự chuacute yacute xung quanh đồng hồ
- Hoạt động kinh doanh yecircu cầu điều hagravenh để dự đoaacuten những thay đổi trong mocirci trường
- Nhiệm vụ phacircn bổ tagravei nguyecircn yecircu cầu lựa chọn người quản lyacute vagrave caacutec nguồn lực hạn chế được triển khai
- Đagravem phaacuten yecircu cầu cập nhật thocircng tin từng phuacutet để coacute thể xacircy dựng được sự đồng thuận
Caacutec loại thocircng tin điều hagravenh- Hệ thống kế toaacuten coacute liecircn quan đến việc tiacutenh toaacuten thu nhập hoạt động cho caacutec lĩnh
vực cụ thể lagrave quan trọng hơn so với caacutec hệ thống kế toaacuten truyền thocircng- Thocircng tin về thị trường khaacutech hagraveng cung cấp giaacute trị trong việc quyết định chiến
lược- Caacutec thocircng tin cần thiết thường được truyền đi trecircn một số hệ thống maacutey tiacutenh vagrave
nằm trong toagraven tổ chức- Caacutec thocircng tin được sử dụng thường lagrave ngắn hạn vagrave dễ thay đổi
Phương thức để xaacutec định thocircng tin cần thiết
Rockart xaacutec định được năm phương thức cơ bản để xaacutec định thocircng tin cần thiết
- Phương thức dựa trecircn kết quả- Phương thức rỗng- Phương thức chỉ số khoacutea- Phương thức tổng hợp nghiecircn cứu- Phương thức dựa vagraveo nhacircn tố then chốt dẫn đến thagravenh cocircng
64 Thagravenh phần EIS
- Sản phẩm EIS đầu tiecircn được phaacutet triển để sử dụng trecircn maacutey tiacutenh cấu higravenh cao nhưng caacutec sản phẩm hiện nay nhằm mục tiecircu lagrave nền tảng ClientServer
- Những nền tảng linh hoạt hơn coacute thể thiacutech ứng với thay đổi trong tổ chức vagrave cocircng nghệ
- Sử dụng dữ liệu thời gian thực dẫn đến quyết định nhanh hơn nhiều thocircng tin hơn
Thagravenh phần phần cứng- Một EIS khocircng đogravei hỏi coacute phần cứng cụ thể hoặc duy nhất nagraveo- Chigravea khoacutea của vấn đề lagrave để đảm bảo rằng caacutec thagravenh phần của EIS tối ưu hoacutea vagrave
phugrave hợp với tagravei nguyecircn maacutey tiacutenh của tổ chức- Hệ thống nagravey phải được cấu higravenh để caacutec nguồn tagravei nguyecircn phugrave hợp với những
người điều hagravenh chuacuteng
Thagravenh phần phần mềm- Traacutei ngược với phần cứng phần mềm thường được chuyecircn mocircn hoacutea cao cho caacutec
bagravei toaacuten về miền- Sự chuyecircn mocircn hoacutea nagravey thường đạt được bằng caacutech sử dụng thagravenh phần off-the-
shelf cho toagraven bộ EIS vagrave caacutec mocirc-đun tugravey chỉnh để đaacutep ứng nhu cầu cụ thể- Lotus Notes lagrave một viacute dụ điển higravenh Noacute coacute thể được sử dụng một migravenh hoặc coacute
thể phục vụ becircn thứ ba mocirc-đun plug-in
Cocircng nghệ EIS hiện nay
Dobrzeniecki đề xuấtphacircn loạitừng cấptheo bachức năng- Loại 1 sản phẩm bao gồmmột bộ đầy đủcaacutec ứng dụngtừ mộtnhagrave cung cấp- Loại 2 sản phẩm đượcthựchiệnở phần đầu củacaacutecsản phẩmDSS đượcphaacutet triển
bởicugravengmộtnhagrave cung cấp- Loại 3 sản phẩmkết hợp với nhautheo bất kỳ số lượngthuộc sở hữu củacocircng ty
65 Xacircy dựng EIS
- Xacircy dựngmộtEISgiống nhưxacircydựngmột số hệ thống khaacutec củamocirc higravenh hệ thống thocircng tin
- Việcphaacutet triểncấu truacutecnecircn được theo dotildeitừ quaacute trigravenh thiết kế đến quaacute trigravenhthực hiện
- Tuy nhiecircn một dự aacuten phaacutet triển EIScoacute xu hướnglagrave thống nhấtvagraveyecircu cầu hỗ trợ caacutec nhagrave quản lyacute latildenh đạo
- Xacircy dựng một EIScoacute thểphaacutet hiện ra đượccaacutectigravenh huống khoacute khănmagravemột nhagrave phaacutet triển chưabao giờ gặp phải
Mocirc higravenh EIS
Khung phaacutet triển một EIS
- Watson et al đề nghị xacircy dựngkhung với ba thagravenh phần+ Caacutech tiếp cận tập trung vagraveo yếu tốcon người vagrave dữ liệu coacute liecircn quan đến EIS+ Quaacute trigravenh phaacutet triển cần sự linh hoạt vagrave tương taacutec+ Người sử dụng - hệ thống hộp thoại bao gồm một ngocircn ngữ hagravenh động để xử lyacute caacutec lệnh
Lợi iacutech của EIS- Dễ duy trigrave caacutec mục tiecircu coacute tổ chức- Dễ truy xuất thocircng tin- Cho pheacutep người sử dụng nacircng cao hiệu suất hơn
- Tăng chất lượng ra quyết định- Cung cấp sự cải tiến cạnh tranh- Tiết kiệm thời gian của người sử dụng- Tăng khả năng vagrave chất lượng giao tiếp- Cung cấp khả năng điều khiển tốt hơn trong tổ chức- Cho pheacutep tham gia caacutec vấn đề vagrave caacutec cơ hội- Cho pheacutep hoạch định- Cho pheacutep tigravem kiếm nguyecircn nhacircn của một vấn đề- Thảo matilden caacutec yecircu cầu của người điều hagravenh
Hạn chế của EIS vagrave 1 số sai lầm cần traacutenh
- Chi phiacute một cuộc khảo saacutetnăm1991 chothấychi phiacute phaacutet triểntrungbigravenh365000USDvớichi phiacute vận hagravenhhagraveng năm lagrave$200000 (EIS)
- Cocircng nghệ hạn chếEIScần phảiđượctiacutech hợp hoagraven toagravenvagraveokiếntruacuteccủadoanh nghiệphiện tại do đoacute noacutelagrave một thaacutech thứclớn đối vớithiết kế
- Hạn chế tổ chức cơ cấu tổ chứccoacute thể khocircng phugrave hợp
Sự hạn chế về tổ chức- Chương trigravenh nghị sự vagrave thời gian chệch EIS mocirc tả một phần việc thực hiện một
chương trigravenh nghị sự vagrave coacute thể dễ dagraveng đạt được sự tin cậy một caacutech chắc chắn- Đồng bộ hoacutea việc quản lyacute sự tin cậy đuacuteng luacutec đặc biệt baacuteo caacuteo EIS coacute thể phaacute
vỡ sự ổn định thiết lập caacutec chu trigravenh baacuteo caacuteo một caacutech tốt nhất- Sự bất ổn EIS phản ứng nhanh coacute thể gacircy ra việc taacutec động trở lại một caacutech
nhanh choacuteng dẫn đến sự thiếu ổn định trong tổ chức
Sự thất bại lagrave thay thế khocircng thể chấp nhận được- Một số yếu tố lagravem EIS thất bại
+ Thiếu sự hỗ trợ về mặt quản lyacute+ Vấn đề chiacutenh trị+ Thất bại của nhagrave phaacutet triển+ Lỗi về cocircng nghệ+ Giaacute cả+ Thời gian
66 Ra quyết định điều hagravenh trong tương lai vagrave EIS
- Coacute một vagravei điều kiện sẽ được hợp nhất cho việc chuyển đổi cocircng nghệ Trong đoacute một vagravei điều kiện coacute thể dễ dự đoaacuten Hai điều kiện magrave ta coacute thể thấy lagrave+ Phaacutet triển cocircng nghệ maacutey tiacutenh trong việc điều hagravenh sẽ tạo ra sự chuyển đổi được chấp nhận một caacutech dễ dagraveng hơn+ Mở rộng traacutech nhiệm điều hagravenh sẽ mở rộng nhu cầu thocircng tin
Tương lai của EIS- EIS thocircng minh Những tiến bộ trong cocircng nghệ AI sẽ được triển khai trong caacutec
EIS- EIS đa phương tiện Cơ sở dữ liệu đa phương tiện sẽ cho pheacutep tiacutech hợp văn bản
giọng noacutei vagrave higravenh ảnh trong tương lai- EIS thocircng tin Tương lai EIS sẽ mở rộng hơn trong việc sử dụng dữ liệu becircn
ngoagravei doanh nghiệp- EIS kết nối Giao tiếp với băng thocircng rộng cho pheacutep kết nối liecircn thocircng lớn hơn
Chương 7 HỆ CHUYEcircN GIA VAgrave TRIacute TUỆ NHAcircN TẠO
71 Caacutec khaacutei niệm
72 Triacute thocircng minh của triacute tuệ nhacircn tạo
73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia
74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia
75 Lợi iacutech vagrave hạn chế của hệ chuyecircn gia
71 Caacutec khaacutei niệm
Chuyecircn mocircn (Expertise) sự hiểu biết rộng trong 1 lĩnh vực hẹp
Hệ chuyecircn gia (Expert Systems)1 chương trigravenh maacutey tiacutenh sử dụng 1 tập caacutec luật dựa trecircn tri thức của con người để giải quyết caacutec vấn đề đogravei hogravei phải coacute sự chuyecircn mocircn
Một số hệ chuyecircn gia nổi tiếng
DENDRAL (Standford 1960s Edward Feigenbaum)
MYCIN (Standford1970s Edward Shortliffe)
PROSPECTOR (MIT 1979)
Triacute tuệ nhacircn tạo (Artificial Intelligence ndash AI)
Triacute tuệ nhacircn tạo một bộ phacircn của ngagravenh khoa học maacutey tiacutenh quan tacircm đến việc thiết kế caacutec hệ thống maacutey tiacutenh thocircng minh đoacute lagrave caacutec hệ thống đưa ra caacutec đặc điểm magrave từ đoacute chuacuteng ta liecircn hệ với sự thocircng minh trong hagravenh động của con người (Barr vagrave Feigenbaum 1981)
Mục điacutech của AI
Mục điacutech khoa học xaacutec định caacutec gợi yacute để giải thiacutech caacutec loại khaacutec nhau của triacute tuệ thực
Mục điacutech kỹ thuật giải quyết caacutec vấn đề trong thế giới thực
Triacute tuệ nhacircn tạo kế thừa nhiều yacute tưởng quan điểm kỹ thuật từ caacutec ngagravenh khoa học khaacutec
- Triết học
- Logic Toaacuten học
- Tiacutenh toaacuten
- Khoa học tacircm lyacute Khoa học nhận thức
- Sinh học Thần kinh học
- Tiến hoacutea
Caacutec lĩnh vực ứng dụng trong Triacute tuệ nhacircn tạo
Mạng nơ ron thần kinh (Neural Networks)
Tiacutenh toaacuten sự tiến hoacutea
(Evolutionary Computation)
Hệ chuyecircn gia (Expert Systems)
Kỹ thuật xử lyacute tiếng noacutei (Speech Processing)
Kỹ thuật xử lyacute ngocircn ngữ tự nhiecircn
(Natural Language Processing)
Lập kế hoạch (Planning)
Robot (Robotics)
Khoa học higravenh ảnh (Vision)
Caacutec kỹ thuật thocircng dụng dugraveng trong AI
Biểu diễn(Representation)
Học (Learning)
Caacutec luật (Rules)
Tigravem kiếm (Search)
72 Triacute thocircng minh của triacute tuệ nhacircn tạo
Con người suy diễn như thế nagraveo
Phacircn loại (Categorization)
Caacutec quy tắc cụ thể
Heuristics
Kinh nghiệm trước đoacute
Dự tiacutenh trước
Maacutey tiacutenh suy diễn như thế nagraveo
Lập luận dựa trecircn luật IF-THEN mocirc tả tri thức được matilde hoacutea dưới dạng caacutec luật
Caacutec khung (Frames) lagrave caacutec đại diện mocirc tả caacutec tigravenh huống giống nhau lagrave điển higravenh của một vagravei phacircn loại
Lập luận dựa trecircn caacutec trường hợp mocirc phỏng giải phaacutep trước đoacute cho một vấn đề hiện tại
Nhận dạng mẫu phaacutet hiện acircm thanh higravenh dạng hoặc caacutec chuỗi dagravei
Caacutec dạng khaacutec của Triacute tuệ nhacircn tạo
Học maacutey- mạng nơron vagrave giải thuật di truyền
Lập trigravenh tự động ndash lagrave những kỹ thuật tạo ra caacutec chương trigravenh để lagravem 1 nhiệm vụ riecircng biệt (cho pheacutep những người khocircng phải lagrave người lập trigravenh coacute thể lập trigravenh được)
Cuộc sống nhacircn tạo ndash nỗ lực để taacutei tạo caacutec hiện tượng sinh học trong caacutec hệ thống dựa trecircn maacutey tiacutenh
73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia(Expert Systems- ES)
Theo Jackson (1999) Một hệ chuyecircn gia lagrave một chương trigravenh maacutey tiacutenh mocirc tả vagrave suy diễn với tri thức của một vagravei lĩnh vực để giải quyết vấn đề hay đưa ra caacutec lời khuyecircn
Cấu truacutec cơ bản của ES được dựa theo cấu truacutec chung của DSS Sự khaacutec biệt chiacutenh giữa ES vagraveDSS lagrave hệ ES thu thập caacutec kiến thức từ những
chuyecircn gia trong lĩnh vực quan tacircmĐặc trưng của hệ chuyecircn gia Hiệu quả cao Thời gian trả lời thỏa đaacuteng Độ tin cậy cao Dễ hiểu
Giao diện người dugraveng trong ES
Thiết kế giao diện người dugraveng tập trung vagraveo caacutec yếu tố như dễ dagraveng sử dụngcoacute độ tin cậy cao giảm tải những khoacute khăn khi sử dụng
Thiết kế necircn coacute một số tương taacutec (đầu vagraveo kiểm soaacutet vagrave truy vấn)
Cấu tạo giao diện người dugraveng gồm coacute magraven higravenh cảm ứng bagraven phiacutem buacutet saacuteng lệnh thoại caacutec phiacutem chuyecircn dụng
Cơ sở tri thức (Knowledge Base)
Chứa đựng caacutec tri thức cụ thể miền thu được từ caacutec chuyecircn gia miền
Coacute thể chứa caacutec mocirc tả caacutec hagravenh vi giải quyết vấn đề caacutec ragraveng buộc caacutec heuristics
Thagravenh cocircng của một ES dựa trecircn tiacutenh đầy đủ vagrave tiacutenh chiacutenh xaacutec của cơ sở tri thức
Mocirc tơ suy diễn (Inference Engine)
Ở đacircy tri thức được đặt để sử dụng tạo ra caacutec giải phaacutep để giải quyết vấn đề
Mocirc tơ nagravey coacute khả năng thực hiện diễn dịch hoặc suy diễn dựa trecircn caacutec luật hay caacutec caacutec sự kiện
Đồng thời cũng coacute khả năng sử dụng caacutec suy diễn mờ hay khocircng chiacutenh xaacutec dựa trecircn xaacutec suất hay aacutenh xạ mẫu
Vograveng điều khiển suy diễn
1 Aacutenh xạ caacutec luật với caacutec sự kiện đatilde được cho
2 Chọn luật để thực hiện
3 Thực hiện luật bằng caacutech thecircm caacutec sự kiện được suy diễn ra vagraveo bộ nhớ lagravem việc
Chuỗi suy diễn (Chaining)
Suy diễn tiến (forward chaining) maacutey suy diễn bắt đầu từ dữ liệu ban đầu vagrave thực hiện việc suy luận để đưa ra caacutec kết luận cuối cugraveng
Suy diễn lugravei (backward chaining) maacutey suy diễn bắt đầu từ dữ liệu điacutech vagrave tigravem ra tri thức hỗ trợ cho dữ liệu điacutech đoacute
Viacute dụ suy diễn lugravei
R1 Nếu coacute A vagrave B thigrave suy ra coacute D
R2 Nếu coacute B thigrave suy ra coacute C
R3 Nếu coacute C vagrave D thigrave suy ra coacute E
Ta coacute E ta xem trong 3 luật R1 R2 R3 luật nagraveo coacute E ta thấy R3 chứa E đồng thời chứa C vagrave D Xeacutet tiếp trong 2 luật R1 R2 luật nagraveo chứa C vagrave D R2 chứa C R3 chứa D Từ đoacute ta coacute được caacutec tri thức hỗ trợ suy diễn vagrave kết luận lagrave nếu coacute A vagrave B thigrave sẽ coacute E Hay nếu A vagrave B đuacuteng thigrave sẽ coacute E
Viacute dụ suy diễn tiến
Giả sử coacute tập chứa 3 luật sau
R1 Nếu coacute A vagrave B thigrave suy ra coacute D
R2 Nếu coacute B thigrave suy ra coacute C
R3 Nếu coacute C vagrave D thigrave suy ra coacute E
Nếu ta coacute A vagrave B thigrave chuacuteng ta suy ra được D từ R1 vagrave suy ra C từ R2 Với D vagrave C đatilde được suy ra ở trecircn giờ chuacuteng ta suy ra được E từ R3
Viacute dụ thực tế
Giả sử muốn biết magraveu của một con vật nuocirci tecircn lagrave Fred biết rằng noacute kecircu ộp ộp vagrave ăn ruồi
Coacute tập 4 luật ban đầu như sau
R1 Nếu X kecircu ộp ộp vagrave ăn ruồi thigrave X lagrave con ếch
R2 Nếu X kecircu chiecircm chiếp vagrave biết hoacutet thigrave X lagrave con chim
R3 Nếu X lagrave con ếch thigrave X coacute magraveu xanh
R4 Nếu X lagrave con chim thigrave X coacute magraveu vagraveng
74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia
Expert system shells lagrave một tập caacutec goacutei phần mềm vagrave caacutec cocircng cụ dugraveng để phaacutet triển caacutec hệ chuyecircn gia
Những Expert system shells đầu tiecircn thường rất rườm ragrave Mặc dugrave vậy noacute vẫn giuacutep cho người sử dụng sẽ khocircng phải bắt đầu lại từ đầu khi xacircy dựng một hệ chuyecircn gia mới
Những shell hiện đại bao gồm hai mocirc-đun chiacutenh lagrave cocircng cụ xacircy dựng một tập quy tắc vagrave mocirc tơ suy diễn
Xacircy dựng hệ chuyecircn gia
Bước 1 xacircy dựng mocirc higravenh bagravei toaacuten xaacutec định vấn đề nhiệm vụ magrave hệ thống sẽ thực hiện Caacutec dạng bagravei toaacuten cần hệ chuyecircn gia
Bagravei toaacuten diễn giải (InterPretation)
Bagravei toaacuten dự baacuteo (Prediction)
Bagravei toaacuten chuẩn đoaacuten (Diagnose)
Bagravei toaacuten gỡ rối (Debugging)
Bagravei toaacuten thiết kế
Tương tự như một dự aacuten phần mềm để xacircy dựng một hệ chuyecircn gia cần phải coacute caacutec yếu tố về nhacircn lực tagravei nguyecircn vagrave thời gian Những yếu tố nagravey ảnh hưởng đến giaacute thah của một hệ chuyecircn giaTrong phần nagravey cacircu hỏi thường được đặt ra lagrave tại sao cần phải xacircy dựng một hệ chuyecircn giaTrước khi bắt đầu phải xaacute định rotilde bagravei toaacuten đạt ra lagrave jiAi lagrave chuyecircn giaAi lagrave người sử dụng
1 Diễn giải (InterPretation) Nghiecircn cứu 1 vấn đề -gt Dựa trecircn những biểu hiện thuộc tiacutenh đặc trưng becircn ngoagravei -gt Tư vấn
(hoặc đưa ra kết luận hay mocirc tả dễ hiểu từ tập dữ liệu thocirc)
2 Bagravei toaacuten dự baacuteo (Prediction) Coacute thể dự đoaacuten được hagravenh vi kết quả dựa trecircn caacutec hiện tượng -gt dự baacuteo
VD Dự baacuteo thời tiết động đấthellip
3 Bagravei toaacuten chẩn đoaacuten (Diagnoss) Xaacutec định caacutec lỗi caacutec bộ phận hỏng hoacutec của hệ thống dựa trecircn caacutec dữ liệu quan saacutet được
4 Bagravei toaacuten gỡ rối (Debugging) Mocirc tả caacutec phương phaacutep khắc phục hệ thống khi gặp sự cố
5 Bagravei toaacuten thiết kế Lựa chọn cấu higravenh caacutec đối tượng nhằm thoả matilden một số ragraveng buộc nagraveo đoacute
6 Giảng dạy Phần mềm dạy học coacute thể chuẩn đoaacuten vagrave sủa lỗi của học sinh trong quaacute trigravenh học tập
Để xaacutec định đuacuteng bagravei toaacuten magrave chuacuteng ta cần giải quyết thigrave phải trả lời đc một số cacircu hỏi
- cần hệ chuyecircn gia
Bước 2 thu thập tri thức lựa chọn cocircng cụ vagrave aacutep dụng
Trong bước thu thập tri thức vấn đề quan trọng lagrave lựa chọn chuyecircn gia những người magrave sẽ đoacuteng goacutep tri thức cho hệ thống Thocircng thường trong suốt quaacute trigravenh phaacutet triển thigrave chuyecircn gia được xem như một thagravenh viecircn của đội phaacutet triển
Hiện nay coacute rất nhiều cocircng cụ để xacircy dựng một hệ chuyecircn gia Phổ biến nhất lagrave JESS CLIPS vagrave OPS5
Bước 3 Thiết kế cơ sở tri thức thiết kế hệ thốngTri thức được biểu diễn trường minh trong cơ sở tri thức
Caacutec chuyecircn gia vagrave kỹ sư tri thức sẽ đối thoại với nhau bằng caacutec kỹ thuật đối thoại Suy diễn (SD) bảng Mocirc higravenh hoacutea SD quy nạp phacircn loại
Vấn đề bagraveo trigrave vagrave phaacutet triển
Caacutec hệ chuyecircn gia đogravei hỏi phải bảo trigrave vagrave phaacutet triển nhiều hơn so với caacutec hệ thống khaacutec Phải thường xuyecircn bổ sung tri thức mới vagrave thay đổi caacutec tri thức cũ để đổi mới hệ chuyecircn gia
Thu thập vagrave khắc phục lỗi do người sử dụng phaacutet hiện để kịp thời khắc phục những sai soacutet của hệ chuyecircn gia
75 Lợi iacutech vagrave hạn chế của caacutec hệ chuyecircn gia
Một số lợi iacutech chiacutenh
Thời gian trả lời hợp lyacute bằng hoặc nhanh hơn so với chuyecircn gia (người) để đi đến cugraveng một quyết định Hệ chuyecircn gia lagrave một hệ thống thời gian thực (real time system)
Khả năng trả lời với mức độ tinh thocircng bằng hoặc cao hơn so với chuyecircn gia (người) trong cugraveng lĩnh vực
Hệ chuyecircn gia giuacutep cho hiệu quả lagravem việc tăng bằng việc sử dụng tập caacutec luật một caacutech nhanh choacuteng magrave ko bị nhầm lẫn chuyecircn gia lagrave người coacute thể quecircn đi một số tri thức cơ sở lyacute luậ nhưng HCG thigrave ko
Quyết định của một người chuyecircn gia coacute thể bị thay đổi vagrave ko coacute tiacutenh thống nhất như quyết định của một hệ chuyecircn gia tạo ra
Hệ chuyecircn gia giuacutep cho người sử dụng coacute thể trau dồi sự hiểu biết trecircn lĩnh vuej cụ thể magrave noacute giải quyết hỗ trợ người ra quyết định coacute trigravenh độ như 1 chuyecircn gia trong quaacute trigravenh gia quyết định
Kiến thức của rất nhiều chuyecircn gia về một lĩnh vực nagraveo đoacute được đưa vagraveo hệ chuyecircn gia lagravem cho CSTT cuat HCG phong phuacute vagrave rộng lớn hơn rất nhiều
HCG giải thiacutech caacutec bước suy luận một caacutech dễ hiểu nhất quaacuten luacutec nagraveo cũng coacute thể sử dụng ko như chuyecircn gia con người
Hạn chế của caacutec hệ chuyecircn gia
Nhược điểm lớn nhất của hệ chuyecircn gia lagrave những yacute kiến chuyecircn mocircn thường rất khoacute matilde hoacutea vagrave giải neacuten
Hệ chuyecircn gia khocircng coacute khả năng tự học tự cập nhật kiến thức mới như caacutec chuyecircn gia magrave cần phải được matilde hoacutea lại khi noacute được cập nhật
Hệ chuyecircn gia khocircng thể nhận ra được vấn đề khocircng nằm trong miền kiến thức của hệ thống
Chương 8 Tri thức vagrave tiếp nhận
1 Bao gồm caacutec vấn đề
Dữ liệu thực tế đo lường hoặc quan saacutet coacute hoặc khocircng coacute bối cảnh
Thocircng tin dữ liệu được tổng hợp một caacutech hữu iacutech để giải quyết những khoacute khăn trong việc đưa ra quyết định
Tri thức bao gồm caacutec ứng dụng quy tắc thocircng tin hướng dẫn của người ra quyết định
2 Những caacutei nhigraven về tri thức
Đại diện lagravem thế nagraveo để diễn tả tri thức viacute dụ như một quyển saacutech khocircng phải lagrave tri thức nhưng noacute lại lagrave một đại diện của tri thức
Sản xuất tri thức lagrave một tập hơp của hagraveng tồn kho coacute thể được sản xuất cũng như mua lại
Tri thức lagrave 1 trong 6 trạng thaacutei của hệ thống
1Dữ liệu 2Thocircng tin 3Cấu truacutec thocircng tin 4Sự thấu hiểu 5Yacute kiến 6 Quyết định
3 Caacutec loại tri thức Phổ biến mocirc tả dữ liệu thocircng tin thủ tục mọi thứ lagravem như thế nagraveo lập luận chiacutenh saacutech hoặc caacutec quy tắc
4 Thu thập Tri thức hệ chuyecircn gia Hầu hết caacutec phương phaacutep đều bắt đầu với mocirc higravenh của caacutec taacutec vụ trong đoacute
hệ chuyecircn gia được xacircy dựng Trong đoacute mocirc tả về caacutec lĩnh vực được tạo ra Caacutec kỹ sư sử dụng caacutec mocirc higravenh giả thuyết vagrave nhận thức về quaacute trigravenh phacircn
tiacutech để gợi ra caacutech giải quyết vấn đề về tri thức từ caacutec chuyecircn gia
5 Caacutec chiều của thu thập tri thức KE- driven caacutec kỹ sư trao đổi trực tiếp với caacutec chuyecircn gia Expert-driven Caacutec chuyecircn gia trực tiếp đưa chuyecircn mocircn của họ vagraveo hệ
thống maacutey tiacutenh Machine-driven Sử dụng caacutec cocircng cụ suy luận để triacutech xuất tri thức từ một
tập caacutec viacute dụ
6 Kỹ thuật thu thập tri thức Trao đổi gồm 2 loại cơ bản lagrave coacute cấu truacutec(coacute kịch bản) vagrave khocircng coacute cấu
truacutec( đối thoại trực tiếp) Giao thức phacircn tiacutech bằng lời Khi caacutec chuyecircn gia thực hiện một cocircng việc
của họ thigrave một bản ghi về cocircng việc đoacute được thực hiện Caacutec kỹ sư sẽ xacircy dựng mocirc higravenh cho những gigrave được ghi lại trong bản ghi
Phương phaacutep sagraveng lọc caacutec chuyecircn gia so saacutenh caacutec nhoacutem liecircn tiếp trong ba đối tượng vagrave cho biết tại sao nhoacutem thứ hai lại khaacutec nhoacutem thứ ba
7 Thu thập tri thức từ nhiều nguồn Thu thập tri thức từ nhiều nguồn lagrave cần thiết để coacute được đầy đủ caacutec tri thức
cho một vấn đề quan điểm yacute kiến traacutei ngược nhau thường phaacutet sinh Phương phaacutep đồng thuận sẽ giuacutep giải quyết được vấn đề macircu thuẫn Kỹ thuật phacircn tiacutech Meta lagrave kỹ thuật được aacutep dụng trong caacutec trường hợp
khaacutec Caacutech tiếp cận bằng định lượng đogravei hỏi caacutec kỹ sư cần cacircn nhắc yếu tố đầu vagraveo của caacutec chuyecircn gia khaacutec nhau
8 Xaacutec nhận hợp lệ vagrave kiểm tra tri thức Một khi thu thập tri thức noacute phải được đaacutenh giaacute về khả năng sử dụng vagrave độ
chiacutenh xaacutec Hai vấn đề cụ thể lagrave hiệu lực của những kiến thức vagrave kiểm tra việc xacircy dựng cơ sở của tri thức
Cần xaacutec nhận xem liệu hệ thống coacute thể hoạt động ở mức độ tối thiểu khocircng
Xaacutec minh liecircn quan đến việc so saacutenh từng chi tiết kỹ thuật của hệ thống những gigrave đatilde được thực hiện cuối cugraveng
9 Một số caacutec biện phaacutep xaacutec nhận Độ chiacutenh xaacutec Khả năng thiacutech nghi Mức độ đầy đủ Bề rộng Độ sacircu Hiệu lực Tổng quan Chiacutenh xaacutec Hiện thực Độ tin cậy Tiacutenh hữu dụng Mức độ
Chương 9 Học maacutey
1 Logic mờ vagrave ngocircn ngữ mờ(Fuzzy Logic and Linguistic Ambiguity)
Ngocircn ngữ tự nhiecircn gồm những khaacutei niệm mơ hồ vagrave khocircng chiacutenh xaacutectruyền tải ngữ nghĩa thocircng qua tiacutenh xấp xỉkhocircng rotilde ragraveng
Những xấp xỉ nagravey giuacutep con người coacute thể truyền tải hết được yacute nghĩa nhưng maacutey thigrave khocircng hiểu
Lagravem sao biểu diễn caacutec tri thức sử dụng caacutec khaacutei niệm khocircng rotilde ragraveng(mờ) hoặc khocircng chiacutenh xaacutec
2 Khaacutei niệm cơ bản của logic mờ tập mờ lagrave những tập hợp khocircng coacute một giới hạn rotilde Mỗi phần tử của noacute chỉ
chứa một mức độ hagravem liecircn thuộc của từng phần tử Vigrave vậy tập mờ khocircng giống như tập cổ điển Tập mờ coacute thể kết hợp với nhau qua những luật mờ magrave đặc trưng cho những hagravenh động trạng thaacutei vagrave thuộc tiacutenh của logic mờ được tận dụng khi thực hiện một bộ điều khiển mờ
Logic mờ dựa trecircn yacute tưởng mỗi phần tử thuộc vagraveo một tập hợp ở một mức độ nagraveo đấy
Locircgic mờ cho pheacutep độ liecircn thuộc (microA )coacute giaacute trị trong khoảng (01) Locircgic mờ coacute thể được coi lagrave mặt ứng dụng của lyacute thuyết tập mờ để xử lyacute caacutec
giaacute trị trong thế giới thực cho caacutec bagravei toaacuten phức tạp
3 So saacutenh tiacutenh đuacuteng đắn logic mờ vagrave xaacutec suất Xaacutec suất thigrave đề cập đến khả năng xảy ra một biến cố hay một điều gigrave đoacute Logic mờ đề cập đến cấp độ magrave đặc tiacutenh ở hiện tại
o viacute dụ1 người coacute chiều cao 6 feet thigrave coacute cấp độ lagrave 05 về chiều cao
4 Ưu điểm của logic mờ Caacutech tiếp cận rất tự nhiecircnkhocircng phức tạp Coacute thể mocirc higravenh hoacutea caacutec hagravem phi tuyến tugravey yacute phức tạp
Coacute thể tận dụng được kinh nghiệm từ những chuyecircn gia hagraveng đầu trong mọi lĩnh vực
Logic mờ được xacircy dựng dựa trecircn ngocircn ngữ tự nhiecircnNền tảng của logic mờ lagrave dựa trecircn cơ sở giao tiếp của con người
5 Nhược điểm của logic mờ Trong 1 hệ thống phức tạpsử dụng logic mờ coacute thể trở thagravenh trở ngại cho
việc xaacutec thực độ tin cậy của hệ thống Cơ chế lập luận mờ khocircng thể học hỏi từ những lỗi sai
6 Mạng noron nhacircn tạo(ANN) Mạng noron nhacircn tạo lagrave một mocirc phỏng xử lyacute thocircng tinđược nghiecircn cứu ra
từ hệ thống thần kinh của sinh vậtgiống như bộ natildeo để xử lyacute thocircng tin ANNs lagrave chương trigravenh dựa trecircn maacutey tiacutenh đơn giản coacute chức năng lagrave một mocirc
higravenh bagravei toaacuten khocircng gian dựa trecircn thử nghiệm vagrave baacuteo lỗi
7 Học từ kinh nghiệm Tiến trigravenh Một mẫu dữ liệu được biểu diễn như một mạng lưới noronANN ldquodự
đoaacutenrdquo 1 đầu radự đoaacuten được so saacutenh với giaacute trị thực tế hoặc giaacute trị chiacutenh xaacutecNếu đoaacuten được chiacutenh xaacutec thigrave khocircng coacute hagravenh động nagraveo được thực hiện
Nếu dự đoaacuten sai ANN kiểm tra lại vagrave xaacutec định lại thocircng số để điều chỉnh Một mẫu dữ liệu khaacutec được biểu diễn vagrave quaacute trigravenh nagravey được lặp lại
8 Nguyecircn tắc cơ bản của cocircng nghệ nơron Caacutec yếu tố xử lyacute cơ bản trong hệ thống thần kinh của con người lagrave tế bagraveo
thần kinhMạng lưới của tế bagraveo nagravey lagrave liecircn kết với nhau nhận được thocircng tin từ caacutec cảm biến trong mắt taihellip
Thocircng tin nhận được bởi tế bagraveo thần kinh hoặc lagrave sẽ kiacutech thiacutech noacute(sẽ được chuyển qua 1 thocircng điệp dọc theo mạng lưới) hoặc lagrave sẽ ngăn cản noacute(ngăn cản dograveng thocircng tin)
Độ nhạy coacute thể thay đổi qua thời gian hoặc sau khi coacute được kinh nghiệm
9 Cấu truacutec mạng Một ANN gồm 3 lớp cơ bản
Lớp đầu vagraveo nhận dữ liệu Lớp becircn trong hoặc lagrave lớp ẩn xử lyacute dữ liệu Lớp đầu ra chuyển tiếp kết quả cuối cugraveng của mạng
10Mạng nơ ron Thường coacute nhiều đầu vagraveo mỗi đầu vagraveo với mức ảnh hưởng vagrave tầm quan
trọng riecircng của noacute Một đầu vagraveo quan trọng coacute thể được sử dụng để khuếch đại đầu ra caacutec hagravem trạng thaacutei tổng hợp caacutec trọng số của caacutec yếu tố
đầuvagraveo khaacutec nhauvagraveo một giaacute trị duy nhất Caacutec hagravem chuyển giao xử lyacute caacutec giaacute trị trạng thaacutei vagrave tạo đầu ra
11Huấn luyện mạng nơ ron Trong mocirc higravenh coacute giaacutem saacutetANN được đến so saacutenh dự đoaacuten của chiacutenh
noacute với thocircng tin phản hồi coacute chứa caacutec kết quả mong muốn ANN sẽ phải tigravem caacutech thay đổi caacutec tham số becircn trong củamigravenh (caacutec trọng số vagrave caacutec ngưỡng) để tạo necircn một aacutenh xạ coacute khả năng aacutenh xạcaacutec đầu vagraveo thagravenh caacutec đầu ra mong muốn Sự thay đổi nagravey được tiến hagravenh nhờ việc so saacutenh giữa đầu ra thực sự vagrave đầu ra mong muốn
Trong mocirc higravenh khocircng coacute giaacutem saacutetANN nhận được dữ liệu vagraveo nhưng khocircng phải coacute bất kỳ thocircng tin phản hồi về kết quả mong muốn
Phần lớn caacutec ứng dụng nằm trong vugraveng của caacutec bagravei toaacuten ước lượng như mocirc higravenh hoacuteathống kecirc neacuten lọc phacircn cụm
12Lợi iacutech Liecircn kết với mạng noron Traacutenh caacutech lập trigravenh tường minh Giảm nhu cầu của chuyecircn gia ANNs thigrave thiacutech nghi với caacutec yếu tố đầu vagraveo thay đổi Khocircng cần thiết cho cơ sở tri thức tinh chế ANNs coacute tiacutenh động vagrave cải thiện với việc sử dụng Coacute khả năng xử lyacute dữ liệu khocircng chiacutenh xaacutec hoặc khocircng đầy đủ Cho pheacutep tổng quaacutet hoacutea từ thocircng tin cụ thể Cho pheacutep thu thập cảm giaacutec thocircng thường vagraveo miền giải quyết vấn đề
13Hạn chế của việc liecircn kết với mạng noron ANNs khocircng thể giải thiacutech được suy luận Bản chất hộp đen thường khiến cho vấn đề traacutech nhiệm vagrave độ tin cậy phaacutet
sinh lagrave khoacute khăn Lặp đi lặp lại quaacute trigravenh huấn luyện rất tốn thời gian Nguồn lực caacutec nhagrave phacircn tiacutech vagrave thiết kế coacute tay nghề cao vẫn lagrave đaacuteng lo
ngại Cocircng nghệ ANN thuacutec đẩy hạn chế của phần cứng hiện tại ANN yecircu cầu phải coacute sự tin tưởng ở đầu ra
14Giới thiệu về thuật toaacuten di truyền Cũng như mạng lưới thần kinh caacutec thuật toaacuten di truyền được dựa trecircn lyacute
thuyết sinh học Thuật toaacuten di truyền tigravem thấy nguồn gốc của chuacuteng trong caacutec lyacute thuyết
tiến hoacutea của chọn lọc tự nhiecircn vagrave thiacutech ứng với biến đổi khiacute hậu Kết quả thuật toaacuten di truyền lagrave từ giao phối 2 caacute thể trong quần thế để tạo
ra con caacutei đocirci khi tốt hơn so với bậc cha mẹ của chuacuteng 15Caacutec thagravenh phần cơ bản của thuật toaacuten di truyền
Toaacuten tử chọn lọc Caacutec caacute thể tốt được chọn lọc để đưa vagraveo thế hệ sau Sự chọn lọc nagravey căn cứ vagraveo độ thiacutech nghi với mocirci trường của mỗi caacute thể
Toaacuten tử lai gheacutep (crossover) Hai caacute thể cha vagrave mẹ trao đổi caacutec gen với nhau để tạo ra caacute thể con
Toaacuten tử đột biến (mutation) Một caacute thể thay đổi một số gen để biến đổi thagravenh một caacute thể mớiTất cả caacutec toaacuten tử trecircn khi thực hiện đều mang tiacutenh ngẫu nhiecircn
16Quaacute trigravenh cơ bản của một thuật toaacuten di truyền Khởi tạo
Đaacutenh giaacute quần thể
Lựa chọn NST thiacutech hợp nhất vagrave loại bỏ NST yếu nhất
Quy trigravenh giao nhau vagrave cải thiện quần thể
đột biến tiến trigravenh để khaacutem phaacute ra NST mới
17Ưu nhược điểm của việc kết hợp với thuật toaacuten di truyền Kiacutech thước quần thể lagrave 1 yếu tố quan trọng trong tốc độ của việc tigravem
kiếmnhưng noacute tương đối dễ dagraveng để dự đoaacuten tốc độ nagravey Giao nhau hoặc đột biến lagrave khocircng necircn đc sử dụng quaacute thường xuyecircn Luocircn coacute được iacutet nhất 1 giải phaacutep hợp lyacute Necircn coacute thể aacutep dụng chuacuteng cho caacutec vấn đề magrave chuacuteng ta khocircng coacute hướng
về caacutech giải quyết Sức mạnh của thuật toaacuten xuất phaacutet từ khaacutei niệm đơn giảnkhocircng phải từ
một thủ tục thuật toaacuten phức tạp 18Tương lai của học maacutey
Mạng lưới thần kinh nhacircn tạo vượt quaacute năng lực của con người trong caacutec trường hợp bị cocirc lập
Về mặt lyacute thuyếtmột maacutey tiacutenh coacute thể xử lyacute dũ liệu nhanh hơn hagraveng triệu lần so với 1 con người
May mắn thay cho chuacuteng tacon người tốt hơn nhiều khi magrave coacute được dữ liệumaacutey tiacutenh khocircng coacute 1 số thứ như lagrave 5 giaacutec quan
CHƯƠNG 10 KHO DỮ LIỆU
1 Kho dữ liệu Kho dữ liệu lagrave tuyển tập caacutec cơ sở dữ liệu tiacutech hợp hướng chủ đề được
thiết kế để trợ giuacutep cho một hệ hỗ trợ quyết định
Theo John Ladley Cocircng nghệ kho dữ liệu lagrave tập caacutec phương phaacutep kỹ thuật vagrave caacutec cocircng cụ coacute thể kết hợp hỗ trợ nhau để cung cấp thocircng tin cho người sử dụng trecircn cơ sở tiacutech hợp từ nhiều nguồn dữ liệu nhiều mocirci trường khaacutec nhau
Kho dữ liệu thường rất lớn tới hagraveng trăm GB hay thậm chiacute hagraveng Terabyte
2 Kho dữ liệu vận hagravenh (ODS) Một kho dữ liệu vận hagravenh Aacutep dụng kỹ thuật kho dữ liệu vagraveo caacutec hệ xử
lyacute giao taacutec lưu trữ dữ liệu cho một ứng dụng đặc thugrave Noacute đưa vagraveo kho dữ liệu một dograveng caacutec dữ liệu thocirc được thiết kế
3 So saacutenh
Kho dữ liệu vận hagravenh Kho dữ liệu
Dữ liệu theo chủ đề Dữ liệu theo chủ đề
Dữ liệu tiacutech hợp Dữ liệu tiacutech hợp
Dữ liệu thay đổi Dữ liệu khocircng thay đổi
Dữ liệu được cập nhật khi thay đổi
Dữ liệu giữ nguyecircn
Chỉ coacute dữ liệu hiện tạiDữliệu hiện tại vagrave dữ liệu lịch sử
Chu kỳ lagravem tươi dữ liệu ngắn Chu kỳ lagravem tươi dữ liệu dagravei
Chỉ coacute dữ liệu chi tiết Dữ liệu chi tiết vagrave dữ liệu tổng kết
Dugraveng cho caacutec quyết định ngắn hạn
Dugraveng cho hoạch định dagravei hạn
4 Kho dữ liệu cục bộ (Data Mart - DM)
Kho dữ liệu cục bộ lagrave CSDL coacute những đặc điểm giống với kho dữ liệu nhưng với quy mocirc nhỏ hơn vagrave lưu trữ dữ liệu về một lĩnh vực một chuyecircn ngagravenh
Data mart phụ thuộc Chứa những dữ liệu được lấy từ DW vagrave những dữ liệu nagravey sẽ được triacutech lọc vagrave tinh chế tiacutech hợp lại ở mức cao hơn để phục vụ một chủ đề nhất định của Datamart
Data mart độc lập Khocircng giống như Datamart phụ thuộc Data mart độc lập được xacircy dựng trước DW vagrave dữ liệu được trực tiếp lấy từ caacutec nguồn khaacutec nhau
5 Siecircu dữ liệu Metadata lagrave dữ liệu để mocirc tả dữ liệu Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột
một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi Metadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu
6 Mocirci trường kho dữ liệu Hệ thống của tổ chức vagrave kho cung cấp dữ liệu để xacircy dựng kho dữ liệu Trong quaacute trigravenh chuyển dữ liệu từ caacutec nguồn khaacutec nhau dữ liệu coacute thể
được lagravem sạch hoặc chuyển đổi vagrave vigrave thế DW được xem như lagrave một chuẩn cho việc lưu trữ
Đồng thời siecircu dữ liệu được ghi lại Cuối cugraveng DW hoặc siecircu thị coacute thể được sử dụng để tạo ra một kho dữ
liệu ldquocaacute nhacircnrdquo 7 Caacutec đặc điểm của kho dữ liệu
Đặc điểm Mocirc tả
Hướng chủ đề - DL tổ chức theo caacutech thức người dugraveng tham chiếu
Tiacutech hợp - Dữ liệu ldquosạchrdquo loại bỏ tiacutenh thiếu nhất quaacuten
Khocircng thay đổi - DL ldquochỉ đọcrdquo người dugraveng khocircng thay đổi được
Chuỗi thời gian - DL lagrave chuỗi thời gian khocircng phải lagrave trạng thaacutei hiện tại
Được tổng kết - DL vận hagravenhthao taacutec khi cần thiết
được kết hợp lại thagravenh dạng coacute thể dugraveng được cho quyết định
Kiacutech cỡ lớn hơn - Lưu giữ theo chuỗi thời gian tức lagrave giữ lại nhiều DL
Khocircng được chuẩn hoacutea - Coacute thể dư thừa DLSiecircu dữ liệu - Dữ liệu của dữ liệu được lưu trữNguồn dữ liệu - DL vận hagravenh (caacutec hệ sẵn coacute) cugraveng
với caacutec nguồn ngoagravei 8 Kho dữ liệu hướng chủ đề
Hướng chủ để coacute nghĩa lagrave kho dữ liệu được tổ chức xung quanh caacutec chủ đề chiacutenh như khaacutech hagraveng sản phẩm sản xuất Tập trung vagraveo việc mocirc higravenh hoacutea vagrave phacircn tiacutech dữ liệu cho caacutec nhagrave ra quyết định magrave khocircng tập trung vagraveo caacutec xử lyacute thocircng thường Cung cấp cho người dugraveng một khung nhigraven toagraven vẹn đơn giản vagrave đầy đủ về caacutec sự kiện quanh caacutec chủ đề
9 Dữ liệu trong DW được tiacutech hợp Dữ liệu trong kho dữ liệu được xacircy dựng bằng caacutech tổng hợp dữ liệu từ
nhiều nguồn khaacutec nhau vagrave caacutec nguồn coacute tổ chức khaacutec nhau Cơ sở dữ liệu caacutec file excel caacutec flat file hoặc caacutec raw file Khi đưa vagraveo kho dữ liệu caacutec dữ liệu được lagravem sạch vagrave tiacutech hợp dữ liệu nhằm đảm bảo tiacutenh nhất quaacuten của dữ liệu
10Kiến truacutec kho dữ liệu Tầng cơ sở dữ liệu hoạt động Tầng truy xuất thocircng tin Tầng truy xuất dữ liệu Tầng siecircu dữ liệu Tầng quản lyacute tiến trigravenh Tầng thocircng điệp của ứng dụng Tầng vật liacute của kho dữ liệu Tầng trigravenh diễn dữ liệu
11Higravenh trạng kho dữ liệu Kho dữ liệu ảo - người dugraveng cuối coacute thể truy cập trực tiếp đến kho dữ liệu
sử dụng caacutec cocircng cụ cho pheacutep ở tầng truy xuất dữ liệu Kho dữ liệu trung tacircm-1 cơ sở dữ liệu vật lyacute chứa tất cả dữ liệu cho một
vugraveng chuyecircn dụng nagraveo đoacute
Kho dữ liệu phacircn taacuten- Thagravenh phần được phacircn taacuten qua nhiều hệ cơ sở dữ liệu vật lyacute
12METADATA- Siecircu dữ liệu Định nghĩa Siecircu dữ liệu lagrave dữ liệu về dữ liệu Lagrave 1 lưu trữ dugraveng để
Miecircu tả kho dữ liệu tổng thể Nhận dạng kiểu kho dữ liệu Quản liacute quaacute trigravenh tiacutech hợp dữ liệu Quản liacute quaacute trigravenh cập nhật kho dữ liệu Quản liacute bảo mật
Lagrave chigravea khoacutea quyết định sự thagravenh cocircng của kho dữ liệu luocircn được thay đổi vagrave cập nhật theo sự phaacutet triển của kho dữ liệu
Dugraveng để quản liacute điều khiển kho dữ liệu Sự ra đời của kho dữ liệu như 1 cấu truacutec hỗ trợ ra quyết định siecircu dữ liệu
được xem như nguồn tagravei nguyecircn dữ liệu Siecircu dữ liệu lagrave trừu tượng Chuacuteng lagrave dữ liệu bậc cao cung cấp mocirc tả ngắn
gọn caacutec dữ liệu bậc thấp hơn 13Hoạt động của Siecircu dữ liệu
Siecircu dữ liệu rất cần thiết trong việc chuyển hoacutea thocircng tin trở thagravenh tri thức Lagrave chigravea khoacutea giuacutep chuacuteng ta xử lyacute được dữ liệu thocirc Viacute dụ một dograveng dữ liệu baacuten hagraveng 1023 K596 11121 agraveNoacute sẽ khocircng coacute nghĩa gigrave cho đến khi chuacuteng ta đưa vagraveo siecircu dữ liệu (thư
mục chứa dữ liệu) agrave cửa hagraveng 1023 sản phẩm K596 vagrave số tiền baacuten được lagrave 11121 đocirc la
14Sự cần thiết phải nhất quaacuten trong kho dữ liệu Kho dữ liệu được xacircy dựng cho lợi iacutech của những nhagrave phacircn tiacutech kinh
doanh caacutec nhagrave quản trị cho tất cả caacutec khu vực chức năng Trong cơ sở dữ liệu riecircng caacutec khu vực khaacutec nhau coacute thể định nghĩa vagrave lưu
trữ dữ liệu thocircng qua phiecircn bản của chiacutenh noacute Khi dữ liệu được lấy từ những vugraveng khaacutec nhau đoacute vagrave được đặt vagraveo kho dữ
liệu Việc chuyển đổi vagrave lagravem sạch caacutec tiến trigravenh sẽ đảm bảo noacute lagrave duy nhất được tiacutech hợp tại một mức của tổ chức
15Ragrave soaacutet lại dữ liệu ndash Thực thi siecircu dữ liệu
Bất kể cấu truacutec tự nhiecircn của 1 cacircu truy vấn thế nagraveo thigrave caacutec thagravenh phần của siecircu dữ liệu rất quan trọng đối với người ra quyết định
Bảng thuộc tiacutenh khoacutea được lưu trữ bởi kho dữ liệu Tập hợp dữ liệu được lấy từ đacircu Những chuyển đổi nagraveo được thực thi với việc lagravem sạch
16Siecircu dữ liệu lagrave gigrave Metadata - lagrave thocircng tin mocirc tả nội dung của cơ sở dữ liệu (CSDL) Metadata baacuteo cho người dugraveng biết thời gian cập nhật sau cugraveng của dữ liệu
định dạng vagrave mục điacutech sử dụng của noacute Những thocircng tin nagravey coacute thể hướng dẫn người dugraveng duyệt qua CSDL vagrave
giuacutep họ hiểu được yacute nghĩa vagrave ngữ cảnh của dữ liệu Trong CSDL metadata lagrave caacutec dạng biểu diễn khaacutec nhau của caacutec đối tượng
trong CSDL Trong CSDL quan hệ metadata lagrave caacutec định nghĩa của bảng cột CSDL
view vagrave nhiều đối tượng khaacutec Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột
một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi -gtMetadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu
Bảng chuyển đổi Ghi lại những chuyển đổi đatilde được thực hiện
Lịch sử thực thi Ghi lại những dữ liệu đatilde được
phacircn tiacutech
Higravenh thaacutei kết nốiGhi lại những dữ liệu được kết nối vagrave tần suất
17Aacutenh xạ thocircng thường của siecircu dữ liệu Bản ghi aacutenh xạ chuyển đổi bao gồm
Định danh của nguồn gốc Chuyển đổi thuộc tiacutenh Chuyển đổi thuộc tiacutenh vật lyacute Matilde hoacutea tham chiếu bảng chuyển đổi Đổi tecircn Đổi khoacutea Gaacuten giaacute trị cho thuộc tiacutenh mặc định Chọn logic cho caacutec nguồn nhiều giaacute trị Đổi thuật toaacuten
18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để
phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai
lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave
tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec
Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm
Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo
19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua
caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau
SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được
Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra
một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức
Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ
Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ
Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech
CHƯƠNG 11 KHAI PHAacute DỮ LIỆU
1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn
ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993
Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng
2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd
1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều
2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP
3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn
4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng
5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server
6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo
7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động
8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời
9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều
10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện
11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech
12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP
3 Xử lyacute phacircn tiacutech trực tuyến OLAP
MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave
dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu
ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave
thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu
HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave
ROLAP4 Khai phaacute dữ liệu
Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh
khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn
Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan
5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp
6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại
Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp
Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec
Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt
Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra
Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh
vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho
Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec
Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm
Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục
Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng
gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp
Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn
Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec
Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper
Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2
Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25
Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước
Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng
Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện
trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp
Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute
độ hỗ trợ ge ngưỡng minsup
độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan
Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn
Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết
Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu
MOLAP ROLAP HOLAP
Lưu trữ dữ liệu cơ sở
Khối Bảng quan hệ Bảng quan hệ
Lưu trữ thocircng tin tổng hợp
Khối Bảng quan hệ Khối
Hiệu suất thực hiện truy vấn
Nhanh nhất Chậm nhất Nhanh
Tiecircu thụ khocircng gian lưu trữ
Nhiều Thấp Trung bigravenh
Chi phiacute bảo trigrave Cao Thấp Trung bigravenh
Mạng vograveng trograven Tương tự như chuỗi nhưng kết thuacutec được kết nối
Mạng kết nối hoagraven toagraven khocircng coacute hạn chế về giao tiếp vagrave tương taacutec giữa caacutec thagravenh viecircnNoacutei chungnoacute đaacutep ứng hầu hết caacutec kết nối của người tham gia nhưng truyền đạt thocircng tin mất nhiều thời gian vagrave coacute nhiều cơ hội xảy ra lỗi
Nhoacutem hagravenh vi vagrave chuẩn mực
MDMs thiết lập caacutec chỉ tiecircu hướng dẫn quaacute trigravenh ra quyết định
Một chuẩn mực quy định cụ thể những gigrave thagravenh viecircn trong nhoacutem dự kiến sẽ lagravem trong những hoagraven cảnh nhất định
Quy tắc gửi coacute thể được thocircng qua viacute dụ đaacutenh giaacute ngang hagraveng hoặc xử phạt
Lagravem thế nagraveo để đưa ra quyết định
Việc chọn lựa magrave trong đoacute việc sử dụng cấu truacutec MDM phải được dựa trecircn một số yếu tố liecircn quan với bối cảnh quyết định
Viacute dụmột cấu truacutec riecircng lẻ sẽ lagravem việc nơi magrave quyết định được cấu truacutec cao vagrave thocircng tin lagrave coacute sẵn
Một ủy ban cơ cấu sẽ lagrave sự lựa chọn khi người ra quyết định khocircng thể đưa ra quyết định một migravenh
52Caacutec vấn đề thường gặp trong nhoacutem
Kiacutech thước Noacutei chung sự nhất triacute vagrave gắn kết giữa caacutec thagravenh viecircn tỉ lệ nghịch với phạm vi nhoacutem Trong nhoacutem lớn rất dễ higravenh thagravenh caacutec nhoacutem nhỏ vagrave hoạt động rời rạc
Tư duy tập thể Trong nhoacutem lớn mọi người coacute xu hướng suy nghĩ đểđạtđược sự nhất triacute necircn khocircng phaacutet huy được sự saacuteng tạo
Caacutec vấn đề về xatilde hội
Xung đột Trong 1 nhoacutem ai cũng muốn migravenh lagrave giỏi nhất necircn dễ dẫn đến xung đột
Ẩn danh(Giấu tecircn) Đacircy lagrave phương phaacutep được sử dụng để kiểm soaacutet xung đột Cho caacutec thagravenh viecircn tham gia ẩn danh
Vấn đề giới tiacutenh Nam vagrave nữ thường coacute những thế mạnh khaacutec nhau điều nagravey coacute thể lagrave sức mạnh trong 1 thiết lập MDM
Đagravem phaacuten vagrave quyết định
Một quyết định coacute thể liecircn quan đến nhiều quan điểm khaacutec nhau vigrave thế cần phải coacute sự đagravem phaacuten
Caacutec thiết kế của cơ chế hỗ trợ cho MDM phải phugrave hợp với caacutec hoạt độngđagravemphaacuten
Những hoạt động nagravey bao gồm việc thu nhận yacute kiến của caacutec thagravenh viecircn 1 caacutech cocircng bằng
53Cocircng nghệ hỗ trợ MDM
Organizational DSSndash 1 hệ thống cung cấp caacutec quyết định hỗ trợ
Group Support Systemndash Cocircng nghệ sử dụng sự hỗ trợ của nhiều becircn tham gia
Group DSS ndash Lagrave 1 hệ thống được thiết kế đặc biệt để hỗ trợ cho MDM
DSS ndash Lagrave 1 hệ thống dưới sự kiểm soaacutet của 1 người quyết định hệ thống nagravey cung cấp 1 bộ cocircng cụ giuacutep phacircn tiacutech hoagraven cảnh đểđưa ra quyết định vagrave nacircng cao hiệu quả của quyết địnhđoacute
53Cocircng nghệ hỗ trợ MDM
Organizational DSSndash 1 hệ thống cung cấp caacutec quyết định hỗ trợ
Group Support Systemndash Cocircng nghệ sử dụng sự hỗ trợ của nhiều becircn tham gia
Group DSS ndash Lagrave 1 hệ thống được thiết kế đặc biệt để hỗ trợ cho MDM
DSS ndash Lagrave 1 hệ thống dưới sự kiểm soaacutet của 1 người quyết định hệ thống nagravey cung cấp 1 bộ cocircng cụ giuacutep phacircn tiacutech hoagraven cảnh đểđưa ra quyết định vagrave nacircng cao hiệu quả của quyết địnhđoacute
Mục tiecircu của cocircng nghệ hỗ trợ MDM
Quy trigravenh hỗ trợ tập trung vagraveo quaacute trigravenh tạo điều kiện thuận lợi cho sự tương taacutec
Cơ chế cấu truacutec quaacute trigravenh chi phối caacutec hoạt động truyền thocircng
Nhiệm vụ hỗ trợ cocircng việc coacute thể chọn lựa tổ chức hoặc lấy thocircng tin
Nhiệm vụ cấu truacutec cocircng việc cho pheacutep truy cập đến kỹ thuật lọc kết hợp phacircn tiacutech kiến thức liecircn quan đến cocircng việc
Caacutec lớp loại cocircng nghệ hỗ trợ MDM
Phacircn loại theo đặc điểm do DeSanctis vagrave Gallupe đưa ra đề xuất một chương trigravenh ba cấp dựa trecircn caacutec tiacutenh năng được cung cấp
Hệ thống cấp 1 Mục điacutech chiacutenh lagrave tạo điều kiện thocircng tin liecircn lạc giữa caacutec thagravenh viecircn
Hệ thống cấp 2 Thiết kế để giảm thiểu rủi ro
Hệ thống cấp 3 Giuacutep điều chỉnh xử lyacute quyết định
Phacircn loại theo cocircng nghệ -Kraemer vagrave King tập trung vagraveo cocircng nghệ aacutep dụng
Cocircng nghệ bảng mạch điện tử
Hội nghị trực tuyến
Mạng lưới tập đoagraven
Trung tacircm thocircng tin
Mocirci trường cộng taacutec
Phograveng quyết định
Nhoacutem phần mềm
Phần mềm được thiết kế để hỗ trợ sự hợp taacutec bao gồm việc thu huacutet vagrave lưu trữ thocircng tin
Caacutec tổ chức dẫn đầu thị trường hiện tại lagrave Lotus Notes and Domino Microsoft Exchange Novell GroupWise and Oracle Office
Caacutec cocircng cụ trong một bộ phần mềm bao gồm người quản lyacute hội nghị (Lotus Sametime) vagrave trao đổi thocircng điệp (Lotus Notes Mail)
Xếp hạng phần mềm cho nhoacutem
Ellis vv đề xuất một hệ thống xếp hạng dựa vagraveo kiểu sự hỗ trợ noacute Cung cấp
Hệ thocircng điệp
Hệ thống hội thảo truyền higravenh
Hệ thống cộng taacutec soạn thảo
Nhoacutem phacircn phối giải phaacutep phần mền
Hệ thống phối hợp
Hệ thống thocircng minh đại diện
Lực lượng điều khiển phaacutet triển phần mềm cho nhoacutem
Một số nhacircn tố chiacutenh bao gồm
Tăng năng suất
Giảm số lượng caacutec cuộc họp
Tăng cường tự động hoacutea caacutec quy trigravenh lagravem việc thường xuyecircn
Cần phối hợp toagraven cầu tốt hơn
Tiacutenh sẵn sagraveng của những mạng lan rộng
Coleman vagrave Khanna liệt kecirc 10 nhacircn tố khaacutec
54Quản lyacute hoạt động MDM (Mobile Device Management - Quản lyacute thiết bị di động)
Một số phương phaacutep phối hợp phổ biến hơnMDM lagrave
Kỹ thuật nhoacutem định danh
Kỹ thuật Delphi
Sự phacircn xử
Hệ thocircng tin dựa trecircn vấn đề
Nemawashi
Kỹ thuật nhoacutem định danh
1-Mỗi người tham gia viết ra những yacute tưởng về những gigrave necircn quyết định
2-Lần lượt mỗi người tham gia trigravenh bagravey yacute tưởng của migravenh được ghi lại trecircn bảng Khocircng thảo luận ở đacircy
3-Sau khi tất cả caacutec yacute tưởng được trigravenh bagravey caacutec đại biểu coacute thể chất vấn những người khaacutec
4-Mỗi người tham gia bỏ phiếu cho mỗi yacute tưởng
Kỹ thuật Delphi
Về cơ bản tương tự như kỹ thuật nhoacutem định danh ngoại trừ những người khocircng bao giờ tham gia cuộc họp
Một cocircng cụ khảo saacutet được sử dụng để thu thập đầu vagraveo ban đầu từ caacutec thagravenh viecircn
Một cuộc khảo saacutet thứ hai được gửi đi với một bản toacutem tắt caacutec kết quả chung
Những bước lặp lại cho đến khi đạt được một sự đồng thuận hoặc nhigraven nhận của đa số
Sự phacircn xử(Arbitration )
Thiacutech hợp nhất khi caacutec thagravenh viecircn của MDM đại diện cho caacutec yếu tố đối lập
Những người tham gia đồng yacute rằng nếu lựa chọn thay thế hai becircn thỏa thuận khocircng được tigravem thấy thigrave một trọng tagravei viecircn becircn ngoagravei sẽ tham gia
Trọng tagravei sau đoacute lựa chọn thay thế ocircng hoặc xeacutet thấy thiacutech hợp nhất
Hệ thống thocircng tin dựa trecircn vấn đề (IBIS)
Lagrave một phương phaacutep lập luận cấu truacutec
Một đại diện cho IBIS lagrave một đồ thị với caacutec nuacutet vagrave caacutec liecircn kết
IBIS bắt đầu với lựa chọn của một nuacutet vấn đề gốc sau đoacute caacutec nuacutet vị triacute khaacutec nhau được liecircn kết với nuacutet gốc
Caacutec nuacutet vị triacute nagravey sau đoacute được đaacutenh giaacute dựa trecircn những lập luận gắn liền với chuacuteng
Nemawashi (được sử dụng rộng ratildei tại Nhật Bản)
1-Một hoặc nhiều thagravenh viecircn của MDM được chỉ định lagrave điều phối viecircnCaacutec điều phối viecircn sau đoacute chọn người tham gia cograven lại
2-Điều phối viecircn xacircy dựng một tổng hợp caacutec sự lựa chọn vagrave sau đoacute caacutec chuyecircn gia đaacutenh giaacute caacutec lựa chọn
3-Điều phối viecircn lựa chọn một sự lựa chọn dựa trecircn kết quả ở trecircn(ở 2)
4-Sự thay thế được luacircn chuyển điều phối viecircn tigravem kiếm sự đồng thuận thocircng qua sự thuyết phục vagrave đagravem phaacuten
5-Nếu đạt được sự đồng thuận điều phối viecircn cho lưu thocircng một tagravei liệu magrave mỗi thagravenh viecircn MDM để lại dấu hiệu trecircn đoacute
55Nơi lagravem việc ảo
Nhiều tổ chức trecircn toagraven thế giới kinh doanh bất động sản cho cocircng nghệ hợp taacutec
Cocircng việc được trở thagravenh một điều bạn lagravem hơn lagrave một nơi bạn đi
Những thay đổi lớn nhất mang lại bởi nơi lagravem việc ảo coacute thể lagrave về văn hoaacute hay xatilde hội hơn lagrave về cocircng nghệ
Chương 6 Hệ thống thocircng tin điều hagravenh
61 Yacute nghĩa của EIS- Hệ thống thocircng tin điều hagravenh
- EIS lagrave một dạng đặc biệt của DSS được thiết kế để hỗ trợ ra quyết định ở cấp cao nhất của một tổ chức
- Lagrave một hệ thống thocircng tin hỗ trợ nhu cầu lập kế hoạch vagrave đaacutenh giaacute của caacutec nhagrave quản lyacute điều hagravenh
- EIS coacute thể giuacutep một CEO coacute được bức tranh tổng thể chiacutenh xaacutec nhất về caacutec hoạt động vagrave một bản toacutem tắt những gigrave magrave đối thủ cạnh tranh đang lagravem
- Caacutec hệ thống nagravey noacutei chung hoạt động dễ dagraveng vagrave trigravenh bagravey thocircng tin theo những caacutech dễ hiểu để việc tiếp thu được nhanh choacuteng (biểu đồ đồ thịhellip)
(Tagravei liệu thecircm EIS lagrave những loại hệ thống lagrave rất phức tạp trong tự nhiecircn Coacute thể noacutei hệ thống nagravey cũng cung cấp cho caacutec nhagrave quản lyacute với caacutec thiết bị coacute khả năng ra quyết định bằng caacutech sử dụng của noacute Hệ thống nagravey hoạt động trong điều kiện như vậy quan trọng như trong caacutec hệ thống khaacutec khocircng hỗ trợ Khả năng lưu trữ dữ liệu nặng lagravem cho noacute lyacute tưởng để được thocircng qua khocircng chỉ bởi caacutec doanh nghiệp lớn magrave cograven bởi caacutec doanh nghiệp nhỏ hơn Nhigraven chung hệ thống nagravey lagrave dagravenh cho caacutec nhacircn viecircn cấp cao hỗ trợ thagravenh thạo trong việc đưa ra caacutec quyết định quan trọng)
Caacutec phiecircn EIS tiecircu biểu- Phiecircn lagravem việc coacute thể bắt đầu với một baacuteo caacuteo về tigravenh higravenh tagravei chiacutenh vagrave kinh
doanh của một cocircng ty caacutec chỉ số hoạt động quan trọng được hiển thị rotilde ragraveng- EIS sẽ cho pheacutep caacutec giaacutem đốc điều hagravenh coacute thể đi sacircu vagraveo dữ liệu từ những con
số bất kỳ magrave noacute hỗ trợ- Việc điều hagravenh coacute thể lựa chọn một mức độ chi tiết ( VD danh số baacuten hagraveng) nếu
như cần điều tra thecircm- Lagrave một phương phaacutep tiếp cận coacute thể giuacutep việc ra quyết định tốt hơn
Những điều magrave EIS ko coacute- EIS khocircng phải lagrave sự thay thế cho caacutec hệ thống dựa trecircn caacutec maacutey tiacutenh khaacutec EIS
thực sự chỉ cung cấp dữ liệu cho caacutec hệ thống nagravey- Noacute khocircng thể biến caacutec bộ hệ điều hagravenh của maacutey tiacutenh thagravenh những ldquochuyecircn viecircn
giỏirdquo- Coacute thể được viacute một caacutech cao hơn như lagrave một trợ lyacute đaacuteng tin cậy coacute thể được gọi
đến bất khi nagraveo vagrave mỗi khi cần thiết
Tagravei liệu thecircm Sự khaacutec nhau giữa EIS vagrave DSS+ EIS thiết kế để hỗ trợ những người điều hagravenh cấp cao giuacutep họ khaacutem phaacute caacutec vấn đề vagrave caacutec cơ hội DSS hỗ trợ những nười phacircn tiacutech cố gắng trả lời cacircu hỏi caacutei gigrave coacute thể lagravem cugraveng với một cơ hội hoặc một vấn đề
Chiều EIS DSSNhững người sử dụng thocircng thường
Duyệt dữ liệu đi xuống truy xuất trạng thaacutei
Hỗ trợ phacircn tiacutech vagrave quyết định
Sự thuacutec đẩy Tiacutenh thiacutech hợp Tiacutenh hiệu quảỨng dụng Queacutet mocirci trường đaacutenh giaacute
hiệu suất nhận dạng caacutec vấn đề vagrave caacutec cơ hội
Caacutec quyết định quản lyacute trecircn caacutec lĩnh vực đa dạng
Hỗ trợ quyết định Caacutec chiacutenh saacutech caacutec quyết định khocircng coacute cấu truacutec ở mức cao vagrave hỗ trợ giaacuten tiếp
Hỗ trợ caacutec quyết định lặp lại caacutec quyết định khocircng thể đoaacuten trước ra quyết định khocircng coacute cấu truacutec vagrave baacuten cấu truacutec
Loại thocircng tin Caacutec thocircng tin tin tức thocircng tin becircn ngoagravei về khaacutech hagraveng đối thủ cạnh tranh mocirci trường caacutec baacuteo caacuteo theo yecircu cầu vagrave định thời về caacutec hoạt động becircn trong
Caacutec thocircng tin hỗ trợ caacutec tigravenh huống đặc biệt
Sử dụng coacute nguyecircn tắc
Dograve theo vết vagrave điều khiển nhận dạng cơ hội
Hoạch định tổ chức phacircn nhoacutem vagrave điều khiển
Khả năng phugrave hợp với những người sử dụng caacute nhacircn
Thiết kế loại ra quyết định cho mỗi người điều hagravenh caacute nhacircn bằng nhiều lựa chọn đầu ra
Cho pheacutep caacutec đaacutenh giaacute caacute nhacircn caacutec khả năng what-if lựa chọn loại hộp hội thoại
Đồ họa Phải coacute Lagrave một phần quan trọng của nhiều DSS
Thacircn thiện người sử dụng
Phải coacute Phải coacute nếu khocircng coacute người sử dụng trung gian
Xử lyacute thocircng tin Lọc neacuten thocircng tin dograve theo vết dữ liệu vagrave thocircng tin quan trọng
EIS kiacutech thiacutech caacutec cacircu hỏi caacutec cacircu trả lời bằng caacutech sử dụng DSS vagrave phản hồi lại EIS
Hỗ trợ caacutec thocircng tin chi tiết
Truy xuất thường xuyecircn caacutec mức chi tiết của bất kỳ thocircng tin tổng hợp nagraveo (duyệt dữ
Coacute thể coacute trong DSS nhưng khocircng thường
liệu chi tiết)Cơ sở mocirc higravenh Caacutec chức năng coacute sẵn bị hạn
chếLagrave điểm cốt lotildei của DSS
Cấu truacutec Theo người baacuten sản phẩm hoặc theo caacutec chuyecircn gia hệ thống thocircng tin
Theo người sử dụng hoặc caacute nhacircn hoặc caacutec chuyecircn gia từ caacutec trung tacircm thocircng tin hoặc phograveng ban hệ thống thocircng tin
Phần cứng Mainframe caacutec trạm RISC mạng LANs hoặc caacutec hệ thống phacircn bố
Mainframe caacutec trạm RISC caacutec maacutey PC hoặc caacutec hệ thống phacircn bố
Bản chất caacutec goacutei phần mềm
Truy xuất tương taacutec dễ dagraveng đến nhiều cơ sở dữ liệu truy xuất trực tuyến caacutec khả năng DBMS phức tạp caacutec liecircn kết phức tạp
Caacutec khả năng tiacutenh toaacuten lớn caacutec ngocircn ngữ mocirc higravenh mocirc phỏng ứng dụng vagrave caacutec bộ tạo DSS
Bản chất caacutec thocircng tin
Trigravenh bagravey thocircng tin được phaacutet sinh trước về quaacute khứ vagrave hiện tại tạo caacutec thocircng tin mới về quaacute khứ hiện tại tương lai
Tạo thocircng tin mới về quaacute khứ hiện tại tương lai
62 Lịch sử EIS- EIS xuất hiện lần đầu tiecircn tại MIT vagraveo những năm 1970
- Những EIS đầu tiecircn được phaacutet triển bởi caacutec doanh ngiệp lớn sẵn sagraveng chấp nhận rủi ro để đạt được lợi thế cạnh tranh
- Vagraveo những năm 1980 caacutec nhagrave cung cấp đatilde phaacutet triển một số cơ sở khaacutech hagraveng rộng vagrave cocircng nghệ EIS được tiếp tục phaacutet triển cho đến ngagravey nay
(Tagravei liệu thecircm Sử dụng DSSEIS cho phaacutet triển bền vững + Một số nghiecircn cứu đatilde được tiến hagravenh để kiểm tra việc thực hiện của EIS trong khu vực cocircng cộng vagrave chiacutenh phủ caacutec nước tổ chức kể từ khi chuacuteng được phaacutet triển theo định hướng lợi nhuận cho caacutec cocircng ty tư nhacircn (Hasan vagrave Hasan năm 1997) Theo một nghiecircn cứu tiến hagravenh tại Mỹ ở hơn 300 cocircng ty kết quả cho thấy sự khaacutec biệt của EIS giữa tư nhacircn vagrave chiacutenh phủ một số kết quả thuacute vị được phaacutet hiệnViacute dụ khoacute khăn hơn để chuyển tiền từ một tagravei khoản khaacutec trong một EIS của chiacutenh phủ cũng lagrave khoacute khăn hơn để biện giải thiacutech cho những chi phiacute phaacutet triển EIS của chiacutenh phủ Một nghiecircn cứu khaacutec được tiến hagravenh ở Australia
cho thấy rằng EIS cung cấp cho quản lyacute một higravenh ảnh chiacutenh xaacutec hơn về tổ chức thực hiện vagrave cung cấp hỗ trợ cho caacutec lợi iacutech chiến lược cải thiện khocircng chỉ cho caacutec nhagrave quản lyacute nhưng cograven cho phần cograven lại của tổ chức Dựa trecircn caacutec hệ thống được thiết kế cho caacutec cocircng ty tư nhacircn với một caacutech rotilde ragravengxaacutec định mục tiecircu EIS lagrave thiacutech hợp cho caacutec tổ chức cocircng cộng hiện đại nhưng cần phải được linh hoạt hơn vagrave kết thagravenh chugravem một phạm vi rộng hơn khả năng vagrave phương tiện hơn so với khu vực tư nhacircn ban đầu theo định hướng sản phẩm (Hasan vagrave Hasan năm 1997) Điều nagravey coacute thể lagrave do thực tế rằng caacutec hoạt động khu vực cocircng lagrave bắt buộc coacute taacutec động rộng phải đaacutep ứng sự mong đợi duy nhất cocircng cộng thường coacute mục tiecircu mơ hồ vagrave macircu thuẫn iacutet quyền tự chủ vagrave kiểm soaacutet việc ra quyết định vagrave nhacircn viecircn lagrave khoacute khăn hơn (Watson vagrave Carte2000) + Toacutem lại EIS lagrave một khaacutei niệm thagravenh cocircng noacute phaacutet triển qua nhiều năm tuy nhiecircn EIS khắc phục khiếm khuyết của migravenh bằng caacutech tiến hagravenh nghiecircn cứu liecircn tục)
63 Tại sao những người điều hagravenh hagraveng đầu lại khaacutec nhau- Họ lagrave những doanh nghiệp theo định hướng coacute suy nghĩ
- Coacute một khoảng khocircng gian rộng để kiểm soaacutet
- Họ chịu traacutech nhiệm cho việc thiết lập chiacutenh saacutech
- Họ đại diện cho tổ chức mocirci trường becircn ngoagravei
- Hagravenh động của họ tạo ra những kết quả đaacuteng kể về tagravei chiacutenh vagrave con người
Tần số caacutec hoạt động điều hagravenh- Xử lyacute xaacuteo trộn 42
- Hoạt động kinh doanh 32
- Phacircn bổ nguồn lực 17
- Đagravem phaacuten 3
- Những điều khaacutec 6
Handling Disturbances 42
Entrepreneurial Activites 32
Resource Allocation 17
Negotiation 3
Other 6
Những thocircng tin điều hagravenh cần thiết- Quản lyacute xaacuteo trộn coacute thể yecircu cầu sự chuacute yacute xung quanh đồng hồ
- Hoạt động kinh doanh yecircu cầu điều hagravenh để dự đoaacuten những thay đổi trong mocirci trường
- Nhiệm vụ phacircn bổ tagravei nguyecircn yecircu cầu lựa chọn người quản lyacute vagrave caacutec nguồn lực hạn chế được triển khai
- Đagravem phaacuten yecircu cầu cập nhật thocircng tin từng phuacutet để coacute thể xacircy dựng được sự đồng thuận
Caacutec loại thocircng tin điều hagravenh- Hệ thống kế toaacuten coacute liecircn quan đến việc tiacutenh toaacuten thu nhập hoạt động cho caacutec lĩnh
vực cụ thể lagrave quan trọng hơn so với caacutec hệ thống kế toaacuten truyền thocircng- Thocircng tin về thị trường khaacutech hagraveng cung cấp giaacute trị trong việc quyết định chiến
lược- Caacutec thocircng tin cần thiết thường được truyền đi trecircn một số hệ thống maacutey tiacutenh vagrave
nằm trong toagraven tổ chức- Caacutec thocircng tin được sử dụng thường lagrave ngắn hạn vagrave dễ thay đổi
Phương thức để xaacutec định thocircng tin cần thiết
Rockart xaacutec định được năm phương thức cơ bản để xaacutec định thocircng tin cần thiết
- Phương thức dựa trecircn kết quả- Phương thức rỗng- Phương thức chỉ số khoacutea- Phương thức tổng hợp nghiecircn cứu- Phương thức dựa vagraveo nhacircn tố then chốt dẫn đến thagravenh cocircng
64 Thagravenh phần EIS
- Sản phẩm EIS đầu tiecircn được phaacutet triển để sử dụng trecircn maacutey tiacutenh cấu higravenh cao nhưng caacutec sản phẩm hiện nay nhằm mục tiecircu lagrave nền tảng ClientServer
- Những nền tảng linh hoạt hơn coacute thể thiacutech ứng với thay đổi trong tổ chức vagrave cocircng nghệ
- Sử dụng dữ liệu thời gian thực dẫn đến quyết định nhanh hơn nhiều thocircng tin hơn
Thagravenh phần phần cứng- Một EIS khocircng đogravei hỏi coacute phần cứng cụ thể hoặc duy nhất nagraveo- Chigravea khoacutea của vấn đề lagrave để đảm bảo rằng caacutec thagravenh phần của EIS tối ưu hoacutea vagrave
phugrave hợp với tagravei nguyecircn maacutey tiacutenh của tổ chức- Hệ thống nagravey phải được cấu higravenh để caacutec nguồn tagravei nguyecircn phugrave hợp với những
người điều hagravenh chuacuteng
Thagravenh phần phần mềm- Traacutei ngược với phần cứng phần mềm thường được chuyecircn mocircn hoacutea cao cho caacutec
bagravei toaacuten về miền- Sự chuyecircn mocircn hoacutea nagravey thường đạt được bằng caacutech sử dụng thagravenh phần off-the-
shelf cho toagraven bộ EIS vagrave caacutec mocirc-đun tugravey chỉnh để đaacutep ứng nhu cầu cụ thể- Lotus Notes lagrave một viacute dụ điển higravenh Noacute coacute thể được sử dụng một migravenh hoặc coacute
thể phục vụ becircn thứ ba mocirc-đun plug-in
Cocircng nghệ EIS hiện nay
Dobrzeniecki đề xuấtphacircn loạitừng cấptheo bachức năng- Loại 1 sản phẩm bao gồmmột bộ đầy đủcaacutec ứng dụngtừ mộtnhagrave cung cấp- Loại 2 sản phẩm đượcthựchiệnở phần đầu củacaacutecsản phẩmDSS đượcphaacutet triển
bởicugravengmộtnhagrave cung cấp- Loại 3 sản phẩmkết hợp với nhautheo bất kỳ số lượngthuộc sở hữu củacocircng ty
65 Xacircy dựng EIS
- Xacircy dựngmộtEISgiống nhưxacircydựngmột số hệ thống khaacutec củamocirc higravenh hệ thống thocircng tin
- Việcphaacutet triểncấu truacutecnecircn được theo dotildeitừ quaacute trigravenh thiết kế đến quaacute trigravenhthực hiện
- Tuy nhiecircn một dự aacuten phaacutet triển EIScoacute xu hướnglagrave thống nhấtvagraveyecircu cầu hỗ trợ caacutec nhagrave quản lyacute latildenh đạo
- Xacircy dựng một EIScoacute thểphaacutet hiện ra đượccaacutectigravenh huống khoacute khănmagravemột nhagrave phaacutet triển chưabao giờ gặp phải
Mocirc higravenh EIS
Khung phaacutet triển một EIS
- Watson et al đề nghị xacircy dựngkhung với ba thagravenh phần+ Caacutech tiếp cận tập trung vagraveo yếu tốcon người vagrave dữ liệu coacute liecircn quan đến EIS+ Quaacute trigravenh phaacutet triển cần sự linh hoạt vagrave tương taacutec+ Người sử dụng - hệ thống hộp thoại bao gồm một ngocircn ngữ hagravenh động để xử lyacute caacutec lệnh
Lợi iacutech của EIS- Dễ duy trigrave caacutec mục tiecircu coacute tổ chức- Dễ truy xuất thocircng tin- Cho pheacutep người sử dụng nacircng cao hiệu suất hơn
- Tăng chất lượng ra quyết định- Cung cấp sự cải tiến cạnh tranh- Tiết kiệm thời gian của người sử dụng- Tăng khả năng vagrave chất lượng giao tiếp- Cung cấp khả năng điều khiển tốt hơn trong tổ chức- Cho pheacutep tham gia caacutec vấn đề vagrave caacutec cơ hội- Cho pheacutep hoạch định- Cho pheacutep tigravem kiếm nguyecircn nhacircn của một vấn đề- Thảo matilden caacutec yecircu cầu của người điều hagravenh
Hạn chế của EIS vagrave 1 số sai lầm cần traacutenh
- Chi phiacute một cuộc khảo saacutetnăm1991 chothấychi phiacute phaacutet triểntrungbigravenh365000USDvớichi phiacute vận hagravenhhagraveng năm lagrave$200000 (EIS)
- Cocircng nghệ hạn chếEIScần phảiđượctiacutech hợp hoagraven toagravenvagraveokiếntruacuteccủadoanh nghiệphiện tại do đoacute noacutelagrave một thaacutech thứclớn đối vớithiết kế
- Hạn chế tổ chức cơ cấu tổ chứccoacute thể khocircng phugrave hợp
Sự hạn chế về tổ chức- Chương trigravenh nghị sự vagrave thời gian chệch EIS mocirc tả một phần việc thực hiện một
chương trigravenh nghị sự vagrave coacute thể dễ dagraveng đạt được sự tin cậy một caacutech chắc chắn- Đồng bộ hoacutea việc quản lyacute sự tin cậy đuacuteng luacutec đặc biệt baacuteo caacuteo EIS coacute thể phaacute
vỡ sự ổn định thiết lập caacutec chu trigravenh baacuteo caacuteo một caacutech tốt nhất- Sự bất ổn EIS phản ứng nhanh coacute thể gacircy ra việc taacutec động trở lại một caacutech
nhanh choacuteng dẫn đến sự thiếu ổn định trong tổ chức
Sự thất bại lagrave thay thế khocircng thể chấp nhận được- Một số yếu tố lagravem EIS thất bại
+ Thiếu sự hỗ trợ về mặt quản lyacute+ Vấn đề chiacutenh trị+ Thất bại của nhagrave phaacutet triển+ Lỗi về cocircng nghệ+ Giaacute cả+ Thời gian
66 Ra quyết định điều hagravenh trong tương lai vagrave EIS
- Coacute một vagravei điều kiện sẽ được hợp nhất cho việc chuyển đổi cocircng nghệ Trong đoacute một vagravei điều kiện coacute thể dễ dự đoaacuten Hai điều kiện magrave ta coacute thể thấy lagrave+ Phaacutet triển cocircng nghệ maacutey tiacutenh trong việc điều hagravenh sẽ tạo ra sự chuyển đổi được chấp nhận một caacutech dễ dagraveng hơn+ Mở rộng traacutech nhiệm điều hagravenh sẽ mở rộng nhu cầu thocircng tin
Tương lai của EIS- EIS thocircng minh Những tiến bộ trong cocircng nghệ AI sẽ được triển khai trong caacutec
EIS- EIS đa phương tiện Cơ sở dữ liệu đa phương tiện sẽ cho pheacutep tiacutech hợp văn bản
giọng noacutei vagrave higravenh ảnh trong tương lai- EIS thocircng tin Tương lai EIS sẽ mở rộng hơn trong việc sử dụng dữ liệu becircn
ngoagravei doanh nghiệp- EIS kết nối Giao tiếp với băng thocircng rộng cho pheacutep kết nối liecircn thocircng lớn hơn
Chương 7 HỆ CHUYEcircN GIA VAgrave TRIacute TUỆ NHAcircN TẠO
71 Caacutec khaacutei niệm
72 Triacute thocircng minh của triacute tuệ nhacircn tạo
73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia
74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia
75 Lợi iacutech vagrave hạn chế của hệ chuyecircn gia
71 Caacutec khaacutei niệm
Chuyecircn mocircn (Expertise) sự hiểu biết rộng trong 1 lĩnh vực hẹp
Hệ chuyecircn gia (Expert Systems)1 chương trigravenh maacutey tiacutenh sử dụng 1 tập caacutec luật dựa trecircn tri thức của con người để giải quyết caacutec vấn đề đogravei hogravei phải coacute sự chuyecircn mocircn
Một số hệ chuyecircn gia nổi tiếng
DENDRAL (Standford 1960s Edward Feigenbaum)
MYCIN (Standford1970s Edward Shortliffe)
PROSPECTOR (MIT 1979)
Triacute tuệ nhacircn tạo (Artificial Intelligence ndash AI)
Triacute tuệ nhacircn tạo một bộ phacircn của ngagravenh khoa học maacutey tiacutenh quan tacircm đến việc thiết kế caacutec hệ thống maacutey tiacutenh thocircng minh đoacute lagrave caacutec hệ thống đưa ra caacutec đặc điểm magrave từ đoacute chuacuteng ta liecircn hệ với sự thocircng minh trong hagravenh động của con người (Barr vagrave Feigenbaum 1981)
Mục điacutech của AI
Mục điacutech khoa học xaacutec định caacutec gợi yacute để giải thiacutech caacutec loại khaacutec nhau của triacute tuệ thực
Mục điacutech kỹ thuật giải quyết caacutec vấn đề trong thế giới thực
Triacute tuệ nhacircn tạo kế thừa nhiều yacute tưởng quan điểm kỹ thuật từ caacutec ngagravenh khoa học khaacutec
- Triết học
- Logic Toaacuten học
- Tiacutenh toaacuten
- Khoa học tacircm lyacute Khoa học nhận thức
- Sinh học Thần kinh học
- Tiến hoacutea
Caacutec lĩnh vực ứng dụng trong Triacute tuệ nhacircn tạo
Mạng nơ ron thần kinh (Neural Networks)
Tiacutenh toaacuten sự tiến hoacutea
(Evolutionary Computation)
Hệ chuyecircn gia (Expert Systems)
Kỹ thuật xử lyacute tiếng noacutei (Speech Processing)
Kỹ thuật xử lyacute ngocircn ngữ tự nhiecircn
(Natural Language Processing)
Lập kế hoạch (Planning)
Robot (Robotics)
Khoa học higravenh ảnh (Vision)
Caacutec kỹ thuật thocircng dụng dugraveng trong AI
Biểu diễn(Representation)
Học (Learning)
Caacutec luật (Rules)
Tigravem kiếm (Search)
72 Triacute thocircng minh của triacute tuệ nhacircn tạo
Con người suy diễn như thế nagraveo
Phacircn loại (Categorization)
Caacutec quy tắc cụ thể
Heuristics
Kinh nghiệm trước đoacute
Dự tiacutenh trước
Maacutey tiacutenh suy diễn như thế nagraveo
Lập luận dựa trecircn luật IF-THEN mocirc tả tri thức được matilde hoacutea dưới dạng caacutec luật
Caacutec khung (Frames) lagrave caacutec đại diện mocirc tả caacutec tigravenh huống giống nhau lagrave điển higravenh của một vagravei phacircn loại
Lập luận dựa trecircn caacutec trường hợp mocirc phỏng giải phaacutep trước đoacute cho một vấn đề hiện tại
Nhận dạng mẫu phaacutet hiện acircm thanh higravenh dạng hoặc caacutec chuỗi dagravei
Caacutec dạng khaacutec của Triacute tuệ nhacircn tạo
Học maacutey- mạng nơron vagrave giải thuật di truyền
Lập trigravenh tự động ndash lagrave những kỹ thuật tạo ra caacutec chương trigravenh để lagravem 1 nhiệm vụ riecircng biệt (cho pheacutep những người khocircng phải lagrave người lập trigravenh coacute thể lập trigravenh được)
Cuộc sống nhacircn tạo ndash nỗ lực để taacutei tạo caacutec hiện tượng sinh học trong caacutec hệ thống dựa trecircn maacutey tiacutenh
73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia(Expert Systems- ES)
Theo Jackson (1999) Một hệ chuyecircn gia lagrave một chương trigravenh maacutey tiacutenh mocirc tả vagrave suy diễn với tri thức của một vagravei lĩnh vực để giải quyết vấn đề hay đưa ra caacutec lời khuyecircn
Cấu truacutec cơ bản của ES được dựa theo cấu truacutec chung của DSS Sự khaacutec biệt chiacutenh giữa ES vagraveDSS lagrave hệ ES thu thập caacutec kiến thức từ những
chuyecircn gia trong lĩnh vực quan tacircmĐặc trưng của hệ chuyecircn gia Hiệu quả cao Thời gian trả lời thỏa đaacuteng Độ tin cậy cao Dễ hiểu
Giao diện người dugraveng trong ES
Thiết kế giao diện người dugraveng tập trung vagraveo caacutec yếu tố như dễ dagraveng sử dụngcoacute độ tin cậy cao giảm tải những khoacute khăn khi sử dụng
Thiết kế necircn coacute một số tương taacutec (đầu vagraveo kiểm soaacutet vagrave truy vấn)
Cấu tạo giao diện người dugraveng gồm coacute magraven higravenh cảm ứng bagraven phiacutem buacutet saacuteng lệnh thoại caacutec phiacutem chuyecircn dụng
Cơ sở tri thức (Knowledge Base)
Chứa đựng caacutec tri thức cụ thể miền thu được từ caacutec chuyecircn gia miền
Coacute thể chứa caacutec mocirc tả caacutec hagravenh vi giải quyết vấn đề caacutec ragraveng buộc caacutec heuristics
Thagravenh cocircng của một ES dựa trecircn tiacutenh đầy đủ vagrave tiacutenh chiacutenh xaacutec của cơ sở tri thức
Mocirc tơ suy diễn (Inference Engine)
Ở đacircy tri thức được đặt để sử dụng tạo ra caacutec giải phaacutep để giải quyết vấn đề
Mocirc tơ nagravey coacute khả năng thực hiện diễn dịch hoặc suy diễn dựa trecircn caacutec luật hay caacutec caacutec sự kiện
Đồng thời cũng coacute khả năng sử dụng caacutec suy diễn mờ hay khocircng chiacutenh xaacutec dựa trecircn xaacutec suất hay aacutenh xạ mẫu
Vograveng điều khiển suy diễn
1 Aacutenh xạ caacutec luật với caacutec sự kiện đatilde được cho
2 Chọn luật để thực hiện
3 Thực hiện luật bằng caacutech thecircm caacutec sự kiện được suy diễn ra vagraveo bộ nhớ lagravem việc
Chuỗi suy diễn (Chaining)
Suy diễn tiến (forward chaining) maacutey suy diễn bắt đầu từ dữ liệu ban đầu vagrave thực hiện việc suy luận để đưa ra caacutec kết luận cuối cugraveng
Suy diễn lugravei (backward chaining) maacutey suy diễn bắt đầu từ dữ liệu điacutech vagrave tigravem ra tri thức hỗ trợ cho dữ liệu điacutech đoacute
Viacute dụ suy diễn lugravei
R1 Nếu coacute A vagrave B thigrave suy ra coacute D
R2 Nếu coacute B thigrave suy ra coacute C
R3 Nếu coacute C vagrave D thigrave suy ra coacute E
Ta coacute E ta xem trong 3 luật R1 R2 R3 luật nagraveo coacute E ta thấy R3 chứa E đồng thời chứa C vagrave D Xeacutet tiếp trong 2 luật R1 R2 luật nagraveo chứa C vagrave D R2 chứa C R3 chứa D Từ đoacute ta coacute được caacutec tri thức hỗ trợ suy diễn vagrave kết luận lagrave nếu coacute A vagrave B thigrave sẽ coacute E Hay nếu A vagrave B đuacuteng thigrave sẽ coacute E
Viacute dụ suy diễn tiến
Giả sử coacute tập chứa 3 luật sau
R1 Nếu coacute A vagrave B thigrave suy ra coacute D
R2 Nếu coacute B thigrave suy ra coacute C
R3 Nếu coacute C vagrave D thigrave suy ra coacute E
Nếu ta coacute A vagrave B thigrave chuacuteng ta suy ra được D từ R1 vagrave suy ra C từ R2 Với D vagrave C đatilde được suy ra ở trecircn giờ chuacuteng ta suy ra được E từ R3
Viacute dụ thực tế
Giả sử muốn biết magraveu của một con vật nuocirci tecircn lagrave Fred biết rằng noacute kecircu ộp ộp vagrave ăn ruồi
Coacute tập 4 luật ban đầu như sau
R1 Nếu X kecircu ộp ộp vagrave ăn ruồi thigrave X lagrave con ếch
R2 Nếu X kecircu chiecircm chiếp vagrave biết hoacutet thigrave X lagrave con chim
R3 Nếu X lagrave con ếch thigrave X coacute magraveu xanh
R4 Nếu X lagrave con chim thigrave X coacute magraveu vagraveng
74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia
Expert system shells lagrave một tập caacutec goacutei phần mềm vagrave caacutec cocircng cụ dugraveng để phaacutet triển caacutec hệ chuyecircn gia
Những Expert system shells đầu tiecircn thường rất rườm ragrave Mặc dugrave vậy noacute vẫn giuacutep cho người sử dụng sẽ khocircng phải bắt đầu lại từ đầu khi xacircy dựng một hệ chuyecircn gia mới
Những shell hiện đại bao gồm hai mocirc-đun chiacutenh lagrave cocircng cụ xacircy dựng một tập quy tắc vagrave mocirc tơ suy diễn
Xacircy dựng hệ chuyecircn gia
Bước 1 xacircy dựng mocirc higravenh bagravei toaacuten xaacutec định vấn đề nhiệm vụ magrave hệ thống sẽ thực hiện Caacutec dạng bagravei toaacuten cần hệ chuyecircn gia
Bagravei toaacuten diễn giải (InterPretation)
Bagravei toaacuten dự baacuteo (Prediction)
Bagravei toaacuten chuẩn đoaacuten (Diagnose)
Bagravei toaacuten gỡ rối (Debugging)
Bagravei toaacuten thiết kế
Tương tự như một dự aacuten phần mềm để xacircy dựng một hệ chuyecircn gia cần phải coacute caacutec yếu tố về nhacircn lực tagravei nguyecircn vagrave thời gian Những yếu tố nagravey ảnh hưởng đến giaacute thah của một hệ chuyecircn giaTrong phần nagravey cacircu hỏi thường được đặt ra lagrave tại sao cần phải xacircy dựng một hệ chuyecircn giaTrước khi bắt đầu phải xaacute định rotilde bagravei toaacuten đạt ra lagrave jiAi lagrave chuyecircn giaAi lagrave người sử dụng
1 Diễn giải (InterPretation) Nghiecircn cứu 1 vấn đề -gt Dựa trecircn những biểu hiện thuộc tiacutenh đặc trưng becircn ngoagravei -gt Tư vấn
(hoặc đưa ra kết luận hay mocirc tả dễ hiểu từ tập dữ liệu thocirc)
2 Bagravei toaacuten dự baacuteo (Prediction) Coacute thể dự đoaacuten được hagravenh vi kết quả dựa trecircn caacutec hiện tượng -gt dự baacuteo
VD Dự baacuteo thời tiết động đấthellip
3 Bagravei toaacuten chẩn đoaacuten (Diagnoss) Xaacutec định caacutec lỗi caacutec bộ phận hỏng hoacutec của hệ thống dựa trecircn caacutec dữ liệu quan saacutet được
4 Bagravei toaacuten gỡ rối (Debugging) Mocirc tả caacutec phương phaacutep khắc phục hệ thống khi gặp sự cố
5 Bagravei toaacuten thiết kế Lựa chọn cấu higravenh caacutec đối tượng nhằm thoả matilden một số ragraveng buộc nagraveo đoacute
6 Giảng dạy Phần mềm dạy học coacute thể chuẩn đoaacuten vagrave sủa lỗi của học sinh trong quaacute trigravenh học tập
Để xaacutec định đuacuteng bagravei toaacuten magrave chuacuteng ta cần giải quyết thigrave phải trả lời đc một số cacircu hỏi
- cần hệ chuyecircn gia
Bước 2 thu thập tri thức lựa chọn cocircng cụ vagrave aacutep dụng
Trong bước thu thập tri thức vấn đề quan trọng lagrave lựa chọn chuyecircn gia những người magrave sẽ đoacuteng goacutep tri thức cho hệ thống Thocircng thường trong suốt quaacute trigravenh phaacutet triển thigrave chuyecircn gia được xem như một thagravenh viecircn của đội phaacutet triển
Hiện nay coacute rất nhiều cocircng cụ để xacircy dựng một hệ chuyecircn gia Phổ biến nhất lagrave JESS CLIPS vagrave OPS5
Bước 3 Thiết kế cơ sở tri thức thiết kế hệ thốngTri thức được biểu diễn trường minh trong cơ sở tri thức
Caacutec chuyecircn gia vagrave kỹ sư tri thức sẽ đối thoại với nhau bằng caacutec kỹ thuật đối thoại Suy diễn (SD) bảng Mocirc higravenh hoacutea SD quy nạp phacircn loại
Vấn đề bagraveo trigrave vagrave phaacutet triển
Caacutec hệ chuyecircn gia đogravei hỏi phải bảo trigrave vagrave phaacutet triển nhiều hơn so với caacutec hệ thống khaacutec Phải thường xuyecircn bổ sung tri thức mới vagrave thay đổi caacutec tri thức cũ để đổi mới hệ chuyecircn gia
Thu thập vagrave khắc phục lỗi do người sử dụng phaacutet hiện để kịp thời khắc phục những sai soacutet của hệ chuyecircn gia
75 Lợi iacutech vagrave hạn chế của caacutec hệ chuyecircn gia
Một số lợi iacutech chiacutenh
Thời gian trả lời hợp lyacute bằng hoặc nhanh hơn so với chuyecircn gia (người) để đi đến cugraveng một quyết định Hệ chuyecircn gia lagrave một hệ thống thời gian thực (real time system)
Khả năng trả lời với mức độ tinh thocircng bằng hoặc cao hơn so với chuyecircn gia (người) trong cugraveng lĩnh vực
Hệ chuyecircn gia giuacutep cho hiệu quả lagravem việc tăng bằng việc sử dụng tập caacutec luật một caacutech nhanh choacuteng magrave ko bị nhầm lẫn chuyecircn gia lagrave người coacute thể quecircn đi một số tri thức cơ sở lyacute luậ nhưng HCG thigrave ko
Quyết định của một người chuyecircn gia coacute thể bị thay đổi vagrave ko coacute tiacutenh thống nhất như quyết định của một hệ chuyecircn gia tạo ra
Hệ chuyecircn gia giuacutep cho người sử dụng coacute thể trau dồi sự hiểu biết trecircn lĩnh vuej cụ thể magrave noacute giải quyết hỗ trợ người ra quyết định coacute trigravenh độ như 1 chuyecircn gia trong quaacute trigravenh gia quyết định
Kiến thức của rất nhiều chuyecircn gia về một lĩnh vực nagraveo đoacute được đưa vagraveo hệ chuyecircn gia lagravem cho CSTT cuat HCG phong phuacute vagrave rộng lớn hơn rất nhiều
HCG giải thiacutech caacutec bước suy luận một caacutech dễ hiểu nhất quaacuten luacutec nagraveo cũng coacute thể sử dụng ko như chuyecircn gia con người
Hạn chế của caacutec hệ chuyecircn gia
Nhược điểm lớn nhất của hệ chuyecircn gia lagrave những yacute kiến chuyecircn mocircn thường rất khoacute matilde hoacutea vagrave giải neacuten
Hệ chuyecircn gia khocircng coacute khả năng tự học tự cập nhật kiến thức mới như caacutec chuyecircn gia magrave cần phải được matilde hoacutea lại khi noacute được cập nhật
Hệ chuyecircn gia khocircng thể nhận ra được vấn đề khocircng nằm trong miền kiến thức của hệ thống
Chương 8 Tri thức vagrave tiếp nhận
1 Bao gồm caacutec vấn đề
Dữ liệu thực tế đo lường hoặc quan saacutet coacute hoặc khocircng coacute bối cảnh
Thocircng tin dữ liệu được tổng hợp một caacutech hữu iacutech để giải quyết những khoacute khăn trong việc đưa ra quyết định
Tri thức bao gồm caacutec ứng dụng quy tắc thocircng tin hướng dẫn của người ra quyết định
2 Những caacutei nhigraven về tri thức
Đại diện lagravem thế nagraveo để diễn tả tri thức viacute dụ như một quyển saacutech khocircng phải lagrave tri thức nhưng noacute lại lagrave một đại diện của tri thức
Sản xuất tri thức lagrave một tập hơp của hagraveng tồn kho coacute thể được sản xuất cũng như mua lại
Tri thức lagrave 1 trong 6 trạng thaacutei của hệ thống
1Dữ liệu 2Thocircng tin 3Cấu truacutec thocircng tin 4Sự thấu hiểu 5Yacute kiến 6 Quyết định
3 Caacutec loại tri thức Phổ biến mocirc tả dữ liệu thocircng tin thủ tục mọi thứ lagravem như thế nagraveo lập luận chiacutenh saacutech hoặc caacutec quy tắc
4 Thu thập Tri thức hệ chuyecircn gia Hầu hết caacutec phương phaacutep đều bắt đầu với mocirc higravenh của caacutec taacutec vụ trong đoacute
hệ chuyecircn gia được xacircy dựng Trong đoacute mocirc tả về caacutec lĩnh vực được tạo ra Caacutec kỹ sư sử dụng caacutec mocirc higravenh giả thuyết vagrave nhận thức về quaacute trigravenh phacircn
tiacutech để gợi ra caacutech giải quyết vấn đề về tri thức từ caacutec chuyecircn gia
5 Caacutec chiều của thu thập tri thức KE- driven caacutec kỹ sư trao đổi trực tiếp với caacutec chuyecircn gia Expert-driven Caacutec chuyecircn gia trực tiếp đưa chuyecircn mocircn của họ vagraveo hệ
thống maacutey tiacutenh Machine-driven Sử dụng caacutec cocircng cụ suy luận để triacutech xuất tri thức từ một
tập caacutec viacute dụ
6 Kỹ thuật thu thập tri thức Trao đổi gồm 2 loại cơ bản lagrave coacute cấu truacutec(coacute kịch bản) vagrave khocircng coacute cấu
truacutec( đối thoại trực tiếp) Giao thức phacircn tiacutech bằng lời Khi caacutec chuyecircn gia thực hiện một cocircng việc
của họ thigrave một bản ghi về cocircng việc đoacute được thực hiện Caacutec kỹ sư sẽ xacircy dựng mocirc higravenh cho những gigrave được ghi lại trong bản ghi
Phương phaacutep sagraveng lọc caacutec chuyecircn gia so saacutenh caacutec nhoacutem liecircn tiếp trong ba đối tượng vagrave cho biết tại sao nhoacutem thứ hai lại khaacutec nhoacutem thứ ba
7 Thu thập tri thức từ nhiều nguồn Thu thập tri thức từ nhiều nguồn lagrave cần thiết để coacute được đầy đủ caacutec tri thức
cho một vấn đề quan điểm yacute kiến traacutei ngược nhau thường phaacutet sinh Phương phaacutep đồng thuận sẽ giuacutep giải quyết được vấn đề macircu thuẫn Kỹ thuật phacircn tiacutech Meta lagrave kỹ thuật được aacutep dụng trong caacutec trường hợp
khaacutec Caacutech tiếp cận bằng định lượng đogravei hỏi caacutec kỹ sư cần cacircn nhắc yếu tố đầu vagraveo của caacutec chuyecircn gia khaacutec nhau
8 Xaacutec nhận hợp lệ vagrave kiểm tra tri thức Một khi thu thập tri thức noacute phải được đaacutenh giaacute về khả năng sử dụng vagrave độ
chiacutenh xaacutec Hai vấn đề cụ thể lagrave hiệu lực của những kiến thức vagrave kiểm tra việc xacircy dựng cơ sở của tri thức
Cần xaacutec nhận xem liệu hệ thống coacute thể hoạt động ở mức độ tối thiểu khocircng
Xaacutec minh liecircn quan đến việc so saacutenh từng chi tiết kỹ thuật của hệ thống những gigrave đatilde được thực hiện cuối cugraveng
9 Một số caacutec biện phaacutep xaacutec nhận Độ chiacutenh xaacutec Khả năng thiacutech nghi Mức độ đầy đủ Bề rộng Độ sacircu Hiệu lực Tổng quan Chiacutenh xaacutec Hiện thực Độ tin cậy Tiacutenh hữu dụng Mức độ
Chương 9 Học maacutey
1 Logic mờ vagrave ngocircn ngữ mờ(Fuzzy Logic and Linguistic Ambiguity)
Ngocircn ngữ tự nhiecircn gồm những khaacutei niệm mơ hồ vagrave khocircng chiacutenh xaacutectruyền tải ngữ nghĩa thocircng qua tiacutenh xấp xỉkhocircng rotilde ragraveng
Những xấp xỉ nagravey giuacutep con người coacute thể truyền tải hết được yacute nghĩa nhưng maacutey thigrave khocircng hiểu
Lagravem sao biểu diễn caacutec tri thức sử dụng caacutec khaacutei niệm khocircng rotilde ragraveng(mờ) hoặc khocircng chiacutenh xaacutec
2 Khaacutei niệm cơ bản của logic mờ tập mờ lagrave những tập hợp khocircng coacute một giới hạn rotilde Mỗi phần tử của noacute chỉ
chứa một mức độ hagravem liecircn thuộc của từng phần tử Vigrave vậy tập mờ khocircng giống như tập cổ điển Tập mờ coacute thể kết hợp với nhau qua những luật mờ magrave đặc trưng cho những hagravenh động trạng thaacutei vagrave thuộc tiacutenh của logic mờ được tận dụng khi thực hiện một bộ điều khiển mờ
Logic mờ dựa trecircn yacute tưởng mỗi phần tử thuộc vagraveo một tập hợp ở một mức độ nagraveo đấy
Locircgic mờ cho pheacutep độ liecircn thuộc (microA )coacute giaacute trị trong khoảng (01) Locircgic mờ coacute thể được coi lagrave mặt ứng dụng của lyacute thuyết tập mờ để xử lyacute caacutec
giaacute trị trong thế giới thực cho caacutec bagravei toaacuten phức tạp
3 So saacutenh tiacutenh đuacuteng đắn logic mờ vagrave xaacutec suất Xaacutec suất thigrave đề cập đến khả năng xảy ra một biến cố hay một điều gigrave đoacute Logic mờ đề cập đến cấp độ magrave đặc tiacutenh ở hiện tại
o viacute dụ1 người coacute chiều cao 6 feet thigrave coacute cấp độ lagrave 05 về chiều cao
4 Ưu điểm của logic mờ Caacutech tiếp cận rất tự nhiecircnkhocircng phức tạp Coacute thể mocirc higravenh hoacutea caacutec hagravem phi tuyến tugravey yacute phức tạp
Coacute thể tận dụng được kinh nghiệm từ những chuyecircn gia hagraveng đầu trong mọi lĩnh vực
Logic mờ được xacircy dựng dựa trecircn ngocircn ngữ tự nhiecircnNền tảng của logic mờ lagrave dựa trecircn cơ sở giao tiếp của con người
5 Nhược điểm của logic mờ Trong 1 hệ thống phức tạpsử dụng logic mờ coacute thể trở thagravenh trở ngại cho
việc xaacutec thực độ tin cậy của hệ thống Cơ chế lập luận mờ khocircng thể học hỏi từ những lỗi sai
6 Mạng noron nhacircn tạo(ANN) Mạng noron nhacircn tạo lagrave một mocirc phỏng xử lyacute thocircng tinđược nghiecircn cứu ra
từ hệ thống thần kinh của sinh vậtgiống như bộ natildeo để xử lyacute thocircng tin ANNs lagrave chương trigravenh dựa trecircn maacutey tiacutenh đơn giản coacute chức năng lagrave một mocirc
higravenh bagravei toaacuten khocircng gian dựa trecircn thử nghiệm vagrave baacuteo lỗi
7 Học từ kinh nghiệm Tiến trigravenh Một mẫu dữ liệu được biểu diễn như một mạng lưới noronANN ldquodự
đoaacutenrdquo 1 đầu radự đoaacuten được so saacutenh với giaacute trị thực tế hoặc giaacute trị chiacutenh xaacutecNếu đoaacuten được chiacutenh xaacutec thigrave khocircng coacute hagravenh động nagraveo được thực hiện
Nếu dự đoaacuten sai ANN kiểm tra lại vagrave xaacutec định lại thocircng số để điều chỉnh Một mẫu dữ liệu khaacutec được biểu diễn vagrave quaacute trigravenh nagravey được lặp lại
8 Nguyecircn tắc cơ bản của cocircng nghệ nơron Caacutec yếu tố xử lyacute cơ bản trong hệ thống thần kinh của con người lagrave tế bagraveo
thần kinhMạng lưới của tế bagraveo nagravey lagrave liecircn kết với nhau nhận được thocircng tin từ caacutec cảm biến trong mắt taihellip
Thocircng tin nhận được bởi tế bagraveo thần kinh hoặc lagrave sẽ kiacutech thiacutech noacute(sẽ được chuyển qua 1 thocircng điệp dọc theo mạng lưới) hoặc lagrave sẽ ngăn cản noacute(ngăn cản dograveng thocircng tin)
Độ nhạy coacute thể thay đổi qua thời gian hoặc sau khi coacute được kinh nghiệm
9 Cấu truacutec mạng Một ANN gồm 3 lớp cơ bản
Lớp đầu vagraveo nhận dữ liệu Lớp becircn trong hoặc lagrave lớp ẩn xử lyacute dữ liệu Lớp đầu ra chuyển tiếp kết quả cuối cugraveng của mạng
10Mạng nơ ron Thường coacute nhiều đầu vagraveo mỗi đầu vagraveo với mức ảnh hưởng vagrave tầm quan
trọng riecircng của noacute Một đầu vagraveo quan trọng coacute thể được sử dụng để khuếch đại đầu ra caacutec hagravem trạng thaacutei tổng hợp caacutec trọng số của caacutec yếu tố
đầuvagraveo khaacutec nhauvagraveo một giaacute trị duy nhất Caacutec hagravem chuyển giao xử lyacute caacutec giaacute trị trạng thaacutei vagrave tạo đầu ra
11Huấn luyện mạng nơ ron Trong mocirc higravenh coacute giaacutem saacutetANN được đến so saacutenh dự đoaacuten của chiacutenh
noacute với thocircng tin phản hồi coacute chứa caacutec kết quả mong muốn ANN sẽ phải tigravem caacutech thay đổi caacutec tham số becircn trong củamigravenh (caacutec trọng số vagrave caacutec ngưỡng) để tạo necircn một aacutenh xạ coacute khả năng aacutenh xạcaacutec đầu vagraveo thagravenh caacutec đầu ra mong muốn Sự thay đổi nagravey được tiến hagravenh nhờ việc so saacutenh giữa đầu ra thực sự vagrave đầu ra mong muốn
Trong mocirc higravenh khocircng coacute giaacutem saacutetANN nhận được dữ liệu vagraveo nhưng khocircng phải coacute bất kỳ thocircng tin phản hồi về kết quả mong muốn
Phần lớn caacutec ứng dụng nằm trong vugraveng của caacutec bagravei toaacuten ước lượng như mocirc higravenh hoacuteathống kecirc neacuten lọc phacircn cụm
12Lợi iacutech Liecircn kết với mạng noron Traacutenh caacutech lập trigravenh tường minh Giảm nhu cầu của chuyecircn gia ANNs thigrave thiacutech nghi với caacutec yếu tố đầu vagraveo thay đổi Khocircng cần thiết cho cơ sở tri thức tinh chế ANNs coacute tiacutenh động vagrave cải thiện với việc sử dụng Coacute khả năng xử lyacute dữ liệu khocircng chiacutenh xaacutec hoặc khocircng đầy đủ Cho pheacutep tổng quaacutet hoacutea từ thocircng tin cụ thể Cho pheacutep thu thập cảm giaacutec thocircng thường vagraveo miền giải quyết vấn đề
13Hạn chế của việc liecircn kết với mạng noron ANNs khocircng thể giải thiacutech được suy luận Bản chất hộp đen thường khiến cho vấn đề traacutech nhiệm vagrave độ tin cậy phaacutet
sinh lagrave khoacute khăn Lặp đi lặp lại quaacute trigravenh huấn luyện rất tốn thời gian Nguồn lực caacutec nhagrave phacircn tiacutech vagrave thiết kế coacute tay nghề cao vẫn lagrave đaacuteng lo
ngại Cocircng nghệ ANN thuacutec đẩy hạn chế của phần cứng hiện tại ANN yecircu cầu phải coacute sự tin tưởng ở đầu ra
14Giới thiệu về thuật toaacuten di truyền Cũng như mạng lưới thần kinh caacutec thuật toaacuten di truyền được dựa trecircn lyacute
thuyết sinh học Thuật toaacuten di truyền tigravem thấy nguồn gốc của chuacuteng trong caacutec lyacute thuyết
tiến hoacutea của chọn lọc tự nhiecircn vagrave thiacutech ứng với biến đổi khiacute hậu Kết quả thuật toaacuten di truyền lagrave từ giao phối 2 caacute thể trong quần thế để tạo
ra con caacutei đocirci khi tốt hơn so với bậc cha mẹ của chuacuteng 15Caacutec thagravenh phần cơ bản của thuật toaacuten di truyền
Toaacuten tử chọn lọc Caacutec caacute thể tốt được chọn lọc để đưa vagraveo thế hệ sau Sự chọn lọc nagravey căn cứ vagraveo độ thiacutech nghi với mocirci trường của mỗi caacute thể
Toaacuten tử lai gheacutep (crossover) Hai caacute thể cha vagrave mẹ trao đổi caacutec gen với nhau để tạo ra caacute thể con
Toaacuten tử đột biến (mutation) Một caacute thể thay đổi một số gen để biến đổi thagravenh một caacute thể mớiTất cả caacutec toaacuten tử trecircn khi thực hiện đều mang tiacutenh ngẫu nhiecircn
16Quaacute trigravenh cơ bản của một thuật toaacuten di truyền Khởi tạo
Đaacutenh giaacute quần thể
Lựa chọn NST thiacutech hợp nhất vagrave loại bỏ NST yếu nhất
Quy trigravenh giao nhau vagrave cải thiện quần thể
đột biến tiến trigravenh để khaacutem phaacute ra NST mới
17Ưu nhược điểm của việc kết hợp với thuật toaacuten di truyền Kiacutech thước quần thể lagrave 1 yếu tố quan trọng trong tốc độ của việc tigravem
kiếmnhưng noacute tương đối dễ dagraveng để dự đoaacuten tốc độ nagravey Giao nhau hoặc đột biến lagrave khocircng necircn đc sử dụng quaacute thường xuyecircn Luocircn coacute được iacutet nhất 1 giải phaacutep hợp lyacute Necircn coacute thể aacutep dụng chuacuteng cho caacutec vấn đề magrave chuacuteng ta khocircng coacute hướng
về caacutech giải quyết Sức mạnh của thuật toaacuten xuất phaacutet từ khaacutei niệm đơn giảnkhocircng phải từ
một thủ tục thuật toaacuten phức tạp 18Tương lai của học maacutey
Mạng lưới thần kinh nhacircn tạo vượt quaacute năng lực của con người trong caacutec trường hợp bị cocirc lập
Về mặt lyacute thuyếtmột maacutey tiacutenh coacute thể xử lyacute dũ liệu nhanh hơn hagraveng triệu lần so với 1 con người
May mắn thay cho chuacuteng tacon người tốt hơn nhiều khi magrave coacute được dữ liệumaacutey tiacutenh khocircng coacute 1 số thứ như lagrave 5 giaacutec quan
CHƯƠNG 10 KHO DỮ LIỆU
1 Kho dữ liệu Kho dữ liệu lagrave tuyển tập caacutec cơ sở dữ liệu tiacutech hợp hướng chủ đề được
thiết kế để trợ giuacutep cho một hệ hỗ trợ quyết định
Theo John Ladley Cocircng nghệ kho dữ liệu lagrave tập caacutec phương phaacutep kỹ thuật vagrave caacutec cocircng cụ coacute thể kết hợp hỗ trợ nhau để cung cấp thocircng tin cho người sử dụng trecircn cơ sở tiacutech hợp từ nhiều nguồn dữ liệu nhiều mocirci trường khaacutec nhau
Kho dữ liệu thường rất lớn tới hagraveng trăm GB hay thậm chiacute hagraveng Terabyte
2 Kho dữ liệu vận hagravenh (ODS) Một kho dữ liệu vận hagravenh Aacutep dụng kỹ thuật kho dữ liệu vagraveo caacutec hệ xử
lyacute giao taacutec lưu trữ dữ liệu cho một ứng dụng đặc thugrave Noacute đưa vagraveo kho dữ liệu một dograveng caacutec dữ liệu thocirc được thiết kế
3 So saacutenh
Kho dữ liệu vận hagravenh Kho dữ liệu
Dữ liệu theo chủ đề Dữ liệu theo chủ đề
Dữ liệu tiacutech hợp Dữ liệu tiacutech hợp
Dữ liệu thay đổi Dữ liệu khocircng thay đổi
Dữ liệu được cập nhật khi thay đổi
Dữ liệu giữ nguyecircn
Chỉ coacute dữ liệu hiện tạiDữliệu hiện tại vagrave dữ liệu lịch sử
Chu kỳ lagravem tươi dữ liệu ngắn Chu kỳ lagravem tươi dữ liệu dagravei
Chỉ coacute dữ liệu chi tiết Dữ liệu chi tiết vagrave dữ liệu tổng kết
Dugraveng cho caacutec quyết định ngắn hạn
Dugraveng cho hoạch định dagravei hạn
4 Kho dữ liệu cục bộ (Data Mart - DM)
Kho dữ liệu cục bộ lagrave CSDL coacute những đặc điểm giống với kho dữ liệu nhưng với quy mocirc nhỏ hơn vagrave lưu trữ dữ liệu về một lĩnh vực một chuyecircn ngagravenh
Data mart phụ thuộc Chứa những dữ liệu được lấy từ DW vagrave những dữ liệu nagravey sẽ được triacutech lọc vagrave tinh chế tiacutech hợp lại ở mức cao hơn để phục vụ một chủ đề nhất định của Datamart
Data mart độc lập Khocircng giống như Datamart phụ thuộc Data mart độc lập được xacircy dựng trước DW vagrave dữ liệu được trực tiếp lấy từ caacutec nguồn khaacutec nhau
5 Siecircu dữ liệu Metadata lagrave dữ liệu để mocirc tả dữ liệu Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột
một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi Metadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu
6 Mocirci trường kho dữ liệu Hệ thống của tổ chức vagrave kho cung cấp dữ liệu để xacircy dựng kho dữ liệu Trong quaacute trigravenh chuyển dữ liệu từ caacutec nguồn khaacutec nhau dữ liệu coacute thể
được lagravem sạch hoặc chuyển đổi vagrave vigrave thế DW được xem như lagrave một chuẩn cho việc lưu trữ
Đồng thời siecircu dữ liệu được ghi lại Cuối cugraveng DW hoặc siecircu thị coacute thể được sử dụng để tạo ra một kho dữ
liệu ldquocaacute nhacircnrdquo 7 Caacutec đặc điểm của kho dữ liệu
Đặc điểm Mocirc tả
Hướng chủ đề - DL tổ chức theo caacutech thức người dugraveng tham chiếu
Tiacutech hợp - Dữ liệu ldquosạchrdquo loại bỏ tiacutenh thiếu nhất quaacuten
Khocircng thay đổi - DL ldquochỉ đọcrdquo người dugraveng khocircng thay đổi được
Chuỗi thời gian - DL lagrave chuỗi thời gian khocircng phải lagrave trạng thaacutei hiện tại
Được tổng kết - DL vận hagravenhthao taacutec khi cần thiết
được kết hợp lại thagravenh dạng coacute thể dugraveng được cho quyết định
Kiacutech cỡ lớn hơn - Lưu giữ theo chuỗi thời gian tức lagrave giữ lại nhiều DL
Khocircng được chuẩn hoacutea - Coacute thể dư thừa DLSiecircu dữ liệu - Dữ liệu của dữ liệu được lưu trữNguồn dữ liệu - DL vận hagravenh (caacutec hệ sẵn coacute) cugraveng
với caacutec nguồn ngoagravei 8 Kho dữ liệu hướng chủ đề
Hướng chủ để coacute nghĩa lagrave kho dữ liệu được tổ chức xung quanh caacutec chủ đề chiacutenh như khaacutech hagraveng sản phẩm sản xuất Tập trung vagraveo việc mocirc higravenh hoacutea vagrave phacircn tiacutech dữ liệu cho caacutec nhagrave ra quyết định magrave khocircng tập trung vagraveo caacutec xử lyacute thocircng thường Cung cấp cho người dugraveng một khung nhigraven toagraven vẹn đơn giản vagrave đầy đủ về caacutec sự kiện quanh caacutec chủ đề
9 Dữ liệu trong DW được tiacutech hợp Dữ liệu trong kho dữ liệu được xacircy dựng bằng caacutech tổng hợp dữ liệu từ
nhiều nguồn khaacutec nhau vagrave caacutec nguồn coacute tổ chức khaacutec nhau Cơ sở dữ liệu caacutec file excel caacutec flat file hoặc caacutec raw file Khi đưa vagraveo kho dữ liệu caacutec dữ liệu được lagravem sạch vagrave tiacutech hợp dữ liệu nhằm đảm bảo tiacutenh nhất quaacuten của dữ liệu
10Kiến truacutec kho dữ liệu Tầng cơ sở dữ liệu hoạt động Tầng truy xuất thocircng tin Tầng truy xuất dữ liệu Tầng siecircu dữ liệu Tầng quản lyacute tiến trigravenh Tầng thocircng điệp của ứng dụng Tầng vật liacute của kho dữ liệu Tầng trigravenh diễn dữ liệu
11Higravenh trạng kho dữ liệu Kho dữ liệu ảo - người dugraveng cuối coacute thể truy cập trực tiếp đến kho dữ liệu
sử dụng caacutec cocircng cụ cho pheacutep ở tầng truy xuất dữ liệu Kho dữ liệu trung tacircm-1 cơ sở dữ liệu vật lyacute chứa tất cả dữ liệu cho một
vugraveng chuyecircn dụng nagraveo đoacute
Kho dữ liệu phacircn taacuten- Thagravenh phần được phacircn taacuten qua nhiều hệ cơ sở dữ liệu vật lyacute
12METADATA- Siecircu dữ liệu Định nghĩa Siecircu dữ liệu lagrave dữ liệu về dữ liệu Lagrave 1 lưu trữ dugraveng để
Miecircu tả kho dữ liệu tổng thể Nhận dạng kiểu kho dữ liệu Quản liacute quaacute trigravenh tiacutech hợp dữ liệu Quản liacute quaacute trigravenh cập nhật kho dữ liệu Quản liacute bảo mật
Lagrave chigravea khoacutea quyết định sự thagravenh cocircng của kho dữ liệu luocircn được thay đổi vagrave cập nhật theo sự phaacutet triển của kho dữ liệu
Dugraveng để quản liacute điều khiển kho dữ liệu Sự ra đời của kho dữ liệu như 1 cấu truacutec hỗ trợ ra quyết định siecircu dữ liệu
được xem như nguồn tagravei nguyecircn dữ liệu Siecircu dữ liệu lagrave trừu tượng Chuacuteng lagrave dữ liệu bậc cao cung cấp mocirc tả ngắn
gọn caacutec dữ liệu bậc thấp hơn 13Hoạt động của Siecircu dữ liệu
Siecircu dữ liệu rất cần thiết trong việc chuyển hoacutea thocircng tin trở thagravenh tri thức Lagrave chigravea khoacutea giuacutep chuacuteng ta xử lyacute được dữ liệu thocirc Viacute dụ một dograveng dữ liệu baacuten hagraveng 1023 K596 11121 agraveNoacute sẽ khocircng coacute nghĩa gigrave cho đến khi chuacuteng ta đưa vagraveo siecircu dữ liệu (thư
mục chứa dữ liệu) agrave cửa hagraveng 1023 sản phẩm K596 vagrave số tiền baacuten được lagrave 11121 đocirc la
14Sự cần thiết phải nhất quaacuten trong kho dữ liệu Kho dữ liệu được xacircy dựng cho lợi iacutech của những nhagrave phacircn tiacutech kinh
doanh caacutec nhagrave quản trị cho tất cả caacutec khu vực chức năng Trong cơ sở dữ liệu riecircng caacutec khu vực khaacutec nhau coacute thể định nghĩa vagrave lưu
trữ dữ liệu thocircng qua phiecircn bản của chiacutenh noacute Khi dữ liệu được lấy từ những vugraveng khaacutec nhau đoacute vagrave được đặt vagraveo kho dữ
liệu Việc chuyển đổi vagrave lagravem sạch caacutec tiến trigravenh sẽ đảm bảo noacute lagrave duy nhất được tiacutech hợp tại một mức của tổ chức
15Ragrave soaacutet lại dữ liệu ndash Thực thi siecircu dữ liệu
Bất kể cấu truacutec tự nhiecircn của 1 cacircu truy vấn thế nagraveo thigrave caacutec thagravenh phần của siecircu dữ liệu rất quan trọng đối với người ra quyết định
Bảng thuộc tiacutenh khoacutea được lưu trữ bởi kho dữ liệu Tập hợp dữ liệu được lấy từ đacircu Những chuyển đổi nagraveo được thực thi với việc lagravem sạch
16Siecircu dữ liệu lagrave gigrave Metadata - lagrave thocircng tin mocirc tả nội dung của cơ sở dữ liệu (CSDL) Metadata baacuteo cho người dugraveng biết thời gian cập nhật sau cugraveng của dữ liệu
định dạng vagrave mục điacutech sử dụng của noacute Những thocircng tin nagravey coacute thể hướng dẫn người dugraveng duyệt qua CSDL vagrave
giuacutep họ hiểu được yacute nghĩa vagrave ngữ cảnh của dữ liệu Trong CSDL metadata lagrave caacutec dạng biểu diễn khaacutec nhau của caacutec đối tượng
trong CSDL Trong CSDL quan hệ metadata lagrave caacutec định nghĩa của bảng cột CSDL
view vagrave nhiều đối tượng khaacutec Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột
một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi -gtMetadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu
Bảng chuyển đổi Ghi lại những chuyển đổi đatilde được thực hiện
Lịch sử thực thi Ghi lại những dữ liệu đatilde được
phacircn tiacutech
Higravenh thaacutei kết nốiGhi lại những dữ liệu được kết nối vagrave tần suất
17Aacutenh xạ thocircng thường của siecircu dữ liệu Bản ghi aacutenh xạ chuyển đổi bao gồm
Định danh của nguồn gốc Chuyển đổi thuộc tiacutenh Chuyển đổi thuộc tiacutenh vật lyacute Matilde hoacutea tham chiếu bảng chuyển đổi Đổi tecircn Đổi khoacutea Gaacuten giaacute trị cho thuộc tiacutenh mặc định Chọn logic cho caacutec nguồn nhiều giaacute trị Đổi thuật toaacuten
18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để
phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai
lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave
tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec
Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm
Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo
19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua
caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau
SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được
Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra
một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức
Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ
Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ
Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech
CHƯƠNG 11 KHAI PHAacute DỮ LIỆU
1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn
ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993
Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng
2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd
1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều
2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP
3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn
4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng
5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server
6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo
7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động
8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời
9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều
10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện
11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech
12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP
3 Xử lyacute phacircn tiacutech trực tuyến OLAP
MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave
dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu
ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave
thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu
HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave
ROLAP4 Khai phaacute dữ liệu
Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh
khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn
Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan
5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp
6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại
Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp
Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec
Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt
Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra
Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh
vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho
Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec
Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm
Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục
Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng
gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp
Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn
Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec
Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper
Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2
Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25
Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước
Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng
Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện
trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp
Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute
độ hỗ trợ ge ngưỡng minsup
độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan
Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn
Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết
Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu
MOLAP ROLAP HOLAP
Lưu trữ dữ liệu cơ sở
Khối Bảng quan hệ Bảng quan hệ
Lưu trữ thocircng tin tổng hợp
Khối Bảng quan hệ Khối
Hiệu suất thực hiện truy vấn
Nhanh nhất Chậm nhất Nhanh
Tiecircu thụ khocircng gian lưu trữ
Nhiều Thấp Trung bigravenh
Chi phiacute bảo trigrave Cao Thấp Trung bigravenh
Vấn đề giới tiacutenh Nam vagrave nữ thường coacute những thế mạnh khaacutec nhau điều nagravey coacute thể lagrave sức mạnh trong 1 thiết lập MDM
Đagravem phaacuten vagrave quyết định
Một quyết định coacute thể liecircn quan đến nhiều quan điểm khaacutec nhau vigrave thế cần phải coacute sự đagravem phaacuten
Caacutec thiết kế của cơ chế hỗ trợ cho MDM phải phugrave hợp với caacutec hoạt độngđagravemphaacuten
Những hoạt động nagravey bao gồm việc thu nhận yacute kiến của caacutec thagravenh viecircn 1 caacutech cocircng bằng
53Cocircng nghệ hỗ trợ MDM
Organizational DSSndash 1 hệ thống cung cấp caacutec quyết định hỗ trợ
Group Support Systemndash Cocircng nghệ sử dụng sự hỗ trợ của nhiều becircn tham gia
Group DSS ndash Lagrave 1 hệ thống được thiết kế đặc biệt để hỗ trợ cho MDM
DSS ndash Lagrave 1 hệ thống dưới sự kiểm soaacutet của 1 người quyết định hệ thống nagravey cung cấp 1 bộ cocircng cụ giuacutep phacircn tiacutech hoagraven cảnh đểđưa ra quyết định vagrave nacircng cao hiệu quả của quyết địnhđoacute
53Cocircng nghệ hỗ trợ MDM
Organizational DSSndash 1 hệ thống cung cấp caacutec quyết định hỗ trợ
Group Support Systemndash Cocircng nghệ sử dụng sự hỗ trợ của nhiều becircn tham gia
Group DSS ndash Lagrave 1 hệ thống được thiết kế đặc biệt để hỗ trợ cho MDM
DSS ndash Lagrave 1 hệ thống dưới sự kiểm soaacutet của 1 người quyết định hệ thống nagravey cung cấp 1 bộ cocircng cụ giuacutep phacircn tiacutech hoagraven cảnh đểđưa ra quyết định vagrave nacircng cao hiệu quả của quyết địnhđoacute
Mục tiecircu của cocircng nghệ hỗ trợ MDM
Quy trigravenh hỗ trợ tập trung vagraveo quaacute trigravenh tạo điều kiện thuận lợi cho sự tương taacutec
Cơ chế cấu truacutec quaacute trigravenh chi phối caacutec hoạt động truyền thocircng
Nhiệm vụ hỗ trợ cocircng việc coacute thể chọn lựa tổ chức hoặc lấy thocircng tin
Nhiệm vụ cấu truacutec cocircng việc cho pheacutep truy cập đến kỹ thuật lọc kết hợp phacircn tiacutech kiến thức liecircn quan đến cocircng việc
Caacutec lớp loại cocircng nghệ hỗ trợ MDM
Phacircn loại theo đặc điểm do DeSanctis vagrave Gallupe đưa ra đề xuất một chương trigravenh ba cấp dựa trecircn caacutec tiacutenh năng được cung cấp
Hệ thống cấp 1 Mục điacutech chiacutenh lagrave tạo điều kiện thocircng tin liecircn lạc giữa caacutec thagravenh viecircn
Hệ thống cấp 2 Thiết kế để giảm thiểu rủi ro
Hệ thống cấp 3 Giuacutep điều chỉnh xử lyacute quyết định
Phacircn loại theo cocircng nghệ -Kraemer vagrave King tập trung vagraveo cocircng nghệ aacutep dụng
Cocircng nghệ bảng mạch điện tử
Hội nghị trực tuyến
Mạng lưới tập đoagraven
Trung tacircm thocircng tin
Mocirci trường cộng taacutec
Phograveng quyết định
Nhoacutem phần mềm
Phần mềm được thiết kế để hỗ trợ sự hợp taacutec bao gồm việc thu huacutet vagrave lưu trữ thocircng tin
Caacutec tổ chức dẫn đầu thị trường hiện tại lagrave Lotus Notes and Domino Microsoft Exchange Novell GroupWise and Oracle Office
Caacutec cocircng cụ trong một bộ phần mềm bao gồm người quản lyacute hội nghị (Lotus Sametime) vagrave trao đổi thocircng điệp (Lotus Notes Mail)
Xếp hạng phần mềm cho nhoacutem
Ellis vv đề xuất một hệ thống xếp hạng dựa vagraveo kiểu sự hỗ trợ noacute Cung cấp
Hệ thocircng điệp
Hệ thống hội thảo truyền higravenh
Hệ thống cộng taacutec soạn thảo
Nhoacutem phacircn phối giải phaacutep phần mền
Hệ thống phối hợp
Hệ thống thocircng minh đại diện
Lực lượng điều khiển phaacutet triển phần mềm cho nhoacutem
Một số nhacircn tố chiacutenh bao gồm
Tăng năng suất
Giảm số lượng caacutec cuộc họp
Tăng cường tự động hoacutea caacutec quy trigravenh lagravem việc thường xuyecircn
Cần phối hợp toagraven cầu tốt hơn
Tiacutenh sẵn sagraveng của những mạng lan rộng
Coleman vagrave Khanna liệt kecirc 10 nhacircn tố khaacutec
54Quản lyacute hoạt động MDM (Mobile Device Management - Quản lyacute thiết bị di động)
Một số phương phaacutep phối hợp phổ biến hơnMDM lagrave
Kỹ thuật nhoacutem định danh
Kỹ thuật Delphi
Sự phacircn xử
Hệ thocircng tin dựa trecircn vấn đề
Nemawashi
Kỹ thuật nhoacutem định danh
1-Mỗi người tham gia viết ra những yacute tưởng về những gigrave necircn quyết định
2-Lần lượt mỗi người tham gia trigravenh bagravey yacute tưởng của migravenh được ghi lại trecircn bảng Khocircng thảo luận ở đacircy
3-Sau khi tất cả caacutec yacute tưởng được trigravenh bagravey caacutec đại biểu coacute thể chất vấn những người khaacutec
4-Mỗi người tham gia bỏ phiếu cho mỗi yacute tưởng
Kỹ thuật Delphi
Về cơ bản tương tự như kỹ thuật nhoacutem định danh ngoại trừ những người khocircng bao giờ tham gia cuộc họp
Một cocircng cụ khảo saacutet được sử dụng để thu thập đầu vagraveo ban đầu từ caacutec thagravenh viecircn
Một cuộc khảo saacutet thứ hai được gửi đi với một bản toacutem tắt caacutec kết quả chung
Những bước lặp lại cho đến khi đạt được một sự đồng thuận hoặc nhigraven nhận của đa số
Sự phacircn xử(Arbitration )
Thiacutech hợp nhất khi caacutec thagravenh viecircn của MDM đại diện cho caacutec yếu tố đối lập
Những người tham gia đồng yacute rằng nếu lựa chọn thay thế hai becircn thỏa thuận khocircng được tigravem thấy thigrave một trọng tagravei viecircn becircn ngoagravei sẽ tham gia
Trọng tagravei sau đoacute lựa chọn thay thế ocircng hoặc xeacutet thấy thiacutech hợp nhất
Hệ thống thocircng tin dựa trecircn vấn đề (IBIS)
Lagrave một phương phaacutep lập luận cấu truacutec
Một đại diện cho IBIS lagrave một đồ thị với caacutec nuacutet vagrave caacutec liecircn kết
IBIS bắt đầu với lựa chọn của một nuacutet vấn đề gốc sau đoacute caacutec nuacutet vị triacute khaacutec nhau được liecircn kết với nuacutet gốc
Caacutec nuacutet vị triacute nagravey sau đoacute được đaacutenh giaacute dựa trecircn những lập luận gắn liền với chuacuteng
Nemawashi (được sử dụng rộng ratildei tại Nhật Bản)
1-Một hoặc nhiều thagravenh viecircn của MDM được chỉ định lagrave điều phối viecircnCaacutec điều phối viecircn sau đoacute chọn người tham gia cograven lại
2-Điều phối viecircn xacircy dựng một tổng hợp caacutec sự lựa chọn vagrave sau đoacute caacutec chuyecircn gia đaacutenh giaacute caacutec lựa chọn
3-Điều phối viecircn lựa chọn một sự lựa chọn dựa trecircn kết quả ở trecircn(ở 2)
4-Sự thay thế được luacircn chuyển điều phối viecircn tigravem kiếm sự đồng thuận thocircng qua sự thuyết phục vagrave đagravem phaacuten
5-Nếu đạt được sự đồng thuận điều phối viecircn cho lưu thocircng một tagravei liệu magrave mỗi thagravenh viecircn MDM để lại dấu hiệu trecircn đoacute
55Nơi lagravem việc ảo
Nhiều tổ chức trecircn toagraven thế giới kinh doanh bất động sản cho cocircng nghệ hợp taacutec
Cocircng việc được trở thagravenh một điều bạn lagravem hơn lagrave một nơi bạn đi
Những thay đổi lớn nhất mang lại bởi nơi lagravem việc ảo coacute thể lagrave về văn hoaacute hay xatilde hội hơn lagrave về cocircng nghệ
Chương 6 Hệ thống thocircng tin điều hagravenh
61 Yacute nghĩa của EIS- Hệ thống thocircng tin điều hagravenh
- EIS lagrave một dạng đặc biệt của DSS được thiết kế để hỗ trợ ra quyết định ở cấp cao nhất của một tổ chức
- Lagrave một hệ thống thocircng tin hỗ trợ nhu cầu lập kế hoạch vagrave đaacutenh giaacute của caacutec nhagrave quản lyacute điều hagravenh
- EIS coacute thể giuacutep một CEO coacute được bức tranh tổng thể chiacutenh xaacutec nhất về caacutec hoạt động vagrave một bản toacutem tắt những gigrave magrave đối thủ cạnh tranh đang lagravem
- Caacutec hệ thống nagravey noacutei chung hoạt động dễ dagraveng vagrave trigravenh bagravey thocircng tin theo những caacutech dễ hiểu để việc tiếp thu được nhanh choacuteng (biểu đồ đồ thịhellip)
(Tagravei liệu thecircm EIS lagrave những loại hệ thống lagrave rất phức tạp trong tự nhiecircn Coacute thể noacutei hệ thống nagravey cũng cung cấp cho caacutec nhagrave quản lyacute với caacutec thiết bị coacute khả năng ra quyết định bằng caacutech sử dụng của noacute Hệ thống nagravey hoạt động trong điều kiện như vậy quan trọng như trong caacutec hệ thống khaacutec khocircng hỗ trợ Khả năng lưu trữ dữ liệu nặng lagravem cho noacute lyacute tưởng để được thocircng qua khocircng chỉ bởi caacutec doanh nghiệp lớn magrave cograven bởi caacutec doanh nghiệp nhỏ hơn Nhigraven chung hệ thống nagravey lagrave dagravenh cho caacutec nhacircn viecircn cấp cao hỗ trợ thagravenh thạo trong việc đưa ra caacutec quyết định quan trọng)
Caacutec phiecircn EIS tiecircu biểu- Phiecircn lagravem việc coacute thể bắt đầu với một baacuteo caacuteo về tigravenh higravenh tagravei chiacutenh vagrave kinh
doanh của một cocircng ty caacutec chỉ số hoạt động quan trọng được hiển thị rotilde ragraveng- EIS sẽ cho pheacutep caacutec giaacutem đốc điều hagravenh coacute thể đi sacircu vagraveo dữ liệu từ những con
số bất kỳ magrave noacute hỗ trợ- Việc điều hagravenh coacute thể lựa chọn một mức độ chi tiết ( VD danh số baacuten hagraveng) nếu
như cần điều tra thecircm- Lagrave một phương phaacutep tiếp cận coacute thể giuacutep việc ra quyết định tốt hơn
Những điều magrave EIS ko coacute- EIS khocircng phải lagrave sự thay thế cho caacutec hệ thống dựa trecircn caacutec maacutey tiacutenh khaacutec EIS
thực sự chỉ cung cấp dữ liệu cho caacutec hệ thống nagravey- Noacute khocircng thể biến caacutec bộ hệ điều hagravenh của maacutey tiacutenh thagravenh những ldquochuyecircn viecircn
giỏirdquo- Coacute thể được viacute một caacutech cao hơn như lagrave một trợ lyacute đaacuteng tin cậy coacute thể được gọi
đến bất khi nagraveo vagrave mỗi khi cần thiết
Tagravei liệu thecircm Sự khaacutec nhau giữa EIS vagrave DSS+ EIS thiết kế để hỗ trợ những người điều hagravenh cấp cao giuacutep họ khaacutem phaacute caacutec vấn đề vagrave caacutec cơ hội DSS hỗ trợ những nười phacircn tiacutech cố gắng trả lời cacircu hỏi caacutei gigrave coacute thể lagravem cugraveng với một cơ hội hoặc một vấn đề
Chiều EIS DSSNhững người sử dụng thocircng thường
Duyệt dữ liệu đi xuống truy xuất trạng thaacutei
Hỗ trợ phacircn tiacutech vagrave quyết định
Sự thuacutec đẩy Tiacutenh thiacutech hợp Tiacutenh hiệu quảỨng dụng Queacutet mocirci trường đaacutenh giaacute
hiệu suất nhận dạng caacutec vấn đề vagrave caacutec cơ hội
Caacutec quyết định quản lyacute trecircn caacutec lĩnh vực đa dạng
Hỗ trợ quyết định Caacutec chiacutenh saacutech caacutec quyết định khocircng coacute cấu truacutec ở mức cao vagrave hỗ trợ giaacuten tiếp
Hỗ trợ caacutec quyết định lặp lại caacutec quyết định khocircng thể đoaacuten trước ra quyết định khocircng coacute cấu truacutec vagrave baacuten cấu truacutec
Loại thocircng tin Caacutec thocircng tin tin tức thocircng tin becircn ngoagravei về khaacutech hagraveng đối thủ cạnh tranh mocirci trường caacutec baacuteo caacuteo theo yecircu cầu vagrave định thời về caacutec hoạt động becircn trong
Caacutec thocircng tin hỗ trợ caacutec tigravenh huống đặc biệt
Sử dụng coacute nguyecircn tắc
Dograve theo vết vagrave điều khiển nhận dạng cơ hội
Hoạch định tổ chức phacircn nhoacutem vagrave điều khiển
Khả năng phugrave hợp với những người sử dụng caacute nhacircn
Thiết kế loại ra quyết định cho mỗi người điều hagravenh caacute nhacircn bằng nhiều lựa chọn đầu ra
Cho pheacutep caacutec đaacutenh giaacute caacute nhacircn caacutec khả năng what-if lựa chọn loại hộp hội thoại
Đồ họa Phải coacute Lagrave một phần quan trọng của nhiều DSS
Thacircn thiện người sử dụng
Phải coacute Phải coacute nếu khocircng coacute người sử dụng trung gian
Xử lyacute thocircng tin Lọc neacuten thocircng tin dograve theo vết dữ liệu vagrave thocircng tin quan trọng
EIS kiacutech thiacutech caacutec cacircu hỏi caacutec cacircu trả lời bằng caacutech sử dụng DSS vagrave phản hồi lại EIS
Hỗ trợ caacutec thocircng tin chi tiết
Truy xuất thường xuyecircn caacutec mức chi tiết của bất kỳ thocircng tin tổng hợp nagraveo (duyệt dữ
Coacute thể coacute trong DSS nhưng khocircng thường
liệu chi tiết)Cơ sở mocirc higravenh Caacutec chức năng coacute sẵn bị hạn
chếLagrave điểm cốt lotildei của DSS
Cấu truacutec Theo người baacuten sản phẩm hoặc theo caacutec chuyecircn gia hệ thống thocircng tin
Theo người sử dụng hoặc caacute nhacircn hoặc caacutec chuyecircn gia từ caacutec trung tacircm thocircng tin hoặc phograveng ban hệ thống thocircng tin
Phần cứng Mainframe caacutec trạm RISC mạng LANs hoặc caacutec hệ thống phacircn bố
Mainframe caacutec trạm RISC caacutec maacutey PC hoặc caacutec hệ thống phacircn bố
Bản chất caacutec goacutei phần mềm
Truy xuất tương taacutec dễ dagraveng đến nhiều cơ sở dữ liệu truy xuất trực tuyến caacutec khả năng DBMS phức tạp caacutec liecircn kết phức tạp
Caacutec khả năng tiacutenh toaacuten lớn caacutec ngocircn ngữ mocirc higravenh mocirc phỏng ứng dụng vagrave caacutec bộ tạo DSS
Bản chất caacutec thocircng tin
Trigravenh bagravey thocircng tin được phaacutet sinh trước về quaacute khứ vagrave hiện tại tạo caacutec thocircng tin mới về quaacute khứ hiện tại tương lai
Tạo thocircng tin mới về quaacute khứ hiện tại tương lai
62 Lịch sử EIS- EIS xuất hiện lần đầu tiecircn tại MIT vagraveo những năm 1970
- Những EIS đầu tiecircn được phaacutet triển bởi caacutec doanh ngiệp lớn sẵn sagraveng chấp nhận rủi ro để đạt được lợi thế cạnh tranh
- Vagraveo những năm 1980 caacutec nhagrave cung cấp đatilde phaacutet triển một số cơ sở khaacutech hagraveng rộng vagrave cocircng nghệ EIS được tiếp tục phaacutet triển cho đến ngagravey nay
(Tagravei liệu thecircm Sử dụng DSSEIS cho phaacutet triển bền vững + Một số nghiecircn cứu đatilde được tiến hagravenh để kiểm tra việc thực hiện của EIS trong khu vực cocircng cộng vagrave chiacutenh phủ caacutec nước tổ chức kể từ khi chuacuteng được phaacutet triển theo định hướng lợi nhuận cho caacutec cocircng ty tư nhacircn (Hasan vagrave Hasan năm 1997) Theo một nghiecircn cứu tiến hagravenh tại Mỹ ở hơn 300 cocircng ty kết quả cho thấy sự khaacutec biệt của EIS giữa tư nhacircn vagrave chiacutenh phủ một số kết quả thuacute vị được phaacutet hiệnViacute dụ khoacute khăn hơn để chuyển tiền từ một tagravei khoản khaacutec trong một EIS của chiacutenh phủ cũng lagrave khoacute khăn hơn để biện giải thiacutech cho những chi phiacute phaacutet triển EIS của chiacutenh phủ Một nghiecircn cứu khaacutec được tiến hagravenh ở Australia
cho thấy rằng EIS cung cấp cho quản lyacute một higravenh ảnh chiacutenh xaacutec hơn về tổ chức thực hiện vagrave cung cấp hỗ trợ cho caacutec lợi iacutech chiến lược cải thiện khocircng chỉ cho caacutec nhagrave quản lyacute nhưng cograven cho phần cograven lại của tổ chức Dựa trecircn caacutec hệ thống được thiết kế cho caacutec cocircng ty tư nhacircn với một caacutech rotilde ragravengxaacutec định mục tiecircu EIS lagrave thiacutech hợp cho caacutec tổ chức cocircng cộng hiện đại nhưng cần phải được linh hoạt hơn vagrave kết thagravenh chugravem một phạm vi rộng hơn khả năng vagrave phương tiện hơn so với khu vực tư nhacircn ban đầu theo định hướng sản phẩm (Hasan vagrave Hasan năm 1997) Điều nagravey coacute thể lagrave do thực tế rằng caacutec hoạt động khu vực cocircng lagrave bắt buộc coacute taacutec động rộng phải đaacutep ứng sự mong đợi duy nhất cocircng cộng thường coacute mục tiecircu mơ hồ vagrave macircu thuẫn iacutet quyền tự chủ vagrave kiểm soaacutet việc ra quyết định vagrave nhacircn viecircn lagrave khoacute khăn hơn (Watson vagrave Carte2000) + Toacutem lại EIS lagrave một khaacutei niệm thagravenh cocircng noacute phaacutet triển qua nhiều năm tuy nhiecircn EIS khắc phục khiếm khuyết của migravenh bằng caacutech tiến hagravenh nghiecircn cứu liecircn tục)
63 Tại sao những người điều hagravenh hagraveng đầu lại khaacutec nhau- Họ lagrave những doanh nghiệp theo định hướng coacute suy nghĩ
- Coacute một khoảng khocircng gian rộng để kiểm soaacutet
- Họ chịu traacutech nhiệm cho việc thiết lập chiacutenh saacutech
- Họ đại diện cho tổ chức mocirci trường becircn ngoagravei
- Hagravenh động của họ tạo ra những kết quả đaacuteng kể về tagravei chiacutenh vagrave con người
Tần số caacutec hoạt động điều hagravenh- Xử lyacute xaacuteo trộn 42
- Hoạt động kinh doanh 32
- Phacircn bổ nguồn lực 17
- Đagravem phaacuten 3
- Những điều khaacutec 6
Handling Disturbances 42
Entrepreneurial Activites 32
Resource Allocation 17
Negotiation 3
Other 6
Những thocircng tin điều hagravenh cần thiết- Quản lyacute xaacuteo trộn coacute thể yecircu cầu sự chuacute yacute xung quanh đồng hồ
- Hoạt động kinh doanh yecircu cầu điều hagravenh để dự đoaacuten những thay đổi trong mocirci trường
- Nhiệm vụ phacircn bổ tagravei nguyecircn yecircu cầu lựa chọn người quản lyacute vagrave caacutec nguồn lực hạn chế được triển khai
- Đagravem phaacuten yecircu cầu cập nhật thocircng tin từng phuacutet để coacute thể xacircy dựng được sự đồng thuận
Caacutec loại thocircng tin điều hagravenh- Hệ thống kế toaacuten coacute liecircn quan đến việc tiacutenh toaacuten thu nhập hoạt động cho caacutec lĩnh
vực cụ thể lagrave quan trọng hơn so với caacutec hệ thống kế toaacuten truyền thocircng- Thocircng tin về thị trường khaacutech hagraveng cung cấp giaacute trị trong việc quyết định chiến
lược- Caacutec thocircng tin cần thiết thường được truyền đi trecircn một số hệ thống maacutey tiacutenh vagrave
nằm trong toagraven tổ chức- Caacutec thocircng tin được sử dụng thường lagrave ngắn hạn vagrave dễ thay đổi
Phương thức để xaacutec định thocircng tin cần thiết
Rockart xaacutec định được năm phương thức cơ bản để xaacutec định thocircng tin cần thiết
- Phương thức dựa trecircn kết quả- Phương thức rỗng- Phương thức chỉ số khoacutea- Phương thức tổng hợp nghiecircn cứu- Phương thức dựa vagraveo nhacircn tố then chốt dẫn đến thagravenh cocircng
64 Thagravenh phần EIS
- Sản phẩm EIS đầu tiecircn được phaacutet triển để sử dụng trecircn maacutey tiacutenh cấu higravenh cao nhưng caacutec sản phẩm hiện nay nhằm mục tiecircu lagrave nền tảng ClientServer
- Những nền tảng linh hoạt hơn coacute thể thiacutech ứng với thay đổi trong tổ chức vagrave cocircng nghệ
- Sử dụng dữ liệu thời gian thực dẫn đến quyết định nhanh hơn nhiều thocircng tin hơn
Thagravenh phần phần cứng- Một EIS khocircng đogravei hỏi coacute phần cứng cụ thể hoặc duy nhất nagraveo- Chigravea khoacutea của vấn đề lagrave để đảm bảo rằng caacutec thagravenh phần của EIS tối ưu hoacutea vagrave
phugrave hợp với tagravei nguyecircn maacutey tiacutenh của tổ chức- Hệ thống nagravey phải được cấu higravenh để caacutec nguồn tagravei nguyecircn phugrave hợp với những
người điều hagravenh chuacuteng
Thagravenh phần phần mềm- Traacutei ngược với phần cứng phần mềm thường được chuyecircn mocircn hoacutea cao cho caacutec
bagravei toaacuten về miền- Sự chuyecircn mocircn hoacutea nagravey thường đạt được bằng caacutech sử dụng thagravenh phần off-the-
shelf cho toagraven bộ EIS vagrave caacutec mocirc-đun tugravey chỉnh để đaacutep ứng nhu cầu cụ thể- Lotus Notes lagrave một viacute dụ điển higravenh Noacute coacute thể được sử dụng một migravenh hoặc coacute
thể phục vụ becircn thứ ba mocirc-đun plug-in
Cocircng nghệ EIS hiện nay
Dobrzeniecki đề xuấtphacircn loạitừng cấptheo bachức năng- Loại 1 sản phẩm bao gồmmột bộ đầy đủcaacutec ứng dụngtừ mộtnhagrave cung cấp- Loại 2 sản phẩm đượcthựchiệnở phần đầu củacaacutecsản phẩmDSS đượcphaacutet triển
bởicugravengmộtnhagrave cung cấp- Loại 3 sản phẩmkết hợp với nhautheo bất kỳ số lượngthuộc sở hữu củacocircng ty
65 Xacircy dựng EIS
- Xacircy dựngmộtEISgiống nhưxacircydựngmột số hệ thống khaacutec củamocirc higravenh hệ thống thocircng tin
- Việcphaacutet triểncấu truacutecnecircn được theo dotildeitừ quaacute trigravenh thiết kế đến quaacute trigravenhthực hiện
- Tuy nhiecircn một dự aacuten phaacutet triển EIScoacute xu hướnglagrave thống nhấtvagraveyecircu cầu hỗ trợ caacutec nhagrave quản lyacute latildenh đạo
- Xacircy dựng một EIScoacute thểphaacutet hiện ra đượccaacutectigravenh huống khoacute khănmagravemột nhagrave phaacutet triển chưabao giờ gặp phải
Mocirc higravenh EIS
Khung phaacutet triển một EIS
- Watson et al đề nghị xacircy dựngkhung với ba thagravenh phần+ Caacutech tiếp cận tập trung vagraveo yếu tốcon người vagrave dữ liệu coacute liecircn quan đến EIS+ Quaacute trigravenh phaacutet triển cần sự linh hoạt vagrave tương taacutec+ Người sử dụng - hệ thống hộp thoại bao gồm một ngocircn ngữ hagravenh động để xử lyacute caacutec lệnh
Lợi iacutech của EIS- Dễ duy trigrave caacutec mục tiecircu coacute tổ chức- Dễ truy xuất thocircng tin- Cho pheacutep người sử dụng nacircng cao hiệu suất hơn
- Tăng chất lượng ra quyết định- Cung cấp sự cải tiến cạnh tranh- Tiết kiệm thời gian của người sử dụng- Tăng khả năng vagrave chất lượng giao tiếp- Cung cấp khả năng điều khiển tốt hơn trong tổ chức- Cho pheacutep tham gia caacutec vấn đề vagrave caacutec cơ hội- Cho pheacutep hoạch định- Cho pheacutep tigravem kiếm nguyecircn nhacircn của một vấn đề- Thảo matilden caacutec yecircu cầu của người điều hagravenh
Hạn chế của EIS vagrave 1 số sai lầm cần traacutenh
- Chi phiacute một cuộc khảo saacutetnăm1991 chothấychi phiacute phaacutet triểntrungbigravenh365000USDvớichi phiacute vận hagravenhhagraveng năm lagrave$200000 (EIS)
- Cocircng nghệ hạn chếEIScần phảiđượctiacutech hợp hoagraven toagravenvagraveokiếntruacuteccủadoanh nghiệphiện tại do đoacute noacutelagrave một thaacutech thứclớn đối vớithiết kế
- Hạn chế tổ chức cơ cấu tổ chứccoacute thể khocircng phugrave hợp
Sự hạn chế về tổ chức- Chương trigravenh nghị sự vagrave thời gian chệch EIS mocirc tả một phần việc thực hiện một
chương trigravenh nghị sự vagrave coacute thể dễ dagraveng đạt được sự tin cậy một caacutech chắc chắn- Đồng bộ hoacutea việc quản lyacute sự tin cậy đuacuteng luacutec đặc biệt baacuteo caacuteo EIS coacute thể phaacute
vỡ sự ổn định thiết lập caacutec chu trigravenh baacuteo caacuteo một caacutech tốt nhất- Sự bất ổn EIS phản ứng nhanh coacute thể gacircy ra việc taacutec động trở lại một caacutech
nhanh choacuteng dẫn đến sự thiếu ổn định trong tổ chức
Sự thất bại lagrave thay thế khocircng thể chấp nhận được- Một số yếu tố lagravem EIS thất bại
+ Thiếu sự hỗ trợ về mặt quản lyacute+ Vấn đề chiacutenh trị+ Thất bại của nhagrave phaacutet triển+ Lỗi về cocircng nghệ+ Giaacute cả+ Thời gian
66 Ra quyết định điều hagravenh trong tương lai vagrave EIS
- Coacute một vagravei điều kiện sẽ được hợp nhất cho việc chuyển đổi cocircng nghệ Trong đoacute một vagravei điều kiện coacute thể dễ dự đoaacuten Hai điều kiện magrave ta coacute thể thấy lagrave+ Phaacutet triển cocircng nghệ maacutey tiacutenh trong việc điều hagravenh sẽ tạo ra sự chuyển đổi được chấp nhận một caacutech dễ dagraveng hơn+ Mở rộng traacutech nhiệm điều hagravenh sẽ mở rộng nhu cầu thocircng tin
Tương lai của EIS- EIS thocircng minh Những tiến bộ trong cocircng nghệ AI sẽ được triển khai trong caacutec
EIS- EIS đa phương tiện Cơ sở dữ liệu đa phương tiện sẽ cho pheacutep tiacutech hợp văn bản
giọng noacutei vagrave higravenh ảnh trong tương lai- EIS thocircng tin Tương lai EIS sẽ mở rộng hơn trong việc sử dụng dữ liệu becircn
ngoagravei doanh nghiệp- EIS kết nối Giao tiếp với băng thocircng rộng cho pheacutep kết nối liecircn thocircng lớn hơn
Chương 7 HỆ CHUYEcircN GIA VAgrave TRIacute TUỆ NHAcircN TẠO
71 Caacutec khaacutei niệm
72 Triacute thocircng minh của triacute tuệ nhacircn tạo
73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia
74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia
75 Lợi iacutech vagrave hạn chế của hệ chuyecircn gia
71 Caacutec khaacutei niệm
Chuyecircn mocircn (Expertise) sự hiểu biết rộng trong 1 lĩnh vực hẹp
Hệ chuyecircn gia (Expert Systems)1 chương trigravenh maacutey tiacutenh sử dụng 1 tập caacutec luật dựa trecircn tri thức của con người để giải quyết caacutec vấn đề đogravei hogravei phải coacute sự chuyecircn mocircn
Một số hệ chuyecircn gia nổi tiếng
DENDRAL (Standford 1960s Edward Feigenbaum)
MYCIN (Standford1970s Edward Shortliffe)
PROSPECTOR (MIT 1979)
Triacute tuệ nhacircn tạo (Artificial Intelligence ndash AI)
Triacute tuệ nhacircn tạo một bộ phacircn của ngagravenh khoa học maacutey tiacutenh quan tacircm đến việc thiết kế caacutec hệ thống maacutey tiacutenh thocircng minh đoacute lagrave caacutec hệ thống đưa ra caacutec đặc điểm magrave từ đoacute chuacuteng ta liecircn hệ với sự thocircng minh trong hagravenh động của con người (Barr vagrave Feigenbaum 1981)
Mục điacutech của AI
Mục điacutech khoa học xaacutec định caacutec gợi yacute để giải thiacutech caacutec loại khaacutec nhau của triacute tuệ thực
Mục điacutech kỹ thuật giải quyết caacutec vấn đề trong thế giới thực
Triacute tuệ nhacircn tạo kế thừa nhiều yacute tưởng quan điểm kỹ thuật từ caacutec ngagravenh khoa học khaacutec
- Triết học
- Logic Toaacuten học
- Tiacutenh toaacuten
- Khoa học tacircm lyacute Khoa học nhận thức
- Sinh học Thần kinh học
- Tiến hoacutea
Caacutec lĩnh vực ứng dụng trong Triacute tuệ nhacircn tạo
Mạng nơ ron thần kinh (Neural Networks)
Tiacutenh toaacuten sự tiến hoacutea
(Evolutionary Computation)
Hệ chuyecircn gia (Expert Systems)
Kỹ thuật xử lyacute tiếng noacutei (Speech Processing)
Kỹ thuật xử lyacute ngocircn ngữ tự nhiecircn
(Natural Language Processing)
Lập kế hoạch (Planning)
Robot (Robotics)
Khoa học higravenh ảnh (Vision)
Caacutec kỹ thuật thocircng dụng dugraveng trong AI
Biểu diễn(Representation)
Học (Learning)
Caacutec luật (Rules)
Tigravem kiếm (Search)
72 Triacute thocircng minh của triacute tuệ nhacircn tạo
Con người suy diễn như thế nagraveo
Phacircn loại (Categorization)
Caacutec quy tắc cụ thể
Heuristics
Kinh nghiệm trước đoacute
Dự tiacutenh trước
Maacutey tiacutenh suy diễn như thế nagraveo
Lập luận dựa trecircn luật IF-THEN mocirc tả tri thức được matilde hoacutea dưới dạng caacutec luật
Caacutec khung (Frames) lagrave caacutec đại diện mocirc tả caacutec tigravenh huống giống nhau lagrave điển higravenh của một vagravei phacircn loại
Lập luận dựa trecircn caacutec trường hợp mocirc phỏng giải phaacutep trước đoacute cho một vấn đề hiện tại
Nhận dạng mẫu phaacutet hiện acircm thanh higravenh dạng hoặc caacutec chuỗi dagravei
Caacutec dạng khaacutec của Triacute tuệ nhacircn tạo
Học maacutey- mạng nơron vagrave giải thuật di truyền
Lập trigravenh tự động ndash lagrave những kỹ thuật tạo ra caacutec chương trigravenh để lagravem 1 nhiệm vụ riecircng biệt (cho pheacutep những người khocircng phải lagrave người lập trigravenh coacute thể lập trigravenh được)
Cuộc sống nhacircn tạo ndash nỗ lực để taacutei tạo caacutec hiện tượng sinh học trong caacutec hệ thống dựa trecircn maacutey tiacutenh
73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia(Expert Systems- ES)
Theo Jackson (1999) Một hệ chuyecircn gia lagrave một chương trigravenh maacutey tiacutenh mocirc tả vagrave suy diễn với tri thức của một vagravei lĩnh vực để giải quyết vấn đề hay đưa ra caacutec lời khuyecircn
Cấu truacutec cơ bản của ES được dựa theo cấu truacutec chung của DSS Sự khaacutec biệt chiacutenh giữa ES vagraveDSS lagrave hệ ES thu thập caacutec kiến thức từ những
chuyecircn gia trong lĩnh vực quan tacircmĐặc trưng của hệ chuyecircn gia Hiệu quả cao Thời gian trả lời thỏa đaacuteng Độ tin cậy cao Dễ hiểu
Giao diện người dugraveng trong ES
Thiết kế giao diện người dugraveng tập trung vagraveo caacutec yếu tố như dễ dagraveng sử dụngcoacute độ tin cậy cao giảm tải những khoacute khăn khi sử dụng
Thiết kế necircn coacute một số tương taacutec (đầu vagraveo kiểm soaacutet vagrave truy vấn)
Cấu tạo giao diện người dugraveng gồm coacute magraven higravenh cảm ứng bagraven phiacutem buacutet saacuteng lệnh thoại caacutec phiacutem chuyecircn dụng
Cơ sở tri thức (Knowledge Base)
Chứa đựng caacutec tri thức cụ thể miền thu được từ caacutec chuyecircn gia miền
Coacute thể chứa caacutec mocirc tả caacutec hagravenh vi giải quyết vấn đề caacutec ragraveng buộc caacutec heuristics
Thagravenh cocircng của một ES dựa trecircn tiacutenh đầy đủ vagrave tiacutenh chiacutenh xaacutec của cơ sở tri thức
Mocirc tơ suy diễn (Inference Engine)
Ở đacircy tri thức được đặt để sử dụng tạo ra caacutec giải phaacutep để giải quyết vấn đề
Mocirc tơ nagravey coacute khả năng thực hiện diễn dịch hoặc suy diễn dựa trecircn caacutec luật hay caacutec caacutec sự kiện
Đồng thời cũng coacute khả năng sử dụng caacutec suy diễn mờ hay khocircng chiacutenh xaacutec dựa trecircn xaacutec suất hay aacutenh xạ mẫu
Vograveng điều khiển suy diễn
1 Aacutenh xạ caacutec luật với caacutec sự kiện đatilde được cho
2 Chọn luật để thực hiện
3 Thực hiện luật bằng caacutech thecircm caacutec sự kiện được suy diễn ra vagraveo bộ nhớ lagravem việc
Chuỗi suy diễn (Chaining)
Suy diễn tiến (forward chaining) maacutey suy diễn bắt đầu từ dữ liệu ban đầu vagrave thực hiện việc suy luận để đưa ra caacutec kết luận cuối cugraveng
Suy diễn lugravei (backward chaining) maacutey suy diễn bắt đầu từ dữ liệu điacutech vagrave tigravem ra tri thức hỗ trợ cho dữ liệu điacutech đoacute
Viacute dụ suy diễn lugravei
R1 Nếu coacute A vagrave B thigrave suy ra coacute D
R2 Nếu coacute B thigrave suy ra coacute C
R3 Nếu coacute C vagrave D thigrave suy ra coacute E
Ta coacute E ta xem trong 3 luật R1 R2 R3 luật nagraveo coacute E ta thấy R3 chứa E đồng thời chứa C vagrave D Xeacutet tiếp trong 2 luật R1 R2 luật nagraveo chứa C vagrave D R2 chứa C R3 chứa D Từ đoacute ta coacute được caacutec tri thức hỗ trợ suy diễn vagrave kết luận lagrave nếu coacute A vagrave B thigrave sẽ coacute E Hay nếu A vagrave B đuacuteng thigrave sẽ coacute E
Viacute dụ suy diễn tiến
Giả sử coacute tập chứa 3 luật sau
R1 Nếu coacute A vagrave B thigrave suy ra coacute D
R2 Nếu coacute B thigrave suy ra coacute C
R3 Nếu coacute C vagrave D thigrave suy ra coacute E
Nếu ta coacute A vagrave B thigrave chuacuteng ta suy ra được D từ R1 vagrave suy ra C từ R2 Với D vagrave C đatilde được suy ra ở trecircn giờ chuacuteng ta suy ra được E từ R3
Viacute dụ thực tế
Giả sử muốn biết magraveu của một con vật nuocirci tecircn lagrave Fred biết rằng noacute kecircu ộp ộp vagrave ăn ruồi
Coacute tập 4 luật ban đầu như sau
R1 Nếu X kecircu ộp ộp vagrave ăn ruồi thigrave X lagrave con ếch
R2 Nếu X kecircu chiecircm chiếp vagrave biết hoacutet thigrave X lagrave con chim
R3 Nếu X lagrave con ếch thigrave X coacute magraveu xanh
R4 Nếu X lagrave con chim thigrave X coacute magraveu vagraveng
74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia
Expert system shells lagrave một tập caacutec goacutei phần mềm vagrave caacutec cocircng cụ dugraveng để phaacutet triển caacutec hệ chuyecircn gia
Những Expert system shells đầu tiecircn thường rất rườm ragrave Mặc dugrave vậy noacute vẫn giuacutep cho người sử dụng sẽ khocircng phải bắt đầu lại từ đầu khi xacircy dựng một hệ chuyecircn gia mới
Những shell hiện đại bao gồm hai mocirc-đun chiacutenh lagrave cocircng cụ xacircy dựng một tập quy tắc vagrave mocirc tơ suy diễn
Xacircy dựng hệ chuyecircn gia
Bước 1 xacircy dựng mocirc higravenh bagravei toaacuten xaacutec định vấn đề nhiệm vụ magrave hệ thống sẽ thực hiện Caacutec dạng bagravei toaacuten cần hệ chuyecircn gia
Bagravei toaacuten diễn giải (InterPretation)
Bagravei toaacuten dự baacuteo (Prediction)
Bagravei toaacuten chuẩn đoaacuten (Diagnose)
Bagravei toaacuten gỡ rối (Debugging)
Bagravei toaacuten thiết kế
Tương tự như một dự aacuten phần mềm để xacircy dựng một hệ chuyecircn gia cần phải coacute caacutec yếu tố về nhacircn lực tagravei nguyecircn vagrave thời gian Những yếu tố nagravey ảnh hưởng đến giaacute thah của một hệ chuyecircn giaTrong phần nagravey cacircu hỏi thường được đặt ra lagrave tại sao cần phải xacircy dựng một hệ chuyecircn giaTrước khi bắt đầu phải xaacute định rotilde bagravei toaacuten đạt ra lagrave jiAi lagrave chuyecircn giaAi lagrave người sử dụng
1 Diễn giải (InterPretation) Nghiecircn cứu 1 vấn đề -gt Dựa trecircn những biểu hiện thuộc tiacutenh đặc trưng becircn ngoagravei -gt Tư vấn
(hoặc đưa ra kết luận hay mocirc tả dễ hiểu từ tập dữ liệu thocirc)
2 Bagravei toaacuten dự baacuteo (Prediction) Coacute thể dự đoaacuten được hagravenh vi kết quả dựa trecircn caacutec hiện tượng -gt dự baacuteo
VD Dự baacuteo thời tiết động đấthellip
3 Bagravei toaacuten chẩn đoaacuten (Diagnoss) Xaacutec định caacutec lỗi caacutec bộ phận hỏng hoacutec của hệ thống dựa trecircn caacutec dữ liệu quan saacutet được
4 Bagravei toaacuten gỡ rối (Debugging) Mocirc tả caacutec phương phaacutep khắc phục hệ thống khi gặp sự cố
5 Bagravei toaacuten thiết kế Lựa chọn cấu higravenh caacutec đối tượng nhằm thoả matilden một số ragraveng buộc nagraveo đoacute
6 Giảng dạy Phần mềm dạy học coacute thể chuẩn đoaacuten vagrave sủa lỗi của học sinh trong quaacute trigravenh học tập
Để xaacutec định đuacuteng bagravei toaacuten magrave chuacuteng ta cần giải quyết thigrave phải trả lời đc một số cacircu hỏi
- cần hệ chuyecircn gia
Bước 2 thu thập tri thức lựa chọn cocircng cụ vagrave aacutep dụng
Trong bước thu thập tri thức vấn đề quan trọng lagrave lựa chọn chuyecircn gia những người magrave sẽ đoacuteng goacutep tri thức cho hệ thống Thocircng thường trong suốt quaacute trigravenh phaacutet triển thigrave chuyecircn gia được xem như một thagravenh viecircn của đội phaacutet triển
Hiện nay coacute rất nhiều cocircng cụ để xacircy dựng một hệ chuyecircn gia Phổ biến nhất lagrave JESS CLIPS vagrave OPS5
Bước 3 Thiết kế cơ sở tri thức thiết kế hệ thốngTri thức được biểu diễn trường minh trong cơ sở tri thức
Caacutec chuyecircn gia vagrave kỹ sư tri thức sẽ đối thoại với nhau bằng caacutec kỹ thuật đối thoại Suy diễn (SD) bảng Mocirc higravenh hoacutea SD quy nạp phacircn loại
Vấn đề bagraveo trigrave vagrave phaacutet triển
Caacutec hệ chuyecircn gia đogravei hỏi phải bảo trigrave vagrave phaacutet triển nhiều hơn so với caacutec hệ thống khaacutec Phải thường xuyecircn bổ sung tri thức mới vagrave thay đổi caacutec tri thức cũ để đổi mới hệ chuyecircn gia
Thu thập vagrave khắc phục lỗi do người sử dụng phaacutet hiện để kịp thời khắc phục những sai soacutet của hệ chuyecircn gia
75 Lợi iacutech vagrave hạn chế của caacutec hệ chuyecircn gia
Một số lợi iacutech chiacutenh
Thời gian trả lời hợp lyacute bằng hoặc nhanh hơn so với chuyecircn gia (người) để đi đến cugraveng một quyết định Hệ chuyecircn gia lagrave một hệ thống thời gian thực (real time system)
Khả năng trả lời với mức độ tinh thocircng bằng hoặc cao hơn so với chuyecircn gia (người) trong cugraveng lĩnh vực
Hệ chuyecircn gia giuacutep cho hiệu quả lagravem việc tăng bằng việc sử dụng tập caacutec luật một caacutech nhanh choacuteng magrave ko bị nhầm lẫn chuyecircn gia lagrave người coacute thể quecircn đi một số tri thức cơ sở lyacute luậ nhưng HCG thigrave ko
Quyết định của một người chuyecircn gia coacute thể bị thay đổi vagrave ko coacute tiacutenh thống nhất như quyết định của một hệ chuyecircn gia tạo ra
Hệ chuyecircn gia giuacutep cho người sử dụng coacute thể trau dồi sự hiểu biết trecircn lĩnh vuej cụ thể magrave noacute giải quyết hỗ trợ người ra quyết định coacute trigravenh độ như 1 chuyecircn gia trong quaacute trigravenh gia quyết định
Kiến thức của rất nhiều chuyecircn gia về một lĩnh vực nagraveo đoacute được đưa vagraveo hệ chuyecircn gia lagravem cho CSTT cuat HCG phong phuacute vagrave rộng lớn hơn rất nhiều
HCG giải thiacutech caacutec bước suy luận một caacutech dễ hiểu nhất quaacuten luacutec nagraveo cũng coacute thể sử dụng ko như chuyecircn gia con người
Hạn chế của caacutec hệ chuyecircn gia
Nhược điểm lớn nhất của hệ chuyecircn gia lagrave những yacute kiến chuyecircn mocircn thường rất khoacute matilde hoacutea vagrave giải neacuten
Hệ chuyecircn gia khocircng coacute khả năng tự học tự cập nhật kiến thức mới như caacutec chuyecircn gia magrave cần phải được matilde hoacutea lại khi noacute được cập nhật
Hệ chuyecircn gia khocircng thể nhận ra được vấn đề khocircng nằm trong miền kiến thức của hệ thống
Chương 8 Tri thức vagrave tiếp nhận
1 Bao gồm caacutec vấn đề
Dữ liệu thực tế đo lường hoặc quan saacutet coacute hoặc khocircng coacute bối cảnh
Thocircng tin dữ liệu được tổng hợp một caacutech hữu iacutech để giải quyết những khoacute khăn trong việc đưa ra quyết định
Tri thức bao gồm caacutec ứng dụng quy tắc thocircng tin hướng dẫn của người ra quyết định
2 Những caacutei nhigraven về tri thức
Đại diện lagravem thế nagraveo để diễn tả tri thức viacute dụ như một quyển saacutech khocircng phải lagrave tri thức nhưng noacute lại lagrave một đại diện của tri thức
Sản xuất tri thức lagrave một tập hơp của hagraveng tồn kho coacute thể được sản xuất cũng như mua lại
Tri thức lagrave 1 trong 6 trạng thaacutei của hệ thống
1Dữ liệu 2Thocircng tin 3Cấu truacutec thocircng tin 4Sự thấu hiểu 5Yacute kiến 6 Quyết định
3 Caacutec loại tri thức Phổ biến mocirc tả dữ liệu thocircng tin thủ tục mọi thứ lagravem như thế nagraveo lập luận chiacutenh saacutech hoặc caacutec quy tắc
4 Thu thập Tri thức hệ chuyecircn gia Hầu hết caacutec phương phaacutep đều bắt đầu với mocirc higravenh của caacutec taacutec vụ trong đoacute
hệ chuyecircn gia được xacircy dựng Trong đoacute mocirc tả về caacutec lĩnh vực được tạo ra Caacutec kỹ sư sử dụng caacutec mocirc higravenh giả thuyết vagrave nhận thức về quaacute trigravenh phacircn
tiacutech để gợi ra caacutech giải quyết vấn đề về tri thức từ caacutec chuyecircn gia
5 Caacutec chiều của thu thập tri thức KE- driven caacutec kỹ sư trao đổi trực tiếp với caacutec chuyecircn gia Expert-driven Caacutec chuyecircn gia trực tiếp đưa chuyecircn mocircn của họ vagraveo hệ
thống maacutey tiacutenh Machine-driven Sử dụng caacutec cocircng cụ suy luận để triacutech xuất tri thức từ một
tập caacutec viacute dụ
6 Kỹ thuật thu thập tri thức Trao đổi gồm 2 loại cơ bản lagrave coacute cấu truacutec(coacute kịch bản) vagrave khocircng coacute cấu
truacutec( đối thoại trực tiếp) Giao thức phacircn tiacutech bằng lời Khi caacutec chuyecircn gia thực hiện một cocircng việc
của họ thigrave một bản ghi về cocircng việc đoacute được thực hiện Caacutec kỹ sư sẽ xacircy dựng mocirc higravenh cho những gigrave được ghi lại trong bản ghi
Phương phaacutep sagraveng lọc caacutec chuyecircn gia so saacutenh caacutec nhoacutem liecircn tiếp trong ba đối tượng vagrave cho biết tại sao nhoacutem thứ hai lại khaacutec nhoacutem thứ ba
7 Thu thập tri thức từ nhiều nguồn Thu thập tri thức từ nhiều nguồn lagrave cần thiết để coacute được đầy đủ caacutec tri thức
cho một vấn đề quan điểm yacute kiến traacutei ngược nhau thường phaacutet sinh Phương phaacutep đồng thuận sẽ giuacutep giải quyết được vấn đề macircu thuẫn Kỹ thuật phacircn tiacutech Meta lagrave kỹ thuật được aacutep dụng trong caacutec trường hợp
khaacutec Caacutech tiếp cận bằng định lượng đogravei hỏi caacutec kỹ sư cần cacircn nhắc yếu tố đầu vagraveo của caacutec chuyecircn gia khaacutec nhau
8 Xaacutec nhận hợp lệ vagrave kiểm tra tri thức Một khi thu thập tri thức noacute phải được đaacutenh giaacute về khả năng sử dụng vagrave độ
chiacutenh xaacutec Hai vấn đề cụ thể lagrave hiệu lực của những kiến thức vagrave kiểm tra việc xacircy dựng cơ sở của tri thức
Cần xaacutec nhận xem liệu hệ thống coacute thể hoạt động ở mức độ tối thiểu khocircng
Xaacutec minh liecircn quan đến việc so saacutenh từng chi tiết kỹ thuật của hệ thống những gigrave đatilde được thực hiện cuối cugraveng
9 Một số caacutec biện phaacutep xaacutec nhận Độ chiacutenh xaacutec Khả năng thiacutech nghi Mức độ đầy đủ Bề rộng Độ sacircu Hiệu lực Tổng quan Chiacutenh xaacutec Hiện thực Độ tin cậy Tiacutenh hữu dụng Mức độ
Chương 9 Học maacutey
1 Logic mờ vagrave ngocircn ngữ mờ(Fuzzy Logic and Linguistic Ambiguity)
Ngocircn ngữ tự nhiecircn gồm những khaacutei niệm mơ hồ vagrave khocircng chiacutenh xaacutectruyền tải ngữ nghĩa thocircng qua tiacutenh xấp xỉkhocircng rotilde ragraveng
Những xấp xỉ nagravey giuacutep con người coacute thể truyền tải hết được yacute nghĩa nhưng maacutey thigrave khocircng hiểu
Lagravem sao biểu diễn caacutec tri thức sử dụng caacutec khaacutei niệm khocircng rotilde ragraveng(mờ) hoặc khocircng chiacutenh xaacutec
2 Khaacutei niệm cơ bản của logic mờ tập mờ lagrave những tập hợp khocircng coacute một giới hạn rotilde Mỗi phần tử của noacute chỉ
chứa một mức độ hagravem liecircn thuộc của từng phần tử Vigrave vậy tập mờ khocircng giống như tập cổ điển Tập mờ coacute thể kết hợp với nhau qua những luật mờ magrave đặc trưng cho những hagravenh động trạng thaacutei vagrave thuộc tiacutenh của logic mờ được tận dụng khi thực hiện một bộ điều khiển mờ
Logic mờ dựa trecircn yacute tưởng mỗi phần tử thuộc vagraveo một tập hợp ở một mức độ nagraveo đấy
Locircgic mờ cho pheacutep độ liecircn thuộc (microA )coacute giaacute trị trong khoảng (01) Locircgic mờ coacute thể được coi lagrave mặt ứng dụng của lyacute thuyết tập mờ để xử lyacute caacutec
giaacute trị trong thế giới thực cho caacutec bagravei toaacuten phức tạp
3 So saacutenh tiacutenh đuacuteng đắn logic mờ vagrave xaacutec suất Xaacutec suất thigrave đề cập đến khả năng xảy ra một biến cố hay một điều gigrave đoacute Logic mờ đề cập đến cấp độ magrave đặc tiacutenh ở hiện tại
o viacute dụ1 người coacute chiều cao 6 feet thigrave coacute cấp độ lagrave 05 về chiều cao
4 Ưu điểm của logic mờ Caacutech tiếp cận rất tự nhiecircnkhocircng phức tạp Coacute thể mocirc higravenh hoacutea caacutec hagravem phi tuyến tugravey yacute phức tạp
Coacute thể tận dụng được kinh nghiệm từ những chuyecircn gia hagraveng đầu trong mọi lĩnh vực
Logic mờ được xacircy dựng dựa trecircn ngocircn ngữ tự nhiecircnNền tảng của logic mờ lagrave dựa trecircn cơ sở giao tiếp của con người
5 Nhược điểm của logic mờ Trong 1 hệ thống phức tạpsử dụng logic mờ coacute thể trở thagravenh trở ngại cho
việc xaacutec thực độ tin cậy của hệ thống Cơ chế lập luận mờ khocircng thể học hỏi từ những lỗi sai
6 Mạng noron nhacircn tạo(ANN) Mạng noron nhacircn tạo lagrave một mocirc phỏng xử lyacute thocircng tinđược nghiecircn cứu ra
từ hệ thống thần kinh của sinh vậtgiống như bộ natildeo để xử lyacute thocircng tin ANNs lagrave chương trigravenh dựa trecircn maacutey tiacutenh đơn giản coacute chức năng lagrave một mocirc
higravenh bagravei toaacuten khocircng gian dựa trecircn thử nghiệm vagrave baacuteo lỗi
7 Học từ kinh nghiệm Tiến trigravenh Một mẫu dữ liệu được biểu diễn như một mạng lưới noronANN ldquodự
đoaacutenrdquo 1 đầu radự đoaacuten được so saacutenh với giaacute trị thực tế hoặc giaacute trị chiacutenh xaacutecNếu đoaacuten được chiacutenh xaacutec thigrave khocircng coacute hagravenh động nagraveo được thực hiện
Nếu dự đoaacuten sai ANN kiểm tra lại vagrave xaacutec định lại thocircng số để điều chỉnh Một mẫu dữ liệu khaacutec được biểu diễn vagrave quaacute trigravenh nagravey được lặp lại
8 Nguyecircn tắc cơ bản của cocircng nghệ nơron Caacutec yếu tố xử lyacute cơ bản trong hệ thống thần kinh của con người lagrave tế bagraveo
thần kinhMạng lưới của tế bagraveo nagravey lagrave liecircn kết với nhau nhận được thocircng tin từ caacutec cảm biến trong mắt taihellip
Thocircng tin nhận được bởi tế bagraveo thần kinh hoặc lagrave sẽ kiacutech thiacutech noacute(sẽ được chuyển qua 1 thocircng điệp dọc theo mạng lưới) hoặc lagrave sẽ ngăn cản noacute(ngăn cản dograveng thocircng tin)
Độ nhạy coacute thể thay đổi qua thời gian hoặc sau khi coacute được kinh nghiệm
9 Cấu truacutec mạng Một ANN gồm 3 lớp cơ bản
Lớp đầu vagraveo nhận dữ liệu Lớp becircn trong hoặc lagrave lớp ẩn xử lyacute dữ liệu Lớp đầu ra chuyển tiếp kết quả cuối cugraveng của mạng
10Mạng nơ ron Thường coacute nhiều đầu vagraveo mỗi đầu vagraveo với mức ảnh hưởng vagrave tầm quan
trọng riecircng của noacute Một đầu vagraveo quan trọng coacute thể được sử dụng để khuếch đại đầu ra caacutec hagravem trạng thaacutei tổng hợp caacutec trọng số của caacutec yếu tố
đầuvagraveo khaacutec nhauvagraveo một giaacute trị duy nhất Caacutec hagravem chuyển giao xử lyacute caacutec giaacute trị trạng thaacutei vagrave tạo đầu ra
11Huấn luyện mạng nơ ron Trong mocirc higravenh coacute giaacutem saacutetANN được đến so saacutenh dự đoaacuten của chiacutenh
noacute với thocircng tin phản hồi coacute chứa caacutec kết quả mong muốn ANN sẽ phải tigravem caacutech thay đổi caacutec tham số becircn trong củamigravenh (caacutec trọng số vagrave caacutec ngưỡng) để tạo necircn một aacutenh xạ coacute khả năng aacutenh xạcaacutec đầu vagraveo thagravenh caacutec đầu ra mong muốn Sự thay đổi nagravey được tiến hagravenh nhờ việc so saacutenh giữa đầu ra thực sự vagrave đầu ra mong muốn
Trong mocirc higravenh khocircng coacute giaacutem saacutetANN nhận được dữ liệu vagraveo nhưng khocircng phải coacute bất kỳ thocircng tin phản hồi về kết quả mong muốn
Phần lớn caacutec ứng dụng nằm trong vugraveng của caacutec bagravei toaacuten ước lượng như mocirc higravenh hoacuteathống kecirc neacuten lọc phacircn cụm
12Lợi iacutech Liecircn kết với mạng noron Traacutenh caacutech lập trigravenh tường minh Giảm nhu cầu của chuyecircn gia ANNs thigrave thiacutech nghi với caacutec yếu tố đầu vagraveo thay đổi Khocircng cần thiết cho cơ sở tri thức tinh chế ANNs coacute tiacutenh động vagrave cải thiện với việc sử dụng Coacute khả năng xử lyacute dữ liệu khocircng chiacutenh xaacutec hoặc khocircng đầy đủ Cho pheacutep tổng quaacutet hoacutea từ thocircng tin cụ thể Cho pheacutep thu thập cảm giaacutec thocircng thường vagraveo miền giải quyết vấn đề
13Hạn chế của việc liecircn kết với mạng noron ANNs khocircng thể giải thiacutech được suy luận Bản chất hộp đen thường khiến cho vấn đề traacutech nhiệm vagrave độ tin cậy phaacutet
sinh lagrave khoacute khăn Lặp đi lặp lại quaacute trigravenh huấn luyện rất tốn thời gian Nguồn lực caacutec nhagrave phacircn tiacutech vagrave thiết kế coacute tay nghề cao vẫn lagrave đaacuteng lo
ngại Cocircng nghệ ANN thuacutec đẩy hạn chế của phần cứng hiện tại ANN yecircu cầu phải coacute sự tin tưởng ở đầu ra
14Giới thiệu về thuật toaacuten di truyền Cũng như mạng lưới thần kinh caacutec thuật toaacuten di truyền được dựa trecircn lyacute
thuyết sinh học Thuật toaacuten di truyền tigravem thấy nguồn gốc của chuacuteng trong caacutec lyacute thuyết
tiến hoacutea của chọn lọc tự nhiecircn vagrave thiacutech ứng với biến đổi khiacute hậu Kết quả thuật toaacuten di truyền lagrave từ giao phối 2 caacute thể trong quần thế để tạo
ra con caacutei đocirci khi tốt hơn so với bậc cha mẹ của chuacuteng 15Caacutec thagravenh phần cơ bản của thuật toaacuten di truyền
Toaacuten tử chọn lọc Caacutec caacute thể tốt được chọn lọc để đưa vagraveo thế hệ sau Sự chọn lọc nagravey căn cứ vagraveo độ thiacutech nghi với mocirci trường của mỗi caacute thể
Toaacuten tử lai gheacutep (crossover) Hai caacute thể cha vagrave mẹ trao đổi caacutec gen với nhau để tạo ra caacute thể con
Toaacuten tử đột biến (mutation) Một caacute thể thay đổi một số gen để biến đổi thagravenh một caacute thể mớiTất cả caacutec toaacuten tử trecircn khi thực hiện đều mang tiacutenh ngẫu nhiecircn
16Quaacute trigravenh cơ bản của một thuật toaacuten di truyền Khởi tạo
Đaacutenh giaacute quần thể
Lựa chọn NST thiacutech hợp nhất vagrave loại bỏ NST yếu nhất
Quy trigravenh giao nhau vagrave cải thiện quần thể
đột biến tiến trigravenh để khaacutem phaacute ra NST mới
17Ưu nhược điểm của việc kết hợp với thuật toaacuten di truyền Kiacutech thước quần thể lagrave 1 yếu tố quan trọng trong tốc độ của việc tigravem
kiếmnhưng noacute tương đối dễ dagraveng để dự đoaacuten tốc độ nagravey Giao nhau hoặc đột biến lagrave khocircng necircn đc sử dụng quaacute thường xuyecircn Luocircn coacute được iacutet nhất 1 giải phaacutep hợp lyacute Necircn coacute thể aacutep dụng chuacuteng cho caacutec vấn đề magrave chuacuteng ta khocircng coacute hướng
về caacutech giải quyết Sức mạnh của thuật toaacuten xuất phaacutet từ khaacutei niệm đơn giảnkhocircng phải từ
một thủ tục thuật toaacuten phức tạp 18Tương lai của học maacutey
Mạng lưới thần kinh nhacircn tạo vượt quaacute năng lực của con người trong caacutec trường hợp bị cocirc lập
Về mặt lyacute thuyếtmột maacutey tiacutenh coacute thể xử lyacute dũ liệu nhanh hơn hagraveng triệu lần so với 1 con người
May mắn thay cho chuacuteng tacon người tốt hơn nhiều khi magrave coacute được dữ liệumaacutey tiacutenh khocircng coacute 1 số thứ như lagrave 5 giaacutec quan
CHƯƠNG 10 KHO DỮ LIỆU
1 Kho dữ liệu Kho dữ liệu lagrave tuyển tập caacutec cơ sở dữ liệu tiacutech hợp hướng chủ đề được
thiết kế để trợ giuacutep cho một hệ hỗ trợ quyết định
Theo John Ladley Cocircng nghệ kho dữ liệu lagrave tập caacutec phương phaacutep kỹ thuật vagrave caacutec cocircng cụ coacute thể kết hợp hỗ trợ nhau để cung cấp thocircng tin cho người sử dụng trecircn cơ sở tiacutech hợp từ nhiều nguồn dữ liệu nhiều mocirci trường khaacutec nhau
Kho dữ liệu thường rất lớn tới hagraveng trăm GB hay thậm chiacute hagraveng Terabyte
2 Kho dữ liệu vận hagravenh (ODS) Một kho dữ liệu vận hagravenh Aacutep dụng kỹ thuật kho dữ liệu vagraveo caacutec hệ xử
lyacute giao taacutec lưu trữ dữ liệu cho một ứng dụng đặc thugrave Noacute đưa vagraveo kho dữ liệu một dograveng caacutec dữ liệu thocirc được thiết kế
3 So saacutenh
Kho dữ liệu vận hagravenh Kho dữ liệu
Dữ liệu theo chủ đề Dữ liệu theo chủ đề
Dữ liệu tiacutech hợp Dữ liệu tiacutech hợp
Dữ liệu thay đổi Dữ liệu khocircng thay đổi
Dữ liệu được cập nhật khi thay đổi
Dữ liệu giữ nguyecircn
Chỉ coacute dữ liệu hiện tạiDữliệu hiện tại vagrave dữ liệu lịch sử
Chu kỳ lagravem tươi dữ liệu ngắn Chu kỳ lagravem tươi dữ liệu dagravei
Chỉ coacute dữ liệu chi tiết Dữ liệu chi tiết vagrave dữ liệu tổng kết
Dugraveng cho caacutec quyết định ngắn hạn
Dugraveng cho hoạch định dagravei hạn
4 Kho dữ liệu cục bộ (Data Mart - DM)
Kho dữ liệu cục bộ lagrave CSDL coacute những đặc điểm giống với kho dữ liệu nhưng với quy mocirc nhỏ hơn vagrave lưu trữ dữ liệu về một lĩnh vực một chuyecircn ngagravenh
Data mart phụ thuộc Chứa những dữ liệu được lấy từ DW vagrave những dữ liệu nagravey sẽ được triacutech lọc vagrave tinh chế tiacutech hợp lại ở mức cao hơn để phục vụ một chủ đề nhất định của Datamart
Data mart độc lập Khocircng giống như Datamart phụ thuộc Data mart độc lập được xacircy dựng trước DW vagrave dữ liệu được trực tiếp lấy từ caacutec nguồn khaacutec nhau
5 Siecircu dữ liệu Metadata lagrave dữ liệu để mocirc tả dữ liệu Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột
một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi Metadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu
6 Mocirci trường kho dữ liệu Hệ thống của tổ chức vagrave kho cung cấp dữ liệu để xacircy dựng kho dữ liệu Trong quaacute trigravenh chuyển dữ liệu từ caacutec nguồn khaacutec nhau dữ liệu coacute thể
được lagravem sạch hoặc chuyển đổi vagrave vigrave thế DW được xem như lagrave một chuẩn cho việc lưu trữ
Đồng thời siecircu dữ liệu được ghi lại Cuối cugraveng DW hoặc siecircu thị coacute thể được sử dụng để tạo ra một kho dữ
liệu ldquocaacute nhacircnrdquo 7 Caacutec đặc điểm của kho dữ liệu
Đặc điểm Mocirc tả
Hướng chủ đề - DL tổ chức theo caacutech thức người dugraveng tham chiếu
Tiacutech hợp - Dữ liệu ldquosạchrdquo loại bỏ tiacutenh thiếu nhất quaacuten
Khocircng thay đổi - DL ldquochỉ đọcrdquo người dugraveng khocircng thay đổi được
Chuỗi thời gian - DL lagrave chuỗi thời gian khocircng phải lagrave trạng thaacutei hiện tại
Được tổng kết - DL vận hagravenhthao taacutec khi cần thiết
được kết hợp lại thagravenh dạng coacute thể dugraveng được cho quyết định
Kiacutech cỡ lớn hơn - Lưu giữ theo chuỗi thời gian tức lagrave giữ lại nhiều DL
Khocircng được chuẩn hoacutea - Coacute thể dư thừa DLSiecircu dữ liệu - Dữ liệu của dữ liệu được lưu trữNguồn dữ liệu - DL vận hagravenh (caacutec hệ sẵn coacute) cugraveng
với caacutec nguồn ngoagravei 8 Kho dữ liệu hướng chủ đề
Hướng chủ để coacute nghĩa lagrave kho dữ liệu được tổ chức xung quanh caacutec chủ đề chiacutenh như khaacutech hagraveng sản phẩm sản xuất Tập trung vagraveo việc mocirc higravenh hoacutea vagrave phacircn tiacutech dữ liệu cho caacutec nhagrave ra quyết định magrave khocircng tập trung vagraveo caacutec xử lyacute thocircng thường Cung cấp cho người dugraveng một khung nhigraven toagraven vẹn đơn giản vagrave đầy đủ về caacutec sự kiện quanh caacutec chủ đề
9 Dữ liệu trong DW được tiacutech hợp Dữ liệu trong kho dữ liệu được xacircy dựng bằng caacutech tổng hợp dữ liệu từ
nhiều nguồn khaacutec nhau vagrave caacutec nguồn coacute tổ chức khaacutec nhau Cơ sở dữ liệu caacutec file excel caacutec flat file hoặc caacutec raw file Khi đưa vagraveo kho dữ liệu caacutec dữ liệu được lagravem sạch vagrave tiacutech hợp dữ liệu nhằm đảm bảo tiacutenh nhất quaacuten của dữ liệu
10Kiến truacutec kho dữ liệu Tầng cơ sở dữ liệu hoạt động Tầng truy xuất thocircng tin Tầng truy xuất dữ liệu Tầng siecircu dữ liệu Tầng quản lyacute tiến trigravenh Tầng thocircng điệp của ứng dụng Tầng vật liacute của kho dữ liệu Tầng trigravenh diễn dữ liệu
11Higravenh trạng kho dữ liệu Kho dữ liệu ảo - người dugraveng cuối coacute thể truy cập trực tiếp đến kho dữ liệu
sử dụng caacutec cocircng cụ cho pheacutep ở tầng truy xuất dữ liệu Kho dữ liệu trung tacircm-1 cơ sở dữ liệu vật lyacute chứa tất cả dữ liệu cho một
vugraveng chuyecircn dụng nagraveo đoacute
Kho dữ liệu phacircn taacuten- Thagravenh phần được phacircn taacuten qua nhiều hệ cơ sở dữ liệu vật lyacute
12METADATA- Siecircu dữ liệu Định nghĩa Siecircu dữ liệu lagrave dữ liệu về dữ liệu Lagrave 1 lưu trữ dugraveng để
Miecircu tả kho dữ liệu tổng thể Nhận dạng kiểu kho dữ liệu Quản liacute quaacute trigravenh tiacutech hợp dữ liệu Quản liacute quaacute trigravenh cập nhật kho dữ liệu Quản liacute bảo mật
Lagrave chigravea khoacutea quyết định sự thagravenh cocircng của kho dữ liệu luocircn được thay đổi vagrave cập nhật theo sự phaacutet triển của kho dữ liệu
Dugraveng để quản liacute điều khiển kho dữ liệu Sự ra đời của kho dữ liệu như 1 cấu truacutec hỗ trợ ra quyết định siecircu dữ liệu
được xem như nguồn tagravei nguyecircn dữ liệu Siecircu dữ liệu lagrave trừu tượng Chuacuteng lagrave dữ liệu bậc cao cung cấp mocirc tả ngắn
gọn caacutec dữ liệu bậc thấp hơn 13Hoạt động của Siecircu dữ liệu
Siecircu dữ liệu rất cần thiết trong việc chuyển hoacutea thocircng tin trở thagravenh tri thức Lagrave chigravea khoacutea giuacutep chuacuteng ta xử lyacute được dữ liệu thocirc Viacute dụ một dograveng dữ liệu baacuten hagraveng 1023 K596 11121 agraveNoacute sẽ khocircng coacute nghĩa gigrave cho đến khi chuacuteng ta đưa vagraveo siecircu dữ liệu (thư
mục chứa dữ liệu) agrave cửa hagraveng 1023 sản phẩm K596 vagrave số tiền baacuten được lagrave 11121 đocirc la
14Sự cần thiết phải nhất quaacuten trong kho dữ liệu Kho dữ liệu được xacircy dựng cho lợi iacutech của những nhagrave phacircn tiacutech kinh
doanh caacutec nhagrave quản trị cho tất cả caacutec khu vực chức năng Trong cơ sở dữ liệu riecircng caacutec khu vực khaacutec nhau coacute thể định nghĩa vagrave lưu
trữ dữ liệu thocircng qua phiecircn bản của chiacutenh noacute Khi dữ liệu được lấy từ những vugraveng khaacutec nhau đoacute vagrave được đặt vagraveo kho dữ
liệu Việc chuyển đổi vagrave lagravem sạch caacutec tiến trigravenh sẽ đảm bảo noacute lagrave duy nhất được tiacutech hợp tại một mức của tổ chức
15Ragrave soaacutet lại dữ liệu ndash Thực thi siecircu dữ liệu
Bất kể cấu truacutec tự nhiecircn của 1 cacircu truy vấn thế nagraveo thigrave caacutec thagravenh phần của siecircu dữ liệu rất quan trọng đối với người ra quyết định
Bảng thuộc tiacutenh khoacutea được lưu trữ bởi kho dữ liệu Tập hợp dữ liệu được lấy từ đacircu Những chuyển đổi nagraveo được thực thi với việc lagravem sạch
16Siecircu dữ liệu lagrave gigrave Metadata - lagrave thocircng tin mocirc tả nội dung của cơ sở dữ liệu (CSDL) Metadata baacuteo cho người dugraveng biết thời gian cập nhật sau cugraveng của dữ liệu
định dạng vagrave mục điacutech sử dụng của noacute Những thocircng tin nagravey coacute thể hướng dẫn người dugraveng duyệt qua CSDL vagrave
giuacutep họ hiểu được yacute nghĩa vagrave ngữ cảnh của dữ liệu Trong CSDL metadata lagrave caacutec dạng biểu diễn khaacutec nhau của caacutec đối tượng
trong CSDL Trong CSDL quan hệ metadata lagrave caacutec định nghĩa của bảng cột CSDL
view vagrave nhiều đối tượng khaacutec Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột
một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi -gtMetadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu
Bảng chuyển đổi Ghi lại những chuyển đổi đatilde được thực hiện
Lịch sử thực thi Ghi lại những dữ liệu đatilde được
phacircn tiacutech
Higravenh thaacutei kết nốiGhi lại những dữ liệu được kết nối vagrave tần suất
17Aacutenh xạ thocircng thường của siecircu dữ liệu Bản ghi aacutenh xạ chuyển đổi bao gồm
Định danh của nguồn gốc Chuyển đổi thuộc tiacutenh Chuyển đổi thuộc tiacutenh vật lyacute Matilde hoacutea tham chiếu bảng chuyển đổi Đổi tecircn Đổi khoacutea Gaacuten giaacute trị cho thuộc tiacutenh mặc định Chọn logic cho caacutec nguồn nhiều giaacute trị Đổi thuật toaacuten
18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để
phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai
lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave
tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec
Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm
Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo
19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua
caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau
SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được
Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra
một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức
Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ
Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ
Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech
CHƯƠNG 11 KHAI PHAacute DỮ LIỆU
1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn
ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993
Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng
2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd
1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều
2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP
3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn
4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng
5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server
6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo
7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động
8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời
9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều
10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện
11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech
12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP
3 Xử lyacute phacircn tiacutech trực tuyến OLAP
MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave
dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu
ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave
thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu
HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave
ROLAP4 Khai phaacute dữ liệu
Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh
khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn
Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan
5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp
6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại
Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp
Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec
Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt
Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra
Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh
vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho
Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec
Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm
Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục
Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng
gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp
Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn
Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec
Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper
Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2
Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25
Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước
Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng
Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện
trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp
Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute
độ hỗ trợ ge ngưỡng minsup
độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan
Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn
Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết
Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu
MOLAP ROLAP HOLAP
Lưu trữ dữ liệu cơ sở
Khối Bảng quan hệ Bảng quan hệ
Lưu trữ thocircng tin tổng hợp
Khối Bảng quan hệ Khối
Hiệu suất thực hiện truy vấn
Nhanh nhất Chậm nhất Nhanh
Tiecircu thụ khocircng gian lưu trữ
Nhiều Thấp Trung bigravenh
Chi phiacute bảo trigrave Cao Thấp Trung bigravenh
Cơ chế cấu truacutec quaacute trigravenh chi phối caacutec hoạt động truyền thocircng
Nhiệm vụ hỗ trợ cocircng việc coacute thể chọn lựa tổ chức hoặc lấy thocircng tin
Nhiệm vụ cấu truacutec cocircng việc cho pheacutep truy cập đến kỹ thuật lọc kết hợp phacircn tiacutech kiến thức liecircn quan đến cocircng việc
Caacutec lớp loại cocircng nghệ hỗ trợ MDM
Phacircn loại theo đặc điểm do DeSanctis vagrave Gallupe đưa ra đề xuất một chương trigravenh ba cấp dựa trecircn caacutec tiacutenh năng được cung cấp
Hệ thống cấp 1 Mục điacutech chiacutenh lagrave tạo điều kiện thocircng tin liecircn lạc giữa caacutec thagravenh viecircn
Hệ thống cấp 2 Thiết kế để giảm thiểu rủi ro
Hệ thống cấp 3 Giuacutep điều chỉnh xử lyacute quyết định
Phacircn loại theo cocircng nghệ -Kraemer vagrave King tập trung vagraveo cocircng nghệ aacutep dụng
Cocircng nghệ bảng mạch điện tử
Hội nghị trực tuyến
Mạng lưới tập đoagraven
Trung tacircm thocircng tin
Mocirci trường cộng taacutec
Phograveng quyết định
Nhoacutem phần mềm
Phần mềm được thiết kế để hỗ trợ sự hợp taacutec bao gồm việc thu huacutet vagrave lưu trữ thocircng tin
Caacutec tổ chức dẫn đầu thị trường hiện tại lagrave Lotus Notes and Domino Microsoft Exchange Novell GroupWise and Oracle Office
Caacutec cocircng cụ trong một bộ phần mềm bao gồm người quản lyacute hội nghị (Lotus Sametime) vagrave trao đổi thocircng điệp (Lotus Notes Mail)
Xếp hạng phần mềm cho nhoacutem
Ellis vv đề xuất một hệ thống xếp hạng dựa vagraveo kiểu sự hỗ trợ noacute Cung cấp
Hệ thocircng điệp
Hệ thống hội thảo truyền higravenh
Hệ thống cộng taacutec soạn thảo
Nhoacutem phacircn phối giải phaacutep phần mền
Hệ thống phối hợp
Hệ thống thocircng minh đại diện
Lực lượng điều khiển phaacutet triển phần mềm cho nhoacutem
Một số nhacircn tố chiacutenh bao gồm
Tăng năng suất
Giảm số lượng caacutec cuộc họp
Tăng cường tự động hoacutea caacutec quy trigravenh lagravem việc thường xuyecircn
Cần phối hợp toagraven cầu tốt hơn
Tiacutenh sẵn sagraveng của những mạng lan rộng
Coleman vagrave Khanna liệt kecirc 10 nhacircn tố khaacutec
54Quản lyacute hoạt động MDM (Mobile Device Management - Quản lyacute thiết bị di động)
Một số phương phaacutep phối hợp phổ biến hơnMDM lagrave
Kỹ thuật nhoacutem định danh
Kỹ thuật Delphi
Sự phacircn xử
Hệ thocircng tin dựa trecircn vấn đề
Nemawashi
Kỹ thuật nhoacutem định danh
1-Mỗi người tham gia viết ra những yacute tưởng về những gigrave necircn quyết định
2-Lần lượt mỗi người tham gia trigravenh bagravey yacute tưởng của migravenh được ghi lại trecircn bảng Khocircng thảo luận ở đacircy
3-Sau khi tất cả caacutec yacute tưởng được trigravenh bagravey caacutec đại biểu coacute thể chất vấn những người khaacutec
4-Mỗi người tham gia bỏ phiếu cho mỗi yacute tưởng
Kỹ thuật Delphi
Về cơ bản tương tự như kỹ thuật nhoacutem định danh ngoại trừ những người khocircng bao giờ tham gia cuộc họp
Một cocircng cụ khảo saacutet được sử dụng để thu thập đầu vagraveo ban đầu từ caacutec thagravenh viecircn
Một cuộc khảo saacutet thứ hai được gửi đi với một bản toacutem tắt caacutec kết quả chung
Những bước lặp lại cho đến khi đạt được một sự đồng thuận hoặc nhigraven nhận của đa số
Sự phacircn xử(Arbitration )
Thiacutech hợp nhất khi caacutec thagravenh viecircn của MDM đại diện cho caacutec yếu tố đối lập
Những người tham gia đồng yacute rằng nếu lựa chọn thay thế hai becircn thỏa thuận khocircng được tigravem thấy thigrave một trọng tagravei viecircn becircn ngoagravei sẽ tham gia
Trọng tagravei sau đoacute lựa chọn thay thế ocircng hoặc xeacutet thấy thiacutech hợp nhất
Hệ thống thocircng tin dựa trecircn vấn đề (IBIS)
Lagrave một phương phaacutep lập luận cấu truacutec
Một đại diện cho IBIS lagrave một đồ thị với caacutec nuacutet vagrave caacutec liecircn kết
IBIS bắt đầu với lựa chọn của một nuacutet vấn đề gốc sau đoacute caacutec nuacutet vị triacute khaacutec nhau được liecircn kết với nuacutet gốc
Caacutec nuacutet vị triacute nagravey sau đoacute được đaacutenh giaacute dựa trecircn những lập luận gắn liền với chuacuteng
Nemawashi (được sử dụng rộng ratildei tại Nhật Bản)
1-Một hoặc nhiều thagravenh viecircn của MDM được chỉ định lagrave điều phối viecircnCaacutec điều phối viecircn sau đoacute chọn người tham gia cograven lại
2-Điều phối viecircn xacircy dựng một tổng hợp caacutec sự lựa chọn vagrave sau đoacute caacutec chuyecircn gia đaacutenh giaacute caacutec lựa chọn
3-Điều phối viecircn lựa chọn một sự lựa chọn dựa trecircn kết quả ở trecircn(ở 2)
4-Sự thay thế được luacircn chuyển điều phối viecircn tigravem kiếm sự đồng thuận thocircng qua sự thuyết phục vagrave đagravem phaacuten
5-Nếu đạt được sự đồng thuận điều phối viecircn cho lưu thocircng một tagravei liệu magrave mỗi thagravenh viecircn MDM để lại dấu hiệu trecircn đoacute
55Nơi lagravem việc ảo
Nhiều tổ chức trecircn toagraven thế giới kinh doanh bất động sản cho cocircng nghệ hợp taacutec
Cocircng việc được trở thagravenh một điều bạn lagravem hơn lagrave một nơi bạn đi
Những thay đổi lớn nhất mang lại bởi nơi lagravem việc ảo coacute thể lagrave về văn hoaacute hay xatilde hội hơn lagrave về cocircng nghệ
Chương 6 Hệ thống thocircng tin điều hagravenh
61 Yacute nghĩa của EIS- Hệ thống thocircng tin điều hagravenh
- EIS lagrave một dạng đặc biệt của DSS được thiết kế để hỗ trợ ra quyết định ở cấp cao nhất của một tổ chức
- Lagrave một hệ thống thocircng tin hỗ trợ nhu cầu lập kế hoạch vagrave đaacutenh giaacute của caacutec nhagrave quản lyacute điều hagravenh
- EIS coacute thể giuacutep một CEO coacute được bức tranh tổng thể chiacutenh xaacutec nhất về caacutec hoạt động vagrave một bản toacutem tắt những gigrave magrave đối thủ cạnh tranh đang lagravem
- Caacutec hệ thống nagravey noacutei chung hoạt động dễ dagraveng vagrave trigravenh bagravey thocircng tin theo những caacutech dễ hiểu để việc tiếp thu được nhanh choacuteng (biểu đồ đồ thịhellip)
(Tagravei liệu thecircm EIS lagrave những loại hệ thống lagrave rất phức tạp trong tự nhiecircn Coacute thể noacutei hệ thống nagravey cũng cung cấp cho caacutec nhagrave quản lyacute với caacutec thiết bị coacute khả năng ra quyết định bằng caacutech sử dụng của noacute Hệ thống nagravey hoạt động trong điều kiện như vậy quan trọng như trong caacutec hệ thống khaacutec khocircng hỗ trợ Khả năng lưu trữ dữ liệu nặng lagravem cho noacute lyacute tưởng để được thocircng qua khocircng chỉ bởi caacutec doanh nghiệp lớn magrave cograven bởi caacutec doanh nghiệp nhỏ hơn Nhigraven chung hệ thống nagravey lagrave dagravenh cho caacutec nhacircn viecircn cấp cao hỗ trợ thagravenh thạo trong việc đưa ra caacutec quyết định quan trọng)
Caacutec phiecircn EIS tiecircu biểu- Phiecircn lagravem việc coacute thể bắt đầu với một baacuteo caacuteo về tigravenh higravenh tagravei chiacutenh vagrave kinh
doanh của một cocircng ty caacutec chỉ số hoạt động quan trọng được hiển thị rotilde ragraveng- EIS sẽ cho pheacutep caacutec giaacutem đốc điều hagravenh coacute thể đi sacircu vagraveo dữ liệu từ những con
số bất kỳ magrave noacute hỗ trợ- Việc điều hagravenh coacute thể lựa chọn một mức độ chi tiết ( VD danh số baacuten hagraveng) nếu
như cần điều tra thecircm- Lagrave một phương phaacutep tiếp cận coacute thể giuacutep việc ra quyết định tốt hơn
Những điều magrave EIS ko coacute- EIS khocircng phải lagrave sự thay thế cho caacutec hệ thống dựa trecircn caacutec maacutey tiacutenh khaacutec EIS
thực sự chỉ cung cấp dữ liệu cho caacutec hệ thống nagravey- Noacute khocircng thể biến caacutec bộ hệ điều hagravenh của maacutey tiacutenh thagravenh những ldquochuyecircn viecircn
giỏirdquo- Coacute thể được viacute một caacutech cao hơn như lagrave một trợ lyacute đaacuteng tin cậy coacute thể được gọi
đến bất khi nagraveo vagrave mỗi khi cần thiết
Tagravei liệu thecircm Sự khaacutec nhau giữa EIS vagrave DSS+ EIS thiết kế để hỗ trợ những người điều hagravenh cấp cao giuacutep họ khaacutem phaacute caacutec vấn đề vagrave caacutec cơ hội DSS hỗ trợ những nười phacircn tiacutech cố gắng trả lời cacircu hỏi caacutei gigrave coacute thể lagravem cugraveng với một cơ hội hoặc một vấn đề
Chiều EIS DSSNhững người sử dụng thocircng thường
Duyệt dữ liệu đi xuống truy xuất trạng thaacutei
Hỗ trợ phacircn tiacutech vagrave quyết định
Sự thuacutec đẩy Tiacutenh thiacutech hợp Tiacutenh hiệu quảỨng dụng Queacutet mocirci trường đaacutenh giaacute
hiệu suất nhận dạng caacutec vấn đề vagrave caacutec cơ hội
Caacutec quyết định quản lyacute trecircn caacutec lĩnh vực đa dạng
Hỗ trợ quyết định Caacutec chiacutenh saacutech caacutec quyết định khocircng coacute cấu truacutec ở mức cao vagrave hỗ trợ giaacuten tiếp
Hỗ trợ caacutec quyết định lặp lại caacutec quyết định khocircng thể đoaacuten trước ra quyết định khocircng coacute cấu truacutec vagrave baacuten cấu truacutec
Loại thocircng tin Caacutec thocircng tin tin tức thocircng tin becircn ngoagravei về khaacutech hagraveng đối thủ cạnh tranh mocirci trường caacutec baacuteo caacuteo theo yecircu cầu vagrave định thời về caacutec hoạt động becircn trong
Caacutec thocircng tin hỗ trợ caacutec tigravenh huống đặc biệt
Sử dụng coacute nguyecircn tắc
Dograve theo vết vagrave điều khiển nhận dạng cơ hội
Hoạch định tổ chức phacircn nhoacutem vagrave điều khiển
Khả năng phugrave hợp với những người sử dụng caacute nhacircn
Thiết kế loại ra quyết định cho mỗi người điều hagravenh caacute nhacircn bằng nhiều lựa chọn đầu ra
Cho pheacutep caacutec đaacutenh giaacute caacute nhacircn caacutec khả năng what-if lựa chọn loại hộp hội thoại
Đồ họa Phải coacute Lagrave một phần quan trọng của nhiều DSS
Thacircn thiện người sử dụng
Phải coacute Phải coacute nếu khocircng coacute người sử dụng trung gian
Xử lyacute thocircng tin Lọc neacuten thocircng tin dograve theo vết dữ liệu vagrave thocircng tin quan trọng
EIS kiacutech thiacutech caacutec cacircu hỏi caacutec cacircu trả lời bằng caacutech sử dụng DSS vagrave phản hồi lại EIS
Hỗ trợ caacutec thocircng tin chi tiết
Truy xuất thường xuyecircn caacutec mức chi tiết của bất kỳ thocircng tin tổng hợp nagraveo (duyệt dữ
Coacute thể coacute trong DSS nhưng khocircng thường
liệu chi tiết)Cơ sở mocirc higravenh Caacutec chức năng coacute sẵn bị hạn
chếLagrave điểm cốt lotildei của DSS
Cấu truacutec Theo người baacuten sản phẩm hoặc theo caacutec chuyecircn gia hệ thống thocircng tin
Theo người sử dụng hoặc caacute nhacircn hoặc caacutec chuyecircn gia từ caacutec trung tacircm thocircng tin hoặc phograveng ban hệ thống thocircng tin
Phần cứng Mainframe caacutec trạm RISC mạng LANs hoặc caacutec hệ thống phacircn bố
Mainframe caacutec trạm RISC caacutec maacutey PC hoặc caacutec hệ thống phacircn bố
Bản chất caacutec goacutei phần mềm
Truy xuất tương taacutec dễ dagraveng đến nhiều cơ sở dữ liệu truy xuất trực tuyến caacutec khả năng DBMS phức tạp caacutec liecircn kết phức tạp
Caacutec khả năng tiacutenh toaacuten lớn caacutec ngocircn ngữ mocirc higravenh mocirc phỏng ứng dụng vagrave caacutec bộ tạo DSS
Bản chất caacutec thocircng tin
Trigravenh bagravey thocircng tin được phaacutet sinh trước về quaacute khứ vagrave hiện tại tạo caacutec thocircng tin mới về quaacute khứ hiện tại tương lai
Tạo thocircng tin mới về quaacute khứ hiện tại tương lai
62 Lịch sử EIS- EIS xuất hiện lần đầu tiecircn tại MIT vagraveo những năm 1970
- Những EIS đầu tiecircn được phaacutet triển bởi caacutec doanh ngiệp lớn sẵn sagraveng chấp nhận rủi ro để đạt được lợi thế cạnh tranh
- Vagraveo những năm 1980 caacutec nhagrave cung cấp đatilde phaacutet triển một số cơ sở khaacutech hagraveng rộng vagrave cocircng nghệ EIS được tiếp tục phaacutet triển cho đến ngagravey nay
(Tagravei liệu thecircm Sử dụng DSSEIS cho phaacutet triển bền vững + Một số nghiecircn cứu đatilde được tiến hagravenh để kiểm tra việc thực hiện của EIS trong khu vực cocircng cộng vagrave chiacutenh phủ caacutec nước tổ chức kể từ khi chuacuteng được phaacutet triển theo định hướng lợi nhuận cho caacutec cocircng ty tư nhacircn (Hasan vagrave Hasan năm 1997) Theo một nghiecircn cứu tiến hagravenh tại Mỹ ở hơn 300 cocircng ty kết quả cho thấy sự khaacutec biệt của EIS giữa tư nhacircn vagrave chiacutenh phủ một số kết quả thuacute vị được phaacutet hiệnViacute dụ khoacute khăn hơn để chuyển tiền từ một tagravei khoản khaacutec trong một EIS của chiacutenh phủ cũng lagrave khoacute khăn hơn để biện giải thiacutech cho những chi phiacute phaacutet triển EIS của chiacutenh phủ Một nghiecircn cứu khaacutec được tiến hagravenh ở Australia
cho thấy rằng EIS cung cấp cho quản lyacute một higravenh ảnh chiacutenh xaacutec hơn về tổ chức thực hiện vagrave cung cấp hỗ trợ cho caacutec lợi iacutech chiến lược cải thiện khocircng chỉ cho caacutec nhagrave quản lyacute nhưng cograven cho phần cograven lại của tổ chức Dựa trecircn caacutec hệ thống được thiết kế cho caacutec cocircng ty tư nhacircn với một caacutech rotilde ragravengxaacutec định mục tiecircu EIS lagrave thiacutech hợp cho caacutec tổ chức cocircng cộng hiện đại nhưng cần phải được linh hoạt hơn vagrave kết thagravenh chugravem một phạm vi rộng hơn khả năng vagrave phương tiện hơn so với khu vực tư nhacircn ban đầu theo định hướng sản phẩm (Hasan vagrave Hasan năm 1997) Điều nagravey coacute thể lagrave do thực tế rằng caacutec hoạt động khu vực cocircng lagrave bắt buộc coacute taacutec động rộng phải đaacutep ứng sự mong đợi duy nhất cocircng cộng thường coacute mục tiecircu mơ hồ vagrave macircu thuẫn iacutet quyền tự chủ vagrave kiểm soaacutet việc ra quyết định vagrave nhacircn viecircn lagrave khoacute khăn hơn (Watson vagrave Carte2000) + Toacutem lại EIS lagrave một khaacutei niệm thagravenh cocircng noacute phaacutet triển qua nhiều năm tuy nhiecircn EIS khắc phục khiếm khuyết của migravenh bằng caacutech tiến hagravenh nghiecircn cứu liecircn tục)
63 Tại sao những người điều hagravenh hagraveng đầu lại khaacutec nhau- Họ lagrave những doanh nghiệp theo định hướng coacute suy nghĩ
- Coacute một khoảng khocircng gian rộng để kiểm soaacutet
- Họ chịu traacutech nhiệm cho việc thiết lập chiacutenh saacutech
- Họ đại diện cho tổ chức mocirci trường becircn ngoagravei
- Hagravenh động của họ tạo ra những kết quả đaacuteng kể về tagravei chiacutenh vagrave con người
Tần số caacutec hoạt động điều hagravenh- Xử lyacute xaacuteo trộn 42
- Hoạt động kinh doanh 32
- Phacircn bổ nguồn lực 17
- Đagravem phaacuten 3
- Những điều khaacutec 6
Handling Disturbances 42
Entrepreneurial Activites 32
Resource Allocation 17
Negotiation 3
Other 6
Những thocircng tin điều hagravenh cần thiết- Quản lyacute xaacuteo trộn coacute thể yecircu cầu sự chuacute yacute xung quanh đồng hồ
- Hoạt động kinh doanh yecircu cầu điều hagravenh để dự đoaacuten những thay đổi trong mocirci trường
- Nhiệm vụ phacircn bổ tagravei nguyecircn yecircu cầu lựa chọn người quản lyacute vagrave caacutec nguồn lực hạn chế được triển khai
- Đagravem phaacuten yecircu cầu cập nhật thocircng tin từng phuacutet để coacute thể xacircy dựng được sự đồng thuận
Caacutec loại thocircng tin điều hagravenh- Hệ thống kế toaacuten coacute liecircn quan đến việc tiacutenh toaacuten thu nhập hoạt động cho caacutec lĩnh
vực cụ thể lagrave quan trọng hơn so với caacutec hệ thống kế toaacuten truyền thocircng- Thocircng tin về thị trường khaacutech hagraveng cung cấp giaacute trị trong việc quyết định chiến
lược- Caacutec thocircng tin cần thiết thường được truyền đi trecircn một số hệ thống maacutey tiacutenh vagrave
nằm trong toagraven tổ chức- Caacutec thocircng tin được sử dụng thường lagrave ngắn hạn vagrave dễ thay đổi
Phương thức để xaacutec định thocircng tin cần thiết
Rockart xaacutec định được năm phương thức cơ bản để xaacutec định thocircng tin cần thiết
- Phương thức dựa trecircn kết quả- Phương thức rỗng- Phương thức chỉ số khoacutea- Phương thức tổng hợp nghiecircn cứu- Phương thức dựa vagraveo nhacircn tố then chốt dẫn đến thagravenh cocircng
64 Thagravenh phần EIS
- Sản phẩm EIS đầu tiecircn được phaacutet triển để sử dụng trecircn maacutey tiacutenh cấu higravenh cao nhưng caacutec sản phẩm hiện nay nhằm mục tiecircu lagrave nền tảng ClientServer
- Những nền tảng linh hoạt hơn coacute thể thiacutech ứng với thay đổi trong tổ chức vagrave cocircng nghệ
- Sử dụng dữ liệu thời gian thực dẫn đến quyết định nhanh hơn nhiều thocircng tin hơn
Thagravenh phần phần cứng- Một EIS khocircng đogravei hỏi coacute phần cứng cụ thể hoặc duy nhất nagraveo- Chigravea khoacutea của vấn đề lagrave để đảm bảo rằng caacutec thagravenh phần của EIS tối ưu hoacutea vagrave
phugrave hợp với tagravei nguyecircn maacutey tiacutenh của tổ chức- Hệ thống nagravey phải được cấu higravenh để caacutec nguồn tagravei nguyecircn phugrave hợp với những
người điều hagravenh chuacuteng
Thagravenh phần phần mềm- Traacutei ngược với phần cứng phần mềm thường được chuyecircn mocircn hoacutea cao cho caacutec
bagravei toaacuten về miền- Sự chuyecircn mocircn hoacutea nagravey thường đạt được bằng caacutech sử dụng thagravenh phần off-the-
shelf cho toagraven bộ EIS vagrave caacutec mocirc-đun tugravey chỉnh để đaacutep ứng nhu cầu cụ thể- Lotus Notes lagrave một viacute dụ điển higravenh Noacute coacute thể được sử dụng một migravenh hoặc coacute
thể phục vụ becircn thứ ba mocirc-đun plug-in
Cocircng nghệ EIS hiện nay
Dobrzeniecki đề xuấtphacircn loạitừng cấptheo bachức năng- Loại 1 sản phẩm bao gồmmột bộ đầy đủcaacutec ứng dụngtừ mộtnhagrave cung cấp- Loại 2 sản phẩm đượcthựchiệnở phần đầu củacaacutecsản phẩmDSS đượcphaacutet triển
bởicugravengmộtnhagrave cung cấp- Loại 3 sản phẩmkết hợp với nhautheo bất kỳ số lượngthuộc sở hữu củacocircng ty
65 Xacircy dựng EIS
- Xacircy dựngmộtEISgiống nhưxacircydựngmột số hệ thống khaacutec củamocirc higravenh hệ thống thocircng tin
- Việcphaacutet triểncấu truacutecnecircn được theo dotildeitừ quaacute trigravenh thiết kế đến quaacute trigravenhthực hiện
- Tuy nhiecircn một dự aacuten phaacutet triển EIScoacute xu hướnglagrave thống nhấtvagraveyecircu cầu hỗ trợ caacutec nhagrave quản lyacute latildenh đạo
- Xacircy dựng một EIScoacute thểphaacutet hiện ra đượccaacutectigravenh huống khoacute khănmagravemột nhagrave phaacutet triển chưabao giờ gặp phải
Mocirc higravenh EIS
Khung phaacutet triển một EIS
- Watson et al đề nghị xacircy dựngkhung với ba thagravenh phần+ Caacutech tiếp cận tập trung vagraveo yếu tốcon người vagrave dữ liệu coacute liecircn quan đến EIS+ Quaacute trigravenh phaacutet triển cần sự linh hoạt vagrave tương taacutec+ Người sử dụng - hệ thống hộp thoại bao gồm một ngocircn ngữ hagravenh động để xử lyacute caacutec lệnh
Lợi iacutech của EIS- Dễ duy trigrave caacutec mục tiecircu coacute tổ chức- Dễ truy xuất thocircng tin- Cho pheacutep người sử dụng nacircng cao hiệu suất hơn
- Tăng chất lượng ra quyết định- Cung cấp sự cải tiến cạnh tranh- Tiết kiệm thời gian của người sử dụng- Tăng khả năng vagrave chất lượng giao tiếp- Cung cấp khả năng điều khiển tốt hơn trong tổ chức- Cho pheacutep tham gia caacutec vấn đề vagrave caacutec cơ hội- Cho pheacutep hoạch định- Cho pheacutep tigravem kiếm nguyecircn nhacircn của một vấn đề- Thảo matilden caacutec yecircu cầu của người điều hagravenh
Hạn chế của EIS vagrave 1 số sai lầm cần traacutenh
- Chi phiacute một cuộc khảo saacutetnăm1991 chothấychi phiacute phaacutet triểntrungbigravenh365000USDvớichi phiacute vận hagravenhhagraveng năm lagrave$200000 (EIS)
- Cocircng nghệ hạn chếEIScần phảiđượctiacutech hợp hoagraven toagravenvagraveokiếntruacuteccủadoanh nghiệphiện tại do đoacute noacutelagrave một thaacutech thứclớn đối vớithiết kế
- Hạn chế tổ chức cơ cấu tổ chứccoacute thể khocircng phugrave hợp
Sự hạn chế về tổ chức- Chương trigravenh nghị sự vagrave thời gian chệch EIS mocirc tả một phần việc thực hiện một
chương trigravenh nghị sự vagrave coacute thể dễ dagraveng đạt được sự tin cậy một caacutech chắc chắn- Đồng bộ hoacutea việc quản lyacute sự tin cậy đuacuteng luacutec đặc biệt baacuteo caacuteo EIS coacute thể phaacute
vỡ sự ổn định thiết lập caacutec chu trigravenh baacuteo caacuteo một caacutech tốt nhất- Sự bất ổn EIS phản ứng nhanh coacute thể gacircy ra việc taacutec động trở lại một caacutech
nhanh choacuteng dẫn đến sự thiếu ổn định trong tổ chức
Sự thất bại lagrave thay thế khocircng thể chấp nhận được- Một số yếu tố lagravem EIS thất bại
+ Thiếu sự hỗ trợ về mặt quản lyacute+ Vấn đề chiacutenh trị+ Thất bại của nhagrave phaacutet triển+ Lỗi về cocircng nghệ+ Giaacute cả+ Thời gian
66 Ra quyết định điều hagravenh trong tương lai vagrave EIS
- Coacute một vagravei điều kiện sẽ được hợp nhất cho việc chuyển đổi cocircng nghệ Trong đoacute một vagravei điều kiện coacute thể dễ dự đoaacuten Hai điều kiện magrave ta coacute thể thấy lagrave+ Phaacutet triển cocircng nghệ maacutey tiacutenh trong việc điều hagravenh sẽ tạo ra sự chuyển đổi được chấp nhận một caacutech dễ dagraveng hơn+ Mở rộng traacutech nhiệm điều hagravenh sẽ mở rộng nhu cầu thocircng tin
Tương lai của EIS- EIS thocircng minh Những tiến bộ trong cocircng nghệ AI sẽ được triển khai trong caacutec
EIS- EIS đa phương tiện Cơ sở dữ liệu đa phương tiện sẽ cho pheacutep tiacutech hợp văn bản
giọng noacutei vagrave higravenh ảnh trong tương lai- EIS thocircng tin Tương lai EIS sẽ mở rộng hơn trong việc sử dụng dữ liệu becircn
ngoagravei doanh nghiệp- EIS kết nối Giao tiếp với băng thocircng rộng cho pheacutep kết nối liecircn thocircng lớn hơn
Chương 7 HỆ CHUYEcircN GIA VAgrave TRIacute TUỆ NHAcircN TẠO
71 Caacutec khaacutei niệm
72 Triacute thocircng minh của triacute tuệ nhacircn tạo
73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia
74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia
75 Lợi iacutech vagrave hạn chế của hệ chuyecircn gia
71 Caacutec khaacutei niệm
Chuyecircn mocircn (Expertise) sự hiểu biết rộng trong 1 lĩnh vực hẹp
Hệ chuyecircn gia (Expert Systems)1 chương trigravenh maacutey tiacutenh sử dụng 1 tập caacutec luật dựa trecircn tri thức của con người để giải quyết caacutec vấn đề đogravei hogravei phải coacute sự chuyecircn mocircn
Một số hệ chuyecircn gia nổi tiếng
DENDRAL (Standford 1960s Edward Feigenbaum)
MYCIN (Standford1970s Edward Shortliffe)
PROSPECTOR (MIT 1979)
Triacute tuệ nhacircn tạo (Artificial Intelligence ndash AI)
Triacute tuệ nhacircn tạo một bộ phacircn của ngagravenh khoa học maacutey tiacutenh quan tacircm đến việc thiết kế caacutec hệ thống maacutey tiacutenh thocircng minh đoacute lagrave caacutec hệ thống đưa ra caacutec đặc điểm magrave từ đoacute chuacuteng ta liecircn hệ với sự thocircng minh trong hagravenh động của con người (Barr vagrave Feigenbaum 1981)
Mục điacutech của AI
Mục điacutech khoa học xaacutec định caacutec gợi yacute để giải thiacutech caacutec loại khaacutec nhau của triacute tuệ thực
Mục điacutech kỹ thuật giải quyết caacutec vấn đề trong thế giới thực
Triacute tuệ nhacircn tạo kế thừa nhiều yacute tưởng quan điểm kỹ thuật từ caacutec ngagravenh khoa học khaacutec
- Triết học
- Logic Toaacuten học
- Tiacutenh toaacuten
- Khoa học tacircm lyacute Khoa học nhận thức
- Sinh học Thần kinh học
- Tiến hoacutea
Caacutec lĩnh vực ứng dụng trong Triacute tuệ nhacircn tạo
Mạng nơ ron thần kinh (Neural Networks)
Tiacutenh toaacuten sự tiến hoacutea
(Evolutionary Computation)
Hệ chuyecircn gia (Expert Systems)
Kỹ thuật xử lyacute tiếng noacutei (Speech Processing)
Kỹ thuật xử lyacute ngocircn ngữ tự nhiecircn
(Natural Language Processing)
Lập kế hoạch (Planning)
Robot (Robotics)
Khoa học higravenh ảnh (Vision)
Caacutec kỹ thuật thocircng dụng dugraveng trong AI
Biểu diễn(Representation)
Học (Learning)
Caacutec luật (Rules)
Tigravem kiếm (Search)
72 Triacute thocircng minh của triacute tuệ nhacircn tạo
Con người suy diễn như thế nagraveo
Phacircn loại (Categorization)
Caacutec quy tắc cụ thể
Heuristics
Kinh nghiệm trước đoacute
Dự tiacutenh trước
Maacutey tiacutenh suy diễn như thế nagraveo
Lập luận dựa trecircn luật IF-THEN mocirc tả tri thức được matilde hoacutea dưới dạng caacutec luật
Caacutec khung (Frames) lagrave caacutec đại diện mocirc tả caacutec tigravenh huống giống nhau lagrave điển higravenh của một vagravei phacircn loại
Lập luận dựa trecircn caacutec trường hợp mocirc phỏng giải phaacutep trước đoacute cho một vấn đề hiện tại
Nhận dạng mẫu phaacutet hiện acircm thanh higravenh dạng hoặc caacutec chuỗi dagravei
Caacutec dạng khaacutec của Triacute tuệ nhacircn tạo
Học maacutey- mạng nơron vagrave giải thuật di truyền
Lập trigravenh tự động ndash lagrave những kỹ thuật tạo ra caacutec chương trigravenh để lagravem 1 nhiệm vụ riecircng biệt (cho pheacutep những người khocircng phải lagrave người lập trigravenh coacute thể lập trigravenh được)
Cuộc sống nhacircn tạo ndash nỗ lực để taacutei tạo caacutec hiện tượng sinh học trong caacutec hệ thống dựa trecircn maacutey tiacutenh
73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia(Expert Systems- ES)
Theo Jackson (1999) Một hệ chuyecircn gia lagrave một chương trigravenh maacutey tiacutenh mocirc tả vagrave suy diễn với tri thức của một vagravei lĩnh vực để giải quyết vấn đề hay đưa ra caacutec lời khuyecircn
Cấu truacutec cơ bản của ES được dựa theo cấu truacutec chung của DSS Sự khaacutec biệt chiacutenh giữa ES vagraveDSS lagrave hệ ES thu thập caacutec kiến thức từ những
chuyecircn gia trong lĩnh vực quan tacircmĐặc trưng của hệ chuyecircn gia Hiệu quả cao Thời gian trả lời thỏa đaacuteng Độ tin cậy cao Dễ hiểu
Giao diện người dugraveng trong ES
Thiết kế giao diện người dugraveng tập trung vagraveo caacutec yếu tố như dễ dagraveng sử dụngcoacute độ tin cậy cao giảm tải những khoacute khăn khi sử dụng
Thiết kế necircn coacute một số tương taacutec (đầu vagraveo kiểm soaacutet vagrave truy vấn)
Cấu tạo giao diện người dugraveng gồm coacute magraven higravenh cảm ứng bagraven phiacutem buacutet saacuteng lệnh thoại caacutec phiacutem chuyecircn dụng
Cơ sở tri thức (Knowledge Base)
Chứa đựng caacutec tri thức cụ thể miền thu được từ caacutec chuyecircn gia miền
Coacute thể chứa caacutec mocirc tả caacutec hagravenh vi giải quyết vấn đề caacutec ragraveng buộc caacutec heuristics
Thagravenh cocircng của một ES dựa trecircn tiacutenh đầy đủ vagrave tiacutenh chiacutenh xaacutec của cơ sở tri thức
Mocirc tơ suy diễn (Inference Engine)
Ở đacircy tri thức được đặt để sử dụng tạo ra caacutec giải phaacutep để giải quyết vấn đề
Mocirc tơ nagravey coacute khả năng thực hiện diễn dịch hoặc suy diễn dựa trecircn caacutec luật hay caacutec caacutec sự kiện
Đồng thời cũng coacute khả năng sử dụng caacutec suy diễn mờ hay khocircng chiacutenh xaacutec dựa trecircn xaacutec suất hay aacutenh xạ mẫu
Vograveng điều khiển suy diễn
1 Aacutenh xạ caacutec luật với caacutec sự kiện đatilde được cho
2 Chọn luật để thực hiện
3 Thực hiện luật bằng caacutech thecircm caacutec sự kiện được suy diễn ra vagraveo bộ nhớ lagravem việc
Chuỗi suy diễn (Chaining)
Suy diễn tiến (forward chaining) maacutey suy diễn bắt đầu từ dữ liệu ban đầu vagrave thực hiện việc suy luận để đưa ra caacutec kết luận cuối cugraveng
Suy diễn lugravei (backward chaining) maacutey suy diễn bắt đầu từ dữ liệu điacutech vagrave tigravem ra tri thức hỗ trợ cho dữ liệu điacutech đoacute
Viacute dụ suy diễn lugravei
R1 Nếu coacute A vagrave B thigrave suy ra coacute D
R2 Nếu coacute B thigrave suy ra coacute C
R3 Nếu coacute C vagrave D thigrave suy ra coacute E
Ta coacute E ta xem trong 3 luật R1 R2 R3 luật nagraveo coacute E ta thấy R3 chứa E đồng thời chứa C vagrave D Xeacutet tiếp trong 2 luật R1 R2 luật nagraveo chứa C vagrave D R2 chứa C R3 chứa D Từ đoacute ta coacute được caacutec tri thức hỗ trợ suy diễn vagrave kết luận lagrave nếu coacute A vagrave B thigrave sẽ coacute E Hay nếu A vagrave B đuacuteng thigrave sẽ coacute E
Viacute dụ suy diễn tiến
Giả sử coacute tập chứa 3 luật sau
R1 Nếu coacute A vagrave B thigrave suy ra coacute D
R2 Nếu coacute B thigrave suy ra coacute C
R3 Nếu coacute C vagrave D thigrave suy ra coacute E
Nếu ta coacute A vagrave B thigrave chuacuteng ta suy ra được D từ R1 vagrave suy ra C từ R2 Với D vagrave C đatilde được suy ra ở trecircn giờ chuacuteng ta suy ra được E từ R3
Viacute dụ thực tế
Giả sử muốn biết magraveu của một con vật nuocirci tecircn lagrave Fred biết rằng noacute kecircu ộp ộp vagrave ăn ruồi
Coacute tập 4 luật ban đầu như sau
R1 Nếu X kecircu ộp ộp vagrave ăn ruồi thigrave X lagrave con ếch
R2 Nếu X kecircu chiecircm chiếp vagrave biết hoacutet thigrave X lagrave con chim
R3 Nếu X lagrave con ếch thigrave X coacute magraveu xanh
R4 Nếu X lagrave con chim thigrave X coacute magraveu vagraveng
74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia
Expert system shells lagrave một tập caacutec goacutei phần mềm vagrave caacutec cocircng cụ dugraveng để phaacutet triển caacutec hệ chuyecircn gia
Những Expert system shells đầu tiecircn thường rất rườm ragrave Mặc dugrave vậy noacute vẫn giuacutep cho người sử dụng sẽ khocircng phải bắt đầu lại từ đầu khi xacircy dựng một hệ chuyecircn gia mới
Những shell hiện đại bao gồm hai mocirc-đun chiacutenh lagrave cocircng cụ xacircy dựng một tập quy tắc vagrave mocirc tơ suy diễn
Xacircy dựng hệ chuyecircn gia
Bước 1 xacircy dựng mocirc higravenh bagravei toaacuten xaacutec định vấn đề nhiệm vụ magrave hệ thống sẽ thực hiện Caacutec dạng bagravei toaacuten cần hệ chuyecircn gia
Bagravei toaacuten diễn giải (InterPretation)
Bagravei toaacuten dự baacuteo (Prediction)
Bagravei toaacuten chuẩn đoaacuten (Diagnose)
Bagravei toaacuten gỡ rối (Debugging)
Bagravei toaacuten thiết kế
Tương tự như một dự aacuten phần mềm để xacircy dựng một hệ chuyecircn gia cần phải coacute caacutec yếu tố về nhacircn lực tagravei nguyecircn vagrave thời gian Những yếu tố nagravey ảnh hưởng đến giaacute thah của một hệ chuyecircn giaTrong phần nagravey cacircu hỏi thường được đặt ra lagrave tại sao cần phải xacircy dựng một hệ chuyecircn giaTrước khi bắt đầu phải xaacute định rotilde bagravei toaacuten đạt ra lagrave jiAi lagrave chuyecircn giaAi lagrave người sử dụng
1 Diễn giải (InterPretation) Nghiecircn cứu 1 vấn đề -gt Dựa trecircn những biểu hiện thuộc tiacutenh đặc trưng becircn ngoagravei -gt Tư vấn
(hoặc đưa ra kết luận hay mocirc tả dễ hiểu từ tập dữ liệu thocirc)
2 Bagravei toaacuten dự baacuteo (Prediction) Coacute thể dự đoaacuten được hagravenh vi kết quả dựa trecircn caacutec hiện tượng -gt dự baacuteo
VD Dự baacuteo thời tiết động đấthellip
3 Bagravei toaacuten chẩn đoaacuten (Diagnoss) Xaacutec định caacutec lỗi caacutec bộ phận hỏng hoacutec của hệ thống dựa trecircn caacutec dữ liệu quan saacutet được
4 Bagravei toaacuten gỡ rối (Debugging) Mocirc tả caacutec phương phaacutep khắc phục hệ thống khi gặp sự cố
5 Bagravei toaacuten thiết kế Lựa chọn cấu higravenh caacutec đối tượng nhằm thoả matilden một số ragraveng buộc nagraveo đoacute
6 Giảng dạy Phần mềm dạy học coacute thể chuẩn đoaacuten vagrave sủa lỗi của học sinh trong quaacute trigravenh học tập
Để xaacutec định đuacuteng bagravei toaacuten magrave chuacuteng ta cần giải quyết thigrave phải trả lời đc một số cacircu hỏi
- cần hệ chuyecircn gia
Bước 2 thu thập tri thức lựa chọn cocircng cụ vagrave aacutep dụng
Trong bước thu thập tri thức vấn đề quan trọng lagrave lựa chọn chuyecircn gia những người magrave sẽ đoacuteng goacutep tri thức cho hệ thống Thocircng thường trong suốt quaacute trigravenh phaacutet triển thigrave chuyecircn gia được xem như một thagravenh viecircn của đội phaacutet triển
Hiện nay coacute rất nhiều cocircng cụ để xacircy dựng một hệ chuyecircn gia Phổ biến nhất lagrave JESS CLIPS vagrave OPS5
Bước 3 Thiết kế cơ sở tri thức thiết kế hệ thốngTri thức được biểu diễn trường minh trong cơ sở tri thức
Caacutec chuyecircn gia vagrave kỹ sư tri thức sẽ đối thoại với nhau bằng caacutec kỹ thuật đối thoại Suy diễn (SD) bảng Mocirc higravenh hoacutea SD quy nạp phacircn loại
Vấn đề bagraveo trigrave vagrave phaacutet triển
Caacutec hệ chuyecircn gia đogravei hỏi phải bảo trigrave vagrave phaacutet triển nhiều hơn so với caacutec hệ thống khaacutec Phải thường xuyecircn bổ sung tri thức mới vagrave thay đổi caacutec tri thức cũ để đổi mới hệ chuyecircn gia
Thu thập vagrave khắc phục lỗi do người sử dụng phaacutet hiện để kịp thời khắc phục những sai soacutet của hệ chuyecircn gia
75 Lợi iacutech vagrave hạn chế của caacutec hệ chuyecircn gia
Một số lợi iacutech chiacutenh
Thời gian trả lời hợp lyacute bằng hoặc nhanh hơn so với chuyecircn gia (người) để đi đến cugraveng một quyết định Hệ chuyecircn gia lagrave một hệ thống thời gian thực (real time system)
Khả năng trả lời với mức độ tinh thocircng bằng hoặc cao hơn so với chuyecircn gia (người) trong cugraveng lĩnh vực
Hệ chuyecircn gia giuacutep cho hiệu quả lagravem việc tăng bằng việc sử dụng tập caacutec luật một caacutech nhanh choacuteng magrave ko bị nhầm lẫn chuyecircn gia lagrave người coacute thể quecircn đi một số tri thức cơ sở lyacute luậ nhưng HCG thigrave ko
Quyết định của một người chuyecircn gia coacute thể bị thay đổi vagrave ko coacute tiacutenh thống nhất như quyết định của một hệ chuyecircn gia tạo ra
Hệ chuyecircn gia giuacutep cho người sử dụng coacute thể trau dồi sự hiểu biết trecircn lĩnh vuej cụ thể magrave noacute giải quyết hỗ trợ người ra quyết định coacute trigravenh độ như 1 chuyecircn gia trong quaacute trigravenh gia quyết định
Kiến thức của rất nhiều chuyecircn gia về một lĩnh vực nagraveo đoacute được đưa vagraveo hệ chuyecircn gia lagravem cho CSTT cuat HCG phong phuacute vagrave rộng lớn hơn rất nhiều
HCG giải thiacutech caacutec bước suy luận một caacutech dễ hiểu nhất quaacuten luacutec nagraveo cũng coacute thể sử dụng ko như chuyecircn gia con người
Hạn chế của caacutec hệ chuyecircn gia
Nhược điểm lớn nhất của hệ chuyecircn gia lagrave những yacute kiến chuyecircn mocircn thường rất khoacute matilde hoacutea vagrave giải neacuten
Hệ chuyecircn gia khocircng coacute khả năng tự học tự cập nhật kiến thức mới như caacutec chuyecircn gia magrave cần phải được matilde hoacutea lại khi noacute được cập nhật
Hệ chuyecircn gia khocircng thể nhận ra được vấn đề khocircng nằm trong miền kiến thức của hệ thống
Chương 8 Tri thức vagrave tiếp nhận
1 Bao gồm caacutec vấn đề
Dữ liệu thực tế đo lường hoặc quan saacutet coacute hoặc khocircng coacute bối cảnh
Thocircng tin dữ liệu được tổng hợp một caacutech hữu iacutech để giải quyết những khoacute khăn trong việc đưa ra quyết định
Tri thức bao gồm caacutec ứng dụng quy tắc thocircng tin hướng dẫn của người ra quyết định
2 Những caacutei nhigraven về tri thức
Đại diện lagravem thế nagraveo để diễn tả tri thức viacute dụ như một quyển saacutech khocircng phải lagrave tri thức nhưng noacute lại lagrave một đại diện của tri thức
Sản xuất tri thức lagrave một tập hơp của hagraveng tồn kho coacute thể được sản xuất cũng như mua lại
Tri thức lagrave 1 trong 6 trạng thaacutei của hệ thống
1Dữ liệu 2Thocircng tin 3Cấu truacutec thocircng tin 4Sự thấu hiểu 5Yacute kiến 6 Quyết định
3 Caacutec loại tri thức Phổ biến mocirc tả dữ liệu thocircng tin thủ tục mọi thứ lagravem như thế nagraveo lập luận chiacutenh saacutech hoặc caacutec quy tắc
4 Thu thập Tri thức hệ chuyecircn gia Hầu hết caacutec phương phaacutep đều bắt đầu với mocirc higravenh của caacutec taacutec vụ trong đoacute
hệ chuyecircn gia được xacircy dựng Trong đoacute mocirc tả về caacutec lĩnh vực được tạo ra Caacutec kỹ sư sử dụng caacutec mocirc higravenh giả thuyết vagrave nhận thức về quaacute trigravenh phacircn
tiacutech để gợi ra caacutech giải quyết vấn đề về tri thức từ caacutec chuyecircn gia
5 Caacutec chiều của thu thập tri thức KE- driven caacutec kỹ sư trao đổi trực tiếp với caacutec chuyecircn gia Expert-driven Caacutec chuyecircn gia trực tiếp đưa chuyecircn mocircn của họ vagraveo hệ
thống maacutey tiacutenh Machine-driven Sử dụng caacutec cocircng cụ suy luận để triacutech xuất tri thức từ một
tập caacutec viacute dụ
6 Kỹ thuật thu thập tri thức Trao đổi gồm 2 loại cơ bản lagrave coacute cấu truacutec(coacute kịch bản) vagrave khocircng coacute cấu
truacutec( đối thoại trực tiếp) Giao thức phacircn tiacutech bằng lời Khi caacutec chuyecircn gia thực hiện một cocircng việc
của họ thigrave một bản ghi về cocircng việc đoacute được thực hiện Caacutec kỹ sư sẽ xacircy dựng mocirc higravenh cho những gigrave được ghi lại trong bản ghi
Phương phaacutep sagraveng lọc caacutec chuyecircn gia so saacutenh caacutec nhoacutem liecircn tiếp trong ba đối tượng vagrave cho biết tại sao nhoacutem thứ hai lại khaacutec nhoacutem thứ ba
7 Thu thập tri thức từ nhiều nguồn Thu thập tri thức từ nhiều nguồn lagrave cần thiết để coacute được đầy đủ caacutec tri thức
cho một vấn đề quan điểm yacute kiến traacutei ngược nhau thường phaacutet sinh Phương phaacutep đồng thuận sẽ giuacutep giải quyết được vấn đề macircu thuẫn Kỹ thuật phacircn tiacutech Meta lagrave kỹ thuật được aacutep dụng trong caacutec trường hợp
khaacutec Caacutech tiếp cận bằng định lượng đogravei hỏi caacutec kỹ sư cần cacircn nhắc yếu tố đầu vagraveo của caacutec chuyecircn gia khaacutec nhau
8 Xaacutec nhận hợp lệ vagrave kiểm tra tri thức Một khi thu thập tri thức noacute phải được đaacutenh giaacute về khả năng sử dụng vagrave độ
chiacutenh xaacutec Hai vấn đề cụ thể lagrave hiệu lực của những kiến thức vagrave kiểm tra việc xacircy dựng cơ sở của tri thức
Cần xaacutec nhận xem liệu hệ thống coacute thể hoạt động ở mức độ tối thiểu khocircng
Xaacutec minh liecircn quan đến việc so saacutenh từng chi tiết kỹ thuật của hệ thống những gigrave đatilde được thực hiện cuối cugraveng
9 Một số caacutec biện phaacutep xaacutec nhận Độ chiacutenh xaacutec Khả năng thiacutech nghi Mức độ đầy đủ Bề rộng Độ sacircu Hiệu lực Tổng quan Chiacutenh xaacutec Hiện thực Độ tin cậy Tiacutenh hữu dụng Mức độ
Chương 9 Học maacutey
1 Logic mờ vagrave ngocircn ngữ mờ(Fuzzy Logic and Linguistic Ambiguity)
Ngocircn ngữ tự nhiecircn gồm những khaacutei niệm mơ hồ vagrave khocircng chiacutenh xaacutectruyền tải ngữ nghĩa thocircng qua tiacutenh xấp xỉkhocircng rotilde ragraveng
Những xấp xỉ nagravey giuacutep con người coacute thể truyền tải hết được yacute nghĩa nhưng maacutey thigrave khocircng hiểu
Lagravem sao biểu diễn caacutec tri thức sử dụng caacutec khaacutei niệm khocircng rotilde ragraveng(mờ) hoặc khocircng chiacutenh xaacutec
2 Khaacutei niệm cơ bản của logic mờ tập mờ lagrave những tập hợp khocircng coacute một giới hạn rotilde Mỗi phần tử của noacute chỉ
chứa một mức độ hagravem liecircn thuộc của từng phần tử Vigrave vậy tập mờ khocircng giống như tập cổ điển Tập mờ coacute thể kết hợp với nhau qua những luật mờ magrave đặc trưng cho những hagravenh động trạng thaacutei vagrave thuộc tiacutenh của logic mờ được tận dụng khi thực hiện một bộ điều khiển mờ
Logic mờ dựa trecircn yacute tưởng mỗi phần tử thuộc vagraveo một tập hợp ở một mức độ nagraveo đấy
Locircgic mờ cho pheacutep độ liecircn thuộc (microA )coacute giaacute trị trong khoảng (01) Locircgic mờ coacute thể được coi lagrave mặt ứng dụng của lyacute thuyết tập mờ để xử lyacute caacutec
giaacute trị trong thế giới thực cho caacutec bagravei toaacuten phức tạp
3 So saacutenh tiacutenh đuacuteng đắn logic mờ vagrave xaacutec suất Xaacutec suất thigrave đề cập đến khả năng xảy ra một biến cố hay một điều gigrave đoacute Logic mờ đề cập đến cấp độ magrave đặc tiacutenh ở hiện tại
o viacute dụ1 người coacute chiều cao 6 feet thigrave coacute cấp độ lagrave 05 về chiều cao
4 Ưu điểm của logic mờ Caacutech tiếp cận rất tự nhiecircnkhocircng phức tạp Coacute thể mocirc higravenh hoacutea caacutec hagravem phi tuyến tugravey yacute phức tạp
Coacute thể tận dụng được kinh nghiệm từ những chuyecircn gia hagraveng đầu trong mọi lĩnh vực
Logic mờ được xacircy dựng dựa trecircn ngocircn ngữ tự nhiecircnNền tảng của logic mờ lagrave dựa trecircn cơ sở giao tiếp của con người
5 Nhược điểm của logic mờ Trong 1 hệ thống phức tạpsử dụng logic mờ coacute thể trở thagravenh trở ngại cho
việc xaacutec thực độ tin cậy của hệ thống Cơ chế lập luận mờ khocircng thể học hỏi từ những lỗi sai
6 Mạng noron nhacircn tạo(ANN) Mạng noron nhacircn tạo lagrave một mocirc phỏng xử lyacute thocircng tinđược nghiecircn cứu ra
từ hệ thống thần kinh của sinh vậtgiống như bộ natildeo để xử lyacute thocircng tin ANNs lagrave chương trigravenh dựa trecircn maacutey tiacutenh đơn giản coacute chức năng lagrave một mocirc
higravenh bagravei toaacuten khocircng gian dựa trecircn thử nghiệm vagrave baacuteo lỗi
7 Học từ kinh nghiệm Tiến trigravenh Một mẫu dữ liệu được biểu diễn như một mạng lưới noronANN ldquodự
đoaacutenrdquo 1 đầu radự đoaacuten được so saacutenh với giaacute trị thực tế hoặc giaacute trị chiacutenh xaacutecNếu đoaacuten được chiacutenh xaacutec thigrave khocircng coacute hagravenh động nagraveo được thực hiện
Nếu dự đoaacuten sai ANN kiểm tra lại vagrave xaacutec định lại thocircng số để điều chỉnh Một mẫu dữ liệu khaacutec được biểu diễn vagrave quaacute trigravenh nagravey được lặp lại
8 Nguyecircn tắc cơ bản của cocircng nghệ nơron Caacutec yếu tố xử lyacute cơ bản trong hệ thống thần kinh của con người lagrave tế bagraveo
thần kinhMạng lưới của tế bagraveo nagravey lagrave liecircn kết với nhau nhận được thocircng tin từ caacutec cảm biến trong mắt taihellip
Thocircng tin nhận được bởi tế bagraveo thần kinh hoặc lagrave sẽ kiacutech thiacutech noacute(sẽ được chuyển qua 1 thocircng điệp dọc theo mạng lưới) hoặc lagrave sẽ ngăn cản noacute(ngăn cản dograveng thocircng tin)
Độ nhạy coacute thể thay đổi qua thời gian hoặc sau khi coacute được kinh nghiệm
9 Cấu truacutec mạng Một ANN gồm 3 lớp cơ bản
Lớp đầu vagraveo nhận dữ liệu Lớp becircn trong hoặc lagrave lớp ẩn xử lyacute dữ liệu Lớp đầu ra chuyển tiếp kết quả cuối cugraveng của mạng
10Mạng nơ ron Thường coacute nhiều đầu vagraveo mỗi đầu vagraveo với mức ảnh hưởng vagrave tầm quan
trọng riecircng của noacute Một đầu vagraveo quan trọng coacute thể được sử dụng để khuếch đại đầu ra caacutec hagravem trạng thaacutei tổng hợp caacutec trọng số của caacutec yếu tố
đầuvagraveo khaacutec nhauvagraveo một giaacute trị duy nhất Caacutec hagravem chuyển giao xử lyacute caacutec giaacute trị trạng thaacutei vagrave tạo đầu ra
11Huấn luyện mạng nơ ron Trong mocirc higravenh coacute giaacutem saacutetANN được đến so saacutenh dự đoaacuten của chiacutenh
noacute với thocircng tin phản hồi coacute chứa caacutec kết quả mong muốn ANN sẽ phải tigravem caacutech thay đổi caacutec tham số becircn trong củamigravenh (caacutec trọng số vagrave caacutec ngưỡng) để tạo necircn một aacutenh xạ coacute khả năng aacutenh xạcaacutec đầu vagraveo thagravenh caacutec đầu ra mong muốn Sự thay đổi nagravey được tiến hagravenh nhờ việc so saacutenh giữa đầu ra thực sự vagrave đầu ra mong muốn
Trong mocirc higravenh khocircng coacute giaacutem saacutetANN nhận được dữ liệu vagraveo nhưng khocircng phải coacute bất kỳ thocircng tin phản hồi về kết quả mong muốn
Phần lớn caacutec ứng dụng nằm trong vugraveng của caacutec bagravei toaacuten ước lượng như mocirc higravenh hoacuteathống kecirc neacuten lọc phacircn cụm
12Lợi iacutech Liecircn kết với mạng noron Traacutenh caacutech lập trigravenh tường minh Giảm nhu cầu của chuyecircn gia ANNs thigrave thiacutech nghi với caacutec yếu tố đầu vagraveo thay đổi Khocircng cần thiết cho cơ sở tri thức tinh chế ANNs coacute tiacutenh động vagrave cải thiện với việc sử dụng Coacute khả năng xử lyacute dữ liệu khocircng chiacutenh xaacutec hoặc khocircng đầy đủ Cho pheacutep tổng quaacutet hoacutea từ thocircng tin cụ thể Cho pheacutep thu thập cảm giaacutec thocircng thường vagraveo miền giải quyết vấn đề
13Hạn chế của việc liecircn kết với mạng noron ANNs khocircng thể giải thiacutech được suy luận Bản chất hộp đen thường khiến cho vấn đề traacutech nhiệm vagrave độ tin cậy phaacutet
sinh lagrave khoacute khăn Lặp đi lặp lại quaacute trigravenh huấn luyện rất tốn thời gian Nguồn lực caacutec nhagrave phacircn tiacutech vagrave thiết kế coacute tay nghề cao vẫn lagrave đaacuteng lo
ngại Cocircng nghệ ANN thuacutec đẩy hạn chế của phần cứng hiện tại ANN yecircu cầu phải coacute sự tin tưởng ở đầu ra
14Giới thiệu về thuật toaacuten di truyền Cũng như mạng lưới thần kinh caacutec thuật toaacuten di truyền được dựa trecircn lyacute
thuyết sinh học Thuật toaacuten di truyền tigravem thấy nguồn gốc của chuacuteng trong caacutec lyacute thuyết
tiến hoacutea của chọn lọc tự nhiecircn vagrave thiacutech ứng với biến đổi khiacute hậu Kết quả thuật toaacuten di truyền lagrave từ giao phối 2 caacute thể trong quần thế để tạo
ra con caacutei đocirci khi tốt hơn so với bậc cha mẹ của chuacuteng 15Caacutec thagravenh phần cơ bản của thuật toaacuten di truyền
Toaacuten tử chọn lọc Caacutec caacute thể tốt được chọn lọc để đưa vagraveo thế hệ sau Sự chọn lọc nagravey căn cứ vagraveo độ thiacutech nghi với mocirci trường của mỗi caacute thể
Toaacuten tử lai gheacutep (crossover) Hai caacute thể cha vagrave mẹ trao đổi caacutec gen với nhau để tạo ra caacute thể con
Toaacuten tử đột biến (mutation) Một caacute thể thay đổi một số gen để biến đổi thagravenh một caacute thể mớiTất cả caacutec toaacuten tử trecircn khi thực hiện đều mang tiacutenh ngẫu nhiecircn
16Quaacute trigravenh cơ bản của một thuật toaacuten di truyền Khởi tạo
Đaacutenh giaacute quần thể
Lựa chọn NST thiacutech hợp nhất vagrave loại bỏ NST yếu nhất
Quy trigravenh giao nhau vagrave cải thiện quần thể
đột biến tiến trigravenh để khaacutem phaacute ra NST mới
17Ưu nhược điểm của việc kết hợp với thuật toaacuten di truyền Kiacutech thước quần thể lagrave 1 yếu tố quan trọng trong tốc độ của việc tigravem
kiếmnhưng noacute tương đối dễ dagraveng để dự đoaacuten tốc độ nagravey Giao nhau hoặc đột biến lagrave khocircng necircn đc sử dụng quaacute thường xuyecircn Luocircn coacute được iacutet nhất 1 giải phaacutep hợp lyacute Necircn coacute thể aacutep dụng chuacuteng cho caacutec vấn đề magrave chuacuteng ta khocircng coacute hướng
về caacutech giải quyết Sức mạnh của thuật toaacuten xuất phaacutet từ khaacutei niệm đơn giảnkhocircng phải từ
một thủ tục thuật toaacuten phức tạp 18Tương lai của học maacutey
Mạng lưới thần kinh nhacircn tạo vượt quaacute năng lực của con người trong caacutec trường hợp bị cocirc lập
Về mặt lyacute thuyếtmột maacutey tiacutenh coacute thể xử lyacute dũ liệu nhanh hơn hagraveng triệu lần so với 1 con người
May mắn thay cho chuacuteng tacon người tốt hơn nhiều khi magrave coacute được dữ liệumaacutey tiacutenh khocircng coacute 1 số thứ như lagrave 5 giaacutec quan
CHƯƠNG 10 KHO DỮ LIỆU
1 Kho dữ liệu Kho dữ liệu lagrave tuyển tập caacutec cơ sở dữ liệu tiacutech hợp hướng chủ đề được
thiết kế để trợ giuacutep cho một hệ hỗ trợ quyết định
Theo John Ladley Cocircng nghệ kho dữ liệu lagrave tập caacutec phương phaacutep kỹ thuật vagrave caacutec cocircng cụ coacute thể kết hợp hỗ trợ nhau để cung cấp thocircng tin cho người sử dụng trecircn cơ sở tiacutech hợp từ nhiều nguồn dữ liệu nhiều mocirci trường khaacutec nhau
Kho dữ liệu thường rất lớn tới hagraveng trăm GB hay thậm chiacute hagraveng Terabyte
2 Kho dữ liệu vận hagravenh (ODS) Một kho dữ liệu vận hagravenh Aacutep dụng kỹ thuật kho dữ liệu vagraveo caacutec hệ xử
lyacute giao taacutec lưu trữ dữ liệu cho một ứng dụng đặc thugrave Noacute đưa vagraveo kho dữ liệu một dograveng caacutec dữ liệu thocirc được thiết kế
3 So saacutenh
Kho dữ liệu vận hagravenh Kho dữ liệu
Dữ liệu theo chủ đề Dữ liệu theo chủ đề
Dữ liệu tiacutech hợp Dữ liệu tiacutech hợp
Dữ liệu thay đổi Dữ liệu khocircng thay đổi
Dữ liệu được cập nhật khi thay đổi
Dữ liệu giữ nguyecircn
Chỉ coacute dữ liệu hiện tạiDữliệu hiện tại vagrave dữ liệu lịch sử
Chu kỳ lagravem tươi dữ liệu ngắn Chu kỳ lagravem tươi dữ liệu dagravei
Chỉ coacute dữ liệu chi tiết Dữ liệu chi tiết vagrave dữ liệu tổng kết
Dugraveng cho caacutec quyết định ngắn hạn
Dugraveng cho hoạch định dagravei hạn
4 Kho dữ liệu cục bộ (Data Mart - DM)
Kho dữ liệu cục bộ lagrave CSDL coacute những đặc điểm giống với kho dữ liệu nhưng với quy mocirc nhỏ hơn vagrave lưu trữ dữ liệu về một lĩnh vực một chuyecircn ngagravenh
Data mart phụ thuộc Chứa những dữ liệu được lấy từ DW vagrave những dữ liệu nagravey sẽ được triacutech lọc vagrave tinh chế tiacutech hợp lại ở mức cao hơn để phục vụ một chủ đề nhất định của Datamart
Data mart độc lập Khocircng giống như Datamart phụ thuộc Data mart độc lập được xacircy dựng trước DW vagrave dữ liệu được trực tiếp lấy từ caacutec nguồn khaacutec nhau
5 Siecircu dữ liệu Metadata lagrave dữ liệu để mocirc tả dữ liệu Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột
một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi Metadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu
6 Mocirci trường kho dữ liệu Hệ thống của tổ chức vagrave kho cung cấp dữ liệu để xacircy dựng kho dữ liệu Trong quaacute trigravenh chuyển dữ liệu từ caacutec nguồn khaacutec nhau dữ liệu coacute thể
được lagravem sạch hoặc chuyển đổi vagrave vigrave thế DW được xem như lagrave một chuẩn cho việc lưu trữ
Đồng thời siecircu dữ liệu được ghi lại Cuối cugraveng DW hoặc siecircu thị coacute thể được sử dụng để tạo ra một kho dữ
liệu ldquocaacute nhacircnrdquo 7 Caacutec đặc điểm của kho dữ liệu
Đặc điểm Mocirc tả
Hướng chủ đề - DL tổ chức theo caacutech thức người dugraveng tham chiếu
Tiacutech hợp - Dữ liệu ldquosạchrdquo loại bỏ tiacutenh thiếu nhất quaacuten
Khocircng thay đổi - DL ldquochỉ đọcrdquo người dugraveng khocircng thay đổi được
Chuỗi thời gian - DL lagrave chuỗi thời gian khocircng phải lagrave trạng thaacutei hiện tại
Được tổng kết - DL vận hagravenhthao taacutec khi cần thiết
được kết hợp lại thagravenh dạng coacute thể dugraveng được cho quyết định
Kiacutech cỡ lớn hơn - Lưu giữ theo chuỗi thời gian tức lagrave giữ lại nhiều DL
Khocircng được chuẩn hoacutea - Coacute thể dư thừa DLSiecircu dữ liệu - Dữ liệu của dữ liệu được lưu trữNguồn dữ liệu - DL vận hagravenh (caacutec hệ sẵn coacute) cugraveng
với caacutec nguồn ngoagravei 8 Kho dữ liệu hướng chủ đề
Hướng chủ để coacute nghĩa lagrave kho dữ liệu được tổ chức xung quanh caacutec chủ đề chiacutenh như khaacutech hagraveng sản phẩm sản xuất Tập trung vagraveo việc mocirc higravenh hoacutea vagrave phacircn tiacutech dữ liệu cho caacutec nhagrave ra quyết định magrave khocircng tập trung vagraveo caacutec xử lyacute thocircng thường Cung cấp cho người dugraveng một khung nhigraven toagraven vẹn đơn giản vagrave đầy đủ về caacutec sự kiện quanh caacutec chủ đề
9 Dữ liệu trong DW được tiacutech hợp Dữ liệu trong kho dữ liệu được xacircy dựng bằng caacutech tổng hợp dữ liệu từ
nhiều nguồn khaacutec nhau vagrave caacutec nguồn coacute tổ chức khaacutec nhau Cơ sở dữ liệu caacutec file excel caacutec flat file hoặc caacutec raw file Khi đưa vagraveo kho dữ liệu caacutec dữ liệu được lagravem sạch vagrave tiacutech hợp dữ liệu nhằm đảm bảo tiacutenh nhất quaacuten của dữ liệu
10Kiến truacutec kho dữ liệu Tầng cơ sở dữ liệu hoạt động Tầng truy xuất thocircng tin Tầng truy xuất dữ liệu Tầng siecircu dữ liệu Tầng quản lyacute tiến trigravenh Tầng thocircng điệp của ứng dụng Tầng vật liacute của kho dữ liệu Tầng trigravenh diễn dữ liệu
11Higravenh trạng kho dữ liệu Kho dữ liệu ảo - người dugraveng cuối coacute thể truy cập trực tiếp đến kho dữ liệu
sử dụng caacutec cocircng cụ cho pheacutep ở tầng truy xuất dữ liệu Kho dữ liệu trung tacircm-1 cơ sở dữ liệu vật lyacute chứa tất cả dữ liệu cho một
vugraveng chuyecircn dụng nagraveo đoacute
Kho dữ liệu phacircn taacuten- Thagravenh phần được phacircn taacuten qua nhiều hệ cơ sở dữ liệu vật lyacute
12METADATA- Siecircu dữ liệu Định nghĩa Siecircu dữ liệu lagrave dữ liệu về dữ liệu Lagrave 1 lưu trữ dugraveng để
Miecircu tả kho dữ liệu tổng thể Nhận dạng kiểu kho dữ liệu Quản liacute quaacute trigravenh tiacutech hợp dữ liệu Quản liacute quaacute trigravenh cập nhật kho dữ liệu Quản liacute bảo mật
Lagrave chigravea khoacutea quyết định sự thagravenh cocircng của kho dữ liệu luocircn được thay đổi vagrave cập nhật theo sự phaacutet triển của kho dữ liệu
Dugraveng để quản liacute điều khiển kho dữ liệu Sự ra đời của kho dữ liệu như 1 cấu truacutec hỗ trợ ra quyết định siecircu dữ liệu
được xem như nguồn tagravei nguyecircn dữ liệu Siecircu dữ liệu lagrave trừu tượng Chuacuteng lagrave dữ liệu bậc cao cung cấp mocirc tả ngắn
gọn caacutec dữ liệu bậc thấp hơn 13Hoạt động của Siecircu dữ liệu
Siecircu dữ liệu rất cần thiết trong việc chuyển hoacutea thocircng tin trở thagravenh tri thức Lagrave chigravea khoacutea giuacutep chuacuteng ta xử lyacute được dữ liệu thocirc Viacute dụ một dograveng dữ liệu baacuten hagraveng 1023 K596 11121 agraveNoacute sẽ khocircng coacute nghĩa gigrave cho đến khi chuacuteng ta đưa vagraveo siecircu dữ liệu (thư
mục chứa dữ liệu) agrave cửa hagraveng 1023 sản phẩm K596 vagrave số tiền baacuten được lagrave 11121 đocirc la
14Sự cần thiết phải nhất quaacuten trong kho dữ liệu Kho dữ liệu được xacircy dựng cho lợi iacutech của những nhagrave phacircn tiacutech kinh
doanh caacutec nhagrave quản trị cho tất cả caacutec khu vực chức năng Trong cơ sở dữ liệu riecircng caacutec khu vực khaacutec nhau coacute thể định nghĩa vagrave lưu
trữ dữ liệu thocircng qua phiecircn bản của chiacutenh noacute Khi dữ liệu được lấy từ những vugraveng khaacutec nhau đoacute vagrave được đặt vagraveo kho dữ
liệu Việc chuyển đổi vagrave lagravem sạch caacutec tiến trigravenh sẽ đảm bảo noacute lagrave duy nhất được tiacutech hợp tại một mức của tổ chức
15Ragrave soaacutet lại dữ liệu ndash Thực thi siecircu dữ liệu
Bất kể cấu truacutec tự nhiecircn của 1 cacircu truy vấn thế nagraveo thigrave caacutec thagravenh phần của siecircu dữ liệu rất quan trọng đối với người ra quyết định
Bảng thuộc tiacutenh khoacutea được lưu trữ bởi kho dữ liệu Tập hợp dữ liệu được lấy từ đacircu Những chuyển đổi nagraveo được thực thi với việc lagravem sạch
16Siecircu dữ liệu lagrave gigrave Metadata - lagrave thocircng tin mocirc tả nội dung của cơ sở dữ liệu (CSDL) Metadata baacuteo cho người dugraveng biết thời gian cập nhật sau cugraveng của dữ liệu
định dạng vagrave mục điacutech sử dụng của noacute Những thocircng tin nagravey coacute thể hướng dẫn người dugraveng duyệt qua CSDL vagrave
giuacutep họ hiểu được yacute nghĩa vagrave ngữ cảnh của dữ liệu Trong CSDL metadata lagrave caacutec dạng biểu diễn khaacutec nhau của caacutec đối tượng
trong CSDL Trong CSDL quan hệ metadata lagrave caacutec định nghĩa của bảng cột CSDL
view vagrave nhiều đối tượng khaacutec Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột
một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi -gtMetadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu
Bảng chuyển đổi Ghi lại những chuyển đổi đatilde được thực hiện
Lịch sử thực thi Ghi lại những dữ liệu đatilde được
phacircn tiacutech
Higravenh thaacutei kết nốiGhi lại những dữ liệu được kết nối vagrave tần suất
17Aacutenh xạ thocircng thường của siecircu dữ liệu Bản ghi aacutenh xạ chuyển đổi bao gồm
Định danh của nguồn gốc Chuyển đổi thuộc tiacutenh Chuyển đổi thuộc tiacutenh vật lyacute Matilde hoacutea tham chiếu bảng chuyển đổi Đổi tecircn Đổi khoacutea Gaacuten giaacute trị cho thuộc tiacutenh mặc định Chọn logic cho caacutec nguồn nhiều giaacute trị Đổi thuật toaacuten
18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để
phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai
lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave
tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec
Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm
Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo
19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua
caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau
SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được
Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra
một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức
Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ
Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ
Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech
CHƯƠNG 11 KHAI PHAacute DỮ LIỆU
1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn
ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993
Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng
2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd
1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều
2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP
3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn
4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng
5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server
6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo
7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động
8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời
9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều
10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện
11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech
12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP
3 Xử lyacute phacircn tiacutech trực tuyến OLAP
MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave
dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu
ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave
thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu
HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave
ROLAP4 Khai phaacute dữ liệu
Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh
khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn
Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan
5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp
6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại
Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp
Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec
Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt
Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra
Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh
vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho
Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec
Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm
Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục
Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng
gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp
Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn
Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec
Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper
Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2
Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25
Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước
Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng
Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện
trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp
Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute
độ hỗ trợ ge ngưỡng minsup
độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan
Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn
Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết
Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu
MOLAP ROLAP HOLAP
Lưu trữ dữ liệu cơ sở
Khối Bảng quan hệ Bảng quan hệ
Lưu trữ thocircng tin tổng hợp
Khối Bảng quan hệ Khối
Hiệu suất thực hiện truy vấn
Nhanh nhất Chậm nhất Nhanh
Tiecircu thụ khocircng gian lưu trữ
Nhiều Thấp Trung bigravenh
Chi phiacute bảo trigrave Cao Thấp Trung bigravenh
Caacutec cocircng cụ trong một bộ phần mềm bao gồm người quản lyacute hội nghị (Lotus Sametime) vagrave trao đổi thocircng điệp (Lotus Notes Mail)
Xếp hạng phần mềm cho nhoacutem
Ellis vv đề xuất một hệ thống xếp hạng dựa vagraveo kiểu sự hỗ trợ noacute Cung cấp
Hệ thocircng điệp
Hệ thống hội thảo truyền higravenh
Hệ thống cộng taacutec soạn thảo
Nhoacutem phacircn phối giải phaacutep phần mền
Hệ thống phối hợp
Hệ thống thocircng minh đại diện
Lực lượng điều khiển phaacutet triển phần mềm cho nhoacutem
Một số nhacircn tố chiacutenh bao gồm
Tăng năng suất
Giảm số lượng caacutec cuộc họp
Tăng cường tự động hoacutea caacutec quy trigravenh lagravem việc thường xuyecircn
Cần phối hợp toagraven cầu tốt hơn
Tiacutenh sẵn sagraveng của những mạng lan rộng
Coleman vagrave Khanna liệt kecirc 10 nhacircn tố khaacutec
54Quản lyacute hoạt động MDM (Mobile Device Management - Quản lyacute thiết bị di động)
Một số phương phaacutep phối hợp phổ biến hơnMDM lagrave
Kỹ thuật nhoacutem định danh
Kỹ thuật Delphi
Sự phacircn xử
Hệ thocircng tin dựa trecircn vấn đề
Nemawashi
Kỹ thuật nhoacutem định danh
1-Mỗi người tham gia viết ra những yacute tưởng về những gigrave necircn quyết định
2-Lần lượt mỗi người tham gia trigravenh bagravey yacute tưởng của migravenh được ghi lại trecircn bảng Khocircng thảo luận ở đacircy
3-Sau khi tất cả caacutec yacute tưởng được trigravenh bagravey caacutec đại biểu coacute thể chất vấn những người khaacutec
4-Mỗi người tham gia bỏ phiếu cho mỗi yacute tưởng
Kỹ thuật Delphi
Về cơ bản tương tự như kỹ thuật nhoacutem định danh ngoại trừ những người khocircng bao giờ tham gia cuộc họp
Một cocircng cụ khảo saacutet được sử dụng để thu thập đầu vagraveo ban đầu từ caacutec thagravenh viecircn
Một cuộc khảo saacutet thứ hai được gửi đi với một bản toacutem tắt caacutec kết quả chung
Những bước lặp lại cho đến khi đạt được một sự đồng thuận hoặc nhigraven nhận của đa số
Sự phacircn xử(Arbitration )
Thiacutech hợp nhất khi caacutec thagravenh viecircn của MDM đại diện cho caacutec yếu tố đối lập
Những người tham gia đồng yacute rằng nếu lựa chọn thay thế hai becircn thỏa thuận khocircng được tigravem thấy thigrave một trọng tagravei viecircn becircn ngoagravei sẽ tham gia
Trọng tagravei sau đoacute lựa chọn thay thế ocircng hoặc xeacutet thấy thiacutech hợp nhất
Hệ thống thocircng tin dựa trecircn vấn đề (IBIS)
Lagrave một phương phaacutep lập luận cấu truacutec
Một đại diện cho IBIS lagrave một đồ thị với caacutec nuacutet vagrave caacutec liecircn kết
IBIS bắt đầu với lựa chọn của một nuacutet vấn đề gốc sau đoacute caacutec nuacutet vị triacute khaacutec nhau được liecircn kết với nuacutet gốc
Caacutec nuacutet vị triacute nagravey sau đoacute được đaacutenh giaacute dựa trecircn những lập luận gắn liền với chuacuteng
Nemawashi (được sử dụng rộng ratildei tại Nhật Bản)
1-Một hoặc nhiều thagravenh viecircn của MDM được chỉ định lagrave điều phối viecircnCaacutec điều phối viecircn sau đoacute chọn người tham gia cograven lại
2-Điều phối viecircn xacircy dựng một tổng hợp caacutec sự lựa chọn vagrave sau đoacute caacutec chuyecircn gia đaacutenh giaacute caacutec lựa chọn
3-Điều phối viecircn lựa chọn một sự lựa chọn dựa trecircn kết quả ở trecircn(ở 2)
4-Sự thay thế được luacircn chuyển điều phối viecircn tigravem kiếm sự đồng thuận thocircng qua sự thuyết phục vagrave đagravem phaacuten
5-Nếu đạt được sự đồng thuận điều phối viecircn cho lưu thocircng một tagravei liệu magrave mỗi thagravenh viecircn MDM để lại dấu hiệu trecircn đoacute
55Nơi lagravem việc ảo
Nhiều tổ chức trecircn toagraven thế giới kinh doanh bất động sản cho cocircng nghệ hợp taacutec
Cocircng việc được trở thagravenh một điều bạn lagravem hơn lagrave một nơi bạn đi
Những thay đổi lớn nhất mang lại bởi nơi lagravem việc ảo coacute thể lagrave về văn hoaacute hay xatilde hội hơn lagrave về cocircng nghệ
Chương 6 Hệ thống thocircng tin điều hagravenh
61 Yacute nghĩa của EIS- Hệ thống thocircng tin điều hagravenh
- EIS lagrave một dạng đặc biệt của DSS được thiết kế để hỗ trợ ra quyết định ở cấp cao nhất của một tổ chức
- Lagrave một hệ thống thocircng tin hỗ trợ nhu cầu lập kế hoạch vagrave đaacutenh giaacute của caacutec nhagrave quản lyacute điều hagravenh
- EIS coacute thể giuacutep một CEO coacute được bức tranh tổng thể chiacutenh xaacutec nhất về caacutec hoạt động vagrave một bản toacutem tắt những gigrave magrave đối thủ cạnh tranh đang lagravem
- Caacutec hệ thống nagravey noacutei chung hoạt động dễ dagraveng vagrave trigravenh bagravey thocircng tin theo những caacutech dễ hiểu để việc tiếp thu được nhanh choacuteng (biểu đồ đồ thịhellip)
(Tagravei liệu thecircm EIS lagrave những loại hệ thống lagrave rất phức tạp trong tự nhiecircn Coacute thể noacutei hệ thống nagravey cũng cung cấp cho caacutec nhagrave quản lyacute với caacutec thiết bị coacute khả năng ra quyết định bằng caacutech sử dụng của noacute Hệ thống nagravey hoạt động trong điều kiện như vậy quan trọng như trong caacutec hệ thống khaacutec khocircng hỗ trợ Khả năng lưu trữ dữ liệu nặng lagravem cho noacute lyacute tưởng để được thocircng qua khocircng chỉ bởi caacutec doanh nghiệp lớn magrave cograven bởi caacutec doanh nghiệp nhỏ hơn Nhigraven chung hệ thống nagravey lagrave dagravenh cho caacutec nhacircn viecircn cấp cao hỗ trợ thagravenh thạo trong việc đưa ra caacutec quyết định quan trọng)
Caacutec phiecircn EIS tiecircu biểu- Phiecircn lagravem việc coacute thể bắt đầu với một baacuteo caacuteo về tigravenh higravenh tagravei chiacutenh vagrave kinh
doanh của một cocircng ty caacutec chỉ số hoạt động quan trọng được hiển thị rotilde ragraveng- EIS sẽ cho pheacutep caacutec giaacutem đốc điều hagravenh coacute thể đi sacircu vagraveo dữ liệu từ những con
số bất kỳ magrave noacute hỗ trợ- Việc điều hagravenh coacute thể lựa chọn một mức độ chi tiết ( VD danh số baacuten hagraveng) nếu
như cần điều tra thecircm- Lagrave một phương phaacutep tiếp cận coacute thể giuacutep việc ra quyết định tốt hơn
Những điều magrave EIS ko coacute- EIS khocircng phải lagrave sự thay thế cho caacutec hệ thống dựa trecircn caacutec maacutey tiacutenh khaacutec EIS
thực sự chỉ cung cấp dữ liệu cho caacutec hệ thống nagravey- Noacute khocircng thể biến caacutec bộ hệ điều hagravenh của maacutey tiacutenh thagravenh những ldquochuyecircn viecircn
giỏirdquo- Coacute thể được viacute một caacutech cao hơn như lagrave một trợ lyacute đaacuteng tin cậy coacute thể được gọi
đến bất khi nagraveo vagrave mỗi khi cần thiết
Tagravei liệu thecircm Sự khaacutec nhau giữa EIS vagrave DSS+ EIS thiết kế để hỗ trợ những người điều hagravenh cấp cao giuacutep họ khaacutem phaacute caacutec vấn đề vagrave caacutec cơ hội DSS hỗ trợ những nười phacircn tiacutech cố gắng trả lời cacircu hỏi caacutei gigrave coacute thể lagravem cugraveng với một cơ hội hoặc một vấn đề
Chiều EIS DSSNhững người sử dụng thocircng thường
Duyệt dữ liệu đi xuống truy xuất trạng thaacutei
Hỗ trợ phacircn tiacutech vagrave quyết định
Sự thuacutec đẩy Tiacutenh thiacutech hợp Tiacutenh hiệu quảỨng dụng Queacutet mocirci trường đaacutenh giaacute
hiệu suất nhận dạng caacutec vấn đề vagrave caacutec cơ hội
Caacutec quyết định quản lyacute trecircn caacutec lĩnh vực đa dạng
Hỗ trợ quyết định Caacutec chiacutenh saacutech caacutec quyết định khocircng coacute cấu truacutec ở mức cao vagrave hỗ trợ giaacuten tiếp
Hỗ trợ caacutec quyết định lặp lại caacutec quyết định khocircng thể đoaacuten trước ra quyết định khocircng coacute cấu truacutec vagrave baacuten cấu truacutec
Loại thocircng tin Caacutec thocircng tin tin tức thocircng tin becircn ngoagravei về khaacutech hagraveng đối thủ cạnh tranh mocirci trường caacutec baacuteo caacuteo theo yecircu cầu vagrave định thời về caacutec hoạt động becircn trong
Caacutec thocircng tin hỗ trợ caacutec tigravenh huống đặc biệt
Sử dụng coacute nguyecircn tắc
Dograve theo vết vagrave điều khiển nhận dạng cơ hội
Hoạch định tổ chức phacircn nhoacutem vagrave điều khiển
Khả năng phugrave hợp với những người sử dụng caacute nhacircn
Thiết kế loại ra quyết định cho mỗi người điều hagravenh caacute nhacircn bằng nhiều lựa chọn đầu ra
Cho pheacutep caacutec đaacutenh giaacute caacute nhacircn caacutec khả năng what-if lựa chọn loại hộp hội thoại
Đồ họa Phải coacute Lagrave một phần quan trọng của nhiều DSS
Thacircn thiện người sử dụng
Phải coacute Phải coacute nếu khocircng coacute người sử dụng trung gian
Xử lyacute thocircng tin Lọc neacuten thocircng tin dograve theo vết dữ liệu vagrave thocircng tin quan trọng
EIS kiacutech thiacutech caacutec cacircu hỏi caacutec cacircu trả lời bằng caacutech sử dụng DSS vagrave phản hồi lại EIS
Hỗ trợ caacutec thocircng tin chi tiết
Truy xuất thường xuyecircn caacutec mức chi tiết của bất kỳ thocircng tin tổng hợp nagraveo (duyệt dữ
Coacute thể coacute trong DSS nhưng khocircng thường
liệu chi tiết)Cơ sở mocirc higravenh Caacutec chức năng coacute sẵn bị hạn
chếLagrave điểm cốt lotildei của DSS
Cấu truacutec Theo người baacuten sản phẩm hoặc theo caacutec chuyecircn gia hệ thống thocircng tin
Theo người sử dụng hoặc caacute nhacircn hoặc caacutec chuyecircn gia từ caacutec trung tacircm thocircng tin hoặc phograveng ban hệ thống thocircng tin
Phần cứng Mainframe caacutec trạm RISC mạng LANs hoặc caacutec hệ thống phacircn bố
Mainframe caacutec trạm RISC caacutec maacutey PC hoặc caacutec hệ thống phacircn bố
Bản chất caacutec goacutei phần mềm
Truy xuất tương taacutec dễ dagraveng đến nhiều cơ sở dữ liệu truy xuất trực tuyến caacutec khả năng DBMS phức tạp caacutec liecircn kết phức tạp
Caacutec khả năng tiacutenh toaacuten lớn caacutec ngocircn ngữ mocirc higravenh mocirc phỏng ứng dụng vagrave caacutec bộ tạo DSS
Bản chất caacutec thocircng tin
Trigravenh bagravey thocircng tin được phaacutet sinh trước về quaacute khứ vagrave hiện tại tạo caacutec thocircng tin mới về quaacute khứ hiện tại tương lai
Tạo thocircng tin mới về quaacute khứ hiện tại tương lai
62 Lịch sử EIS- EIS xuất hiện lần đầu tiecircn tại MIT vagraveo những năm 1970
- Những EIS đầu tiecircn được phaacutet triển bởi caacutec doanh ngiệp lớn sẵn sagraveng chấp nhận rủi ro để đạt được lợi thế cạnh tranh
- Vagraveo những năm 1980 caacutec nhagrave cung cấp đatilde phaacutet triển một số cơ sở khaacutech hagraveng rộng vagrave cocircng nghệ EIS được tiếp tục phaacutet triển cho đến ngagravey nay
(Tagravei liệu thecircm Sử dụng DSSEIS cho phaacutet triển bền vững + Một số nghiecircn cứu đatilde được tiến hagravenh để kiểm tra việc thực hiện của EIS trong khu vực cocircng cộng vagrave chiacutenh phủ caacutec nước tổ chức kể từ khi chuacuteng được phaacutet triển theo định hướng lợi nhuận cho caacutec cocircng ty tư nhacircn (Hasan vagrave Hasan năm 1997) Theo một nghiecircn cứu tiến hagravenh tại Mỹ ở hơn 300 cocircng ty kết quả cho thấy sự khaacutec biệt của EIS giữa tư nhacircn vagrave chiacutenh phủ một số kết quả thuacute vị được phaacutet hiệnViacute dụ khoacute khăn hơn để chuyển tiền từ một tagravei khoản khaacutec trong một EIS của chiacutenh phủ cũng lagrave khoacute khăn hơn để biện giải thiacutech cho những chi phiacute phaacutet triển EIS của chiacutenh phủ Một nghiecircn cứu khaacutec được tiến hagravenh ở Australia
cho thấy rằng EIS cung cấp cho quản lyacute một higravenh ảnh chiacutenh xaacutec hơn về tổ chức thực hiện vagrave cung cấp hỗ trợ cho caacutec lợi iacutech chiến lược cải thiện khocircng chỉ cho caacutec nhagrave quản lyacute nhưng cograven cho phần cograven lại của tổ chức Dựa trecircn caacutec hệ thống được thiết kế cho caacutec cocircng ty tư nhacircn với một caacutech rotilde ragravengxaacutec định mục tiecircu EIS lagrave thiacutech hợp cho caacutec tổ chức cocircng cộng hiện đại nhưng cần phải được linh hoạt hơn vagrave kết thagravenh chugravem một phạm vi rộng hơn khả năng vagrave phương tiện hơn so với khu vực tư nhacircn ban đầu theo định hướng sản phẩm (Hasan vagrave Hasan năm 1997) Điều nagravey coacute thể lagrave do thực tế rằng caacutec hoạt động khu vực cocircng lagrave bắt buộc coacute taacutec động rộng phải đaacutep ứng sự mong đợi duy nhất cocircng cộng thường coacute mục tiecircu mơ hồ vagrave macircu thuẫn iacutet quyền tự chủ vagrave kiểm soaacutet việc ra quyết định vagrave nhacircn viecircn lagrave khoacute khăn hơn (Watson vagrave Carte2000) + Toacutem lại EIS lagrave một khaacutei niệm thagravenh cocircng noacute phaacutet triển qua nhiều năm tuy nhiecircn EIS khắc phục khiếm khuyết của migravenh bằng caacutech tiến hagravenh nghiecircn cứu liecircn tục)
63 Tại sao những người điều hagravenh hagraveng đầu lại khaacutec nhau- Họ lagrave những doanh nghiệp theo định hướng coacute suy nghĩ
- Coacute một khoảng khocircng gian rộng để kiểm soaacutet
- Họ chịu traacutech nhiệm cho việc thiết lập chiacutenh saacutech
- Họ đại diện cho tổ chức mocirci trường becircn ngoagravei
- Hagravenh động của họ tạo ra những kết quả đaacuteng kể về tagravei chiacutenh vagrave con người
Tần số caacutec hoạt động điều hagravenh- Xử lyacute xaacuteo trộn 42
- Hoạt động kinh doanh 32
- Phacircn bổ nguồn lực 17
- Đagravem phaacuten 3
- Những điều khaacutec 6
Handling Disturbances 42
Entrepreneurial Activites 32
Resource Allocation 17
Negotiation 3
Other 6
Những thocircng tin điều hagravenh cần thiết- Quản lyacute xaacuteo trộn coacute thể yecircu cầu sự chuacute yacute xung quanh đồng hồ
- Hoạt động kinh doanh yecircu cầu điều hagravenh để dự đoaacuten những thay đổi trong mocirci trường
- Nhiệm vụ phacircn bổ tagravei nguyecircn yecircu cầu lựa chọn người quản lyacute vagrave caacutec nguồn lực hạn chế được triển khai
- Đagravem phaacuten yecircu cầu cập nhật thocircng tin từng phuacutet để coacute thể xacircy dựng được sự đồng thuận
Caacutec loại thocircng tin điều hagravenh- Hệ thống kế toaacuten coacute liecircn quan đến việc tiacutenh toaacuten thu nhập hoạt động cho caacutec lĩnh
vực cụ thể lagrave quan trọng hơn so với caacutec hệ thống kế toaacuten truyền thocircng- Thocircng tin về thị trường khaacutech hagraveng cung cấp giaacute trị trong việc quyết định chiến
lược- Caacutec thocircng tin cần thiết thường được truyền đi trecircn một số hệ thống maacutey tiacutenh vagrave
nằm trong toagraven tổ chức- Caacutec thocircng tin được sử dụng thường lagrave ngắn hạn vagrave dễ thay đổi
Phương thức để xaacutec định thocircng tin cần thiết
Rockart xaacutec định được năm phương thức cơ bản để xaacutec định thocircng tin cần thiết
- Phương thức dựa trecircn kết quả- Phương thức rỗng- Phương thức chỉ số khoacutea- Phương thức tổng hợp nghiecircn cứu- Phương thức dựa vagraveo nhacircn tố then chốt dẫn đến thagravenh cocircng
64 Thagravenh phần EIS
- Sản phẩm EIS đầu tiecircn được phaacutet triển để sử dụng trecircn maacutey tiacutenh cấu higravenh cao nhưng caacutec sản phẩm hiện nay nhằm mục tiecircu lagrave nền tảng ClientServer
- Những nền tảng linh hoạt hơn coacute thể thiacutech ứng với thay đổi trong tổ chức vagrave cocircng nghệ
- Sử dụng dữ liệu thời gian thực dẫn đến quyết định nhanh hơn nhiều thocircng tin hơn
Thagravenh phần phần cứng- Một EIS khocircng đogravei hỏi coacute phần cứng cụ thể hoặc duy nhất nagraveo- Chigravea khoacutea của vấn đề lagrave để đảm bảo rằng caacutec thagravenh phần của EIS tối ưu hoacutea vagrave
phugrave hợp với tagravei nguyecircn maacutey tiacutenh của tổ chức- Hệ thống nagravey phải được cấu higravenh để caacutec nguồn tagravei nguyecircn phugrave hợp với những
người điều hagravenh chuacuteng
Thagravenh phần phần mềm- Traacutei ngược với phần cứng phần mềm thường được chuyecircn mocircn hoacutea cao cho caacutec
bagravei toaacuten về miền- Sự chuyecircn mocircn hoacutea nagravey thường đạt được bằng caacutech sử dụng thagravenh phần off-the-
shelf cho toagraven bộ EIS vagrave caacutec mocirc-đun tugravey chỉnh để đaacutep ứng nhu cầu cụ thể- Lotus Notes lagrave một viacute dụ điển higravenh Noacute coacute thể được sử dụng một migravenh hoặc coacute
thể phục vụ becircn thứ ba mocirc-đun plug-in
Cocircng nghệ EIS hiện nay
Dobrzeniecki đề xuấtphacircn loạitừng cấptheo bachức năng- Loại 1 sản phẩm bao gồmmột bộ đầy đủcaacutec ứng dụngtừ mộtnhagrave cung cấp- Loại 2 sản phẩm đượcthựchiệnở phần đầu củacaacutecsản phẩmDSS đượcphaacutet triển
bởicugravengmộtnhagrave cung cấp- Loại 3 sản phẩmkết hợp với nhautheo bất kỳ số lượngthuộc sở hữu củacocircng ty
65 Xacircy dựng EIS
- Xacircy dựngmộtEISgiống nhưxacircydựngmột số hệ thống khaacutec củamocirc higravenh hệ thống thocircng tin
- Việcphaacutet triểncấu truacutecnecircn được theo dotildeitừ quaacute trigravenh thiết kế đến quaacute trigravenhthực hiện
- Tuy nhiecircn một dự aacuten phaacutet triển EIScoacute xu hướnglagrave thống nhấtvagraveyecircu cầu hỗ trợ caacutec nhagrave quản lyacute latildenh đạo
- Xacircy dựng một EIScoacute thểphaacutet hiện ra đượccaacutectigravenh huống khoacute khănmagravemột nhagrave phaacutet triển chưabao giờ gặp phải
Mocirc higravenh EIS
Khung phaacutet triển một EIS
- Watson et al đề nghị xacircy dựngkhung với ba thagravenh phần+ Caacutech tiếp cận tập trung vagraveo yếu tốcon người vagrave dữ liệu coacute liecircn quan đến EIS+ Quaacute trigravenh phaacutet triển cần sự linh hoạt vagrave tương taacutec+ Người sử dụng - hệ thống hộp thoại bao gồm một ngocircn ngữ hagravenh động để xử lyacute caacutec lệnh
Lợi iacutech của EIS- Dễ duy trigrave caacutec mục tiecircu coacute tổ chức- Dễ truy xuất thocircng tin- Cho pheacutep người sử dụng nacircng cao hiệu suất hơn
- Tăng chất lượng ra quyết định- Cung cấp sự cải tiến cạnh tranh- Tiết kiệm thời gian của người sử dụng- Tăng khả năng vagrave chất lượng giao tiếp- Cung cấp khả năng điều khiển tốt hơn trong tổ chức- Cho pheacutep tham gia caacutec vấn đề vagrave caacutec cơ hội- Cho pheacutep hoạch định- Cho pheacutep tigravem kiếm nguyecircn nhacircn của một vấn đề- Thảo matilden caacutec yecircu cầu của người điều hagravenh
Hạn chế của EIS vagrave 1 số sai lầm cần traacutenh
- Chi phiacute một cuộc khảo saacutetnăm1991 chothấychi phiacute phaacutet triểntrungbigravenh365000USDvớichi phiacute vận hagravenhhagraveng năm lagrave$200000 (EIS)
- Cocircng nghệ hạn chếEIScần phảiđượctiacutech hợp hoagraven toagravenvagraveokiếntruacuteccủadoanh nghiệphiện tại do đoacute noacutelagrave một thaacutech thứclớn đối vớithiết kế
- Hạn chế tổ chức cơ cấu tổ chứccoacute thể khocircng phugrave hợp
Sự hạn chế về tổ chức- Chương trigravenh nghị sự vagrave thời gian chệch EIS mocirc tả một phần việc thực hiện một
chương trigravenh nghị sự vagrave coacute thể dễ dagraveng đạt được sự tin cậy một caacutech chắc chắn- Đồng bộ hoacutea việc quản lyacute sự tin cậy đuacuteng luacutec đặc biệt baacuteo caacuteo EIS coacute thể phaacute
vỡ sự ổn định thiết lập caacutec chu trigravenh baacuteo caacuteo một caacutech tốt nhất- Sự bất ổn EIS phản ứng nhanh coacute thể gacircy ra việc taacutec động trở lại một caacutech
nhanh choacuteng dẫn đến sự thiếu ổn định trong tổ chức
Sự thất bại lagrave thay thế khocircng thể chấp nhận được- Một số yếu tố lagravem EIS thất bại
+ Thiếu sự hỗ trợ về mặt quản lyacute+ Vấn đề chiacutenh trị+ Thất bại của nhagrave phaacutet triển+ Lỗi về cocircng nghệ+ Giaacute cả+ Thời gian
66 Ra quyết định điều hagravenh trong tương lai vagrave EIS
- Coacute một vagravei điều kiện sẽ được hợp nhất cho việc chuyển đổi cocircng nghệ Trong đoacute một vagravei điều kiện coacute thể dễ dự đoaacuten Hai điều kiện magrave ta coacute thể thấy lagrave+ Phaacutet triển cocircng nghệ maacutey tiacutenh trong việc điều hagravenh sẽ tạo ra sự chuyển đổi được chấp nhận một caacutech dễ dagraveng hơn+ Mở rộng traacutech nhiệm điều hagravenh sẽ mở rộng nhu cầu thocircng tin
Tương lai của EIS- EIS thocircng minh Những tiến bộ trong cocircng nghệ AI sẽ được triển khai trong caacutec
EIS- EIS đa phương tiện Cơ sở dữ liệu đa phương tiện sẽ cho pheacutep tiacutech hợp văn bản
giọng noacutei vagrave higravenh ảnh trong tương lai- EIS thocircng tin Tương lai EIS sẽ mở rộng hơn trong việc sử dụng dữ liệu becircn
ngoagravei doanh nghiệp- EIS kết nối Giao tiếp với băng thocircng rộng cho pheacutep kết nối liecircn thocircng lớn hơn
Chương 7 HỆ CHUYEcircN GIA VAgrave TRIacute TUỆ NHAcircN TẠO
71 Caacutec khaacutei niệm
72 Triacute thocircng minh của triacute tuệ nhacircn tạo
73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia
74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia
75 Lợi iacutech vagrave hạn chế của hệ chuyecircn gia
71 Caacutec khaacutei niệm
Chuyecircn mocircn (Expertise) sự hiểu biết rộng trong 1 lĩnh vực hẹp
Hệ chuyecircn gia (Expert Systems)1 chương trigravenh maacutey tiacutenh sử dụng 1 tập caacutec luật dựa trecircn tri thức của con người để giải quyết caacutec vấn đề đogravei hogravei phải coacute sự chuyecircn mocircn
Một số hệ chuyecircn gia nổi tiếng
DENDRAL (Standford 1960s Edward Feigenbaum)
MYCIN (Standford1970s Edward Shortliffe)
PROSPECTOR (MIT 1979)
Triacute tuệ nhacircn tạo (Artificial Intelligence ndash AI)
Triacute tuệ nhacircn tạo một bộ phacircn của ngagravenh khoa học maacutey tiacutenh quan tacircm đến việc thiết kế caacutec hệ thống maacutey tiacutenh thocircng minh đoacute lagrave caacutec hệ thống đưa ra caacutec đặc điểm magrave từ đoacute chuacuteng ta liecircn hệ với sự thocircng minh trong hagravenh động của con người (Barr vagrave Feigenbaum 1981)
Mục điacutech của AI
Mục điacutech khoa học xaacutec định caacutec gợi yacute để giải thiacutech caacutec loại khaacutec nhau của triacute tuệ thực
Mục điacutech kỹ thuật giải quyết caacutec vấn đề trong thế giới thực
Triacute tuệ nhacircn tạo kế thừa nhiều yacute tưởng quan điểm kỹ thuật từ caacutec ngagravenh khoa học khaacutec
- Triết học
- Logic Toaacuten học
- Tiacutenh toaacuten
- Khoa học tacircm lyacute Khoa học nhận thức
- Sinh học Thần kinh học
- Tiến hoacutea
Caacutec lĩnh vực ứng dụng trong Triacute tuệ nhacircn tạo
Mạng nơ ron thần kinh (Neural Networks)
Tiacutenh toaacuten sự tiến hoacutea
(Evolutionary Computation)
Hệ chuyecircn gia (Expert Systems)
Kỹ thuật xử lyacute tiếng noacutei (Speech Processing)
Kỹ thuật xử lyacute ngocircn ngữ tự nhiecircn
(Natural Language Processing)
Lập kế hoạch (Planning)
Robot (Robotics)
Khoa học higravenh ảnh (Vision)
Caacutec kỹ thuật thocircng dụng dugraveng trong AI
Biểu diễn(Representation)
Học (Learning)
Caacutec luật (Rules)
Tigravem kiếm (Search)
72 Triacute thocircng minh của triacute tuệ nhacircn tạo
Con người suy diễn như thế nagraveo
Phacircn loại (Categorization)
Caacutec quy tắc cụ thể
Heuristics
Kinh nghiệm trước đoacute
Dự tiacutenh trước
Maacutey tiacutenh suy diễn như thế nagraveo
Lập luận dựa trecircn luật IF-THEN mocirc tả tri thức được matilde hoacutea dưới dạng caacutec luật
Caacutec khung (Frames) lagrave caacutec đại diện mocirc tả caacutec tigravenh huống giống nhau lagrave điển higravenh của một vagravei phacircn loại
Lập luận dựa trecircn caacutec trường hợp mocirc phỏng giải phaacutep trước đoacute cho một vấn đề hiện tại
Nhận dạng mẫu phaacutet hiện acircm thanh higravenh dạng hoặc caacutec chuỗi dagravei
Caacutec dạng khaacutec của Triacute tuệ nhacircn tạo
Học maacutey- mạng nơron vagrave giải thuật di truyền
Lập trigravenh tự động ndash lagrave những kỹ thuật tạo ra caacutec chương trigravenh để lagravem 1 nhiệm vụ riecircng biệt (cho pheacutep những người khocircng phải lagrave người lập trigravenh coacute thể lập trigravenh được)
Cuộc sống nhacircn tạo ndash nỗ lực để taacutei tạo caacutec hiện tượng sinh học trong caacutec hệ thống dựa trecircn maacutey tiacutenh
73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia(Expert Systems- ES)
Theo Jackson (1999) Một hệ chuyecircn gia lagrave một chương trigravenh maacutey tiacutenh mocirc tả vagrave suy diễn với tri thức của một vagravei lĩnh vực để giải quyết vấn đề hay đưa ra caacutec lời khuyecircn
Cấu truacutec cơ bản của ES được dựa theo cấu truacutec chung của DSS Sự khaacutec biệt chiacutenh giữa ES vagraveDSS lagrave hệ ES thu thập caacutec kiến thức từ những
chuyecircn gia trong lĩnh vực quan tacircmĐặc trưng của hệ chuyecircn gia Hiệu quả cao Thời gian trả lời thỏa đaacuteng Độ tin cậy cao Dễ hiểu
Giao diện người dugraveng trong ES
Thiết kế giao diện người dugraveng tập trung vagraveo caacutec yếu tố như dễ dagraveng sử dụngcoacute độ tin cậy cao giảm tải những khoacute khăn khi sử dụng
Thiết kế necircn coacute một số tương taacutec (đầu vagraveo kiểm soaacutet vagrave truy vấn)
Cấu tạo giao diện người dugraveng gồm coacute magraven higravenh cảm ứng bagraven phiacutem buacutet saacuteng lệnh thoại caacutec phiacutem chuyecircn dụng
Cơ sở tri thức (Knowledge Base)
Chứa đựng caacutec tri thức cụ thể miền thu được từ caacutec chuyecircn gia miền
Coacute thể chứa caacutec mocirc tả caacutec hagravenh vi giải quyết vấn đề caacutec ragraveng buộc caacutec heuristics
Thagravenh cocircng của một ES dựa trecircn tiacutenh đầy đủ vagrave tiacutenh chiacutenh xaacutec của cơ sở tri thức
Mocirc tơ suy diễn (Inference Engine)
Ở đacircy tri thức được đặt để sử dụng tạo ra caacutec giải phaacutep để giải quyết vấn đề
Mocirc tơ nagravey coacute khả năng thực hiện diễn dịch hoặc suy diễn dựa trecircn caacutec luật hay caacutec caacutec sự kiện
Đồng thời cũng coacute khả năng sử dụng caacutec suy diễn mờ hay khocircng chiacutenh xaacutec dựa trecircn xaacutec suất hay aacutenh xạ mẫu
Vograveng điều khiển suy diễn
1 Aacutenh xạ caacutec luật với caacutec sự kiện đatilde được cho
2 Chọn luật để thực hiện
3 Thực hiện luật bằng caacutech thecircm caacutec sự kiện được suy diễn ra vagraveo bộ nhớ lagravem việc
Chuỗi suy diễn (Chaining)
Suy diễn tiến (forward chaining) maacutey suy diễn bắt đầu từ dữ liệu ban đầu vagrave thực hiện việc suy luận để đưa ra caacutec kết luận cuối cugraveng
Suy diễn lugravei (backward chaining) maacutey suy diễn bắt đầu từ dữ liệu điacutech vagrave tigravem ra tri thức hỗ trợ cho dữ liệu điacutech đoacute
Viacute dụ suy diễn lugravei
R1 Nếu coacute A vagrave B thigrave suy ra coacute D
R2 Nếu coacute B thigrave suy ra coacute C
R3 Nếu coacute C vagrave D thigrave suy ra coacute E
Ta coacute E ta xem trong 3 luật R1 R2 R3 luật nagraveo coacute E ta thấy R3 chứa E đồng thời chứa C vagrave D Xeacutet tiếp trong 2 luật R1 R2 luật nagraveo chứa C vagrave D R2 chứa C R3 chứa D Từ đoacute ta coacute được caacutec tri thức hỗ trợ suy diễn vagrave kết luận lagrave nếu coacute A vagrave B thigrave sẽ coacute E Hay nếu A vagrave B đuacuteng thigrave sẽ coacute E
Viacute dụ suy diễn tiến
Giả sử coacute tập chứa 3 luật sau
R1 Nếu coacute A vagrave B thigrave suy ra coacute D
R2 Nếu coacute B thigrave suy ra coacute C
R3 Nếu coacute C vagrave D thigrave suy ra coacute E
Nếu ta coacute A vagrave B thigrave chuacuteng ta suy ra được D từ R1 vagrave suy ra C từ R2 Với D vagrave C đatilde được suy ra ở trecircn giờ chuacuteng ta suy ra được E từ R3
Viacute dụ thực tế
Giả sử muốn biết magraveu của một con vật nuocirci tecircn lagrave Fred biết rằng noacute kecircu ộp ộp vagrave ăn ruồi
Coacute tập 4 luật ban đầu như sau
R1 Nếu X kecircu ộp ộp vagrave ăn ruồi thigrave X lagrave con ếch
R2 Nếu X kecircu chiecircm chiếp vagrave biết hoacutet thigrave X lagrave con chim
R3 Nếu X lagrave con ếch thigrave X coacute magraveu xanh
R4 Nếu X lagrave con chim thigrave X coacute magraveu vagraveng
74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia
Expert system shells lagrave một tập caacutec goacutei phần mềm vagrave caacutec cocircng cụ dugraveng để phaacutet triển caacutec hệ chuyecircn gia
Những Expert system shells đầu tiecircn thường rất rườm ragrave Mặc dugrave vậy noacute vẫn giuacutep cho người sử dụng sẽ khocircng phải bắt đầu lại từ đầu khi xacircy dựng một hệ chuyecircn gia mới
Những shell hiện đại bao gồm hai mocirc-đun chiacutenh lagrave cocircng cụ xacircy dựng một tập quy tắc vagrave mocirc tơ suy diễn
Xacircy dựng hệ chuyecircn gia
Bước 1 xacircy dựng mocirc higravenh bagravei toaacuten xaacutec định vấn đề nhiệm vụ magrave hệ thống sẽ thực hiện Caacutec dạng bagravei toaacuten cần hệ chuyecircn gia
Bagravei toaacuten diễn giải (InterPretation)
Bagravei toaacuten dự baacuteo (Prediction)
Bagravei toaacuten chuẩn đoaacuten (Diagnose)
Bagravei toaacuten gỡ rối (Debugging)
Bagravei toaacuten thiết kế
Tương tự như một dự aacuten phần mềm để xacircy dựng một hệ chuyecircn gia cần phải coacute caacutec yếu tố về nhacircn lực tagravei nguyecircn vagrave thời gian Những yếu tố nagravey ảnh hưởng đến giaacute thah của một hệ chuyecircn giaTrong phần nagravey cacircu hỏi thường được đặt ra lagrave tại sao cần phải xacircy dựng một hệ chuyecircn giaTrước khi bắt đầu phải xaacute định rotilde bagravei toaacuten đạt ra lagrave jiAi lagrave chuyecircn giaAi lagrave người sử dụng
1 Diễn giải (InterPretation) Nghiecircn cứu 1 vấn đề -gt Dựa trecircn những biểu hiện thuộc tiacutenh đặc trưng becircn ngoagravei -gt Tư vấn
(hoặc đưa ra kết luận hay mocirc tả dễ hiểu từ tập dữ liệu thocirc)
2 Bagravei toaacuten dự baacuteo (Prediction) Coacute thể dự đoaacuten được hagravenh vi kết quả dựa trecircn caacutec hiện tượng -gt dự baacuteo
VD Dự baacuteo thời tiết động đấthellip
3 Bagravei toaacuten chẩn đoaacuten (Diagnoss) Xaacutec định caacutec lỗi caacutec bộ phận hỏng hoacutec của hệ thống dựa trecircn caacutec dữ liệu quan saacutet được
4 Bagravei toaacuten gỡ rối (Debugging) Mocirc tả caacutec phương phaacutep khắc phục hệ thống khi gặp sự cố
5 Bagravei toaacuten thiết kế Lựa chọn cấu higravenh caacutec đối tượng nhằm thoả matilden một số ragraveng buộc nagraveo đoacute
6 Giảng dạy Phần mềm dạy học coacute thể chuẩn đoaacuten vagrave sủa lỗi của học sinh trong quaacute trigravenh học tập
Để xaacutec định đuacuteng bagravei toaacuten magrave chuacuteng ta cần giải quyết thigrave phải trả lời đc một số cacircu hỏi
- cần hệ chuyecircn gia
Bước 2 thu thập tri thức lựa chọn cocircng cụ vagrave aacutep dụng
Trong bước thu thập tri thức vấn đề quan trọng lagrave lựa chọn chuyecircn gia những người magrave sẽ đoacuteng goacutep tri thức cho hệ thống Thocircng thường trong suốt quaacute trigravenh phaacutet triển thigrave chuyecircn gia được xem như một thagravenh viecircn của đội phaacutet triển
Hiện nay coacute rất nhiều cocircng cụ để xacircy dựng một hệ chuyecircn gia Phổ biến nhất lagrave JESS CLIPS vagrave OPS5
Bước 3 Thiết kế cơ sở tri thức thiết kế hệ thốngTri thức được biểu diễn trường minh trong cơ sở tri thức
Caacutec chuyecircn gia vagrave kỹ sư tri thức sẽ đối thoại với nhau bằng caacutec kỹ thuật đối thoại Suy diễn (SD) bảng Mocirc higravenh hoacutea SD quy nạp phacircn loại
Vấn đề bagraveo trigrave vagrave phaacutet triển
Caacutec hệ chuyecircn gia đogravei hỏi phải bảo trigrave vagrave phaacutet triển nhiều hơn so với caacutec hệ thống khaacutec Phải thường xuyecircn bổ sung tri thức mới vagrave thay đổi caacutec tri thức cũ để đổi mới hệ chuyecircn gia
Thu thập vagrave khắc phục lỗi do người sử dụng phaacutet hiện để kịp thời khắc phục những sai soacutet của hệ chuyecircn gia
75 Lợi iacutech vagrave hạn chế của caacutec hệ chuyecircn gia
Một số lợi iacutech chiacutenh
Thời gian trả lời hợp lyacute bằng hoặc nhanh hơn so với chuyecircn gia (người) để đi đến cugraveng một quyết định Hệ chuyecircn gia lagrave một hệ thống thời gian thực (real time system)
Khả năng trả lời với mức độ tinh thocircng bằng hoặc cao hơn so với chuyecircn gia (người) trong cugraveng lĩnh vực
Hệ chuyecircn gia giuacutep cho hiệu quả lagravem việc tăng bằng việc sử dụng tập caacutec luật một caacutech nhanh choacuteng magrave ko bị nhầm lẫn chuyecircn gia lagrave người coacute thể quecircn đi một số tri thức cơ sở lyacute luậ nhưng HCG thigrave ko
Quyết định của một người chuyecircn gia coacute thể bị thay đổi vagrave ko coacute tiacutenh thống nhất như quyết định của một hệ chuyecircn gia tạo ra
Hệ chuyecircn gia giuacutep cho người sử dụng coacute thể trau dồi sự hiểu biết trecircn lĩnh vuej cụ thể magrave noacute giải quyết hỗ trợ người ra quyết định coacute trigravenh độ như 1 chuyecircn gia trong quaacute trigravenh gia quyết định
Kiến thức của rất nhiều chuyecircn gia về một lĩnh vực nagraveo đoacute được đưa vagraveo hệ chuyecircn gia lagravem cho CSTT cuat HCG phong phuacute vagrave rộng lớn hơn rất nhiều
HCG giải thiacutech caacutec bước suy luận một caacutech dễ hiểu nhất quaacuten luacutec nagraveo cũng coacute thể sử dụng ko như chuyecircn gia con người
Hạn chế của caacutec hệ chuyecircn gia
Nhược điểm lớn nhất của hệ chuyecircn gia lagrave những yacute kiến chuyecircn mocircn thường rất khoacute matilde hoacutea vagrave giải neacuten
Hệ chuyecircn gia khocircng coacute khả năng tự học tự cập nhật kiến thức mới như caacutec chuyecircn gia magrave cần phải được matilde hoacutea lại khi noacute được cập nhật
Hệ chuyecircn gia khocircng thể nhận ra được vấn đề khocircng nằm trong miền kiến thức của hệ thống
Chương 8 Tri thức vagrave tiếp nhận
1 Bao gồm caacutec vấn đề
Dữ liệu thực tế đo lường hoặc quan saacutet coacute hoặc khocircng coacute bối cảnh
Thocircng tin dữ liệu được tổng hợp một caacutech hữu iacutech để giải quyết những khoacute khăn trong việc đưa ra quyết định
Tri thức bao gồm caacutec ứng dụng quy tắc thocircng tin hướng dẫn của người ra quyết định
2 Những caacutei nhigraven về tri thức
Đại diện lagravem thế nagraveo để diễn tả tri thức viacute dụ như một quyển saacutech khocircng phải lagrave tri thức nhưng noacute lại lagrave một đại diện của tri thức
Sản xuất tri thức lagrave một tập hơp của hagraveng tồn kho coacute thể được sản xuất cũng như mua lại
Tri thức lagrave 1 trong 6 trạng thaacutei của hệ thống
1Dữ liệu 2Thocircng tin 3Cấu truacutec thocircng tin 4Sự thấu hiểu 5Yacute kiến 6 Quyết định
3 Caacutec loại tri thức Phổ biến mocirc tả dữ liệu thocircng tin thủ tục mọi thứ lagravem như thế nagraveo lập luận chiacutenh saacutech hoặc caacutec quy tắc
4 Thu thập Tri thức hệ chuyecircn gia Hầu hết caacutec phương phaacutep đều bắt đầu với mocirc higravenh của caacutec taacutec vụ trong đoacute
hệ chuyecircn gia được xacircy dựng Trong đoacute mocirc tả về caacutec lĩnh vực được tạo ra Caacutec kỹ sư sử dụng caacutec mocirc higravenh giả thuyết vagrave nhận thức về quaacute trigravenh phacircn
tiacutech để gợi ra caacutech giải quyết vấn đề về tri thức từ caacutec chuyecircn gia
5 Caacutec chiều của thu thập tri thức KE- driven caacutec kỹ sư trao đổi trực tiếp với caacutec chuyecircn gia Expert-driven Caacutec chuyecircn gia trực tiếp đưa chuyecircn mocircn của họ vagraveo hệ
thống maacutey tiacutenh Machine-driven Sử dụng caacutec cocircng cụ suy luận để triacutech xuất tri thức từ một
tập caacutec viacute dụ
6 Kỹ thuật thu thập tri thức Trao đổi gồm 2 loại cơ bản lagrave coacute cấu truacutec(coacute kịch bản) vagrave khocircng coacute cấu
truacutec( đối thoại trực tiếp) Giao thức phacircn tiacutech bằng lời Khi caacutec chuyecircn gia thực hiện một cocircng việc
của họ thigrave một bản ghi về cocircng việc đoacute được thực hiện Caacutec kỹ sư sẽ xacircy dựng mocirc higravenh cho những gigrave được ghi lại trong bản ghi
Phương phaacutep sagraveng lọc caacutec chuyecircn gia so saacutenh caacutec nhoacutem liecircn tiếp trong ba đối tượng vagrave cho biết tại sao nhoacutem thứ hai lại khaacutec nhoacutem thứ ba
7 Thu thập tri thức từ nhiều nguồn Thu thập tri thức từ nhiều nguồn lagrave cần thiết để coacute được đầy đủ caacutec tri thức
cho một vấn đề quan điểm yacute kiến traacutei ngược nhau thường phaacutet sinh Phương phaacutep đồng thuận sẽ giuacutep giải quyết được vấn đề macircu thuẫn Kỹ thuật phacircn tiacutech Meta lagrave kỹ thuật được aacutep dụng trong caacutec trường hợp
khaacutec Caacutech tiếp cận bằng định lượng đogravei hỏi caacutec kỹ sư cần cacircn nhắc yếu tố đầu vagraveo của caacutec chuyecircn gia khaacutec nhau
8 Xaacutec nhận hợp lệ vagrave kiểm tra tri thức Một khi thu thập tri thức noacute phải được đaacutenh giaacute về khả năng sử dụng vagrave độ
chiacutenh xaacutec Hai vấn đề cụ thể lagrave hiệu lực của những kiến thức vagrave kiểm tra việc xacircy dựng cơ sở của tri thức
Cần xaacutec nhận xem liệu hệ thống coacute thể hoạt động ở mức độ tối thiểu khocircng
Xaacutec minh liecircn quan đến việc so saacutenh từng chi tiết kỹ thuật của hệ thống những gigrave đatilde được thực hiện cuối cugraveng
9 Một số caacutec biện phaacutep xaacutec nhận Độ chiacutenh xaacutec Khả năng thiacutech nghi Mức độ đầy đủ Bề rộng Độ sacircu Hiệu lực Tổng quan Chiacutenh xaacutec Hiện thực Độ tin cậy Tiacutenh hữu dụng Mức độ
Chương 9 Học maacutey
1 Logic mờ vagrave ngocircn ngữ mờ(Fuzzy Logic and Linguistic Ambiguity)
Ngocircn ngữ tự nhiecircn gồm những khaacutei niệm mơ hồ vagrave khocircng chiacutenh xaacutectruyền tải ngữ nghĩa thocircng qua tiacutenh xấp xỉkhocircng rotilde ragraveng
Những xấp xỉ nagravey giuacutep con người coacute thể truyền tải hết được yacute nghĩa nhưng maacutey thigrave khocircng hiểu
Lagravem sao biểu diễn caacutec tri thức sử dụng caacutec khaacutei niệm khocircng rotilde ragraveng(mờ) hoặc khocircng chiacutenh xaacutec
2 Khaacutei niệm cơ bản của logic mờ tập mờ lagrave những tập hợp khocircng coacute một giới hạn rotilde Mỗi phần tử của noacute chỉ
chứa một mức độ hagravem liecircn thuộc của từng phần tử Vigrave vậy tập mờ khocircng giống như tập cổ điển Tập mờ coacute thể kết hợp với nhau qua những luật mờ magrave đặc trưng cho những hagravenh động trạng thaacutei vagrave thuộc tiacutenh của logic mờ được tận dụng khi thực hiện một bộ điều khiển mờ
Logic mờ dựa trecircn yacute tưởng mỗi phần tử thuộc vagraveo một tập hợp ở một mức độ nagraveo đấy
Locircgic mờ cho pheacutep độ liecircn thuộc (microA )coacute giaacute trị trong khoảng (01) Locircgic mờ coacute thể được coi lagrave mặt ứng dụng của lyacute thuyết tập mờ để xử lyacute caacutec
giaacute trị trong thế giới thực cho caacutec bagravei toaacuten phức tạp
3 So saacutenh tiacutenh đuacuteng đắn logic mờ vagrave xaacutec suất Xaacutec suất thigrave đề cập đến khả năng xảy ra một biến cố hay một điều gigrave đoacute Logic mờ đề cập đến cấp độ magrave đặc tiacutenh ở hiện tại
o viacute dụ1 người coacute chiều cao 6 feet thigrave coacute cấp độ lagrave 05 về chiều cao
4 Ưu điểm của logic mờ Caacutech tiếp cận rất tự nhiecircnkhocircng phức tạp Coacute thể mocirc higravenh hoacutea caacutec hagravem phi tuyến tugravey yacute phức tạp
Coacute thể tận dụng được kinh nghiệm từ những chuyecircn gia hagraveng đầu trong mọi lĩnh vực
Logic mờ được xacircy dựng dựa trecircn ngocircn ngữ tự nhiecircnNền tảng của logic mờ lagrave dựa trecircn cơ sở giao tiếp của con người
5 Nhược điểm của logic mờ Trong 1 hệ thống phức tạpsử dụng logic mờ coacute thể trở thagravenh trở ngại cho
việc xaacutec thực độ tin cậy của hệ thống Cơ chế lập luận mờ khocircng thể học hỏi từ những lỗi sai
6 Mạng noron nhacircn tạo(ANN) Mạng noron nhacircn tạo lagrave một mocirc phỏng xử lyacute thocircng tinđược nghiecircn cứu ra
từ hệ thống thần kinh của sinh vậtgiống như bộ natildeo để xử lyacute thocircng tin ANNs lagrave chương trigravenh dựa trecircn maacutey tiacutenh đơn giản coacute chức năng lagrave một mocirc
higravenh bagravei toaacuten khocircng gian dựa trecircn thử nghiệm vagrave baacuteo lỗi
7 Học từ kinh nghiệm Tiến trigravenh Một mẫu dữ liệu được biểu diễn như một mạng lưới noronANN ldquodự
đoaacutenrdquo 1 đầu radự đoaacuten được so saacutenh với giaacute trị thực tế hoặc giaacute trị chiacutenh xaacutecNếu đoaacuten được chiacutenh xaacutec thigrave khocircng coacute hagravenh động nagraveo được thực hiện
Nếu dự đoaacuten sai ANN kiểm tra lại vagrave xaacutec định lại thocircng số để điều chỉnh Một mẫu dữ liệu khaacutec được biểu diễn vagrave quaacute trigravenh nagravey được lặp lại
8 Nguyecircn tắc cơ bản của cocircng nghệ nơron Caacutec yếu tố xử lyacute cơ bản trong hệ thống thần kinh của con người lagrave tế bagraveo
thần kinhMạng lưới của tế bagraveo nagravey lagrave liecircn kết với nhau nhận được thocircng tin từ caacutec cảm biến trong mắt taihellip
Thocircng tin nhận được bởi tế bagraveo thần kinh hoặc lagrave sẽ kiacutech thiacutech noacute(sẽ được chuyển qua 1 thocircng điệp dọc theo mạng lưới) hoặc lagrave sẽ ngăn cản noacute(ngăn cản dograveng thocircng tin)
Độ nhạy coacute thể thay đổi qua thời gian hoặc sau khi coacute được kinh nghiệm
9 Cấu truacutec mạng Một ANN gồm 3 lớp cơ bản
Lớp đầu vagraveo nhận dữ liệu Lớp becircn trong hoặc lagrave lớp ẩn xử lyacute dữ liệu Lớp đầu ra chuyển tiếp kết quả cuối cugraveng của mạng
10Mạng nơ ron Thường coacute nhiều đầu vagraveo mỗi đầu vagraveo với mức ảnh hưởng vagrave tầm quan
trọng riecircng của noacute Một đầu vagraveo quan trọng coacute thể được sử dụng để khuếch đại đầu ra caacutec hagravem trạng thaacutei tổng hợp caacutec trọng số của caacutec yếu tố
đầuvagraveo khaacutec nhauvagraveo một giaacute trị duy nhất Caacutec hagravem chuyển giao xử lyacute caacutec giaacute trị trạng thaacutei vagrave tạo đầu ra
11Huấn luyện mạng nơ ron Trong mocirc higravenh coacute giaacutem saacutetANN được đến so saacutenh dự đoaacuten của chiacutenh
noacute với thocircng tin phản hồi coacute chứa caacutec kết quả mong muốn ANN sẽ phải tigravem caacutech thay đổi caacutec tham số becircn trong củamigravenh (caacutec trọng số vagrave caacutec ngưỡng) để tạo necircn một aacutenh xạ coacute khả năng aacutenh xạcaacutec đầu vagraveo thagravenh caacutec đầu ra mong muốn Sự thay đổi nagravey được tiến hagravenh nhờ việc so saacutenh giữa đầu ra thực sự vagrave đầu ra mong muốn
Trong mocirc higravenh khocircng coacute giaacutem saacutetANN nhận được dữ liệu vagraveo nhưng khocircng phải coacute bất kỳ thocircng tin phản hồi về kết quả mong muốn
Phần lớn caacutec ứng dụng nằm trong vugraveng của caacutec bagravei toaacuten ước lượng như mocirc higravenh hoacuteathống kecirc neacuten lọc phacircn cụm
12Lợi iacutech Liecircn kết với mạng noron Traacutenh caacutech lập trigravenh tường minh Giảm nhu cầu của chuyecircn gia ANNs thigrave thiacutech nghi với caacutec yếu tố đầu vagraveo thay đổi Khocircng cần thiết cho cơ sở tri thức tinh chế ANNs coacute tiacutenh động vagrave cải thiện với việc sử dụng Coacute khả năng xử lyacute dữ liệu khocircng chiacutenh xaacutec hoặc khocircng đầy đủ Cho pheacutep tổng quaacutet hoacutea từ thocircng tin cụ thể Cho pheacutep thu thập cảm giaacutec thocircng thường vagraveo miền giải quyết vấn đề
13Hạn chế của việc liecircn kết với mạng noron ANNs khocircng thể giải thiacutech được suy luận Bản chất hộp đen thường khiến cho vấn đề traacutech nhiệm vagrave độ tin cậy phaacutet
sinh lagrave khoacute khăn Lặp đi lặp lại quaacute trigravenh huấn luyện rất tốn thời gian Nguồn lực caacutec nhagrave phacircn tiacutech vagrave thiết kế coacute tay nghề cao vẫn lagrave đaacuteng lo
ngại Cocircng nghệ ANN thuacutec đẩy hạn chế của phần cứng hiện tại ANN yecircu cầu phải coacute sự tin tưởng ở đầu ra
14Giới thiệu về thuật toaacuten di truyền Cũng như mạng lưới thần kinh caacutec thuật toaacuten di truyền được dựa trecircn lyacute
thuyết sinh học Thuật toaacuten di truyền tigravem thấy nguồn gốc của chuacuteng trong caacutec lyacute thuyết
tiến hoacutea của chọn lọc tự nhiecircn vagrave thiacutech ứng với biến đổi khiacute hậu Kết quả thuật toaacuten di truyền lagrave từ giao phối 2 caacute thể trong quần thế để tạo
ra con caacutei đocirci khi tốt hơn so với bậc cha mẹ của chuacuteng 15Caacutec thagravenh phần cơ bản của thuật toaacuten di truyền
Toaacuten tử chọn lọc Caacutec caacute thể tốt được chọn lọc để đưa vagraveo thế hệ sau Sự chọn lọc nagravey căn cứ vagraveo độ thiacutech nghi với mocirci trường của mỗi caacute thể
Toaacuten tử lai gheacutep (crossover) Hai caacute thể cha vagrave mẹ trao đổi caacutec gen với nhau để tạo ra caacute thể con
Toaacuten tử đột biến (mutation) Một caacute thể thay đổi một số gen để biến đổi thagravenh một caacute thể mớiTất cả caacutec toaacuten tử trecircn khi thực hiện đều mang tiacutenh ngẫu nhiecircn
16Quaacute trigravenh cơ bản của một thuật toaacuten di truyền Khởi tạo
Đaacutenh giaacute quần thể
Lựa chọn NST thiacutech hợp nhất vagrave loại bỏ NST yếu nhất
Quy trigravenh giao nhau vagrave cải thiện quần thể
đột biến tiến trigravenh để khaacutem phaacute ra NST mới
17Ưu nhược điểm của việc kết hợp với thuật toaacuten di truyền Kiacutech thước quần thể lagrave 1 yếu tố quan trọng trong tốc độ của việc tigravem
kiếmnhưng noacute tương đối dễ dagraveng để dự đoaacuten tốc độ nagravey Giao nhau hoặc đột biến lagrave khocircng necircn đc sử dụng quaacute thường xuyecircn Luocircn coacute được iacutet nhất 1 giải phaacutep hợp lyacute Necircn coacute thể aacutep dụng chuacuteng cho caacutec vấn đề magrave chuacuteng ta khocircng coacute hướng
về caacutech giải quyết Sức mạnh của thuật toaacuten xuất phaacutet từ khaacutei niệm đơn giảnkhocircng phải từ
một thủ tục thuật toaacuten phức tạp 18Tương lai của học maacutey
Mạng lưới thần kinh nhacircn tạo vượt quaacute năng lực của con người trong caacutec trường hợp bị cocirc lập
Về mặt lyacute thuyếtmột maacutey tiacutenh coacute thể xử lyacute dũ liệu nhanh hơn hagraveng triệu lần so với 1 con người
May mắn thay cho chuacuteng tacon người tốt hơn nhiều khi magrave coacute được dữ liệumaacutey tiacutenh khocircng coacute 1 số thứ như lagrave 5 giaacutec quan
CHƯƠNG 10 KHO DỮ LIỆU
1 Kho dữ liệu Kho dữ liệu lagrave tuyển tập caacutec cơ sở dữ liệu tiacutech hợp hướng chủ đề được
thiết kế để trợ giuacutep cho một hệ hỗ trợ quyết định
Theo John Ladley Cocircng nghệ kho dữ liệu lagrave tập caacutec phương phaacutep kỹ thuật vagrave caacutec cocircng cụ coacute thể kết hợp hỗ trợ nhau để cung cấp thocircng tin cho người sử dụng trecircn cơ sở tiacutech hợp từ nhiều nguồn dữ liệu nhiều mocirci trường khaacutec nhau
Kho dữ liệu thường rất lớn tới hagraveng trăm GB hay thậm chiacute hagraveng Terabyte
2 Kho dữ liệu vận hagravenh (ODS) Một kho dữ liệu vận hagravenh Aacutep dụng kỹ thuật kho dữ liệu vagraveo caacutec hệ xử
lyacute giao taacutec lưu trữ dữ liệu cho một ứng dụng đặc thugrave Noacute đưa vagraveo kho dữ liệu một dograveng caacutec dữ liệu thocirc được thiết kế
3 So saacutenh
Kho dữ liệu vận hagravenh Kho dữ liệu
Dữ liệu theo chủ đề Dữ liệu theo chủ đề
Dữ liệu tiacutech hợp Dữ liệu tiacutech hợp
Dữ liệu thay đổi Dữ liệu khocircng thay đổi
Dữ liệu được cập nhật khi thay đổi
Dữ liệu giữ nguyecircn
Chỉ coacute dữ liệu hiện tạiDữliệu hiện tại vagrave dữ liệu lịch sử
Chu kỳ lagravem tươi dữ liệu ngắn Chu kỳ lagravem tươi dữ liệu dagravei
Chỉ coacute dữ liệu chi tiết Dữ liệu chi tiết vagrave dữ liệu tổng kết
Dugraveng cho caacutec quyết định ngắn hạn
Dugraveng cho hoạch định dagravei hạn
4 Kho dữ liệu cục bộ (Data Mart - DM)
Kho dữ liệu cục bộ lagrave CSDL coacute những đặc điểm giống với kho dữ liệu nhưng với quy mocirc nhỏ hơn vagrave lưu trữ dữ liệu về một lĩnh vực một chuyecircn ngagravenh
Data mart phụ thuộc Chứa những dữ liệu được lấy từ DW vagrave những dữ liệu nagravey sẽ được triacutech lọc vagrave tinh chế tiacutech hợp lại ở mức cao hơn để phục vụ một chủ đề nhất định của Datamart
Data mart độc lập Khocircng giống như Datamart phụ thuộc Data mart độc lập được xacircy dựng trước DW vagrave dữ liệu được trực tiếp lấy từ caacutec nguồn khaacutec nhau
5 Siecircu dữ liệu Metadata lagrave dữ liệu để mocirc tả dữ liệu Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột
một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi Metadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu
6 Mocirci trường kho dữ liệu Hệ thống của tổ chức vagrave kho cung cấp dữ liệu để xacircy dựng kho dữ liệu Trong quaacute trigravenh chuyển dữ liệu từ caacutec nguồn khaacutec nhau dữ liệu coacute thể
được lagravem sạch hoặc chuyển đổi vagrave vigrave thế DW được xem như lagrave một chuẩn cho việc lưu trữ
Đồng thời siecircu dữ liệu được ghi lại Cuối cugraveng DW hoặc siecircu thị coacute thể được sử dụng để tạo ra một kho dữ
liệu ldquocaacute nhacircnrdquo 7 Caacutec đặc điểm của kho dữ liệu
Đặc điểm Mocirc tả
Hướng chủ đề - DL tổ chức theo caacutech thức người dugraveng tham chiếu
Tiacutech hợp - Dữ liệu ldquosạchrdquo loại bỏ tiacutenh thiếu nhất quaacuten
Khocircng thay đổi - DL ldquochỉ đọcrdquo người dugraveng khocircng thay đổi được
Chuỗi thời gian - DL lagrave chuỗi thời gian khocircng phải lagrave trạng thaacutei hiện tại
Được tổng kết - DL vận hagravenhthao taacutec khi cần thiết
được kết hợp lại thagravenh dạng coacute thể dugraveng được cho quyết định
Kiacutech cỡ lớn hơn - Lưu giữ theo chuỗi thời gian tức lagrave giữ lại nhiều DL
Khocircng được chuẩn hoacutea - Coacute thể dư thừa DLSiecircu dữ liệu - Dữ liệu của dữ liệu được lưu trữNguồn dữ liệu - DL vận hagravenh (caacutec hệ sẵn coacute) cugraveng
với caacutec nguồn ngoagravei 8 Kho dữ liệu hướng chủ đề
Hướng chủ để coacute nghĩa lagrave kho dữ liệu được tổ chức xung quanh caacutec chủ đề chiacutenh như khaacutech hagraveng sản phẩm sản xuất Tập trung vagraveo việc mocirc higravenh hoacutea vagrave phacircn tiacutech dữ liệu cho caacutec nhagrave ra quyết định magrave khocircng tập trung vagraveo caacutec xử lyacute thocircng thường Cung cấp cho người dugraveng một khung nhigraven toagraven vẹn đơn giản vagrave đầy đủ về caacutec sự kiện quanh caacutec chủ đề
9 Dữ liệu trong DW được tiacutech hợp Dữ liệu trong kho dữ liệu được xacircy dựng bằng caacutech tổng hợp dữ liệu từ
nhiều nguồn khaacutec nhau vagrave caacutec nguồn coacute tổ chức khaacutec nhau Cơ sở dữ liệu caacutec file excel caacutec flat file hoặc caacutec raw file Khi đưa vagraveo kho dữ liệu caacutec dữ liệu được lagravem sạch vagrave tiacutech hợp dữ liệu nhằm đảm bảo tiacutenh nhất quaacuten của dữ liệu
10Kiến truacutec kho dữ liệu Tầng cơ sở dữ liệu hoạt động Tầng truy xuất thocircng tin Tầng truy xuất dữ liệu Tầng siecircu dữ liệu Tầng quản lyacute tiến trigravenh Tầng thocircng điệp của ứng dụng Tầng vật liacute của kho dữ liệu Tầng trigravenh diễn dữ liệu
11Higravenh trạng kho dữ liệu Kho dữ liệu ảo - người dugraveng cuối coacute thể truy cập trực tiếp đến kho dữ liệu
sử dụng caacutec cocircng cụ cho pheacutep ở tầng truy xuất dữ liệu Kho dữ liệu trung tacircm-1 cơ sở dữ liệu vật lyacute chứa tất cả dữ liệu cho một
vugraveng chuyecircn dụng nagraveo đoacute
Kho dữ liệu phacircn taacuten- Thagravenh phần được phacircn taacuten qua nhiều hệ cơ sở dữ liệu vật lyacute
12METADATA- Siecircu dữ liệu Định nghĩa Siecircu dữ liệu lagrave dữ liệu về dữ liệu Lagrave 1 lưu trữ dugraveng để
Miecircu tả kho dữ liệu tổng thể Nhận dạng kiểu kho dữ liệu Quản liacute quaacute trigravenh tiacutech hợp dữ liệu Quản liacute quaacute trigravenh cập nhật kho dữ liệu Quản liacute bảo mật
Lagrave chigravea khoacutea quyết định sự thagravenh cocircng của kho dữ liệu luocircn được thay đổi vagrave cập nhật theo sự phaacutet triển của kho dữ liệu
Dugraveng để quản liacute điều khiển kho dữ liệu Sự ra đời của kho dữ liệu như 1 cấu truacutec hỗ trợ ra quyết định siecircu dữ liệu
được xem như nguồn tagravei nguyecircn dữ liệu Siecircu dữ liệu lagrave trừu tượng Chuacuteng lagrave dữ liệu bậc cao cung cấp mocirc tả ngắn
gọn caacutec dữ liệu bậc thấp hơn 13Hoạt động của Siecircu dữ liệu
Siecircu dữ liệu rất cần thiết trong việc chuyển hoacutea thocircng tin trở thagravenh tri thức Lagrave chigravea khoacutea giuacutep chuacuteng ta xử lyacute được dữ liệu thocirc Viacute dụ một dograveng dữ liệu baacuten hagraveng 1023 K596 11121 agraveNoacute sẽ khocircng coacute nghĩa gigrave cho đến khi chuacuteng ta đưa vagraveo siecircu dữ liệu (thư
mục chứa dữ liệu) agrave cửa hagraveng 1023 sản phẩm K596 vagrave số tiền baacuten được lagrave 11121 đocirc la
14Sự cần thiết phải nhất quaacuten trong kho dữ liệu Kho dữ liệu được xacircy dựng cho lợi iacutech của những nhagrave phacircn tiacutech kinh
doanh caacutec nhagrave quản trị cho tất cả caacutec khu vực chức năng Trong cơ sở dữ liệu riecircng caacutec khu vực khaacutec nhau coacute thể định nghĩa vagrave lưu
trữ dữ liệu thocircng qua phiecircn bản của chiacutenh noacute Khi dữ liệu được lấy từ những vugraveng khaacutec nhau đoacute vagrave được đặt vagraveo kho dữ
liệu Việc chuyển đổi vagrave lagravem sạch caacutec tiến trigravenh sẽ đảm bảo noacute lagrave duy nhất được tiacutech hợp tại một mức của tổ chức
15Ragrave soaacutet lại dữ liệu ndash Thực thi siecircu dữ liệu
Bất kể cấu truacutec tự nhiecircn của 1 cacircu truy vấn thế nagraveo thigrave caacutec thagravenh phần của siecircu dữ liệu rất quan trọng đối với người ra quyết định
Bảng thuộc tiacutenh khoacutea được lưu trữ bởi kho dữ liệu Tập hợp dữ liệu được lấy từ đacircu Những chuyển đổi nagraveo được thực thi với việc lagravem sạch
16Siecircu dữ liệu lagrave gigrave Metadata - lagrave thocircng tin mocirc tả nội dung của cơ sở dữ liệu (CSDL) Metadata baacuteo cho người dugraveng biết thời gian cập nhật sau cugraveng của dữ liệu
định dạng vagrave mục điacutech sử dụng của noacute Những thocircng tin nagravey coacute thể hướng dẫn người dugraveng duyệt qua CSDL vagrave
giuacutep họ hiểu được yacute nghĩa vagrave ngữ cảnh của dữ liệu Trong CSDL metadata lagrave caacutec dạng biểu diễn khaacutec nhau của caacutec đối tượng
trong CSDL Trong CSDL quan hệ metadata lagrave caacutec định nghĩa của bảng cột CSDL
view vagrave nhiều đối tượng khaacutec Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột
một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi -gtMetadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu
Bảng chuyển đổi Ghi lại những chuyển đổi đatilde được thực hiện
Lịch sử thực thi Ghi lại những dữ liệu đatilde được
phacircn tiacutech
Higravenh thaacutei kết nốiGhi lại những dữ liệu được kết nối vagrave tần suất
17Aacutenh xạ thocircng thường của siecircu dữ liệu Bản ghi aacutenh xạ chuyển đổi bao gồm
Định danh của nguồn gốc Chuyển đổi thuộc tiacutenh Chuyển đổi thuộc tiacutenh vật lyacute Matilde hoacutea tham chiếu bảng chuyển đổi Đổi tecircn Đổi khoacutea Gaacuten giaacute trị cho thuộc tiacutenh mặc định Chọn logic cho caacutec nguồn nhiều giaacute trị Đổi thuật toaacuten
18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để
phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai
lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave
tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec
Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm
Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo
19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua
caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau
SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được
Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra
một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức
Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ
Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ
Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech
CHƯƠNG 11 KHAI PHAacute DỮ LIỆU
1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn
ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993
Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng
2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd
1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều
2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP
3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn
4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng
5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server
6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo
7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động
8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời
9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều
10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện
11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech
12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP
3 Xử lyacute phacircn tiacutech trực tuyến OLAP
MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave
dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu
ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave
thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu
HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave
ROLAP4 Khai phaacute dữ liệu
Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh
khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn
Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan
5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp
6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại
Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp
Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec
Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt
Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra
Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh
vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho
Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec
Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm
Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục
Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng
gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp
Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn
Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec
Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper
Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2
Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25
Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước
Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng
Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện
trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp
Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute
độ hỗ trợ ge ngưỡng minsup
độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan
Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn
Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết
Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu
MOLAP ROLAP HOLAP
Lưu trữ dữ liệu cơ sở
Khối Bảng quan hệ Bảng quan hệ
Lưu trữ thocircng tin tổng hợp
Khối Bảng quan hệ Khối
Hiệu suất thực hiện truy vấn
Nhanh nhất Chậm nhất Nhanh
Tiecircu thụ khocircng gian lưu trữ
Nhiều Thấp Trung bigravenh
Chi phiacute bảo trigrave Cao Thấp Trung bigravenh
Sự phacircn xử
Hệ thocircng tin dựa trecircn vấn đề
Nemawashi
Kỹ thuật nhoacutem định danh
1-Mỗi người tham gia viết ra những yacute tưởng về những gigrave necircn quyết định
2-Lần lượt mỗi người tham gia trigravenh bagravey yacute tưởng của migravenh được ghi lại trecircn bảng Khocircng thảo luận ở đacircy
3-Sau khi tất cả caacutec yacute tưởng được trigravenh bagravey caacutec đại biểu coacute thể chất vấn những người khaacutec
4-Mỗi người tham gia bỏ phiếu cho mỗi yacute tưởng
Kỹ thuật Delphi
Về cơ bản tương tự như kỹ thuật nhoacutem định danh ngoại trừ những người khocircng bao giờ tham gia cuộc họp
Một cocircng cụ khảo saacutet được sử dụng để thu thập đầu vagraveo ban đầu từ caacutec thagravenh viecircn
Một cuộc khảo saacutet thứ hai được gửi đi với một bản toacutem tắt caacutec kết quả chung
Những bước lặp lại cho đến khi đạt được một sự đồng thuận hoặc nhigraven nhận của đa số
Sự phacircn xử(Arbitration )
Thiacutech hợp nhất khi caacutec thagravenh viecircn của MDM đại diện cho caacutec yếu tố đối lập
Những người tham gia đồng yacute rằng nếu lựa chọn thay thế hai becircn thỏa thuận khocircng được tigravem thấy thigrave một trọng tagravei viecircn becircn ngoagravei sẽ tham gia
Trọng tagravei sau đoacute lựa chọn thay thế ocircng hoặc xeacutet thấy thiacutech hợp nhất
Hệ thống thocircng tin dựa trecircn vấn đề (IBIS)
Lagrave một phương phaacutep lập luận cấu truacutec
Một đại diện cho IBIS lagrave một đồ thị với caacutec nuacutet vagrave caacutec liecircn kết
IBIS bắt đầu với lựa chọn của một nuacutet vấn đề gốc sau đoacute caacutec nuacutet vị triacute khaacutec nhau được liecircn kết với nuacutet gốc
Caacutec nuacutet vị triacute nagravey sau đoacute được đaacutenh giaacute dựa trecircn những lập luận gắn liền với chuacuteng
Nemawashi (được sử dụng rộng ratildei tại Nhật Bản)
1-Một hoặc nhiều thagravenh viecircn của MDM được chỉ định lagrave điều phối viecircnCaacutec điều phối viecircn sau đoacute chọn người tham gia cograven lại
2-Điều phối viecircn xacircy dựng một tổng hợp caacutec sự lựa chọn vagrave sau đoacute caacutec chuyecircn gia đaacutenh giaacute caacutec lựa chọn
3-Điều phối viecircn lựa chọn một sự lựa chọn dựa trecircn kết quả ở trecircn(ở 2)
4-Sự thay thế được luacircn chuyển điều phối viecircn tigravem kiếm sự đồng thuận thocircng qua sự thuyết phục vagrave đagravem phaacuten
5-Nếu đạt được sự đồng thuận điều phối viecircn cho lưu thocircng một tagravei liệu magrave mỗi thagravenh viecircn MDM để lại dấu hiệu trecircn đoacute
55Nơi lagravem việc ảo
Nhiều tổ chức trecircn toagraven thế giới kinh doanh bất động sản cho cocircng nghệ hợp taacutec
Cocircng việc được trở thagravenh một điều bạn lagravem hơn lagrave một nơi bạn đi
Những thay đổi lớn nhất mang lại bởi nơi lagravem việc ảo coacute thể lagrave về văn hoaacute hay xatilde hội hơn lagrave về cocircng nghệ
Chương 6 Hệ thống thocircng tin điều hagravenh
61 Yacute nghĩa của EIS- Hệ thống thocircng tin điều hagravenh
- EIS lagrave một dạng đặc biệt của DSS được thiết kế để hỗ trợ ra quyết định ở cấp cao nhất của một tổ chức
- Lagrave một hệ thống thocircng tin hỗ trợ nhu cầu lập kế hoạch vagrave đaacutenh giaacute của caacutec nhagrave quản lyacute điều hagravenh
- EIS coacute thể giuacutep một CEO coacute được bức tranh tổng thể chiacutenh xaacutec nhất về caacutec hoạt động vagrave một bản toacutem tắt những gigrave magrave đối thủ cạnh tranh đang lagravem
- Caacutec hệ thống nagravey noacutei chung hoạt động dễ dagraveng vagrave trigravenh bagravey thocircng tin theo những caacutech dễ hiểu để việc tiếp thu được nhanh choacuteng (biểu đồ đồ thịhellip)
(Tagravei liệu thecircm EIS lagrave những loại hệ thống lagrave rất phức tạp trong tự nhiecircn Coacute thể noacutei hệ thống nagravey cũng cung cấp cho caacutec nhagrave quản lyacute với caacutec thiết bị coacute khả năng ra quyết định bằng caacutech sử dụng của noacute Hệ thống nagravey hoạt động trong điều kiện như vậy quan trọng như trong caacutec hệ thống khaacutec khocircng hỗ trợ Khả năng lưu trữ dữ liệu nặng lagravem cho noacute lyacute tưởng để được thocircng qua khocircng chỉ bởi caacutec doanh nghiệp lớn magrave cograven bởi caacutec doanh nghiệp nhỏ hơn Nhigraven chung hệ thống nagravey lagrave dagravenh cho caacutec nhacircn viecircn cấp cao hỗ trợ thagravenh thạo trong việc đưa ra caacutec quyết định quan trọng)
Caacutec phiecircn EIS tiecircu biểu- Phiecircn lagravem việc coacute thể bắt đầu với một baacuteo caacuteo về tigravenh higravenh tagravei chiacutenh vagrave kinh
doanh của một cocircng ty caacutec chỉ số hoạt động quan trọng được hiển thị rotilde ragraveng- EIS sẽ cho pheacutep caacutec giaacutem đốc điều hagravenh coacute thể đi sacircu vagraveo dữ liệu từ những con
số bất kỳ magrave noacute hỗ trợ- Việc điều hagravenh coacute thể lựa chọn một mức độ chi tiết ( VD danh số baacuten hagraveng) nếu
như cần điều tra thecircm- Lagrave một phương phaacutep tiếp cận coacute thể giuacutep việc ra quyết định tốt hơn
Những điều magrave EIS ko coacute- EIS khocircng phải lagrave sự thay thế cho caacutec hệ thống dựa trecircn caacutec maacutey tiacutenh khaacutec EIS
thực sự chỉ cung cấp dữ liệu cho caacutec hệ thống nagravey- Noacute khocircng thể biến caacutec bộ hệ điều hagravenh của maacutey tiacutenh thagravenh những ldquochuyecircn viecircn
giỏirdquo- Coacute thể được viacute một caacutech cao hơn như lagrave một trợ lyacute đaacuteng tin cậy coacute thể được gọi
đến bất khi nagraveo vagrave mỗi khi cần thiết
Tagravei liệu thecircm Sự khaacutec nhau giữa EIS vagrave DSS+ EIS thiết kế để hỗ trợ những người điều hagravenh cấp cao giuacutep họ khaacutem phaacute caacutec vấn đề vagrave caacutec cơ hội DSS hỗ trợ những nười phacircn tiacutech cố gắng trả lời cacircu hỏi caacutei gigrave coacute thể lagravem cugraveng với một cơ hội hoặc một vấn đề
Chiều EIS DSSNhững người sử dụng thocircng thường
Duyệt dữ liệu đi xuống truy xuất trạng thaacutei
Hỗ trợ phacircn tiacutech vagrave quyết định
Sự thuacutec đẩy Tiacutenh thiacutech hợp Tiacutenh hiệu quảỨng dụng Queacutet mocirci trường đaacutenh giaacute
hiệu suất nhận dạng caacutec vấn đề vagrave caacutec cơ hội
Caacutec quyết định quản lyacute trecircn caacutec lĩnh vực đa dạng
Hỗ trợ quyết định Caacutec chiacutenh saacutech caacutec quyết định khocircng coacute cấu truacutec ở mức cao vagrave hỗ trợ giaacuten tiếp
Hỗ trợ caacutec quyết định lặp lại caacutec quyết định khocircng thể đoaacuten trước ra quyết định khocircng coacute cấu truacutec vagrave baacuten cấu truacutec
Loại thocircng tin Caacutec thocircng tin tin tức thocircng tin becircn ngoagravei về khaacutech hagraveng đối thủ cạnh tranh mocirci trường caacutec baacuteo caacuteo theo yecircu cầu vagrave định thời về caacutec hoạt động becircn trong
Caacutec thocircng tin hỗ trợ caacutec tigravenh huống đặc biệt
Sử dụng coacute nguyecircn tắc
Dograve theo vết vagrave điều khiển nhận dạng cơ hội
Hoạch định tổ chức phacircn nhoacutem vagrave điều khiển
Khả năng phugrave hợp với những người sử dụng caacute nhacircn
Thiết kế loại ra quyết định cho mỗi người điều hagravenh caacute nhacircn bằng nhiều lựa chọn đầu ra
Cho pheacutep caacutec đaacutenh giaacute caacute nhacircn caacutec khả năng what-if lựa chọn loại hộp hội thoại
Đồ họa Phải coacute Lagrave một phần quan trọng của nhiều DSS
Thacircn thiện người sử dụng
Phải coacute Phải coacute nếu khocircng coacute người sử dụng trung gian
Xử lyacute thocircng tin Lọc neacuten thocircng tin dograve theo vết dữ liệu vagrave thocircng tin quan trọng
EIS kiacutech thiacutech caacutec cacircu hỏi caacutec cacircu trả lời bằng caacutech sử dụng DSS vagrave phản hồi lại EIS
Hỗ trợ caacutec thocircng tin chi tiết
Truy xuất thường xuyecircn caacutec mức chi tiết của bất kỳ thocircng tin tổng hợp nagraveo (duyệt dữ
Coacute thể coacute trong DSS nhưng khocircng thường
liệu chi tiết)Cơ sở mocirc higravenh Caacutec chức năng coacute sẵn bị hạn
chếLagrave điểm cốt lotildei của DSS
Cấu truacutec Theo người baacuten sản phẩm hoặc theo caacutec chuyecircn gia hệ thống thocircng tin
Theo người sử dụng hoặc caacute nhacircn hoặc caacutec chuyecircn gia từ caacutec trung tacircm thocircng tin hoặc phograveng ban hệ thống thocircng tin
Phần cứng Mainframe caacutec trạm RISC mạng LANs hoặc caacutec hệ thống phacircn bố
Mainframe caacutec trạm RISC caacutec maacutey PC hoặc caacutec hệ thống phacircn bố
Bản chất caacutec goacutei phần mềm
Truy xuất tương taacutec dễ dagraveng đến nhiều cơ sở dữ liệu truy xuất trực tuyến caacutec khả năng DBMS phức tạp caacutec liecircn kết phức tạp
Caacutec khả năng tiacutenh toaacuten lớn caacutec ngocircn ngữ mocirc higravenh mocirc phỏng ứng dụng vagrave caacutec bộ tạo DSS
Bản chất caacutec thocircng tin
Trigravenh bagravey thocircng tin được phaacutet sinh trước về quaacute khứ vagrave hiện tại tạo caacutec thocircng tin mới về quaacute khứ hiện tại tương lai
Tạo thocircng tin mới về quaacute khứ hiện tại tương lai
62 Lịch sử EIS- EIS xuất hiện lần đầu tiecircn tại MIT vagraveo những năm 1970
- Những EIS đầu tiecircn được phaacutet triển bởi caacutec doanh ngiệp lớn sẵn sagraveng chấp nhận rủi ro để đạt được lợi thế cạnh tranh
- Vagraveo những năm 1980 caacutec nhagrave cung cấp đatilde phaacutet triển một số cơ sở khaacutech hagraveng rộng vagrave cocircng nghệ EIS được tiếp tục phaacutet triển cho đến ngagravey nay
(Tagravei liệu thecircm Sử dụng DSSEIS cho phaacutet triển bền vững + Một số nghiecircn cứu đatilde được tiến hagravenh để kiểm tra việc thực hiện của EIS trong khu vực cocircng cộng vagrave chiacutenh phủ caacutec nước tổ chức kể từ khi chuacuteng được phaacutet triển theo định hướng lợi nhuận cho caacutec cocircng ty tư nhacircn (Hasan vagrave Hasan năm 1997) Theo một nghiecircn cứu tiến hagravenh tại Mỹ ở hơn 300 cocircng ty kết quả cho thấy sự khaacutec biệt của EIS giữa tư nhacircn vagrave chiacutenh phủ một số kết quả thuacute vị được phaacutet hiệnViacute dụ khoacute khăn hơn để chuyển tiền từ một tagravei khoản khaacutec trong một EIS của chiacutenh phủ cũng lagrave khoacute khăn hơn để biện giải thiacutech cho những chi phiacute phaacutet triển EIS của chiacutenh phủ Một nghiecircn cứu khaacutec được tiến hagravenh ở Australia
cho thấy rằng EIS cung cấp cho quản lyacute một higravenh ảnh chiacutenh xaacutec hơn về tổ chức thực hiện vagrave cung cấp hỗ trợ cho caacutec lợi iacutech chiến lược cải thiện khocircng chỉ cho caacutec nhagrave quản lyacute nhưng cograven cho phần cograven lại của tổ chức Dựa trecircn caacutec hệ thống được thiết kế cho caacutec cocircng ty tư nhacircn với một caacutech rotilde ragravengxaacutec định mục tiecircu EIS lagrave thiacutech hợp cho caacutec tổ chức cocircng cộng hiện đại nhưng cần phải được linh hoạt hơn vagrave kết thagravenh chugravem một phạm vi rộng hơn khả năng vagrave phương tiện hơn so với khu vực tư nhacircn ban đầu theo định hướng sản phẩm (Hasan vagrave Hasan năm 1997) Điều nagravey coacute thể lagrave do thực tế rằng caacutec hoạt động khu vực cocircng lagrave bắt buộc coacute taacutec động rộng phải đaacutep ứng sự mong đợi duy nhất cocircng cộng thường coacute mục tiecircu mơ hồ vagrave macircu thuẫn iacutet quyền tự chủ vagrave kiểm soaacutet việc ra quyết định vagrave nhacircn viecircn lagrave khoacute khăn hơn (Watson vagrave Carte2000) + Toacutem lại EIS lagrave một khaacutei niệm thagravenh cocircng noacute phaacutet triển qua nhiều năm tuy nhiecircn EIS khắc phục khiếm khuyết của migravenh bằng caacutech tiến hagravenh nghiecircn cứu liecircn tục)
63 Tại sao những người điều hagravenh hagraveng đầu lại khaacutec nhau- Họ lagrave những doanh nghiệp theo định hướng coacute suy nghĩ
- Coacute một khoảng khocircng gian rộng để kiểm soaacutet
- Họ chịu traacutech nhiệm cho việc thiết lập chiacutenh saacutech
- Họ đại diện cho tổ chức mocirci trường becircn ngoagravei
- Hagravenh động của họ tạo ra những kết quả đaacuteng kể về tagravei chiacutenh vagrave con người
Tần số caacutec hoạt động điều hagravenh- Xử lyacute xaacuteo trộn 42
- Hoạt động kinh doanh 32
- Phacircn bổ nguồn lực 17
- Đagravem phaacuten 3
- Những điều khaacutec 6
Handling Disturbances 42
Entrepreneurial Activites 32
Resource Allocation 17
Negotiation 3
Other 6
Những thocircng tin điều hagravenh cần thiết- Quản lyacute xaacuteo trộn coacute thể yecircu cầu sự chuacute yacute xung quanh đồng hồ
- Hoạt động kinh doanh yecircu cầu điều hagravenh để dự đoaacuten những thay đổi trong mocirci trường
- Nhiệm vụ phacircn bổ tagravei nguyecircn yecircu cầu lựa chọn người quản lyacute vagrave caacutec nguồn lực hạn chế được triển khai
- Đagravem phaacuten yecircu cầu cập nhật thocircng tin từng phuacutet để coacute thể xacircy dựng được sự đồng thuận
Caacutec loại thocircng tin điều hagravenh- Hệ thống kế toaacuten coacute liecircn quan đến việc tiacutenh toaacuten thu nhập hoạt động cho caacutec lĩnh
vực cụ thể lagrave quan trọng hơn so với caacutec hệ thống kế toaacuten truyền thocircng- Thocircng tin về thị trường khaacutech hagraveng cung cấp giaacute trị trong việc quyết định chiến
lược- Caacutec thocircng tin cần thiết thường được truyền đi trecircn một số hệ thống maacutey tiacutenh vagrave
nằm trong toagraven tổ chức- Caacutec thocircng tin được sử dụng thường lagrave ngắn hạn vagrave dễ thay đổi
Phương thức để xaacutec định thocircng tin cần thiết
Rockart xaacutec định được năm phương thức cơ bản để xaacutec định thocircng tin cần thiết
- Phương thức dựa trecircn kết quả- Phương thức rỗng- Phương thức chỉ số khoacutea- Phương thức tổng hợp nghiecircn cứu- Phương thức dựa vagraveo nhacircn tố then chốt dẫn đến thagravenh cocircng
64 Thagravenh phần EIS
- Sản phẩm EIS đầu tiecircn được phaacutet triển để sử dụng trecircn maacutey tiacutenh cấu higravenh cao nhưng caacutec sản phẩm hiện nay nhằm mục tiecircu lagrave nền tảng ClientServer
- Những nền tảng linh hoạt hơn coacute thể thiacutech ứng với thay đổi trong tổ chức vagrave cocircng nghệ
- Sử dụng dữ liệu thời gian thực dẫn đến quyết định nhanh hơn nhiều thocircng tin hơn
Thagravenh phần phần cứng- Một EIS khocircng đogravei hỏi coacute phần cứng cụ thể hoặc duy nhất nagraveo- Chigravea khoacutea của vấn đề lagrave để đảm bảo rằng caacutec thagravenh phần của EIS tối ưu hoacutea vagrave
phugrave hợp với tagravei nguyecircn maacutey tiacutenh của tổ chức- Hệ thống nagravey phải được cấu higravenh để caacutec nguồn tagravei nguyecircn phugrave hợp với những
người điều hagravenh chuacuteng
Thagravenh phần phần mềm- Traacutei ngược với phần cứng phần mềm thường được chuyecircn mocircn hoacutea cao cho caacutec
bagravei toaacuten về miền- Sự chuyecircn mocircn hoacutea nagravey thường đạt được bằng caacutech sử dụng thagravenh phần off-the-
shelf cho toagraven bộ EIS vagrave caacutec mocirc-đun tugravey chỉnh để đaacutep ứng nhu cầu cụ thể- Lotus Notes lagrave một viacute dụ điển higravenh Noacute coacute thể được sử dụng một migravenh hoặc coacute
thể phục vụ becircn thứ ba mocirc-đun plug-in
Cocircng nghệ EIS hiện nay
Dobrzeniecki đề xuấtphacircn loạitừng cấptheo bachức năng- Loại 1 sản phẩm bao gồmmột bộ đầy đủcaacutec ứng dụngtừ mộtnhagrave cung cấp- Loại 2 sản phẩm đượcthựchiệnở phần đầu củacaacutecsản phẩmDSS đượcphaacutet triển
bởicugravengmộtnhagrave cung cấp- Loại 3 sản phẩmkết hợp với nhautheo bất kỳ số lượngthuộc sở hữu củacocircng ty
65 Xacircy dựng EIS
- Xacircy dựngmộtEISgiống nhưxacircydựngmột số hệ thống khaacutec củamocirc higravenh hệ thống thocircng tin
- Việcphaacutet triểncấu truacutecnecircn được theo dotildeitừ quaacute trigravenh thiết kế đến quaacute trigravenhthực hiện
- Tuy nhiecircn một dự aacuten phaacutet triển EIScoacute xu hướnglagrave thống nhấtvagraveyecircu cầu hỗ trợ caacutec nhagrave quản lyacute latildenh đạo
- Xacircy dựng một EIScoacute thểphaacutet hiện ra đượccaacutectigravenh huống khoacute khănmagravemột nhagrave phaacutet triển chưabao giờ gặp phải
Mocirc higravenh EIS
Khung phaacutet triển một EIS
- Watson et al đề nghị xacircy dựngkhung với ba thagravenh phần+ Caacutech tiếp cận tập trung vagraveo yếu tốcon người vagrave dữ liệu coacute liecircn quan đến EIS+ Quaacute trigravenh phaacutet triển cần sự linh hoạt vagrave tương taacutec+ Người sử dụng - hệ thống hộp thoại bao gồm một ngocircn ngữ hagravenh động để xử lyacute caacutec lệnh
Lợi iacutech của EIS- Dễ duy trigrave caacutec mục tiecircu coacute tổ chức- Dễ truy xuất thocircng tin- Cho pheacutep người sử dụng nacircng cao hiệu suất hơn
- Tăng chất lượng ra quyết định- Cung cấp sự cải tiến cạnh tranh- Tiết kiệm thời gian của người sử dụng- Tăng khả năng vagrave chất lượng giao tiếp- Cung cấp khả năng điều khiển tốt hơn trong tổ chức- Cho pheacutep tham gia caacutec vấn đề vagrave caacutec cơ hội- Cho pheacutep hoạch định- Cho pheacutep tigravem kiếm nguyecircn nhacircn của một vấn đề- Thảo matilden caacutec yecircu cầu của người điều hagravenh
Hạn chế của EIS vagrave 1 số sai lầm cần traacutenh
- Chi phiacute một cuộc khảo saacutetnăm1991 chothấychi phiacute phaacutet triểntrungbigravenh365000USDvớichi phiacute vận hagravenhhagraveng năm lagrave$200000 (EIS)
- Cocircng nghệ hạn chếEIScần phảiđượctiacutech hợp hoagraven toagravenvagraveokiếntruacuteccủadoanh nghiệphiện tại do đoacute noacutelagrave một thaacutech thứclớn đối vớithiết kế
- Hạn chế tổ chức cơ cấu tổ chứccoacute thể khocircng phugrave hợp
Sự hạn chế về tổ chức- Chương trigravenh nghị sự vagrave thời gian chệch EIS mocirc tả một phần việc thực hiện một
chương trigravenh nghị sự vagrave coacute thể dễ dagraveng đạt được sự tin cậy một caacutech chắc chắn- Đồng bộ hoacutea việc quản lyacute sự tin cậy đuacuteng luacutec đặc biệt baacuteo caacuteo EIS coacute thể phaacute
vỡ sự ổn định thiết lập caacutec chu trigravenh baacuteo caacuteo một caacutech tốt nhất- Sự bất ổn EIS phản ứng nhanh coacute thể gacircy ra việc taacutec động trở lại một caacutech
nhanh choacuteng dẫn đến sự thiếu ổn định trong tổ chức
Sự thất bại lagrave thay thế khocircng thể chấp nhận được- Một số yếu tố lagravem EIS thất bại
+ Thiếu sự hỗ trợ về mặt quản lyacute+ Vấn đề chiacutenh trị+ Thất bại của nhagrave phaacutet triển+ Lỗi về cocircng nghệ+ Giaacute cả+ Thời gian
66 Ra quyết định điều hagravenh trong tương lai vagrave EIS
- Coacute một vagravei điều kiện sẽ được hợp nhất cho việc chuyển đổi cocircng nghệ Trong đoacute một vagravei điều kiện coacute thể dễ dự đoaacuten Hai điều kiện magrave ta coacute thể thấy lagrave+ Phaacutet triển cocircng nghệ maacutey tiacutenh trong việc điều hagravenh sẽ tạo ra sự chuyển đổi được chấp nhận một caacutech dễ dagraveng hơn+ Mở rộng traacutech nhiệm điều hagravenh sẽ mở rộng nhu cầu thocircng tin
Tương lai của EIS- EIS thocircng minh Những tiến bộ trong cocircng nghệ AI sẽ được triển khai trong caacutec
EIS- EIS đa phương tiện Cơ sở dữ liệu đa phương tiện sẽ cho pheacutep tiacutech hợp văn bản
giọng noacutei vagrave higravenh ảnh trong tương lai- EIS thocircng tin Tương lai EIS sẽ mở rộng hơn trong việc sử dụng dữ liệu becircn
ngoagravei doanh nghiệp- EIS kết nối Giao tiếp với băng thocircng rộng cho pheacutep kết nối liecircn thocircng lớn hơn
Chương 7 HỆ CHUYEcircN GIA VAgrave TRIacute TUỆ NHAcircN TẠO
71 Caacutec khaacutei niệm
72 Triacute thocircng minh của triacute tuệ nhacircn tạo
73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia
74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia
75 Lợi iacutech vagrave hạn chế của hệ chuyecircn gia
71 Caacutec khaacutei niệm
Chuyecircn mocircn (Expertise) sự hiểu biết rộng trong 1 lĩnh vực hẹp
Hệ chuyecircn gia (Expert Systems)1 chương trigravenh maacutey tiacutenh sử dụng 1 tập caacutec luật dựa trecircn tri thức của con người để giải quyết caacutec vấn đề đogravei hogravei phải coacute sự chuyecircn mocircn
Một số hệ chuyecircn gia nổi tiếng
DENDRAL (Standford 1960s Edward Feigenbaum)
MYCIN (Standford1970s Edward Shortliffe)
PROSPECTOR (MIT 1979)
Triacute tuệ nhacircn tạo (Artificial Intelligence ndash AI)
Triacute tuệ nhacircn tạo một bộ phacircn của ngagravenh khoa học maacutey tiacutenh quan tacircm đến việc thiết kế caacutec hệ thống maacutey tiacutenh thocircng minh đoacute lagrave caacutec hệ thống đưa ra caacutec đặc điểm magrave từ đoacute chuacuteng ta liecircn hệ với sự thocircng minh trong hagravenh động của con người (Barr vagrave Feigenbaum 1981)
Mục điacutech của AI
Mục điacutech khoa học xaacutec định caacutec gợi yacute để giải thiacutech caacutec loại khaacutec nhau của triacute tuệ thực
Mục điacutech kỹ thuật giải quyết caacutec vấn đề trong thế giới thực
Triacute tuệ nhacircn tạo kế thừa nhiều yacute tưởng quan điểm kỹ thuật từ caacutec ngagravenh khoa học khaacutec
- Triết học
- Logic Toaacuten học
- Tiacutenh toaacuten
- Khoa học tacircm lyacute Khoa học nhận thức
- Sinh học Thần kinh học
- Tiến hoacutea
Caacutec lĩnh vực ứng dụng trong Triacute tuệ nhacircn tạo
Mạng nơ ron thần kinh (Neural Networks)
Tiacutenh toaacuten sự tiến hoacutea
(Evolutionary Computation)
Hệ chuyecircn gia (Expert Systems)
Kỹ thuật xử lyacute tiếng noacutei (Speech Processing)
Kỹ thuật xử lyacute ngocircn ngữ tự nhiecircn
(Natural Language Processing)
Lập kế hoạch (Planning)
Robot (Robotics)
Khoa học higravenh ảnh (Vision)
Caacutec kỹ thuật thocircng dụng dugraveng trong AI
Biểu diễn(Representation)
Học (Learning)
Caacutec luật (Rules)
Tigravem kiếm (Search)
72 Triacute thocircng minh của triacute tuệ nhacircn tạo
Con người suy diễn như thế nagraveo
Phacircn loại (Categorization)
Caacutec quy tắc cụ thể
Heuristics
Kinh nghiệm trước đoacute
Dự tiacutenh trước
Maacutey tiacutenh suy diễn như thế nagraveo
Lập luận dựa trecircn luật IF-THEN mocirc tả tri thức được matilde hoacutea dưới dạng caacutec luật
Caacutec khung (Frames) lagrave caacutec đại diện mocirc tả caacutec tigravenh huống giống nhau lagrave điển higravenh của một vagravei phacircn loại
Lập luận dựa trecircn caacutec trường hợp mocirc phỏng giải phaacutep trước đoacute cho một vấn đề hiện tại
Nhận dạng mẫu phaacutet hiện acircm thanh higravenh dạng hoặc caacutec chuỗi dagravei
Caacutec dạng khaacutec của Triacute tuệ nhacircn tạo
Học maacutey- mạng nơron vagrave giải thuật di truyền
Lập trigravenh tự động ndash lagrave những kỹ thuật tạo ra caacutec chương trigravenh để lagravem 1 nhiệm vụ riecircng biệt (cho pheacutep những người khocircng phải lagrave người lập trigravenh coacute thể lập trigravenh được)
Cuộc sống nhacircn tạo ndash nỗ lực để taacutei tạo caacutec hiện tượng sinh học trong caacutec hệ thống dựa trecircn maacutey tiacutenh
73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia(Expert Systems- ES)
Theo Jackson (1999) Một hệ chuyecircn gia lagrave một chương trigravenh maacutey tiacutenh mocirc tả vagrave suy diễn với tri thức của một vagravei lĩnh vực để giải quyết vấn đề hay đưa ra caacutec lời khuyecircn
Cấu truacutec cơ bản của ES được dựa theo cấu truacutec chung của DSS Sự khaacutec biệt chiacutenh giữa ES vagraveDSS lagrave hệ ES thu thập caacutec kiến thức từ những
chuyecircn gia trong lĩnh vực quan tacircmĐặc trưng của hệ chuyecircn gia Hiệu quả cao Thời gian trả lời thỏa đaacuteng Độ tin cậy cao Dễ hiểu
Giao diện người dugraveng trong ES
Thiết kế giao diện người dugraveng tập trung vagraveo caacutec yếu tố như dễ dagraveng sử dụngcoacute độ tin cậy cao giảm tải những khoacute khăn khi sử dụng
Thiết kế necircn coacute một số tương taacutec (đầu vagraveo kiểm soaacutet vagrave truy vấn)
Cấu tạo giao diện người dugraveng gồm coacute magraven higravenh cảm ứng bagraven phiacutem buacutet saacuteng lệnh thoại caacutec phiacutem chuyecircn dụng
Cơ sở tri thức (Knowledge Base)
Chứa đựng caacutec tri thức cụ thể miền thu được từ caacutec chuyecircn gia miền
Coacute thể chứa caacutec mocirc tả caacutec hagravenh vi giải quyết vấn đề caacutec ragraveng buộc caacutec heuristics
Thagravenh cocircng của một ES dựa trecircn tiacutenh đầy đủ vagrave tiacutenh chiacutenh xaacutec của cơ sở tri thức
Mocirc tơ suy diễn (Inference Engine)
Ở đacircy tri thức được đặt để sử dụng tạo ra caacutec giải phaacutep để giải quyết vấn đề
Mocirc tơ nagravey coacute khả năng thực hiện diễn dịch hoặc suy diễn dựa trecircn caacutec luật hay caacutec caacutec sự kiện
Đồng thời cũng coacute khả năng sử dụng caacutec suy diễn mờ hay khocircng chiacutenh xaacutec dựa trecircn xaacutec suất hay aacutenh xạ mẫu
Vograveng điều khiển suy diễn
1 Aacutenh xạ caacutec luật với caacutec sự kiện đatilde được cho
2 Chọn luật để thực hiện
3 Thực hiện luật bằng caacutech thecircm caacutec sự kiện được suy diễn ra vagraveo bộ nhớ lagravem việc
Chuỗi suy diễn (Chaining)
Suy diễn tiến (forward chaining) maacutey suy diễn bắt đầu từ dữ liệu ban đầu vagrave thực hiện việc suy luận để đưa ra caacutec kết luận cuối cugraveng
Suy diễn lugravei (backward chaining) maacutey suy diễn bắt đầu từ dữ liệu điacutech vagrave tigravem ra tri thức hỗ trợ cho dữ liệu điacutech đoacute
Viacute dụ suy diễn lugravei
R1 Nếu coacute A vagrave B thigrave suy ra coacute D
R2 Nếu coacute B thigrave suy ra coacute C
R3 Nếu coacute C vagrave D thigrave suy ra coacute E
Ta coacute E ta xem trong 3 luật R1 R2 R3 luật nagraveo coacute E ta thấy R3 chứa E đồng thời chứa C vagrave D Xeacutet tiếp trong 2 luật R1 R2 luật nagraveo chứa C vagrave D R2 chứa C R3 chứa D Từ đoacute ta coacute được caacutec tri thức hỗ trợ suy diễn vagrave kết luận lagrave nếu coacute A vagrave B thigrave sẽ coacute E Hay nếu A vagrave B đuacuteng thigrave sẽ coacute E
Viacute dụ suy diễn tiến
Giả sử coacute tập chứa 3 luật sau
R1 Nếu coacute A vagrave B thigrave suy ra coacute D
R2 Nếu coacute B thigrave suy ra coacute C
R3 Nếu coacute C vagrave D thigrave suy ra coacute E
Nếu ta coacute A vagrave B thigrave chuacuteng ta suy ra được D từ R1 vagrave suy ra C từ R2 Với D vagrave C đatilde được suy ra ở trecircn giờ chuacuteng ta suy ra được E từ R3
Viacute dụ thực tế
Giả sử muốn biết magraveu của một con vật nuocirci tecircn lagrave Fred biết rằng noacute kecircu ộp ộp vagrave ăn ruồi
Coacute tập 4 luật ban đầu như sau
R1 Nếu X kecircu ộp ộp vagrave ăn ruồi thigrave X lagrave con ếch
R2 Nếu X kecircu chiecircm chiếp vagrave biết hoacutet thigrave X lagrave con chim
R3 Nếu X lagrave con ếch thigrave X coacute magraveu xanh
R4 Nếu X lagrave con chim thigrave X coacute magraveu vagraveng
74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia
Expert system shells lagrave một tập caacutec goacutei phần mềm vagrave caacutec cocircng cụ dugraveng để phaacutet triển caacutec hệ chuyecircn gia
Những Expert system shells đầu tiecircn thường rất rườm ragrave Mặc dugrave vậy noacute vẫn giuacutep cho người sử dụng sẽ khocircng phải bắt đầu lại từ đầu khi xacircy dựng một hệ chuyecircn gia mới
Những shell hiện đại bao gồm hai mocirc-đun chiacutenh lagrave cocircng cụ xacircy dựng một tập quy tắc vagrave mocirc tơ suy diễn
Xacircy dựng hệ chuyecircn gia
Bước 1 xacircy dựng mocirc higravenh bagravei toaacuten xaacutec định vấn đề nhiệm vụ magrave hệ thống sẽ thực hiện Caacutec dạng bagravei toaacuten cần hệ chuyecircn gia
Bagravei toaacuten diễn giải (InterPretation)
Bagravei toaacuten dự baacuteo (Prediction)
Bagravei toaacuten chuẩn đoaacuten (Diagnose)
Bagravei toaacuten gỡ rối (Debugging)
Bagravei toaacuten thiết kế
Tương tự như một dự aacuten phần mềm để xacircy dựng một hệ chuyecircn gia cần phải coacute caacutec yếu tố về nhacircn lực tagravei nguyecircn vagrave thời gian Những yếu tố nagravey ảnh hưởng đến giaacute thah của một hệ chuyecircn giaTrong phần nagravey cacircu hỏi thường được đặt ra lagrave tại sao cần phải xacircy dựng một hệ chuyecircn giaTrước khi bắt đầu phải xaacute định rotilde bagravei toaacuten đạt ra lagrave jiAi lagrave chuyecircn giaAi lagrave người sử dụng
1 Diễn giải (InterPretation) Nghiecircn cứu 1 vấn đề -gt Dựa trecircn những biểu hiện thuộc tiacutenh đặc trưng becircn ngoagravei -gt Tư vấn
(hoặc đưa ra kết luận hay mocirc tả dễ hiểu từ tập dữ liệu thocirc)
2 Bagravei toaacuten dự baacuteo (Prediction) Coacute thể dự đoaacuten được hagravenh vi kết quả dựa trecircn caacutec hiện tượng -gt dự baacuteo
VD Dự baacuteo thời tiết động đấthellip
3 Bagravei toaacuten chẩn đoaacuten (Diagnoss) Xaacutec định caacutec lỗi caacutec bộ phận hỏng hoacutec của hệ thống dựa trecircn caacutec dữ liệu quan saacutet được
4 Bagravei toaacuten gỡ rối (Debugging) Mocirc tả caacutec phương phaacutep khắc phục hệ thống khi gặp sự cố
5 Bagravei toaacuten thiết kế Lựa chọn cấu higravenh caacutec đối tượng nhằm thoả matilden một số ragraveng buộc nagraveo đoacute
6 Giảng dạy Phần mềm dạy học coacute thể chuẩn đoaacuten vagrave sủa lỗi của học sinh trong quaacute trigravenh học tập
Để xaacutec định đuacuteng bagravei toaacuten magrave chuacuteng ta cần giải quyết thigrave phải trả lời đc một số cacircu hỏi
- cần hệ chuyecircn gia
Bước 2 thu thập tri thức lựa chọn cocircng cụ vagrave aacutep dụng
Trong bước thu thập tri thức vấn đề quan trọng lagrave lựa chọn chuyecircn gia những người magrave sẽ đoacuteng goacutep tri thức cho hệ thống Thocircng thường trong suốt quaacute trigravenh phaacutet triển thigrave chuyecircn gia được xem như một thagravenh viecircn của đội phaacutet triển
Hiện nay coacute rất nhiều cocircng cụ để xacircy dựng một hệ chuyecircn gia Phổ biến nhất lagrave JESS CLIPS vagrave OPS5
Bước 3 Thiết kế cơ sở tri thức thiết kế hệ thốngTri thức được biểu diễn trường minh trong cơ sở tri thức
Caacutec chuyecircn gia vagrave kỹ sư tri thức sẽ đối thoại với nhau bằng caacutec kỹ thuật đối thoại Suy diễn (SD) bảng Mocirc higravenh hoacutea SD quy nạp phacircn loại
Vấn đề bagraveo trigrave vagrave phaacutet triển
Caacutec hệ chuyecircn gia đogravei hỏi phải bảo trigrave vagrave phaacutet triển nhiều hơn so với caacutec hệ thống khaacutec Phải thường xuyecircn bổ sung tri thức mới vagrave thay đổi caacutec tri thức cũ để đổi mới hệ chuyecircn gia
Thu thập vagrave khắc phục lỗi do người sử dụng phaacutet hiện để kịp thời khắc phục những sai soacutet của hệ chuyecircn gia
75 Lợi iacutech vagrave hạn chế của caacutec hệ chuyecircn gia
Một số lợi iacutech chiacutenh
Thời gian trả lời hợp lyacute bằng hoặc nhanh hơn so với chuyecircn gia (người) để đi đến cugraveng một quyết định Hệ chuyecircn gia lagrave một hệ thống thời gian thực (real time system)
Khả năng trả lời với mức độ tinh thocircng bằng hoặc cao hơn so với chuyecircn gia (người) trong cugraveng lĩnh vực
Hệ chuyecircn gia giuacutep cho hiệu quả lagravem việc tăng bằng việc sử dụng tập caacutec luật một caacutech nhanh choacuteng magrave ko bị nhầm lẫn chuyecircn gia lagrave người coacute thể quecircn đi một số tri thức cơ sở lyacute luậ nhưng HCG thigrave ko
Quyết định của một người chuyecircn gia coacute thể bị thay đổi vagrave ko coacute tiacutenh thống nhất như quyết định của một hệ chuyecircn gia tạo ra
Hệ chuyecircn gia giuacutep cho người sử dụng coacute thể trau dồi sự hiểu biết trecircn lĩnh vuej cụ thể magrave noacute giải quyết hỗ trợ người ra quyết định coacute trigravenh độ như 1 chuyecircn gia trong quaacute trigravenh gia quyết định
Kiến thức của rất nhiều chuyecircn gia về một lĩnh vực nagraveo đoacute được đưa vagraveo hệ chuyecircn gia lagravem cho CSTT cuat HCG phong phuacute vagrave rộng lớn hơn rất nhiều
HCG giải thiacutech caacutec bước suy luận một caacutech dễ hiểu nhất quaacuten luacutec nagraveo cũng coacute thể sử dụng ko như chuyecircn gia con người
Hạn chế của caacutec hệ chuyecircn gia
Nhược điểm lớn nhất của hệ chuyecircn gia lagrave những yacute kiến chuyecircn mocircn thường rất khoacute matilde hoacutea vagrave giải neacuten
Hệ chuyecircn gia khocircng coacute khả năng tự học tự cập nhật kiến thức mới như caacutec chuyecircn gia magrave cần phải được matilde hoacutea lại khi noacute được cập nhật
Hệ chuyecircn gia khocircng thể nhận ra được vấn đề khocircng nằm trong miền kiến thức của hệ thống
Chương 8 Tri thức vagrave tiếp nhận
1 Bao gồm caacutec vấn đề
Dữ liệu thực tế đo lường hoặc quan saacutet coacute hoặc khocircng coacute bối cảnh
Thocircng tin dữ liệu được tổng hợp một caacutech hữu iacutech để giải quyết những khoacute khăn trong việc đưa ra quyết định
Tri thức bao gồm caacutec ứng dụng quy tắc thocircng tin hướng dẫn của người ra quyết định
2 Những caacutei nhigraven về tri thức
Đại diện lagravem thế nagraveo để diễn tả tri thức viacute dụ như một quyển saacutech khocircng phải lagrave tri thức nhưng noacute lại lagrave một đại diện của tri thức
Sản xuất tri thức lagrave một tập hơp của hagraveng tồn kho coacute thể được sản xuất cũng như mua lại
Tri thức lagrave 1 trong 6 trạng thaacutei của hệ thống
1Dữ liệu 2Thocircng tin 3Cấu truacutec thocircng tin 4Sự thấu hiểu 5Yacute kiến 6 Quyết định
3 Caacutec loại tri thức Phổ biến mocirc tả dữ liệu thocircng tin thủ tục mọi thứ lagravem như thế nagraveo lập luận chiacutenh saacutech hoặc caacutec quy tắc
4 Thu thập Tri thức hệ chuyecircn gia Hầu hết caacutec phương phaacutep đều bắt đầu với mocirc higravenh của caacutec taacutec vụ trong đoacute
hệ chuyecircn gia được xacircy dựng Trong đoacute mocirc tả về caacutec lĩnh vực được tạo ra Caacutec kỹ sư sử dụng caacutec mocirc higravenh giả thuyết vagrave nhận thức về quaacute trigravenh phacircn
tiacutech để gợi ra caacutech giải quyết vấn đề về tri thức từ caacutec chuyecircn gia
5 Caacutec chiều của thu thập tri thức KE- driven caacutec kỹ sư trao đổi trực tiếp với caacutec chuyecircn gia Expert-driven Caacutec chuyecircn gia trực tiếp đưa chuyecircn mocircn của họ vagraveo hệ
thống maacutey tiacutenh Machine-driven Sử dụng caacutec cocircng cụ suy luận để triacutech xuất tri thức từ một
tập caacutec viacute dụ
6 Kỹ thuật thu thập tri thức Trao đổi gồm 2 loại cơ bản lagrave coacute cấu truacutec(coacute kịch bản) vagrave khocircng coacute cấu
truacutec( đối thoại trực tiếp) Giao thức phacircn tiacutech bằng lời Khi caacutec chuyecircn gia thực hiện một cocircng việc
của họ thigrave một bản ghi về cocircng việc đoacute được thực hiện Caacutec kỹ sư sẽ xacircy dựng mocirc higravenh cho những gigrave được ghi lại trong bản ghi
Phương phaacutep sagraveng lọc caacutec chuyecircn gia so saacutenh caacutec nhoacutem liecircn tiếp trong ba đối tượng vagrave cho biết tại sao nhoacutem thứ hai lại khaacutec nhoacutem thứ ba
7 Thu thập tri thức từ nhiều nguồn Thu thập tri thức từ nhiều nguồn lagrave cần thiết để coacute được đầy đủ caacutec tri thức
cho một vấn đề quan điểm yacute kiến traacutei ngược nhau thường phaacutet sinh Phương phaacutep đồng thuận sẽ giuacutep giải quyết được vấn đề macircu thuẫn Kỹ thuật phacircn tiacutech Meta lagrave kỹ thuật được aacutep dụng trong caacutec trường hợp
khaacutec Caacutech tiếp cận bằng định lượng đogravei hỏi caacutec kỹ sư cần cacircn nhắc yếu tố đầu vagraveo của caacutec chuyecircn gia khaacutec nhau
8 Xaacutec nhận hợp lệ vagrave kiểm tra tri thức Một khi thu thập tri thức noacute phải được đaacutenh giaacute về khả năng sử dụng vagrave độ
chiacutenh xaacutec Hai vấn đề cụ thể lagrave hiệu lực của những kiến thức vagrave kiểm tra việc xacircy dựng cơ sở của tri thức
Cần xaacutec nhận xem liệu hệ thống coacute thể hoạt động ở mức độ tối thiểu khocircng
Xaacutec minh liecircn quan đến việc so saacutenh từng chi tiết kỹ thuật của hệ thống những gigrave đatilde được thực hiện cuối cugraveng
9 Một số caacutec biện phaacutep xaacutec nhận Độ chiacutenh xaacutec Khả năng thiacutech nghi Mức độ đầy đủ Bề rộng Độ sacircu Hiệu lực Tổng quan Chiacutenh xaacutec Hiện thực Độ tin cậy Tiacutenh hữu dụng Mức độ
Chương 9 Học maacutey
1 Logic mờ vagrave ngocircn ngữ mờ(Fuzzy Logic and Linguistic Ambiguity)
Ngocircn ngữ tự nhiecircn gồm những khaacutei niệm mơ hồ vagrave khocircng chiacutenh xaacutectruyền tải ngữ nghĩa thocircng qua tiacutenh xấp xỉkhocircng rotilde ragraveng
Những xấp xỉ nagravey giuacutep con người coacute thể truyền tải hết được yacute nghĩa nhưng maacutey thigrave khocircng hiểu
Lagravem sao biểu diễn caacutec tri thức sử dụng caacutec khaacutei niệm khocircng rotilde ragraveng(mờ) hoặc khocircng chiacutenh xaacutec
2 Khaacutei niệm cơ bản của logic mờ tập mờ lagrave những tập hợp khocircng coacute một giới hạn rotilde Mỗi phần tử của noacute chỉ
chứa một mức độ hagravem liecircn thuộc của từng phần tử Vigrave vậy tập mờ khocircng giống như tập cổ điển Tập mờ coacute thể kết hợp với nhau qua những luật mờ magrave đặc trưng cho những hagravenh động trạng thaacutei vagrave thuộc tiacutenh của logic mờ được tận dụng khi thực hiện một bộ điều khiển mờ
Logic mờ dựa trecircn yacute tưởng mỗi phần tử thuộc vagraveo một tập hợp ở một mức độ nagraveo đấy
Locircgic mờ cho pheacutep độ liecircn thuộc (microA )coacute giaacute trị trong khoảng (01) Locircgic mờ coacute thể được coi lagrave mặt ứng dụng của lyacute thuyết tập mờ để xử lyacute caacutec
giaacute trị trong thế giới thực cho caacutec bagravei toaacuten phức tạp
3 So saacutenh tiacutenh đuacuteng đắn logic mờ vagrave xaacutec suất Xaacutec suất thigrave đề cập đến khả năng xảy ra một biến cố hay một điều gigrave đoacute Logic mờ đề cập đến cấp độ magrave đặc tiacutenh ở hiện tại
o viacute dụ1 người coacute chiều cao 6 feet thigrave coacute cấp độ lagrave 05 về chiều cao
4 Ưu điểm của logic mờ Caacutech tiếp cận rất tự nhiecircnkhocircng phức tạp Coacute thể mocirc higravenh hoacutea caacutec hagravem phi tuyến tugravey yacute phức tạp
Coacute thể tận dụng được kinh nghiệm từ những chuyecircn gia hagraveng đầu trong mọi lĩnh vực
Logic mờ được xacircy dựng dựa trecircn ngocircn ngữ tự nhiecircnNền tảng của logic mờ lagrave dựa trecircn cơ sở giao tiếp của con người
5 Nhược điểm của logic mờ Trong 1 hệ thống phức tạpsử dụng logic mờ coacute thể trở thagravenh trở ngại cho
việc xaacutec thực độ tin cậy của hệ thống Cơ chế lập luận mờ khocircng thể học hỏi từ những lỗi sai
6 Mạng noron nhacircn tạo(ANN) Mạng noron nhacircn tạo lagrave một mocirc phỏng xử lyacute thocircng tinđược nghiecircn cứu ra
từ hệ thống thần kinh của sinh vậtgiống như bộ natildeo để xử lyacute thocircng tin ANNs lagrave chương trigravenh dựa trecircn maacutey tiacutenh đơn giản coacute chức năng lagrave một mocirc
higravenh bagravei toaacuten khocircng gian dựa trecircn thử nghiệm vagrave baacuteo lỗi
7 Học từ kinh nghiệm Tiến trigravenh Một mẫu dữ liệu được biểu diễn như một mạng lưới noronANN ldquodự
đoaacutenrdquo 1 đầu radự đoaacuten được so saacutenh với giaacute trị thực tế hoặc giaacute trị chiacutenh xaacutecNếu đoaacuten được chiacutenh xaacutec thigrave khocircng coacute hagravenh động nagraveo được thực hiện
Nếu dự đoaacuten sai ANN kiểm tra lại vagrave xaacutec định lại thocircng số để điều chỉnh Một mẫu dữ liệu khaacutec được biểu diễn vagrave quaacute trigravenh nagravey được lặp lại
8 Nguyecircn tắc cơ bản của cocircng nghệ nơron Caacutec yếu tố xử lyacute cơ bản trong hệ thống thần kinh của con người lagrave tế bagraveo
thần kinhMạng lưới của tế bagraveo nagravey lagrave liecircn kết với nhau nhận được thocircng tin từ caacutec cảm biến trong mắt taihellip
Thocircng tin nhận được bởi tế bagraveo thần kinh hoặc lagrave sẽ kiacutech thiacutech noacute(sẽ được chuyển qua 1 thocircng điệp dọc theo mạng lưới) hoặc lagrave sẽ ngăn cản noacute(ngăn cản dograveng thocircng tin)
Độ nhạy coacute thể thay đổi qua thời gian hoặc sau khi coacute được kinh nghiệm
9 Cấu truacutec mạng Một ANN gồm 3 lớp cơ bản
Lớp đầu vagraveo nhận dữ liệu Lớp becircn trong hoặc lagrave lớp ẩn xử lyacute dữ liệu Lớp đầu ra chuyển tiếp kết quả cuối cugraveng của mạng
10Mạng nơ ron Thường coacute nhiều đầu vagraveo mỗi đầu vagraveo với mức ảnh hưởng vagrave tầm quan
trọng riecircng của noacute Một đầu vagraveo quan trọng coacute thể được sử dụng để khuếch đại đầu ra caacutec hagravem trạng thaacutei tổng hợp caacutec trọng số của caacutec yếu tố
đầuvagraveo khaacutec nhauvagraveo một giaacute trị duy nhất Caacutec hagravem chuyển giao xử lyacute caacutec giaacute trị trạng thaacutei vagrave tạo đầu ra
11Huấn luyện mạng nơ ron Trong mocirc higravenh coacute giaacutem saacutetANN được đến so saacutenh dự đoaacuten của chiacutenh
noacute với thocircng tin phản hồi coacute chứa caacutec kết quả mong muốn ANN sẽ phải tigravem caacutech thay đổi caacutec tham số becircn trong củamigravenh (caacutec trọng số vagrave caacutec ngưỡng) để tạo necircn một aacutenh xạ coacute khả năng aacutenh xạcaacutec đầu vagraveo thagravenh caacutec đầu ra mong muốn Sự thay đổi nagravey được tiến hagravenh nhờ việc so saacutenh giữa đầu ra thực sự vagrave đầu ra mong muốn
Trong mocirc higravenh khocircng coacute giaacutem saacutetANN nhận được dữ liệu vagraveo nhưng khocircng phải coacute bất kỳ thocircng tin phản hồi về kết quả mong muốn
Phần lớn caacutec ứng dụng nằm trong vugraveng của caacutec bagravei toaacuten ước lượng như mocirc higravenh hoacuteathống kecirc neacuten lọc phacircn cụm
12Lợi iacutech Liecircn kết với mạng noron Traacutenh caacutech lập trigravenh tường minh Giảm nhu cầu của chuyecircn gia ANNs thigrave thiacutech nghi với caacutec yếu tố đầu vagraveo thay đổi Khocircng cần thiết cho cơ sở tri thức tinh chế ANNs coacute tiacutenh động vagrave cải thiện với việc sử dụng Coacute khả năng xử lyacute dữ liệu khocircng chiacutenh xaacutec hoặc khocircng đầy đủ Cho pheacutep tổng quaacutet hoacutea từ thocircng tin cụ thể Cho pheacutep thu thập cảm giaacutec thocircng thường vagraveo miền giải quyết vấn đề
13Hạn chế của việc liecircn kết với mạng noron ANNs khocircng thể giải thiacutech được suy luận Bản chất hộp đen thường khiến cho vấn đề traacutech nhiệm vagrave độ tin cậy phaacutet
sinh lagrave khoacute khăn Lặp đi lặp lại quaacute trigravenh huấn luyện rất tốn thời gian Nguồn lực caacutec nhagrave phacircn tiacutech vagrave thiết kế coacute tay nghề cao vẫn lagrave đaacuteng lo
ngại Cocircng nghệ ANN thuacutec đẩy hạn chế của phần cứng hiện tại ANN yecircu cầu phải coacute sự tin tưởng ở đầu ra
14Giới thiệu về thuật toaacuten di truyền Cũng như mạng lưới thần kinh caacutec thuật toaacuten di truyền được dựa trecircn lyacute
thuyết sinh học Thuật toaacuten di truyền tigravem thấy nguồn gốc của chuacuteng trong caacutec lyacute thuyết
tiến hoacutea của chọn lọc tự nhiecircn vagrave thiacutech ứng với biến đổi khiacute hậu Kết quả thuật toaacuten di truyền lagrave từ giao phối 2 caacute thể trong quần thế để tạo
ra con caacutei đocirci khi tốt hơn so với bậc cha mẹ của chuacuteng 15Caacutec thagravenh phần cơ bản của thuật toaacuten di truyền
Toaacuten tử chọn lọc Caacutec caacute thể tốt được chọn lọc để đưa vagraveo thế hệ sau Sự chọn lọc nagravey căn cứ vagraveo độ thiacutech nghi với mocirci trường của mỗi caacute thể
Toaacuten tử lai gheacutep (crossover) Hai caacute thể cha vagrave mẹ trao đổi caacutec gen với nhau để tạo ra caacute thể con
Toaacuten tử đột biến (mutation) Một caacute thể thay đổi một số gen để biến đổi thagravenh một caacute thể mớiTất cả caacutec toaacuten tử trecircn khi thực hiện đều mang tiacutenh ngẫu nhiecircn
16Quaacute trigravenh cơ bản của một thuật toaacuten di truyền Khởi tạo
Đaacutenh giaacute quần thể
Lựa chọn NST thiacutech hợp nhất vagrave loại bỏ NST yếu nhất
Quy trigravenh giao nhau vagrave cải thiện quần thể
đột biến tiến trigravenh để khaacutem phaacute ra NST mới
17Ưu nhược điểm của việc kết hợp với thuật toaacuten di truyền Kiacutech thước quần thể lagrave 1 yếu tố quan trọng trong tốc độ của việc tigravem
kiếmnhưng noacute tương đối dễ dagraveng để dự đoaacuten tốc độ nagravey Giao nhau hoặc đột biến lagrave khocircng necircn đc sử dụng quaacute thường xuyecircn Luocircn coacute được iacutet nhất 1 giải phaacutep hợp lyacute Necircn coacute thể aacutep dụng chuacuteng cho caacutec vấn đề magrave chuacuteng ta khocircng coacute hướng
về caacutech giải quyết Sức mạnh của thuật toaacuten xuất phaacutet từ khaacutei niệm đơn giảnkhocircng phải từ
một thủ tục thuật toaacuten phức tạp 18Tương lai của học maacutey
Mạng lưới thần kinh nhacircn tạo vượt quaacute năng lực của con người trong caacutec trường hợp bị cocirc lập
Về mặt lyacute thuyếtmột maacutey tiacutenh coacute thể xử lyacute dũ liệu nhanh hơn hagraveng triệu lần so với 1 con người
May mắn thay cho chuacuteng tacon người tốt hơn nhiều khi magrave coacute được dữ liệumaacutey tiacutenh khocircng coacute 1 số thứ như lagrave 5 giaacutec quan
CHƯƠNG 10 KHO DỮ LIỆU
1 Kho dữ liệu Kho dữ liệu lagrave tuyển tập caacutec cơ sở dữ liệu tiacutech hợp hướng chủ đề được
thiết kế để trợ giuacutep cho một hệ hỗ trợ quyết định
Theo John Ladley Cocircng nghệ kho dữ liệu lagrave tập caacutec phương phaacutep kỹ thuật vagrave caacutec cocircng cụ coacute thể kết hợp hỗ trợ nhau để cung cấp thocircng tin cho người sử dụng trecircn cơ sở tiacutech hợp từ nhiều nguồn dữ liệu nhiều mocirci trường khaacutec nhau
Kho dữ liệu thường rất lớn tới hagraveng trăm GB hay thậm chiacute hagraveng Terabyte
2 Kho dữ liệu vận hagravenh (ODS) Một kho dữ liệu vận hagravenh Aacutep dụng kỹ thuật kho dữ liệu vagraveo caacutec hệ xử
lyacute giao taacutec lưu trữ dữ liệu cho một ứng dụng đặc thugrave Noacute đưa vagraveo kho dữ liệu một dograveng caacutec dữ liệu thocirc được thiết kế
3 So saacutenh
Kho dữ liệu vận hagravenh Kho dữ liệu
Dữ liệu theo chủ đề Dữ liệu theo chủ đề
Dữ liệu tiacutech hợp Dữ liệu tiacutech hợp
Dữ liệu thay đổi Dữ liệu khocircng thay đổi
Dữ liệu được cập nhật khi thay đổi
Dữ liệu giữ nguyecircn
Chỉ coacute dữ liệu hiện tạiDữliệu hiện tại vagrave dữ liệu lịch sử
Chu kỳ lagravem tươi dữ liệu ngắn Chu kỳ lagravem tươi dữ liệu dagravei
Chỉ coacute dữ liệu chi tiết Dữ liệu chi tiết vagrave dữ liệu tổng kết
Dugraveng cho caacutec quyết định ngắn hạn
Dugraveng cho hoạch định dagravei hạn
4 Kho dữ liệu cục bộ (Data Mart - DM)
Kho dữ liệu cục bộ lagrave CSDL coacute những đặc điểm giống với kho dữ liệu nhưng với quy mocirc nhỏ hơn vagrave lưu trữ dữ liệu về một lĩnh vực một chuyecircn ngagravenh
Data mart phụ thuộc Chứa những dữ liệu được lấy từ DW vagrave những dữ liệu nagravey sẽ được triacutech lọc vagrave tinh chế tiacutech hợp lại ở mức cao hơn để phục vụ một chủ đề nhất định của Datamart
Data mart độc lập Khocircng giống như Datamart phụ thuộc Data mart độc lập được xacircy dựng trước DW vagrave dữ liệu được trực tiếp lấy từ caacutec nguồn khaacutec nhau
5 Siecircu dữ liệu Metadata lagrave dữ liệu để mocirc tả dữ liệu Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột
một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi Metadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu
6 Mocirci trường kho dữ liệu Hệ thống của tổ chức vagrave kho cung cấp dữ liệu để xacircy dựng kho dữ liệu Trong quaacute trigravenh chuyển dữ liệu từ caacutec nguồn khaacutec nhau dữ liệu coacute thể
được lagravem sạch hoặc chuyển đổi vagrave vigrave thế DW được xem như lagrave một chuẩn cho việc lưu trữ
Đồng thời siecircu dữ liệu được ghi lại Cuối cugraveng DW hoặc siecircu thị coacute thể được sử dụng để tạo ra một kho dữ
liệu ldquocaacute nhacircnrdquo 7 Caacutec đặc điểm của kho dữ liệu
Đặc điểm Mocirc tả
Hướng chủ đề - DL tổ chức theo caacutech thức người dugraveng tham chiếu
Tiacutech hợp - Dữ liệu ldquosạchrdquo loại bỏ tiacutenh thiếu nhất quaacuten
Khocircng thay đổi - DL ldquochỉ đọcrdquo người dugraveng khocircng thay đổi được
Chuỗi thời gian - DL lagrave chuỗi thời gian khocircng phải lagrave trạng thaacutei hiện tại
Được tổng kết - DL vận hagravenhthao taacutec khi cần thiết
được kết hợp lại thagravenh dạng coacute thể dugraveng được cho quyết định
Kiacutech cỡ lớn hơn - Lưu giữ theo chuỗi thời gian tức lagrave giữ lại nhiều DL
Khocircng được chuẩn hoacutea - Coacute thể dư thừa DLSiecircu dữ liệu - Dữ liệu của dữ liệu được lưu trữNguồn dữ liệu - DL vận hagravenh (caacutec hệ sẵn coacute) cugraveng
với caacutec nguồn ngoagravei 8 Kho dữ liệu hướng chủ đề
Hướng chủ để coacute nghĩa lagrave kho dữ liệu được tổ chức xung quanh caacutec chủ đề chiacutenh như khaacutech hagraveng sản phẩm sản xuất Tập trung vagraveo việc mocirc higravenh hoacutea vagrave phacircn tiacutech dữ liệu cho caacutec nhagrave ra quyết định magrave khocircng tập trung vagraveo caacutec xử lyacute thocircng thường Cung cấp cho người dugraveng một khung nhigraven toagraven vẹn đơn giản vagrave đầy đủ về caacutec sự kiện quanh caacutec chủ đề
9 Dữ liệu trong DW được tiacutech hợp Dữ liệu trong kho dữ liệu được xacircy dựng bằng caacutech tổng hợp dữ liệu từ
nhiều nguồn khaacutec nhau vagrave caacutec nguồn coacute tổ chức khaacutec nhau Cơ sở dữ liệu caacutec file excel caacutec flat file hoặc caacutec raw file Khi đưa vagraveo kho dữ liệu caacutec dữ liệu được lagravem sạch vagrave tiacutech hợp dữ liệu nhằm đảm bảo tiacutenh nhất quaacuten của dữ liệu
10Kiến truacutec kho dữ liệu Tầng cơ sở dữ liệu hoạt động Tầng truy xuất thocircng tin Tầng truy xuất dữ liệu Tầng siecircu dữ liệu Tầng quản lyacute tiến trigravenh Tầng thocircng điệp của ứng dụng Tầng vật liacute của kho dữ liệu Tầng trigravenh diễn dữ liệu
11Higravenh trạng kho dữ liệu Kho dữ liệu ảo - người dugraveng cuối coacute thể truy cập trực tiếp đến kho dữ liệu
sử dụng caacutec cocircng cụ cho pheacutep ở tầng truy xuất dữ liệu Kho dữ liệu trung tacircm-1 cơ sở dữ liệu vật lyacute chứa tất cả dữ liệu cho một
vugraveng chuyecircn dụng nagraveo đoacute
Kho dữ liệu phacircn taacuten- Thagravenh phần được phacircn taacuten qua nhiều hệ cơ sở dữ liệu vật lyacute
12METADATA- Siecircu dữ liệu Định nghĩa Siecircu dữ liệu lagrave dữ liệu về dữ liệu Lagrave 1 lưu trữ dugraveng để
Miecircu tả kho dữ liệu tổng thể Nhận dạng kiểu kho dữ liệu Quản liacute quaacute trigravenh tiacutech hợp dữ liệu Quản liacute quaacute trigravenh cập nhật kho dữ liệu Quản liacute bảo mật
Lagrave chigravea khoacutea quyết định sự thagravenh cocircng của kho dữ liệu luocircn được thay đổi vagrave cập nhật theo sự phaacutet triển của kho dữ liệu
Dugraveng để quản liacute điều khiển kho dữ liệu Sự ra đời của kho dữ liệu như 1 cấu truacutec hỗ trợ ra quyết định siecircu dữ liệu
được xem như nguồn tagravei nguyecircn dữ liệu Siecircu dữ liệu lagrave trừu tượng Chuacuteng lagrave dữ liệu bậc cao cung cấp mocirc tả ngắn
gọn caacutec dữ liệu bậc thấp hơn 13Hoạt động của Siecircu dữ liệu
Siecircu dữ liệu rất cần thiết trong việc chuyển hoacutea thocircng tin trở thagravenh tri thức Lagrave chigravea khoacutea giuacutep chuacuteng ta xử lyacute được dữ liệu thocirc Viacute dụ một dograveng dữ liệu baacuten hagraveng 1023 K596 11121 agraveNoacute sẽ khocircng coacute nghĩa gigrave cho đến khi chuacuteng ta đưa vagraveo siecircu dữ liệu (thư
mục chứa dữ liệu) agrave cửa hagraveng 1023 sản phẩm K596 vagrave số tiền baacuten được lagrave 11121 đocirc la
14Sự cần thiết phải nhất quaacuten trong kho dữ liệu Kho dữ liệu được xacircy dựng cho lợi iacutech của những nhagrave phacircn tiacutech kinh
doanh caacutec nhagrave quản trị cho tất cả caacutec khu vực chức năng Trong cơ sở dữ liệu riecircng caacutec khu vực khaacutec nhau coacute thể định nghĩa vagrave lưu
trữ dữ liệu thocircng qua phiecircn bản của chiacutenh noacute Khi dữ liệu được lấy từ những vugraveng khaacutec nhau đoacute vagrave được đặt vagraveo kho dữ
liệu Việc chuyển đổi vagrave lagravem sạch caacutec tiến trigravenh sẽ đảm bảo noacute lagrave duy nhất được tiacutech hợp tại một mức của tổ chức
15Ragrave soaacutet lại dữ liệu ndash Thực thi siecircu dữ liệu
Bất kể cấu truacutec tự nhiecircn của 1 cacircu truy vấn thế nagraveo thigrave caacutec thagravenh phần của siecircu dữ liệu rất quan trọng đối với người ra quyết định
Bảng thuộc tiacutenh khoacutea được lưu trữ bởi kho dữ liệu Tập hợp dữ liệu được lấy từ đacircu Những chuyển đổi nagraveo được thực thi với việc lagravem sạch
16Siecircu dữ liệu lagrave gigrave Metadata - lagrave thocircng tin mocirc tả nội dung của cơ sở dữ liệu (CSDL) Metadata baacuteo cho người dugraveng biết thời gian cập nhật sau cugraveng của dữ liệu
định dạng vagrave mục điacutech sử dụng của noacute Những thocircng tin nagravey coacute thể hướng dẫn người dugraveng duyệt qua CSDL vagrave
giuacutep họ hiểu được yacute nghĩa vagrave ngữ cảnh của dữ liệu Trong CSDL metadata lagrave caacutec dạng biểu diễn khaacutec nhau của caacutec đối tượng
trong CSDL Trong CSDL quan hệ metadata lagrave caacutec định nghĩa của bảng cột CSDL
view vagrave nhiều đối tượng khaacutec Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột
một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi -gtMetadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu
Bảng chuyển đổi Ghi lại những chuyển đổi đatilde được thực hiện
Lịch sử thực thi Ghi lại những dữ liệu đatilde được
phacircn tiacutech
Higravenh thaacutei kết nốiGhi lại những dữ liệu được kết nối vagrave tần suất
17Aacutenh xạ thocircng thường của siecircu dữ liệu Bản ghi aacutenh xạ chuyển đổi bao gồm
Định danh của nguồn gốc Chuyển đổi thuộc tiacutenh Chuyển đổi thuộc tiacutenh vật lyacute Matilde hoacutea tham chiếu bảng chuyển đổi Đổi tecircn Đổi khoacutea Gaacuten giaacute trị cho thuộc tiacutenh mặc định Chọn logic cho caacutec nguồn nhiều giaacute trị Đổi thuật toaacuten
18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để
phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai
lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave
tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec
Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm
Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo
19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua
caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau
SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được
Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra
một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức
Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ
Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ
Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech
CHƯƠNG 11 KHAI PHAacute DỮ LIỆU
1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn
ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993
Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng
2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd
1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều
2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP
3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn
4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng
5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server
6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo
7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động
8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời
9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều
10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện
11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech
12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP
3 Xử lyacute phacircn tiacutech trực tuyến OLAP
MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave
dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu
ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave
thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu
HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave
ROLAP4 Khai phaacute dữ liệu
Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh
khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn
Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan
5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp
6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại
Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp
Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec
Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt
Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra
Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh
vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho
Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec
Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm
Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục
Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng
gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp
Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn
Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec
Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper
Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2
Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25
Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước
Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng
Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện
trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp
Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute
độ hỗ trợ ge ngưỡng minsup
độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan
Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn
Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết
Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu
MOLAP ROLAP HOLAP
Lưu trữ dữ liệu cơ sở
Khối Bảng quan hệ Bảng quan hệ
Lưu trữ thocircng tin tổng hợp
Khối Bảng quan hệ Khối
Hiệu suất thực hiện truy vấn
Nhanh nhất Chậm nhất Nhanh
Tiecircu thụ khocircng gian lưu trữ
Nhiều Thấp Trung bigravenh
Chi phiacute bảo trigrave Cao Thấp Trung bigravenh
Một đại diện cho IBIS lagrave một đồ thị với caacutec nuacutet vagrave caacutec liecircn kết
IBIS bắt đầu với lựa chọn của một nuacutet vấn đề gốc sau đoacute caacutec nuacutet vị triacute khaacutec nhau được liecircn kết với nuacutet gốc
Caacutec nuacutet vị triacute nagravey sau đoacute được đaacutenh giaacute dựa trecircn những lập luận gắn liền với chuacuteng
Nemawashi (được sử dụng rộng ratildei tại Nhật Bản)
1-Một hoặc nhiều thagravenh viecircn của MDM được chỉ định lagrave điều phối viecircnCaacutec điều phối viecircn sau đoacute chọn người tham gia cograven lại
2-Điều phối viecircn xacircy dựng một tổng hợp caacutec sự lựa chọn vagrave sau đoacute caacutec chuyecircn gia đaacutenh giaacute caacutec lựa chọn
3-Điều phối viecircn lựa chọn một sự lựa chọn dựa trecircn kết quả ở trecircn(ở 2)
4-Sự thay thế được luacircn chuyển điều phối viecircn tigravem kiếm sự đồng thuận thocircng qua sự thuyết phục vagrave đagravem phaacuten
5-Nếu đạt được sự đồng thuận điều phối viecircn cho lưu thocircng một tagravei liệu magrave mỗi thagravenh viecircn MDM để lại dấu hiệu trecircn đoacute
55Nơi lagravem việc ảo
Nhiều tổ chức trecircn toagraven thế giới kinh doanh bất động sản cho cocircng nghệ hợp taacutec
Cocircng việc được trở thagravenh một điều bạn lagravem hơn lagrave một nơi bạn đi
Những thay đổi lớn nhất mang lại bởi nơi lagravem việc ảo coacute thể lagrave về văn hoaacute hay xatilde hội hơn lagrave về cocircng nghệ
Chương 6 Hệ thống thocircng tin điều hagravenh
61 Yacute nghĩa của EIS- Hệ thống thocircng tin điều hagravenh
- EIS lagrave một dạng đặc biệt của DSS được thiết kế để hỗ trợ ra quyết định ở cấp cao nhất của một tổ chức
- Lagrave một hệ thống thocircng tin hỗ trợ nhu cầu lập kế hoạch vagrave đaacutenh giaacute của caacutec nhagrave quản lyacute điều hagravenh
- EIS coacute thể giuacutep một CEO coacute được bức tranh tổng thể chiacutenh xaacutec nhất về caacutec hoạt động vagrave một bản toacutem tắt những gigrave magrave đối thủ cạnh tranh đang lagravem
- Caacutec hệ thống nagravey noacutei chung hoạt động dễ dagraveng vagrave trigravenh bagravey thocircng tin theo những caacutech dễ hiểu để việc tiếp thu được nhanh choacuteng (biểu đồ đồ thịhellip)
(Tagravei liệu thecircm EIS lagrave những loại hệ thống lagrave rất phức tạp trong tự nhiecircn Coacute thể noacutei hệ thống nagravey cũng cung cấp cho caacutec nhagrave quản lyacute với caacutec thiết bị coacute khả năng ra quyết định bằng caacutech sử dụng của noacute Hệ thống nagravey hoạt động trong điều kiện như vậy quan trọng như trong caacutec hệ thống khaacutec khocircng hỗ trợ Khả năng lưu trữ dữ liệu nặng lagravem cho noacute lyacute tưởng để được thocircng qua khocircng chỉ bởi caacutec doanh nghiệp lớn magrave cograven bởi caacutec doanh nghiệp nhỏ hơn Nhigraven chung hệ thống nagravey lagrave dagravenh cho caacutec nhacircn viecircn cấp cao hỗ trợ thagravenh thạo trong việc đưa ra caacutec quyết định quan trọng)
Caacutec phiecircn EIS tiecircu biểu- Phiecircn lagravem việc coacute thể bắt đầu với một baacuteo caacuteo về tigravenh higravenh tagravei chiacutenh vagrave kinh
doanh của một cocircng ty caacutec chỉ số hoạt động quan trọng được hiển thị rotilde ragraveng- EIS sẽ cho pheacutep caacutec giaacutem đốc điều hagravenh coacute thể đi sacircu vagraveo dữ liệu từ những con
số bất kỳ magrave noacute hỗ trợ- Việc điều hagravenh coacute thể lựa chọn một mức độ chi tiết ( VD danh số baacuten hagraveng) nếu
như cần điều tra thecircm- Lagrave một phương phaacutep tiếp cận coacute thể giuacutep việc ra quyết định tốt hơn
Những điều magrave EIS ko coacute- EIS khocircng phải lagrave sự thay thế cho caacutec hệ thống dựa trecircn caacutec maacutey tiacutenh khaacutec EIS
thực sự chỉ cung cấp dữ liệu cho caacutec hệ thống nagravey- Noacute khocircng thể biến caacutec bộ hệ điều hagravenh của maacutey tiacutenh thagravenh những ldquochuyecircn viecircn
giỏirdquo- Coacute thể được viacute một caacutech cao hơn như lagrave một trợ lyacute đaacuteng tin cậy coacute thể được gọi
đến bất khi nagraveo vagrave mỗi khi cần thiết
Tagravei liệu thecircm Sự khaacutec nhau giữa EIS vagrave DSS+ EIS thiết kế để hỗ trợ những người điều hagravenh cấp cao giuacutep họ khaacutem phaacute caacutec vấn đề vagrave caacutec cơ hội DSS hỗ trợ những nười phacircn tiacutech cố gắng trả lời cacircu hỏi caacutei gigrave coacute thể lagravem cugraveng với một cơ hội hoặc một vấn đề
Chiều EIS DSSNhững người sử dụng thocircng thường
Duyệt dữ liệu đi xuống truy xuất trạng thaacutei
Hỗ trợ phacircn tiacutech vagrave quyết định
Sự thuacutec đẩy Tiacutenh thiacutech hợp Tiacutenh hiệu quảỨng dụng Queacutet mocirci trường đaacutenh giaacute
hiệu suất nhận dạng caacutec vấn đề vagrave caacutec cơ hội
Caacutec quyết định quản lyacute trecircn caacutec lĩnh vực đa dạng
Hỗ trợ quyết định Caacutec chiacutenh saacutech caacutec quyết định khocircng coacute cấu truacutec ở mức cao vagrave hỗ trợ giaacuten tiếp
Hỗ trợ caacutec quyết định lặp lại caacutec quyết định khocircng thể đoaacuten trước ra quyết định khocircng coacute cấu truacutec vagrave baacuten cấu truacutec
Loại thocircng tin Caacutec thocircng tin tin tức thocircng tin becircn ngoagravei về khaacutech hagraveng đối thủ cạnh tranh mocirci trường caacutec baacuteo caacuteo theo yecircu cầu vagrave định thời về caacutec hoạt động becircn trong
Caacutec thocircng tin hỗ trợ caacutec tigravenh huống đặc biệt
Sử dụng coacute nguyecircn tắc
Dograve theo vết vagrave điều khiển nhận dạng cơ hội
Hoạch định tổ chức phacircn nhoacutem vagrave điều khiển
Khả năng phugrave hợp với những người sử dụng caacute nhacircn
Thiết kế loại ra quyết định cho mỗi người điều hagravenh caacute nhacircn bằng nhiều lựa chọn đầu ra
Cho pheacutep caacutec đaacutenh giaacute caacute nhacircn caacutec khả năng what-if lựa chọn loại hộp hội thoại
Đồ họa Phải coacute Lagrave một phần quan trọng của nhiều DSS
Thacircn thiện người sử dụng
Phải coacute Phải coacute nếu khocircng coacute người sử dụng trung gian
Xử lyacute thocircng tin Lọc neacuten thocircng tin dograve theo vết dữ liệu vagrave thocircng tin quan trọng
EIS kiacutech thiacutech caacutec cacircu hỏi caacutec cacircu trả lời bằng caacutech sử dụng DSS vagrave phản hồi lại EIS
Hỗ trợ caacutec thocircng tin chi tiết
Truy xuất thường xuyecircn caacutec mức chi tiết của bất kỳ thocircng tin tổng hợp nagraveo (duyệt dữ
Coacute thể coacute trong DSS nhưng khocircng thường
liệu chi tiết)Cơ sở mocirc higravenh Caacutec chức năng coacute sẵn bị hạn
chếLagrave điểm cốt lotildei của DSS
Cấu truacutec Theo người baacuten sản phẩm hoặc theo caacutec chuyecircn gia hệ thống thocircng tin
Theo người sử dụng hoặc caacute nhacircn hoặc caacutec chuyecircn gia từ caacutec trung tacircm thocircng tin hoặc phograveng ban hệ thống thocircng tin
Phần cứng Mainframe caacutec trạm RISC mạng LANs hoặc caacutec hệ thống phacircn bố
Mainframe caacutec trạm RISC caacutec maacutey PC hoặc caacutec hệ thống phacircn bố
Bản chất caacutec goacutei phần mềm
Truy xuất tương taacutec dễ dagraveng đến nhiều cơ sở dữ liệu truy xuất trực tuyến caacutec khả năng DBMS phức tạp caacutec liecircn kết phức tạp
Caacutec khả năng tiacutenh toaacuten lớn caacutec ngocircn ngữ mocirc higravenh mocirc phỏng ứng dụng vagrave caacutec bộ tạo DSS
Bản chất caacutec thocircng tin
Trigravenh bagravey thocircng tin được phaacutet sinh trước về quaacute khứ vagrave hiện tại tạo caacutec thocircng tin mới về quaacute khứ hiện tại tương lai
Tạo thocircng tin mới về quaacute khứ hiện tại tương lai
62 Lịch sử EIS- EIS xuất hiện lần đầu tiecircn tại MIT vagraveo những năm 1970
- Những EIS đầu tiecircn được phaacutet triển bởi caacutec doanh ngiệp lớn sẵn sagraveng chấp nhận rủi ro để đạt được lợi thế cạnh tranh
- Vagraveo những năm 1980 caacutec nhagrave cung cấp đatilde phaacutet triển một số cơ sở khaacutech hagraveng rộng vagrave cocircng nghệ EIS được tiếp tục phaacutet triển cho đến ngagravey nay
(Tagravei liệu thecircm Sử dụng DSSEIS cho phaacutet triển bền vững + Một số nghiecircn cứu đatilde được tiến hagravenh để kiểm tra việc thực hiện của EIS trong khu vực cocircng cộng vagrave chiacutenh phủ caacutec nước tổ chức kể từ khi chuacuteng được phaacutet triển theo định hướng lợi nhuận cho caacutec cocircng ty tư nhacircn (Hasan vagrave Hasan năm 1997) Theo một nghiecircn cứu tiến hagravenh tại Mỹ ở hơn 300 cocircng ty kết quả cho thấy sự khaacutec biệt của EIS giữa tư nhacircn vagrave chiacutenh phủ một số kết quả thuacute vị được phaacutet hiệnViacute dụ khoacute khăn hơn để chuyển tiền từ một tagravei khoản khaacutec trong một EIS của chiacutenh phủ cũng lagrave khoacute khăn hơn để biện giải thiacutech cho những chi phiacute phaacutet triển EIS của chiacutenh phủ Một nghiecircn cứu khaacutec được tiến hagravenh ở Australia
cho thấy rằng EIS cung cấp cho quản lyacute một higravenh ảnh chiacutenh xaacutec hơn về tổ chức thực hiện vagrave cung cấp hỗ trợ cho caacutec lợi iacutech chiến lược cải thiện khocircng chỉ cho caacutec nhagrave quản lyacute nhưng cograven cho phần cograven lại của tổ chức Dựa trecircn caacutec hệ thống được thiết kế cho caacutec cocircng ty tư nhacircn với một caacutech rotilde ragravengxaacutec định mục tiecircu EIS lagrave thiacutech hợp cho caacutec tổ chức cocircng cộng hiện đại nhưng cần phải được linh hoạt hơn vagrave kết thagravenh chugravem một phạm vi rộng hơn khả năng vagrave phương tiện hơn so với khu vực tư nhacircn ban đầu theo định hướng sản phẩm (Hasan vagrave Hasan năm 1997) Điều nagravey coacute thể lagrave do thực tế rằng caacutec hoạt động khu vực cocircng lagrave bắt buộc coacute taacutec động rộng phải đaacutep ứng sự mong đợi duy nhất cocircng cộng thường coacute mục tiecircu mơ hồ vagrave macircu thuẫn iacutet quyền tự chủ vagrave kiểm soaacutet việc ra quyết định vagrave nhacircn viecircn lagrave khoacute khăn hơn (Watson vagrave Carte2000) + Toacutem lại EIS lagrave một khaacutei niệm thagravenh cocircng noacute phaacutet triển qua nhiều năm tuy nhiecircn EIS khắc phục khiếm khuyết của migravenh bằng caacutech tiến hagravenh nghiecircn cứu liecircn tục)
63 Tại sao những người điều hagravenh hagraveng đầu lại khaacutec nhau- Họ lagrave những doanh nghiệp theo định hướng coacute suy nghĩ
- Coacute một khoảng khocircng gian rộng để kiểm soaacutet
- Họ chịu traacutech nhiệm cho việc thiết lập chiacutenh saacutech
- Họ đại diện cho tổ chức mocirci trường becircn ngoagravei
- Hagravenh động của họ tạo ra những kết quả đaacuteng kể về tagravei chiacutenh vagrave con người
Tần số caacutec hoạt động điều hagravenh- Xử lyacute xaacuteo trộn 42
- Hoạt động kinh doanh 32
- Phacircn bổ nguồn lực 17
- Đagravem phaacuten 3
- Những điều khaacutec 6
Handling Disturbances 42
Entrepreneurial Activites 32
Resource Allocation 17
Negotiation 3
Other 6
Những thocircng tin điều hagravenh cần thiết- Quản lyacute xaacuteo trộn coacute thể yecircu cầu sự chuacute yacute xung quanh đồng hồ
- Hoạt động kinh doanh yecircu cầu điều hagravenh để dự đoaacuten những thay đổi trong mocirci trường
- Nhiệm vụ phacircn bổ tagravei nguyecircn yecircu cầu lựa chọn người quản lyacute vagrave caacutec nguồn lực hạn chế được triển khai
- Đagravem phaacuten yecircu cầu cập nhật thocircng tin từng phuacutet để coacute thể xacircy dựng được sự đồng thuận
Caacutec loại thocircng tin điều hagravenh- Hệ thống kế toaacuten coacute liecircn quan đến việc tiacutenh toaacuten thu nhập hoạt động cho caacutec lĩnh
vực cụ thể lagrave quan trọng hơn so với caacutec hệ thống kế toaacuten truyền thocircng- Thocircng tin về thị trường khaacutech hagraveng cung cấp giaacute trị trong việc quyết định chiến
lược- Caacutec thocircng tin cần thiết thường được truyền đi trecircn một số hệ thống maacutey tiacutenh vagrave
nằm trong toagraven tổ chức- Caacutec thocircng tin được sử dụng thường lagrave ngắn hạn vagrave dễ thay đổi
Phương thức để xaacutec định thocircng tin cần thiết
Rockart xaacutec định được năm phương thức cơ bản để xaacutec định thocircng tin cần thiết
- Phương thức dựa trecircn kết quả- Phương thức rỗng- Phương thức chỉ số khoacutea- Phương thức tổng hợp nghiecircn cứu- Phương thức dựa vagraveo nhacircn tố then chốt dẫn đến thagravenh cocircng
64 Thagravenh phần EIS
- Sản phẩm EIS đầu tiecircn được phaacutet triển để sử dụng trecircn maacutey tiacutenh cấu higravenh cao nhưng caacutec sản phẩm hiện nay nhằm mục tiecircu lagrave nền tảng ClientServer
- Những nền tảng linh hoạt hơn coacute thể thiacutech ứng với thay đổi trong tổ chức vagrave cocircng nghệ
- Sử dụng dữ liệu thời gian thực dẫn đến quyết định nhanh hơn nhiều thocircng tin hơn
Thagravenh phần phần cứng- Một EIS khocircng đogravei hỏi coacute phần cứng cụ thể hoặc duy nhất nagraveo- Chigravea khoacutea của vấn đề lagrave để đảm bảo rằng caacutec thagravenh phần của EIS tối ưu hoacutea vagrave
phugrave hợp với tagravei nguyecircn maacutey tiacutenh của tổ chức- Hệ thống nagravey phải được cấu higravenh để caacutec nguồn tagravei nguyecircn phugrave hợp với những
người điều hagravenh chuacuteng
Thagravenh phần phần mềm- Traacutei ngược với phần cứng phần mềm thường được chuyecircn mocircn hoacutea cao cho caacutec
bagravei toaacuten về miền- Sự chuyecircn mocircn hoacutea nagravey thường đạt được bằng caacutech sử dụng thagravenh phần off-the-
shelf cho toagraven bộ EIS vagrave caacutec mocirc-đun tugravey chỉnh để đaacutep ứng nhu cầu cụ thể- Lotus Notes lagrave một viacute dụ điển higravenh Noacute coacute thể được sử dụng một migravenh hoặc coacute
thể phục vụ becircn thứ ba mocirc-đun plug-in
Cocircng nghệ EIS hiện nay
Dobrzeniecki đề xuấtphacircn loạitừng cấptheo bachức năng- Loại 1 sản phẩm bao gồmmột bộ đầy đủcaacutec ứng dụngtừ mộtnhagrave cung cấp- Loại 2 sản phẩm đượcthựchiệnở phần đầu củacaacutecsản phẩmDSS đượcphaacutet triển
bởicugravengmộtnhagrave cung cấp- Loại 3 sản phẩmkết hợp với nhautheo bất kỳ số lượngthuộc sở hữu củacocircng ty
65 Xacircy dựng EIS
- Xacircy dựngmộtEISgiống nhưxacircydựngmột số hệ thống khaacutec củamocirc higravenh hệ thống thocircng tin
- Việcphaacutet triểncấu truacutecnecircn được theo dotildeitừ quaacute trigravenh thiết kế đến quaacute trigravenhthực hiện
- Tuy nhiecircn một dự aacuten phaacutet triển EIScoacute xu hướnglagrave thống nhấtvagraveyecircu cầu hỗ trợ caacutec nhagrave quản lyacute latildenh đạo
- Xacircy dựng một EIScoacute thểphaacutet hiện ra đượccaacutectigravenh huống khoacute khănmagravemột nhagrave phaacutet triển chưabao giờ gặp phải
Mocirc higravenh EIS
Khung phaacutet triển một EIS
- Watson et al đề nghị xacircy dựngkhung với ba thagravenh phần+ Caacutech tiếp cận tập trung vagraveo yếu tốcon người vagrave dữ liệu coacute liecircn quan đến EIS+ Quaacute trigravenh phaacutet triển cần sự linh hoạt vagrave tương taacutec+ Người sử dụng - hệ thống hộp thoại bao gồm một ngocircn ngữ hagravenh động để xử lyacute caacutec lệnh
Lợi iacutech của EIS- Dễ duy trigrave caacutec mục tiecircu coacute tổ chức- Dễ truy xuất thocircng tin- Cho pheacutep người sử dụng nacircng cao hiệu suất hơn
- Tăng chất lượng ra quyết định- Cung cấp sự cải tiến cạnh tranh- Tiết kiệm thời gian của người sử dụng- Tăng khả năng vagrave chất lượng giao tiếp- Cung cấp khả năng điều khiển tốt hơn trong tổ chức- Cho pheacutep tham gia caacutec vấn đề vagrave caacutec cơ hội- Cho pheacutep hoạch định- Cho pheacutep tigravem kiếm nguyecircn nhacircn của một vấn đề- Thảo matilden caacutec yecircu cầu của người điều hagravenh
Hạn chế của EIS vagrave 1 số sai lầm cần traacutenh
- Chi phiacute một cuộc khảo saacutetnăm1991 chothấychi phiacute phaacutet triểntrungbigravenh365000USDvớichi phiacute vận hagravenhhagraveng năm lagrave$200000 (EIS)
- Cocircng nghệ hạn chếEIScần phảiđượctiacutech hợp hoagraven toagravenvagraveokiếntruacuteccủadoanh nghiệphiện tại do đoacute noacutelagrave một thaacutech thứclớn đối vớithiết kế
- Hạn chế tổ chức cơ cấu tổ chứccoacute thể khocircng phugrave hợp
Sự hạn chế về tổ chức- Chương trigravenh nghị sự vagrave thời gian chệch EIS mocirc tả một phần việc thực hiện một
chương trigravenh nghị sự vagrave coacute thể dễ dagraveng đạt được sự tin cậy một caacutech chắc chắn- Đồng bộ hoacutea việc quản lyacute sự tin cậy đuacuteng luacutec đặc biệt baacuteo caacuteo EIS coacute thể phaacute
vỡ sự ổn định thiết lập caacutec chu trigravenh baacuteo caacuteo một caacutech tốt nhất- Sự bất ổn EIS phản ứng nhanh coacute thể gacircy ra việc taacutec động trở lại một caacutech
nhanh choacuteng dẫn đến sự thiếu ổn định trong tổ chức
Sự thất bại lagrave thay thế khocircng thể chấp nhận được- Một số yếu tố lagravem EIS thất bại
+ Thiếu sự hỗ trợ về mặt quản lyacute+ Vấn đề chiacutenh trị+ Thất bại của nhagrave phaacutet triển+ Lỗi về cocircng nghệ+ Giaacute cả+ Thời gian
66 Ra quyết định điều hagravenh trong tương lai vagrave EIS
- Coacute một vagravei điều kiện sẽ được hợp nhất cho việc chuyển đổi cocircng nghệ Trong đoacute một vagravei điều kiện coacute thể dễ dự đoaacuten Hai điều kiện magrave ta coacute thể thấy lagrave+ Phaacutet triển cocircng nghệ maacutey tiacutenh trong việc điều hagravenh sẽ tạo ra sự chuyển đổi được chấp nhận một caacutech dễ dagraveng hơn+ Mở rộng traacutech nhiệm điều hagravenh sẽ mở rộng nhu cầu thocircng tin
Tương lai của EIS- EIS thocircng minh Những tiến bộ trong cocircng nghệ AI sẽ được triển khai trong caacutec
EIS- EIS đa phương tiện Cơ sở dữ liệu đa phương tiện sẽ cho pheacutep tiacutech hợp văn bản
giọng noacutei vagrave higravenh ảnh trong tương lai- EIS thocircng tin Tương lai EIS sẽ mở rộng hơn trong việc sử dụng dữ liệu becircn
ngoagravei doanh nghiệp- EIS kết nối Giao tiếp với băng thocircng rộng cho pheacutep kết nối liecircn thocircng lớn hơn
Chương 7 HỆ CHUYEcircN GIA VAgrave TRIacute TUỆ NHAcircN TẠO
71 Caacutec khaacutei niệm
72 Triacute thocircng minh của triacute tuệ nhacircn tạo
73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia
74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia
75 Lợi iacutech vagrave hạn chế của hệ chuyecircn gia
71 Caacutec khaacutei niệm
Chuyecircn mocircn (Expertise) sự hiểu biết rộng trong 1 lĩnh vực hẹp
Hệ chuyecircn gia (Expert Systems)1 chương trigravenh maacutey tiacutenh sử dụng 1 tập caacutec luật dựa trecircn tri thức của con người để giải quyết caacutec vấn đề đogravei hogravei phải coacute sự chuyecircn mocircn
Một số hệ chuyecircn gia nổi tiếng
DENDRAL (Standford 1960s Edward Feigenbaum)
MYCIN (Standford1970s Edward Shortliffe)
PROSPECTOR (MIT 1979)
Triacute tuệ nhacircn tạo (Artificial Intelligence ndash AI)
Triacute tuệ nhacircn tạo một bộ phacircn của ngagravenh khoa học maacutey tiacutenh quan tacircm đến việc thiết kế caacutec hệ thống maacutey tiacutenh thocircng minh đoacute lagrave caacutec hệ thống đưa ra caacutec đặc điểm magrave từ đoacute chuacuteng ta liecircn hệ với sự thocircng minh trong hagravenh động của con người (Barr vagrave Feigenbaum 1981)
Mục điacutech của AI
Mục điacutech khoa học xaacutec định caacutec gợi yacute để giải thiacutech caacutec loại khaacutec nhau của triacute tuệ thực
Mục điacutech kỹ thuật giải quyết caacutec vấn đề trong thế giới thực
Triacute tuệ nhacircn tạo kế thừa nhiều yacute tưởng quan điểm kỹ thuật từ caacutec ngagravenh khoa học khaacutec
- Triết học
- Logic Toaacuten học
- Tiacutenh toaacuten
- Khoa học tacircm lyacute Khoa học nhận thức
- Sinh học Thần kinh học
- Tiến hoacutea
Caacutec lĩnh vực ứng dụng trong Triacute tuệ nhacircn tạo
Mạng nơ ron thần kinh (Neural Networks)
Tiacutenh toaacuten sự tiến hoacutea
(Evolutionary Computation)
Hệ chuyecircn gia (Expert Systems)
Kỹ thuật xử lyacute tiếng noacutei (Speech Processing)
Kỹ thuật xử lyacute ngocircn ngữ tự nhiecircn
(Natural Language Processing)
Lập kế hoạch (Planning)
Robot (Robotics)
Khoa học higravenh ảnh (Vision)
Caacutec kỹ thuật thocircng dụng dugraveng trong AI
Biểu diễn(Representation)
Học (Learning)
Caacutec luật (Rules)
Tigravem kiếm (Search)
72 Triacute thocircng minh của triacute tuệ nhacircn tạo
Con người suy diễn như thế nagraveo
Phacircn loại (Categorization)
Caacutec quy tắc cụ thể
Heuristics
Kinh nghiệm trước đoacute
Dự tiacutenh trước
Maacutey tiacutenh suy diễn như thế nagraveo
Lập luận dựa trecircn luật IF-THEN mocirc tả tri thức được matilde hoacutea dưới dạng caacutec luật
Caacutec khung (Frames) lagrave caacutec đại diện mocirc tả caacutec tigravenh huống giống nhau lagrave điển higravenh của một vagravei phacircn loại
Lập luận dựa trecircn caacutec trường hợp mocirc phỏng giải phaacutep trước đoacute cho một vấn đề hiện tại
Nhận dạng mẫu phaacutet hiện acircm thanh higravenh dạng hoặc caacutec chuỗi dagravei
Caacutec dạng khaacutec của Triacute tuệ nhacircn tạo
Học maacutey- mạng nơron vagrave giải thuật di truyền
Lập trigravenh tự động ndash lagrave những kỹ thuật tạo ra caacutec chương trigravenh để lagravem 1 nhiệm vụ riecircng biệt (cho pheacutep những người khocircng phải lagrave người lập trigravenh coacute thể lập trigravenh được)
Cuộc sống nhacircn tạo ndash nỗ lực để taacutei tạo caacutec hiện tượng sinh học trong caacutec hệ thống dựa trecircn maacutey tiacutenh
73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia(Expert Systems- ES)
Theo Jackson (1999) Một hệ chuyecircn gia lagrave một chương trigravenh maacutey tiacutenh mocirc tả vagrave suy diễn với tri thức của một vagravei lĩnh vực để giải quyết vấn đề hay đưa ra caacutec lời khuyecircn
Cấu truacutec cơ bản của ES được dựa theo cấu truacutec chung của DSS Sự khaacutec biệt chiacutenh giữa ES vagraveDSS lagrave hệ ES thu thập caacutec kiến thức từ những
chuyecircn gia trong lĩnh vực quan tacircmĐặc trưng của hệ chuyecircn gia Hiệu quả cao Thời gian trả lời thỏa đaacuteng Độ tin cậy cao Dễ hiểu
Giao diện người dugraveng trong ES
Thiết kế giao diện người dugraveng tập trung vagraveo caacutec yếu tố như dễ dagraveng sử dụngcoacute độ tin cậy cao giảm tải những khoacute khăn khi sử dụng
Thiết kế necircn coacute một số tương taacutec (đầu vagraveo kiểm soaacutet vagrave truy vấn)
Cấu tạo giao diện người dugraveng gồm coacute magraven higravenh cảm ứng bagraven phiacutem buacutet saacuteng lệnh thoại caacutec phiacutem chuyecircn dụng
Cơ sở tri thức (Knowledge Base)
Chứa đựng caacutec tri thức cụ thể miền thu được từ caacutec chuyecircn gia miền
Coacute thể chứa caacutec mocirc tả caacutec hagravenh vi giải quyết vấn đề caacutec ragraveng buộc caacutec heuristics
Thagravenh cocircng của một ES dựa trecircn tiacutenh đầy đủ vagrave tiacutenh chiacutenh xaacutec của cơ sở tri thức
Mocirc tơ suy diễn (Inference Engine)
Ở đacircy tri thức được đặt để sử dụng tạo ra caacutec giải phaacutep để giải quyết vấn đề
Mocirc tơ nagravey coacute khả năng thực hiện diễn dịch hoặc suy diễn dựa trecircn caacutec luật hay caacutec caacutec sự kiện
Đồng thời cũng coacute khả năng sử dụng caacutec suy diễn mờ hay khocircng chiacutenh xaacutec dựa trecircn xaacutec suất hay aacutenh xạ mẫu
Vograveng điều khiển suy diễn
1 Aacutenh xạ caacutec luật với caacutec sự kiện đatilde được cho
2 Chọn luật để thực hiện
3 Thực hiện luật bằng caacutech thecircm caacutec sự kiện được suy diễn ra vagraveo bộ nhớ lagravem việc
Chuỗi suy diễn (Chaining)
Suy diễn tiến (forward chaining) maacutey suy diễn bắt đầu từ dữ liệu ban đầu vagrave thực hiện việc suy luận để đưa ra caacutec kết luận cuối cugraveng
Suy diễn lugravei (backward chaining) maacutey suy diễn bắt đầu từ dữ liệu điacutech vagrave tigravem ra tri thức hỗ trợ cho dữ liệu điacutech đoacute
Viacute dụ suy diễn lugravei
R1 Nếu coacute A vagrave B thigrave suy ra coacute D
R2 Nếu coacute B thigrave suy ra coacute C
R3 Nếu coacute C vagrave D thigrave suy ra coacute E
Ta coacute E ta xem trong 3 luật R1 R2 R3 luật nagraveo coacute E ta thấy R3 chứa E đồng thời chứa C vagrave D Xeacutet tiếp trong 2 luật R1 R2 luật nagraveo chứa C vagrave D R2 chứa C R3 chứa D Từ đoacute ta coacute được caacutec tri thức hỗ trợ suy diễn vagrave kết luận lagrave nếu coacute A vagrave B thigrave sẽ coacute E Hay nếu A vagrave B đuacuteng thigrave sẽ coacute E
Viacute dụ suy diễn tiến
Giả sử coacute tập chứa 3 luật sau
R1 Nếu coacute A vagrave B thigrave suy ra coacute D
R2 Nếu coacute B thigrave suy ra coacute C
R3 Nếu coacute C vagrave D thigrave suy ra coacute E
Nếu ta coacute A vagrave B thigrave chuacuteng ta suy ra được D từ R1 vagrave suy ra C từ R2 Với D vagrave C đatilde được suy ra ở trecircn giờ chuacuteng ta suy ra được E từ R3
Viacute dụ thực tế
Giả sử muốn biết magraveu của một con vật nuocirci tecircn lagrave Fred biết rằng noacute kecircu ộp ộp vagrave ăn ruồi
Coacute tập 4 luật ban đầu như sau
R1 Nếu X kecircu ộp ộp vagrave ăn ruồi thigrave X lagrave con ếch
R2 Nếu X kecircu chiecircm chiếp vagrave biết hoacutet thigrave X lagrave con chim
R3 Nếu X lagrave con ếch thigrave X coacute magraveu xanh
R4 Nếu X lagrave con chim thigrave X coacute magraveu vagraveng
74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia
Expert system shells lagrave một tập caacutec goacutei phần mềm vagrave caacutec cocircng cụ dugraveng để phaacutet triển caacutec hệ chuyecircn gia
Những Expert system shells đầu tiecircn thường rất rườm ragrave Mặc dugrave vậy noacute vẫn giuacutep cho người sử dụng sẽ khocircng phải bắt đầu lại từ đầu khi xacircy dựng một hệ chuyecircn gia mới
Những shell hiện đại bao gồm hai mocirc-đun chiacutenh lagrave cocircng cụ xacircy dựng một tập quy tắc vagrave mocirc tơ suy diễn
Xacircy dựng hệ chuyecircn gia
Bước 1 xacircy dựng mocirc higravenh bagravei toaacuten xaacutec định vấn đề nhiệm vụ magrave hệ thống sẽ thực hiện Caacutec dạng bagravei toaacuten cần hệ chuyecircn gia
Bagravei toaacuten diễn giải (InterPretation)
Bagravei toaacuten dự baacuteo (Prediction)
Bagravei toaacuten chuẩn đoaacuten (Diagnose)
Bagravei toaacuten gỡ rối (Debugging)
Bagravei toaacuten thiết kế
Tương tự như một dự aacuten phần mềm để xacircy dựng một hệ chuyecircn gia cần phải coacute caacutec yếu tố về nhacircn lực tagravei nguyecircn vagrave thời gian Những yếu tố nagravey ảnh hưởng đến giaacute thah của một hệ chuyecircn giaTrong phần nagravey cacircu hỏi thường được đặt ra lagrave tại sao cần phải xacircy dựng một hệ chuyecircn giaTrước khi bắt đầu phải xaacute định rotilde bagravei toaacuten đạt ra lagrave jiAi lagrave chuyecircn giaAi lagrave người sử dụng
1 Diễn giải (InterPretation) Nghiecircn cứu 1 vấn đề -gt Dựa trecircn những biểu hiện thuộc tiacutenh đặc trưng becircn ngoagravei -gt Tư vấn
(hoặc đưa ra kết luận hay mocirc tả dễ hiểu từ tập dữ liệu thocirc)
2 Bagravei toaacuten dự baacuteo (Prediction) Coacute thể dự đoaacuten được hagravenh vi kết quả dựa trecircn caacutec hiện tượng -gt dự baacuteo
VD Dự baacuteo thời tiết động đấthellip
3 Bagravei toaacuten chẩn đoaacuten (Diagnoss) Xaacutec định caacutec lỗi caacutec bộ phận hỏng hoacutec của hệ thống dựa trecircn caacutec dữ liệu quan saacutet được
4 Bagravei toaacuten gỡ rối (Debugging) Mocirc tả caacutec phương phaacutep khắc phục hệ thống khi gặp sự cố
5 Bagravei toaacuten thiết kế Lựa chọn cấu higravenh caacutec đối tượng nhằm thoả matilden một số ragraveng buộc nagraveo đoacute
6 Giảng dạy Phần mềm dạy học coacute thể chuẩn đoaacuten vagrave sủa lỗi của học sinh trong quaacute trigravenh học tập
Để xaacutec định đuacuteng bagravei toaacuten magrave chuacuteng ta cần giải quyết thigrave phải trả lời đc một số cacircu hỏi
- cần hệ chuyecircn gia
Bước 2 thu thập tri thức lựa chọn cocircng cụ vagrave aacutep dụng
Trong bước thu thập tri thức vấn đề quan trọng lagrave lựa chọn chuyecircn gia những người magrave sẽ đoacuteng goacutep tri thức cho hệ thống Thocircng thường trong suốt quaacute trigravenh phaacutet triển thigrave chuyecircn gia được xem như một thagravenh viecircn của đội phaacutet triển
Hiện nay coacute rất nhiều cocircng cụ để xacircy dựng một hệ chuyecircn gia Phổ biến nhất lagrave JESS CLIPS vagrave OPS5
Bước 3 Thiết kế cơ sở tri thức thiết kế hệ thốngTri thức được biểu diễn trường minh trong cơ sở tri thức
Caacutec chuyecircn gia vagrave kỹ sư tri thức sẽ đối thoại với nhau bằng caacutec kỹ thuật đối thoại Suy diễn (SD) bảng Mocirc higravenh hoacutea SD quy nạp phacircn loại
Vấn đề bagraveo trigrave vagrave phaacutet triển
Caacutec hệ chuyecircn gia đogravei hỏi phải bảo trigrave vagrave phaacutet triển nhiều hơn so với caacutec hệ thống khaacutec Phải thường xuyecircn bổ sung tri thức mới vagrave thay đổi caacutec tri thức cũ để đổi mới hệ chuyecircn gia
Thu thập vagrave khắc phục lỗi do người sử dụng phaacutet hiện để kịp thời khắc phục những sai soacutet của hệ chuyecircn gia
75 Lợi iacutech vagrave hạn chế của caacutec hệ chuyecircn gia
Một số lợi iacutech chiacutenh
Thời gian trả lời hợp lyacute bằng hoặc nhanh hơn so với chuyecircn gia (người) để đi đến cugraveng một quyết định Hệ chuyecircn gia lagrave một hệ thống thời gian thực (real time system)
Khả năng trả lời với mức độ tinh thocircng bằng hoặc cao hơn so với chuyecircn gia (người) trong cugraveng lĩnh vực
Hệ chuyecircn gia giuacutep cho hiệu quả lagravem việc tăng bằng việc sử dụng tập caacutec luật một caacutech nhanh choacuteng magrave ko bị nhầm lẫn chuyecircn gia lagrave người coacute thể quecircn đi một số tri thức cơ sở lyacute luậ nhưng HCG thigrave ko
Quyết định của một người chuyecircn gia coacute thể bị thay đổi vagrave ko coacute tiacutenh thống nhất như quyết định của một hệ chuyecircn gia tạo ra
Hệ chuyecircn gia giuacutep cho người sử dụng coacute thể trau dồi sự hiểu biết trecircn lĩnh vuej cụ thể magrave noacute giải quyết hỗ trợ người ra quyết định coacute trigravenh độ như 1 chuyecircn gia trong quaacute trigravenh gia quyết định
Kiến thức của rất nhiều chuyecircn gia về một lĩnh vực nagraveo đoacute được đưa vagraveo hệ chuyecircn gia lagravem cho CSTT cuat HCG phong phuacute vagrave rộng lớn hơn rất nhiều
HCG giải thiacutech caacutec bước suy luận một caacutech dễ hiểu nhất quaacuten luacutec nagraveo cũng coacute thể sử dụng ko như chuyecircn gia con người
Hạn chế của caacutec hệ chuyecircn gia
Nhược điểm lớn nhất của hệ chuyecircn gia lagrave những yacute kiến chuyecircn mocircn thường rất khoacute matilde hoacutea vagrave giải neacuten
Hệ chuyecircn gia khocircng coacute khả năng tự học tự cập nhật kiến thức mới như caacutec chuyecircn gia magrave cần phải được matilde hoacutea lại khi noacute được cập nhật
Hệ chuyecircn gia khocircng thể nhận ra được vấn đề khocircng nằm trong miền kiến thức của hệ thống
Chương 8 Tri thức vagrave tiếp nhận
1 Bao gồm caacutec vấn đề
Dữ liệu thực tế đo lường hoặc quan saacutet coacute hoặc khocircng coacute bối cảnh
Thocircng tin dữ liệu được tổng hợp một caacutech hữu iacutech để giải quyết những khoacute khăn trong việc đưa ra quyết định
Tri thức bao gồm caacutec ứng dụng quy tắc thocircng tin hướng dẫn của người ra quyết định
2 Những caacutei nhigraven về tri thức
Đại diện lagravem thế nagraveo để diễn tả tri thức viacute dụ như một quyển saacutech khocircng phải lagrave tri thức nhưng noacute lại lagrave một đại diện của tri thức
Sản xuất tri thức lagrave một tập hơp của hagraveng tồn kho coacute thể được sản xuất cũng như mua lại
Tri thức lagrave 1 trong 6 trạng thaacutei của hệ thống
1Dữ liệu 2Thocircng tin 3Cấu truacutec thocircng tin 4Sự thấu hiểu 5Yacute kiến 6 Quyết định
3 Caacutec loại tri thức Phổ biến mocirc tả dữ liệu thocircng tin thủ tục mọi thứ lagravem như thế nagraveo lập luận chiacutenh saacutech hoặc caacutec quy tắc
4 Thu thập Tri thức hệ chuyecircn gia Hầu hết caacutec phương phaacutep đều bắt đầu với mocirc higravenh của caacutec taacutec vụ trong đoacute
hệ chuyecircn gia được xacircy dựng Trong đoacute mocirc tả về caacutec lĩnh vực được tạo ra Caacutec kỹ sư sử dụng caacutec mocirc higravenh giả thuyết vagrave nhận thức về quaacute trigravenh phacircn
tiacutech để gợi ra caacutech giải quyết vấn đề về tri thức từ caacutec chuyecircn gia
5 Caacutec chiều của thu thập tri thức KE- driven caacutec kỹ sư trao đổi trực tiếp với caacutec chuyecircn gia Expert-driven Caacutec chuyecircn gia trực tiếp đưa chuyecircn mocircn của họ vagraveo hệ
thống maacutey tiacutenh Machine-driven Sử dụng caacutec cocircng cụ suy luận để triacutech xuất tri thức từ một
tập caacutec viacute dụ
6 Kỹ thuật thu thập tri thức Trao đổi gồm 2 loại cơ bản lagrave coacute cấu truacutec(coacute kịch bản) vagrave khocircng coacute cấu
truacutec( đối thoại trực tiếp) Giao thức phacircn tiacutech bằng lời Khi caacutec chuyecircn gia thực hiện một cocircng việc
của họ thigrave một bản ghi về cocircng việc đoacute được thực hiện Caacutec kỹ sư sẽ xacircy dựng mocirc higravenh cho những gigrave được ghi lại trong bản ghi
Phương phaacutep sagraveng lọc caacutec chuyecircn gia so saacutenh caacutec nhoacutem liecircn tiếp trong ba đối tượng vagrave cho biết tại sao nhoacutem thứ hai lại khaacutec nhoacutem thứ ba
7 Thu thập tri thức từ nhiều nguồn Thu thập tri thức từ nhiều nguồn lagrave cần thiết để coacute được đầy đủ caacutec tri thức
cho một vấn đề quan điểm yacute kiến traacutei ngược nhau thường phaacutet sinh Phương phaacutep đồng thuận sẽ giuacutep giải quyết được vấn đề macircu thuẫn Kỹ thuật phacircn tiacutech Meta lagrave kỹ thuật được aacutep dụng trong caacutec trường hợp
khaacutec Caacutech tiếp cận bằng định lượng đogravei hỏi caacutec kỹ sư cần cacircn nhắc yếu tố đầu vagraveo của caacutec chuyecircn gia khaacutec nhau
8 Xaacutec nhận hợp lệ vagrave kiểm tra tri thức Một khi thu thập tri thức noacute phải được đaacutenh giaacute về khả năng sử dụng vagrave độ
chiacutenh xaacutec Hai vấn đề cụ thể lagrave hiệu lực của những kiến thức vagrave kiểm tra việc xacircy dựng cơ sở của tri thức
Cần xaacutec nhận xem liệu hệ thống coacute thể hoạt động ở mức độ tối thiểu khocircng
Xaacutec minh liecircn quan đến việc so saacutenh từng chi tiết kỹ thuật của hệ thống những gigrave đatilde được thực hiện cuối cugraveng
9 Một số caacutec biện phaacutep xaacutec nhận Độ chiacutenh xaacutec Khả năng thiacutech nghi Mức độ đầy đủ Bề rộng Độ sacircu Hiệu lực Tổng quan Chiacutenh xaacutec Hiện thực Độ tin cậy Tiacutenh hữu dụng Mức độ
Chương 9 Học maacutey
1 Logic mờ vagrave ngocircn ngữ mờ(Fuzzy Logic and Linguistic Ambiguity)
Ngocircn ngữ tự nhiecircn gồm những khaacutei niệm mơ hồ vagrave khocircng chiacutenh xaacutectruyền tải ngữ nghĩa thocircng qua tiacutenh xấp xỉkhocircng rotilde ragraveng
Những xấp xỉ nagravey giuacutep con người coacute thể truyền tải hết được yacute nghĩa nhưng maacutey thigrave khocircng hiểu
Lagravem sao biểu diễn caacutec tri thức sử dụng caacutec khaacutei niệm khocircng rotilde ragraveng(mờ) hoặc khocircng chiacutenh xaacutec
2 Khaacutei niệm cơ bản của logic mờ tập mờ lagrave những tập hợp khocircng coacute một giới hạn rotilde Mỗi phần tử của noacute chỉ
chứa một mức độ hagravem liecircn thuộc của từng phần tử Vigrave vậy tập mờ khocircng giống như tập cổ điển Tập mờ coacute thể kết hợp với nhau qua những luật mờ magrave đặc trưng cho những hagravenh động trạng thaacutei vagrave thuộc tiacutenh của logic mờ được tận dụng khi thực hiện một bộ điều khiển mờ
Logic mờ dựa trecircn yacute tưởng mỗi phần tử thuộc vagraveo một tập hợp ở một mức độ nagraveo đấy
Locircgic mờ cho pheacutep độ liecircn thuộc (microA )coacute giaacute trị trong khoảng (01) Locircgic mờ coacute thể được coi lagrave mặt ứng dụng của lyacute thuyết tập mờ để xử lyacute caacutec
giaacute trị trong thế giới thực cho caacutec bagravei toaacuten phức tạp
3 So saacutenh tiacutenh đuacuteng đắn logic mờ vagrave xaacutec suất Xaacutec suất thigrave đề cập đến khả năng xảy ra một biến cố hay một điều gigrave đoacute Logic mờ đề cập đến cấp độ magrave đặc tiacutenh ở hiện tại
o viacute dụ1 người coacute chiều cao 6 feet thigrave coacute cấp độ lagrave 05 về chiều cao
4 Ưu điểm của logic mờ Caacutech tiếp cận rất tự nhiecircnkhocircng phức tạp Coacute thể mocirc higravenh hoacutea caacutec hagravem phi tuyến tugravey yacute phức tạp
Coacute thể tận dụng được kinh nghiệm từ những chuyecircn gia hagraveng đầu trong mọi lĩnh vực
Logic mờ được xacircy dựng dựa trecircn ngocircn ngữ tự nhiecircnNền tảng của logic mờ lagrave dựa trecircn cơ sở giao tiếp của con người
5 Nhược điểm của logic mờ Trong 1 hệ thống phức tạpsử dụng logic mờ coacute thể trở thagravenh trở ngại cho
việc xaacutec thực độ tin cậy của hệ thống Cơ chế lập luận mờ khocircng thể học hỏi từ những lỗi sai
6 Mạng noron nhacircn tạo(ANN) Mạng noron nhacircn tạo lagrave một mocirc phỏng xử lyacute thocircng tinđược nghiecircn cứu ra
từ hệ thống thần kinh của sinh vậtgiống như bộ natildeo để xử lyacute thocircng tin ANNs lagrave chương trigravenh dựa trecircn maacutey tiacutenh đơn giản coacute chức năng lagrave một mocirc
higravenh bagravei toaacuten khocircng gian dựa trecircn thử nghiệm vagrave baacuteo lỗi
7 Học từ kinh nghiệm Tiến trigravenh Một mẫu dữ liệu được biểu diễn như một mạng lưới noronANN ldquodự
đoaacutenrdquo 1 đầu radự đoaacuten được so saacutenh với giaacute trị thực tế hoặc giaacute trị chiacutenh xaacutecNếu đoaacuten được chiacutenh xaacutec thigrave khocircng coacute hagravenh động nagraveo được thực hiện
Nếu dự đoaacuten sai ANN kiểm tra lại vagrave xaacutec định lại thocircng số để điều chỉnh Một mẫu dữ liệu khaacutec được biểu diễn vagrave quaacute trigravenh nagravey được lặp lại
8 Nguyecircn tắc cơ bản của cocircng nghệ nơron Caacutec yếu tố xử lyacute cơ bản trong hệ thống thần kinh của con người lagrave tế bagraveo
thần kinhMạng lưới của tế bagraveo nagravey lagrave liecircn kết với nhau nhận được thocircng tin từ caacutec cảm biến trong mắt taihellip
Thocircng tin nhận được bởi tế bagraveo thần kinh hoặc lagrave sẽ kiacutech thiacutech noacute(sẽ được chuyển qua 1 thocircng điệp dọc theo mạng lưới) hoặc lagrave sẽ ngăn cản noacute(ngăn cản dograveng thocircng tin)
Độ nhạy coacute thể thay đổi qua thời gian hoặc sau khi coacute được kinh nghiệm
9 Cấu truacutec mạng Một ANN gồm 3 lớp cơ bản
Lớp đầu vagraveo nhận dữ liệu Lớp becircn trong hoặc lagrave lớp ẩn xử lyacute dữ liệu Lớp đầu ra chuyển tiếp kết quả cuối cugraveng của mạng
10Mạng nơ ron Thường coacute nhiều đầu vagraveo mỗi đầu vagraveo với mức ảnh hưởng vagrave tầm quan
trọng riecircng của noacute Một đầu vagraveo quan trọng coacute thể được sử dụng để khuếch đại đầu ra caacutec hagravem trạng thaacutei tổng hợp caacutec trọng số của caacutec yếu tố
đầuvagraveo khaacutec nhauvagraveo một giaacute trị duy nhất Caacutec hagravem chuyển giao xử lyacute caacutec giaacute trị trạng thaacutei vagrave tạo đầu ra
11Huấn luyện mạng nơ ron Trong mocirc higravenh coacute giaacutem saacutetANN được đến so saacutenh dự đoaacuten của chiacutenh
noacute với thocircng tin phản hồi coacute chứa caacutec kết quả mong muốn ANN sẽ phải tigravem caacutech thay đổi caacutec tham số becircn trong củamigravenh (caacutec trọng số vagrave caacutec ngưỡng) để tạo necircn một aacutenh xạ coacute khả năng aacutenh xạcaacutec đầu vagraveo thagravenh caacutec đầu ra mong muốn Sự thay đổi nagravey được tiến hagravenh nhờ việc so saacutenh giữa đầu ra thực sự vagrave đầu ra mong muốn
Trong mocirc higravenh khocircng coacute giaacutem saacutetANN nhận được dữ liệu vagraveo nhưng khocircng phải coacute bất kỳ thocircng tin phản hồi về kết quả mong muốn
Phần lớn caacutec ứng dụng nằm trong vugraveng của caacutec bagravei toaacuten ước lượng như mocirc higravenh hoacuteathống kecirc neacuten lọc phacircn cụm
12Lợi iacutech Liecircn kết với mạng noron Traacutenh caacutech lập trigravenh tường minh Giảm nhu cầu của chuyecircn gia ANNs thigrave thiacutech nghi với caacutec yếu tố đầu vagraveo thay đổi Khocircng cần thiết cho cơ sở tri thức tinh chế ANNs coacute tiacutenh động vagrave cải thiện với việc sử dụng Coacute khả năng xử lyacute dữ liệu khocircng chiacutenh xaacutec hoặc khocircng đầy đủ Cho pheacutep tổng quaacutet hoacutea từ thocircng tin cụ thể Cho pheacutep thu thập cảm giaacutec thocircng thường vagraveo miền giải quyết vấn đề
13Hạn chế của việc liecircn kết với mạng noron ANNs khocircng thể giải thiacutech được suy luận Bản chất hộp đen thường khiến cho vấn đề traacutech nhiệm vagrave độ tin cậy phaacutet
sinh lagrave khoacute khăn Lặp đi lặp lại quaacute trigravenh huấn luyện rất tốn thời gian Nguồn lực caacutec nhagrave phacircn tiacutech vagrave thiết kế coacute tay nghề cao vẫn lagrave đaacuteng lo
ngại Cocircng nghệ ANN thuacutec đẩy hạn chế của phần cứng hiện tại ANN yecircu cầu phải coacute sự tin tưởng ở đầu ra
14Giới thiệu về thuật toaacuten di truyền Cũng như mạng lưới thần kinh caacutec thuật toaacuten di truyền được dựa trecircn lyacute
thuyết sinh học Thuật toaacuten di truyền tigravem thấy nguồn gốc của chuacuteng trong caacutec lyacute thuyết
tiến hoacutea của chọn lọc tự nhiecircn vagrave thiacutech ứng với biến đổi khiacute hậu Kết quả thuật toaacuten di truyền lagrave từ giao phối 2 caacute thể trong quần thế để tạo
ra con caacutei đocirci khi tốt hơn so với bậc cha mẹ của chuacuteng 15Caacutec thagravenh phần cơ bản của thuật toaacuten di truyền
Toaacuten tử chọn lọc Caacutec caacute thể tốt được chọn lọc để đưa vagraveo thế hệ sau Sự chọn lọc nagravey căn cứ vagraveo độ thiacutech nghi với mocirci trường của mỗi caacute thể
Toaacuten tử lai gheacutep (crossover) Hai caacute thể cha vagrave mẹ trao đổi caacutec gen với nhau để tạo ra caacute thể con
Toaacuten tử đột biến (mutation) Một caacute thể thay đổi một số gen để biến đổi thagravenh một caacute thể mớiTất cả caacutec toaacuten tử trecircn khi thực hiện đều mang tiacutenh ngẫu nhiecircn
16Quaacute trigravenh cơ bản của một thuật toaacuten di truyền Khởi tạo
Đaacutenh giaacute quần thể
Lựa chọn NST thiacutech hợp nhất vagrave loại bỏ NST yếu nhất
Quy trigravenh giao nhau vagrave cải thiện quần thể
đột biến tiến trigravenh để khaacutem phaacute ra NST mới
17Ưu nhược điểm của việc kết hợp với thuật toaacuten di truyền Kiacutech thước quần thể lagrave 1 yếu tố quan trọng trong tốc độ của việc tigravem
kiếmnhưng noacute tương đối dễ dagraveng để dự đoaacuten tốc độ nagravey Giao nhau hoặc đột biến lagrave khocircng necircn đc sử dụng quaacute thường xuyecircn Luocircn coacute được iacutet nhất 1 giải phaacutep hợp lyacute Necircn coacute thể aacutep dụng chuacuteng cho caacutec vấn đề magrave chuacuteng ta khocircng coacute hướng
về caacutech giải quyết Sức mạnh của thuật toaacuten xuất phaacutet từ khaacutei niệm đơn giảnkhocircng phải từ
một thủ tục thuật toaacuten phức tạp 18Tương lai của học maacutey
Mạng lưới thần kinh nhacircn tạo vượt quaacute năng lực của con người trong caacutec trường hợp bị cocirc lập
Về mặt lyacute thuyếtmột maacutey tiacutenh coacute thể xử lyacute dũ liệu nhanh hơn hagraveng triệu lần so với 1 con người
May mắn thay cho chuacuteng tacon người tốt hơn nhiều khi magrave coacute được dữ liệumaacutey tiacutenh khocircng coacute 1 số thứ như lagrave 5 giaacutec quan
CHƯƠNG 10 KHO DỮ LIỆU
1 Kho dữ liệu Kho dữ liệu lagrave tuyển tập caacutec cơ sở dữ liệu tiacutech hợp hướng chủ đề được
thiết kế để trợ giuacutep cho một hệ hỗ trợ quyết định
Theo John Ladley Cocircng nghệ kho dữ liệu lagrave tập caacutec phương phaacutep kỹ thuật vagrave caacutec cocircng cụ coacute thể kết hợp hỗ trợ nhau để cung cấp thocircng tin cho người sử dụng trecircn cơ sở tiacutech hợp từ nhiều nguồn dữ liệu nhiều mocirci trường khaacutec nhau
Kho dữ liệu thường rất lớn tới hagraveng trăm GB hay thậm chiacute hagraveng Terabyte
2 Kho dữ liệu vận hagravenh (ODS) Một kho dữ liệu vận hagravenh Aacutep dụng kỹ thuật kho dữ liệu vagraveo caacutec hệ xử
lyacute giao taacutec lưu trữ dữ liệu cho một ứng dụng đặc thugrave Noacute đưa vagraveo kho dữ liệu một dograveng caacutec dữ liệu thocirc được thiết kế
3 So saacutenh
Kho dữ liệu vận hagravenh Kho dữ liệu
Dữ liệu theo chủ đề Dữ liệu theo chủ đề
Dữ liệu tiacutech hợp Dữ liệu tiacutech hợp
Dữ liệu thay đổi Dữ liệu khocircng thay đổi
Dữ liệu được cập nhật khi thay đổi
Dữ liệu giữ nguyecircn
Chỉ coacute dữ liệu hiện tạiDữliệu hiện tại vagrave dữ liệu lịch sử
Chu kỳ lagravem tươi dữ liệu ngắn Chu kỳ lagravem tươi dữ liệu dagravei
Chỉ coacute dữ liệu chi tiết Dữ liệu chi tiết vagrave dữ liệu tổng kết
Dugraveng cho caacutec quyết định ngắn hạn
Dugraveng cho hoạch định dagravei hạn
4 Kho dữ liệu cục bộ (Data Mart - DM)
Kho dữ liệu cục bộ lagrave CSDL coacute những đặc điểm giống với kho dữ liệu nhưng với quy mocirc nhỏ hơn vagrave lưu trữ dữ liệu về một lĩnh vực một chuyecircn ngagravenh
Data mart phụ thuộc Chứa những dữ liệu được lấy từ DW vagrave những dữ liệu nagravey sẽ được triacutech lọc vagrave tinh chế tiacutech hợp lại ở mức cao hơn để phục vụ một chủ đề nhất định của Datamart
Data mart độc lập Khocircng giống như Datamart phụ thuộc Data mart độc lập được xacircy dựng trước DW vagrave dữ liệu được trực tiếp lấy từ caacutec nguồn khaacutec nhau
5 Siecircu dữ liệu Metadata lagrave dữ liệu để mocirc tả dữ liệu Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột
một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi Metadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu
6 Mocirci trường kho dữ liệu Hệ thống của tổ chức vagrave kho cung cấp dữ liệu để xacircy dựng kho dữ liệu Trong quaacute trigravenh chuyển dữ liệu từ caacutec nguồn khaacutec nhau dữ liệu coacute thể
được lagravem sạch hoặc chuyển đổi vagrave vigrave thế DW được xem như lagrave một chuẩn cho việc lưu trữ
Đồng thời siecircu dữ liệu được ghi lại Cuối cugraveng DW hoặc siecircu thị coacute thể được sử dụng để tạo ra một kho dữ
liệu ldquocaacute nhacircnrdquo 7 Caacutec đặc điểm của kho dữ liệu
Đặc điểm Mocirc tả
Hướng chủ đề - DL tổ chức theo caacutech thức người dugraveng tham chiếu
Tiacutech hợp - Dữ liệu ldquosạchrdquo loại bỏ tiacutenh thiếu nhất quaacuten
Khocircng thay đổi - DL ldquochỉ đọcrdquo người dugraveng khocircng thay đổi được
Chuỗi thời gian - DL lagrave chuỗi thời gian khocircng phải lagrave trạng thaacutei hiện tại
Được tổng kết - DL vận hagravenhthao taacutec khi cần thiết
được kết hợp lại thagravenh dạng coacute thể dugraveng được cho quyết định
Kiacutech cỡ lớn hơn - Lưu giữ theo chuỗi thời gian tức lagrave giữ lại nhiều DL
Khocircng được chuẩn hoacutea - Coacute thể dư thừa DLSiecircu dữ liệu - Dữ liệu của dữ liệu được lưu trữNguồn dữ liệu - DL vận hagravenh (caacutec hệ sẵn coacute) cugraveng
với caacutec nguồn ngoagravei 8 Kho dữ liệu hướng chủ đề
Hướng chủ để coacute nghĩa lagrave kho dữ liệu được tổ chức xung quanh caacutec chủ đề chiacutenh như khaacutech hagraveng sản phẩm sản xuất Tập trung vagraveo việc mocirc higravenh hoacutea vagrave phacircn tiacutech dữ liệu cho caacutec nhagrave ra quyết định magrave khocircng tập trung vagraveo caacutec xử lyacute thocircng thường Cung cấp cho người dugraveng một khung nhigraven toagraven vẹn đơn giản vagrave đầy đủ về caacutec sự kiện quanh caacutec chủ đề
9 Dữ liệu trong DW được tiacutech hợp Dữ liệu trong kho dữ liệu được xacircy dựng bằng caacutech tổng hợp dữ liệu từ
nhiều nguồn khaacutec nhau vagrave caacutec nguồn coacute tổ chức khaacutec nhau Cơ sở dữ liệu caacutec file excel caacutec flat file hoặc caacutec raw file Khi đưa vagraveo kho dữ liệu caacutec dữ liệu được lagravem sạch vagrave tiacutech hợp dữ liệu nhằm đảm bảo tiacutenh nhất quaacuten của dữ liệu
10Kiến truacutec kho dữ liệu Tầng cơ sở dữ liệu hoạt động Tầng truy xuất thocircng tin Tầng truy xuất dữ liệu Tầng siecircu dữ liệu Tầng quản lyacute tiến trigravenh Tầng thocircng điệp của ứng dụng Tầng vật liacute của kho dữ liệu Tầng trigravenh diễn dữ liệu
11Higravenh trạng kho dữ liệu Kho dữ liệu ảo - người dugraveng cuối coacute thể truy cập trực tiếp đến kho dữ liệu
sử dụng caacutec cocircng cụ cho pheacutep ở tầng truy xuất dữ liệu Kho dữ liệu trung tacircm-1 cơ sở dữ liệu vật lyacute chứa tất cả dữ liệu cho một
vugraveng chuyecircn dụng nagraveo đoacute
Kho dữ liệu phacircn taacuten- Thagravenh phần được phacircn taacuten qua nhiều hệ cơ sở dữ liệu vật lyacute
12METADATA- Siecircu dữ liệu Định nghĩa Siecircu dữ liệu lagrave dữ liệu về dữ liệu Lagrave 1 lưu trữ dugraveng để
Miecircu tả kho dữ liệu tổng thể Nhận dạng kiểu kho dữ liệu Quản liacute quaacute trigravenh tiacutech hợp dữ liệu Quản liacute quaacute trigravenh cập nhật kho dữ liệu Quản liacute bảo mật
Lagrave chigravea khoacutea quyết định sự thagravenh cocircng của kho dữ liệu luocircn được thay đổi vagrave cập nhật theo sự phaacutet triển của kho dữ liệu
Dugraveng để quản liacute điều khiển kho dữ liệu Sự ra đời của kho dữ liệu như 1 cấu truacutec hỗ trợ ra quyết định siecircu dữ liệu
được xem như nguồn tagravei nguyecircn dữ liệu Siecircu dữ liệu lagrave trừu tượng Chuacuteng lagrave dữ liệu bậc cao cung cấp mocirc tả ngắn
gọn caacutec dữ liệu bậc thấp hơn 13Hoạt động của Siecircu dữ liệu
Siecircu dữ liệu rất cần thiết trong việc chuyển hoacutea thocircng tin trở thagravenh tri thức Lagrave chigravea khoacutea giuacutep chuacuteng ta xử lyacute được dữ liệu thocirc Viacute dụ một dograveng dữ liệu baacuten hagraveng 1023 K596 11121 agraveNoacute sẽ khocircng coacute nghĩa gigrave cho đến khi chuacuteng ta đưa vagraveo siecircu dữ liệu (thư
mục chứa dữ liệu) agrave cửa hagraveng 1023 sản phẩm K596 vagrave số tiền baacuten được lagrave 11121 đocirc la
14Sự cần thiết phải nhất quaacuten trong kho dữ liệu Kho dữ liệu được xacircy dựng cho lợi iacutech của những nhagrave phacircn tiacutech kinh
doanh caacutec nhagrave quản trị cho tất cả caacutec khu vực chức năng Trong cơ sở dữ liệu riecircng caacutec khu vực khaacutec nhau coacute thể định nghĩa vagrave lưu
trữ dữ liệu thocircng qua phiecircn bản của chiacutenh noacute Khi dữ liệu được lấy từ những vugraveng khaacutec nhau đoacute vagrave được đặt vagraveo kho dữ
liệu Việc chuyển đổi vagrave lagravem sạch caacutec tiến trigravenh sẽ đảm bảo noacute lagrave duy nhất được tiacutech hợp tại một mức của tổ chức
15Ragrave soaacutet lại dữ liệu ndash Thực thi siecircu dữ liệu
Bất kể cấu truacutec tự nhiecircn của 1 cacircu truy vấn thế nagraveo thigrave caacutec thagravenh phần của siecircu dữ liệu rất quan trọng đối với người ra quyết định
Bảng thuộc tiacutenh khoacutea được lưu trữ bởi kho dữ liệu Tập hợp dữ liệu được lấy từ đacircu Những chuyển đổi nagraveo được thực thi với việc lagravem sạch
16Siecircu dữ liệu lagrave gigrave Metadata - lagrave thocircng tin mocirc tả nội dung của cơ sở dữ liệu (CSDL) Metadata baacuteo cho người dugraveng biết thời gian cập nhật sau cugraveng của dữ liệu
định dạng vagrave mục điacutech sử dụng của noacute Những thocircng tin nagravey coacute thể hướng dẫn người dugraveng duyệt qua CSDL vagrave
giuacutep họ hiểu được yacute nghĩa vagrave ngữ cảnh của dữ liệu Trong CSDL metadata lagrave caacutec dạng biểu diễn khaacutec nhau của caacutec đối tượng
trong CSDL Trong CSDL quan hệ metadata lagrave caacutec định nghĩa của bảng cột CSDL
view vagrave nhiều đối tượng khaacutec Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột
một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi -gtMetadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu
Bảng chuyển đổi Ghi lại những chuyển đổi đatilde được thực hiện
Lịch sử thực thi Ghi lại những dữ liệu đatilde được
phacircn tiacutech
Higravenh thaacutei kết nốiGhi lại những dữ liệu được kết nối vagrave tần suất
17Aacutenh xạ thocircng thường của siecircu dữ liệu Bản ghi aacutenh xạ chuyển đổi bao gồm
Định danh của nguồn gốc Chuyển đổi thuộc tiacutenh Chuyển đổi thuộc tiacutenh vật lyacute Matilde hoacutea tham chiếu bảng chuyển đổi Đổi tecircn Đổi khoacutea Gaacuten giaacute trị cho thuộc tiacutenh mặc định Chọn logic cho caacutec nguồn nhiều giaacute trị Đổi thuật toaacuten
18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để
phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai
lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave
tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec
Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm
Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo
19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua
caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau
SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được
Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra
một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức
Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ
Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ
Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech
CHƯƠNG 11 KHAI PHAacute DỮ LIỆU
1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn
ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993
Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng
2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd
1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều
2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP
3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn
4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng
5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server
6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo
7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động
8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời
9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều
10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện
11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech
12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP
3 Xử lyacute phacircn tiacutech trực tuyến OLAP
MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave
dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu
ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave
thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu
HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave
ROLAP4 Khai phaacute dữ liệu
Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh
khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn
Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan
5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp
6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại
Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp
Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec
Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt
Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra
Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh
vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho
Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec
Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm
Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục
Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng
gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp
Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn
Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec
Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper
Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2
Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25
Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước
Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng
Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện
trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp
Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute
độ hỗ trợ ge ngưỡng minsup
độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan
Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn
Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết
Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu
MOLAP ROLAP HOLAP
Lưu trữ dữ liệu cơ sở
Khối Bảng quan hệ Bảng quan hệ
Lưu trữ thocircng tin tổng hợp
Khối Bảng quan hệ Khối
Hiệu suất thực hiện truy vấn
Nhanh nhất Chậm nhất Nhanh
Tiecircu thụ khocircng gian lưu trữ
Nhiều Thấp Trung bigravenh
Chi phiacute bảo trigrave Cao Thấp Trung bigravenh
- EIS lagrave một dạng đặc biệt của DSS được thiết kế để hỗ trợ ra quyết định ở cấp cao nhất của một tổ chức
- Lagrave một hệ thống thocircng tin hỗ trợ nhu cầu lập kế hoạch vagrave đaacutenh giaacute của caacutec nhagrave quản lyacute điều hagravenh
- EIS coacute thể giuacutep một CEO coacute được bức tranh tổng thể chiacutenh xaacutec nhất về caacutec hoạt động vagrave một bản toacutem tắt những gigrave magrave đối thủ cạnh tranh đang lagravem
- Caacutec hệ thống nagravey noacutei chung hoạt động dễ dagraveng vagrave trigravenh bagravey thocircng tin theo những caacutech dễ hiểu để việc tiếp thu được nhanh choacuteng (biểu đồ đồ thịhellip)
(Tagravei liệu thecircm EIS lagrave những loại hệ thống lagrave rất phức tạp trong tự nhiecircn Coacute thể noacutei hệ thống nagravey cũng cung cấp cho caacutec nhagrave quản lyacute với caacutec thiết bị coacute khả năng ra quyết định bằng caacutech sử dụng của noacute Hệ thống nagravey hoạt động trong điều kiện như vậy quan trọng như trong caacutec hệ thống khaacutec khocircng hỗ trợ Khả năng lưu trữ dữ liệu nặng lagravem cho noacute lyacute tưởng để được thocircng qua khocircng chỉ bởi caacutec doanh nghiệp lớn magrave cograven bởi caacutec doanh nghiệp nhỏ hơn Nhigraven chung hệ thống nagravey lagrave dagravenh cho caacutec nhacircn viecircn cấp cao hỗ trợ thagravenh thạo trong việc đưa ra caacutec quyết định quan trọng)
Caacutec phiecircn EIS tiecircu biểu- Phiecircn lagravem việc coacute thể bắt đầu với một baacuteo caacuteo về tigravenh higravenh tagravei chiacutenh vagrave kinh
doanh của một cocircng ty caacutec chỉ số hoạt động quan trọng được hiển thị rotilde ragraveng- EIS sẽ cho pheacutep caacutec giaacutem đốc điều hagravenh coacute thể đi sacircu vagraveo dữ liệu từ những con
số bất kỳ magrave noacute hỗ trợ- Việc điều hagravenh coacute thể lựa chọn một mức độ chi tiết ( VD danh số baacuten hagraveng) nếu
như cần điều tra thecircm- Lagrave một phương phaacutep tiếp cận coacute thể giuacutep việc ra quyết định tốt hơn
Những điều magrave EIS ko coacute- EIS khocircng phải lagrave sự thay thế cho caacutec hệ thống dựa trecircn caacutec maacutey tiacutenh khaacutec EIS
thực sự chỉ cung cấp dữ liệu cho caacutec hệ thống nagravey- Noacute khocircng thể biến caacutec bộ hệ điều hagravenh của maacutey tiacutenh thagravenh những ldquochuyecircn viecircn
giỏirdquo- Coacute thể được viacute một caacutech cao hơn như lagrave một trợ lyacute đaacuteng tin cậy coacute thể được gọi
đến bất khi nagraveo vagrave mỗi khi cần thiết
Tagravei liệu thecircm Sự khaacutec nhau giữa EIS vagrave DSS+ EIS thiết kế để hỗ trợ những người điều hagravenh cấp cao giuacutep họ khaacutem phaacute caacutec vấn đề vagrave caacutec cơ hội DSS hỗ trợ những nười phacircn tiacutech cố gắng trả lời cacircu hỏi caacutei gigrave coacute thể lagravem cugraveng với một cơ hội hoặc một vấn đề
Chiều EIS DSSNhững người sử dụng thocircng thường
Duyệt dữ liệu đi xuống truy xuất trạng thaacutei
Hỗ trợ phacircn tiacutech vagrave quyết định
Sự thuacutec đẩy Tiacutenh thiacutech hợp Tiacutenh hiệu quảỨng dụng Queacutet mocirci trường đaacutenh giaacute
hiệu suất nhận dạng caacutec vấn đề vagrave caacutec cơ hội
Caacutec quyết định quản lyacute trecircn caacutec lĩnh vực đa dạng
Hỗ trợ quyết định Caacutec chiacutenh saacutech caacutec quyết định khocircng coacute cấu truacutec ở mức cao vagrave hỗ trợ giaacuten tiếp
Hỗ trợ caacutec quyết định lặp lại caacutec quyết định khocircng thể đoaacuten trước ra quyết định khocircng coacute cấu truacutec vagrave baacuten cấu truacutec
Loại thocircng tin Caacutec thocircng tin tin tức thocircng tin becircn ngoagravei về khaacutech hagraveng đối thủ cạnh tranh mocirci trường caacutec baacuteo caacuteo theo yecircu cầu vagrave định thời về caacutec hoạt động becircn trong
Caacutec thocircng tin hỗ trợ caacutec tigravenh huống đặc biệt
Sử dụng coacute nguyecircn tắc
Dograve theo vết vagrave điều khiển nhận dạng cơ hội
Hoạch định tổ chức phacircn nhoacutem vagrave điều khiển
Khả năng phugrave hợp với những người sử dụng caacute nhacircn
Thiết kế loại ra quyết định cho mỗi người điều hagravenh caacute nhacircn bằng nhiều lựa chọn đầu ra
Cho pheacutep caacutec đaacutenh giaacute caacute nhacircn caacutec khả năng what-if lựa chọn loại hộp hội thoại
Đồ họa Phải coacute Lagrave một phần quan trọng của nhiều DSS
Thacircn thiện người sử dụng
Phải coacute Phải coacute nếu khocircng coacute người sử dụng trung gian
Xử lyacute thocircng tin Lọc neacuten thocircng tin dograve theo vết dữ liệu vagrave thocircng tin quan trọng
EIS kiacutech thiacutech caacutec cacircu hỏi caacutec cacircu trả lời bằng caacutech sử dụng DSS vagrave phản hồi lại EIS
Hỗ trợ caacutec thocircng tin chi tiết
Truy xuất thường xuyecircn caacutec mức chi tiết của bất kỳ thocircng tin tổng hợp nagraveo (duyệt dữ
Coacute thể coacute trong DSS nhưng khocircng thường
liệu chi tiết)Cơ sở mocirc higravenh Caacutec chức năng coacute sẵn bị hạn
chếLagrave điểm cốt lotildei của DSS
Cấu truacutec Theo người baacuten sản phẩm hoặc theo caacutec chuyecircn gia hệ thống thocircng tin
Theo người sử dụng hoặc caacute nhacircn hoặc caacutec chuyecircn gia từ caacutec trung tacircm thocircng tin hoặc phograveng ban hệ thống thocircng tin
Phần cứng Mainframe caacutec trạm RISC mạng LANs hoặc caacutec hệ thống phacircn bố
Mainframe caacutec trạm RISC caacutec maacutey PC hoặc caacutec hệ thống phacircn bố
Bản chất caacutec goacutei phần mềm
Truy xuất tương taacutec dễ dagraveng đến nhiều cơ sở dữ liệu truy xuất trực tuyến caacutec khả năng DBMS phức tạp caacutec liecircn kết phức tạp
Caacutec khả năng tiacutenh toaacuten lớn caacutec ngocircn ngữ mocirc higravenh mocirc phỏng ứng dụng vagrave caacutec bộ tạo DSS
Bản chất caacutec thocircng tin
Trigravenh bagravey thocircng tin được phaacutet sinh trước về quaacute khứ vagrave hiện tại tạo caacutec thocircng tin mới về quaacute khứ hiện tại tương lai
Tạo thocircng tin mới về quaacute khứ hiện tại tương lai
62 Lịch sử EIS- EIS xuất hiện lần đầu tiecircn tại MIT vagraveo những năm 1970
- Những EIS đầu tiecircn được phaacutet triển bởi caacutec doanh ngiệp lớn sẵn sagraveng chấp nhận rủi ro để đạt được lợi thế cạnh tranh
- Vagraveo những năm 1980 caacutec nhagrave cung cấp đatilde phaacutet triển một số cơ sở khaacutech hagraveng rộng vagrave cocircng nghệ EIS được tiếp tục phaacutet triển cho đến ngagravey nay
(Tagravei liệu thecircm Sử dụng DSSEIS cho phaacutet triển bền vững + Một số nghiecircn cứu đatilde được tiến hagravenh để kiểm tra việc thực hiện của EIS trong khu vực cocircng cộng vagrave chiacutenh phủ caacutec nước tổ chức kể từ khi chuacuteng được phaacutet triển theo định hướng lợi nhuận cho caacutec cocircng ty tư nhacircn (Hasan vagrave Hasan năm 1997) Theo một nghiecircn cứu tiến hagravenh tại Mỹ ở hơn 300 cocircng ty kết quả cho thấy sự khaacutec biệt của EIS giữa tư nhacircn vagrave chiacutenh phủ một số kết quả thuacute vị được phaacutet hiệnViacute dụ khoacute khăn hơn để chuyển tiền từ một tagravei khoản khaacutec trong một EIS của chiacutenh phủ cũng lagrave khoacute khăn hơn để biện giải thiacutech cho những chi phiacute phaacutet triển EIS của chiacutenh phủ Một nghiecircn cứu khaacutec được tiến hagravenh ở Australia
cho thấy rằng EIS cung cấp cho quản lyacute một higravenh ảnh chiacutenh xaacutec hơn về tổ chức thực hiện vagrave cung cấp hỗ trợ cho caacutec lợi iacutech chiến lược cải thiện khocircng chỉ cho caacutec nhagrave quản lyacute nhưng cograven cho phần cograven lại của tổ chức Dựa trecircn caacutec hệ thống được thiết kế cho caacutec cocircng ty tư nhacircn với một caacutech rotilde ragravengxaacutec định mục tiecircu EIS lagrave thiacutech hợp cho caacutec tổ chức cocircng cộng hiện đại nhưng cần phải được linh hoạt hơn vagrave kết thagravenh chugravem một phạm vi rộng hơn khả năng vagrave phương tiện hơn so với khu vực tư nhacircn ban đầu theo định hướng sản phẩm (Hasan vagrave Hasan năm 1997) Điều nagravey coacute thể lagrave do thực tế rằng caacutec hoạt động khu vực cocircng lagrave bắt buộc coacute taacutec động rộng phải đaacutep ứng sự mong đợi duy nhất cocircng cộng thường coacute mục tiecircu mơ hồ vagrave macircu thuẫn iacutet quyền tự chủ vagrave kiểm soaacutet việc ra quyết định vagrave nhacircn viecircn lagrave khoacute khăn hơn (Watson vagrave Carte2000) + Toacutem lại EIS lagrave một khaacutei niệm thagravenh cocircng noacute phaacutet triển qua nhiều năm tuy nhiecircn EIS khắc phục khiếm khuyết của migravenh bằng caacutech tiến hagravenh nghiecircn cứu liecircn tục)
63 Tại sao những người điều hagravenh hagraveng đầu lại khaacutec nhau- Họ lagrave những doanh nghiệp theo định hướng coacute suy nghĩ
- Coacute một khoảng khocircng gian rộng để kiểm soaacutet
- Họ chịu traacutech nhiệm cho việc thiết lập chiacutenh saacutech
- Họ đại diện cho tổ chức mocirci trường becircn ngoagravei
- Hagravenh động của họ tạo ra những kết quả đaacuteng kể về tagravei chiacutenh vagrave con người
Tần số caacutec hoạt động điều hagravenh- Xử lyacute xaacuteo trộn 42
- Hoạt động kinh doanh 32
- Phacircn bổ nguồn lực 17
- Đagravem phaacuten 3
- Những điều khaacutec 6
Handling Disturbances 42
Entrepreneurial Activites 32
Resource Allocation 17
Negotiation 3
Other 6
Những thocircng tin điều hagravenh cần thiết- Quản lyacute xaacuteo trộn coacute thể yecircu cầu sự chuacute yacute xung quanh đồng hồ
- Hoạt động kinh doanh yecircu cầu điều hagravenh để dự đoaacuten những thay đổi trong mocirci trường
- Nhiệm vụ phacircn bổ tagravei nguyecircn yecircu cầu lựa chọn người quản lyacute vagrave caacutec nguồn lực hạn chế được triển khai
- Đagravem phaacuten yecircu cầu cập nhật thocircng tin từng phuacutet để coacute thể xacircy dựng được sự đồng thuận
Caacutec loại thocircng tin điều hagravenh- Hệ thống kế toaacuten coacute liecircn quan đến việc tiacutenh toaacuten thu nhập hoạt động cho caacutec lĩnh
vực cụ thể lagrave quan trọng hơn so với caacutec hệ thống kế toaacuten truyền thocircng- Thocircng tin về thị trường khaacutech hagraveng cung cấp giaacute trị trong việc quyết định chiến
lược- Caacutec thocircng tin cần thiết thường được truyền đi trecircn một số hệ thống maacutey tiacutenh vagrave
nằm trong toagraven tổ chức- Caacutec thocircng tin được sử dụng thường lagrave ngắn hạn vagrave dễ thay đổi
Phương thức để xaacutec định thocircng tin cần thiết
Rockart xaacutec định được năm phương thức cơ bản để xaacutec định thocircng tin cần thiết
- Phương thức dựa trecircn kết quả- Phương thức rỗng- Phương thức chỉ số khoacutea- Phương thức tổng hợp nghiecircn cứu- Phương thức dựa vagraveo nhacircn tố then chốt dẫn đến thagravenh cocircng
64 Thagravenh phần EIS
- Sản phẩm EIS đầu tiecircn được phaacutet triển để sử dụng trecircn maacutey tiacutenh cấu higravenh cao nhưng caacutec sản phẩm hiện nay nhằm mục tiecircu lagrave nền tảng ClientServer
- Những nền tảng linh hoạt hơn coacute thể thiacutech ứng với thay đổi trong tổ chức vagrave cocircng nghệ
- Sử dụng dữ liệu thời gian thực dẫn đến quyết định nhanh hơn nhiều thocircng tin hơn
Thagravenh phần phần cứng- Một EIS khocircng đogravei hỏi coacute phần cứng cụ thể hoặc duy nhất nagraveo- Chigravea khoacutea của vấn đề lagrave để đảm bảo rằng caacutec thagravenh phần của EIS tối ưu hoacutea vagrave
phugrave hợp với tagravei nguyecircn maacutey tiacutenh của tổ chức- Hệ thống nagravey phải được cấu higravenh để caacutec nguồn tagravei nguyecircn phugrave hợp với những
người điều hagravenh chuacuteng
Thagravenh phần phần mềm- Traacutei ngược với phần cứng phần mềm thường được chuyecircn mocircn hoacutea cao cho caacutec
bagravei toaacuten về miền- Sự chuyecircn mocircn hoacutea nagravey thường đạt được bằng caacutech sử dụng thagravenh phần off-the-
shelf cho toagraven bộ EIS vagrave caacutec mocirc-đun tugravey chỉnh để đaacutep ứng nhu cầu cụ thể- Lotus Notes lagrave một viacute dụ điển higravenh Noacute coacute thể được sử dụng một migravenh hoặc coacute
thể phục vụ becircn thứ ba mocirc-đun plug-in
Cocircng nghệ EIS hiện nay
Dobrzeniecki đề xuấtphacircn loạitừng cấptheo bachức năng- Loại 1 sản phẩm bao gồmmột bộ đầy đủcaacutec ứng dụngtừ mộtnhagrave cung cấp- Loại 2 sản phẩm đượcthựchiệnở phần đầu củacaacutecsản phẩmDSS đượcphaacutet triển
bởicugravengmộtnhagrave cung cấp- Loại 3 sản phẩmkết hợp với nhautheo bất kỳ số lượngthuộc sở hữu củacocircng ty
65 Xacircy dựng EIS
- Xacircy dựngmộtEISgiống nhưxacircydựngmột số hệ thống khaacutec củamocirc higravenh hệ thống thocircng tin
- Việcphaacutet triểncấu truacutecnecircn được theo dotildeitừ quaacute trigravenh thiết kế đến quaacute trigravenhthực hiện
- Tuy nhiecircn một dự aacuten phaacutet triển EIScoacute xu hướnglagrave thống nhấtvagraveyecircu cầu hỗ trợ caacutec nhagrave quản lyacute latildenh đạo
- Xacircy dựng một EIScoacute thểphaacutet hiện ra đượccaacutectigravenh huống khoacute khănmagravemột nhagrave phaacutet triển chưabao giờ gặp phải
Mocirc higravenh EIS
Khung phaacutet triển một EIS
- Watson et al đề nghị xacircy dựngkhung với ba thagravenh phần+ Caacutech tiếp cận tập trung vagraveo yếu tốcon người vagrave dữ liệu coacute liecircn quan đến EIS+ Quaacute trigravenh phaacutet triển cần sự linh hoạt vagrave tương taacutec+ Người sử dụng - hệ thống hộp thoại bao gồm một ngocircn ngữ hagravenh động để xử lyacute caacutec lệnh
Lợi iacutech của EIS- Dễ duy trigrave caacutec mục tiecircu coacute tổ chức- Dễ truy xuất thocircng tin- Cho pheacutep người sử dụng nacircng cao hiệu suất hơn
- Tăng chất lượng ra quyết định- Cung cấp sự cải tiến cạnh tranh- Tiết kiệm thời gian của người sử dụng- Tăng khả năng vagrave chất lượng giao tiếp- Cung cấp khả năng điều khiển tốt hơn trong tổ chức- Cho pheacutep tham gia caacutec vấn đề vagrave caacutec cơ hội- Cho pheacutep hoạch định- Cho pheacutep tigravem kiếm nguyecircn nhacircn của một vấn đề- Thảo matilden caacutec yecircu cầu của người điều hagravenh
Hạn chế của EIS vagrave 1 số sai lầm cần traacutenh
- Chi phiacute một cuộc khảo saacutetnăm1991 chothấychi phiacute phaacutet triểntrungbigravenh365000USDvớichi phiacute vận hagravenhhagraveng năm lagrave$200000 (EIS)
- Cocircng nghệ hạn chếEIScần phảiđượctiacutech hợp hoagraven toagravenvagraveokiếntruacuteccủadoanh nghiệphiện tại do đoacute noacutelagrave một thaacutech thứclớn đối vớithiết kế
- Hạn chế tổ chức cơ cấu tổ chứccoacute thể khocircng phugrave hợp
Sự hạn chế về tổ chức- Chương trigravenh nghị sự vagrave thời gian chệch EIS mocirc tả một phần việc thực hiện một
chương trigravenh nghị sự vagrave coacute thể dễ dagraveng đạt được sự tin cậy một caacutech chắc chắn- Đồng bộ hoacutea việc quản lyacute sự tin cậy đuacuteng luacutec đặc biệt baacuteo caacuteo EIS coacute thể phaacute
vỡ sự ổn định thiết lập caacutec chu trigravenh baacuteo caacuteo một caacutech tốt nhất- Sự bất ổn EIS phản ứng nhanh coacute thể gacircy ra việc taacutec động trở lại một caacutech
nhanh choacuteng dẫn đến sự thiếu ổn định trong tổ chức
Sự thất bại lagrave thay thế khocircng thể chấp nhận được- Một số yếu tố lagravem EIS thất bại
+ Thiếu sự hỗ trợ về mặt quản lyacute+ Vấn đề chiacutenh trị+ Thất bại của nhagrave phaacutet triển+ Lỗi về cocircng nghệ+ Giaacute cả+ Thời gian
66 Ra quyết định điều hagravenh trong tương lai vagrave EIS
- Coacute một vagravei điều kiện sẽ được hợp nhất cho việc chuyển đổi cocircng nghệ Trong đoacute một vagravei điều kiện coacute thể dễ dự đoaacuten Hai điều kiện magrave ta coacute thể thấy lagrave+ Phaacutet triển cocircng nghệ maacutey tiacutenh trong việc điều hagravenh sẽ tạo ra sự chuyển đổi được chấp nhận một caacutech dễ dagraveng hơn+ Mở rộng traacutech nhiệm điều hagravenh sẽ mở rộng nhu cầu thocircng tin
Tương lai của EIS- EIS thocircng minh Những tiến bộ trong cocircng nghệ AI sẽ được triển khai trong caacutec
EIS- EIS đa phương tiện Cơ sở dữ liệu đa phương tiện sẽ cho pheacutep tiacutech hợp văn bản
giọng noacutei vagrave higravenh ảnh trong tương lai- EIS thocircng tin Tương lai EIS sẽ mở rộng hơn trong việc sử dụng dữ liệu becircn
ngoagravei doanh nghiệp- EIS kết nối Giao tiếp với băng thocircng rộng cho pheacutep kết nối liecircn thocircng lớn hơn
Chương 7 HỆ CHUYEcircN GIA VAgrave TRIacute TUỆ NHAcircN TẠO
71 Caacutec khaacutei niệm
72 Triacute thocircng minh của triacute tuệ nhacircn tạo
73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia
74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia
75 Lợi iacutech vagrave hạn chế của hệ chuyecircn gia
71 Caacutec khaacutei niệm
Chuyecircn mocircn (Expertise) sự hiểu biết rộng trong 1 lĩnh vực hẹp
Hệ chuyecircn gia (Expert Systems)1 chương trigravenh maacutey tiacutenh sử dụng 1 tập caacutec luật dựa trecircn tri thức của con người để giải quyết caacutec vấn đề đogravei hogravei phải coacute sự chuyecircn mocircn
Một số hệ chuyecircn gia nổi tiếng
DENDRAL (Standford 1960s Edward Feigenbaum)
MYCIN (Standford1970s Edward Shortliffe)
PROSPECTOR (MIT 1979)
Triacute tuệ nhacircn tạo (Artificial Intelligence ndash AI)
Triacute tuệ nhacircn tạo một bộ phacircn của ngagravenh khoa học maacutey tiacutenh quan tacircm đến việc thiết kế caacutec hệ thống maacutey tiacutenh thocircng minh đoacute lagrave caacutec hệ thống đưa ra caacutec đặc điểm magrave từ đoacute chuacuteng ta liecircn hệ với sự thocircng minh trong hagravenh động của con người (Barr vagrave Feigenbaum 1981)
Mục điacutech của AI
Mục điacutech khoa học xaacutec định caacutec gợi yacute để giải thiacutech caacutec loại khaacutec nhau của triacute tuệ thực
Mục điacutech kỹ thuật giải quyết caacutec vấn đề trong thế giới thực
Triacute tuệ nhacircn tạo kế thừa nhiều yacute tưởng quan điểm kỹ thuật từ caacutec ngagravenh khoa học khaacutec
- Triết học
- Logic Toaacuten học
- Tiacutenh toaacuten
- Khoa học tacircm lyacute Khoa học nhận thức
- Sinh học Thần kinh học
- Tiến hoacutea
Caacutec lĩnh vực ứng dụng trong Triacute tuệ nhacircn tạo
Mạng nơ ron thần kinh (Neural Networks)
Tiacutenh toaacuten sự tiến hoacutea
(Evolutionary Computation)
Hệ chuyecircn gia (Expert Systems)
Kỹ thuật xử lyacute tiếng noacutei (Speech Processing)
Kỹ thuật xử lyacute ngocircn ngữ tự nhiecircn
(Natural Language Processing)
Lập kế hoạch (Planning)
Robot (Robotics)
Khoa học higravenh ảnh (Vision)
Caacutec kỹ thuật thocircng dụng dugraveng trong AI
Biểu diễn(Representation)
Học (Learning)
Caacutec luật (Rules)
Tigravem kiếm (Search)
72 Triacute thocircng minh của triacute tuệ nhacircn tạo
Con người suy diễn như thế nagraveo
Phacircn loại (Categorization)
Caacutec quy tắc cụ thể
Heuristics
Kinh nghiệm trước đoacute
Dự tiacutenh trước
Maacutey tiacutenh suy diễn như thế nagraveo
Lập luận dựa trecircn luật IF-THEN mocirc tả tri thức được matilde hoacutea dưới dạng caacutec luật
Caacutec khung (Frames) lagrave caacutec đại diện mocirc tả caacutec tigravenh huống giống nhau lagrave điển higravenh của một vagravei phacircn loại
Lập luận dựa trecircn caacutec trường hợp mocirc phỏng giải phaacutep trước đoacute cho một vấn đề hiện tại
Nhận dạng mẫu phaacutet hiện acircm thanh higravenh dạng hoặc caacutec chuỗi dagravei
Caacutec dạng khaacutec của Triacute tuệ nhacircn tạo
Học maacutey- mạng nơron vagrave giải thuật di truyền
Lập trigravenh tự động ndash lagrave những kỹ thuật tạo ra caacutec chương trigravenh để lagravem 1 nhiệm vụ riecircng biệt (cho pheacutep những người khocircng phải lagrave người lập trigravenh coacute thể lập trigravenh được)
Cuộc sống nhacircn tạo ndash nỗ lực để taacutei tạo caacutec hiện tượng sinh học trong caacutec hệ thống dựa trecircn maacutey tiacutenh
73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia(Expert Systems- ES)
Theo Jackson (1999) Một hệ chuyecircn gia lagrave một chương trigravenh maacutey tiacutenh mocirc tả vagrave suy diễn với tri thức của một vagravei lĩnh vực để giải quyết vấn đề hay đưa ra caacutec lời khuyecircn
Cấu truacutec cơ bản của ES được dựa theo cấu truacutec chung của DSS Sự khaacutec biệt chiacutenh giữa ES vagraveDSS lagrave hệ ES thu thập caacutec kiến thức từ những
chuyecircn gia trong lĩnh vực quan tacircmĐặc trưng của hệ chuyecircn gia Hiệu quả cao Thời gian trả lời thỏa đaacuteng Độ tin cậy cao Dễ hiểu
Giao diện người dugraveng trong ES
Thiết kế giao diện người dugraveng tập trung vagraveo caacutec yếu tố như dễ dagraveng sử dụngcoacute độ tin cậy cao giảm tải những khoacute khăn khi sử dụng
Thiết kế necircn coacute một số tương taacutec (đầu vagraveo kiểm soaacutet vagrave truy vấn)
Cấu tạo giao diện người dugraveng gồm coacute magraven higravenh cảm ứng bagraven phiacutem buacutet saacuteng lệnh thoại caacutec phiacutem chuyecircn dụng
Cơ sở tri thức (Knowledge Base)
Chứa đựng caacutec tri thức cụ thể miền thu được từ caacutec chuyecircn gia miền
Coacute thể chứa caacutec mocirc tả caacutec hagravenh vi giải quyết vấn đề caacutec ragraveng buộc caacutec heuristics
Thagravenh cocircng của một ES dựa trecircn tiacutenh đầy đủ vagrave tiacutenh chiacutenh xaacutec của cơ sở tri thức
Mocirc tơ suy diễn (Inference Engine)
Ở đacircy tri thức được đặt để sử dụng tạo ra caacutec giải phaacutep để giải quyết vấn đề
Mocirc tơ nagravey coacute khả năng thực hiện diễn dịch hoặc suy diễn dựa trecircn caacutec luật hay caacutec caacutec sự kiện
Đồng thời cũng coacute khả năng sử dụng caacutec suy diễn mờ hay khocircng chiacutenh xaacutec dựa trecircn xaacutec suất hay aacutenh xạ mẫu
Vograveng điều khiển suy diễn
1 Aacutenh xạ caacutec luật với caacutec sự kiện đatilde được cho
2 Chọn luật để thực hiện
3 Thực hiện luật bằng caacutech thecircm caacutec sự kiện được suy diễn ra vagraveo bộ nhớ lagravem việc
Chuỗi suy diễn (Chaining)
Suy diễn tiến (forward chaining) maacutey suy diễn bắt đầu từ dữ liệu ban đầu vagrave thực hiện việc suy luận để đưa ra caacutec kết luận cuối cugraveng
Suy diễn lugravei (backward chaining) maacutey suy diễn bắt đầu từ dữ liệu điacutech vagrave tigravem ra tri thức hỗ trợ cho dữ liệu điacutech đoacute
Viacute dụ suy diễn lugravei
R1 Nếu coacute A vagrave B thigrave suy ra coacute D
R2 Nếu coacute B thigrave suy ra coacute C
R3 Nếu coacute C vagrave D thigrave suy ra coacute E
Ta coacute E ta xem trong 3 luật R1 R2 R3 luật nagraveo coacute E ta thấy R3 chứa E đồng thời chứa C vagrave D Xeacutet tiếp trong 2 luật R1 R2 luật nagraveo chứa C vagrave D R2 chứa C R3 chứa D Từ đoacute ta coacute được caacutec tri thức hỗ trợ suy diễn vagrave kết luận lagrave nếu coacute A vagrave B thigrave sẽ coacute E Hay nếu A vagrave B đuacuteng thigrave sẽ coacute E
Viacute dụ suy diễn tiến
Giả sử coacute tập chứa 3 luật sau
R1 Nếu coacute A vagrave B thigrave suy ra coacute D
R2 Nếu coacute B thigrave suy ra coacute C
R3 Nếu coacute C vagrave D thigrave suy ra coacute E
Nếu ta coacute A vagrave B thigrave chuacuteng ta suy ra được D từ R1 vagrave suy ra C từ R2 Với D vagrave C đatilde được suy ra ở trecircn giờ chuacuteng ta suy ra được E từ R3
Viacute dụ thực tế
Giả sử muốn biết magraveu của một con vật nuocirci tecircn lagrave Fred biết rằng noacute kecircu ộp ộp vagrave ăn ruồi
Coacute tập 4 luật ban đầu như sau
R1 Nếu X kecircu ộp ộp vagrave ăn ruồi thigrave X lagrave con ếch
R2 Nếu X kecircu chiecircm chiếp vagrave biết hoacutet thigrave X lagrave con chim
R3 Nếu X lagrave con ếch thigrave X coacute magraveu xanh
R4 Nếu X lagrave con chim thigrave X coacute magraveu vagraveng
74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia
Expert system shells lagrave một tập caacutec goacutei phần mềm vagrave caacutec cocircng cụ dugraveng để phaacutet triển caacutec hệ chuyecircn gia
Những Expert system shells đầu tiecircn thường rất rườm ragrave Mặc dugrave vậy noacute vẫn giuacutep cho người sử dụng sẽ khocircng phải bắt đầu lại từ đầu khi xacircy dựng một hệ chuyecircn gia mới
Những shell hiện đại bao gồm hai mocirc-đun chiacutenh lagrave cocircng cụ xacircy dựng một tập quy tắc vagrave mocirc tơ suy diễn
Xacircy dựng hệ chuyecircn gia
Bước 1 xacircy dựng mocirc higravenh bagravei toaacuten xaacutec định vấn đề nhiệm vụ magrave hệ thống sẽ thực hiện Caacutec dạng bagravei toaacuten cần hệ chuyecircn gia
Bagravei toaacuten diễn giải (InterPretation)
Bagravei toaacuten dự baacuteo (Prediction)
Bagravei toaacuten chuẩn đoaacuten (Diagnose)
Bagravei toaacuten gỡ rối (Debugging)
Bagravei toaacuten thiết kế
Tương tự như một dự aacuten phần mềm để xacircy dựng một hệ chuyecircn gia cần phải coacute caacutec yếu tố về nhacircn lực tagravei nguyecircn vagrave thời gian Những yếu tố nagravey ảnh hưởng đến giaacute thah của một hệ chuyecircn giaTrong phần nagravey cacircu hỏi thường được đặt ra lagrave tại sao cần phải xacircy dựng một hệ chuyecircn giaTrước khi bắt đầu phải xaacute định rotilde bagravei toaacuten đạt ra lagrave jiAi lagrave chuyecircn giaAi lagrave người sử dụng
1 Diễn giải (InterPretation) Nghiecircn cứu 1 vấn đề -gt Dựa trecircn những biểu hiện thuộc tiacutenh đặc trưng becircn ngoagravei -gt Tư vấn
(hoặc đưa ra kết luận hay mocirc tả dễ hiểu từ tập dữ liệu thocirc)
2 Bagravei toaacuten dự baacuteo (Prediction) Coacute thể dự đoaacuten được hagravenh vi kết quả dựa trecircn caacutec hiện tượng -gt dự baacuteo
VD Dự baacuteo thời tiết động đấthellip
3 Bagravei toaacuten chẩn đoaacuten (Diagnoss) Xaacutec định caacutec lỗi caacutec bộ phận hỏng hoacutec của hệ thống dựa trecircn caacutec dữ liệu quan saacutet được
4 Bagravei toaacuten gỡ rối (Debugging) Mocirc tả caacutec phương phaacutep khắc phục hệ thống khi gặp sự cố
5 Bagravei toaacuten thiết kế Lựa chọn cấu higravenh caacutec đối tượng nhằm thoả matilden một số ragraveng buộc nagraveo đoacute
6 Giảng dạy Phần mềm dạy học coacute thể chuẩn đoaacuten vagrave sủa lỗi của học sinh trong quaacute trigravenh học tập
Để xaacutec định đuacuteng bagravei toaacuten magrave chuacuteng ta cần giải quyết thigrave phải trả lời đc một số cacircu hỏi
- cần hệ chuyecircn gia
Bước 2 thu thập tri thức lựa chọn cocircng cụ vagrave aacutep dụng
Trong bước thu thập tri thức vấn đề quan trọng lagrave lựa chọn chuyecircn gia những người magrave sẽ đoacuteng goacutep tri thức cho hệ thống Thocircng thường trong suốt quaacute trigravenh phaacutet triển thigrave chuyecircn gia được xem như một thagravenh viecircn của đội phaacutet triển
Hiện nay coacute rất nhiều cocircng cụ để xacircy dựng một hệ chuyecircn gia Phổ biến nhất lagrave JESS CLIPS vagrave OPS5
Bước 3 Thiết kế cơ sở tri thức thiết kế hệ thốngTri thức được biểu diễn trường minh trong cơ sở tri thức
Caacutec chuyecircn gia vagrave kỹ sư tri thức sẽ đối thoại với nhau bằng caacutec kỹ thuật đối thoại Suy diễn (SD) bảng Mocirc higravenh hoacutea SD quy nạp phacircn loại
Vấn đề bagraveo trigrave vagrave phaacutet triển
Caacutec hệ chuyecircn gia đogravei hỏi phải bảo trigrave vagrave phaacutet triển nhiều hơn so với caacutec hệ thống khaacutec Phải thường xuyecircn bổ sung tri thức mới vagrave thay đổi caacutec tri thức cũ để đổi mới hệ chuyecircn gia
Thu thập vagrave khắc phục lỗi do người sử dụng phaacutet hiện để kịp thời khắc phục những sai soacutet của hệ chuyecircn gia
75 Lợi iacutech vagrave hạn chế của caacutec hệ chuyecircn gia
Một số lợi iacutech chiacutenh
Thời gian trả lời hợp lyacute bằng hoặc nhanh hơn so với chuyecircn gia (người) để đi đến cugraveng một quyết định Hệ chuyecircn gia lagrave một hệ thống thời gian thực (real time system)
Khả năng trả lời với mức độ tinh thocircng bằng hoặc cao hơn so với chuyecircn gia (người) trong cugraveng lĩnh vực
Hệ chuyecircn gia giuacutep cho hiệu quả lagravem việc tăng bằng việc sử dụng tập caacutec luật một caacutech nhanh choacuteng magrave ko bị nhầm lẫn chuyecircn gia lagrave người coacute thể quecircn đi một số tri thức cơ sở lyacute luậ nhưng HCG thigrave ko
Quyết định của một người chuyecircn gia coacute thể bị thay đổi vagrave ko coacute tiacutenh thống nhất như quyết định của một hệ chuyecircn gia tạo ra
Hệ chuyecircn gia giuacutep cho người sử dụng coacute thể trau dồi sự hiểu biết trecircn lĩnh vuej cụ thể magrave noacute giải quyết hỗ trợ người ra quyết định coacute trigravenh độ như 1 chuyecircn gia trong quaacute trigravenh gia quyết định
Kiến thức của rất nhiều chuyecircn gia về một lĩnh vực nagraveo đoacute được đưa vagraveo hệ chuyecircn gia lagravem cho CSTT cuat HCG phong phuacute vagrave rộng lớn hơn rất nhiều
HCG giải thiacutech caacutec bước suy luận một caacutech dễ hiểu nhất quaacuten luacutec nagraveo cũng coacute thể sử dụng ko như chuyecircn gia con người
Hạn chế của caacutec hệ chuyecircn gia
Nhược điểm lớn nhất của hệ chuyecircn gia lagrave những yacute kiến chuyecircn mocircn thường rất khoacute matilde hoacutea vagrave giải neacuten
Hệ chuyecircn gia khocircng coacute khả năng tự học tự cập nhật kiến thức mới như caacutec chuyecircn gia magrave cần phải được matilde hoacutea lại khi noacute được cập nhật
Hệ chuyecircn gia khocircng thể nhận ra được vấn đề khocircng nằm trong miền kiến thức của hệ thống
Chương 8 Tri thức vagrave tiếp nhận
1 Bao gồm caacutec vấn đề
Dữ liệu thực tế đo lường hoặc quan saacutet coacute hoặc khocircng coacute bối cảnh
Thocircng tin dữ liệu được tổng hợp một caacutech hữu iacutech để giải quyết những khoacute khăn trong việc đưa ra quyết định
Tri thức bao gồm caacutec ứng dụng quy tắc thocircng tin hướng dẫn của người ra quyết định
2 Những caacutei nhigraven về tri thức
Đại diện lagravem thế nagraveo để diễn tả tri thức viacute dụ như một quyển saacutech khocircng phải lagrave tri thức nhưng noacute lại lagrave một đại diện của tri thức
Sản xuất tri thức lagrave một tập hơp của hagraveng tồn kho coacute thể được sản xuất cũng như mua lại
Tri thức lagrave 1 trong 6 trạng thaacutei của hệ thống
1Dữ liệu 2Thocircng tin 3Cấu truacutec thocircng tin 4Sự thấu hiểu 5Yacute kiến 6 Quyết định
3 Caacutec loại tri thức Phổ biến mocirc tả dữ liệu thocircng tin thủ tục mọi thứ lagravem như thế nagraveo lập luận chiacutenh saacutech hoặc caacutec quy tắc
4 Thu thập Tri thức hệ chuyecircn gia Hầu hết caacutec phương phaacutep đều bắt đầu với mocirc higravenh của caacutec taacutec vụ trong đoacute
hệ chuyecircn gia được xacircy dựng Trong đoacute mocirc tả về caacutec lĩnh vực được tạo ra Caacutec kỹ sư sử dụng caacutec mocirc higravenh giả thuyết vagrave nhận thức về quaacute trigravenh phacircn
tiacutech để gợi ra caacutech giải quyết vấn đề về tri thức từ caacutec chuyecircn gia
5 Caacutec chiều của thu thập tri thức KE- driven caacutec kỹ sư trao đổi trực tiếp với caacutec chuyecircn gia Expert-driven Caacutec chuyecircn gia trực tiếp đưa chuyecircn mocircn của họ vagraveo hệ
thống maacutey tiacutenh Machine-driven Sử dụng caacutec cocircng cụ suy luận để triacutech xuất tri thức từ một
tập caacutec viacute dụ
6 Kỹ thuật thu thập tri thức Trao đổi gồm 2 loại cơ bản lagrave coacute cấu truacutec(coacute kịch bản) vagrave khocircng coacute cấu
truacutec( đối thoại trực tiếp) Giao thức phacircn tiacutech bằng lời Khi caacutec chuyecircn gia thực hiện một cocircng việc
của họ thigrave một bản ghi về cocircng việc đoacute được thực hiện Caacutec kỹ sư sẽ xacircy dựng mocirc higravenh cho những gigrave được ghi lại trong bản ghi
Phương phaacutep sagraveng lọc caacutec chuyecircn gia so saacutenh caacutec nhoacutem liecircn tiếp trong ba đối tượng vagrave cho biết tại sao nhoacutem thứ hai lại khaacutec nhoacutem thứ ba
7 Thu thập tri thức từ nhiều nguồn Thu thập tri thức từ nhiều nguồn lagrave cần thiết để coacute được đầy đủ caacutec tri thức
cho một vấn đề quan điểm yacute kiến traacutei ngược nhau thường phaacutet sinh Phương phaacutep đồng thuận sẽ giuacutep giải quyết được vấn đề macircu thuẫn Kỹ thuật phacircn tiacutech Meta lagrave kỹ thuật được aacutep dụng trong caacutec trường hợp
khaacutec Caacutech tiếp cận bằng định lượng đogravei hỏi caacutec kỹ sư cần cacircn nhắc yếu tố đầu vagraveo của caacutec chuyecircn gia khaacutec nhau
8 Xaacutec nhận hợp lệ vagrave kiểm tra tri thức Một khi thu thập tri thức noacute phải được đaacutenh giaacute về khả năng sử dụng vagrave độ
chiacutenh xaacutec Hai vấn đề cụ thể lagrave hiệu lực của những kiến thức vagrave kiểm tra việc xacircy dựng cơ sở của tri thức
Cần xaacutec nhận xem liệu hệ thống coacute thể hoạt động ở mức độ tối thiểu khocircng
Xaacutec minh liecircn quan đến việc so saacutenh từng chi tiết kỹ thuật của hệ thống những gigrave đatilde được thực hiện cuối cugraveng
9 Một số caacutec biện phaacutep xaacutec nhận Độ chiacutenh xaacutec Khả năng thiacutech nghi Mức độ đầy đủ Bề rộng Độ sacircu Hiệu lực Tổng quan Chiacutenh xaacutec Hiện thực Độ tin cậy Tiacutenh hữu dụng Mức độ
Chương 9 Học maacutey
1 Logic mờ vagrave ngocircn ngữ mờ(Fuzzy Logic and Linguistic Ambiguity)
Ngocircn ngữ tự nhiecircn gồm những khaacutei niệm mơ hồ vagrave khocircng chiacutenh xaacutectruyền tải ngữ nghĩa thocircng qua tiacutenh xấp xỉkhocircng rotilde ragraveng
Những xấp xỉ nagravey giuacutep con người coacute thể truyền tải hết được yacute nghĩa nhưng maacutey thigrave khocircng hiểu
Lagravem sao biểu diễn caacutec tri thức sử dụng caacutec khaacutei niệm khocircng rotilde ragraveng(mờ) hoặc khocircng chiacutenh xaacutec
2 Khaacutei niệm cơ bản của logic mờ tập mờ lagrave những tập hợp khocircng coacute một giới hạn rotilde Mỗi phần tử của noacute chỉ
chứa một mức độ hagravem liecircn thuộc của từng phần tử Vigrave vậy tập mờ khocircng giống như tập cổ điển Tập mờ coacute thể kết hợp với nhau qua những luật mờ magrave đặc trưng cho những hagravenh động trạng thaacutei vagrave thuộc tiacutenh của logic mờ được tận dụng khi thực hiện một bộ điều khiển mờ
Logic mờ dựa trecircn yacute tưởng mỗi phần tử thuộc vagraveo một tập hợp ở một mức độ nagraveo đấy
Locircgic mờ cho pheacutep độ liecircn thuộc (microA )coacute giaacute trị trong khoảng (01) Locircgic mờ coacute thể được coi lagrave mặt ứng dụng của lyacute thuyết tập mờ để xử lyacute caacutec
giaacute trị trong thế giới thực cho caacutec bagravei toaacuten phức tạp
3 So saacutenh tiacutenh đuacuteng đắn logic mờ vagrave xaacutec suất Xaacutec suất thigrave đề cập đến khả năng xảy ra một biến cố hay một điều gigrave đoacute Logic mờ đề cập đến cấp độ magrave đặc tiacutenh ở hiện tại
o viacute dụ1 người coacute chiều cao 6 feet thigrave coacute cấp độ lagrave 05 về chiều cao
4 Ưu điểm của logic mờ Caacutech tiếp cận rất tự nhiecircnkhocircng phức tạp Coacute thể mocirc higravenh hoacutea caacutec hagravem phi tuyến tugravey yacute phức tạp
Coacute thể tận dụng được kinh nghiệm từ những chuyecircn gia hagraveng đầu trong mọi lĩnh vực
Logic mờ được xacircy dựng dựa trecircn ngocircn ngữ tự nhiecircnNền tảng của logic mờ lagrave dựa trecircn cơ sở giao tiếp của con người
5 Nhược điểm của logic mờ Trong 1 hệ thống phức tạpsử dụng logic mờ coacute thể trở thagravenh trở ngại cho
việc xaacutec thực độ tin cậy của hệ thống Cơ chế lập luận mờ khocircng thể học hỏi từ những lỗi sai
6 Mạng noron nhacircn tạo(ANN) Mạng noron nhacircn tạo lagrave một mocirc phỏng xử lyacute thocircng tinđược nghiecircn cứu ra
từ hệ thống thần kinh của sinh vậtgiống như bộ natildeo để xử lyacute thocircng tin ANNs lagrave chương trigravenh dựa trecircn maacutey tiacutenh đơn giản coacute chức năng lagrave một mocirc
higravenh bagravei toaacuten khocircng gian dựa trecircn thử nghiệm vagrave baacuteo lỗi
7 Học từ kinh nghiệm Tiến trigravenh Một mẫu dữ liệu được biểu diễn như một mạng lưới noronANN ldquodự
đoaacutenrdquo 1 đầu radự đoaacuten được so saacutenh với giaacute trị thực tế hoặc giaacute trị chiacutenh xaacutecNếu đoaacuten được chiacutenh xaacutec thigrave khocircng coacute hagravenh động nagraveo được thực hiện
Nếu dự đoaacuten sai ANN kiểm tra lại vagrave xaacutec định lại thocircng số để điều chỉnh Một mẫu dữ liệu khaacutec được biểu diễn vagrave quaacute trigravenh nagravey được lặp lại
8 Nguyecircn tắc cơ bản của cocircng nghệ nơron Caacutec yếu tố xử lyacute cơ bản trong hệ thống thần kinh của con người lagrave tế bagraveo
thần kinhMạng lưới của tế bagraveo nagravey lagrave liecircn kết với nhau nhận được thocircng tin từ caacutec cảm biến trong mắt taihellip
Thocircng tin nhận được bởi tế bagraveo thần kinh hoặc lagrave sẽ kiacutech thiacutech noacute(sẽ được chuyển qua 1 thocircng điệp dọc theo mạng lưới) hoặc lagrave sẽ ngăn cản noacute(ngăn cản dograveng thocircng tin)
Độ nhạy coacute thể thay đổi qua thời gian hoặc sau khi coacute được kinh nghiệm
9 Cấu truacutec mạng Một ANN gồm 3 lớp cơ bản
Lớp đầu vagraveo nhận dữ liệu Lớp becircn trong hoặc lagrave lớp ẩn xử lyacute dữ liệu Lớp đầu ra chuyển tiếp kết quả cuối cugraveng của mạng
10Mạng nơ ron Thường coacute nhiều đầu vagraveo mỗi đầu vagraveo với mức ảnh hưởng vagrave tầm quan
trọng riecircng của noacute Một đầu vagraveo quan trọng coacute thể được sử dụng để khuếch đại đầu ra caacutec hagravem trạng thaacutei tổng hợp caacutec trọng số của caacutec yếu tố
đầuvagraveo khaacutec nhauvagraveo một giaacute trị duy nhất Caacutec hagravem chuyển giao xử lyacute caacutec giaacute trị trạng thaacutei vagrave tạo đầu ra
11Huấn luyện mạng nơ ron Trong mocirc higravenh coacute giaacutem saacutetANN được đến so saacutenh dự đoaacuten của chiacutenh
noacute với thocircng tin phản hồi coacute chứa caacutec kết quả mong muốn ANN sẽ phải tigravem caacutech thay đổi caacutec tham số becircn trong củamigravenh (caacutec trọng số vagrave caacutec ngưỡng) để tạo necircn một aacutenh xạ coacute khả năng aacutenh xạcaacutec đầu vagraveo thagravenh caacutec đầu ra mong muốn Sự thay đổi nagravey được tiến hagravenh nhờ việc so saacutenh giữa đầu ra thực sự vagrave đầu ra mong muốn
Trong mocirc higravenh khocircng coacute giaacutem saacutetANN nhận được dữ liệu vagraveo nhưng khocircng phải coacute bất kỳ thocircng tin phản hồi về kết quả mong muốn
Phần lớn caacutec ứng dụng nằm trong vugraveng của caacutec bagravei toaacuten ước lượng như mocirc higravenh hoacuteathống kecirc neacuten lọc phacircn cụm
12Lợi iacutech Liecircn kết với mạng noron Traacutenh caacutech lập trigravenh tường minh Giảm nhu cầu của chuyecircn gia ANNs thigrave thiacutech nghi với caacutec yếu tố đầu vagraveo thay đổi Khocircng cần thiết cho cơ sở tri thức tinh chế ANNs coacute tiacutenh động vagrave cải thiện với việc sử dụng Coacute khả năng xử lyacute dữ liệu khocircng chiacutenh xaacutec hoặc khocircng đầy đủ Cho pheacutep tổng quaacutet hoacutea từ thocircng tin cụ thể Cho pheacutep thu thập cảm giaacutec thocircng thường vagraveo miền giải quyết vấn đề
13Hạn chế của việc liecircn kết với mạng noron ANNs khocircng thể giải thiacutech được suy luận Bản chất hộp đen thường khiến cho vấn đề traacutech nhiệm vagrave độ tin cậy phaacutet
sinh lagrave khoacute khăn Lặp đi lặp lại quaacute trigravenh huấn luyện rất tốn thời gian Nguồn lực caacutec nhagrave phacircn tiacutech vagrave thiết kế coacute tay nghề cao vẫn lagrave đaacuteng lo
ngại Cocircng nghệ ANN thuacutec đẩy hạn chế của phần cứng hiện tại ANN yecircu cầu phải coacute sự tin tưởng ở đầu ra
14Giới thiệu về thuật toaacuten di truyền Cũng như mạng lưới thần kinh caacutec thuật toaacuten di truyền được dựa trecircn lyacute
thuyết sinh học Thuật toaacuten di truyền tigravem thấy nguồn gốc của chuacuteng trong caacutec lyacute thuyết
tiến hoacutea của chọn lọc tự nhiecircn vagrave thiacutech ứng với biến đổi khiacute hậu Kết quả thuật toaacuten di truyền lagrave từ giao phối 2 caacute thể trong quần thế để tạo
ra con caacutei đocirci khi tốt hơn so với bậc cha mẹ của chuacuteng 15Caacutec thagravenh phần cơ bản của thuật toaacuten di truyền
Toaacuten tử chọn lọc Caacutec caacute thể tốt được chọn lọc để đưa vagraveo thế hệ sau Sự chọn lọc nagravey căn cứ vagraveo độ thiacutech nghi với mocirci trường của mỗi caacute thể
Toaacuten tử lai gheacutep (crossover) Hai caacute thể cha vagrave mẹ trao đổi caacutec gen với nhau để tạo ra caacute thể con
Toaacuten tử đột biến (mutation) Một caacute thể thay đổi một số gen để biến đổi thagravenh một caacute thể mớiTất cả caacutec toaacuten tử trecircn khi thực hiện đều mang tiacutenh ngẫu nhiecircn
16Quaacute trigravenh cơ bản của một thuật toaacuten di truyền Khởi tạo
Đaacutenh giaacute quần thể
Lựa chọn NST thiacutech hợp nhất vagrave loại bỏ NST yếu nhất
Quy trigravenh giao nhau vagrave cải thiện quần thể
đột biến tiến trigravenh để khaacutem phaacute ra NST mới
17Ưu nhược điểm của việc kết hợp với thuật toaacuten di truyền Kiacutech thước quần thể lagrave 1 yếu tố quan trọng trong tốc độ của việc tigravem
kiếmnhưng noacute tương đối dễ dagraveng để dự đoaacuten tốc độ nagravey Giao nhau hoặc đột biến lagrave khocircng necircn đc sử dụng quaacute thường xuyecircn Luocircn coacute được iacutet nhất 1 giải phaacutep hợp lyacute Necircn coacute thể aacutep dụng chuacuteng cho caacutec vấn đề magrave chuacuteng ta khocircng coacute hướng
về caacutech giải quyết Sức mạnh của thuật toaacuten xuất phaacutet từ khaacutei niệm đơn giảnkhocircng phải từ
một thủ tục thuật toaacuten phức tạp 18Tương lai của học maacutey
Mạng lưới thần kinh nhacircn tạo vượt quaacute năng lực của con người trong caacutec trường hợp bị cocirc lập
Về mặt lyacute thuyếtmột maacutey tiacutenh coacute thể xử lyacute dũ liệu nhanh hơn hagraveng triệu lần so với 1 con người
May mắn thay cho chuacuteng tacon người tốt hơn nhiều khi magrave coacute được dữ liệumaacutey tiacutenh khocircng coacute 1 số thứ như lagrave 5 giaacutec quan
CHƯƠNG 10 KHO DỮ LIỆU
1 Kho dữ liệu Kho dữ liệu lagrave tuyển tập caacutec cơ sở dữ liệu tiacutech hợp hướng chủ đề được
thiết kế để trợ giuacutep cho một hệ hỗ trợ quyết định
Theo John Ladley Cocircng nghệ kho dữ liệu lagrave tập caacutec phương phaacutep kỹ thuật vagrave caacutec cocircng cụ coacute thể kết hợp hỗ trợ nhau để cung cấp thocircng tin cho người sử dụng trecircn cơ sở tiacutech hợp từ nhiều nguồn dữ liệu nhiều mocirci trường khaacutec nhau
Kho dữ liệu thường rất lớn tới hagraveng trăm GB hay thậm chiacute hagraveng Terabyte
2 Kho dữ liệu vận hagravenh (ODS) Một kho dữ liệu vận hagravenh Aacutep dụng kỹ thuật kho dữ liệu vagraveo caacutec hệ xử
lyacute giao taacutec lưu trữ dữ liệu cho một ứng dụng đặc thugrave Noacute đưa vagraveo kho dữ liệu một dograveng caacutec dữ liệu thocirc được thiết kế
3 So saacutenh
Kho dữ liệu vận hagravenh Kho dữ liệu
Dữ liệu theo chủ đề Dữ liệu theo chủ đề
Dữ liệu tiacutech hợp Dữ liệu tiacutech hợp
Dữ liệu thay đổi Dữ liệu khocircng thay đổi
Dữ liệu được cập nhật khi thay đổi
Dữ liệu giữ nguyecircn
Chỉ coacute dữ liệu hiện tạiDữliệu hiện tại vagrave dữ liệu lịch sử
Chu kỳ lagravem tươi dữ liệu ngắn Chu kỳ lagravem tươi dữ liệu dagravei
Chỉ coacute dữ liệu chi tiết Dữ liệu chi tiết vagrave dữ liệu tổng kết
Dugraveng cho caacutec quyết định ngắn hạn
Dugraveng cho hoạch định dagravei hạn
4 Kho dữ liệu cục bộ (Data Mart - DM)
Kho dữ liệu cục bộ lagrave CSDL coacute những đặc điểm giống với kho dữ liệu nhưng với quy mocirc nhỏ hơn vagrave lưu trữ dữ liệu về một lĩnh vực một chuyecircn ngagravenh
Data mart phụ thuộc Chứa những dữ liệu được lấy từ DW vagrave những dữ liệu nagravey sẽ được triacutech lọc vagrave tinh chế tiacutech hợp lại ở mức cao hơn để phục vụ một chủ đề nhất định của Datamart
Data mart độc lập Khocircng giống như Datamart phụ thuộc Data mart độc lập được xacircy dựng trước DW vagrave dữ liệu được trực tiếp lấy từ caacutec nguồn khaacutec nhau
5 Siecircu dữ liệu Metadata lagrave dữ liệu để mocirc tả dữ liệu Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột
một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi Metadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu
6 Mocirci trường kho dữ liệu Hệ thống của tổ chức vagrave kho cung cấp dữ liệu để xacircy dựng kho dữ liệu Trong quaacute trigravenh chuyển dữ liệu từ caacutec nguồn khaacutec nhau dữ liệu coacute thể
được lagravem sạch hoặc chuyển đổi vagrave vigrave thế DW được xem như lagrave một chuẩn cho việc lưu trữ
Đồng thời siecircu dữ liệu được ghi lại Cuối cugraveng DW hoặc siecircu thị coacute thể được sử dụng để tạo ra một kho dữ
liệu ldquocaacute nhacircnrdquo 7 Caacutec đặc điểm của kho dữ liệu
Đặc điểm Mocirc tả
Hướng chủ đề - DL tổ chức theo caacutech thức người dugraveng tham chiếu
Tiacutech hợp - Dữ liệu ldquosạchrdquo loại bỏ tiacutenh thiếu nhất quaacuten
Khocircng thay đổi - DL ldquochỉ đọcrdquo người dugraveng khocircng thay đổi được
Chuỗi thời gian - DL lagrave chuỗi thời gian khocircng phải lagrave trạng thaacutei hiện tại
Được tổng kết - DL vận hagravenhthao taacutec khi cần thiết
được kết hợp lại thagravenh dạng coacute thể dugraveng được cho quyết định
Kiacutech cỡ lớn hơn - Lưu giữ theo chuỗi thời gian tức lagrave giữ lại nhiều DL
Khocircng được chuẩn hoacutea - Coacute thể dư thừa DLSiecircu dữ liệu - Dữ liệu của dữ liệu được lưu trữNguồn dữ liệu - DL vận hagravenh (caacutec hệ sẵn coacute) cugraveng
với caacutec nguồn ngoagravei 8 Kho dữ liệu hướng chủ đề
Hướng chủ để coacute nghĩa lagrave kho dữ liệu được tổ chức xung quanh caacutec chủ đề chiacutenh như khaacutech hagraveng sản phẩm sản xuất Tập trung vagraveo việc mocirc higravenh hoacutea vagrave phacircn tiacutech dữ liệu cho caacutec nhagrave ra quyết định magrave khocircng tập trung vagraveo caacutec xử lyacute thocircng thường Cung cấp cho người dugraveng một khung nhigraven toagraven vẹn đơn giản vagrave đầy đủ về caacutec sự kiện quanh caacutec chủ đề
9 Dữ liệu trong DW được tiacutech hợp Dữ liệu trong kho dữ liệu được xacircy dựng bằng caacutech tổng hợp dữ liệu từ
nhiều nguồn khaacutec nhau vagrave caacutec nguồn coacute tổ chức khaacutec nhau Cơ sở dữ liệu caacutec file excel caacutec flat file hoặc caacutec raw file Khi đưa vagraveo kho dữ liệu caacutec dữ liệu được lagravem sạch vagrave tiacutech hợp dữ liệu nhằm đảm bảo tiacutenh nhất quaacuten của dữ liệu
10Kiến truacutec kho dữ liệu Tầng cơ sở dữ liệu hoạt động Tầng truy xuất thocircng tin Tầng truy xuất dữ liệu Tầng siecircu dữ liệu Tầng quản lyacute tiến trigravenh Tầng thocircng điệp của ứng dụng Tầng vật liacute của kho dữ liệu Tầng trigravenh diễn dữ liệu
11Higravenh trạng kho dữ liệu Kho dữ liệu ảo - người dugraveng cuối coacute thể truy cập trực tiếp đến kho dữ liệu
sử dụng caacutec cocircng cụ cho pheacutep ở tầng truy xuất dữ liệu Kho dữ liệu trung tacircm-1 cơ sở dữ liệu vật lyacute chứa tất cả dữ liệu cho một
vugraveng chuyecircn dụng nagraveo đoacute
Kho dữ liệu phacircn taacuten- Thagravenh phần được phacircn taacuten qua nhiều hệ cơ sở dữ liệu vật lyacute
12METADATA- Siecircu dữ liệu Định nghĩa Siecircu dữ liệu lagrave dữ liệu về dữ liệu Lagrave 1 lưu trữ dugraveng để
Miecircu tả kho dữ liệu tổng thể Nhận dạng kiểu kho dữ liệu Quản liacute quaacute trigravenh tiacutech hợp dữ liệu Quản liacute quaacute trigravenh cập nhật kho dữ liệu Quản liacute bảo mật
Lagrave chigravea khoacutea quyết định sự thagravenh cocircng của kho dữ liệu luocircn được thay đổi vagrave cập nhật theo sự phaacutet triển của kho dữ liệu
Dugraveng để quản liacute điều khiển kho dữ liệu Sự ra đời của kho dữ liệu như 1 cấu truacutec hỗ trợ ra quyết định siecircu dữ liệu
được xem như nguồn tagravei nguyecircn dữ liệu Siecircu dữ liệu lagrave trừu tượng Chuacuteng lagrave dữ liệu bậc cao cung cấp mocirc tả ngắn
gọn caacutec dữ liệu bậc thấp hơn 13Hoạt động của Siecircu dữ liệu
Siecircu dữ liệu rất cần thiết trong việc chuyển hoacutea thocircng tin trở thagravenh tri thức Lagrave chigravea khoacutea giuacutep chuacuteng ta xử lyacute được dữ liệu thocirc Viacute dụ một dograveng dữ liệu baacuten hagraveng 1023 K596 11121 agraveNoacute sẽ khocircng coacute nghĩa gigrave cho đến khi chuacuteng ta đưa vagraveo siecircu dữ liệu (thư
mục chứa dữ liệu) agrave cửa hagraveng 1023 sản phẩm K596 vagrave số tiền baacuten được lagrave 11121 đocirc la
14Sự cần thiết phải nhất quaacuten trong kho dữ liệu Kho dữ liệu được xacircy dựng cho lợi iacutech của những nhagrave phacircn tiacutech kinh
doanh caacutec nhagrave quản trị cho tất cả caacutec khu vực chức năng Trong cơ sở dữ liệu riecircng caacutec khu vực khaacutec nhau coacute thể định nghĩa vagrave lưu
trữ dữ liệu thocircng qua phiecircn bản của chiacutenh noacute Khi dữ liệu được lấy từ những vugraveng khaacutec nhau đoacute vagrave được đặt vagraveo kho dữ
liệu Việc chuyển đổi vagrave lagravem sạch caacutec tiến trigravenh sẽ đảm bảo noacute lagrave duy nhất được tiacutech hợp tại một mức của tổ chức
15Ragrave soaacutet lại dữ liệu ndash Thực thi siecircu dữ liệu
Bất kể cấu truacutec tự nhiecircn của 1 cacircu truy vấn thế nagraveo thigrave caacutec thagravenh phần của siecircu dữ liệu rất quan trọng đối với người ra quyết định
Bảng thuộc tiacutenh khoacutea được lưu trữ bởi kho dữ liệu Tập hợp dữ liệu được lấy từ đacircu Những chuyển đổi nagraveo được thực thi với việc lagravem sạch
16Siecircu dữ liệu lagrave gigrave Metadata - lagrave thocircng tin mocirc tả nội dung của cơ sở dữ liệu (CSDL) Metadata baacuteo cho người dugraveng biết thời gian cập nhật sau cugraveng của dữ liệu
định dạng vagrave mục điacutech sử dụng của noacute Những thocircng tin nagravey coacute thể hướng dẫn người dugraveng duyệt qua CSDL vagrave
giuacutep họ hiểu được yacute nghĩa vagrave ngữ cảnh của dữ liệu Trong CSDL metadata lagrave caacutec dạng biểu diễn khaacutec nhau của caacutec đối tượng
trong CSDL Trong CSDL quan hệ metadata lagrave caacutec định nghĩa của bảng cột CSDL
view vagrave nhiều đối tượng khaacutec Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột
một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi -gtMetadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu
Bảng chuyển đổi Ghi lại những chuyển đổi đatilde được thực hiện
Lịch sử thực thi Ghi lại những dữ liệu đatilde được
phacircn tiacutech
Higravenh thaacutei kết nốiGhi lại những dữ liệu được kết nối vagrave tần suất
17Aacutenh xạ thocircng thường của siecircu dữ liệu Bản ghi aacutenh xạ chuyển đổi bao gồm
Định danh của nguồn gốc Chuyển đổi thuộc tiacutenh Chuyển đổi thuộc tiacutenh vật lyacute Matilde hoacutea tham chiếu bảng chuyển đổi Đổi tecircn Đổi khoacutea Gaacuten giaacute trị cho thuộc tiacutenh mặc định Chọn logic cho caacutec nguồn nhiều giaacute trị Đổi thuật toaacuten
18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để
phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai
lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave
tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec
Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm
Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo
19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua
caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau
SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được
Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra
một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức
Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ
Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ
Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech
CHƯƠNG 11 KHAI PHAacute DỮ LIỆU
1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn
ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993
Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng
2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd
1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều
2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP
3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn
4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng
5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server
6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo
7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động
8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời
9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều
10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện
11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech
12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP
3 Xử lyacute phacircn tiacutech trực tuyến OLAP
MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave
dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu
ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave
thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu
HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave
ROLAP4 Khai phaacute dữ liệu
Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh
khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn
Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan
5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp
6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại
Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp
Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec
Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt
Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra
Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh
vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho
Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec
Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm
Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục
Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng
gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp
Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn
Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec
Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper
Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2
Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25
Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước
Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng
Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện
trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp
Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute
độ hỗ trợ ge ngưỡng minsup
độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan
Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn
Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết
Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu
MOLAP ROLAP HOLAP
Lưu trữ dữ liệu cơ sở
Khối Bảng quan hệ Bảng quan hệ
Lưu trữ thocircng tin tổng hợp
Khối Bảng quan hệ Khối
Hiệu suất thực hiện truy vấn
Nhanh nhất Chậm nhất Nhanh
Tiecircu thụ khocircng gian lưu trữ
Nhiều Thấp Trung bigravenh
Chi phiacute bảo trigrave Cao Thấp Trung bigravenh
Tagravei liệu thecircm Sự khaacutec nhau giữa EIS vagrave DSS+ EIS thiết kế để hỗ trợ những người điều hagravenh cấp cao giuacutep họ khaacutem phaacute caacutec vấn đề vagrave caacutec cơ hội DSS hỗ trợ những nười phacircn tiacutech cố gắng trả lời cacircu hỏi caacutei gigrave coacute thể lagravem cugraveng với một cơ hội hoặc một vấn đề
Chiều EIS DSSNhững người sử dụng thocircng thường
Duyệt dữ liệu đi xuống truy xuất trạng thaacutei
Hỗ trợ phacircn tiacutech vagrave quyết định
Sự thuacutec đẩy Tiacutenh thiacutech hợp Tiacutenh hiệu quảỨng dụng Queacutet mocirci trường đaacutenh giaacute
hiệu suất nhận dạng caacutec vấn đề vagrave caacutec cơ hội
Caacutec quyết định quản lyacute trecircn caacutec lĩnh vực đa dạng
Hỗ trợ quyết định Caacutec chiacutenh saacutech caacutec quyết định khocircng coacute cấu truacutec ở mức cao vagrave hỗ trợ giaacuten tiếp
Hỗ trợ caacutec quyết định lặp lại caacutec quyết định khocircng thể đoaacuten trước ra quyết định khocircng coacute cấu truacutec vagrave baacuten cấu truacutec
Loại thocircng tin Caacutec thocircng tin tin tức thocircng tin becircn ngoagravei về khaacutech hagraveng đối thủ cạnh tranh mocirci trường caacutec baacuteo caacuteo theo yecircu cầu vagrave định thời về caacutec hoạt động becircn trong
Caacutec thocircng tin hỗ trợ caacutec tigravenh huống đặc biệt
Sử dụng coacute nguyecircn tắc
Dograve theo vết vagrave điều khiển nhận dạng cơ hội
Hoạch định tổ chức phacircn nhoacutem vagrave điều khiển
Khả năng phugrave hợp với những người sử dụng caacute nhacircn
Thiết kế loại ra quyết định cho mỗi người điều hagravenh caacute nhacircn bằng nhiều lựa chọn đầu ra
Cho pheacutep caacutec đaacutenh giaacute caacute nhacircn caacutec khả năng what-if lựa chọn loại hộp hội thoại
Đồ họa Phải coacute Lagrave một phần quan trọng của nhiều DSS
Thacircn thiện người sử dụng
Phải coacute Phải coacute nếu khocircng coacute người sử dụng trung gian
Xử lyacute thocircng tin Lọc neacuten thocircng tin dograve theo vết dữ liệu vagrave thocircng tin quan trọng
EIS kiacutech thiacutech caacutec cacircu hỏi caacutec cacircu trả lời bằng caacutech sử dụng DSS vagrave phản hồi lại EIS
Hỗ trợ caacutec thocircng tin chi tiết
Truy xuất thường xuyecircn caacutec mức chi tiết của bất kỳ thocircng tin tổng hợp nagraveo (duyệt dữ
Coacute thể coacute trong DSS nhưng khocircng thường
liệu chi tiết)Cơ sở mocirc higravenh Caacutec chức năng coacute sẵn bị hạn
chếLagrave điểm cốt lotildei của DSS
Cấu truacutec Theo người baacuten sản phẩm hoặc theo caacutec chuyecircn gia hệ thống thocircng tin
Theo người sử dụng hoặc caacute nhacircn hoặc caacutec chuyecircn gia từ caacutec trung tacircm thocircng tin hoặc phograveng ban hệ thống thocircng tin
Phần cứng Mainframe caacutec trạm RISC mạng LANs hoặc caacutec hệ thống phacircn bố
Mainframe caacutec trạm RISC caacutec maacutey PC hoặc caacutec hệ thống phacircn bố
Bản chất caacutec goacutei phần mềm
Truy xuất tương taacutec dễ dagraveng đến nhiều cơ sở dữ liệu truy xuất trực tuyến caacutec khả năng DBMS phức tạp caacutec liecircn kết phức tạp
Caacutec khả năng tiacutenh toaacuten lớn caacutec ngocircn ngữ mocirc higravenh mocirc phỏng ứng dụng vagrave caacutec bộ tạo DSS
Bản chất caacutec thocircng tin
Trigravenh bagravey thocircng tin được phaacutet sinh trước về quaacute khứ vagrave hiện tại tạo caacutec thocircng tin mới về quaacute khứ hiện tại tương lai
Tạo thocircng tin mới về quaacute khứ hiện tại tương lai
62 Lịch sử EIS- EIS xuất hiện lần đầu tiecircn tại MIT vagraveo những năm 1970
- Những EIS đầu tiecircn được phaacutet triển bởi caacutec doanh ngiệp lớn sẵn sagraveng chấp nhận rủi ro để đạt được lợi thế cạnh tranh
- Vagraveo những năm 1980 caacutec nhagrave cung cấp đatilde phaacutet triển một số cơ sở khaacutech hagraveng rộng vagrave cocircng nghệ EIS được tiếp tục phaacutet triển cho đến ngagravey nay
(Tagravei liệu thecircm Sử dụng DSSEIS cho phaacutet triển bền vững + Một số nghiecircn cứu đatilde được tiến hagravenh để kiểm tra việc thực hiện của EIS trong khu vực cocircng cộng vagrave chiacutenh phủ caacutec nước tổ chức kể từ khi chuacuteng được phaacutet triển theo định hướng lợi nhuận cho caacutec cocircng ty tư nhacircn (Hasan vagrave Hasan năm 1997) Theo một nghiecircn cứu tiến hagravenh tại Mỹ ở hơn 300 cocircng ty kết quả cho thấy sự khaacutec biệt của EIS giữa tư nhacircn vagrave chiacutenh phủ một số kết quả thuacute vị được phaacutet hiệnViacute dụ khoacute khăn hơn để chuyển tiền từ một tagravei khoản khaacutec trong một EIS của chiacutenh phủ cũng lagrave khoacute khăn hơn để biện giải thiacutech cho những chi phiacute phaacutet triển EIS của chiacutenh phủ Một nghiecircn cứu khaacutec được tiến hagravenh ở Australia
cho thấy rằng EIS cung cấp cho quản lyacute một higravenh ảnh chiacutenh xaacutec hơn về tổ chức thực hiện vagrave cung cấp hỗ trợ cho caacutec lợi iacutech chiến lược cải thiện khocircng chỉ cho caacutec nhagrave quản lyacute nhưng cograven cho phần cograven lại của tổ chức Dựa trecircn caacutec hệ thống được thiết kế cho caacutec cocircng ty tư nhacircn với một caacutech rotilde ragravengxaacutec định mục tiecircu EIS lagrave thiacutech hợp cho caacutec tổ chức cocircng cộng hiện đại nhưng cần phải được linh hoạt hơn vagrave kết thagravenh chugravem một phạm vi rộng hơn khả năng vagrave phương tiện hơn so với khu vực tư nhacircn ban đầu theo định hướng sản phẩm (Hasan vagrave Hasan năm 1997) Điều nagravey coacute thể lagrave do thực tế rằng caacutec hoạt động khu vực cocircng lagrave bắt buộc coacute taacutec động rộng phải đaacutep ứng sự mong đợi duy nhất cocircng cộng thường coacute mục tiecircu mơ hồ vagrave macircu thuẫn iacutet quyền tự chủ vagrave kiểm soaacutet việc ra quyết định vagrave nhacircn viecircn lagrave khoacute khăn hơn (Watson vagrave Carte2000) + Toacutem lại EIS lagrave một khaacutei niệm thagravenh cocircng noacute phaacutet triển qua nhiều năm tuy nhiecircn EIS khắc phục khiếm khuyết của migravenh bằng caacutech tiến hagravenh nghiecircn cứu liecircn tục)
63 Tại sao những người điều hagravenh hagraveng đầu lại khaacutec nhau- Họ lagrave những doanh nghiệp theo định hướng coacute suy nghĩ
- Coacute một khoảng khocircng gian rộng để kiểm soaacutet
- Họ chịu traacutech nhiệm cho việc thiết lập chiacutenh saacutech
- Họ đại diện cho tổ chức mocirci trường becircn ngoagravei
- Hagravenh động của họ tạo ra những kết quả đaacuteng kể về tagravei chiacutenh vagrave con người
Tần số caacutec hoạt động điều hagravenh- Xử lyacute xaacuteo trộn 42
- Hoạt động kinh doanh 32
- Phacircn bổ nguồn lực 17
- Đagravem phaacuten 3
- Những điều khaacutec 6
Handling Disturbances 42
Entrepreneurial Activites 32
Resource Allocation 17
Negotiation 3
Other 6
Những thocircng tin điều hagravenh cần thiết- Quản lyacute xaacuteo trộn coacute thể yecircu cầu sự chuacute yacute xung quanh đồng hồ
- Hoạt động kinh doanh yecircu cầu điều hagravenh để dự đoaacuten những thay đổi trong mocirci trường
- Nhiệm vụ phacircn bổ tagravei nguyecircn yecircu cầu lựa chọn người quản lyacute vagrave caacutec nguồn lực hạn chế được triển khai
- Đagravem phaacuten yecircu cầu cập nhật thocircng tin từng phuacutet để coacute thể xacircy dựng được sự đồng thuận
Caacutec loại thocircng tin điều hagravenh- Hệ thống kế toaacuten coacute liecircn quan đến việc tiacutenh toaacuten thu nhập hoạt động cho caacutec lĩnh
vực cụ thể lagrave quan trọng hơn so với caacutec hệ thống kế toaacuten truyền thocircng- Thocircng tin về thị trường khaacutech hagraveng cung cấp giaacute trị trong việc quyết định chiến
lược- Caacutec thocircng tin cần thiết thường được truyền đi trecircn một số hệ thống maacutey tiacutenh vagrave
nằm trong toagraven tổ chức- Caacutec thocircng tin được sử dụng thường lagrave ngắn hạn vagrave dễ thay đổi
Phương thức để xaacutec định thocircng tin cần thiết
Rockart xaacutec định được năm phương thức cơ bản để xaacutec định thocircng tin cần thiết
- Phương thức dựa trecircn kết quả- Phương thức rỗng- Phương thức chỉ số khoacutea- Phương thức tổng hợp nghiecircn cứu- Phương thức dựa vagraveo nhacircn tố then chốt dẫn đến thagravenh cocircng
64 Thagravenh phần EIS
- Sản phẩm EIS đầu tiecircn được phaacutet triển để sử dụng trecircn maacutey tiacutenh cấu higravenh cao nhưng caacutec sản phẩm hiện nay nhằm mục tiecircu lagrave nền tảng ClientServer
- Những nền tảng linh hoạt hơn coacute thể thiacutech ứng với thay đổi trong tổ chức vagrave cocircng nghệ
- Sử dụng dữ liệu thời gian thực dẫn đến quyết định nhanh hơn nhiều thocircng tin hơn
Thagravenh phần phần cứng- Một EIS khocircng đogravei hỏi coacute phần cứng cụ thể hoặc duy nhất nagraveo- Chigravea khoacutea của vấn đề lagrave để đảm bảo rằng caacutec thagravenh phần của EIS tối ưu hoacutea vagrave
phugrave hợp với tagravei nguyecircn maacutey tiacutenh của tổ chức- Hệ thống nagravey phải được cấu higravenh để caacutec nguồn tagravei nguyecircn phugrave hợp với những
người điều hagravenh chuacuteng
Thagravenh phần phần mềm- Traacutei ngược với phần cứng phần mềm thường được chuyecircn mocircn hoacutea cao cho caacutec
bagravei toaacuten về miền- Sự chuyecircn mocircn hoacutea nagravey thường đạt được bằng caacutech sử dụng thagravenh phần off-the-
shelf cho toagraven bộ EIS vagrave caacutec mocirc-đun tugravey chỉnh để đaacutep ứng nhu cầu cụ thể- Lotus Notes lagrave một viacute dụ điển higravenh Noacute coacute thể được sử dụng một migravenh hoặc coacute
thể phục vụ becircn thứ ba mocirc-đun plug-in
Cocircng nghệ EIS hiện nay
Dobrzeniecki đề xuấtphacircn loạitừng cấptheo bachức năng- Loại 1 sản phẩm bao gồmmột bộ đầy đủcaacutec ứng dụngtừ mộtnhagrave cung cấp- Loại 2 sản phẩm đượcthựchiệnở phần đầu củacaacutecsản phẩmDSS đượcphaacutet triển
bởicugravengmộtnhagrave cung cấp- Loại 3 sản phẩmkết hợp với nhautheo bất kỳ số lượngthuộc sở hữu củacocircng ty
65 Xacircy dựng EIS
- Xacircy dựngmộtEISgiống nhưxacircydựngmột số hệ thống khaacutec củamocirc higravenh hệ thống thocircng tin
- Việcphaacutet triểncấu truacutecnecircn được theo dotildeitừ quaacute trigravenh thiết kế đến quaacute trigravenhthực hiện
- Tuy nhiecircn một dự aacuten phaacutet triển EIScoacute xu hướnglagrave thống nhấtvagraveyecircu cầu hỗ trợ caacutec nhagrave quản lyacute latildenh đạo
- Xacircy dựng một EIScoacute thểphaacutet hiện ra đượccaacutectigravenh huống khoacute khănmagravemột nhagrave phaacutet triển chưabao giờ gặp phải
Mocirc higravenh EIS
Khung phaacutet triển một EIS
- Watson et al đề nghị xacircy dựngkhung với ba thagravenh phần+ Caacutech tiếp cận tập trung vagraveo yếu tốcon người vagrave dữ liệu coacute liecircn quan đến EIS+ Quaacute trigravenh phaacutet triển cần sự linh hoạt vagrave tương taacutec+ Người sử dụng - hệ thống hộp thoại bao gồm một ngocircn ngữ hagravenh động để xử lyacute caacutec lệnh
Lợi iacutech của EIS- Dễ duy trigrave caacutec mục tiecircu coacute tổ chức- Dễ truy xuất thocircng tin- Cho pheacutep người sử dụng nacircng cao hiệu suất hơn
- Tăng chất lượng ra quyết định- Cung cấp sự cải tiến cạnh tranh- Tiết kiệm thời gian của người sử dụng- Tăng khả năng vagrave chất lượng giao tiếp- Cung cấp khả năng điều khiển tốt hơn trong tổ chức- Cho pheacutep tham gia caacutec vấn đề vagrave caacutec cơ hội- Cho pheacutep hoạch định- Cho pheacutep tigravem kiếm nguyecircn nhacircn của một vấn đề- Thảo matilden caacutec yecircu cầu của người điều hagravenh
Hạn chế của EIS vagrave 1 số sai lầm cần traacutenh
- Chi phiacute một cuộc khảo saacutetnăm1991 chothấychi phiacute phaacutet triểntrungbigravenh365000USDvớichi phiacute vận hagravenhhagraveng năm lagrave$200000 (EIS)
- Cocircng nghệ hạn chếEIScần phảiđượctiacutech hợp hoagraven toagravenvagraveokiếntruacuteccủadoanh nghiệphiện tại do đoacute noacutelagrave một thaacutech thứclớn đối vớithiết kế
- Hạn chế tổ chức cơ cấu tổ chứccoacute thể khocircng phugrave hợp
Sự hạn chế về tổ chức- Chương trigravenh nghị sự vagrave thời gian chệch EIS mocirc tả một phần việc thực hiện một
chương trigravenh nghị sự vagrave coacute thể dễ dagraveng đạt được sự tin cậy một caacutech chắc chắn- Đồng bộ hoacutea việc quản lyacute sự tin cậy đuacuteng luacutec đặc biệt baacuteo caacuteo EIS coacute thể phaacute
vỡ sự ổn định thiết lập caacutec chu trigravenh baacuteo caacuteo một caacutech tốt nhất- Sự bất ổn EIS phản ứng nhanh coacute thể gacircy ra việc taacutec động trở lại một caacutech
nhanh choacuteng dẫn đến sự thiếu ổn định trong tổ chức
Sự thất bại lagrave thay thế khocircng thể chấp nhận được- Một số yếu tố lagravem EIS thất bại
+ Thiếu sự hỗ trợ về mặt quản lyacute+ Vấn đề chiacutenh trị+ Thất bại của nhagrave phaacutet triển+ Lỗi về cocircng nghệ+ Giaacute cả+ Thời gian
66 Ra quyết định điều hagravenh trong tương lai vagrave EIS
- Coacute một vagravei điều kiện sẽ được hợp nhất cho việc chuyển đổi cocircng nghệ Trong đoacute một vagravei điều kiện coacute thể dễ dự đoaacuten Hai điều kiện magrave ta coacute thể thấy lagrave+ Phaacutet triển cocircng nghệ maacutey tiacutenh trong việc điều hagravenh sẽ tạo ra sự chuyển đổi được chấp nhận một caacutech dễ dagraveng hơn+ Mở rộng traacutech nhiệm điều hagravenh sẽ mở rộng nhu cầu thocircng tin
Tương lai của EIS- EIS thocircng minh Những tiến bộ trong cocircng nghệ AI sẽ được triển khai trong caacutec
EIS- EIS đa phương tiện Cơ sở dữ liệu đa phương tiện sẽ cho pheacutep tiacutech hợp văn bản
giọng noacutei vagrave higravenh ảnh trong tương lai- EIS thocircng tin Tương lai EIS sẽ mở rộng hơn trong việc sử dụng dữ liệu becircn
ngoagravei doanh nghiệp- EIS kết nối Giao tiếp với băng thocircng rộng cho pheacutep kết nối liecircn thocircng lớn hơn
Chương 7 HỆ CHUYEcircN GIA VAgrave TRIacute TUỆ NHAcircN TẠO
71 Caacutec khaacutei niệm
72 Triacute thocircng minh của triacute tuệ nhacircn tạo
73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia
74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia
75 Lợi iacutech vagrave hạn chế của hệ chuyecircn gia
71 Caacutec khaacutei niệm
Chuyecircn mocircn (Expertise) sự hiểu biết rộng trong 1 lĩnh vực hẹp
Hệ chuyecircn gia (Expert Systems)1 chương trigravenh maacutey tiacutenh sử dụng 1 tập caacutec luật dựa trecircn tri thức của con người để giải quyết caacutec vấn đề đogravei hogravei phải coacute sự chuyecircn mocircn
Một số hệ chuyecircn gia nổi tiếng
DENDRAL (Standford 1960s Edward Feigenbaum)
MYCIN (Standford1970s Edward Shortliffe)
PROSPECTOR (MIT 1979)
Triacute tuệ nhacircn tạo (Artificial Intelligence ndash AI)
Triacute tuệ nhacircn tạo một bộ phacircn của ngagravenh khoa học maacutey tiacutenh quan tacircm đến việc thiết kế caacutec hệ thống maacutey tiacutenh thocircng minh đoacute lagrave caacutec hệ thống đưa ra caacutec đặc điểm magrave từ đoacute chuacuteng ta liecircn hệ với sự thocircng minh trong hagravenh động của con người (Barr vagrave Feigenbaum 1981)
Mục điacutech của AI
Mục điacutech khoa học xaacutec định caacutec gợi yacute để giải thiacutech caacutec loại khaacutec nhau của triacute tuệ thực
Mục điacutech kỹ thuật giải quyết caacutec vấn đề trong thế giới thực
Triacute tuệ nhacircn tạo kế thừa nhiều yacute tưởng quan điểm kỹ thuật từ caacutec ngagravenh khoa học khaacutec
- Triết học
- Logic Toaacuten học
- Tiacutenh toaacuten
- Khoa học tacircm lyacute Khoa học nhận thức
- Sinh học Thần kinh học
- Tiến hoacutea
Caacutec lĩnh vực ứng dụng trong Triacute tuệ nhacircn tạo
Mạng nơ ron thần kinh (Neural Networks)
Tiacutenh toaacuten sự tiến hoacutea
(Evolutionary Computation)
Hệ chuyecircn gia (Expert Systems)
Kỹ thuật xử lyacute tiếng noacutei (Speech Processing)
Kỹ thuật xử lyacute ngocircn ngữ tự nhiecircn
(Natural Language Processing)
Lập kế hoạch (Planning)
Robot (Robotics)
Khoa học higravenh ảnh (Vision)
Caacutec kỹ thuật thocircng dụng dugraveng trong AI
Biểu diễn(Representation)
Học (Learning)
Caacutec luật (Rules)
Tigravem kiếm (Search)
72 Triacute thocircng minh của triacute tuệ nhacircn tạo
Con người suy diễn như thế nagraveo
Phacircn loại (Categorization)
Caacutec quy tắc cụ thể
Heuristics
Kinh nghiệm trước đoacute
Dự tiacutenh trước
Maacutey tiacutenh suy diễn như thế nagraveo
Lập luận dựa trecircn luật IF-THEN mocirc tả tri thức được matilde hoacutea dưới dạng caacutec luật
Caacutec khung (Frames) lagrave caacutec đại diện mocirc tả caacutec tigravenh huống giống nhau lagrave điển higravenh của một vagravei phacircn loại
Lập luận dựa trecircn caacutec trường hợp mocirc phỏng giải phaacutep trước đoacute cho một vấn đề hiện tại
Nhận dạng mẫu phaacutet hiện acircm thanh higravenh dạng hoặc caacutec chuỗi dagravei
Caacutec dạng khaacutec của Triacute tuệ nhacircn tạo
Học maacutey- mạng nơron vagrave giải thuật di truyền
Lập trigravenh tự động ndash lagrave những kỹ thuật tạo ra caacutec chương trigravenh để lagravem 1 nhiệm vụ riecircng biệt (cho pheacutep những người khocircng phải lagrave người lập trigravenh coacute thể lập trigravenh được)
Cuộc sống nhacircn tạo ndash nỗ lực để taacutei tạo caacutec hiện tượng sinh học trong caacutec hệ thống dựa trecircn maacutey tiacutenh
73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia(Expert Systems- ES)
Theo Jackson (1999) Một hệ chuyecircn gia lagrave một chương trigravenh maacutey tiacutenh mocirc tả vagrave suy diễn với tri thức của một vagravei lĩnh vực để giải quyết vấn đề hay đưa ra caacutec lời khuyecircn
Cấu truacutec cơ bản của ES được dựa theo cấu truacutec chung của DSS Sự khaacutec biệt chiacutenh giữa ES vagraveDSS lagrave hệ ES thu thập caacutec kiến thức từ những
chuyecircn gia trong lĩnh vực quan tacircmĐặc trưng của hệ chuyecircn gia Hiệu quả cao Thời gian trả lời thỏa đaacuteng Độ tin cậy cao Dễ hiểu
Giao diện người dugraveng trong ES
Thiết kế giao diện người dugraveng tập trung vagraveo caacutec yếu tố như dễ dagraveng sử dụngcoacute độ tin cậy cao giảm tải những khoacute khăn khi sử dụng
Thiết kế necircn coacute một số tương taacutec (đầu vagraveo kiểm soaacutet vagrave truy vấn)
Cấu tạo giao diện người dugraveng gồm coacute magraven higravenh cảm ứng bagraven phiacutem buacutet saacuteng lệnh thoại caacutec phiacutem chuyecircn dụng
Cơ sở tri thức (Knowledge Base)
Chứa đựng caacutec tri thức cụ thể miền thu được từ caacutec chuyecircn gia miền
Coacute thể chứa caacutec mocirc tả caacutec hagravenh vi giải quyết vấn đề caacutec ragraveng buộc caacutec heuristics
Thagravenh cocircng của một ES dựa trecircn tiacutenh đầy đủ vagrave tiacutenh chiacutenh xaacutec của cơ sở tri thức
Mocirc tơ suy diễn (Inference Engine)
Ở đacircy tri thức được đặt để sử dụng tạo ra caacutec giải phaacutep để giải quyết vấn đề
Mocirc tơ nagravey coacute khả năng thực hiện diễn dịch hoặc suy diễn dựa trecircn caacutec luật hay caacutec caacutec sự kiện
Đồng thời cũng coacute khả năng sử dụng caacutec suy diễn mờ hay khocircng chiacutenh xaacutec dựa trecircn xaacutec suất hay aacutenh xạ mẫu
Vograveng điều khiển suy diễn
1 Aacutenh xạ caacutec luật với caacutec sự kiện đatilde được cho
2 Chọn luật để thực hiện
3 Thực hiện luật bằng caacutech thecircm caacutec sự kiện được suy diễn ra vagraveo bộ nhớ lagravem việc
Chuỗi suy diễn (Chaining)
Suy diễn tiến (forward chaining) maacutey suy diễn bắt đầu từ dữ liệu ban đầu vagrave thực hiện việc suy luận để đưa ra caacutec kết luận cuối cugraveng
Suy diễn lugravei (backward chaining) maacutey suy diễn bắt đầu từ dữ liệu điacutech vagrave tigravem ra tri thức hỗ trợ cho dữ liệu điacutech đoacute
Viacute dụ suy diễn lugravei
R1 Nếu coacute A vagrave B thigrave suy ra coacute D
R2 Nếu coacute B thigrave suy ra coacute C
R3 Nếu coacute C vagrave D thigrave suy ra coacute E
Ta coacute E ta xem trong 3 luật R1 R2 R3 luật nagraveo coacute E ta thấy R3 chứa E đồng thời chứa C vagrave D Xeacutet tiếp trong 2 luật R1 R2 luật nagraveo chứa C vagrave D R2 chứa C R3 chứa D Từ đoacute ta coacute được caacutec tri thức hỗ trợ suy diễn vagrave kết luận lagrave nếu coacute A vagrave B thigrave sẽ coacute E Hay nếu A vagrave B đuacuteng thigrave sẽ coacute E
Viacute dụ suy diễn tiến
Giả sử coacute tập chứa 3 luật sau
R1 Nếu coacute A vagrave B thigrave suy ra coacute D
R2 Nếu coacute B thigrave suy ra coacute C
R3 Nếu coacute C vagrave D thigrave suy ra coacute E
Nếu ta coacute A vagrave B thigrave chuacuteng ta suy ra được D từ R1 vagrave suy ra C từ R2 Với D vagrave C đatilde được suy ra ở trecircn giờ chuacuteng ta suy ra được E từ R3
Viacute dụ thực tế
Giả sử muốn biết magraveu của một con vật nuocirci tecircn lagrave Fred biết rằng noacute kecircu ộp ộp vagrave ăn ruồi
Coacute tập 4 luật ban đầu như sau
R1 Nếu X kecircu ộp ộp vagrave ăn ruồi thigrave X lagrave con ếch
R2 Nếu X kecircu chiecircm chiếp vagrave biết hoacutet thigrave X lagrave con chim
R3 Nếu X lagrave con ếch thigrave X coacute magraveu xanh
R4 Nếu X lagrave con chim thigrave X coacute magraveu vagraveng
74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia
Expert system shells lagrave một tập caacutec goacutei phần mềm vagrave caacutec cocircng cụ dugraveng để phaacutet triển caacutec hệ chuyecircn gia
Những Expert system shells đầu tiecircn thường rất rườm ragrave Mặc dugrave vậy noacute vẫn giuacutep cho người sử dụng sẽ khocircng phải bắt đầu lại từ đầu khi xacircy dựng một hệ chuyecircn gia mới
Những shell hiện đại bao gồm hai mocirc-đun chiacutenh lagrave cocircng cụ xacircy dựng một tập quy tắc vagrave mocirc tơ suy diễn
Xacircy dựng hệ chuyecircn gia
Bước 1 xacircy dựng mocirc higravenh bagravei toaacuten xaacutec định vấn đề nhiệm vụ magrave hệ thống sẽ thực hiện Caacutec dạng bagravei toaacuten cần hệ chuyecircn gia
Bagravei toaacuten diễn giải (InterPretation)
Bagravei toaacuten dự baacuteo (Prediction)
Bagravei toaacuten chuẩn đoaacuten (Diagnose)
Bagravei toaacuten gỡ rối (Debugging)
Bagravei toaacuten thiết kế
Tương tự như một dự aacuten phần mềm để xacircy dựng một hệ chuyecircn gia cần phải coacute caacutec yếu tố về nhacircn lực tagravei nguyecircn vagrave thời gian Những yếu tố nagravey ảnh hưởng đến giaacute thah của một hệ chuyecircn giaTrong phần nagravey cacircu hỏi thường được đặt ra lagrave tại sao cần phải xacircy dựng một hệ chuyecircn giaTrước khi bắt đầu phải xaacute định rotilde bagravei toaacuten đạt ra lagrave jiAi lagrave chuyecircn giaAi lagrave người sử dụng
1 Diễn giải (InterPretation) Nghiecircn cứu 1 vấn đề -gt Dựa trecircn những biểu hiện thuộc tiacutenh đặc trưng becircn ngoagravei -gt Tư vấn
(hoặc đưa ra kết luận hay mocirc tả dễ hiểu từ tập dữ liệu thocirc)
2 Bagravei toaacuten dự baacuteo (Prediction) Coacute thể dự đoaacuten được hagravenh vi kết quả dựa trecircn caacutec hiện tượng -gt dự baacuteo
VD Dự baacuteo thời tiết động đấthellip
3 Bagravei toaacuten chẩn đoaacuten (Diagnoss) Xaacutec định caacutec lỗi caacutec bộ phận hỏng hoacutec của hệ thống dựa trecircn caacutec dữ liệu quan saacutet được
4 Bagravei toaacuten gỡ rối (Debugging) Mocirc tả caacutec phương phaacutep khắc phục hệ thống khi gặp sự cố
5 Bagravei toaacuten thiết kế Lựa chọn cấu higravenh caacutec đối tượng nhằm thoả matilden một số ragraveng buộc nagraveo đoacute
6 Giảng dạy Phần mềm dạy học coacute thể chuẩn đoaacuten vagrave sủa lỗi của học sinh trong quaacute trigravenh học tập
Để xaacutec định đuacuteng bagravei toaacuten magrave chuacuteng ta cần giải quyết thigrave phải trả lời đc một số cacircu hỏi
- cần hệ chuyecircn gia
Bước 2 thu thập tri thức lựa chọn cocircng cụ vagrave aacutep dụng
Trong bước thu thập tri thức vấn đề quan trọng lagrave lựa chọn chuyecircn gia những người magrave sẽ đoacuteng goacutep tri thức cho hệ thống Thocircng thường trong suốt quaacute trigravenh phaacutet triển thigrave chuyecircn gia được xem như một thagravenh viecircn của đội phaacutet triển
Hiện nay coacute rất nhiều cocircng cụ để xacircy dựng một hệ chuyecircn gia Phổ biến nhất lagrave JESS CLIPS vagrave OPS5
Bước 3 Thiết kế cơ sở tri thức thiết kế hệ thốngTri thức được biểu diễn trường minh trong cơ sở tri thức
Caacutec chuyecircn gia vagrave kỹ sư tri thức sẽ đối thoại với nhau bằng caacutec kỹ thuật đối thoại Suy diễn (SD) bảng Mocirc higravenh hoacutea SD quy nạp phacircn loại
Vấn đề bagraveo trigrave vagrave phaacutet triển
Caacutec hệ chuyecircn gia đogravei hỏi phải bảo trigrave vagrave phaacutet triển nhiều hơn so với caacutec hệ thống khaacutec Phải thường xuyecircn bổ sung tri thức mới vagrave thay đổi caacutec tri thức cũ để đổi mới hệ chuyecircn gia
Thu thập vagrave khắc phục lỗi do người sử dụng phaacutet hiện để kịp thời khắc phục những sai soacutet của hệ chuyecircn gia
75 Lợi iacutech vagrave hạn chế của caacutec hệ chuyecircn gia
Một số lợi iacutech chiacutenh
Thời gian trả lời hợp lyacute bằng hoặc nhanh hơn so với chuyecircn gia (người) để đi đến cugraveng một quyết định Hệ chuyecircn gia lagrave một hệ thống thời gian thực (real time system)
Khả năng trả lời với mức độ tinh thocircng bằng hoặc cao hơn so với chuyecircn gia (người) trong cugraveng lĩnh vực
Hệ chuyecircn gia giuacutep cho hiệu quả lagravem việc tăng bằng việc sử dụng tập caacutec luật một caacutech nhanh choacuteng magrave ko bị nhầm lẫn chuyecircn gia lagrave người coacute thể quecircn đi một số tri thức cơ sở lyacute luậ nhưng HCG thigrave ko
Quyết định của một người chuyecircn gia coacute thể bị thay đổi vagrave ko coacute tiacutenh thống nhất như quyết định của một hệ chuyecircn gia tạo ra
Hệ chuyecircn gia giuacutep cho người sử dụng coacute thể trau dồi sự hiểu biết trecircn lĩnh vuej cụ thể magrave noacute giải quyết hỗ trợ người ra quyết định coacute trigravenh độ như 1 chuyecircn gia trong quaacute trigravenh gia quyết định
Kiến thức của rất nhiều chuyecircn gia về một lĩnh vực nagraveo đoacute được đưa vagraveo hệ chuyecircn gia lagravem cho CSTT cuat HCG phong phuacute vagrave rộng lớn hơn rất nhiều
HCG giải thiacutech caacutec bước suy luận một caacutech dễ hiểu nhất quaacuten luacutec nagraveo cũng coacute thể sử dụng ko như chuyecircn gia con người
Hạn chế của caacutec hệ chuyecircn gia
Nhược điểm lớn nhất của hệ chuyecircn gia lagrave những yacute kiến chuyecircn mocircn thường rất khoacute matilde hoacutea vagrave giải neacuten
Hệ chuyecircn gia khocircng coacute khả năng tự học tự cập nhật kiến thức mới như caacutec chuyecircn gia magrave cần phải được matilde hoacutea lại khi noacute được cập nhật
Hệ chuyecircn gia khocircng thể nhận ra được vấn đề khocircng nằm trong miền kiến thức của hệ thống
Chương 8 Tri thức vagrave tiếp nhận
1 Bao gồm caacutec vấn đề
Dữ liệu thực tế đo lường hoặc quan saacutet coacute hoặc khocircng coacute bối cảnh
Thocircng tin dữ liệu được tổng hợp một caacutech hữu iacutech để giải quyết những khoacute khăn trong việc đưa ra quyết định
Tri thức bao gồm caacutec ứng dụng quy tắc thocircng tin hướng dẫn của người ra quyết định
2 Những caacutei nhigraven về tri thức
Đại diện lagravem thế nagraveo để diễn tả tri thức viacute dụ như một quyển saacutech khocircng phải lagrave tri thức nhưng noacute lại lagrave một đại diện của tri thức
Sản xuất tri thức lagrave một tập hơp của hagraveng tồn kho coacute thể được sản xuất cũng như mua lại
Tri thức lagrave 1 trong 6 trạng thaacutei của hệ thống
1Dữ liệu 2Thocircng tin 3Cấu truacutec thocircng tin 4Sự thấu hiểu 5Yacute kiến 6 Quyết định
3 Caacutec loại tri thức Phổ biến mocirc tả dữ liệu thocircng tin thủ tục mọi thứ lagravem như thế nagraveo lập luận chiacutenh saacutech hoặc caacutec quy tắc
4 Thu thập Tri thức hệ chuyecircn gia Hầu hết caacutec phương phaacutep đều bắt đầu với mocirc higravenh của caacutec taacutec vụ trong đoacute
hệ chuyecircn gia được xacircy dựng Trong đoacute mocirc tả về caacutec lĩnh vực được tạo ra Caacutec kỹ sư sử dụng caacutec mocirc higravenh giả thuyết vagrave nhận thức về quaacute trigravenh phacircn
tiacutech để gợi ra caacutech giải quyết vấn đề về tri thức từ caacutec chuyecircn gia
5 Caacutec chiều của thu thập tri thức KE- driven caacutec kỹ sư trao đổi trực tiếp với caacutec chuyecircn gia Expert-driven Caacutec chuyecircn gia trực tiếp đưa chuyecircn mocircn của họ vagraveo hệ
thống maacutey tiacutenh Machine-driven Sử dụng caacutec cocircng cụ suy luận để triacutech xuất tri thức từ một
tập caacutec viacute dụ
6 Kỹ thuật thu thập tri thức Trao đổi gồm 2 loại cơ bản lagrave coacute cấu truacutec(coacute kịch bản) vagrave khocircng coacute cấu
truacutec( đối thoại trực tiếp) Giao thức phacircn tiacutech bằng lời Khi caacutec chuyecircn gia thực hiện một cocircng việc
của họ thigrave một bản ghi về cocircng việc đoacute được thực hiện Caacutec kỹ sư sẽ xacircy dựng mocirc higravenh cho những gigrave được ghi lại trong bản ghi
Phương phaacutep sagraveng lọc caacutec chuyecircn gia so saacutenh caacutec nhoacutem liecircn tiếp trong ba đối tượng vagrave cho biết tại sao nhoacutem thứ hai lại khaacutec nhoacutem thứ ba
7 Thu thập tri thức từ nhiều nguồn Thu thập tri thức từ nhiều nguồn lagrave cần thiết để coacute được đầy đủ caacutec tri thức
cho một vấn đề quan điểm yacute kiến traacutei ngược nhau thường phaacutet sinh Phương phaacutep đồng thuận sẽ giuacutep giải quyết được vấn đề macircu thuẫn Kỹ thuật phacircn tiacutech Meta lagrave kỹ thuật được aacutep dụng trong caacutec trường hợp
khaacutec Caacutech tiếp cận bằng định lượng đogravei hỏi caacutec kỹ sư cần cacircn nhắc yếu tố đầu vagraveo của caacutec chuyecircn gia khaacutec nhau
8 Xaacutec nhận hợp lệ vagrave kiểm tra tri thức Một khi thu thập tri thức noacute phải được đaacutenh giaacute về khả năng sử dụng vagrave độ
chiacutenh xaacutec Hai vấn đề cụ thể lagrave hiệu lực của những kiến thức vagrave kiểm tra việc xacircy dựng cơ sở của tri thức
Cần xaacutec nhận xem liệu hệ thống coacute thể hoạt động ở mức độ tối thiểu khocircng
Xaacutec minh liecircn quan đến việc so saacutenh từng chi tiết kỹ thuật của hệ thống những gigrave đatilde được thực hiện cuối cugraveng
9 Một số caacutec biện phaacutep xaacutec nhận Độ chiacutenh xaacutec Khả năng thiacutech nghi Mức độ đầy đủ Bề rộng Độ sacircu Hiệu lực Tổng quan Chiacutenh xaacutec Hiện thực Độ tin cậy Tiacutenh hữu dụng Mức độ
Chương 9 Học maacutey
1 Logic mờ vagrave ngocircn ngữ mờ(Fuzzy Logic and Linguistic Ambiguity)
Ngocircn ngữ tự nhiecircn gồm những khaacutei niệm mơ hồ vagrave khocircng chiacutenh xaacutectruyền tải ngữ nghĩa thocircng qua tiacutenh xấp xỉkhocircng rotilde ragraveng
Những xấp xỉ nagravey giuacutep con người coacute thể truyền tải hết được yacute nghĩa nhưng maacutey thigrave khocircng hiểu
Lagravem sao biểu diễn caacutec tri thức sử dụng caacutec khaacutei niệm khocircng rotilde ragraveng(mờ) hoặc khocircng chiacutenh xaacutec
2 Khaacutei niệm cơ bản của logic mờ tập mờ lagrave những tập hợp khocircng coacute một giới hạn rotilde Mỗi phần tử của noacute chỉ
chứa một mức độ hagravem liecircn thuộc của từng phần tử Vigrave vậy tập mờ khocircng giống như tập cổ điển Tập mờ coacute thể kết hợp với nhau qua những luật mờ magrave đặc trưng cho những hagravenh động trạng thaacutei vagrave thuộc tiacutenh của logic mờ được tận dụng khi thực hiện một bộ điều khiển mờ
Logic mờ dựa trecircn yacute tưởng mỗi phần tử thuộc vagraveo một tập hợp ở một mức độ nagraveo đấy
Locircgic mờ cho pheacutep độ liecircn thuộc (microA )coacute giaacute trị trong khoảng (01) Locircgic mờ coacute thể được coi lagrave mặt ứng dụng của lyacute thuyết tập mờ để xử lyacute caacutec
giaacute trị trong thế giới thực cho caacutec bagravei toaacuten phức tạp
3 So saacutenh tiacutenh đuacuteng đắn logic mờ vagrave xaacutec suất Xaacutec suất thigrave đề cập đến khả năng xảy ra một biến cố hay một điều gigrave đoacute Logic mờ đề cập đến cấp độ magrave đặc tiacutenh ở hiện tại
o viacute dụ1 người coacute chiều cao 6 feet thigrave coacute cấp độ lagrave 05 về chiều cao
4 Ưu điểm của logic mờ Caacutech tiếp cận rất tự nhiecircnkhocircng phức tạp Coacute thể mocirc higravenh hoacutea caacutec hagravem phi tuyến tugravey yacute phức tạp
Coacute thể tận dụng được kinh nghiệm từ những chuyecircn gia hagraveng đầu trong mọi lĩnh vực
Logic mờ được xacircy dựng dựa trecircn ngocircn ngữ tự nhiecircnNền tảng của logic mờ lagrave dựa trecircn cơ sở giao tiếp của con người
5 Nhược điểm của logic mờ Trong 1 hệ thống phức tạpsử dụng logic mờ coacute thể trở thagravenh trở ngại cho
việc xaacutec thực độ tin cậy của hệ thống Cơ chế lập luận mờ khocircng thể học hỏi từ những lỗi sai
6 Mạng noron nhacircn tạo(ANN) Mạng noron nhacircn tạo lagrave một mocirc phỏng xử lyacute thocircng tinđược nghiecircn cứu ra
từ hệ thống thần kinh của sinh vậtgiống như bộ natildeo để xử lyacute thocircng tin ANNs lagrave chương trigravenh dựa trecircn maacutey tiacutenh đơn giản coacute chức năng lagrave một mocirc
higravenh bagravei toaacuten khocircng gian dựa trecircn thử nghiệm vagrave baacuteo lỗi
7 Học từ kinh nghiệm Tiến trigravenh Một mẫu dữ liệu được biểu diễn như một mạng lưới noronANN ldquodự
đoaacutenrdquo 1 đầu radự đoaacuten được so saacutenh với giaacute trị thực tế hoặc giaacute trị chiacutenh xaacutecNếu đoaacuten được chiacutenh xaacutec thigrave khocircng coacute hagravenh động nagraveo được thực hiện
Nếu dự đoaacuten sai ANN kiểm tra lại vagrave xaacutec định lại thocircng số để điều chỉnh Một mẫu dữ liệu khaacutec được biểu diễn vagrave quaacute trigravenh nagravey được lặp lại
8 Nguyecircn tắc cơ bản của cocircng nghệ nơron Caacutec yếu tố xử lyacute cơ bản trong hệ thống thần kinh của con người lagrave tế bagraveo
thần kinhMạng lưới của tế bagraveo nagravey lagrave liecircn kết với nhau nhận được thocircng tin từ caacutec cảm biến trong mắt taihellip
Thocircng tin nhận được bởi tế bagraveo thần kinh hoặc lagrave sẽ kiacutech thiacutech noacute(sẽ được chuyển qua 1 thocircng điệp dọc theo mạng lưới) hoặc lagrave sẽ ngăn cản noacute(ngăn cản dograveng thocircng tin)
Độ nhạy coacute thể thay đổi qua thời gian hoặc sau khi coacute được kinh nghiệm
9 Cấu truacutec mạng Một ANN gồm 3 lớp cơ bản
Lớp đầu vagraveo nhận dữ liệu Lớp becircn trong hoặc lagrave lớp ẩn xử lyacute dữ liệu Lớp đầu ra chuyển tiếp kết quả cuối cugraveng của mạng
10Mạng nơ ron Thường coacute nhiều đầu vagraveo mỗi đầu vagraveo với mức ảnh hưởng vagrave tầm quan
trọng riecircng của noacute Một đầu vagraveo quan trọng coacute thể được sử dụng để khuếch đại đầu ra caacutec hagravem trạng thaacutei tổng hợp caacutec trọng số của caacutec yếu tố
đầuvagraveo khaacutec nhauvagraveo một giaacute trị duy nhất Caacutec hagravem chuyển giao xử lyacute caacutec giaacute trị trạng thaacutei vagrave tạo đầu ra
11Huấn luyện mạng nơ ron Trong mocirc higravenh coacute giaacutem saacutetANN được đến so saacutenh dự đoaacuten của chiacutenh
noacute với thocircng tin phản hồi coacute chứa caacutec kết quả mong muốn ANN sẽ phải tigravem caacutech thay đổi caacutec tham số becircn trong củamigravenh (caacutec trọng số vagrave caacutec ngưỡng) để tạo necircn một aacutenh xạ coacute khả năng aacutenh xạcaacutec đầu vagraveo thagravenh caacutec đầu ra mong muốn Sự thay đổi nagravey được tiến hagravenh nhờ việc so saacutenh giữa đầu ra thực sự vagrave đầu ra mong muốn
Trong mocirc higravenh khocircng coacute giaacutem saacutetANN nhận được dữ liệu vagraveo nhưng khocircng phải coacute bất kỳ thocircng tin phản hồi về kết quả mong muốn
Phần lớn caacutec ứng dụng nằm trong vugraveng của caacutec bagravei toaacuten ước lượng như mocirc higravenh hoacuteathống kecirc neacuten lọc phacircn cụm
12Lợi iacutech Liecircn kết với mạng noron Traacutenh caacutech lập trigravenh tường minh Giảm nhu cầu của chuyecircn gia ANNs thigrave thiacutech nghi với caacutec yếu tố đầu vagraveo thay đổi Khocircng cần thiết cho cơ sở tri thức tinh chế ANNs coacute tiacutenh động vagrave cải thiện với việc sử dụng Coacute khả năng xử lyacute dữ liệu khocircng chiacutenh xaacutec hoặc khocircng đầy đủ Cho pheacutep tổng quaacutet hoacutea từ thocircng tin cụ thể Cho pheacutep thu thập cảm giaacutec thocircng thường vagraveo miền giải quyết vấn đề
13Hạn chế của việc liecircn kết với mạng noron ANNs khocircng thể giải thiacutech được suy luận Bản chất hộp đen thường khiến cho vấn đề traacutech nhiệm vagrave độ tin cậy phaacutet
sinh lagrave khoacute khăn Lặp đi lặp lại quaacute trigravenh huấn luyện rất tốn thời gian Nguồn lực caacutec nhagrave phacircn tiacutech vagrave thiết kế coacute tay nghề cao vẫn lagrave đaacuteng lo
ngại Cocircng nghệ ANN thuacutec đẩy hạn chế của phần cứng hiện tại ANN yecircu cầu phải coacute sự tin tưởng ở đầu ra
14Giới thiệu về thuật toaacuten di truyền Cũng như mạng lưới thần kinh caacutec thuật toaacuten di truyền được dựa trecircn lyacute
thuyết sinh học Thuật toaacuten di truyền tigravem thấy nguồn gốc của chuacuteng trong caacutec lyacute thuyết
tiến hoacutea của chọn lọc tự nhiecircn vagrave thiacutech ứng với biến đổi khiacute hậu Kết quả thuật toaacuten di truyền lagrave từ giao phối 2 caacute thể trong quần thế để tạo
ra con caacutei đocirci khi tốt hơn so với bậc cha mẹ của chuacuteng 15Caacutec thagravenh phần cơ bản của thuật toaacuten di truyền
Toaacuten tử chọn lọc Caacutec caacute thể tốt được chọn lọc để đưa vagraveo thế hệ sau Sự chọn lọc nagravey căn cứ vagraveo độ thiacutech nghi với mocirci trường của mỗi caacute thể
Toaacuten tử lai gheacutep (crossover) Hai caacute thể cha vagrave mẹ trao đổi caacutec gen với nhau để tạo ra caacute thể con
Toaacuten tử đột biến (mutation) Một caacute thể thay đổi một số gen để biến đổi thagravenh một caacute thể mớiTất cả caacutec toaacuten tử trecircn khi thực hiện đều mang tiacutenh ngẫu nhiecircn
16Quaacute trigravenh cơ bản của một thuật toaacuten di truyền Khởi tạo
Đaacutenh giaacute quần thể
Lựa chọn NST thiacutech hợp nhất vagrave loại bỏ NST yếu nhất
Quy trigravenh giao nhau vagrave cải thiện quần thể
đột biến tiến trigravenh để khaacutem phaacute ra NST mới
17Ưu nhược điểm của việc kết hợp với thuật toaacuten di truyền Kiacutech thước quần thể lagrave 1 yếu tố quan trọng trong tốc độ của việc tigravem
kiếmnhưng noacute tương đối dễ dagraveng để dự đoaacuten tốc độ nagravey Giao nhau hoặc đột biến lagrave khocircng necircn đc sử dụng quaacute thường xuyecircn Luocircn coacute được iacutet nhất 1 giải phaacutep hợp lyacute Necircn coacute thể aacutep dụng chuacuteng cho caacutec vấn đề magrave chuacuteng ta khocircng coacute hướng
về caacutech giải quyết Sức mạnh của thuật toaacuten xuất phaacutet từ khaacutei niệm đơn giảnkhocircng phải từ
một thủ tục thuật toaacuten phức tạp 18Tương lai của học maacutey
Mạng lưới thần kinh nhacircn tạo vượt quaacute năng lực của con người trong caacutec trường hợp bị cocirc lập
Về mặt lyacute thuyếtmột maacutey tiacutenh coacute thể xử lyacute dũ liệu nhanh hơn hagraveng triệu lần so với 1 con người
May mắn thay cho chuacuteng tacon người tốt hơn nhiều khi magrave coacute được dữ liệumaacutey tiacutenh khocircng coacute 1 số thứ như lagrave 5 giaacutec quan
CHƯƠNG 10 KHO DỮ LIỆU
1 Kho dữ liệu Kho dữ liệu lagrave tuyển tập caacutec cơ sở dữ liệu tiacutech hợp hướng chủ đề được
thiết kế để trợ giuacutep cho một hệ hỗ trợ quyết định
Theo John Ladley Cocircng nghệ kho dữ liệu lagrave tập caacutec phương phaacutep kỹ thuật vagrave caacutec cocircng cụ coacute thể kết hợp hỗ trợ nhau để cung cấp thocircng tin cho người sử dụng trecircn cơ sở tiacutech hợp từ nhiều nguồn dữ liệu nhiều mocirci trường khaacutec nhau
Kho dữ liệu thường rất lớn tới hagraveng trăm GB hay thậm chiacute hagraveng Terabyte
2 Kho dữ liệu vận hagravenh (ODS) Một kho dữ liệu vận hagravenh Aacutep dụng kỹ thuật kho dữ liệu vagraveo caacutec hệ xử
lyacute giao taacutec lưu trữ dữ liệu cho một ứng dụng đặc thugrave Noacute đưa vagraveo kho dữ liệu một dograveng caacutec dữ liệu thocirc được thiết kế
3 So saacutenh
Kho dữ liệu vận hagravenh Kho dữ liệu
Dữ liệu theo chủ đề Dữ liệu theo chủ đề
Dữ liệu tiacutech hợp Dữ liệu tiacutech hợp
Dữ liệu thay đổi Dữ liệu khocircng thay đổi
Dữ liệu được cập nhật khi thay đổi
Dữ liệu giữ nguyecircn
Chỉ coacute dữ liệu hiện tạiDữliệu hiện tại vagrave dữ liệu lịch sử
Chu kỳ lagravem tươi dữ liệu ngắn Chu kỳ lagravem tươi dữ liệu dagravei
Chỉ coacute dữ liệu chi tiết Dữ liệu chi tiết vagrave dữ liệu tổng kết
Dugraveng cho caacutec quyết định ngắn hạn
Dugraveng cho hoạch định dagravei hạn
4 Kho dữ liệu cục bộ (Data Mart - DM)
Kho dữ liệu cục bộ lagrave CSDL coacute những đặc điểm giống với kho dữ liệu nhưng với quy mocirc nhỏ hơn vagrave lưu trữ dữ liệu về một lĩnh vực một chuyecircn ngagravenh
Data mart phụ thuộc Chứa những dữ liệu được lấy từ DW vagrave những dữ liệu nagravey sẽ được triacutech lọc vagrave tinh chế tiacutech hợp lại ở mức cao hơn để phục vụ một chủ đề nhất định của Datamart
Data mart độc lập Khocircng giống như Datamart phụ thuộc Data mart độc lập được xacircy dựng trước DW vagrave dữ liệu được trực tiếp lấy từ caacutec nguồn khaacutec nhau
5 Siecircu dữ liệu Metadata lagrave dữ liệu để mocirc tả dữ liệu Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột
một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi Metadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu
6 Mocirci trường kho dữ liệu Hệ thống của tổ chức vagrave kho cung cấp dữ liệu để xacircy dựng kho dữ liệu Trong quaacute trigravenh chuyển dữ liệu từ caacutec nguồn khaacutec nhau dữ liệu coacute thể
được lagravem sạch hoặc chuyển đổi vagrave vigrave thế DW được xem như lagrave một chuẩn cho việc lưu trữ
Đồng thời siecircu dữ liệu được ghi lại Cuối cugraveng DW hoặc siecircu thị coacute thể được sử dụng để tạo ra một kho dữ
liệu ldquocaacute nhacircnrdquo 7 Caacutec đặc điểm của kho dữ liệu
Đặc điểm Mocirc tả
Hướng chủ đề - DL tổ chức theo caacutech thức người dugraveng tham chiếu
Tiacutech hợp - Dữ liệu ldquosạchrdquo loại bỏ tiacutenh thiếu nhất quaacuten
Khocircng thay đổi - DL ldquochỉ đọcrdquo người dugraveng khocircng thay đổi được
Chuỗi thời gian - DL lagrave chuỗi thời gian khocircng phải lagrave trạng thaacutei hiện tại
Được tổng kết - DL vận hagravenhthao taacutec khi cần thiết
được kết hợp lại thagravenh dạng coacute thể dugraveng được cho quyết định
Kiacutech cỡ lớn hơn - Lưu giữ theo chuỗi thời gian tức lagrave giữ lại nhiều DL
Khocircng được chuẩn hoacutea - Coacute thể dư thừa DLSiecircu dữ liệu - Dữ liệu của dữ liệu được lưu trữNguồn dữ liệu - DL vận hagravenh (caacutec hệ sẵn coacute) cugraveng
với caacutec nguồn ngoagravei 8 Kho dữ liệu hướng chủ đề
Hướng chủ để coacute nghĩa lagrave kho dữ liệu được tổ chức xung quanh caacutec chủ đề chiacutenh như khaacutech hagraveng sản phẩm sản xuất Tập trung vagraveo việc mocirc higravenh hoacutea vagrave phacircn tiacutech dữ liệu cho caacutec nhagrave ra quyết định magrave khocircng tập trung vagraveo caacutec xử lyacute thocircng thường Cung cấp cho người dugraveng một khung nhigraven toagraven vẹn đơn giản vagrave đầy đủ về caacutec sự kiện quanh caacutec chủ đề
9 Dữ liệu trong DW được tiacutech hợp Dữ liệu trong kho dữ liệu được xacircy dựng bằng caacutech tổng hợp dữ liệu từ
nhiều nguồn khaacutec nhau vagrave caacutec nguồn coacute tổ chức khaacutec nhau Cơ sở dữ liệu caacutec file excel caacutec flat file hoặc caacutec raw file Khi đưa vagraveo kho dữ liệu caacutec dữ liệu được lagravem sạch vagrave tiacutech hợp dữ liệu nhằm đảm bảo tiacutenh nhất quaacuten của dữ liệu
10Kiến truacutec kho dữ liệu Tầng cơ sở dữ liệu hoạt động Tầng truy xuất thocircng tin Tầng truy xuất dữ liệu Tầng siecircu dữ liệu Tầng quản lyacute tiến trigravenh Tầng thocircng điệp của ứng dụng Tầng vật liacute của kho dữ liệu Tầng trigravenh diễn dữ liệu
11Higravenh trạng kho dữ liệu Kho dữ liệu ảo - người dugraveng cuối coacute thể truy cập trực tiếp đến kho dữ liệu
sử dụng caacutec cocircng cụ cho pheacutep ở tầng truy xuất dữ liệu Kho dữ liệu trung tacircm-1 cơ sở dữ liệu vật lyacute chứa tất cả dữ liệu cho một
vugraveng chuyecircn dụng nagraveo đoacute
Kho dữ liệu phacircn taacuten- Thagravenh phần được phacircn taacuten qua nhiều hệ cơ sở dữ liệu vật lyacute
12METADATA- Siecircu dữ liệu Định nghĩa Siecircu dữ liệu lagrave dữ liệu về dữ liệu Lagrave 1 lưu trữ dugraveng để
Miecircu tả kho dữ liệu tổng thể Nhận dạng kiểu kho dữ liệu Quản liacute quaacute trigravenh tiacutech hợp dữ liệu Quản liacute quaacute trigravenh cập nhật kho dữ liệu Quản liacute bảo mật
Lagrave chigravea khoacutea quyết định sự thagravenh cocircng của kho dữ liệu luocircn được thay đổi vagrave cập nhật theo sự phaacutet triển của kho dữ liệu
Dugraveng để quản liacute điều khiển kho dữ liệu Sự ra đời của kho dữ liệu như 1 cấu truacutec hỗ trợ ra quyết định siecircu dữ liệu
được xem như nguồn tagravei nguyecircn dữ liệu Siecircu dữ liệu lagrave trừu tượng Chuacuteng lagrave dữ liệu bậc cao cung cấp mocirc tả ngắn
gọn caacutec dữ liệu bậc thấp hơn 13Hoạt động của Siecircu dữ liệu
Siecircu dữ liệu rất cần thiết trong việc chuyển hoacutea thocircng tin trở thagravenh tri thức Lagrave chigravea khoacutea giuacutep chuacuteng ta xử lyacute được dữ liệu thocirc Viacute dụ một dograveng dữ liệu baacuten hagraveng 1023 K596 11121 agraveNoacute sẽ khocircng coacute nghĩa gigrave cho đến khi chuacuteng ta đưa vagraveo siecircu dữ liệu (thư
mục chứa dữ liệu) agrave cửa hagraveng 1023 sản phẩm K596 vagrave số tiền baacuten được lagrave 11121 đocirc la
14Sự cần thiết phải nhất quaacuten trong kho dữ liệu Kho dữ liệu được xacircy dựng cho lợi iacutech của những nhagrave phacircn tiacutech kinh
doanh caacutec nhagrave quản trị cho tất cả caacutec khu vực chức năng Trong cơ sở dữ liệu riecircng caacutec khu vực khaacutec nhau coacute thể định nghĩa vagrave lưu
trữ dữ liệu thocircng qua phiecircn bản của chiacutenh noacute Khi dữ liệu được lấy từ những vugraveng khaacutec nhau đoacute vagrave được đặt vagraveo kho dữ
liệu Việc chuyển đổi vagrave lagravem sạch caacutec tiến trigravenh sẽ đảm bảo noacute lagrave duy nhất được tiacutech hợp tại một mức của tổ chức
15Ragrave soaacutet lại dữ liệu ndash Thực thi siecircu dữ liệu
Bất kể cấu truacutec tự nhiecircn của 1 cacircu truy vấn thế nagraveo thigrave caacutec thagravenh phần của siecircu dữ liệu rất quan trọng đối với người ra quyết định
Bảng thuộc tiacutenh khoacutea được lưu trữ bởi kho dữ liệu Tập hợp dữ liệu được lấy từ đacircu Những chuyển đổi nagraveo được thực thi với việc lagravem sạch
16Siecircu dữ liệu lagrave gigrave Metadata - lagrave thocircng tin mocirc tả nội dung của cơ sở dữ liệu (CSDL) Metadata baacuteo cho người dugraveng biết thời gian cập nhật sau cugraveng của dữ liệu
định dạng vagrave mục điacutech sử dụng của noacute Những thocircng tin nagravey coacute thể hướng dẫn người dugraveng duyệt qua CSDL vagrave
giuacutep họ hiểu được yacute nghĩa vagrave ngữ cảnh của dữ liệu Trong CSDL metadata lagrave caacutec dạng biểu diễn khaacutec nhau của caacutec đối tượng
trong CSDL Trong CSDL quan hệ metadata lagrave caacutec định nghĩa của bảng cột CSDL
view vagrave nhiều đối tượng khaacutec Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột
một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi -gtMetadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu
Bảng chuyển đổi Ghi lại những chuyển đổi đatilde được thực hiện
Lịch sử thực thi Ghi lại những dữ liệu đatilde được
phacircn tiacutech
Higravenh thaacutei kết nốiGhi lại những dữ liệu được kết nối vagrave tần suất
17Aacutenh xạ thocircng thường của siecircu dữ liệu Bản ghi aacutenh xạ chuyển đổi bao gồm
Định danh của nguồn gốc Chuyển đổi thuộc tiacutenh Chuyển đổi thuộc tiacutenh vật lyacute Matilde hoacutea tham chiếu bảng chuyển đổi Đổi tecircn Đổi khoacutea Gaacuten giaacute trị cho thuộc tiacutenh mặc định Chọn logic cho caacutec nguồn nhiều giaacute trị Đổi thuật toaacuten
18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để
phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai
lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave
tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec
Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm
Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo
19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua
caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau
SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được
Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra
một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức
Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ
Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ
Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech
CHƯƠNG 11 KHAI PHAacute DỮ LIỆU
1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn
ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993
Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng
2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd
1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều
2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP
3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn
4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng
5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server
6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo
7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động
8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời
9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều
10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện
11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech
12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP
3 Xử lyacute phacircn tiacutech trực tuyến OLAP
MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave
dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu
ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave
thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu
HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave
ROLAP4 Khai phaacute dữ liệu
Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh
khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn
Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan
5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp
6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại
Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp
Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec
Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt
Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra
Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh
vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho
Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec
Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm
Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục
Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng
gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp
Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn
Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec
Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper
Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2
Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25
Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước
Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng
Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện
trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp
Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute
độ hỗ trợ ge ngưỡng minsup
độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan
Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn
Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết
Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu
MOLAP ROLAP HOLAP
Lưu trữ dữ liệu cơ sở
Khối Bảng quan hệ Bảng quan hệ
Lưu trữ thocircng tin tổng hợp
Khối Bảng quan hệ Khối
Hiệu suất thực hiện truy vấn
Nhanh nhất Chậm nhất Nhanh
Tiecircu thụ khocircng gian lưu trữ
Nhiều Thấp Trung bigravenh
Chi phiacute bảo trigrave Cao Thấp Trung bigravenh
liệu chi tiết)Cơ sở mocirc higravenh Caacutec chức năng coacute sẵn bị hạn
chếLagrave điểm cốt lotildei của DSS
Cấu truacutec Theo người baacuten sản phẩm hoặc theo caacutec chuyecircn gia hệ thống thocircng tin
Theo người sử dụng hoặc caacute nhacircn hoặc caacutec chuyecircn gia từ caacutec trung tacircm thocircng tin hoặc phograveng ban hệ thống thocircng tin
Phần cứng Mainframe caacutec trạm RISC mạng LANs hoặc caacutec hệ thống phacircn bố
Mainframe caacutec trạm RISC caacutec maacutey PC hoặc caacutec hệ thống phacircn bố
Bản chất caacutec goacutei phần mềm
Truy xuất tương taacutec dễ dagraveng đến nhiều cơ sở dữ liệu truy xuất trực tuyến caacutec khả năng DBMS phức tạp caacutec liecircn kết phức tạp
Caacutec khả năng tiacutenh toaacuten lớn caacutec ngocircn ngữ mocirc higravenh mocirc phỏng ứng dụng vagrave caacutec bộ tạo DSS
Bản chất caacutec thocircng tin
Trigravenh bagravey thocircng tin được phaacutet sinh trước về quaacute khứ vagrave hiện tại tạo caacutec thocircng tin mới về quaacute khứ hiện tại tương lai
Tạo thocircng tin mới về quaacute khứ hiện tại tương lai
62 Lịch sử EIS- EIS xuất hiện lần đầu tiecircn tại MIT vagraveo những năm 1970
- Những EIS đầu tiecircn được phaacutet triển bởi caacutec doanh ngiệp lớn sẵn sagraveng chấp nhận rủi ro để đạt được lợi thế cạnh tranh
- Vagraveo những năm 1980 caacutec nhagrave cung cấp đatilde phaacutet triển một số cơ sở khaacutech hagraveng rộng vagrave cocircng nghệ EIS được tiếp tục phaacutet triển cho đến ngagravey nay
(Tagravei liệu thecircm Sử dụng DSSEIS cho phaacutet triển bền vững + Một số nghiecircn cứu đatilde được tiến hagravenh để kiểm tra việc thực hiện của EIS trong khu vực cocircng cộng vagrave chiacutenh phủ caacutec nước tổ chức kể từ khi chuacuteng được phaacutet triển theo định hướng lợi nhuận cho caacutec cocircng ty tư nhacircn (Hasan vagrave Hasan năm 1997) Theo một nghiecircn cứu tiến hagravenh tại Mỹ ở hơn 300 cocircng ty kết quả cho thấy sự khaacutec biệt của EIS giữa tư nhacircn vagrave chiacutenh phủ một số kết quả thuacute vị được phaacutet hiệnViacute dụ khoacute khăn hơn để chuyển tiền từ một tagravei khoản khaacutec trong một EIS của chiacutenh phủ cũng lagrave khoacute khăn hơn để biện giải thiacutech cho những chi phiacute phaacutet triển EIS của chiacutenh phủ Một nghiecircn cứu khaacutec được tiến hagravenh ở Australia
cho thấy rằng EIS cung cấp cho quản lyacute một higravenh ảnh chiacutenh xaacutec hơn về tổ chức thực hiện vagrave cung cấp hỗ trợ cho caacutec lợi iacutech chiến lược cải thiện khocircng chỉ cho caacutec nhagrave quản lyacute nhưng cograven cho phần cograven lại của tổ chức Dựa trecircn caacutec hệ thống được thiết kế cho caacutec cocircng ty tư nhacircn với một caacutech rotilde ragravengxaacutec định mục tiecircu EIS lagrave thiacutech hợp cho caacutec tổ chức cocircng cộng hiện đại nhưng cần phải được linh hoạt hơn vagrave kết thagravenh chugravem một phạm vi rộng hơn khả năng vagrave phương tiện hơn so với khu vực tư nhacircn ban đầu theo định hướng sản phẩm (Hasan vagrave Hasan năm 1997) Điều nagravey coacute thể lagrave do thực tế rằng caacutec hoạt động khu vực cocircng lagrave bắt buộc coacute taacutec động rộng phải đaacutep ứng sự mong đợi duy nhất cocircng cộng thường coacute mục tiecircu mơ hồ vagrave macircu thuẫn iacutet quyền tự chủ vagrave kiểm soaacutet việc ra quyết định vagrave nhacircn viecircn lagrave khoacute khăn hơn (Watson vagrave Carte2000) + Toacutem lại EIS lagrave một khaacutei niệm thagravenh cocircng noacute phaacutet triển qua nhiều năm tuy nhiecircn EIS khắc phục khiếm khuyết của migravenh bằng caacutech tiến hagravenh nghiecircn cứu liecircn tục)
63 Tại sao những người điều hagravenh hagraveng đầu lại khaacutec nhau- Họ lagrave những doanh nghiệp theo định hướng coacute suy nghĩ
- Coacute một khoảng khocircng gian rộng để kiểm soaacutet
- Họ chịu traacutech nhiệm cho việc thiết lập chiacutenh saacutech
- Họ đại diện cho tổ chức mocirci trường becircn ngoagravei
- Hagravenh động của họ tạo ra những kết quả đaacuteng kể về tagravei chiacutenh vagrave con người
Tần số caacutec hoạt động điều hagravenh- Xử lyacute xaacuteo trộn 42
- Hoạt động kinh doanh 32
- Phacircn bổ nguồn lực 17
- Đagravem phaacuten 3
- Những điều khaacutec 6
Handling Disturbances 42
Entrepreneurial Activites 32
Resource Allocation 17
Negotiation 3
Other 6
Những thocircng tin điều hagravenh cần thiết- Quản lyacute xaacuteo trộn coacute thể yecircu cầu sự chuacute yacute xung quanh đồng hồ
- Hoạt động kinh doanh yecircu cầu điều hagravenh để dự đoaacuten những thay đổi trong mocirci trường
- Nhiệm vụ phacircn bổ tagravei nguyecircn yecircu cầu lựa chọn người quản lyacute vagrave caacutec nguồn lực hạn chế được triển khai
- Đagravem phaacuten yecircu cầu cập nhật thocircng tin từng phuacutet để coacute thể xacircy dựng được sự đồng thuận
Caacutec loại thocircng tin điều hagravenh- Hệ thống kế toaacuten coacute liecircn quan đến việc tiacutenh toaacuten thu nhập hoạt động cho caacutec lĩnh
vực cụ thể lagrave quan trọng hơn so với caacutec hệ thống kế toaacuten truyền thocircng- Thocircng tin về thị trường khaacutech hagraveng cung cấp giaacute trị trong việc quyết định chiến
lược- Caacutec thocircng tin cần thiết thường được truyền đi trecircn một số hệ thống maacutey tiacutenh vagrave
nằm trong toagraven tổ chức- Caacutec thocircng tin được sử dụng thường lagrave ngắn hạn vagrave dễ thay đổi
Phương thức để xaacutec định thocircng tin cần thiết
Rockart xaacutec định được năm phương thức cơ bản để xaacutec định thocircng tin cần thiết
- Phương thức dựa trecircn kết quả- Phương thức rỗng- Phương thức chỉ số khoacutea- Phương thức tổng hợp nghiecircn cứu- Phương thức dựa vagraveo nhacircn tố then chốt dẫn đến thagravenh cocircng
64 Thagravenh phần EIS
- Sản phẩm EIS đầu tiecircn được phaacutet triển để sử dụng trecircn maacutey tiacutenh cấu higravenh cao nhưng caacutec sản phẩm hiện nay nhằm mục tiecircu lagrave nền tảng ClientServer
- Những nền tảng linh hoạt hơn coacute thể thiacutech ứng với thay đổi trong tổ chức vagrave cocircng nghệ
- Sử dụng dữ liệu thời gian thực dẫn đến quyết định nhanh hơn nhiều thocircng tin hơn
Thagravenh phần phần cứng- Một EIS khocircng đogravei hỏi coacute phần cứng cụ thể hoặc duy nhất nagraveo- Chigravea khoacutea của vấn đề lagrave để đảm bảo rằng caacutec thagravenh phần của EIS tối ưu hoacutea vagrave
phugrave hợp với tagravei nguyecircn maacutey tiacutenh của tổ chức- Hệ thống nagravey phải được cấu higravenh để caacutec nguồn tagravei nguyecircn phugrave hợp với những
người điều hagravenh chuacuteng
Thagravenh phần phần mềm- Traacutei ngược với phần cứng phần mềm thường được chuyecircn mocircn hoacutea cao cho caacutec
bagravei toaacuten về miền- Sự chuyecircn mocircn hoacutea nagravey thường đạt được bằng caacutech sử dụng thagravenh phần off-the-
shelf cho toagraven bộ EIS vagrave caacutec mocirc-đun tugravey chỉnh để đaacutep ứng nhu cầu cụ thể- Lotus Notes lagrave một viacute dụ điển higravenh Noacute coacute thể được sử dụng một migravenh hoặc coacute
thể phục vụ becircn thứ ba mocirc-đun plug-in
Cocircng nghệ EIS hiện nay
Dobrzeniecki đề xuấtphacircn loạitừng cấptheo bachức năng- Loại 1 sản phẩm bao gồmmột bộ đầy đủcaacutec ứng dụngtừ mộtnhagrave cung cấp- Loại 2 sản phẩm đượcthựchiệnở phần đầu củacaacutecsản phẩmDSS đượcphaacutet triển
bởicugravengmộtnhagrave cung cấp- Loại 3 sản phẩmkết hợp với nhautheo bất kỳ số lượngthuộc sở hữu củacocircng ty
65 Xacircy dựng EIS
- Xacircy dựngmộtEISgiống nhưxacircydựngmột số hệ thống khaacutec củamocirc higravenh hệ thống thocircng tin
- Việcphaacutet triểncấu truacutecnecircn được theo dotildeitừ quaacute trigravenh thiết kế đến quaacute trigravenhthực hiện
- Tuy nhiecircn một dự aacuten phaacutet triển EIScoacute xu hướnglagrave thống nhấtvagraveyecircu cầu hỗ trợ caacutec nhagrave quản lyacute latildenh đạo
- Xacircy dựng một EIScoacute thểphaacutet hiện ra đượccaacutectigravenh huống khoacute khănmagravemột nhagrave phaacutet triển chưabao giờ gặp phải
Mocirc higravenh EIS
Khung phaacutet triển một EIS
- Watson et al đề nghị xacircy dựngkhung với ba thagravenh phần+ Caacutech tiếp cận tập trung vagraveo yếu tốcon người vagrave dữ liệu coacute liecircn quan đến EIS+ Quaacute trigravenh phaacutet triển cần sự linh hoạt vagrave tương taacutec+ Người sử dụng - hệ thống hộp thoại bao gồm một ngocircn ngữ hagravenh động để xử lyacute caacutec lệnh
Lợi iacutech của EIS- Dễ duy trigrave caacutec mục tiecircu coacute tổ chức- Dễ truy xuất thocircng tin- Cho pheacutep người sử dụng nacircng cao hiệu suất hơn
- Tăng chất lượng ra quyết định- Cung cấp sự cải tiến cạnh tranh- Tiết kiệm thời gian của người sử dụng- Tăng khả năng vagrave chất lượng giao tiếp- Cung cấp khả năng điều khiển tốt hơn trong tổ chức- Cho pheacutep tham gia caacutec vấn đề vagrave caacutec cơ hội- Cho pheacutep hoạch định- Cho pheacutep tigravem kiếm nguyecircn nhacircn của một vấn đề- Thảo matilden caacutec yecircu cầu của người điều hagravenh
Hạn chế của EIS vagrave 1 số sai lầm cần traacutenh
- Chi phiacute một cuộc khảo saacutetnăm1991 chothấychi phiacute phaacutet triểntrungbigravenh365000USDvớichi phiacute vận hagravenhhagraveng năm lagrave$200000 (EIS)
- Cocircng nghệ hạn chếEIScần phảiđượctiacutech hợp hoagraven toagravenvagraveokiếntruacuteccủadoanh nghiệphiện tại do đoacute noacutelagrave một thaacutech thứclớn đối vớithiết kế
- Hạn chế tổ chức cơ cấu tổ chứccoacute thể khocircng phugrave hợp
Sự hạn chế về tổ chức- Chương trigravenh nghị sự vagrave thời gian chệch EIS mocirc tả một phần việc thực hiện một
chương trigravenh nghị sự vagrave coacute thể dễ dagraveng đạt được sự tin cậy một caacutech chắc chắn- Đồng bộ hoacutea việc quản lyacute sự tin cậy đuacuteng luacutec đặc biệt baacuteo caacuteo EIS coacute thể phaacute
vỡ sự ổn định thiết lập caacutec chu trigravenh baacuteo caacuteo một caacutech tốt nhất- Sự bất ổn EIS phản ứng nhanh coacute thể gacircy ra việc taacutec động trở lại một caacutech
nhanh choacuteng dẫn đến sự thiếu ổn định trong tổ chức
Sự thất bại lagrave thay thế khocircng thể chấp nhận được- Một số yếu tố lagravem EIS thất bại
+ Thiếu sự hỗ trợ về mặt quản lyacute+ Vấn đề chiacutenh trị+ Thất bại của nhagrave phaacutet triển+ Lỗi về cocircng nghệ+ Giaacute cả+ Thời gian
66 Ra quyết định điều hagravenh trong tương lai vagrave EIS
- Coacute một vagravei điều kiện sẽ được hợp nhất cho việc chuyển đổi cocircng nghệ Trong đoacute một vagravei điều kiện coacute thể dễ dự đoaacuten Hai điều kiện magrave ta coacute thể thấy lagrave+ Phaacutet triển cocircng nghệ maacutey tiacutenh trong việc điều hagravenh sẽ tạo ra sự chuyển đổi được chấp nhận một caacutech dễ dagraveng hơn+ Mở rộng traacutech nhiệm điều hagravenh sẽ mở rộng nhu cầu thocircng tin
Tương lai của EIS- EIS thocircng minh Những tiến bộ trong cocircng nghệ AI sẽ được triển khai trong caacutec
EIS- EIS đa phương tiện Cơ sở dữ liệu đa phương tiện sẽ cho pheacutep tiacutech hợp văn bản
giọng noacutei vagrave higravenh ảnh trong tương lai- EIS thocircng tin Tương lai EIS sẽ mở rộng hơn trong việc sử dụng dữ liệu becircn
ngoagravei doanh nghiệp- EIS kết nối Giao tiếp với băng thocircng rộng cho pheacutep kết nối liecircn thocircng lớn hơn
Chương 7 HỆ CHUYEcircN GIA VAgrave TRIacute TUỆ NHAcircN TẠO
71 Caacutec khaacutei niệm
72 Triacute thocircng minh của triacute tuệ nhacircn tạo
73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia
74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia
75 Lợi iacutech vagrave hạn chế của hệ chuyecircn gia
71 Caacutec khaacutei niệm
Chuyecircn mocircn (Expertise) sự hiểu biết rộng trong 1 lĩnh vực hẹp
Hệ chuyecircn gia (Expert Systems)1 chương trigravenh maacutey tiacutenh sử dụng 1 tập caacutec luật dựa trecircn tri thức của con người để giải quyết caacutec vấn đề đogravei hogravei phải coacute sự chuyecircn mocircn
Một số hệ chuyecircn gia nổi tiếng
DENDRAL (Standford 1960s Edward Feigenbaum)
MYCIN (Standford1970s Edward Shortliffe)
PROSPECTOR (MIT 1979)
Triacute tuệ nhacircn tạo (Artificial Intelligence ndash AI)
Triacute tuệ nhacircn tạo một bộ phacircn của ngagravenh khoa học maacutey tiacutenh quan tacircm đến việc thiết kế caacutec hệ thống maacutey tiacutenh thocircng minh đoacute lagrave caacutec hệ thống đưa ra caacutec đặc điểm magrave từ đoacute chuacuteng ta liecircn hệ với sự thocircng minh trong hagravenh động của con người (Barr vagrave Feigenbaum 1981)
Mục điacutech của AI
Mục điacutech khoa học xaacutec định caacutec gợi yacute để giải thiacutech caacutec loại khaacutec nhau của triacute tuệ thực
Mục điacutech kỹ thuật giải quyết caacutec vấn đề trong thế giới thực
Triacute tuệ nhacircn tạo kế thừa nhiều yacute tưởng quan điểm kỹ thuật từ caacutec ngagravenh khoa học khaacutec
- Triết học
- Logic Toaacuten học
- Tiacutenh toaacuten
- Khoa học tacircm lyacute Khoa học nhận thức
- Sinh học Thần kinh học
- Tiến hoacutea
Caacutec lĩnh vực ứng dụng trong Triacute tuệ nhacircn tạo
Mạng nơ ron thần kinh (Neural Networks)
Tiacutenh toaacuten sự tiến hoacutea
(Evolutionary Computation)
Hệ chuyecircn gia (Expert Systems)
Kỹ thuật xử lyacute tiếng noacutei (Speech Processing)
Kỹ thuật xử lyacute ngocircn ngữ tự nhiecircn
(Natural Language Processing)
Lập kế hoạch (Planning)
Robot (Robotics)
Khoa học higravenh ảnh (Vision)
Caacutec kỹ thuật thocircng dụng dugraveng trong AI
Biểu diễn(Representation)
Học (Learning)
Caacutec luật (Rules)
Tigravem kiếm (Search)
72 Triacute thocircng minh của triacute tuệ nhacircn tạo
Con người suy diễn như thế nagraveo
Phacircn loại (Categorization)
Caacutec quy tắc cụ thể
Heuristics
Kinh nghiệm trước đoacute
Dự tiacutenh trước
Maacutey tiacutenh suy diễn như thế nagraveo
Lập luận dựa trecircn luật IF-THEN mocirc tả tri thức được matilde hoacutea dưới dạng caacutec luật
Caacutec khung (Frames) lagrave caacutec đại diện mocirc tả caacutec tigravenh huống giống nhau lagrave điển higravenh của một vagravei phacircn loại
Lập luận dựa trecircn caacutec trường hợp mocirc phỏng giải phaacutep trước đoacute cho một vấn đề hiện tại
Nhận dạng mẫu phaacutet hiện acircm thanh higravenh dạng hoặc caacutec chuỗi dagravei
Caacutec dạng khaacutec của Triacute tuệ nhacircn tạo
Học maacutey- mạng nơron vagrave giải thuật di truyền
Lập trigravenh tự động ndash lagrave những kỹ thuật tạo ra caacutec chương trigravenh để lagravem 1 nhiệm vụ riecircng biệt (cho pheacutep những người khocircng phải lagrave người lập trigravenh coacute thể lập trigravenh được)
Cuộc sống nhacircn tạo ndash nỗ lực để taacutei tạo caacutec hiện tượng sinh học trong caacutec hệ thống dựa trecircn maacutey tiacutenh
73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia(Expert Systems- ES)
Theo Jackson (1999) Một hệ chuyecircn gia lagrave một chương trigravenh maacutey tiacutenh mocirc tả vagrave suy diễn với tri thức của một vagravei lĩnh vực để giải quyết vấn đề hay đưa ra caacutec lời khuyecircn
Cấu truacutec cơ bản của ES được dựa theo cấu truacutec chung của DSS Sự khaacutec biệt chiacutenh giữa ES vagraveDSS lagrave hệ ES thu thập caacutec kiến thức từ những
chuyecircn gia trong lĩnh vực quan tacircmĐặc trưng của hệ chuyecircn gia Hiệu quả cao Thời gian trả lời thỏa đaacuteng Độ tin cậy cao Dễ hiểu
Giao diện người dugraveng trong ES
Thiết kế giao diện người dugraveng tập trung vagraveo caacutec yếu tố như dễ dagraveng sử dụngcoacute độ tin cậy cao giảm tải những khoacute khăn khi sử dụng
Thiết kế necircn coacute một số tương taacutec (đầu vagraveo kiểm soaacutet vagrave truy vấn)
Cấu tạo giao diện người dugraveng gồm coacute magraven higravenh cảm ứng bagraven phiacutem buacutet saacuteng lệnh thoại caacutec phiacutem chuyecircn dụng
Cơ sở tri thức (Knowledge Base)
Chứa đựng caacutec tri thức cụ thể miền thu được từ caacutec chuyecircn gia miền
Coacute thể chứa caacutec mocirc tả caacutec hagravenh vi giải quyết vấn đề caacutec ragraveng buộc caacutec heuristics
Thagravenh cocircng của một ES dựa trecircn tiacutenh đầy đủ vagrave tiacutenh chiacutenh xaacutec của cơ sở tri thức
Mocirc tơ suy diễn (Inference Engine)
Ở đacircy tri thức được đặt để sử dụng tạo ra caacutec giải phaacutep để giải quyết vấn đề
Mocirc tơ nagravey coacute khả năng thực hiện diễn dịch hoặc suy diễn dựa trecircn caacutec luật hay caacutec caacutec sự kiện
Đồng thời cũng coacute khả năng sử dụng caacutec suy diễn mờ hay khocircng chiacutenh xaacutec dựa trecircn xaacutec suất hay aacutenh xạ mẫu
Vograveng điều khiển suy diễn
1 Aacutenh xạ caacutec luật với caacutec sự kiện đatilde được cho
2 Chọn luật để thực hiện
3 Thực hiện luật bằng caacutech thecircm caacutec sự kiện được suy diễn ra vagraveo bộ nhớ lagravem việc
Chuỗi suy diễn (Chaining)
Suy diễn tiến (forward chaining) maacutey suy diễn bắt đầu từ dữ liệu ban đầu vagrave thực hiện việc suy luận để đưa ra caacutec kết luận cuối cugraveng
Suy diễn lugravei (backward chaining) maacutey suy diễn bắt đầu từ dữ liệu điacutech vagrave tigravem ra tri thức hỗ trợ cho dữ liệu điacutech đoacute
Viacute dụ suy diễn lugravei
R1 Nếu coacute A vagrave B thigrave suy ra coacute D
R2 Nếu coacute B thigrave suy ra coacute C
R3 Nếu coacute C vagrave D thigrave suy ra coacute E
Ta coacute E ta xem trong 3 luật R1 R2 R3 luật nagraveo coacute E ta thấy R3 chứa E đồng thời chứa C vagrave D Xeacutet tiếp trong 2 luật R1 R2 luật nagraveo chứa C vagrave D R2 chứa C R3 chứa D Từ đoacute ta coacute được caacutec tri thức hỗ trợ suy diễn vagrave kết luận lagrave nếu coacute A vagrave B thigrave sẽ coacute E Hay nếu A vagrave B đuacuteng thigrave sẽ coacute E
Viacute dụ suy diễn tiến
Giả sử coacute tập chứa 3 luật sau
R1 Nếu coacute A vagrave B thigrave suy ra coacute D
R2 Nếu coacute B thigrave suy ra coacute C
R3 Nếu coacute C vagrave D thigrave suy ra coacute E
Nếu ta coacute A vagrave B thigrave chuacuteng ta suy ra được D từ R1 vagrave suy ra C từ R2 Với D vagrave C đatilde được suy ra ở trecircn giờ chuacuteng ta suy ra được E từ R3
Viacute dụ thực tế
Giả sử muốn biết magraveu của một con vật nuocirci tecircn lagrave Fred biết rằng noacute kecircu ộp ộp vagrave ăn ruồi
Coacute tập 4 luật ban đầu như sau
R1 Nếu X kecircu ộp ộp vagrave ăn ruồi thigrave X lagrave con ếch
R2 Nếu X kecircu chiecircm chiếp vagrave biết hoacutet thigrave X lagrave con chim
R3 Nếu X lagrave con ếch thigrave X coacute magraveu xanh
R4 Nếu X lagrave con chim thigrave X coacute magraveu vagraveng
74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia
Expert system shells lagrave một tập caacutec goacutei phần mềm vagrave caacutec cocircng cụ dugraveng để phaacutet triển caacutec hệ chuyecircn gia
Những Expert system shells đầu tiecircn thường rất rườm ragrave Mặc dugrave vậy noacute vẫn giuacutep cho người sử dụng sẽ khocircng phải bắt đầu lại từ đầu khi xacircy dựng một hệ chuyecircn gia mới
Những shell hiện đại bao gồm hai mocirc-đun chiacutenh lagrave cocircng cụ xacircy dựng một tập quy tắc vagrave mocirc tơ suy diễn
Xacircy dựng hệ chuyecircn gia
Bước 1 xacircy dựng mocirc higravenh bagravei toaacuten xaacutec định vấn đề nhiệm vụ magrave hệ thống sẽ thực hiện Caacutec dạng bagravei toaacuten cần hệ chuyecircn gia
Bagravei toaacuten diễn giải (InterPretation)
Bagravei toaacuten dự baacuteo (Prediction)
Bagravei toaacuten chuẩn đoaacuten (Diagnose)
Bagravei toaacuten gỡ rối (Debugging)
Bagravei toaacuten thiết kế
Tương tự như một dự aacuten phần mềm để xacircy dựng một hệ chuyecircn gia cần phải coacute caacutec yếu tố về nhacircn lực tagravei nguyecircn vagrave thời gian Những yếu tố nagravey ảnh hưởng đến giaacute thah của một hệ chuyecircn giaTrong phần nagravey cacircu hỏi thường được đặt ra lagrave tại sao cần phải xacircy dựng một hệ chuyecircn giaTrước khi bắt đầu phải xaacute định rotilde bagravei toaacuten đạt ra lagrave jiAi lagrave chuyecircn giaAi lagrave người sử dụng
1 Diễn giải (InterPretation) Nghiecircn cứu 1 vấn đề -gt Dựa trecircn những biểu hiện thuộc tiacutenh đặc trưng becircn ngoagravei -gt Tư vấn
(hoặc đưa ra kết luận hay mocirc tả dễ hiểu từ tập dữ liệu thocirc)
2 Bagravei toaacuten dự baacuteo (Prediction) Coacute thể dự đoaacuten được hagravenh vi kết quả dựa trecircn caacutec hiện tượng -gt dự baacuteo
VD Dự baacuteo thời tiết động đấthellip
3 Bagravei toaacuten chẩn đoaacuten (Diagnoss) Xaacutec định caacutec lỗi caacutec bộ phận hỏng hoacutec của hệ thống dựa trecircn caacutec dữ liệu quan saacutet được
4 Bagravei toaacuten gỡ rối (Debugging) Mocirc tả caacutec phương phaacutep khắc phục hệ thống khi gặp sự cố
5 Bagravei toaacuten thiết kế Lựa chọn cấu higravenh caacutec đối tượng nhằm thoả matilden một số ragraveng buộc nagraveo đoacute
6 Giảng dạy Phần mềm dạy học coacute thể chuẩn đoaacuten vagrave sủa lỗi của học sinh trong quaacute trigravenh học tập
Để xaacutec định đuacuteng bagravei toaacuten magrave chuacuteng ta cần giải quyết thigrave phải trả lời đc một số cacircu hỏi
- cần hệ chuyecircn gia
Bước 2 thu thập tri thức lựa chọn cocircng cụ vagrave aacutep dụng
Trong bước thu thập tri thức vấn đề quan trọng lagrave lựa chọn chuyecircn gia những người magrave sẽ đoacuteng goacutep tri thức cho hệ thống Thocircng thường trong suốt quaacute trigravenh phaacutet triển thigrave chuyecircn gia được xem như một thagravenh viecircn của đội phaacutet triển
Hiện nay coacute rất nhiều cocircng cụ để xacircy dựng một hệ chuyecircn gia Phổ biến nhất lagrave JESS CLIPS vagrave OPS5
Bước 3 Thiết kế cơ sở tri thức thiết kế hệ thốngTri thức được biểu diễn trường minh trong cơ sở tri thức
Caacutec chuyecircn gia vagrave kỹ sư tri thức sẽ đối thoại với nhau bằng caacutec kỹ thuật đối thoại Suy diễn (SD) bảng Mocirc higravenh hoacutea SD quy nạp phacircn loại
Vấn đề bagraveo trigrave vagrave phaacutet triển
Caacutec hệ chuyecircn gia đogravei hỏi phải bảo trigrave vagrave phaacutet triển nhiều hơn so với caacutec hệ thống khaacutec Phải thường xuyecircn bổ sung tri thức mới vagrave thay đổi caacutec tri thức cũ để đổi mới hệ chuyecircn gia
Thu thập vagrave khắc phục lỗi do người sử dụng phaacutet hiện để kịp thời khắc phục những sai soacutet của hệ chuyecircn gia
75 Lợi iacutech vagrave hạn chế của caacutec hệ chuyecircn gia
Một số lợi iacutech chiacutenh
Thời gian trả lời hợp lyacute bằng hoặc nhanh hơn so với chuyecircn gia (người) để đi đến cugraveng một quyết định Hệ chuyecircn gia lagrave một hệ thống thời gian thực (real time system)
Khả năng trả lời với mức độ tinh thocircng bằng hoặc cao hơn so với chuyecircn gia (người) trong cugraveng lĩnh vực
Hệ chuyecircn gia giuacutep cho hiệu quả lagravem việc tăng bằng việc sử dụng tập caacutec luật một caacutech nhanh choacuteng magrave ko bị nhầm lẫn chuyecircn gia lagrave người coacute thể quecircn đi một số tri thức cơ sở lyacute luậ nhưng HCG thigrave ko
Quyết định của một người chuyecircn gia coacute thể bị thay đổi vagrave ko coacute tiacutenh thống nhất như quyết định của một hệ chuyecircn gia tạo ra
Hệ chuyecircn gia giuacutep cho người sử dụng coacute thể trau dồi sự hiểu biết trecircn lĩnh vuej cụ thể magrave noacute giải quyết hỗ trợ người ra quyết định coacute trigravenh độ như 1 chuyecircn gia trong quaacute trigravenh gia quyết định
Kiến thức của rất nhiều chuyecircn gia về một lĩnh vực nagraveo đoacute được đưa vagraveo hệ chuyecircn gia lagravem cho CSTT cuat HCG phong phuacute vagrave rộng lớn hơn rất nhiều
HCG giải thiacutech caacutec bước suy luận một caacutech dễ hiểu nhất quaacuten luacutec nagraveo cũng coacute thể sử dụng ko như chuyecircn gia con người
Hạn chế của caacutec hệ chuyecircn gia
Nhược điểm lớn nhất của hệ chuyecircn gia lagrave những yacute kiến chuyecircn mocircn thường rất khoacute matilde hoacutea vagrave giải neacuten
Hệ chuyecircn gia khocircng coacute khả năng tự học tự cập nhật kiến thức mới như caacutec chuyecircn gia magrave cần phải được matilde hoacutea lại khi noacute được cập nhật
Hệ chuyecircn gia khocircng thể nhận ra được vấn đề khocircng nằm trong miền kiến thức của hệ thống
Chương 8 Tri thức vagrave tiếp nhận
1 Bao gồm caacutec vấn đề
Dữ liệu thực tế đo lường hoặc quan saacutet coacute hoặc khocircng coacute bối cảnh
Thocircng tin dữ liệu được tổng hợp một caacutech hữu iacutech để giải quyết những khoacute khăn trong việc đưa ra quyết định
Tri thức bao gồm caacutec ứng dụng quy tắc thocircng tin hướng dẫn của người ra quyết định
2 Những caacutei nhigraven về tri thức
Đại diện lagravem thế nagraveo để diễn tả tri thức viacute dụ như một quyển saacutech khocircng phải lagrave tri thức nhưng noacute lại lagrave một đại diện của tri thức
Sản xuất tri thức lagrave một tập hơp của hagraveng tồn kho coacute thể được sản xuất cũng như mua lại
Tri thức lagrave 1 trong 6 trạng thaacutei của hệ thống
1Dữ liệu 2Thocircng tin 3Cấu truacutec thocircng tin 4Sự thấu hiểu 5Yacute kiến 6 Quyết định
3 Caacutec loại tri thức Phổ biến mocirc tả dữ liệu thocircng tin thủ tục mọi thứ lagravem như thế nagraveo lập luận chiacutenh saacutech hoặc caacutec quy tắc
4 Thu thập Tri thức hệ chuyecircn gia Hầu hết caacutec phương phaacutep đều bắt đầu với mocirc higravenh của caacutec taacutec vụ trong đoacute
hệ chuyecircn gia được xacircy dựng Trong đoacute mocirc tả về caacutec lĩnh vực được tạo ra Caacutec kỹ sư sử dụng caacutec mocirc higravenh giả thuyết vagrave nhận thức về quaacute trigravenh phacircn
tiacutech để gợi ra caacutech giải quyết vấn đề về tri thức từ caacutec chuyecircn gia
5 Caacutec chiều của thu thập tri thức KE- driven caacutec kỹ sư trao đổi trực tiếp với caacutec chuyecircn gia Expert-driven Caacutec chuyecircn gia trực tiếp đưa chuyecircn mocircn của họ vagraveo hệ
thống maacutey tiacutenh Machine-driven Sử dụng caacutec cocircng cụ suy luận để triacutech xuất tri thức từ một
tập caacutec viacute dụ
6 Kỹ thuật thu thập tri thức Trao đổi gồm 2 loại cơ bản lagrave coacute cấu truacutec(coacute kịch bản) vagrave khocircng coacute cấu
truacutec( đối thoại trực tiếp) Giao thức phacircn tiacutech bằng lời Khi caacutec chuyecircn gia thực hiện một cocircng việc
của họ thigrave một bản ghi về cocircng việc đoacute được thực hiện Caacutec kỹ sư sẽ xacircy dựng mocirc higravenh cho những gigrave được ghi lại trong bản ghi
Phương phaacutep sagraveng lọc caacutec chuyecircn gia so saacutenh caacutec nhoacutem liecircn tiếp trong ba đối tượng vagrave cho biết tại sao nhoacutem thứ hai lại khaacutec nhoacutem thứ ba
7 Thu thập tri thức từ nhiều nguồn Thu thập tri thức từ nhiều nguồn lagrave cần thiết để coacute được đầy đủ caacutec tri thức
cho một vấn đề quan điểm yacute kiến traacutei ngược nhau thường phaacutet sinh Phương phaacutep đồng thuận sẽ giuacutep giải quyết được vấn đề macircu thuẫn Kỹ thuật phacircn tiacutech Meta lagrave kỹ thuật được aacutep dụng trong caacutec trường hợp
khaacutec Caacutech tiếp cận bằng định lượng đogravei hỏi caacutec kỹ sư cần cacircn nhắc yếu tố đầu vagraveo của caacutec chuyecircn gia khaacutec nhau
8 Xaacutec nhận hợp lệ vagrave kiểm tra tri thức Một khi thu thập tri thức noacute phải được đaacutenh giaacute về khả năng sử dụng vagrave độ
chiacutenh xaacutec Hai vấn đề cụ thể lagrave hiệu lực của những kiến thức vagrave kiểm tra việc xacircy dựng cơ sở của tri thức
Cần xaacutec nhận xem liệu hệ thống coacute thể hoạt động ở mức độ tối thiểu khocircng
Xaacutec minh liecircn quan đến việc so saacutenh từng chi tiết kỹ thuật của hệ thống những gigrave đatilde được thực hiện cuối cugraveng
9 Một số caacutec biện phaacutep xaacutec nhận Độ chiacutenh xaacutec Khả năng thiacutech nghi Mức độ đầy đủ Bề rộng Độ sacircu Hiệu lực Tổng quan Chiacutenh xaacutec Hiện thực Độ tin cậy Tiacutenh hữu dụng Mức độ
Chương 9 Học maacutey
1 Logic mờ vagrave ngocircn ngữ mờ(Fuzzy Logic and Linguistic Ambiguity)
Ngocircn ngữ tự nhiecircn gồm những khaacutei niệm mơ hồ vagrave khocircng chiacutenh xaacutectruyền tải ngữ nghĩa thocircng qua tiacutenh xấp xỉkhocircng rotilde ragraveng
Những xấp xỉ nagravey giuacutep con người coacute thể truyền tải hết được yacute nghĩa nhưng maacutey thigrave khocircng hiểu
Lagravem sao biểu diễn caacutec tri thức sử dụng caacutec khaacutei niệm khocircng rotilde ragraveng(mờ) hoặc khocircng chiacutenh xaacutec
2 Khaacutei niệm cơ bản của logic mờ tập mờ lagrave những tập hợp khocircng coacute một giới hạn rotilde Mỗi phần tử của noacute chỉ
chứa một mức độ hagravem liecircn thuộc của từng phần tử Vigrave vậy tập mờ khocircng giống như tập cổ điển Tập mờ coacute thể kết hợp với nhau qua những luật mờ magrave đặc trưng cho những hagravenh động trạng thaacutei vagrave thuộc tiacutenh của logic mờ được tận dụng khi thực hiện một bộ điều khiển mờ
Logic mờ dựa trecircn yacute tưởng mỗi phần tử thuộc vagraveo một tập hợp ở một mức độ nagraveo đấy
Locircgic mờ cho pheacutep độ liecircn thuộc (microA )coacute giaacute trị trong khoảng (01) Locircgic mờ coacute thể được coi lagrave mặt ứng dụng của lyacute thuyết tập mờ để xử lyacute caacutec
giaacute trị trong thế giới thực cho caacutec bagravei toaacuten phức tạp
3 So saacutenh tiacutenh đuacuteng đắn logic mờ vagrave xaacutec suất Xaacutec suất thigrave đề cập đến khả năng xảy ra một biến cố hay một điều gigrave đoacute Logic mờ đề cập đến cấp độ magrave đặc tiacutenh ở hiện tại
o viacute dụ1 người coacute chiều cao 6 feet thigrave coacute cấp độ lagrave 05 về chiều cao
4 Ưu điểm của logic mờ Caacutech tiếp cận rất tự nhiecircnkhocircng phức tạp Coacute thể mocirc higravenh hoacutea caacutec hagravem phi tuyến tugravey yacute phức tạp
Coacute thể tận dụng được kinh nghiệm từ những chuyecircn gia hagraveng đầu trong mọi lĩnh vực
Logic mờ được xacircy dựng dựa trecircn ngocircn ngữ tự nhiecircnNền tảng của logic mờ lagrave dựa trecircn cơ sở giao tiếp của con người
5 Nhược điểm của logic mờ Trong 1 hệ thống phức tạpsử dụng logic mờ coacute thể trở thagravenh trở ngại cho
việc xaacutec thực độ tin cậy của hệ thống Cơ chế lập luận mờ khocircng thể học hỏi từ những lỗi sai
6 Mạng noron nhacircn tạo(ANN) Mạng noron nhacircn tạo lagrave một mocirc phỏng xử lyacute thocircng tinđược nghiecircn cứu ra
từ hệ thống thần kinh của sinh vậtgiống như bộ natildeo để xử lyacute thocircng tin ANNs lagrave chương trigravenh dựa trecircn maacutey tiacutenh đơn giản coacute chức năng lagrave một mocirc
higravenh bagravei toaacuten khocircng gian dựa trecircn thử nghiệm vagrave baacuteo lỗi
7 Học từ kinh nghiệm Tiến trigravenh Một mẫu dữ liệu được biểu diễn như một mạng lưới noronANN ldquodự
đoaacutenrdquo 1 đầu radự đoaacuten được so saacutenh với giaacute trị thực tế hoặc giaacute trị chiacutenh xaacutecNếu đoaacuten được chiacutenh xaacutec thigrave khocircng coacute hagravenh động nagraveo được thực hiện
Nếu dự đoaacuten sai ANN kiểm tra lại vagrave xaacutec định lại thocircng số để điều chỉnh Một mẫu dữ liệu khaacutec được biểu diễn vagrave quaacute trigravenh nagravey được lặp lại
8 Nguyecircn tắc cơ bản của cocircng nghệ nơron Caacutec yếu tố xử lyacute cơ bản trong hệ thống thần kinh của con người lagrave tế bagraveo
thần kinhMạng lưới của tế bagraveo nagravey lagrave liecircn kết với nhau nhận được thocircng tin từ caacutec cảm biến trong mắt taihellip
Thocircng tin nhận được bởi tế bagraveo thần kinh hoặc lagrave sẽ kiacutech thiacutech noacute(sẽ được chuyển qua 1 thocircng điệp dọc theo mạng lưới) hoặc lagrave sẽ ngăn cản noacute(ngăn cản dograveng thocircng tin)
Độ nhạy coacute thể thay đổi qua thời gian hoặc sau khi coacute được kinh nghiệm
9 Cấu truacutec mạng Một ANN gồm 3 lớp cơ bản
Lớp đầu vagraveo nhận dữ liệu Lớp becircn trong hoặc lagrave lớp ẩn xử lyacute dữ liệu Lớp đầu ra chuyển tiếp kết quả cuối cugraveng của mạng
10Mạng nơ ron Thường coacute nhiều đầu vagraveo mỗi đầu vagraveo với mức ảnh hưởng vagrave tầm quan
trọng riecircng của noacute Một đầu vagraveo quan trọng coacute thể được sử dụng để khuếch đại đầu ra caacutec hagravem trạng thaacutei tổng hợp caacutec trọng số của caacutec yếu tố
đầuvagraveo khaacutec nhauvagraveo một giaacute trị duy nhất Caacutec hagravem chuyển giao xử lyacute caacutec giaacute trị trạng thaacutei vagrave tạo đầu ra
11Huấn luyện mạng nơ ron Trong mocirc higravenh coacute giaacutem saacutetANN được đến so saacutenh dự đoaacuten của chiacutenh
noacute với thocircng tin phản hồi coacute chứa caacutec kết quả mong muốn ANN sẽ phải tigravem caacutech thay đổi caacutec tham số becircn trong củamigravenh (caacutec trọng số vagrave caacutec ngưỡng) để tạo necircn một aacutenh xạ coacute khả năng aacutenh xạcaacutec đầu vagraveo thagravenh caacutec đầu ra mong muốn Sự thay đổi nagravey được tiến hagravenh nhờ việc so saacutenh giữa đầu ra thực sự vagrave đầu ra mong muốn
Trong mocirc higravenh khocircng coacute giaacutem saacutetANN nhận được dữ liệu vagraveo nhưng khocircng phải coacute bất kỳ thocircng tin phản hồi về kết quả mong muốn
Phần lớn caacutec ứng dụng nằm trong vugraveng của caacutec bagravei toaacuten ước lượng như mocirc higravenh hoacuteathống kecirc neacuten lọc phacircn cụm
12Lợi iacutech Liecircn kết với mạng noron Traacutenh caacutech lập trigravenh tường minh Giảm nhu cầu của chuyecircn gia ANNs thigrave thiacutech nghi với caacutec yếu tố đầu vagraveo thay đổi Khocircng cần thiết cho cơ sở tri thức tinh chế ANNs coacute tiacutenh động vagrave cải thiện với việc sử dụng Coacute khả năng xử lyacute dữ liệu khocircng chiacutenh xaacutec hoặc khocircng đầy đủ Cho pheacutep tổng quaacutet hoacutea từ thocircng tin cụ thể Cho pheacutep thu thập cảm giaacutec thocircng thường vagraveo miền giải quyết vấn đề
13Hạn chế của việc liecircn kết với mạng noron ANNs khocircng thể giải thiacutech được suy luận Bản chất hộp đen thường khiến cho vấn đề traacutech nhiệm vagrave độ tin cậy phaacutet
sinh lagrave khoacute khăn Lặp đi lặp lại quaacute trigravenh huấn luyện rất tốn thời gian Nguồn lực caacutec nhagrave phacircn tiacutech vagrave thiết kế coacute tay nghề cao vẫn lagrave đaacuteng lo
ngại Cocircng nghệ ANN thuacutec đẩy hạn chế của phần cứng hiện tại ANN yecircu cầu phải coacute sự tin tưởng ở đầu ra
14Giới thiệu về thuật toaacuten di truyền Cũng như mạng lưới thần kinh caacutec thuật toaacuten di truyền được dựa trecircn lyacute
thuyết sinh học Thuật toaacuten di truyền tigravem thấy nguồn gốc của chuacuteng trong caacutec lyacute thuyết
tiến hoacutea của chọn lọc tự nhiecircn vagrave thiacutech ứng với biến đổi khiacute hậu Kết quả thuật toaacuten di truyền lagrave từ giao phối 2 caacute thể trong quần thế để tạo
ra con caacutei đocirci khi tốt hơn so với bậc cha mẹ của chuacuteng 15Caacutec thagravenh phần cơ bản của thuật toaacuten di truyền
Toaacuten tử chọn lọc Caacutec caacute thể tốt được chọn lọc để đưa vagraveo thế hệ sau Sự chọn lọc nagravey căn cứ vagraveo độ thiacutech nghi với mocirci trường của mỗi caacute thể
Toaacuten tử lai gheacutep (crossover) Hai caacute thể cha vagrave mẹ trao đổi caacutec gen với nhau để tạo ra caacute thể con
Toaacuten tử đột biến (mutation) Một caacute thể thay đổi một số gen để biến đổi thagravenh một caacute thể mớiTất cả caacutec toaacuten tử trecircn khi thực hiện đều mang tiacutenh ngẫu nhiecircn
16Quaacute trigravenh cơ bản của một thuật toaacuten di truyền Khởi tạo
Đaacutenh giaacute quần thể
Lựa chọn NST thiacutech hợp nhất vagrave loại bỏ NST yếu nhất
Quy trigravenh giao nhau vagrave cải thiện quần thể
đột biến tiến trigravenh để khaacutem phaacute ra NST mới
17Ưu nhược điểm của việc kết hợp với thuật toaacuten di truyền Kiacutech thước quần thể lagrave 1 yếu tố quan trọng trong tốc độ của việc tigravem
kiếmnhưng noacute tương đối dễ dagraveng để dự đoaacuten tốc độ nagravey Giao nhau hoặc đột biến lagrave khocircng necircn đc sử dụng quaacute thường xuyecircn Luocircn coacute được iacutet nhất 1 giải phaacutep hợp lyacute Necircn coacute thể aacutep dụng chuacuteng cho caacutec vấn đề magrave chuacuteng ta khocircng coacute hướng
về caacutech giải quyết Sức mạnh của thuật toaacuten xuất phaacutet từ khaacutei niệm đơn giảnkhocircng phải từ
một thủ tục thuật toaacuten phức tạp 18Tương lai của học maacutey
Mạng lưới thần kinh nhacircn tạo vượt quaacute năng lực của con người trong caacutec trường hợp bị cocirc lập
Về mặt lyacute thuyếtmột maacutey tiacutenh coacute thể xử lyacute dũ liệu nhanh hơn hagraveng triệu lần so với 1 con người
May mắn thay cho chuacuteng tacon người tốt hơn nhiều khi magrave coacute được dữ liệumaacutey tiacutenh khocircng coacute 1 số thứ như lagrave 5 giaacutec quan
CHƯƠNG 10 KHO DỮ LIỆU
1 Kho dữ liệu Kho dữ liệu lagrave tuyển tập caacutec cơ sở dữ liệu tiacutech hợp hướng chủ đề được
thiết kế để trợ giuacutep cho một hệ hỗ trợ quyết định
Theo John Ladley Cocircng nghệ kho dữ liệu lagrave tập caacutec phương phaacutep kỹ thuật vagrave caacutec cocircng cụ coacute thể kết hợp hỗ trợ nhau để cung cấp thocircng tin cho người sử dụng trecircn cơ sở tiacutech hợp từ nhiều nguồn dữ liệu nhiều mocirci trường khaacutec nhau
Kho dữ liệu thường rất lớn tới hagraveng trăm GB hay thậm chiacute hagraveng Terabyte
2 Kho dữ liệu vận hagravenh (ODS) Một kho dữ liệu vận hagravenh Aacutep dụng kỹ thuật kho dữ liệu vagraveo caacutec hệ xử
lyacute giao taacutec lưu trữ dữ liệu cho một ứng dụng đặc thugrave Noacute đưa vagraveo kho dữ liệu một dograveng caacutec dữ liệu thocirc được thiết kế
3 So saacutenh
Kho dữ liệu vận hagravenh Kho dữ liệu
Dữ liệu theo chủ đề Dữ liệu theo chủ đề
Dữ liệu tiacutech hợp Dữ liệu tiacutech hợp
Dữ liệu thay đổi Dữ liệu khocircng thay đổi
Dữ liệu được cập nhật khi thay đổi
Dữ liệu giữ nguyecircn
Chỉ coacute dữ liệu hiện tạiDữliệu hiện tại vagrave dữ liệu lịch sử
Chu kỳ lagravem tươi dữ liệu ngắn Chu kỳ lagravem tươi dữ liệu dagravei
Chỉ coacute dữ liệu chi tiết Dữ liệu chi tiết vagrave dữ liệu tổng kết
Dugraveng cho caacutec quyết định ngắn hạn
Dugraveng cho hoạch định dagravei hạn
4 Kho dữ liệu cục bộ (Data Mart - DM)
Kho dữ liệu cục bộ lagrave CSDL coacute những đặc điểm giống với kho dữ liệu nhưng với quy mocirc nhỏ hơn vagrave lưu trữ dữ liệu về một lĩnh vực một chuyecircn ngagravenh
Data mart phụ thuộc Chứa những dữ liệu được lấy từ DW vagrave những dữ liệu nagravey sẽ được triacutech lọc vagrave tinh chế tiacutech hợp lại ở mức cao hơn để phục vụ một chủ đề nhất định của Datamart
Data mart độc lập Khocircng giống như Datamart phụ thuộc Data mart độc lập được xacircy dựng trước DW vagrave dữ liệu được trực tiếp lấy từ caacutec nguồn khaacutec nhau
5 Siecircu dữ liệu Metadata lagrave dữ liệu để mocirc tả dữ liệu Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột
một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi Metadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu
6 Mocirci trường kho dữ liệu Hệ thống của tổ chức vagrave kho cung cấp dữ liệu để xacircy dựng kho dữ liệu Trong quaacute trigravenh chuyển dữ liệu từ caacutec nguồn khaacutec nhau dữ liệu coacute thể
được lagravem sạch hoặc chuyển đổi vagrave vigrave thế DW được xem như lagrave một chuẩn cho việc lưu trữ
Đồng thời siecircu dữ liệu được ghi lại Cuối cugraveng DW hoặc siecircu thị coacute thể được sử dụng để tạo ra một kho dữ
liệu ldquocaacute nhacircnrdquo 7 Caacutec đặc điểm của kho dữ liệu
Đặc điểm Mocirc tả
Hướng chủ đề - DL tổ chức theo caacutech thức người dugraveng tham chiếu
Tiacutech hợp - Dữ liệu ldquosạchrdquo loại bỏ tiacutenh thiếu nhất quaacuten
Khocircng thay đổi - DL ldquochỉ đọcrdquo người dugraveng khocircng thay đổi được
Chuỗi thời gian - DL lagrave chuỗi thời gian khocircng phải lagrave trạng thaacutei hiện tại
Được tổng kết - DL vận hagravenhthao taacutec khi cần thiết
được kết hợp lại thagravenh dạng coacute thể dugraveng được cho quyết định
Kiacutech cỡ lớn hơn - Lưu giữ theo chuỗi thời gian tức lagrave giữ lại nhiều DL
Khocircng được chuẩn hoacutea - Coacute thể dư thừa DLSiecircu dữ liệu - Dữ liệu của dữ liệu được lưu trữNguồn dữ liệu - DL vận hagravenh (caacutec hệ sẵn coacute) cugraveng
với caacutec nguồn ngoagravei 8 Kho dữ liệu hướng chủ đề
Hướng chủ để coacute nghĩa lagrave kho dữ liệu được tổ chức xung quanh caacutec chủ đề chiacutenh như khaacutech hagraveng sản phẩm sản xuất Tập trung vagraveo việc mocirc higravenh hoacutea vagrave phacircn tiacutech dữ liệu cho caacutec nhagrave ra quyết định magrave khocircng tập trung vagraveo caacutec xử lyacute thocircng thường Cung cấp cho người dugraveng một khung nhigraven toagraven vẹn đơn giản vagrave đầy đủ về caacutec sự kiện quanh caacutec chủ đề
9 Dữ liệu trong DW được tiacutech hợp Dữ liệu trong kho dữ liệu được xacircy dựng bằng caacutech tổng hợp dữ liệu từ
nhiều nguồn khaacutec nhau vagrave caacutec nguồn coacute tổ chức khaacutec nhau Cơ sở dữ liệu caacutec file excel caacutec flat file hoặc caacutec raw file Khi đưa vagraveo kho dữ liệu caacutec dữ liệu được lagravem sạch vagrave tiacutech hợp dữ liệu nhằm đảm bảo tiacutenh nhất quaacuten của dữ liệu
10Kiến truacutec kho dữ liệu Tầng cơ sở dữ liệu hoạt động Tầng truy xuất thocircng tin Tầng truy xuất dữ liệu Tầng siecircu dữ liệu Tầng quản lyacute tiến trigravenh Tầng thocircng điệp của ứng dụng Tầng vật liacute của kho dữ liệu Tầng trigravenh diễn dữ liệu
11Higravenh trạng kho dữ liệu Kho dữ liệu ảo - người dugraveng cuối coacute thể truy cập trực tiếp đến kho dữ liệu
sử dụng caacutec cocircng cụ cho pheacutep ở tầng truy xuất dữ liệu Kho dữ liệu trung tacircm-1 cơ sở dữ liệu vật lyacute chứa tất cả dữ liệu cho một
vugraveng chuyecircn dụng nagraveo đoacute
Kho dữ liệu phacircn taacuten- Thagravenh phần được phacircn taacuten qua nhiều hệ cơ sở dữ liệu vật lyacute
12METADATA- Siecircu dữ liệu Định nghĩa Siecircu dữ liệu lagrave dữ liệu về dữ liệu Lagrave 1 lưu trữ dugraveng để
Miecircu tả kho dữ liệu tổng thể Nhận dạng kiểu kho dữ liệu Quản liacute quaacute trigravenh tiacutech hợp dữ liệu Quản liacute quaacute trigravenh cập nhật kho dữ liệu Quản liacute bảo mật
Lagrave chigravea khoacutea quyết định sự thagravenh cocircng của kho dữ liệu luocircn được thay đổi vagrave cập nhật theo sự phaacutet triển của kho dữ liệu
Dugraveng để quản liacute điều khiển kho dữ liệu Sự ra đời của kho dữ liệu như 1 cấu truacutec hỗ trợ ra quyết định siecircu dữ liệu
được xem như nguồn tagravei nguyecircn dữ liệu Siecircu dữ liệu lagrave trừu tượng Chuacuteng lagrave dữ liệu bậc cao cung cấp mocirc tả ngắn
gọn caacutec dữ liệu bậc thấp hơn 13Hoạt động của Siecircu dữ liệu
Siecircu dữ liệu rất cần thiết trong việc chuyển hoacutea thocircng tin trở thagravenh tri thức Lagrave chigravea khoacutea giuacutep chuacuteng ta xử lyacute được dữ liệu thocirc Viacute dụ một dograveng dữ liệu baacuten hagraveng 1023 K596 11121 agraveNoacute sẽ khocircng coacute nghĩa gigrave cho đến khi chuacuteng ta đưa vagraveo siecircu dữ liệu (thư
mục chứa dữ liệu) agrave cửa hagraveng 1023 sản phẩm K596 vagrave số tiền baacuten được lagrave 11121 đocirc la
14Sự cần thiết phải nhất quaacuten trong kho dữ liệu Kho dữ liệu được xacircy dựng cho lợi iacutech của những nhagrave phacircn tiacutech kinh
doanh caacutec nhagrave quản trị cho tất cả caacutec khu vực chức năng Trong cơ sở dữ liệu riecircng caacutec khu vực khaacutec nhau coacute thể định nghĩa vagrave lưu
trữ dữ liệu thocircng qua phiecircn bản của chiacutenh noacute Khi dữ liệu được lấy từ những vugraveng khaacutec nhau đoacute vagrave được đặt vagraveo kho dữ
liệu Việc chuyển đổi vagrave lagravem sạch caacutec tiến trigravenh sẽ đảm bảo noacute lagrave duy nhất được tiacutech hợp tại một mức của tổ chức
15Ragrave soaacutet lại dữ liệu ndash Thực thi siecircu dữ liệu
Bất kể cấu truacutec tự nhiecircn của 1 cacircu truy vấn thế nagraveo thigrave caacutec thagravenh phần của siecircu dữ liệu rất quan trọng đối với người ra quyết định
Bảng thuộc tiacutenh khoacutea được lưu trữ bởi kho dữ liệu Tập hợp dữ liệu được lấy từ đacircu Những chuyển đổi nagraveo được thực thi với việc lagravem sạch
16Siecircu dữ liệu lagrave gigrave Metadata - lagrave thocircng tin mocirc tả nội dung của cơ sở dữ liệu (CSDL) Metadata baacuteo cho người dugraveng biết thời gian cập nhật sau cugraveng của dữ liệu
định dạng vagrave mục điacutech sử dụng của noacute Những thocircng tin nagravey coacute thể hướng dẫn người dugraveng duyệt qua CSDL vagrave
giuacutep họ hiểu được yacute nghĩa vagrave ngữ cảnh của dữ liệu Trong CSDL metadata lagrave caacutec dạng biểu diễn khaacutec nhau của caacutec đối tượng
trong CSDL Trong CSDL quan hệ metadata lagrave caacutec định nghĩa của bảng cột CSDL
view vagrave nhiều đối tượng khaacutec Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột
một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi -gtMetadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu
Bảng chuyển đổi Ghi lại những chuyển đổi đatilde được thực hiện
Lịch sử thực thi Ghi lại những dữ liệu đatilde được
phacircn tiacutech
Higravenh thaacutei kết nốiGhi lại những dữ liệu được kết nối vagrave tần suất
17Aacutenh xạ thocircng thường của siecircu dữ liệu Bản ghi aacutenh xạ chuyển đổi bao gồm
Định danh của nguồn gốc Chuyển đổi thuộc tiacutenh Chuyển đổi thuộc tiacutenh vật lyacute Matilde hoacutea tham chiếu bảng chuyển đổi Đổi tecircn Đổi khoacutea Gaacuten giaacute trị cho thuộc tiacutenh mặc định Chọn logic cho caacutec nguồn nhiều giaacute trị Đổi thuật toaacuten
18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để
phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai
lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave
tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec
Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm
Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo
19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua
caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau
SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được
Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra
một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức
Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ
Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ
Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech
CHƯƠNG 11 KHAI PHAacute DỮ LIỆU
1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn
ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993
Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng
2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd
1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều
2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP
3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn
4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng
5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server
6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo
7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động
8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời
9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều
10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện
11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech
12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP
3 Xử lyacute phacircn tiacutech trực tuyến OLAP
MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave
dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu
ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave
thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu
HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave
ROLAP4 Khai phaacute dữ liệu
Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh
khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn
Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan
5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp
6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại
Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp
Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec
Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt
Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra
Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh
vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho
Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec
Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm
Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục
Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng
gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp
Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn
Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec
Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper
Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2
Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25
Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước
Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng
Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện
trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp
Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute
độ hỗ trợ ge ngưỡng minsup
độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan
Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn
Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết
Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu
MOLAP ROLAP HOLAP
Lưu trữ dữ liệu cơ sở
Khối Bảng quan hệ Bảng quan hệ
Lưu trữ thocircng tin tổng hợp
Khối Bảng quan hệ Khối
Hiệu suất thực hiện truy vấn
Nhanh nhất Chậm nhất Nhanh
Tiecircu thụ khocircng gian lưu trữ
Nhiều Thấp Trung bigravenh
Chi phiacute bảo trigrave Cao Thấp Trung bigravenh
cho thấy rằng EIS cung cấp cho quản lyacute một higravenh ảnh chiacutenh xaacutec hơn về tổ chức thực hiện vagrave cung cấp hỗ trợ cho caacutec lợi iacutech chiến lược cải thiện khocircng chỉ cho caacutec nhagrave quản lyacute nhưng cograven cho phần cograven lại của tổ chức Dựa trecircn caacutec hệ thống được thiết kế cho caacutec cocircng ty tư nhacircn với một caacutech rotilde ragravengxaacutec định mục tiecircu EIS lagrave thiacutech hợp cho caacutec tổ chức cocircng cộng hiện đại nhưng cần phải được linh hoạt hơn vagrave kết thagravenh chugravem một phạm vi rộng hơn khả năng vagrave phương tiện hơn so với khu vực tư nhacircn ban đầu theo định hướng sản phẩm (Hasan vagrave Hasan năm 1997) Điều nagravey coacute thể lagrave do thực tế rằng caacutec hoạt động khu vực cocircng lagrave bắt buộc coacute taacutec động rộng phải đaacutep ứng sự mong đợi duy nhất cocircng cộng thường coacute mục tiecircu mơ hồ vagrave macircu thuẫn iacutet quyền tự chủ vagrave kiểm soaacutet việc ra quyết định vagrave nhacircn viecircn lagrave khoacute khăn hơn (Watson vagrave Carte2000) + Toacutem lại EIS lagrave một khaacutei niệm thagravenh cocircng noacute phaacutet triển qua nhiều năm tuy nhiecircn EIS khắc phục khiếm khuyết của migravenh bằng caacutech tiến hagravenh nghiecircn cứu liecircn tục)
63 Tại sao những người điều hagravenh hagraveng đầu lại khaacutec nhau- Họ lagrave những doanh nghiệp theo định hướng coacute suy nghĩ
- Coacute một khoảng khocircng gian rộng để kiểm soaacutet
- Họ chịu traacutech nhiệm cho việc thiết lập chiacutenh saacutech
- Họ đại diện cho tổ chức mocirci trường becircn ngoagravei
- Hagravenh động của họ tạo ra những kết quả đaacuteng kể về tagravei chiacutenh vagrave con người
Tần số caacutec hoạt động điều hagravenh- Xử lyacute xaacuteo trộn 42
- Hoạt động kinh doanh 32
- Phacircn bổ nguồn lực 17
- Đagravem phaacuten 3
- Những điều khaacutec 6
Handling Disturbances 42
Entrepreneurial Activites 32
Resource Allocation 17
Negotiation 3
Other 6
Những thocircng tin điều hagravenh cần thiết- Quản lyacute xaacuteo trộn coacute thể yecircu cầu sự chuacute yacute xung quanh đồng hồ
- Hoạt động kinh doanh yecircu cầu điều hagravenh để dự đoaacuten những thay đổi trong mocirci trường
- Nhiệm vụ phacircn bổ tagravei nguyecircn yecircu cầu lựa chọn người quản lyacute vagrave caacutec nguồn lực hạn chế được triển khai
- Đagravem phaacuten yecircu cầu cập nhật thocircng tin từng phuacutet để coacute thể xacircy dựng được sự đồng thuận
Caacutec loại thocircng tin điều hagravenh- Hệ thống kế toaacuten coacute liecircn quan đến việc tiacutenh toaacuten thu nhập hoạt động cho caacutec lĩnh
vực cụ thể lagrave quan trọng hơn so với caacutec hệ thống kế toaacuten truyền thocircng- Thocircng tin về thị trường khaacutech hagraveng cung cấp giaacute trị trong việc quyết định chiến
lược- Caacutec thocircng tin cần thiết thường được truyền đi trecircn một số hệ thống maacutey tiacutenh vagrave
nằm trong toagraven tổ chức- Caacutec thocircng tin được sử dụng thường lagrave ngắn hạn vagrave dễ thay đổi
Phương thức để xaacutec định thocircng tin cần thiết
Rockart xaacutec định được năm phương thức cơ bản để xaacutec định thocircng tin cần thiết
- Phương thức dựa trecircn kết quả- Phương thức rỗng- Phương thức chỉ số khoacutea- Phương thức tổng hợp nghiecircn cứu- Phương thức dựa vagraveo nhacircn tố then chốt dẫn đến thagravenh cocircng
64 Thagravenh phần EIS
- Sản phẩm EIS đầu tiecircn được phaacutet triển để sử dụng trecircn maacutey tiacutenh cấu higravenh cao nhưng caacutec sản phẩm hiện nay nhằm mục tiecircu lagrave nền tảng ClientServer
- Những nền tảng linh hoạt hơn coacute thể thiacutech ứng với thay đổi trong tổ chức vagrave cocircng nghệ
- Sử dụng dữ liệu thời gian thực dẫn đến quyết định nhanh hơn nhiều thocircng tin hơn
Thagravenh phần phần cứng- Một EIS khocircng đogravei hỏi coacute phần cứng cụ thể hoặc duy nhất nagraveo- Chigravea khoacutea của vấn đề lagrave để đảm bảo rằng caacutec thagravenh phần của EIS tối ưu hoacutea vagrave
phugrave hợp với tagravei nguyecircn maacutey tiacutenh của tổ chức- Hệ thống nagravey phải được cấu higravenh để caacutec nguồn tagravei nguyecircn phugrave hợp với những
người điều hagravenh chuacuteng
Thagravenh phần phần mềm- Traacutei ngược với phần cứng phần mềm thường được chuyecircn mocircn hoacutea cao cho caacutec
bagravei toaacuten về miền- Sự chuyecircn mocircn hoacutea nagravey thường đạt được bằng caacutech sử dụng thagravenh phần off-the-
shelf cho toagraven bộ EIS vagrave caacutec mocirc-đun tugravey chỉnh để đaacutep ứng nhu cầu cụ thể- Lotus Notes lagrave một viacute dụ điển higravenh Noacute coacute thể được sử dụng một migravenh hoặc coacute
thể phục vụ becircn thứ ba mocirc-đun plug-in
Cocircng nghệ EIS hiện nay
Dobrzeniecki đề xuấtphacircn loạitừng cấptheo bachức năng- Loại 1 sản phẩm bao gồmmột bộ đầy đủcaacutec ứng dụngtừ mộtnhagrave cung cấp- Loại 2 sản phẩm đượcthựchiệnở phần đầu củacaacutecsản phẩmDSS đượcphaacutet triển
bởicugravengmộtnhagrave cung cấp- Loại 3 sản phẩmkết hợp với nhautheo bất kỳ số lượngthuộc sở hữu củacocircng ty
65 Xacircy dựng EIS
- Xacircy dựngmộtEISgiống nhưxacircydựngmột số hệ thống khaacutec củamocirc higravenh hệ thống thocircng tin
- Việcphaacutet triểncấu truacutecnecircn được theo dotildeitừ quaacute trigravenh thiết kế đến quaacute trigravenhthực hiện
- Tuy nhiecircn một dự aacuten phaacutet triển EIScoacute xu hướnglagrave thống nhấtvagraveyecircu cầu hỗ trợ caacutec nhagrave quản lyacute latildenh đạo
- Xacircy dựng một EIScoacute thểphaacutet hiện ra đượccaacutectigravenh huống khoacute khănmagravemột nhagrave phaacutet triển chưabao giờ gặp phải
Mocirc higravenh EIS
Khung phaacutet triển một EIS
- Watson et al đề nghị xacircy dựngkhung với ba thagravenh phần+ Caacutech tiếp cận tập trung vagraveo yếu tốcon người vagrave dữ liệu coacute liecircn quan đến EIS+ Quaacute trigravenh phaacutet triển cần sự linh hoạt vagrave tương taacutec+ Người sử dụng - hệ thống hộp thoại bao gồm một ngocircn ngữ hagravenh động để xử lyacute caacutec lệnh
Lợi iacutech của EIS- Dễ duy trigrave caacutec mục tiecircu coacute tổ chức- Dễ truy xuất thocircng tin- Cho pheacutep người sử dụng nacircng cao hiệu suất hơn
- Tăng chất lượng ra quyết định- Cung cấp sự cải tiến cạnh tranh- Tiết kiệm thời gian của người sử dụng- Tăng khả năng vagrave chất lượng giao tiếp- Cung cấp khả năng điều khiển tốt hơn trong tổ chức- Cho pheacutep tham gia caacutec vấn đề vagrave caacutec cơ hội- Cho pheacutep hoạch định- Cho pheacutep tigravem kiếm nguyecircn nhacircn của một vấn đề- Thảo matilden caacutec yecircu cầu của người điều hagravenh
Hạn chế của EIS vagrave 1 số sai lầm cần traacutenh
- Chi phiacute một cuộc khảo saacutetnăm1991 chothấychi phiacute phaacutet triểntrungbigravenh365000USDvớichi phiacute vận hagravenhhagraveng năm lagrave$200000 (EIS)
- Cocircng nghệ hạn chếEIScần phảiđượctiacutech hợp hoagraven toagravenvagraveokiếntruacuteccủadoanh nghiệphiện tại do đoacute noacutelagrave một thaacutech thứclớn đối vớithiết kế
- Hạn chế tổ chức cơ cấu tổ chứccoacute thể khocircng phugrave hợp
Sự hạn chế về tổ chức- Chương trigravenh nghị sự vagrave thời gian chệch EIS mocirc tả một phần việc thực hiện một
chương trigravenh nghị sự vagrave coacute thể dễ dagraveng đạt được sự tin cậy một caacutech chắc chắn- Đồng bộ hoacutea việc quản lyacute sự tin cậy đuacuteng luacutec đặc biệt baacuteo caacuteo EIS coacute thể phaacute
vỡ sự ổn định thiết lập caacutec chu trigravenh baacuteo caacuteo một caacutech tốt nhất- Sự bất ổn EIS phản ứng nhanh coacute thể gacircy ra việc taacutec động trở lại một caacutech
nhanh choacuteng dẫn đến sự thiếu ổn định trong tổ chức
Sự thất bại lagrave thay thế khocircng thể chấp nhận được- Một số yếu tố lagravem EIS thất bại
+ Thiếu sự hỗ trợ về mặt quản lyacute+ Vấn đề chiacutenh trị+ Thất bại của nhagrave phaacutet triển+ Lỗi về cocircng nghệ+ Giaacute cả+ Thời gian
66 Ra quyết định điều hagravenh trong tương lai vagrave EIS
- Coacute một vagravei điều kiện sẽ được hợp nhất cho việc chuyển đổi cocircng nghệ Trong đoacute một vagravei điều kiện coacute thể dễ dự đoaacuten Hai điều kiện magrave ta coacute thể thấy lagrave+ Phaacutet triển cocircng nghệ maacutey tiacutenh trong việc điều hagravenh sẽ tạo ra sự chuyển đổi được chấp nhận một caacutech dễ dagraveng hơn+ Mở rộng traacutech nhiệm điều hagravenh sẽ mở rộng nhu cầu thocircng tin
Tương lai của EIS- EIS thocircng minh Những tiến bộ trong cocircng nghệ AI sẽ được triển khai trong caacutec
EIS- EIS đa phương tiện Cơ sở dữ liệu đa phương tiện sẽ cho pheacutep tiacutech hợp văn bản
giọng noacutei vagrave higravenh ảnh trong tương lai- EIS thocircng tin Tương lai EIS sẽ mở rộng hơn trong việc sử dụng dữ liệu becircn
ngoagravei doanh nghiệp- EIS kết nối Giao tiếp với băng thocircng rộng cho pheacutep kết nối liecircn thocircng lớn hơn
Chương 7 HỆ CHUYEcircN GIA VAgrave TRIacute TUỆ NHAcircN TẠO
71 Caacutec khaacutei niệm
72 Triacute thocircng minh của triacute tuệ nhacircn tạo
73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia
74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia
75 Lợi iacutech vagrave hạn chế của hệ chuyecircn gia
71 Caacutec khaacutei niệm
Chuyecircn mocircn (Expertise) sự hiểu biết rộng trong 1 lĩnh vực hẹp
Hệ chuyecircn gia (Expert Systems)1 chương trigravenh maacutey tiacutenh sử dụng 1 tập caacutec luật dựa trecircn tri thức của con người để giải quyết caacutec vấn đề đogravei hogravei phải coacute sự chuyecircn mocircn
Một số hệ chuyecircn gia nổi tiếng
DENDRAL (Standford 1960s Edward Feigenbaum)
MYCIN (Standford1970s Edward Shortliffe)
PROSPECTOR (MIT 1979)
Triacute tuệ nhacircn tạo (Artificial Intelligence ndash AI)
Triacute tuệ nhacircn tạo một bộ phacircn của ngagravenh khoa học maacutey tiacutenh quan tacircm đến việc thiết kế caacutec hệ thống maacutey tiacutenh thocircng minh đoacute lagrave caacutec hệ thống đưa ra caacutec đặc điểm magrave từ đoacute chuacuteng ta liecircn hệ với sự thocircng minh trong hagravenh động của con người (Barr vagrave Feigenbaum 1981)
Mục điacutech của AI
Mục điacutech khoa học xaacutec định caacutec gợi yacute để giải thiacutech caacutec loại khaacutec nhau của triacute tuệ thực
Mục điacutech kỹ thuật giải quyết caacutec vấn đề trong thế giới thực
Triacute tuệ nhacircn tạo kế thừa nhiều yacute tưởng quan điểm kỹ thuật từ caacutec ngagravenh khoa học khaacutec
- Triết học
- Logic Toaacuten học
- Tiacutenh toaacuten
- Khoa học tacircm lyacute Khoa học nhận thức
- Sinh học Thần kinh học
- Tiến hoacutea
Caacutec lĩnh vực ứng dụng trong Triacute tuệ nhacircn tạo
Mạng nơ ron thần kinh (Neural Networks)
Tiacutenh toaacuten sự tiến hoacutea
(Evolutionary Computation)
Hệ chuyecircn gia (Expert Systems)
Kỹ thuật xử lyacute tiếng noacutei (Speech Processing)
Kỹ thuật xử lyacute ngocircn ngữ tự nhiecircn
(Natural Language Processing)
Lập kế hoạch (Planning)
Robot (Robotics)
Khoa học higravenh ảnh (Vision)
Caacutec kỹ thuật thocircng dụng dugraveng trong AI
Biểu diễn(Representation)
Học (Learning)
Caacutec luật (Rules)
Tigravem kiếm (Search)
72 Triacute thocircng minh của triacute tuệ nhacircn tạo
Con người suy diễn như thế nagraveo
Phacircn loại (Categorization)
Caacutec quy tắc cụ thể
Heuristics
Kinh nghiệm trước đoacute
Dự tiacutenh trước
Maacutey tiacutenh suy diễn như thế nagraveo
Lập luận dựa trecircn luật IF-THEN mocirc tả tri thức được matilde hoacutea dưới dạng caacutec luật
Caacutec khung (Frames) lagrave caacutec đại diện mocirc tả caacutec tigravenh huống giống nhau lagrave điển higravenh của một vagravei phacircn loại
Lập luận dựa trecircn caacutec trường hợp mocirc phỏng giải phaacutep trước đoacute cho một vấn đề hiện tại
Nhận dạng mẫu phaacutet hiện acircm thanh higravenh dạng hoặc caacutec chuỗi dagravei
Caacutec dạng khaacutec của Triacute tuệ nhacircn tạo
Học maacutey- mạng nơron vagrave giải thuật di truyền
Lập trigravenh tự động ndash lagrave những kỹ thuật tạo ra caacutec chương trigravenh để lagravem 1 nhiệm vụ riecircng biệt (cho pheacutep những người khocircng phải lagrave người lập trigravenh coacute thể lập trigravenh được)
Cuộc sống nhacircn tạo ndash nỗ lực để taacutei tạo caacutec hiện tượng sinh học trong caacutec hệ thống dựa trecircn maacutey tiacutenh
73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia(Expert Systems- ES)
Theo Jackson (1999) Một hệ chuyecircn gia lagrave một chương trigravenh maacutey tiacutenh mocirc tả vagrave suy diễn với tri thức của một vagravei lĩnh vực để giải quyết vấn đề hay đưa ra caacutec lời khuyecircn
Cấu truacutec cơ bản của ES được dựa theo cấu truacutec chung của DSS Sự khaacutec biệt chiacutenh giữa ES vagraveDSS lagrave hệ ES thu thập caacutec kiến thức từ những
chuyecircn gia trong lĩnh vực quan tacircmĐặc trưng của hệ chuyecircn gia Hiệu quả cao Thời gian trả lời thỏa đaacuteng Độ tin cậy cao Dễ hiểu
Giao diện người dugraveng trong ES
Thiết kế giao diện người dugraveng tập trung vagraveo caacutec yếu tố như dễ dagraveng sử dụngcoacute độ tin cậy cao giảm tải những khoacute khăn khi sử dụng
Thiết kế necircn coacute một số tương taacutec (đầu vagraveo kiểm soaacutet vagrave truy vấn)
Cấu tạo giao diện người dugraveng gồm coacute magraven higravenh cảm ứng bagraven phiacutem buacutet saacuteng lệnh thoại caacutec phiacutem chuyecircn dụng
Cơ sở tri thức (Knowledge Base)
Chứa đựng caacutec tri thức cụ thể miền thu được từ caacutec chuyecircn gia miền
Coacute thể chứa caacutec mocirc tả caacutec hagravenh vi giải quyết vấn đề caacutec ragraveng buộc caacutec heuristics
Thagravenh cocircng của một ES dựa trecircn tiacutenh đầy đủ vagrave tiacutenh chiacutenh xaacutec của cơ sở tri thức
Mocirc tơ suy diễn (Inference Engine)
Ở đacircy tri thức được đặt để sử dụng tạo ra caacutec giải phaacutep để giải quyết vấn đề
Mocirc tơ nagravey coacute khả năng thực hiện diễn dịch hoặc suy diễn dựa trecircn caacutec luật hay caacutec caacutec sự kiện
Đồng thời cũng coacute khả năng sử dụng caacutec suy diễn mờ hay khocircng chiacutenh xaacutec dựa trecircn xaacutec suất hay aacutenh xạ mẫu
Vograveng điều khiển suy diễn
1 Aacutenh xạ caacutec luật với caacutec sự kiện đatilde được cho
2 Chọn luật để thực hiện
3 Thực hiện luật bằng caacutech thecircm caacutec sự kiện được suy diễn ra vagraveo bộ nhớ lagravem việc
Chuỗi suy diễn (Chaining)
Suy diễn tiến (forward chaining) maacutey suy diễn bắt đầu từ dữ liệu ban đầu vagrave thực hiện việc suy luận để đưa ra caacutec kết luận cuối cugraveng
Suy diễn lugravei (backward chaining) maacutey suy diễn bắt đầu từ dữ liệu điacutech vagrave tigravem ra tri thức hỗ trợ cho dữ liệu điacutech đoacute
Viacute dụ suy diễn lugravei
R1 Nếu coacute A vagrave B thigrave suy ra coacute D
R2 Nếu coacute B thigrave suy ra coacute C
R3 Nếu coacute C vagrave D thigrave suy ra coacute E
Ta coacute E ta xem trong 3 luật R1 R2 R3 luật nagraveo coacute E ta thấy R3 chứa E đồng thời chứa C vagrave D Xeacutet tiếp trong 2 luật R1 R2 luật nagraveo chứa C vagrave D R2 chứa C R3 chứa D Từ đoacute ta coacute được caacutec tri thức hỗ trợ suy diễn vagrave kết luận lagrave nếu coacute A vagrave B thigrave sẽ coacute E Hay nếu A vagrave B đuacuteng thigrave sẽ coacute E
Viacute dụ suy diễn tiến
Giả sử coacute tập chứa 3 luật sau
R1 Nếu coacute A vagrave B thigrave suy ra coacute D
R2 Nếu coacute B thigrave suy ra coacute C
R3 Nếu coacute C vagrave D thigrave suy ra coacute E
Nếu ta coacute A vagrave B thigrave chuacuteng ta suy ra được D từ R1 vagrave suy ra C từ R2 Với D vagrave C đatilde được suy ra ở trecircn giờ chuacuteng ta suy ra được E từ R3
Viacute dụ thực tế
Giả sử muốn biết magraveu của một con vật nuocirci tecircn lagrave Fred biết rằng noacute kecircu ộp ộp vagrave ăn ruồi
Coacute tập 4 luật ban đầu như sau
R1 Nếu X kecircu ộp ộp vagrave ăn ruồi thigrave X lagrave con ếch
R2 Nếu X kecircu chiecircm chiếp vagrave biết hoacutet thigrave X lagrave con chim
R3 Nếu X lagrave con ếch thigrave X coacute magraveu xanh
R4 Nếu X lagrave con chim thigrave X coacute magraveu vagraveng
74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia
Expert system shells lagrave một tập caacutec goacutei phần mềm vagrave caacutec cocircng cụ dugraveng để phaacutet triển caacutec hệ chuyecircn gia
Những Expert system shells đầu tiecircn thường rất rườm ragrave Mặc dugrave vậy noacute vẫn giuacutep cho người sử dụng sẽ khocircng phải bắt đầu lại từ đầu khi xacircy dựng một hệ chuyecircn gia mới
Những shell hiện đại bao gồm hai mocirc-đun chiacutenh lagrave cocircng cụ xacircy dựng một tập quy tắc vagrave mocirc tơ suy diễn
Xacircy dựng hệ chuyecircn gia
Bước 1 xacircy dựng mocirc higravenh bagravei toaacuten xaacutec định vấn đề nhiệm vụ magrave hệ thống sẽ thực hiện Caacutec dạng bagravei toaacuten cần hệ chuyecircn gia
Bagravei toaacuten diễn giải (InterPretation)
Bagravei toaacuten dự baacuteo (Prediction)
Bagravei toaacuten chuẩn đoaacuten (Diagnose)
Bagravei toaacuten gỡ rối (Debugging)
Bagravei toaacuten thiết kế
Tương tự như một dự aacuten phần mềm để xacircy dựng một hệ chuyecircn gia cần phải coacute caacutec yếu tố về nhacircn lực tagravei nguyecircn vagrave thời gian Những yếu tố nagravey ảnh hưởng đến giaacute thah của một hệ chuyecircn giaTrong phần nagravey cacircu hỏi thường được đặt ra lagrave tại sao cần phải xacircy dựng một hệ chuyecircn giaTrước khi bắt đầu phải xaacute định rotilde bagravei toaacuten đạt ra lagrave jiAi lagrave chuyecircn giaAi lagrave người sử dụng
1 Diễn giải (InterPretation) Nghiecircn cứu 1 vấn đề -gt Dựa trecircn những biểu hiện thuộc tiacutenh đặc trưng becircn ngoagravei -gt Tư vấn
(hoặc đưa ra kết luận hay mocirc tả dễ hiểu từ tập dữ liệu thocirc)
2 Bagravei toaacuten dự baacuteo (Prediction) Coacute thể dự đoaacuten được hagravenh vi kết quả dựa trecircn caacutec hiện tượng -gt dự baacuteo
VD Dự baacuteo thời tiết động đấthellip
3 Bagravei toaacuten chẩn đoaacuten (Diagnoss) Xaacutec định caacutec lỗi caacutec bộ phận hỏng hoacutec của hệ thống dựa trecircn caacutec dữ liệu quan saacutet được
4 Bagravei toaacuten gỡ rối (Debugging) Mocirc tả caacutec phương phaacutep khắc phục hệ thống khi gặp sự cố
5 Bagravei toaacuten thiết kế Lựa chọn cấu higravenh caacutec đối tượng nhằm thoả matilden một số ragraveng buộc nagraveo đoacute
6 Giảng dạy Phần mềm dạy học coacute thể chuẩn đoaacuten vagrave sủa lỗi của học sinh trong quaacute trigravenh học tập
Để xaacutec định đuacuteng bagravei toaacuten magrave chuacuteng ta cần giải quyết thigrave phải trả lời đc một số cacircu hỏi
- cần hệ chuyecircn gia
Bước 2 thu thập tri thức lựa chọn cocircng cụ vagrave aacutep dụng
Trong bước thu thập tri thức vấn đề quan trọng lagrave lựa chọn chuyecircn gia những người magrave sẽ đoacuteng goacutep tri thức cho hệ thống Thocircng thường trong suốt quaacute trigravenh phaacutet triển thigrave chuyecircn gia được xem như một thagravenh viecircn của đội phaacutet triển
Hiện nay coacute rất nhiều cocircng cụ để xacircy dựng một hệ chuyecircn gia Phổ biến nhất lagrave JESS CLIPS vagrave OPS5
Bước 3 Thiết kế cơ sở tri thức thiết kế hệ thốngTri thức được biểu diễn trường minh trong cơ sở tri thức
Caacutec chuyecircn gia vagrave kỹ sư tri thức sẽ đối thoại với nhau bằng caacutec kỹ thuật đối thoại Suy diễn (SD) bảng Mocirc higravenh hoacutea SD quy nạp phacircn loại
Vấn đề bagraveo trigrave vagrave phaacutet triển
Caacutec hệ chuyecircn gia đogravei hỏi phải bảo trigrave vagrave phaacutet triển nhiều hơn so với caacutec hệ thống khaacutec Phải thường xuyecircn bổ sung tri thức mới vagrave thay đổi caacutec tri thức cũ để đổi mới hệ chuyecircn gia
Thu thập vagrave khắc phục lỗi do người sử dụng phaacutet hiện để kịp thời khắc phục những sai soacutet của hệ chuyecircn gia
75 Lợi iacutech vagrave hạn chế của caacutec hệ chuyecircn gia
Một số lợi iacutech chiacutenh
Thời gian trả lời hợp lyacute bằng hoặc nhanh hơn so với chuyecircn gia (người) để đi đến cugraveng một quyết định Hệ chuyecircn gia lagrave một hệ thống thời gian thực (real time system)
Khả năng trả lời với mức độ tinh thocircng bằng hoặc cao hơn so với chuyecircn gia (người) trong cugraveng lĩnh vực
Hệ chuyecircn gia giuacutep cho hiệu quả lagravem việc tăng bằng việc sử dụng tập caacutec luật một caacutech nhanh choacuteng magrave ko bị nhầm lẫn chuyecircn gia lagrave người coacute thể quecircn đi một số tri thức cơ sở lyacute luậ nhưng HCG thigrave ko
Quyết định của một người chuyecircn gia coacute thể bị thay đổi vagrave ko coacute tiacutenh thống nhất như quyết định của một hệ chuyecircn gia tạo ra
Hệ chuyecircn gia giuacutep cho người sử dụng coacute thể trau dồi sự hiểu biết trecircn lĩnh vuej cụ thể magrave noacute giải quyết hỗ trợ người ra quyết định coacute trigravenh độ như 1 chuyecircn gia trong quaacute trigravenh gia quyết định
Kiến thức của rất nhiều chuyecircn gia về một lĩnh vực nagraveo đoacute được đưa vagraveo hệ chuyecircn gia lagravem cho CSTT cuat HCG phong phuacute vagrave rộng lớn hơn rất nhiều
HCG giải thiacutech caacutec bước suy luận một caacutech dễ hiểu nhất quaacuten luacutec nagraveo cũng coacute thể sử dụng ko như chuyecircn gia con người
Hạn chế của caacutec hệ chuyecircn gia
Nhược điểm lớn nhất của hệ chuyecircn gia lagrave những yacute kiến chuyecircn mocircn thường rất khoacute matilde hoacutea vagrave giải neacuten
Hệ chuyecircn gia khocircng coacute khả năng tự học tự cập nhật kiến thức mới như caacutec chuyecircn gia magrave cần phải được matilde hoacutea lại khi noacute được cập nhật
Hệ chuyecircn gia khocircng thể nhận ra được vấn đề khocircng nằm trong miền kiến thức của hệ thống
Chương 8 Tri thức vagrave tiếp nhận
1 Bao gồm caacutec vấn đề
Dữ liệu thực tế đo lường hoặc quan saacutet coacute hoặc khocircng coacute bối cảnh
Thocircng tin dữ liệu được tổng hợp một caacutech hữu iacutech để giải quyết những khoacute khăn trong việc đưa ra quyết định
Tri thức bao gồm caacutec ứng dụng quy tắc thocircng tin hướng dẫn của người ra quyết định
2 Những caacutei nhigraven về tri thức
Đại diện lagravem thế nagraveo để diễn tả tri thức viacute dụ như một quyển saacutech khocircng phải lagrave tri thức nhưng noacute lại lagrave một đại diện của tri thức
Sản xuất tri thức lagrave một tập hơp của hagraveng tồn kho coacute thể được sản xuất cũng như mua lại
Tri thức lagrave 1 trong 6 trạng thaacutei của hệ thống
1Dữ liệu 2Thocircng tin 3Cấu truacutec thocircng tin 4Sự thấu hiểu 5Yacute kiến 6 Quyết định
3 Caacutec loại tri thức Phổ biến mocirc tả dữ liệu thocircng tin thủ tục mọi thứ lagravem như thế nagraveo lập luận chiacutenh saacutech hoặc caacutec quy tắc
4 Thu thập Tri thức hệ chuyecircn gia Hầu hết caacutec phương phaacutep đều bắt đầu với mocirc higravenh của caacutec taacutec vụ trong đoacute
hệ chuyecircn gia được xacircy dựng Trong đoacute mocirc tả về caacutec lĩnh vực được tạo ra Caacutec kỹ sư sử dụng caacutec mocirc higravenh giả thuyết vagrave nhận thức về quaacute trigravenh phacircn
tiacutech để gợi ra caacutech giải quyết vấn đề về tri thức từ caacutec chuyecircn gia
5 Caacutec chiều của thu thập tri thức KE- driven caacutec kỹ sư trao đổi trực tiếp với caacutec chuyecircn gia Expert-driven Caacutec chuyecircn gia trực tiếp đưa chuyecircn mocircn của họ vagraveo hệ
thống maacutey tiacutenh Machine-driven Sử dụng caacutec cocircng cụ suy luận để triacutech xuất tri thức từ một
tập caacutec viacute dụ
6 Kỹ thuật thu thập tri thức Trao đổi gồm 2 loại cơ bản lagrave coacute cấu truacutec(coacute kịch bản) vagrave khocircng coacute cấu
truacutec( đối thoại trực tiếp) Giao thức phacircn tiacutech bằng lời Khi caacutec chuyecircn gia thực hiện một cocircng việc
của họ thigrave một bản ghi về cocircng việc đoacute được thực hiện Caacutec kỹ sư sẽ xacircy dựng mocirc higravenh cho những gigrave được ghi lại trong bản ghi
Phương phaacutep sagraveng lọc caacutec chuyecircn gia so saacutenh caacutec nhoacutem liecircn tiếp trong ba đối tượng vagrave cho biết tại sao nhoacutem thứ hai lại khaacutec nhoacutem thứ ba
7 Thu thập tri thức từ nhiều nguồn Thu thập tri thức từ nhiều nguồn lagrave cần thiết để coacute được đầy đủ caacutec tri thức
cho một vấn đề quan điểm yacute kiến traacutei ngược nhau thường phaacutet sinh Phương phaacutep đồng thuận sẽ giuacutep giải quyết được vấn đề macircu thuẫn Kỹ thuật phacircn tiacutech Meta lagrave kỹ thuật được aacutep dụng trong caacutec trường hợp
khaacutec Caacutech tiếp cận bằng định lượng đogravei hỏi caacutec kỹ sư cần cacircn nhắc yếu tố đầu vagraveo của caacutec chuyecircn gia khaacutec nhau
8 Xaacutec nhận hợp lệ vagrave kiểm tra tri thức Một khi thu thập tri thức noacute phải được đaacutenh giaacute về khả năng sử dụng vagrave độ
chiacutenh xaacutec Hai vấn đề cụ thể lagrave hiệu lực của những kiến thức vagrave kiểm tra việc xacircy dựng cơ sở của tri thức
Cần xaacutec nhận xem liệu hệ thống coacute thể hoạt động ở mức độ tối thiểu khocircng
Xaacutec minh liecircn quan đến việc so saacutenh từng chi tiết kỹ thuật của hệ thống những gigrave đatilde được thực hiện cuối cugraveng
9 Một số caacutec biện phaacutep xaacutec nhận Độ chiacutenh xaacutec Khả năng thiacutech nghi Mức độ đầy đủ Bề rộng Độ sacircu Hiệu lực Tổng quan Chiacutenh xaacutec Hiện thực Độ tin cậy Tiacutenh hữu dụng Mức độ
Chương 9 Học maacutey
1 Logic mờ vagrave ngocircn ngữ mờ(Fuzzy Logic and Linguistic Ambiguity)
Ngocircn ngữ tự nhiecircn gồm những khaacutei niệm mơ hồ vagrave khocircng chiacutenh xaacutectruyền tải ngữ nghĩa thocircng qua tiacutenh xấp xỉkhocircng rotilde ragraveng
Những xấp xỉ nagravey giuacutep con người coacute thể truyền tải hết được yacute nghĩa nhưng maacutey thigrave khocircng hiểu
Lagravem sao biểu diễn caacutec tri thức sử dụng caacutec khaacutei niệm khocircng rotilde ragraveng(mờ) hoặc khocircng chiacutenh xaacutec
2 Khaacutei niệm cơ bản của logic mờ tập mờ lagrave những tập hợp khocircng coacute một giới hạn rotilde Mỗi phần tử của noacute chỉ
chứa một mức độ hagravem liecircn thuộc của từng phần tử Vigrave vậy tập mờ khocircng giống như tập cổ điển Tập mờ coacute thể kết hợp với nhau qua những luật mờ magrave đặc trưng cho những hagravenh động trạng thaacutei vagrave thuộc tiacutenh của logic mờ được tận dụng khi thực hiện một bộ điều khiển mờ
Logic mờ dựa trecircn yacute tưởng mỗi phần tử thuộc vagraveo một tập hợp ở một mức độ nagraveo đấy
Locircgic mờ cho pheacutep độ liecircn thuộc (microA )coacute giaacute trị trong khoảng (01) Locircgic mờ coacute thể được coi lagrave mặt ứng dụng của lyacute thuyết tập mờ để xử lyacute caacutec
giaacute trị trong thế giới thực cho caacutec bagravei toaacuten phức tạp
3 So saacutenh tiacutenh đuacuteng đắn logic mờ vagrave xaacutec suất Xaacutec suất thigrave đề cập đến khả năng xảy ra một biến cố hay một điều gigrave đoacute Logic mờ đề cập đến cấp độ magrave đặc tiacutenh ở hiện tại
o viacute dụ1 người coacute chiều cao 6 feet thigrave coacute cấp độ lagrave 05 về chiều cao
4 Ưu điểm của logic mờ Caacutech tiếp cận rất tự nhiecircnkhocircng phức tạp Coacute thể mocirc higravenh hoacutea caacutec hagravem phi tuyến tugravey yacute phức tạp
Coacute thể tận dụng được kinh nghiệm từ những chuyecircn gia hagraveng đầu trong mọi lĩnh vực
Logic mờ được xacircy dựng dựa trecircn ngocircn ngữ tự nhiecircnNền tảng của logic mờ lagrave dựa trecircn cơ sở giao tiếp của con người
5 Nhược điểm của logic mờ Trong 1 hệ thống phức tạpsử dụng logic mờ coacute thể trở thagravenh trở ngại cho
việc xaacutec thực độ tin cậy của hệ thống Cơ chế lập luận mờ khocircng thể học hỏi từ những lỗi sai
6 Mạng noron nhacircn tạo(ANN) Mạng noron nhacircn tạo lagrave một mocirc phỏng xử lyacute thocircng tinđược nghiecircn cứu ra
từ hệ thống thần kinh của sinh vậtgiống như bộ natildeo để xử lyacute thocircng tin ANNs lagrave chương trigravenh dựa trecircn maacutey tiacutenh đơn giản coacute chức năng lagrave một mocirc
higravenh bagravei toaacuten khocircng gian dựa trecircn thử nghiệm vagrave baacuteo lỗi
7 Học từ kinh nghiệm Tiến trigravenh Một mẫu dữ liệu được biểu diễn như một mạng lưới noronANN ldquodự
đoaacutenrdquo 1 đầu radự đoaacuten được so saacutenh với giaacute trị thực tế hoặc giaacute trị chiacutenh xaacutecNếu đoaacuten được chiacutenh xaacutec thigrave khocircng coacute hagravenh động nagraveo được thực hiện
Nếu dự đoaacuten sai ANN kiểm tra lại vagrave xaacutec định lại thocircng số để điều chỉnh Một mẫu dữ liệu khaacutec được biểu diễn vagrave quaacute trigravenh nagravey được lặp lại
8 Nguyecircn tắc cơ bản của cocircng nghệ nơron Caacutec yếu tố xử lyacute cơ bản trong hệ thống thần kinh của con người lagrave tế bagraveo
thần kinhMạng lưới của tế bagraveo nagravey lagrave liecircn kết với nhau nhận được thocircng tin từ caacutec cảm biến trong mắt taihellip
Thocircng tin nhận được bởi tế bagraveo thần kinh hoặc lagrave sẽ kiacutech thiacutech noacute(sẽ được chuyển qua 1 thocircng điệp dọc theo mạng lưới) hoặc lagrave sẽ ngăn cản noacute(ngăn cản dograveng thocircng tin)
Độ nhạy coacute thể thay đổi qua thời gian hoặc sau khi coacute được kinh nghiệm
9 Cấu truacutec mạng Một ANN gồm 3 lớp cơ bản
Lớp đầu vagraveo nhận dữ liệu Lớp becircn trong hoặc lagrave lớp ẩn xử lyacute dữ liệu Lớp đầu ra chuyển tiếp kết quả cuối cugraveng của mạng
10Mạng nơ ron Thường coacute nhiều đầu vagraveo mỗi đầu vagraveo với mức ảnh hưởng vagrave tầm quan
trọng riecircng của noacute Một đầu vagraveo quan trọng coacute thể được sử dụng để khuếch đại đầu ra caacutec hagravem trạng thaacutei tổng hợp caacutec trọng số của caacutec yếu tố
đầuvagraveo khaacutec nhauvagraveo một giaacute trị duy nhất Caacutec hagravem chuyển giao xử lyacute caacutec giaacute trị trạng thaacutei vagrave tạo đầu ra
11Huấn luyện mạng nơ ron Trong mocirc higravenh coacute giaacutem saacutetANN được đến so saacutenh dự đoaacuten của chiacutenh
noacute với thocircng tin phản hồi coacute chứa caacutec kết quả mong muốn ANN sẽ phải tigravem caacutech thay đổi caacutec tham số becircn trong củamigravenh (caacutec trọng số vagrave caacutec ngưỡng) để tạo necircn một aacutenh xạ coacute khả năng aacutenh xạcaacutec đầu vagraveo thagravenh caacutec đầu ra mong muốn Sự thay đổi nagravey được tiến hagravenh nhờ việc so saacutenh giữa đầu ra thực sự vagrave đầu ra mong muốn
Trong mocirc higravenh khocircng coacute giaacutem saacutetANN nhận được dữ liệu vagraveo nhưng khocircng phải coacute bất kỳ thocircng tin phản hồi về kết quả mong muốn
Phần lớn caacutec ứng dụng nằm trong vugraveng của caacutec bagravei toaacuten ước lượng như mocirc higravenh hoacuteathống kecirc neacuten lọc phacircn cụm
12Lợi iacutech Liecircn kết với mạng noron Traacutenh caacutech lập trigravenh tường minh Giảm nhu cầu của chuyecircn gia ANNs thigrave thiacutech nghi với caacutec yếu tố đầu vagraveo thay đổi Khocircng cần thiết cho cơ sở tri thức tinh chế ANNs coacute tiacutenh động vagrave cải thiện với việc sử dụng Coacute khả năng xử lyacute dữ liệu khocircng chiacutenh xaacutec hoặc khocircng đầy đủ Cho pheacutep tổng quaacutet hoacutea từ thocircng tin cụ thể Cho pheacutep thu thập cảm giaacutec thocircng thường vagraveo miền giải quyết vấn đề
13Hạn chế của việc liecircn kết với mạng noron ANNs khocircng thể giải thiacutech được suy luận Bản chất hộp đen thường khiến cho vấn đề traacutech nhiệm vagrave độ tin cậy phaacutet
sinh lagrave khoacute khăn Lặp đi lặp lại quaacute trigravenh huấn luyện rất tốn thời gian Nguồn lực caacutec nhagrave phacircn tiacutech vagrave thiết kế coacute tay nghề cao vẫn lagrave đaacuteng lo
ngại Cocircng nghệ ANN thuacutec đẩy hạn chế của phần cứng hiện tại ANN yecircu cầu phải coacute sự tin tưởng ở đầu ra
14Giới thiệu về thuật toaacuten di truyền Cũng như mạng lưới thần kinh caacutec thuật toaacuten di truyền được dựa trecircn lyacute
thuyết sinh học Thuật toaacuten di truyền tigravem thấy nguồn gốc của chuacuteng trong caacutec lyacute thuyết
tiến hoacutea của chọn lọc tự nhiecircn vagrave thiacutech ứng với biến đổi khiacute hậu Kết quả thuật toaacuten di truyền lagrave từ giao phối 2 caacute thể trong quần thế để tạo
ra con caacutei đocirci khi tốt hơn so với bậc cha mẹ của chuacuteng 15Caacutec thagravenh phần cơ bản của thuật toaacuten di truyền
Toaacuten tử chọn lọc Caacutec caacute thể tốt được chọn lọc để đưa vagraveo thế hệ sau Sự chọn lọc nagravey căn cứ vagraveo độ thiacutech nghi với mocirci trường của mỗi caacute thể
Toaacuten tử lai gheacutep (crossover) Hai caacute thể cha vagrave mẹ trao đổi caacutec gen với nhau để tạo ra caacute thể con
Toaacuten tử đột biến (mutation) Một caacute thể thay đổi một số gen để biến đổi thagravenh một caacute thể mớiTất cả caacutec toaacuten tử trecircn khi thực hiện đều mang tiacutenh ngẫu nhiecircn
16Quaacute trigravenh cơ bản của một thuật toaacuten di truyền Khởi tạo
Đaacutenh giaacute quần thể
Lựa chọn NST thiacutech hợp nhất vagrave loại bỏ NST yếu nhất
Quy trigravenh giao nhau vagrave cải thiện quần thể
đột biến tiến trigravenh để khaacutem phaacute ra NST mới
17Ưu nhược điểm của việc kết hợp với thuật toaacuten di truyền Kiacutech thước quần thể lagrave 1 yếu tố quan trọng trong tốc độ của việc tigravem
kiếmnhưng noacute tương đối dễ dagraveng để dự đoaacuten tốc độ nagravey Giao nhau hoặc đột biến lagrave khocircng necircn đc sử dụng quaacute thường xuyecircn Luocircn coacute được iacutet nhất 1 giải phaacutep hợp lyacute Necircn coacute thể aacutep dụng chuacuteng cho caacutec vấn đề magrave chuacuteng ta khocircng coacute hướng
về caacutech giải quyết Sức mạnh của thuật toaacuten xuất phaacutet từ khaacutei niệm đơn giảnkhocircng phải từ
một thủ tục thuật toaacuten phức tạp 18Tương lai của học maacutey
Mạng lưới thần kinh nhacircn tạo vượt quaacute năng lực của con người trong caacutec trường hợp bị cocirc lập
Về mặt lyacute thuyếtmột maacutey tiacutenh coacute thể xử lyacute dũ liệu nhanh hơn hagraveng triệu lần so với 1 con người
May mắn thay cho chuacuteng tacon người tốt hơn nhiều khi magrave coacute được dữ liệumaacutey tiacutenh khocircng coacute 1 số thứ như lagrave 5 giaacutec quan
CHƯƠNG 10 KHO DỮ LIỆU
1 Kho dữ liệu Kho dữ liệu lagrave tuyển tập caacutec cơ sở dữ liệu tiacutech hợp hướng chủ đề được
thiết kế để trợ giuacutep cho một hệ hỗ trợ quyết định
Theo John Ladley Cocircng nghệ kho dữ liệu lagrave tập caacutec phương phaacutep kỹ thuật vagrave caacutec cocircng cụ coacute thể kết hợp hỗ trợ nhau để cung cấp thocircng tin cho người sử dụng trecircn cơ sở tiacutech hợp từ nhiều nguồn dữ liệu nhiều mocirci trường khaacutec nhau
Kho dữ liệu thường rất lớn tới hagraveng trăm GB hay thậm chiacute hagraveng Terabyte
2 Kho dữ liệu vận hagravenh (ODS) Một kho dữ liệu vận hagravenh Aacutep dụng kỹ thuật kho dữ liệu vagraveo caacutec hệ xử
lyacute giao taacutec lưu trữ dữ liệu cho một ứng dụng đặc thugrave Noacute đưa vagraveo kho dữ liệu một dograveng caacutec dữ liệu thocirc được thiết kế
3 So saacutenh
Kho dữ liệu vận hagravenh Kho dữ liệu
Dữ liệu theo chủ đề Dữ liệu theo chủ đề
Dữ liệu tiacutech hợp Dữ liệu tiacutech hợp
Dữ liệu thay đổi Dữ liệu khocircng thay đổi
Dữ liệu được cập nhật khi thay đổi
Dữ liệu giữ nguyecircn
Chỉ coacute dữ liệu hiện tạiDữliệu hiện tại vagrave dữ liệu lịch sử
Chu kỳ lagravem tươi dữ liệu ngắn Chu kỳ lagravem tươi dữ liệu dagravei
Chỉ coacute dữ liệu chi tiết Dữ liệu chi tiết vagrave dữ liệu tổng kết
Dugraveng cho caacutec quyết định ngắn hạn
Dugraveng cho hoạch định dagravei hạn
4 Kho dữ liệu cục bộ (Data Mart - DM)
Kho dữ liệu cục bộ lagrave CSDL coacute những đặc điểm giống với kho dữ liệu nhưng với quy mocirc nhỏ hơn vagrave lưu trữ dữ liệu về một lĩnh vực một chuyecircn ngagravenh
Data mart phụ thuộc Chứa những dữ liệu được lấy từ DW vagrave những dữ liệu nagravey sẽ được triacutech lọc vagrave tinh chế tiacutech hợp lại ở mức cao hơn để phục vụ một chủ đề nhất định của Datamart
Data mart độc lập Khocircng giống như Datamart phụ thuộc Data mart độc lập được xacircy dựng trước DW vagrave dữ liệu được trực tiếp lấy từ caacutec nguồn khaacutec nhau
5 Siecircu dữ liệu Metadata lagrave dữ liệu để mocirc tả dữ liệu Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột
một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi Metadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu
6 Mocirci trường kho dữ liệu Hệ thống của tổ chức vagrave kho cung cấp dữ liệu để xacircy dựng kho dữ liệu Trong quaacute trigravenh chuyển dữ liệu từ caacutec nguồn khaacutec nhau dữ liệu coacute thể
được lagravem sạch hoặc chuyển đổi vagrave vigrave thế DW được xem như lagrave một chuẩn cho việc lưu trữ
Đồng thời siecircu dữ liệu được ghi lại Cuối cugraveng DW hoặc siecircu thị coacute thể được sử dụng để tạo ra một kho dữ
liệu ldquocaacute nhacircnrdquo 7 Caacutec đặc điểm của kho dữ liệu
Đặc điểm Mocirc tả
Hướng chủ đề - DL tổ chức theo caacutech thức người dugraveng tham chiếu
Tiacutech hợp - Dữ liệu ldquosạchrdquo loại bỏ tiacutenh thiếu nhất quaacuten
Khocircng thay đổi - DL ldquochỉ đọcrdquo người dugraveng khocircng thay đổi được
Chuỗi thời gian - DL lagrave chuỗi thời gian khocircng phải lagrave trạng thaacutei hiện tại
Được tổng kết - DL vận hagravenhthao taacutec khi cần thiết
được kết hợp lại thagravenh dạng coacute thể dugraveng được cho quyết định
Kiacutech cỡ lớn hơn - Lưu giữ theo chuỗi thời gian tức lagrave giữ lại nhiều DL
Khocircng được chuẩn hoacutea - Coacute thể dư thừa DLSiecircu dữ liệu - Dữ liệu của dữ liệu được lưu trữNguồn dữ liệu - DL vận hagravenh (caacutec hệ sẵn coacute) cugraveng
với caacutec nguồn ngoagravei 8 Kho dữ liệu hướng chủ đề
Hướng chủ để coacute nghĩa lagrave kho dữ liệu được tổ chức xung quanh caacutec chủ đề chiacutenh như khaacutech hagraveng sản phẩm sản xuất Tập trung vagraveo việc mocirc higravenh hoacutea vagrave phacircn tiacutech dữ liệu cho caacutec nhagrave ra quyết định magrave khocircng tập trung vagraveo caacutec xử lyacute thocircng thường Cung cấp cho người dugraveng một khung nhigraven toagraven vẹn đơn giản vagrave đầy đủ về caacutec sự kiện quanh caacutec chủ đề
9 Dữ liệu trong DW được tiacutech hợp Dữ liệu trong kho dữ liệu được xacircy dựng bằng caacutech tổng hợp dữ liệu từ
nhiều nguồn khaacutec nhau vagrave caacutec nguồn coacute tổ chức khaacutec nhau Cơ sở dữ liệu caacutec file excel caacutec flat file hoặc caacutec raw file Khi đưa vagraveo kho dữ liệu caacutec dữ liệu được lagravem sạch vagrave tiacutech hợp dữ liệu nhằm đảm bảo tiacutenh nhất quaacuten của dữ liệu
10Kiến truacutec kho dữ liệu Tầng cơ sở dữ liệu hoạt động Tầng truy xuất thocircng tin Tầng truy xuất dữ liệu Tầng siecircu dữ liệu Tầng quản lyacute tiến trigravenh Tầng thocircng điệp của ứng dụng Tầng vật liacute của kho dữ liệu Tầng trigravenh diễn dữ liệu
11Higravenh trạng kho dữ liệu Kho dữ liệu ảo - người dugraveng cuối coacute thể truy cập trực tiếp đến kho dữ liệu
sử dụng caacutec cocircng cụ cho pheacutep ở tầng truy xuất dữ liệu Kho dữ liệu trung tacircm-1 cơ sở dữ liệu vật lyacute chứa tất cả dữ liệu cho một
vugraveng chuyecircn dụng nagraveo đoacute
Kho dữ liệu phacircn taacuten- Thagravenh phần được phacircn taacuten qua nhiều hệ cơ sở dữ liệu vật lyacute
12METADATA- Siecircu dữ liệu Định nghĩa Siecircu dữ liệu lagrave dữ liệu về dữ liệu Lagrave 1 lưu trữ dugraveng để
Miecircu tả kho dữ liệu tổng thể Nhận dạng kiểu kho dữ liệu Quản liacute quaacute trigravenh tiacutech hợp dữ liệu Quản liacute quaacute trigravenh cập nhật kho dữ liệu Quản liacute bảo mật
Lagrave chigravea khoacutea quyết định sự thagravenh cocircng của kho dữ liệu luocircn được thay đổi vagrave cập nhật theo sự phaacutet triển của kho dữ liệu
Dugraveng để quản liacute điều khiển kho dữ liệu Sự ra đời của kho dữ liệu như 1 cấu truacutec hỗ trợ ra quyết định siecircu dữ liệu
được xem như nguồn tagravei nguyecircn dữ liệu Siecircu dữ liệu lagrave trừu tượng Chuacuteng lagrave dữ liệu bậc cao cung cấp mocirc tả ngắn
gọn caacutec dữ liệu bậc thấp hơn 13Hoạt động của Siecircu dữ liệu
Siecircu dữ liệu rất cần thiết trong việc chuyển hoacutea thocircng tin trở thagravenh tri thức Lagrave chigravea khoacutea giuacutep chuacuteng ta xử lyacute được dữ liệu thocirc Viacute dụ một dograveng dữ liệu baacuten hagraveng 1023 K596 11121 agraveNoacute sẽ khocircng coacute nghĩa gigrave cho đến khi chuacuteng ta đưa vagraveo siecircu dữ liệu (thư
mục chứa dữ liệu) agrave cửa hagraveng 1023 sản phẩm K596 vagrave số tiền baacuten được lagrave 11121 đocirc la
14Sự cần thiết phải nhất quaacuten trong kho dữ liệu Kho dữ liệu được xacircy dựng cho lợi iacutech của những nhagrave phacircn tiacutech kinh
doanh caacutec nhagrave quản trị cho tất cả caacutec khu vực chức năng Trong cơ sở dữ liệu riecircng caacutec khu vực khaacutec nhau coacute thể định nghĩa vagrave lưu
trữ dữ liệu thocircng qua phiecircn bản của chiacutenh noacute Khi dữ liệu được lấy từ những vugraveng khaacutec nhau đoacute vagrave được đặt vagraveo kho dữ
liệu Việc chuyển đổi vagrave lagravem sạch caacutec tiến trigravenh sẽ đảm bảo noacute lagrave duy nhất được tiacutech hợp tại một mức của tổ chức
15Ragrave soaacutet lại dữ liệu ndash Thực thi siecircu dữ liệu
Bất kể cấu truacutec tự nhiecircn của 1 cacircu truy vấn thế nagraveo thigrave caacutec thagravenh phần của siecircu dữ liệu rất quan trọng đối với người ra quyết định
Bảng thuộc tiacutenh khoacutea được lưu trữ bởi kho dữ liệu Tập hợp dữ liệu được lấy từ đacircu Những chuyển đổi nagraveo được thực thi với việc lagravem sạch
16Siecircu dữ liệu lagrave gigrave Metadata - lagrave thocircng tin mocirc tả nội dung của cơ sở dữ liệu (CSDL) Metadata baacuteo cho người dugraveng biết thời gian cập nhật sau cugraveng của dữ liệu
định dạng vagrave mục điacutech sử dụng của noacute Những thocircng tin nagravey coacute thể hướng dẫn người dugraveng duyệt qua CSDL vagrave
giuacutep họ hiểu được yacute nghĩa vagrave ngữ cảnh của dữ liệu Trong CSDL metadata lagrave caacutec dạng biểu diễn khaacutec nhau của caacutec đối tượng
trong CSDL Trong CSDL quan hệ metadata lagrave caacutec định nghĩa của bảng cột CSDL
view vagrave nhiều đối tượng khaacutec Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột
một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi -gtMetadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu
Bảng chuyển đổi Ghi lại những chuyển đổi đatilde được thực hiện
Lịch sử thực thi Ghi lại những dữ liệu đatilde được
phacircn tiacutech
Higravenh thaacutei kết nốiGhi lại những dữ liệu được kết nối vagrave tần suất
17Aacutenh xạ thocircng thường của siecircu dữ liệu Bản ghi aacutenh xạ chuyển đổi bao gồm
Định danh của nguồn gốc Chuyển đổi thuộc tiacutenh Chuyển đổi thuộc tiacutenh vật lyacute Matilde hoacutea tham chiếu bảng chuyển đổi Đổi tecircn Đổi khoacutea Gaacuten giaacute trị cho thuộc tiacutenh mặc định Chọn logic cho caacutec nguồn nhiều giaacute trị Đổi thuật toaacuten
18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để
phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai
lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave
tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec
Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm
Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo
19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua
caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau
SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được
Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra
một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức
Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ
Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ
Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech
CHƯƠNG 11 KHAI PHAacute DỮ LIỆU
1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn
ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993
Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng
2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd
1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều
2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP
3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn
4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng
5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server
6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo
7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động
8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời
9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều
10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện
11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech
12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP
3 Xử lyacute phacircn tiacutech trực tuyến OLAP
MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave
dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu
ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave
thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu
HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave
ROLAP4 Khai phaacute dữ liệu
Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh
khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn
Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan
5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp
6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại
Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp
Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec
Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt
Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra
Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh
vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho
Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec
Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm
Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục
Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng
gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp
Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn
Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec
Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper
Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2
Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25
Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước
Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng
Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện
trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp
Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute
độ hỗ trợ ge ngưỡng minsup
độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan
Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn
Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết
Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu
MOLAP ROLAP HOLAP
Lưu trữ dữ liệu cơ sở
Khối Bảng quan hệ Bảng quan hệ
Lưu trữ thocircng tin tổng hợp
Khối Bảng quan hệ Khối
Hiệu suất thực hiện truy vấn
Nhanh nhất Chậm nhất Nhanh
Tiecircu thụ khocircng gian lưu trữ
Nhiều Thấp Trung bigravenh
Chi phiacute bảo trigrave Cao Thấp Trung bigravenh
Những thocircng tin điều hagravenh cần thiết- Quản lyacute xaacuteo trộn coacute thể yecircu cầu sự chuacute yacute xung quanh đồng hồ
- Hoạt động kinh doanh yecircu cầu điều hagravenh để dự đoaacuten những thay đổi trong mocirci trường
- Nhiệm vụ phacircn bổ tagravei nguyecircn yecircu cầu lựa chọn người quản lyacute vagrave caacutec nguồn lực hạn chế được triển khai
- Đagravem phaacuten yecircu cầu cập nhật thocircng tin từng phuacutet để coacute thể xacircy dựng được sự đồng thuận
Caacutec loại thocircng tin điều hagravenh- Hệ thống kế toaacuten coacute liecircn quan đến việc tiacutenh toaacuten thu nhập hoạt động cho caacutec lĩnh
vực cụ thể lagrave quan trọng hơn so với caacutec hệ thống kế toaacuten truyền thocircng- Thocircng tin về thị trường khaacutech hagraveng cung cấp giaacute trị trong việc quyết định chiến
lược- Caacutec thocircng tin cần thiết thường được truyền đi trecircn một số hệ thống maacutey tiacutenh vagrave
nằm trong toagraven tổ chức- Caacutec thocircng tin được sử dụng thường lagrave ngắn hạn vagrave dễ thay đổi
Phương thức để xaacutec định thocircng tin cần thiết
Rockart xaacutec định được năm phương thức cơ bản để xaacutec định thocircng tin cần thiết
- Phương thức dựa trecircn kết quả- Phương thức rỗng- Phương thức chỉ số khoacutea- Phương thức tổng hợp nghiecircn cứu- Phương thức dựa vagraveo nhacircn tố then chốt dẫn đến thagravenh cocircng
64 Thagravenh phần EIS
- Sản phẩm EIS đầu tiecircn được phaacutet triển để sử dụng trecircn maacutey tiacutenh cấu higravenh cao nhưng caacutec sản phẩm hiện nay nhằm mục tiecircu lagrave nền tảng ClientServer
- Những nền tảng linh hoạt hơn coacute thể thiacutech ứng với thay đổi trong tổ chức vagrave cocircng nghệ
- Sử dụng dữ liệu thời gian thực dẫn đến quyết định nhanh hơn nhiều thocircng tin hơn
Thagravenh phần phần cứng- Một EIS khocircng đogravei hỏi coacute phần cứng cụ thể hoặc duy nhất nagraveo- Chigravea khoacutea của vấn đề lagrave để đảm bảo rằng caacutec thagravenh phần của EIS tối ưu hoacutea vagrave
phugrave hợp với tagravei nguyecircn maacutey tiacutenh của tổ chức- Hệ thống nagravey phải được cấu higravenh để caacutec nguồn tagravei nguyecircn phugrave hợp với những
người điều hagravenh chuacuteng
Thagravenh phần phần mềm- Traacutei ngược với phần cứng phần mềm thường được chuyecircn mocircn hoacutea cao cho caacutec
bagravei toaacuten về miền- Sự chuyecircn mocircn hoacutea nagravey thường đạt được bằng caacutech sử dụng thagravenh phần off-the-
shelf cho toagraven bộ EIS vagrave caacutec mocirc-đun tugravey chỉnh để đaacutep ứng nhu cầu cụ thể- Lotus Notes lagrave một viacute dụ điển higravenh Noacute coacute thể được sử dụng một migravenh hoặc coacute
thể phục vụ becircn thứ ba mocirc-đun plug-in
Cocircng nghệ EIS hiện nay
Dobrzeniecki đề xuấtphacircn loạitừng cấptheo bachức năng- Loại 1 sản phẩm bao gồmmột bộ đầy đủcaacutec ứng dụngtừ mộtnhagrave cung cấp- Loại 2 sản phẩm đượcthựchiệnở phần đầu củacaacutecsản phẩmDSS đượcphaacutet triển
bởicugravengmộtnhagrave cung cấp- Loại 3 sản phẩmkết hợp với nhautheo bất kỳ số lượngthuộc sở hữu củacocircng ty
65 Xacircy dựng EIS
- Xacircy dựngmộtEISgiống nhưxacircydựngmột số hệ thống khaacutec củamocirc higravenh hệ thống thocircng tin
- Việcphaacutet triểncấu truacutecnecircn được theo dotildeitừ quaacute trigravenh thiết kế đến quaacute trigravenhthực hiện
- Tuy nhiecircn một dự aacuten phaacutet triển EIScoacute xu hướnglagrave thống nhấtvagraveyecircu cầu hỗ trợ caacutec nhagrave quản lyacute latildenh đạo
- Xacircy dựng một EIScoacute thểphaacutet hiện ra đượccaacutectigravenh huống khoacute khănmagravemột nhagrave phaacutet triển chưabao giờ gặp phải
Mocirc higravenh EIS
Khung phaacutet triển một EIS
- Watson et al đề nghị xacircy dựngkhung với ba thagravenh phần+ Caacutech tiếp cận tập trung vagraveo yếu tốcon người vagrave dữ liệu coacute liecircn quan đến EIS+ Quaacute trigravenh phaacutet triển cần sự linh hoạt vagrave tương taacutec+ Người sử dụng - hệ thống hộp thoại bao gồm một ngocircn ngữ hagravenh động để xử lyacute caacutec lệnh
Lợi iacutech của EIS- Dễ duy trigrave caacutec mục tiecircu coacute tổ chức- Dễ truy xuất thocircng tin- Cho pheacutep người sử dụng nacircng cao hiệu suất hơn
- Tăng chất lượng ra quyết định- Cung cấp sự cải tiến cạnh tranh- Tiết kiệm thời gian của người sử dụng- Tăng khả năng vagrave chất lượng giao tiếp- Cung cấp khả năng điều khiển tốt hơn trong tổ chức- Cho pheacutep tham gia caacutec vấn đề vagrave caacutec cơ hội- Cho pheacutep hoạch định- Cho pheacutep tigravem kiếm nguyecircn nhacircn của một vấn đề- Thảo matilden caacutec yecircu cầu của người điều hagravenh
Hạn chế của EIS vagrave 1 số sai lầm cần traacutenh
- Chi phiacute một cuộc khảo saacutetnăm1991 chothấychi phiacute phaacutet triểntrungbigravenh365000USDvớichi phiacute vận hagravenhhagraveng năm lagrave$200000 (EIS)
- Cocircng nghệ hạn chếEIScần phảiđượctiacutech hợp hoagraven toagravenvagraveokiếntruacuteccủadoanh nghiệphiện tại do đoacute noacutelagrave một thaacutech thứclớn đối vớithiết kế
- Hạn chế tổ chức cơ cấu tổ chứccoacute thể khocircng phugrave hợp
Sự hạn chế về tổ chức- Chương trigravenh nghị sự vagrave thời gian chệch EIS mocirc tả một phần việc thực hiện một
chương trigravenh nghị sự vagrave coacute thể dễ dagraveng đạt được sự tin cậy một caacutech chắc chắn- Đồng bộ hoacutea việc quản lyacute sự tin cậy đuacuteng luacutec đặc biệt baacuteo caacuteo EIS coacute thể phaacute
vỡ sự ổn định thiết lập caacutec chu trigravenh baacuteo caacuteo một caacutech tốt nhất- Sự bất ổn EIS phản ứng nhanh coacute thể gacircy ra việc taacutec động trở lại một caacutech
nhanh choacuteng dẫn đến sự thiếu ổn định trong tổ chức
Sự thất bại lagrave thay thế khocircng thể chấp nhận được- Một số yếu tố lagravem EIS thất bại
+ Thiếu sự hỗ trợ về mặt quản lyacute+ Vấn đề chiacutenh trị+ Thất bại của nhagrave phaacutet triển+ Lỗi về cocircng nghệ+ Giaacute cả+ Thời gian
66 Ra quyết định điều hagravenh trong tương lai vagrave EIS
- Coacute một vagravei điều kiện sẽ được hợp nhất cho việc chuyển đổi cocircng nghệ Trong đoacute một vagravei điều kiện coacute thể dễ dự đoaacuten Hai điều kiện magrave ta coacute thể thấy lagrave+ Phaacutet triển cocircng nghệ maacutey tiacutenh trong việc điều hagravenh sẽ tạo ra sự chuyển đổi được chấp nhận một caacutech dễ dagraveng hơn+ Mở rộng traacutech nhiệm điều hagravenh sẽ mở rộng nhu cầu thocircng tin
Tương lai của EIS- EIS thocircng minh Những tiến bộ trong cocircng nghệ AI sẽ được triển khai trong caacutec
EIS- EIS đa phương tiện Cơ sở dữ liệu đa phương tiện sẽ cho pheacutep tiacutech hợp văn bản
giọng noacutei vagrave higravenh ảnh trong tương lai- EIS thocircng tin Tương lai EIS sẽ mở rộng hơn trong việc sử dụng dữ liệu becircn
ngoagravei doanh nghiệp- EIS kết nối Giao tiếp với băng thocircng rộng cho pheacutep kết nối liecircn thocircng lớn hơn
Chương 7 HỆ CHUYEcircN GIA VAgrave TRIacute TUỆ NHAcircN TẠO
71 Caacutec khaacutei niệm
72 Triacute thocircng minh của triacute tuệ nhacircn tạo
73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia
74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia
75 Lợi iacutech vagrave hạn chế của hệ chuyecircn gia
71 Caacutec khaacutei niệm
Chuyecircn mocircn (Expertise) sự hiểu biết rộng trong 1 lĩnh vực hẹp
Hệ chuyecircn gia (Expert Systems)1 chương trigravenh maacutey tiacutenh sử dụng 1 tập caacutec luật dựa trecircn tri thức của con người để giải quyết caacutec vấn đề đogravei hogravei phải coacute sự chuyecircn mocircn
Một số hệ chuyecircn gia nổi tiếng
DENDRAL (Standford 1960s Edward Feigenbaum)
MYCIN (Standford1970s Edward Shortliffe)
PROSPECTOR (MIT 1979)
Triacute tuệ nhacircn tạo (Artificial Intelligence ndash AI)
Triacute tuệ nhacircn tạo một bộ phacircn của ngagravenh khoa học maacutey tiacutenh quan tacircm đến việc thiết kế caacutec hệ thống maacutey tiacutenh thocircng minh đoacute lagrave caacutec hệ thống đưa ra caacutec đặc điểm magrave từ đoacute chuacuteng ta liecircn hệ với sự thocircng minh trong hagravenh động của con người (Barr vagrave Feigenbaum 1981)
Mục điacutech của AI
Mục điacutech khoa học xaacutec định caacutec gợi yacute để giải thiacutech caacutec loại khaacutec nhau của triacute tuệ thực
Mục điacutech kỹ thuật giải quyết caacutec vấn đề trong thế giới thực
Triacute tuệ nhacircn tạo kế thừa nhiều yacute tưởng quan điểm kỹ thuật từ caacutec ngagravenh khoa học khaacutec
- Triết học
- Logic Toaacuten học
- Tiacutenh toaacuten
- Khoa học tacircm lyacute Khoa học nhận thức
- Sinh học Thần kinh học
- Tiến hoacutea
Caacutec lĩnh vực ứng dụng trong Triacute tuệ nhacircn tạo
Mạng nơ ron thần kinh (Neural Networks)
Tiacutenh toaacuten sự tiến hoacutea
(Evolutionary Computation)
Hệ chuyecircn gia (Expert Systems)
Kỹ thuật xử lyacute tiếng noacutei (Speech Processing)
Kỹ thuật xử lyacute ngocircn ngữ tự nhiecircn
(Natural Language Processing)
Lập kế hoạch (Planning)
Robot (Robotics)
Khoa học higravenh ảnh (Vision)
Caacutec kỹ thuật thocircng dụng dugraveng trong AI
Biểu diễn(Representation)
Học (Learning)
Caacutec luật (Rules)
Tigravem kiếm (Search)
72 Triacute thocircng minh của triacute tuệ nhacircn tạo
Con người suy diễn như thế nagraveo
Phacircn loại (Categorization)
Caacutec quy tắc cụ thể
Heuristics
Kinh nghiệm trước đoacute
Dự tiacutenh trước
Maacutey tiacutenh suy diễn như thế nagraveo
Lập luận dựa trecircn luật IF-THEN mocirc tả tri thức được matilde hoacutea dưới dạng caacutec luật
Caacutec khung (Frames) lagrave caacutec đại diện mocirc tả caacutec tigravenh huống giống nhau lagrave điển higravenh của một vagravei phacircn loại
Lập luận dựa trecircn caacutec trường hợp mocirc phỏng giải phaacutep trước đoacute cho một vấn đề hiện tại
Nhận dạng mẫu phaacutet hiện acircm thanh higravenh dạng hoặc caacutec chuỗi dagravei
Caacutec dạng khaacutec của Triacute tuệ nhacircn tạo
Học maacutey- mạng nơron vagrave giải thuật di truyền
Lập trigravenh tự động ndash lagrave những kỹ thuật tạo ra caacutec chương trigravenh để lagravem 1 nhiệm vụ riecircng biệt (cho pheacutep những người khocircng phải lagrave người lập trigravenh coacute thể lập trigravenh được)
Cuộc sống nhacircn tạo ndash nỗ lực để taacutei tạo caacutec hiện tượng sinh học trong caacutec hệ thống dựa trecircn maacutey tiacutenh
73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia(Expert Systems- ES)
Theo Jackson (1999) Một hệ chuyecircn gia lagrave một chương trigravenh maacutey tiacutenh mocirc tả vagrave suy diễn với tri thức của một vagravei lĩnh vực để giải quyết vấn đề hay đưa ra caacutec lời khuyecircn
Cấu truacutec cơ bản của ES được dựa theo cấu truacutec chung của DSS Sự khaacutec biệt chiacutenh giữa ES vagraveDSS lagrave hệ ES thu thập caacutec kiến thức từ những
chuyecircn gia trong lĩnh vực quan tacircmĐặc trưng của hệ chuyecircn gia Hiệu quả cao Thời gian trả lời thỏa đaacuteng Độ tin cậy cao Dễ hiểu
Giao diện người dugraveng trong ES
Thiết kế giao diện người dugraveng tập trung vagraveo caacutec yếu tố như dễ dagraveng sử dụngcoacute độ tin cậy cao giảm tải những khoacute khăn khi sử dụng
Thiết kế necircn coacute một số tương taacutec (đầu vagraveo kiểm soaacutet vagrave truy vấn)
Cấu tạo giao diện người dugraveng gồm coacute magraven higravenh cảm ứng bagraven phiacutem buacutet saacuteng lệnh thoại caacutec phiacutem chuyecircn dụng
Cơ sở tri thức (Knowledge Base)
Chứa đựng caacutec tri thức cụ thể miền thu được từ caacutec chuyecircn gia miền
Coacute thể chứa caacutec mocirc tả caacutec hagravenh vi giải quyết vấn đề caacutec ragraveng buộc caacutec heuristics
Thagravenh cocircng của một ES dựa trecircn tiacutenh đầy đủ vagrave tiacutenh chiacutenh xaacutec của cơ sở tri thức
Mocirc tơ suy diễn (Inference Engine)
Ở đacircy tri thức được đặt để sử dụng tạo ra caacutec giải phaacutep để giải quyết vấn đề
Mocirc tơ nagravey coacute khả năng thực hiện diễn dịch hoặc suy diễn dựa trecircn caacutec luật hay caacutec caacutec sự kiện
Đồng thời cũng coacute khả năng sử dụng caacutec suy diễn mờ hay khocircng chiacutenh xaacutec dựa trecircn xaacutec suất hay aacutenh xạ mẫu
Vograveng điều khiển suy diễn
1 Aacutenh xạ caacutec luật với caacutec sự kiện đatilde được cho
2 Chọn luật để thực hiện
3 Thực hiện luật bằng caacutech thecircm caacutec sự kiện được suy diễn ra vagraveo bộ nhớ lagravem việc
Chuỗi suy diễn (Chaining)
Suy diễn tiến (forward chaining) maacutey suy diễn bắt đầu từ dữ liệu ban đầu vagrave thực hiện việc suy luận để đưa ra caacutec kết luận cuối cugraveng
Suy diễn lugravei (backward chaining) maacutey suy diễn bắt đầu từ dữ liệu điacutech vagrave tigravem ra tri thức hỗ trợ cho dữ liệu điacutech đoacute
Viacute dụ suy diễn lugravei
R1 Nếu coacute A vagrave B thigrave suy ra coacute D
R2 Nếu coacute B thigrave suy ra coacute C
R3 Nếu coacute C vagrave D thigrave suy ra coacute E
Ta coacute E ta xem trong 3 luật R1 R2 R3 luật nagraveo coacute E ta thấy R3 chứa E đồng thời chứa C vagrave D Xeacutet tiếp trong 2 luật R1 R2 luật nagraveo chứa C vagrave D R2 chứa C R3 chứa D Từ đoacute ta coacute được caacutec tri thức hỗ trợ suy diễn vagrave kết luận lagrave nếu coacute A vagrave B thigrave sẽ coacute E Hay nếu A vagrave B đuacuteng thigrave sẽ coacute E
Viacute dụ suy diễn tiến
Giả sử coacute tập chứa 3 luật sau
R1 Nếu coacute A vagrave B thigrave suy ra coacute D
R2 Nếu coacute B thigrave suy ra coacute C
R3 Nếu coacute C vagrave D thigrave suy ra coacute E
Nếu ta coacute A vagrave B thigrave chuacuteng ta suy ra được D từ R1 vagrave suy ra C từ R2 Với D vagrave C đatilde được suy ra ở trecircn giờ chuacuteng ta suy ra được E từ R3
Viacute dụ thực tế
Giả sử muốn biết magraveu của một con vật nuocirci tecircn lagrave Fred biết rằng noacute kecircu ộp ộp vagrave ăn ruồi
Coacute tập 4 luật ban đầu như sau
R1 Nếu X kecircu ộp ộp vagrave ăn ruồi thigrave X lagrave con ếch
R2 Nếu X kecircu chiecircm chiếp vagrave biết hoacutet thigrave X lagrave con chim
R3 Nếu X lagrave con ếch thigrave X coacute magraveu xanh
R4 Nếu X lagrave con chim thigrave X coacute magraveu vagraveng
74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia
Expert system shells lagrave một tập caacutec goacutei phần mềm vagrave caacutec cocircng cụ dugraveng để phaacutet triển caacutec hệ chuyecircn gia
Những Expert system shells đầu tiecircn thường rất rườm ragrave Mặc dugrave vậy noacute vẫn giuacutep cho người sử dụng sẽ khocircng phải bắt đầu lại từ đầu khi xacircy dựng một hệ chuyecircn gia mới
Những shell hiện đại bao gồm hai mocirc-đun chiacutenh lagrave cocircng cụ xacircy dựng một tập quy tắc vagrave mocirc tơ suy diễn
Xacircy dựng hệ chuyecircn gia
Bước 1 xacircy dựng mocirc higravenh bagravei toaacuten xaacutec định vấn đề nhiệm vụ magrave hệ thống sẽ thực hiện Caacutec dạng bagravei toaacuten cần hệ chuyecircn gia
Bagravei toaacuten diễn giải (InterPretation)
Bagravei toaacuten dự baacuteo (Prediction)
Bagravei toaacuten chuẩn đoaacuten (Diagnose)
Bagravei toaacuten gỡ rối (Debugging)
Bagravei toaacuten thiết kế
Tương tự như một dự aacuten phần mềm để xacircy dựng một hệ chuyecircn gia cần phải coacute caacutec yếu tố về nhacircn lực tagravei nguyecircn vagrave thời gian Những yếu tố nagravey ảnh hưởng đến giaacute thah của một hệ chuyecircn giaTrong phần nagravey cacircu hỏi thường được đặt ra lagrave tại sao cần phải xacircy dựng một hệ chuyecircn giaTrước khi bắt đầu phải xaacute định rotilde bagravei toaacuten đạt ra lagrave jiAi lagrave chuyecircn giaAi lagrave người sử dụng
1 Diễn giải (InterPretation) Nghiecircn cứu 1 vấn đề -gt Dựa trecircn những biểu hiện thuộc tiacutenh đặc trưng becircn ngoagravei -gt Tư vấn
(hoặc đưa ra kết luận hay mocirc tả dễ hiểu từ tập dữ liệu thocirc)
2 Bagravei toaacuten dự baacuteo (Prediction) Coacute thể dự đoaacuten được hagravenh vi kết quả dựa trecircn caacutec hiện tượng -gt dự baacuteo
VD Dự baacuteo thời tiết động đấthellip
3 Bagravei toaacuten chẩn đoaacuten (Diagnoss) Xaacutec định caacutec lỗi caacutec bộ phận hỏng hoacutec của hệ thống dựa trecircn caacutec dữ liệu quan saacutet được
4 Bagravei toaacuten gỡ rối (Debugging) Mocirc tả caacutec phương phaacutep khắc phục hệ thống khi gặp sự cố
5 Bagravei toaacuten thiết kế Lựa chọn cấu higravenh caacutec đối tượng nhằm thoả matilden một số ragraveng buộc nagraveo đoacute
6 Giảng dạy Phần mềm dạy học coacute thể chuẩn đoaacuten vagrave sủa lỗi của học sinh trong quaacute trigravenh học tập
Để xaacutec định đuacuteng bagravei toaacuten magrave chuacuteng ta cần giải quyết thigrave phải trả lời đc một số cacircu hỏi
- cần hệ chuyecircn gia
Bước 2 thu thập tri thức lựa chọn cocircng cụ vagrave aacutep dụng
Trong bước thu thập tri thức vấn đề quan trọng lagrave lựa chọn chuyecircn gia những người magrave sẽ đoacuteng goacutep tri thức cho hệ thống Thocircng thường trong suốt quaacute trigravenh phaacutet triển thigrave chuyecircn gia được xem như một thagravenh viecircn của đội phaacutet triển
Hiện nay coacute rất nhiều cocircng cụ để xacircy dựng một hệ chuyecircn gia Phổ biến nhất lagrave JESS CLIPS vagrave OPS5
Bước 3 Thiết kế cơ sở tri thức thiết kế hệ thốngTri thức được biểu diễn trường minh trong cơ sở tri thức
Caacutec chuyecircn gia vagrave kỹ sư tri thức sẽ đối thoại với nhau bằng caacutec kỹ thuật đối thoại Suy diễn (SD) bảng Mocirc higravenh hoacutea SD quy nạp phacircn loại
Vấn đề bagraveo trigrave vagrave phaacutet triển
Caacutec hệ chuyecircn gia đogravei hỏi phải bảo trigrave vagrave phaacutet triển nhiều hơn so với caacutec hệ thống khaacutec Phải thường xuyecircn bổ sung tri thức mới vagrave thay đổi caacutec tri thức cũ để đổi mới hệ chuyecircn gia
Thu thập vagrave khắc phục lỗi do người sử dụng phaacutet hiện để kịp thời khắc phục những sai soacutet của hệ chuyecircn gia
75 Lợi iacutech vagrave hạn chế của caacutec hệ chuyecircn gia
Một số lợi iacutech chiacutenh
Thời gian trả lời hợp lyacute bằng hoặc nhanh hơn so với chuyecircn gia (người) để đi đến cugraveng một quyết định Hệ chuyecircn gia lagrave một hệ thống thời gian thực (real time system)
Khả năng trả lời với mức độ tinh thocircng bằng hoặc cao hơn so với chuyecircn gia (người) trong cugraveng lĩnh vực
Hệ chuyecircn gia giuacutep cho hiệu quả lagravem việc tăng bằng việc sử dụng tập caacutec luật một caacutech nhanh choacuteng magrave ko bị nhầm lẫn chuyecircn gia lagrave người coacute thể quecircn đi một số tri thức cơ sở lyacute luậ nhưng HCG thigrave ko
Quyết định của một người chuyecircn gia coacute thể bị thay đổi vagrave ko coacute tiacutenh thống nhất như quyết định của một hệ chuyecircn gia tạo ra
Hệ chuyecircn gia giuacutep cho người sử dụng coacute thể trau dồi sự hiểu biết trecircn lĩnh vuej cụ thể magrave noacute giải quyết hỗ trợ người ra quyết định coacute trigravenh độ như 1 chuyecircn gia trong quaacute trigravenh gia quyết định
Kiến thức của rất nhiều chuyecircn gia về một lĩnh vực nagraveo đoacute được đưa vagraveo hệ chuyecircn gia lagravem cho CSTT cuat HCG phong phuacute vagrave rộng lớn hơn rất nhiều
HCG giải thiacutech caacutec bước suy luận một caacutech dễ hiểu nhất quaacuten luacutec nagraveo cũng coacute thể sử dụng ko như chuyecircn gia con người
Hạn chế của caacutec hệ chuyecircn gia
Nhược điểm lớn nhất của hệ chuyecircn gia lagrave những yacute kiến chuyecircn mocircn thường rất khoacute matilde hoacutea vagrave giải neacuten
Hệ chuyecircn gia khocircng coacute khả năng tự học tự cập nhật kiến thức mới như caacutec chuyecircn gia magrave cần phải được matilde hoacutea lại khi noacute được cập nhật
Hệ chuyecircn gia khocircng thể nhận ra được vấn đề khocircng nằm trong miền kiến thức của hệ thống
Chương 8 Tri thức vagrave tiếp nhận
1 Bao gồm caacutec vấn đề
Dữ liệu thực tế đo lường hoặc quan saacutet coacute hoặc khocircng coacute bối cảnh
Thocircng tin dữ liệu được tổng hợp một caacutech hữu iacutech để giải quyết những khoacute khăn trong việc đưa ra quyết định
Tri thức bao gồm caacutec ứng dụng quy tắc thocircng tin hướng dẫn của người ra quyết định
2 Những caacutei nhigraven về tri thức
Đại diện lagravem thế nagraveo để diễn tả tri thức viacute dụ như một quyển saacutech khocircng phải lagrave tri thức nhưng noacute lại lagrave một đại diện của tri thức
Sản xuất tri thức lagrave một tập hơp của hagraveng tồn kho coacute thể được sản xuất cũng như mua lại
Tri thức lagrave 1 trong 6 trạng thaacutei của hệ thống
1Dữ liệu 2Thocircng tin 3Cấu truacutec thocircng tin 4Sự thấu hiểu 5Yacute kiến 6 Quyết định
3 Caacutec loại tri thức Phổ biến mocirc tả dữ liệu thocircng tin thủ tục mọi thứ lagravem như thế nagraveo lập luận chiacutenh saacutech hoặc caacutec quy tắc
4 Thu thập Tri thức hệ chuyecircn gia Hầu hết caacutec phương phaacutep đều bắt đầu với mocirc higravenh của caacutec taacutec vụ trong đoacute
hệ chuyecircn gia được xacircy dựng Trong đoacute mocirc tả về caacutec lĩnh vực được tạo ra Caacutec kỹ sư sử dụng caacutec mocirc higravenh giả thuyết vagrave nhận thức về quaacute trigravenh phacircn
tiacutech để gợi ra caacutech giải quyết vấn đề về tri thức từ caacutec chuyecircn gia
5 Caacutec chiều của thu thập tri thức KE- driven caacutec kỹ sư trao đổi trực tiếp với caacutec chuyecircn gia Expert-driven Caacutec chuyecircn gia trực tiếp đưa chuyecircn mocircn của họ vagraveo hệ
thống maacutey tiacutenh Machine-driven Sử dụng caacutec cocircng cụ suy luận để triacutech xuất tri thức từ một
tập caacutec viacute dụ
6 Kỹ thuật thu thập tri thức Trao đổi gồm 2 loại cơ bản lagrave coacute cấu truacutec(coacute kịch bản) vagrave khocircng coacute cấu
truacutec( đối thoại trực tiếp) Giao thức phacircn tiacutech bằng lời Khi caacutec chuyecircn gia thực hiện một cocircng việc
của họ thigrave một bản ghi về cocircng việc đoacute được thực hiện Caacutec kỹ sư sẽ xacircy dựng mocirc higravenh cho những gigrave được ghi lại trong bản ghi
Phương phaacutep sagraveng lọc caacutec chuyecircn gia so saacutenh caacutec nhoacutem liecircn tiếp trong ba đối tượng vagrave cho biết tại sao nhoacutem thứ hai lại khaacutec nhoacutem thứ ba
7 Thu thập tri thức từ nhiều nguồn Thu thập tri thức từ nhiều nguồn lagrave cần thiết để coacute được đầy đủ caacutec tri thức
cho một vấn đề quan điểm yacute kiến traacutei ngược nhau thường phaacutet sinh Phương phaacutep đồng thuận sẽ giuacutep giải quyết được vấn đề macircu thuẫn Kỹ thuật phacircn tiacutech Meta lagrave kỹ thuật được aacutep dụng trong caacutec trường hợp
khaacutec Caacutech tiếp cận bằng định lượng đogravei hỏi caacutec kỹ sư cần cacircn nhắc yếu tố đầu vagraveo của caacutec chuyecircn gia khaacutec nhau
8 Xaacutec nhận hợp lệ vagrave kiểm tra tri thức Một khi thu thập tri thức noacute phải được đaacutenh giaacute về khả năng sử dụng vagrave độ
chiacutenh xaacutec Hai vấn đề cụ thể lagrave hiệu lực của những kiến thức vagrave kiểm tra việc xacircy dựng cơ sở của tri thức
Cần xaacutec nhận xem liệu hệ thống coacute thể hoạt động ở mức độ tối thiểu khocircng
Xaacutec minh liecircn quan đến việc so saacutenh từng chi tiết kỹ thuật của hệ thống những gigrave đatilde được thực hiện cuối cugraveng
9 Một số caacutec biện phaacutep xaacutec nhận Độ chiacutenh xaacutec Khả năng thiacutech nghi Mức độ đầy đủ Bề rộng Độ sacircu Hiệu lực Tổng quan Chiacutenh xaacutec Hiện thực Độ tin cậy Tiacutenh hữu dụng Mức độ
Chương 9 Học maacutey
1 Logic mờ vagrave ngocircn ngữ mờ(Fuzzy Logic and Linguistic Ambiguity)
Ngocircn ngữ tự nhiecircn gồm những khaacutei niệm mơ hồ vagrave khocircng chiacutenh xaacutectruyền tải ngữ nghĩa thocircng qua tiacutenh xấp xỉkhocircng rotilde ragraveng
Những xấp xỉ nagravey giuacutep con người coacute thể truyền tải hết được yacute nghĩa nhưng maacutey thigrave khocircng hiểu
Lagravem sao biểu diễn caacutec tri thức sử dụng caacutec khaacutei niệm khocircng rotilde ragraveng(mờ) hoặc khocircng chiacutenh xaacutec
2 Khaacutei niệm cơ bản của logic mờ tập mờ lagrave những tập hợp khocircng coacute một giới hạn rotilde Mỗi phần tử của noacute chỉ
chứa một mức độ hagravem liecircn thuộc của từng phần tử Vigrave vậy tập mờ khocircng giống như tập cổ điển Tập mờ coacute thể kết hợp với nhau qua những luật mờ magrave đặc trưng cho những hagravenh động trạng thaacutei vagrave thuộc tiacutenh của logic mờ được tận dụng khi thực hiện một bộ điều khiển mờ
Logic mờ dựa trecircn yacute tưởng mỗi phần tử thuộc vagraveo một tập hợp ở một mức độ nagraveo đấy
Locircgic mờ cho pheacutep độ liecircn thuộc (microA )coacute giaacute trị trong khoảng (01) Locircgic mờ coacute thể được coi lagrave mặt ứng dụng của lyacute thuyết tập mờ để xử lyacute caacutec
giaacute trị trong thế giới thực cho caacutec bagravei toaacuten phức tạp
3 So saacutenh tiacutenh đuacuteng đắn logic mờ vagrave xaacutec suất Xaacutec suất thigrave đề cập đến khả năng xảy ra một biến cố hay một điều gigrave đoacute Logic mờ đề cập đến cấp độ magrave đặc tiacutenh ở hiện tại
o viacute dụ1 người coacute chiều cao 6 feet thigrave coacute cấp độ lagrave 05 về chiều cao
4 Ưu điểm của logic mờ Caacutech tiếp cận rất tự nhiecircnkhocircng phức tạp Coacute thể mocirc higravenh hoacutea caacutec hagravem phi tuyến tugravey yacute phức tạp
Coacute thể tận dụng được kinh nghiệm từ những chuyecircn gia hagraveng đầu trong mọi lĩnh vực
Logic mờ được xacircy dựng dựa trecircn ngocircn ngữ tự nhiecircnNền tảng của logic mờ lagrave dựa trecircn cơ sở giao tiếp của con người
5 Nhược điểm của logic mờ Trong 1 hệ thống phức tạpsử dụng logic mờ coacute thể trở thagravenh trở ngại cho
việc xaacutec thực độ tin cậy của hệ thống Cơ chế lập luận mờ khocircng thể học hỏi từ những lỗi sai
6 Mạng noron nhacircn tạo(ANN) Mạng noron nhacircn tạo lagrave một mocirc phỏng xử lyacute thocircng tinđược nghiecircn cứu ra
từ hệ thống thần kinh của sinh vậtgiống như bộ natildeo để xử lyacute thocircng tin ANNs lagrave chương trigravenh dựa trecircn maacutey tiacutenh đơn giản coacute chức năng lagrave một mocirc
higravenh bagravei toaacuten khocircng gian dựa trecircn thử nghiệm vagrave baacuteo lỗi
7 Học từ kinh nghiệm Tiến trigravenh Một mẫu dữ liệu được biểu diễn như một mạng lưới noronANN ldquodự
đoaacutenrdquo 1 đầu radự đoaacuten được so saacutenh với giaacute trị thực tế hoặc giaacute trị chiacutenh xaacutecNếu đoaacuten được chiacutenh xaacutec thigrave khocircng coacute hagravenh động nagraveo được thực hiện
Nếu dự đoaacuten sai ANN kiểm tra lại vagrave xaacutec định lại thocircng số để điều chỉnh Một mẫu dữ liệu khaacutec được biểu diễn vagrave quaacute trigravenh nagravey được lặp lại
8 Nguyecircn tắc cơ bản của cocircng nghệ nơron Caacutec yếu tố xử lyacute cơ bản trong hệ thống thần kinh của con người lagrave tế bagraveo
thần kinhMạng lưới của tế bagraveo nagravey lagrave liecircn kết với nhau nhận được thocircng tin từ caacutec cảm biến trong mắt taihellip
Thocircng tin nhận được bởi tế bagraveo thần kinh hoặc lagrave sẽ kiacutech thiacutech noacute(sẽ được chuyển qua 1 thocircng điệp dọc theo mạng lưới) hoặc lagrave sẽ ngăn cản noacute(ngăn cản dograveng thocircng tin)
Độ nhạy coacute thể thay đổi qua thời gian hoặc sau khi coacute được kinh nghiệm
9 Cấu truacutec mạng Một ANN gồm 3 lớp cơ bản
Lớp đầu vagraveo nhận dữ liệu Lớp becircn trong hoặc lagrave lớp ẩn xử lyacute dữ liệu Lớp đầu ra chuyển tiếp kết quả cuối cugraveng của mạng
10Mạng nơ ron Thường coacute nhiều đầu vagraveo mỗi đầu vagraveo với mức ảnh hưởng vagrave tầm quan
trọng riecircng của noacute Một đầu vagraveo quan trọng coacute thể được sử dụng để khuếch đại đầu ra caacutec hagravem trạng thaacutei tổng hợp caacutec trọng số của caacutec yếu tố
đầuvagraveo khaacutec nhauvagraveo một giaacute trị duy nhất Caacutec hagravem chuyển giao xử lyacute caacutec giaacute trị trạng thaacutei vagrave tạo đầu ra
11Huấn luyện mạng nơ ron Trong mocirc higravenh coacute giaacutem saacutetANN được đến so saacutenh dự đoaacuten của chiacutenh
noacute với thocircng tin phản hồi coacute chứa caacutec kết quả mong muốn ANN sẽ phải tigravem caacutech thay đổi caacutec tham số becircn trong củamigravenh (caacutec trọng số vagrave caacutec ngưỡng) để tạo necircn một aacutenh xạ coacute khả năng aacutenh xạcaacutec đầu vagraveo thagravenh caacutec đầu ra mong muốn Sự thay đổi nagravey được tiến hagravenh nhờ việc so saacutenh giữa đầu ra thực sự vagrave đầu ra mong muốn
Trong mocirc higravenh khocircng coacute giaacutem saacutetANN nhận được dữ liệu vagraveo nhưng khocircng phải coacute bất kỳ thocircng tin phản hồi về kết quả mong muốn
Phần lớn caacutec ứng dụng nằm trong vugraveng của caacutec bagravei toaacuten ước lượng như mocirc higravenh hoacuteathống kecirc neacuten lọc phacircn cụm
12Lợi iacutech Liecircn kết với mạng noron Traacutenh caacutech lập trigravenh tường minh Giảm nhu cầu của chuyecircn gia ANNs thigrave thiacutech nghi với caacutec yếu tố đầu vagraveo thay đổi Khocircng cần thiết cho cơ sở tri thức tinh chế ANNs coacute tiacutenh động vagrave cải thiện với việc sử dụng Coacute khả năng xử lyacute dữ liệu khocircng chiacutenh xaacutec hoặc khocircng đầy đủ Cho pheacutep tổng quaacutet hoacutea từ thocircng tin cụ thể Cho pheacutep thu thập cảm giaacutec thocircng thường vagraveo miền giải quyết vấn đề
13Hạn chế của việc liecircn kết với mạng noron ANNs khocircng thể giải thiacutech được suy luận Bản chất hộp đen thường khiến cho vấn đề traacutech nhiệm vagrave độ tin cậy phaacutet
sinh lagrave khoacute khăn Lặp đi lặp lại quaacute trigravenh huấn luyện rất tốn thời gian Nguồn lực caacutec nhagrave phacircn tiacutech vagrave thiết kế coacute tay nghề cao vẫn lagrave đaacuteng lo
ngại Cocircng nghệ ANN thuacutec đẩy hạn chế của phần cứng hiện tại ANN yecircu cầu phải coacute sự tin tưởng ở đầu ra
14Giới thiệu về thuật toaacuten di truyền Cũng như mạng lưới thần kinh caacutec thuật toaacuten di truyền được dựa trecircn lyacute
thuyết sinh học Thuật toaacuten di truyền tigravem thấy nguồn gốc của chuacuteng trong caacutec lyacute thuyết
tiến hoacutea của chọn lọc tự nhiecircn vagrave thiacutech ứng với biến đổi khiacute hậu Kết quả thuật toaacuten di truyền lagrave từ giao phối 2 caacute thể trong quần thế để tạo
ra con caacutei đocirci khi tốt hơn so với bậc cha mẹ của chuacuteng 15Caacutec thagravenh phần cơ bản của thuật toaacuten di truyền
Toaacuten tử chọn lọc Caacutec caacute thể tốt được chọn lọc để đưa vagraveo thế hệ sau Sự chọn lọc nagravey căn cứ vagraveo độ thiacutech nghi với mocirci trường của mỗi caacute thể
Toaacuten tử lai gheacutep (crossover) Hai caacute thể cha vagrave mẹ trao đổi caacutec gen với nhau để tạo ra caacute thể con
Toaacuten tử đột biến (mutation) Một caacute thể thay đổi một số gen để biến đổi thagravenh một caacute thể mớiTất cả caacutec toaacuten tử trecircn khi thực hiện đều mang tiacutenh ngẫu nhiecircn
16Quaacute trigravenh cơ bản của một thuật toaacuten di truyền Khởi tạo
Đaacutenh giaacute quần thể
Lựa chọn NST thiacutech hợp nhất vagrave loại bỏ NST yếu nhất
Quy trigravenh giao nhau vagrave cải thiện quần thể
đột biến tiến trigravenh để khaacutem phaacute ra NST mới
17Ưu nhược điểm của việc kết hợp với thuật toaacuten di truyền Kiacutech thước quần thể lagrave 1 yếu tố quan trọng trong tốc độ của việc tigravem
kiếmnhưng noacute tương đối dễ dagraveng để dự đoaacuten tốc độ nagravey Giao nhau hoặc đột biến lagrave khocircng necircn đc sử dụng quaacute thường xuyecircn Luocircn coacute được iacutet nhất 1 giải phaacutep hợp lyacute Necircn coacute thể aacutep dụng chuacuteng cho caacutec vấn đề magrave chuacuteng ta khocircng coacute hướng
về caacutech giải quyết Sức mạnh của thuật toaacuten xuất phaacutet từ khaacutei niệm đơn giảnkhocircng phải từ
một thủ tục thuật toaacuten phức tạp 18Tương lai của học maacutey
Mạng lưới thần kinh nhacircn tạo vượt quaacute năng lực của con người trong caacutec trường hợp bị cocirc lập
Về mặt lyacute thuyếtmột maacutey tiacutenh coacute thể xử lyacute dũ liệu nhanh hơn hagraveng triệu lần so với 1 con người
May mắn thay cho chuacuteng tacon người tốt hơn nhiều khi magrave coacute được dữ liệumaacutey tiacutenh khocircng coacute 1 số thứ như lagrave 5 giaacutec quan
CHƯƠNG 10 KHO DỮ LIỆU
1 Kho dữ liệu Kho dữ liệu lagrave tuyển tập caacutec cơ sở dữ liệu tiacutech hợp hướng chủ đề được
thiết kế để trợ giuacutep cho một hệ hỗ trợ quyết định
Theo John Ladley Cocircng nghệ kho dữ liệu lagrave tập caacutec phương phaacutep kỹ thuật vagrave caacutec cocircng cụ coacute thể kết hợp hỗ trợ nhau để cung cấp thocircng tin cho người sử dụng trecircn cơ sở tiacutech hợp từ nhiều nguồn dữ liệu nhiều mocirci trường khaacutec nhau
Kho dữ liệu thường rất lớn tới hagraveng trăm GB hay thậm chiacute hagraveng Terabyte
2 Kho dữ liệu vận hagravenh (ODS) Một kho dữ liệu vận hagravenh Aacutep dụng kỹ thuật kho dữ liệu vagraveo caacutec hệ xử
lyacute giao taacutec lưu trữ dữ liệu cho một ứng dụng đặc thugrave Noacute đưa vagraveo kho dữ liệu một dograveng caacutec dữ liệu thocirc được thiết kế
3 So saacutenh
Kho dữ liệu vận hagravenh Kho dữ liệu
Dữ liệu theo chủ đề Dữ liệu theo chủ đề
Dữ liệu tiacutech hợp Dữ liệu tiacutech hợp
Dữ liệu thay đổi Dữ liệu khocircng thay đổi
Dữ liệu được cập nhật khi thay đổi
Dữ liệu giữ nguyecircn
Chỉ coacute dữ liệu hiện tạiDữliệu hiện tại vagrave dữ liệu lịch sử
Chu kỳ lagravem tươi dữ liệu ngắn Chu kỳ lagravem tươi dữ liệu dagravei
Chỉ coacute dữ liệu chi tiết Dữ liệu chi tiết vagrave dữ liệu tổng kết
Dugraveng cho caacutec quyết định ngắn hạn
Dugraveng cho hoạch định dagravei hạn
4 Kho dữ liệu cục bộ (Data Mart - DM)
Kho dữ liệu cục bộ lagrave CSDL coacute những đặc điểm giống với kho dữ liệu nhưng với quy mocirc nhỏ hơn vagrave lưu trữ dữ liệu về một lĩnh vực một chuyecircn ngagravenh
Data mart phụ thuộc Chứa những dữ liệu được lấy từ DW vagrave những dữ liệu nagravey sẽ được triacutech lọc vagrave tinh chế tiacutech hợp lại ở mức cao hơn để phục vụ một chủ đề nhất định của Datamart
Data mart độc lập Khocircng giống như Datamart phụ thuộc Data mart độc lập được xacircy dựng trước DW vagrave dữ liệu được trực tiếp lấy từ caacutec nguồn khaacutec nhau
5 Siecircu dữ liệu Metadata lagrave dữ liệu để mocirc tả dữ liệu Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột
một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi Metadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu
6 Mocirci trường kho dữ liệu Hệ thống của tổ chức vagrave kho cung cấp dữ liệu để xacircy dựng kho dữ liệu Trong quaacute trigravenh chuyển dữ liệu từ caacutec nguồn khaacutec nhau dữ liệu coacute thể
được lagravem sạch hoặc chuyển đổi vagrave vigrave thế DW được xem như lagrave một chuẩn cho việc lưu trữ
Đồng thời siecircu dữ liệu được ghi lại Cuối cugraveng DW hoặc siecircu thị coacute thể được sử dụng để tạo ra một kho dữ
liệu ldquocaacute nhacircnrdquo 7 Caacutec đặc điểm của kho dữ liệu
Đặc điểm Mocirc tả
Hướng chủ đề - DL tổ chức theo caacutech thức người dugraveng tham chiếu
Tiacutech hợp - Dữ liệu ldquosạchrdquo loại bỏ tiacutenh thiếu nhất quaacuten
Khocircng thay đổi - DL ldquochỉ đọcrdquo người dugraveng khocircng thay đổi được
Chuỗi thời gian - DL lagrave chuỗi thời gian khocircng phải lagrave trạng thaacutei hiện tại
Được tổng kết - DL vận hagravenhthao taacutec khi cần thiết
được kết hợp lại thagravenh dạng coacute thể dugraveng được cho quyết định
Kiacutech cỡ lớn hơn - Lưu giữ theo chuỗi thời gian tức lagrave giữ lại nhiều DL
Khocircng được chuẩn hoacutea - Coacute thể dư thừa DLSiecircu dữ liệu - Dữ liệu của dữ liệu được lưu trữNguồn dữ liệu - DL vận hagravenh (caacutec hệ sẵn coacute) cugraveng
với caacutec nguồn ngoagravei 8 Kho dữ liệu hướng chủ đề
Hướng chủ để coacute nghĩa lagrave kho dữ liệu được tổ chức xung quanh caacutec chủ đề chiacutenh như khaacutech hagraveng sản phẩm sản xuất Tập trung vagraveo việc mocirc higravenh hoacutea vagrave phacircn tiacutech dữ liệu cho caacutec nhagrave ra quyết định magrave khocircng tập trung vagraveo caacutec xử lyacute thocircng thường Cung cấp cho người dugraveng một khung nhigraven toagraven vẹn đơn giản vagrave đầy đủ về caacutec sự kiện quanh caacutec chủ đề
9 Dữ liệu trong DW được tiacutech hợp Dữ liệu trong kho dữ liệu được xacircy dựng bằng caacutech tổng hợp dữ liệu từ
nhiều nguồn khaacutec nhau vagrave caacutec nguồn coacute tổ chức khaacutec nhau Cơ sở dữ liệu caacutec file excel caacutec flat file hoặc caacutec raw file Khi đưa vagraveo kho dữ liệu caacutec dữ liệu được lagravem sạch vagrave tiacutech hợp dữ liệu nhằm đảm bảo tiacutenh nhất quaacuten của dữ liệu
10Kiến truacutec kho dữ liệu Tầng cơ sở dữ liệu hoạt động Tầng truy xuất thocircng tin Tầng truy xuất dữ liệu Tầng siecircu dữ liệu Tầng quản lyacute tiến trigravenh Tầng thocircng điệp của ứng dụng Tầng vật liacute của kho dữ liệu Tầng trigravenh diễn dữ liệu
11Higravenh trạng kho dữ liệu Kho dữ liệu ảo - người dugraveng cuối coacute thể truy cập trực tiếp đến kho dữ liệu
sử dụng caacutec cocircng cụ cho pheacutep ở tầng truy xuất dữ liệu Kho dữ liệu trung tacircm-1 cơ sở dữ liệu vật lyacute chứa tất cả dữ liệu cho một
vugraveng chuyecircn dụng nagraveo đoacute
Kho dữ liệu phacircn taacuten- Thagravenh phần được phacircn taacuten qua nhiều hệ cơ sở dữ liệu vật lyacute
12METADATA- Siecircu dữ liệu Định nghĩa Siecircu dữ liệu lagrave dữ liệu về dữ liệu Lagrave 1 lưu trữ dugraveng để
Miecircu tả kho dữ liệu tổng thể Nhận dạng kiểu kho dữ liệu Quản liacute quaacute trigravenh tiacutech hợp dữ liệu Quản liacute quaacute trigravenh cập nhật kho dữ liệu Quản liacute bảo mật
Lagrave chigravea khoacutea quyết định sự thagravenh cocircng của kho dữ liệu luocircn được thay đổi vagrave cập nhật theo sự phaacutet triển của kho dữ liệu
Dugraveng để quản liacute điều khiển kho dữ liệu Sự ra đời của kho dữ liệu như 1 cấu truacutec hỗ trợ ra quyết định siecircu dữ liệu
được xem như nguồn tagravei nguyecircn dữ liệu Siecircu dữ liệu lagrave trừu tượng Chuacuteng lagrave dữ liệu bậc cao cung cấp mocirc tả ngắn
gọn caacutec dữ liệu bậc thấp hơn 13Hoạt động của Siecircu dữ liệu
Siecircu dữ liệu rất cần thiết trong việc chuyển hoacutea thocircng tin trở thagravenh tri thức Lagrave chigravea khoacutea giuacutep chuacuteng ta xử lyacute được dữ liệu thocirc Viacute dụ một dograveng dữ liệu baacuten hagraveng 1023 K596 11121 agraveNoacute sẽ khocircng coacute nghĩa gigrave cho đến khi chuacuteng ta đưa vagraveo siecircu dữ liệu (thư
mục chứa dữ liệu) agrave cửa hagraveng 1023 sản phẩm K596 vagrave số tiền baacuten được lagrave 11121 đocirc la
14Sự cần thiết phải nhất quaacuten trong kho dữ liệu Kho dữ liệu được xacircy dựng cho lợi iacutech của những nhagrave phacircn tiacutech kinh
doanh caacutec nhagrave quản trị cho tất cả caacutec khu vực chức năng Trong cơ sở dữ liệu riecircng caacutec khu vực khaacutec nhau coacute thể định nghĩa vagrave lưu
trữ dữ liệu thocircng qua phiecircn bản của chiacutenh noacute Khi dữ liệu được lấy từ những vugraveng khaacutec nhau đoacute vagrave được đặt vagraveo kho dữ
liệu Việc chuyển đổi vagrave lagravem sạch caacutec tiến trigravenh sẽ đảm bảo noacute lagrave duy nhất được tiacutech hợp tại một mức của tổ chức
15Ragrave soaacutet lại dữ liệu ndash Thực thi siecircu dữ liệu
Bất kể cấu truacutec tự nhiecircn của 1 cacircu truy vấn thế nagraveo thigrave caacutec thagravenh phần của siecircu dữ liệu rất quan trọng đối với người ra quyết định
Bảng thuộc tiacutenh khoacutea được lưu trữ bởi kho dữ liệu Tập hợp dữ liệu được lấy từ đacircu Những chuyển đổi nagraveo được thực thi với việc lagravem sạch
16Siecircu dữ liệu lagrave gigrave Metadata - lagrave thocircng tin mocirc tả nội dung của cơ sở dữ liệu (CSDL) Metadata baacuteo cho người dugraveng biết thời gian cập nhật sau cugraveng của dữ liệu
định dạng vagrave mục điacutech sử dụng của noacute Những thocircng tin nagravey coacute thể hướng dẫn người dugraveng duyệt qua CSDL vagrave
giuacutep họ hiểu được yacute nghĩa vagrave ngữ cảnh của dữ liệu Trong CSDL metadata lagrave caacutec dạng biểu diễn khaacutec nhau của caacutec đối tượng
trong CSDL Trong CSDL quan hệ metadata lagrave caacutec định nghĩa của bảng cột CSDL
view vagrave nhiều đối tượng khaacutec Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột
một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi -gtMetadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu
Bảng chuyển đổi Ghi lại những chuyển đổi đatilde được thực hiện
Lịch sử thực thi Ghi lại những dữ liệu đatilde được
phacircn tiacutech
Higravenh thaacutei kết nốiGhi lại những dữ liệu được kết nối vagrave tần suất
17Aacutenh xạ thocircng thường của siecircu dữ liệu Bản ghi aacutenh xạ chuyển đổi bao gồm
Định danh của nguồn gốc Chuyển đổi thuộc tiacutenh Chuyển đổi thuộc tiacutenh vật lyacute Matilde hoacutea tham chiếu bảng chuyển đổi Đổi tecircn Đổi khoacutea Gaacuten giaacute trị cho thuộc tiacutenh mặc định Chọn logic cho caacutec nguồn nhiều giaacute trị Đổi thuật toaacuten
18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để
phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai
lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave
tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec
Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm
Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo
19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua
caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau
SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được
Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra
một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức
Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ
Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ
Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech
CHƯƠNG 11 KHAI PHAacute DỮ LIỆU
1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn
ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993
Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng
2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd
1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều
2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP
3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn
4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng
5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server
6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo
7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động
8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời
9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều
10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện
11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech
12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP
3 Xử lyacute phacircn tiacutech trực tuyến OLAP
MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave
dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu
ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave
thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu
HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave
ROLAP4 Khai phaacute dữ liệu
Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh
khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn
Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan
5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp
6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại
Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp
Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec
Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt
Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra
Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh
vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho
Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec
Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm
Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục
Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng
gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp
Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn
Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec
Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper
Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2
Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25
Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước
Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng
Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện
trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp
Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute
độ hỗ trợ ge ngưỡng minsup
độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan
Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn
Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết
Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu
MOLAP ROLAP HOLAP
Lưu trữ dữ liệu cơ sở
Khối Bảng quan hệ Bảng quan hệ
Lưu trữ thocircng tin tổng hợp
Khối Bảng quan hệ Khối
Hiệu suất thực hiện truy vấn
Nhanh nhất Chậm nhất Nhanh
Tiecircu thụ khocircng gian lưu trữ
Nhiều Thấp Trung bigravenh
Chi phiacute bảo trigrave Cao Thấp Trung bigravenh
- Sản phẩm EIS đầu tiecircn được phaacutet triển để sử dụng trecircn maacutey tiacutenh cấu higravenh cao nhưng caacutec sản phẩm hiện nay nhằm mục tiecircu lagrave nền tảng ClientServer
- Những nền tảng linh hoạt hơn coacute thể thiacutech ứng với thay đổi trong tổ chức vagrave cocircng nghệ
- Sử dụng dữ liệu thời gian thực dẫn đến quyết định nhanh hơn nhiều thocircng tin hơn
Thagravenh phần phần cứng- Một EIS khocircng đogravei hỏi coacute phần cứng cụ thể hoặc duy nhất nagraveo- Chigravea khoacutea của vấn đề lagrave để đảm bảo rằng caacutec thagravenh phần của EIS tối ưu hoacutea vagrave
phugrave hợp với tagravei nguyecircn maacutey tiacutenh của tổ chức- Hệ thống nagravey phải được cấu higravenh để caacutec nguồn tagravei nguyecircn phugrave hợp với những
người điều hagravenh chuacuteng
Thagravenh phần phần mềm- Traacutei ngược với phần cứng phần mềm thường được chuyecircn mocircn hoacutea cao cho caacutec
bagravei toaacuten về miền- Sự chuyecircn mocircn hoacutea nagravey thường đạt được bằng caacutech sử dụng thagravenh phần off-the-
shelf cho toagraven bộ EIS vagrave caacutec mocirc-đun tugravey chỉnh để đaacutep ứng nhu cầu cụ thể- Lotus Notes lagrave một viacute dụ điển higravenh Noacute coacute thể được sử dụng một migravenh hoặc coacute
thể phục vụ becircn thứ ba mocirc-đun plug-in
Cocircng nghệ EIS hiện nay
Dobrzeniecki đề xuấtphacircn loạitừng cấptheo bachức năng- Loại 1 sản phẩm bao gồmmột bộ đầy đủcaacutec ứng dụngtừ mộtnhagrave cung cấp- Loại 2 sản phẩm đượcthựchiệnở phần đầu củacaacutecsản phẩmDSS đượcphaacutet triển
bởicugravengmộtnhagrave cung cấp- Loại 3 sản phẩmkết hợp với nhautheo bất kỳ số lượngthuộc sở hữu củacocircng ty
65 Xacircy dựng EIS
- Xacircy dựngmộtEISgiống nhưxacircydựngmột số hệ thống khaacutec củamocirc higravenh hệ thống thocircng tin
- Việcphaacutet triểncấu truacutecnecircn được theo dotildeitừ quaacute trigravenh thiết kế đến quaacute trigravenhthực hiện
- Tuy nhiecircn một dự aacuten phaacutet triển EIScoacute xu hướnglagrave thống nhấtvagraveyecircu cầu hỗ trợ caacutec nhagrave quản lyacute latildenh đạo
- Xacircy dựng một EIScoacute thểphaacutet hiện ra đượccaacutectigravenh huống khoacute khănmagravemột nhagrave phaacutet triển chưabao giờ gặp phải
Mocirc higravenh EIS
Khung phaacutet triển một EIS
- Watson et al đề nghị xacircy dựngkhung với ba thagravenh phần+ Caacutech tiếp cận tập trung vagraveo yếu tốcon người vagrave dữ liệu coacute liecircn quan đến EIS+ Quaacute trigravenh phaacutet triển cần sự linh hoạt vagrave tương taacutec+ Người sử dụng - hệ thống hộp thoại bao gồm một ngocircn ngữ hagravenh động để xử lyacute caacutec lệnh
Lợi iacutech của EIS- Dễ duy trigrave caacutec mục tiecircu coacute tổ chức- Dễ truy xuất thocircng tin- Cho pheacutep người sử dụng nacircng cao hiệu suất hơn
- Tăng chất lượng ra quyết định- Cung cấp sự cải tiến cạnh tranh- Tiết kiệm thời gian của người sử dụng- Tăng khả năng vagrave chất lượng giao tiếp- Cung cấp khả năng điều khiển tốt hơn trong tổ chức- Cho pheacutep tham gia caacutec vấn đề vagrave caacutec cơ hội- Cho pheacutep hoạch định- Cho pheacutep tigravem kiếm nguyecircn nhacircn của một vấn đề- Thảo matilden caacutec yecircu cầu của người điều hagravenh
Hạn chế của EIS vagrave 1 số sai lầm cần traacutenh
- Chi phiacute một cuộc khảo saacutetnăm1991 chothấychi phiacute phaacutet triểntrungbigravenh365000USDvớichi phiacute vận hagravenhhagraveng năm lagrave$200000 (EIS)
- Cocircng nghệ hạn chếEIScần phảiđượctiacutech hợp hoagraven toagravenvagraveokiếntruacuteccủadoanh nghiệphiện tại do đoacute noacutelagrave một thaacutech thứclớn đối vớithiết kế
- Hạn chế tổ chức cơ cấu tổ chứccoacute thể khocircng phugrave hợp
Sự hạn chế về tổ chức- Chương trigravenh nghị sự vagrave thời gian chệch EIS mocirc tả một phần việc thực hiện một
chương trigravenh nghị sự vagrave coacute thể dễ dagraveng đạt được sự tin cậy một caacutech chắc chắn- Đồng bộ hoacutea việc quản lyacute sự tin cậy đuacuteng luacutec đặc biệt baacuteo caacuteo EIS coacute thể phaacute
vỡ sự ổn định thiết lập caacutec chu trigravenh baacuteo caacuteo một caacutech tốt nhất- Sự bất ổn EIS phản ứng nhanh coacute thể gacircy ra việc taacutec động trở lại một caacutech
nhanh choacuteng dẫn đến sự thiếu ổn định trong tổ chức
Sự thất bại lagrave thay thế khocircng thể chấp nhận được- Một số yếu tố lagravem EIS thất bại
+ Thiếu sự hỗ trợ về mặt quản lyacute+ Vấn đề chiacutenh trị+ Thất bại của nhagrave phaacutet triển+ Lỗi về cocircng nghệ+ Giaacute cả+ Thời gian
66 Ra quyết định điều hagravenh trong tương lai vagrave EIS
- Coacute một vagravei điều kiện sẽ được hợp nhất cho việc chuyển đổi cocircng nghệ Trong đoacute một vagravei điều kiện coacute thể dễ dự đoaacuten Hai điều kiện magrave ta coacute thể thấy lagrave+ Phaacutet triển cocircng nghệ maacutey tiacutenh trong việc điều hagravenh sẽ tạo ra sự chuyển đổi được chấp nhận một caacutech dễ dagraveng hơn+ Mở rộng traacutech nhiệm điều hagravenh sẽ mở rộng nhu cầu thocircng tin
Tương lai của EIS- EIS thocircng minh Những tiến bộ trong cocircng nghệ AI sẽ được triển khai trong caacutec
EIS- EIS đa phương tiện Cơ sở dữ liệu đa phương tiện sẽ cho pheacutep tiacutech hợp văn bản
giọng noacutei vagrave higravenh ảnh trong tương lai- EIS thocircng tin Tương lai EIS sẽ mở rộng hơn trong việc sử dụng dữ liệu becircn
ngoagravei doanh nghiệp- EIS kết nối Giao tiếp với băng thocircng rộng cho pheacutep kết nối liecircn thocircng lớn hơn
Chương 7 HỆ CHUYEcircN GIA VAgrave TRIacute TUỆ NHAcircN TẠO
71 Caacutec khaacutei niệm
72 Triacute thocircng minh của triacute tuệ nhacircn tạo
73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia
74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia
75 Lợi iacutech vagrave hạn chế của hệ chuyecircn gia
71 Caacutec khaacutei niệm
Chuyecircn mocircn (Expertise) sự hiểu biết rộng trong 1 lĩnh vực hẹp
Hệ chuyecircn gia (Expert Systems)1 chương trigravenh maacutey tiacutenh sử dụng 1 tập caacutec luật dựa trecircn tri thức của con người để giải quyết caacutec vấn đề đogravei hogravei phải coacute sự chuyecircn mocircn
Một số hệ chuyecircn gia nổi tiếng
DENDRAL (Standford 1960s Edward Feigenbaum)
MYCIN (Standford1970s Edward Shortliffe)
PROSPECTOR (MIT 1979)
Triacute tuệ nhacircn tạo (Artificial Intelligence ndash AI)
Triacute tuệ nhacircn tạo một bộ phacircn của ngagravenh khoa học maacutey tiacutenh quan tacircm đến việc thiết kế caacutec hệ thống maacutey tiacutenh thocircng minh đoacute lagrave caacutec hệ thống đưa ra caacutec đặc điểm magrave từ đoacute chuacuteng ta liecircn hệ với sự thocircng minh trong hagravenh động của con người (Barr vagrave Feigenbaum 1981)
Mục điacutech của AI
Mục điacutech khoa học xaacutec định caacutec gợi yacute để giải thiacutech caacutec loại khaacutec nhau của triacute tuệ thực
Mục điacutech kỹ thuật giải quyết caacutec vấn đề trong thế giới thực
Triacute tuệ nhacircn tạo kế thừa nhiều yacute tưởng quan điểm kỹ thuật từ caacutec ngagravenh khoa học khaacutec
- Triết học
- Logic Toaacuten học
- Tiacutenh toaacuten
- Khoa học tacircm lyacute Khoa học nhận thức
- Sinh học Thần kinh học
- Tiến hoacutea
Caacutec lĩnh vực ứng dụng trong Triacute tuệ nhacircn tạo
Mạng nơ ron thần kinh (Neural Networks)
Tiacutenh toaacuten sự tiến hoacutea
(Evolutionary Computation)
Hệ chuyecircn gia (Expert Systems)
Kỹ thuật xử lyacute tiếng noacutei (Speech Processing)
Kỹ thuật xử lyacute ngocircn ngữ tự nhiecircn
(Natural Language Processing)
Lập kế hoạch (Planning)
Robot (Robotics)
Khoa học higravenh ảnh (Vision)
Caacutec kỹ thuật thocircng dụng dugraveng trong AI
Biểu diễn(Representation)
Học (Learning)
Caacutec luật (Rules)
Tigravem kiếm (Search)
72 Triacute thocircng minh của triacute tuệ nhacircn tạo
Con người suy diễn như thế nagraveo
Phacircn loại (Categorization)
Caacutec quy tắc cụ thể
Heuristics
Kinh nghiệm trước đoacute
Dự tiacutenh trước
Maacutey tiacutenh suy diễn như thế nagraveo
Lập luận dựa trecircn luật IF-THEN mocirc tả tri thức được matilde hoacutea dưới dạng caacutec luật
Caacutec khung (Frames) lagrave caacutec đại diện mocirc tả caacutec tigravenh huống giống nhau lagrave điển higravenh của một vagravei phacircn loại
Lập luận dựa trecircn caacutec trường hợp mocirc phỏng giải phaacutep trước đoacute cho một vấn đề hiện tại
Nhận dạng mẫu phaacutet hiện acircm thanh higravenh dạng hoặc caacutec chuỗi dagravei
Caacutec dạng khaacutec của Triacute tuệ nhacircn tạo
Học maacutey- mạng nơron vagrave giải thuật di truyền
Lập trigravenh tự động ndash lagrave những kỹ thuật tạo ra caacutec chương trigravenh để lagravem 1 nhiệm vụ riecircng biệt (cho pheacutep những người khocircng phải lagrave người lập trigravenh coacute thể lập trigravenh được)
Cuộc sống nhacircn tạo ndash nỗ lực để taacutei tạo caacutec hiện tượng sinh học trong caacutec hệ thống dựa trecircn maacutey tiacutenh
73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia(Expert Systems- ES)
Theo Jackson (1999) Một hệ chuyecircn gia lagrave một chương trigravenh maacutey tiacutenh mocirc tả vagrave suy diễn với tri thức của một vagravei lĩnh vực để giải quyết vấn đề hay đưa ra caacutec lời khuyecircn
Cấu truacutec cơ bản của ES được dựa theo cấu truacutec chung của DSS Sự khaacutec biệt chiacutenh giữa ES vagraveDSS lagrave hệ ES thu thập caacutec kiến thức từ những
chuyecircn gia trong lĩnh vực quan tacircmĐặc trưng của hệ chuyecircn gia Hiệu quả cao Thời gian trả lời thỏa đaacuteng Độ tin cậy cao Dễ hiểu
Giao diện người dugraveng trong ES
Thiết kế giao diện người dugraveng tập trung vagraveo caacutec yếu tố như dễ dagraveng sử dụngcoacute độ tin cậy cao giảm tải những khoacute khăn khi sử dụng
Thiết kế necircn coacute một số tương taacutec (đầu vagraveo kiểm soaacutet vagrave truy vấn)
Cấu tạo giao diện người dugraveng gồm coacute magraven higravenh cảm ứng bagraven phiacutem buacutet saacuteng lệnh thoại caacutec phiacutem chuyecircn dụng
Cơ sở tri thức (Knowledge Base)
Chứa đựng caacutec tri thức cụ thể miền thu được từ caacutec chuyecircn gia miền
Coacute thể chứa caacutec mocirc tả caacutec hagravenh vi giải quyết vấn đề caacutec ragraveng buộc caacutec heuristics
Thagravenh cocircng của một ES dựa trecircn tiacutenh đầy đủ vagrave tiacutenh chiacutenh xaacutec của cơ sở tri thức
Mocirc tơ suy diễn (Inference Engine)
Ở đacircy tri thức được đặt để sử dụng tạo ra caacutec giải phaacutep để giải quyết vấn đề
Mocirc tơ nagravey coacute khả năng thực hiện diễn dịch hoặc suy diễn dựa trecircn caacutec luật hay caacutec caacutec sự kiện
Đồng thời cũng coacute khả năng sử dụng caacutec suy diễn mờ hay khocircng chiacutenh xaacutec dựa trecircn xaacutec suất hay aacutenh xạ mẫu
Vograveng điều khiển suy diễn
1 Aacutenh xạ caacutec luật với caacutec sự kiện đatilde được cho
2 Chọn luật để thực hiện
3 Thực hiện luật bằng caacutech thecircm caacutec sự kiện được suy diễn ra vagraveo bộ nhớ lagravem việc
Chuỗi suy diễn (Chaining)
Suy diễn tiến (forward chaining) maacutey suy diễn bắt đầu từ dữ liệu ban đầu vagrave thực hiện việc suy luận để đưa ra caacutec kết luận cuối cugraveng
Suy diễn lugravei (backward chaining) maacutey suy diễn bắt đầu từ dữ liệu điacutech vagrave tigravem ra tri thức hỗ trợ cho dữ liệu điacutech đoacute
Viacute dụ suy diễn lugravei
R1 Nếu coacute A vagrave B thigrave suy ra coacute D
R2 Nếu coacute B thigrave suy ra coacute C
R3 Nếu coacute C vagrave D thigrave suy ra coacute E
Ta coacute E ta xem trong 3 luật R1 R2 R3 luật nagraveo coacute E ta thấy R3 chứa E đồng thời chứa C vagrave D Xeacutet tiếp trong 2 luật R1 R2 luật nagraveo chứa C vagrave D R2 chứa C R3 chứa D Từ đoacute ta coacute được caacutec tri thức hỗ trợ suy diễn vagrave kết luận lagrave nếu coacute A vagrave B thigrave sẽ coacute E Hay nếu A vagrave B đuacuteng thigrave sẽ coacute E
Viacute dụ suy diễn tiến
Giả sử coacute tập chứa 3 luật sau
R1 Nếu coacute A vagrave B thigrave suy ra coacute D
R2 Nếu coacute B thigrave suy ra coacute C
R3 Nếu coacute C vagrave D thigrave suy ra coacute E
Nếu ta coacute A vagrave B thigrave chuacuteng ta suy ra được D từ R1 vagrave suy ra C từ R2 Với D vagrave C đatilde được suy ra ở trecircn giờ chuacuteng ta suy ra được E từ R3
Viacute dụ thực tế
Giả sử muốn biết magraveu của một con vật nuocirci tecircn lagrave Fred biết rằng noacute kecircu ộp ộp vagrave ăn ruồi
Coacute tập 4 luật ban đầu như sau
R1 Nếu X kecircu ộp ộp vagrave ăn ruồi thigrave X lagrave con ếch
R2 Nếu X kecircu chiecircm chiếp vagrave biết hoacutet thigrave X lagrave con chim
R3 Nếu X lagrave con ếch thigrave X coacute magraveu xanh
R4 Nếu X lagrave con chim thigrave X coacute magraveu vagraveng
74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia
Expert system shells lagrave một tập caacutec goacutei phần mềm vagrave caacutec cocircng cụ dugraveng để phaacutet triển caacutec hệ chuyecircn gia
Những Expert system shells đầu tiecircn thường rất rườm ragrave Mặc dugrave vậy noacute vẫn giuacutep cho người sử dụng sẽ khocircng phải bắt đầu lại từ đầu khi xacircy dựng một hệ chuyecircn gia mới
Những shell hiện đại bao gồm hai mocirc-đun chiacutenh lagrave cocircng cụ xacircy dựng một tập quy tắc vagrave mocirc tơ suy diễn
Xacircy dựng hệ chuyecircn gia
Bước 1 xacircy dựng mocirc higravenh bagravei toaacuten xaacutec định vấn đề nhiệm vụ magrave hệ thống sẽ thực hiện Caacutec dạng bagravei toaacuten cần hệ chuyecircn gia
Bagravei toaacuten diễn giải (InterPretation)
Bagravei toaacuten dự baacuteo (Prediction)
Bagravei toaacuten chuẩn đoaacuten (Diagnose)
Bagravei toaacuten gỡ rối (Debugging)
Bagravei toaacuten thiết kế
Tương tự như một dự aacuten phần mềm để xacircy dựng một hệ chuyecircn gia cần phải coacute caacutec yếu tố về nhacircn lực tagravei nguyecircn vagrave thời gian Những yếu tố nagravey ảnh hưởng đến giaacute thah của một hệ chuyecircn giaTrong phần nagravey cacircu hỏi thường được đặt ra lagrave tại sao cần phải xacircy dựng một hệ chuyecircn giaTrước khi bắt đầu phải xaacute định rotilde bagravei toaacuten đạt ra lagrave jiAi lagrave chuyecircn giaAi lagrave người sử dụng
1 Diễn giải (InterPretation) Nghiecircn cứu 1 vấn đề -gt Dựa trecircn những biểu hiện thuộc tiacutenh đặc trưng becircn ngoagravei -gt Tư vấn
(hoặc đưa ra kết luận hay mocirc tả dễ hiểu từ tập dữ liệu thocirc)
2 Bagravei toaacuten dự baacuteo (Prediction) Coacute thể dự đoaacuten được hagravenh vi kết quả dựa trecircn caacutec hiện tượng -gt dự baacuteo
VD Dự baacuteo thời tiết động đấthellip
3 Bagravei toaacuten chẩn đoaacuten (Diagnoss) Xaacutec định caacutec lỗi caacutec bộ phận hỏng hoacutec của hệ thống dựa trecircn caacutec dữ liệu quan saacutet được
4 Bagravei toaacuten gỡ rối (Debugging) Mocirc tả caacutec phương phaacutep khắc phục hệ thống khi gặp sự cố
5 Bagravei toaacuten thiết kế Lựa chọn cấu higravenh caacutec đối tượng nhằm thoả matilden một số ragraveng buộc nagraveo đoacute
6 Giảng dạy Phần mềm dạy học coacute thể chuẩn đoaacuten vagrave sủa lỗi của học sinh trong quaacute trigravenh học tập
Để xaacutec định đuacuteng bagravei toaacuten magrave chuacuteng ta cần giải quyết thigrave phải trả lời đc một số cacircu hỏi
- cần hệ chuyecircn gia
Bước 2 thu thập tri thức lựa chọn cocircng cụ vagrave aacutep dụng
Trong bước thu thập tri thức vấn đề quan trọng lagrave lựa chọn chuyecircn gia những người magrave sẽ đoacuteng goacutep tri thức cho hệ thống Thocircng thường trong suốt quaacute trigravenh phaacutet triển thigrave chuyecircn gia được xem như một thagravenh viecircn của đội phaacutet triển
Hiện nay coacute rất nhiều cocircng cụ để xacircy dựng một hệ chuyecircn gia Phổ biến nhất lagrave JESS CLIPS vagrave OPS5
Bước 3 Thiết kế cơ sở tri thức thiết kế hệ thốngTri thức được biểu diễn trường minh trong cơ sở tri thức
Caacutec chuyecircn gia vagrave kỹ sư tri thức sẽ đối thoại với nhau bằng caacutec kỹ thuật đối thoại Suy diễn (SD) bảng Mocirc higravenh hoacutea SD quy nạp phacircn loại
Vấn đề bagraveo trigrave vagrave phaacutet triển
Caacutec hệ chuyecircn gia đogravei hỏi phải bảo trigrave vagrave phaacutet triển nhiều hơn so với caacutec hệ thống khaacutec Phải thường xuyecircn bổ sung tri thức mới vagrave thay đổi caacutec tri thức cũ để đổi mới hệ chuyecircn gia
Thu thập vagrave khắc phục lỗi do người sử dụng phaacutet hiện để kịp thời khắc phục những sai soacutet của hệ chuyecircn gia
75 Lợi iacutech vagrave hạn chế của caacutec hệ chuyecircn gia
Một số lợi iacutech chiacutenh
Thời gian trả lời hợp lyacute bằng hoặc nhanh hơn so với chuyecircn gia (người) để đi đến cugraveng một quyết định Hệ chuyecircn gia lagrave một hệ thống thời gian thực (real time system)
Khả năng trả lời với mức độ tinh thocircng bằng hoặc cao hơn so với chuyecircn gia (người) trong cugraveng lĩnh vực
Hệ chuyecircn gia giuacutep cho hiệu quả lagravem việc tăng bằng việc sử dụng tập caacutec luật một caacutech nhanh choacuteng magrave ko bị nhầm lẫn chuyecircn gia lagrave người coacute thể quecircn đi một số tri thức cơ sở lyacute luậ nhưng HCG thigrave ko
Quyết định của một người chuyecircn gia coacute thể bị thay đổi vagrave ko coacute tiacutenh thống nhất như quyết định của một hệ chuyecircn gia tạo ra
Hệ chuyecircn gia giuacutep cho người sử dụng coacute thể trau dồi sự hiểu biết trecircn lĩnh vuej cụ thể magrave noacute giải quyết hỗ trợ người ra quyết định coacute trigravenh độ như 1 chuyecircn gia trong quaacute trigravenh gia quyết định
Kiến thức của rất nhiều chuyecircn gia về một lĩnh vực nagraveo đoacute được đưa vagraveo hệ chuyecircn gia lagravem cho CSTT cuat HCG phong phuacute vagrave rộng lớn hơn rất nhiều
HCG giải thiacutech caacutec bước suy luận một caacutech dễ hiểu nhất quaacuten luacutec nagraveo cũng coacute thể sử dụng ko như chuyecircn gia con người
Hạn chế của caacutec hệ chuyecircn gia
Nhược điểm lớn nhất của hệ chuyecircn gia lagrave những yacute kiến chuyecircn mocircn thường rất khoacute matilde hoacutea vagrave giải neacuten
Hệ chuyecircn gia khocircng coacute khả năng tự học tự cập nhật kiến thức mới như caacutec chuyecircn gia magrave cần phải được matilde hoacutea lại khi noacute được cập nhật
Hệ chuyecircn gia khocircng thể nhận ra được vấn đề khocircng nằm trong miền kiến thức của hệ thống
Chương 8 Tri thức vagrave tiếp nhận
1 Bao gồm caacutec vấn đề
Dữ liệu thực tế đo lường hoặc quan saacutet coacute hoặc khocircng coacute bối cảnh
Thocircng tin dữ liệu được tổng hợp một caacutech hữu iacutech để giải quyết những khoacute khăn trong việc đưa ra quyết định
Tri thức bao gồm caacutec ứng dụng quy tắc thocircng tin hướng dẫn của người ra quyết định
2 Những caacutei nhigraven về tri thức
Đại diện lagravem thế nagraveo để diễn tả tri thức viacute dụ như một quyển saacutech khocircng phải lagrave tri thức nhưng noacute lại lagrave một đại diện của tri thức
Sản xuất tri thức lagrave một tập hơp của hagraveng tồn kho coacute thể được sản xuất cũng như mua lại
Tri thức lagrave 1 trong 6 trạng thaacutei của hệ thống
1Dữ liệu 2Thocircng tin 3Cấu truacutec thocircng tin 4Sự thấu hiểu 5Yacute kiến 6 Quyết định
3 Caacutec loại tri thức Phổ biến mocirc tả dữ liệu thocircng tin thủ tục mọi thứ lagravem như thế nagraveo lập luận chiacutenh saacutech hoặc caacutec quy tắc
4 Thu thập Tri thức hệ chuyecircn gia Hầu hết caacutec phương phaacutep đều bắt đầu với mocirc higravenh của caacutec taacutec vụ trong đoacute
hệ chuyecircn gia được xacircy dựng Trong đoacute mocirc tả về caacutec lĩnh vực được tạo ra Caacutec kỹ sư sử dụng caacutec mocirc higravenh giả thuyết vagrave nhận thức về quaacute trigravenh phacircn
tiacutech để gợi ra caacutech giải quyết vấn đề về tri thức từ caacutec chuyecircn gia
5 Caacutec chiều của thu thập tri thức KE- driven caacutec kỹ sư trao đổi trực tiếp với caacutec chuyecircn gia Expert-driven Caacutec chuyecircn gia trực tiếp đưa chuyecircn mocircn của họ vagraveo hệ
thống maacutey tiacutenh Machine-driven Sử dụng caacutec cocircng cụ suy luận để triacutech xuất tri thức từ một
tập caacutec viacute dụ
6 Kỹ thuật thu thập tri thức Trao đổi gồm 2 loại cơ bản lagrave coacute cấu truacutec(coacute kịch bản) vagrave khocircng coacute cấu
truacutec( đối thoại trực tiếp) Giao thức phacircn tiacutech bằng lời Khi caacutec chuyecircn gia thực hiện một cocircng việc
của họ thigrave một bản ghi về cocircng việc đoacute được thực hiện Caacutec kỹ sư sẽ xacircy dựng mocirc higravenh cho những gigrave được ghi lại trong bản ghi
Phương phaacutep sagraveng lọc caacutec chuyecircn gia so saacutenh caacutec nhoacutem liecircn tiếp trong ba đối tượng vagrave cho biết tại sao nhoacutem thứ hai lại khaacutec nhoacutem thứ ba
7 Thu thập tri thức từ nhiều nguồn Thu thập tri thức từ nhiều nguồn lagrave cần thiết để coacute được đầy đủ caacutec tri thức
cho một vấn đề quan điểm yacute kiến traacutei ngược nhau thường phaacutet sinh Phương phaacutep đồng thuận sẽ giuacutep giải quyết được vấn đề macircu thuẫn Kỹ thuật phacircn tiacutech Meta lagrave kỹ thuật được aacutep dụng trong caacutec trường hợp
khaacutec Caacutech tiếp cận bằng định lượng đogravei hỏi caacutec kỹ sư cần cacircn nhắc yếu tố đầu vagraveo của caacutec chuyecircn gia khaacutec nhau
8 Xaacutec nhận hợp lệ vagrave kiểm tra tri thức Một khi thu thập tri thức noacute phải được đaacutenh giaacute về khả năng sử dụng vagrave độ
chiacutenh xaacutec Hai vấn đề cụ thể lagrave hiệu lực của những kiến thức vagrave kiểm tra việc xacircy dựng cơ sở của tri thức
Cần xaacutec nhận xem liệu hệ thống coacute thể hoạt động ở mức độ tối thiểu khocircng
Xaacutec minh liecircn quan đến việc so saacutenh từng chi tiết kỹ thuật của hệ thống những gigrave đatilde được thực hiện cuối cugraveng
9 Một số caacutec biện phaacutep xaacutec nhận Độ chiacutenh xaacutec Khả năng thiacutech nghi Mức độ đầy đủ Bề rộng Độ sacircu Hiệu lực Tổng quan Chiacutenh xaacutec Hiện thực Độ tin cậy Tiacutenh hữu dụng Mức độ
Chương 9 Học maacutey
1 Logic mờ vagrave ngocircn ngữ mờ(Fuzzy Logic and Linguistic Ambiguity)
Ngocircn ngữ tự nhiecircn gồm những khaacutei niệm mơ hồ vagrave khocircng chiacutenh xaacutectruyền tải ngữ nghĩa thocircng qua tiacutenh xấp xỉkhocircng rotilde ragraveng
Những xấp xỉ nagravey giuacutep con người coacute thể truyền tải hết được yacute nghĩa nhưng maacutey thigrave khocircng hiểu
Lagravem sao biểu diễn caacutec tri thức sử dụng caacutec khaacutei niệm khocircng rotilde ragraveng(mờ) hoặc khocircng chiacutenh xaacutec
2 Khaacutei niệm cơ bản của logic mờ tập mờ lagrave những tập hợp khocircng coacute một giới hạn rotilde Mỗi phần tử của noacute chỉ
chứa một mức độ hagravem liecircn thuộc của từng phần tử Vigrave vậy tập mờ khocircng giống như tập cổ điển Tập mờ coacute thể kết hợp với nhau qua những luật mờ magrave đặc trưng cho những hagravenh động trạng thaacutei vagrave thuộc tiacutenh của logic mờ được tận dụng khi thực hiện một bộ điều khiển mờ
Logic mờ dựa trecircn yacute tưởng mỗi phần tử thuộc vagraveo một tập hợp ở một mức độ nagraveo đấy
Locircgic mờ cho pheacutep độ liecircn thuộc (microA )coacute giaacute trị trong khoảng (01) Locircgic mờ coacute thể được coi lagrave mặt ứng dụng của lyacute thuyết tập mờ để xử lyacute caacutec
giaacute trị trong thế giới thực cho caacutec bagravei toaacuten phức tạp
3 So saacutenh tiacutenh đuacuteng đắn logic mờ vagrave xaacutec suất Xaacutec suất thigrave đề cập đến khả năng xảy ra một biến cố hay một điều gigrave đoacute Logic mờ đề cập đến cấp độ magrave đặc tiacutenh ở hiện tại
o viacute dụ1 người coacute chiều cao 6 feet thigrave coacute cấp độ lagrave 05 về chiều cao
4 Ưu điểm của logic mờ Caacutech tiếp cận rất tự nhiecircnkhocircng phức tạp Coacute thể mocirc higravenh hoacutea caacutec hagravem phi tuyến tugravey yacute phức tạp
Coacute thể tận dụng được kinh nghiệm từ những chuyecircn gia hagraveng đầu trong mọi lĩnh vực
Logic mờ được xacircy dựng dựa trecircn ngocircn ngữ tự nhiecircnNền tảng của logic mờ lagrave dựa trecircn cơ sở giao tiếp của con người
5 Nhược điểm của logic mờ Trong 1 hệ thống phức tạpsử dụng logic mờ coacute thể trở thagravenh trở ngại cho
việc xaacutec thực độ tin cậy của hệ thống Cơ chế lập luận mờ khocircng thể học hỏi từ những lỗi sai
6 Mạng noron nhacircn tạo(ANN) Mạng noron nhacircn tạo lagrave một mocirc phỏng xử lyacute thocircng tinđược nghiecircn cứu ra
từ hệ thống thần kinh của sinh vậtgiống như bộ natildeo để xử lyacute thocircng tin ANNs lagrave chương trigravenh dựa trecircn maacutey tiacutenh đơn giản coacute chức năng lagrave một mocirc
higravenh bagravei toaacuten khocircng gian dựa trecircn thử nghiệm vagrave baacuteo lỗi
7 Học từ kinh nghiệm Tiến trigravenh Một mẫu dữ liệu được biểu diễn như một mạng lưới noronANN ldquodự
đoaacutenrdquo 1 đầu radự đoaacuten được so saacutenh với giaacute trị thực tế hoặc giaacute trị chiacutenh xaacutecNếu đoaacuten được chiacutenh xaacutec thigrave khocircng coacute hagravenh động nagraveo được thực hiện
Nếu dự đoaacuten sai ANN kiểm tra lại vagrave xaacutec định lại thocircng số để điều chỉnh Một mẫu dữ liệu khaacutec được biểu diễn vagrave quaacute trigravenh nagravey được lặp lại
8 Nguyecircn tắc cơ bản của cocircng nghệ nơron Caacutec yếu tố xử lyacute cơ bản trong hệ thống thần kinh của con người lagrave tế bagraveo
thần kinhMạng lưới của tế bagraveo nagravey lagrave liecircn kết với nhau nhận được thocircng tin từ caacutec cảm biến trong mắt taihellip
Thocircng tin nhận được bởi tế bagraveo thần kinh hoặc lagrave sẽ kiacutech thiacutech noacute(sẽ được chuyển qua 1 thocircng điệp dọc theo mạng lưới) hoặc lagrave sẽ ngăn cản noacute(ngăn cản dograveng thocircng tin)
Độ nhạy coacute thể thay đổi qua thời gian hoặc sau khi coacute được kinh nghiệm
9 Cấu truacutec mạng Một ANN gồm 3 lớp cơ bản
Lớp đầu vagraveo nhận dữ liệu Lớp becircn trong hoặc lagrave lớp ẩn xử lyacute dữ liệu Lớp đầu ra chuyển tiếp kết quả cuối cugraveng của mạng
10Mạng nơ ron Thường coacute nhiều đầu vagraveo mỗi đầu vagraveo với mức ảnh hưởng vagrave tầm quan
trọng riecircng của noacute Một đầu vagraveo quan trọng coacute thể được sử dụng để khuếch đại đầu ra caacutec hagravem trạng thaacutei tổng hợp caacutec trọng số của caacutec yếu tố
đầuvagraveo khaacutec nhauvagraveo một giaacute trị duy nhất Caacutec hagravem chuyển giao xử lyacute caacutec giaacute trị trạng thaacutei vagrave tạo đầu ra
11Huấn luyện mạng nơ ron Trong mocirc higravenh coacute giaacutem saacutetANN được đến so saacutenh dự đoaacuten của chiacutenh
noacute với thocircng tin phản hồi coacute chứa caacutec kết quả mong muốn ANN sẽ phải tigravem caacutech thay đổi caacutec tham số becircn trong củamigravenh (caacutec trọng số vagrave caacutec ngưỡng) để tạo necircn một aacutenh xạ coacute khả năng aacutenh xạcaacutec đầu vagraveo thagravenh caacutec đầu ra mong muốn Sự thay đổi nagravey được tiến hagravenh nhờ việc so saacutenh giữa đầu ra thực sự vagrave đầu ra mong muốn
Trong mocirc higravenh khocircng coacute giaacutem saacutetANN nhận được dữ liệu vagraveo nhưng khocircng phải coacute bất kỳ thocircng tin phản hồi về kết quả mong muốn
Phần lớn caacutec ứng dụng nằm trong vugraveng của caacutec bagravei toaacuten ước lượng như mocirc higravenh hoacuteathống kecirc neacuten lọc phacircn cụm
12Lợi iacutech Liecircn kết với mạng noron Traacutenh caacutech lập trigravenh tường minh Giảm nhu cầu của chuyecircn gia ANNs thigrave thiacutech nghi với caacutec yếu tố đầu vagraveo thay đổi Khocircng cần thiết cho cơ sở tri thức tinh chế ANNs coacute tiacutenh động vagrave cải thiện với việc sử dụng Coacute khả năng xử lyacute dữ liệu khocircng chiacutenh xaacutec hoặc khocircng đầy đủ Cho pheacutep tổng quaacutet hoacutea từ thocircng tin cụ thể Cho pheacutep thu thập cảm giaacutec thocircng thường vagraveo miền giải quyết vấn đề
13Hạn chế của việc liecircn kết với mạng noron ANNs khocircng thể giải thiacutech được suy luận Bản chất hộp đen thường khiến cho vấn đề traacutech nhiệm vagrave độ tin cậy phaacutet
sinh lagrave khoacute khăn Lặp đi lặp lại quaacute trigravenh huấn luyện rất tốn thời gian Nguồn lực caacutec nhagrave phacircn tiacutech vagrave thiết kế coacute tay nghề cao vẫn lagrave đaacuteng lo
ngại Cocircng nghệ ANN thuacutec đẩy hạn chế của phần cứng hiện tại ANN yecircu cầu phải coacute sự tin tưởng ở đầu ra
14Giới thiệu về thuật toaacuten di truyền Cũng như mạng lưới thần kinh caacutec thuật toaacuten di truyền được dựa trecircn lyacute
thuyết sinh học Thuật toaacuten di truyền tigravem thấy nguồn gốc của chuacuteng trong caacutec lyacute thuyết
tiến hoacutea của chọn lọc tự nhiecircn vagrave thiacutech ứng với biến đổi khiacute hậu Kết quả thuật toaacuten di truyền lagrave từ giao phối 2 caacute thể trong quần thế để tạo
ra con caacutei đocirci khi tốt hơn so với bậc cha mẹ của chuacuteng 15Caacutec thagravenh phần cơ bản của thuật toaacuten di truyền
Toaacuten tử chọn lọc Caacutec caacute thể tốt được chọn lọc để đưa vagraveo thế hệ sau Sự chọn lọc nagravey căn cứ vagraveo độ thiacutech nghi với mocirci trường của mỗi caacute thể
Toaacuten tử lai gheacutep (crossover) Hai caacute thể cha vagrave mẹ trao đổi caacutec gen với nhau để tạo ra caacute thể con
Toaacuten tử đột biến (mutation) Một caacute thể thay đổi một số gen để biến đổi thagravenh một caacute thể mớiTất cả caacutec toaacuten tử trecircn khi thực hiện đều mang tiacutenh ngẫu nhiecircn
16Quaacute trigravenh cơ bản của một thuật toaacuten di truyền Khởi tạo
Đaacutenh giaacute quần thể
Lựa chọn NST thiacutech hợp nhất vagrave loại bỏ NST yếu nhất
Quy trigravenh giao nhau vagrave cải thiện quần thể
đột biến tiến trigravenh để khaacutem phaacute ra NST mới
17Ưu nhược điểm của việc kết hợp với thuật toaacuten di truyền Kiacutech thước quần thể lagrave 1 yếu tố quan trọng trong tốc độ của việc tigravem
kiếmnhưng noacute tương đối dễ dagraveng để dự đoaacuten tốc độ nagravey Giao nhau hoặc đột biến lagrave khocircng necircn đc sử dụng quaacute thường xuyecircn Luocircn coacute được iacutet nhất 1 giải phaacutep hợp lyacute Necircn coacute thể aacutep dụng chuacuteng cho caacutec vấn đề magrave chuacuteng ta khocircng coacute hướng
về caacutech giải quyết Sức mạnh của thuật toaacuten xuất phaacutet từ khaacutei niệm đơn giảnkhocircng phải từ
một thủ tục thuật toaacuten phức tạp 18Tương lai của học maacutey
Mạng lưới thần kinh nhacircn tạo vượt quaacute năng lực của con người trong caacutec trường hợp bị cocirc lập
Về mặt lyacute thuyếtmột maacutey tiacutenh coacute thể xử lyacute dũ liệu nhanh hơn hagraveng triệu lần so với 1 con người
May mắn thay cho chuacuteng tacon người tốt hơn nhiều khi magrave coacute được dữ liệumaacutey tiacutenh khocircng coacute 1 số thứ như lagrave 5 giaacutec quan
CHƯƠNG 10 KHO DỮ LIỆU
1 Kho dữ liệu Kho dữ liệu lagrave tuyển tập caacutec cơ sở dữ liệu tiacutech hợp hướng chủ đề được
thiết kế để trợ giuacutep cho một hệ hỗ trợ quyết định
Theo John Ladley Cocircng nghệ kho dữ liệu lagrave tập caacutec phương phaacutep kỹ thuật vagrave caacutec cocircng cụ coacute thể kết hợp hỗ trợ nhau để cung cấp thocircng tin cho người sử dụng trecircn cơ sở tiacutech hợp từ nhiều nguồn dữ liệu nhiều mocirci trường khaacutec nhau
Kho dữ liệu thường rất lớn tới hagraveng trăm GB hay thậm chiacute hagraveng Terabyte
2 Kho dữ liệu vận hagravenh (ODS) Một kho dữ liệu vận hagravenh Aacutep dụng kỹ thuật kho dữ liệu vagraveo caacutec hệ xử
lyacute giao taacutec lưu trữ dữ liệu cho một ứng dụng đặc thugrave Noacute đưa vagraveo kho dữ liệu một dograveng caacutec dữ liệu thocirc được thiết kế
3 So saacutenh
Kho dữ liệu vận hagravenh Kho dữ liệu
Dữ liệu theo chủ đề Dữ liệu theo chủ đề
Dữ liệu tiacutech hợp Dữ liệu tiacutech hợp
Dữ liệu thay đổi Dữ liệu khocircng thay đổi
Dữ liệu được cập nhật khi thay đổi
Dữ liệu giữ nguyecircn
Chỉ coacute dữ liệu hiện tạiDữliệu hiện tại vagrave dữ liệu lịch sử
Chu kỳ lagravem tươi dữ liệu ngắn Chu kỳ lagravem tươi dữ liệu dagravei
Chỉ coacute dữ liệu chi tiết Dữ liệu chi tiết vagrave dữ liệu tổng kết
Dugraveng cho caacutec quyết định ngắn hạn
Dugraveng cho hoạch định dagravei hạn
4 Kho dữ liệu cục bộ (Data Mart - DM)
Kho dữ liệu cục bộ lagrave CSDL coacute những đặc điểm giống với kho dữ liệu nhưng với quy mocirc nhỏ hơn vagrave lưu trữ dữ liệu về một lĩnh vực một chuyecircn ngagravenh
Data mart phụ thuộc Chứa những dữ liệu được lấy từ DW vagrave những dữ liệu nagravey sẽ được triacutech lọc vagrave tinh chế tiacutech hợp lại ở mức cao hơn để phục vụ một chủ đề nhất định của Datamart
Data mart độc lập Khocircng giống như Datamart phụ thuộc Data mart độc lập được xacircy dựng trước DW vagrave dữ liệu được trực tiếp lấy từ caacutec nguồn khaacutec nhau
5 Siecircu dữ liệu Metadata lagrave dữ liệu để mocirc tả dữ liệu Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột
một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi Metadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu
6 Mocirci trường kho dữ liệu Hệ thống của tổ chức vagrave kho cung cấp dữ liệu để xacircy dựng kho dữ liệu Trong quaacute trigravenh chuyển dữ liệu từ caacutec nguồn khaacutec nhau dữ liệu coacute thể
được lagravem sạch hoặc chuyển đổi vagrave vigrave thế DW được xem như lagrave một chuẩn cho việc lưu trữ
Đồng thời siecircu dữ liệu được ghi lại Cuối cugraveng DW hoặc siecircu thị coacute thể được sử dụng để tạo ra một kho dữ
liệu ldquocaacute nhacircnrdquo 7 Caacutec đặc điểm của kho dữ liệu
Đặc điểm Mocirc tả
Hướng chủ đề - DL tổ chức theo caacutech thức người dugraveng tham chiếu
Tiacutech hợp - Dữ liệu ldquosạchrdquo loại bỏ tiacutenh thiếu nhất quaacuten
Khocircng thay đổi - DL ldquochỉ đọcrdquo người dugraveng khocircng thay đổi được
Chuỗi thời gian - DL lagrave chuỗi thời gian khocircng phải lagrave trạng thaacutei hiện tại
Được tổng kết - DL vận hagravenhthao taacutec khi cần thiết
được kết hợp lại thagravenh dạng coacute thể dugraveng được cho quyết định
Kiacutech cỡ lớn hơn - Lưu giữ theo chuỗi thời gian tức lagrave giữ lại nhiều DL
Khocircng được chuẩn hoacutea - Coacute thể dư thừa DLSiecircu dữ liệu - Dữ liệu của dữ liệu được lưu trữNguồn dữ liệu - DL vận hagravenh (caacutec hệ sẵn coacute) cugraveng
với caacutec nguồn ngoagravei 8 Kho dữ liệu hướng chủ đề
Hướng chủ để coacute nghĩa lagrave kho dữ liệu được tổ chức xung quanh caacutec chủ đề chiacutenh như khaacutech hagraveng sản phẩm sản xuất Tập trung vagraveo việc mocirc higravenh hoacutea vagrave phacircn tiacutech dữ liệu cho caacutec nhagrave ra quyết định magrave khocircng tập trung vagraveo caacutec xử lyacute thocircng thường Cung cấp cho người dugraveng một khung nhigraven toagraven vẹn đơn giản vagrave đầy đủ về caacutec sự kiện quanh caacutec chủ đề
9 Dữ liệu trong DW được tiacutech hợp Dữ liệu trong kho dữ liệu được xacircy dựng bằng caacutech tổng hợp dữ liệu từ
nhiều nguồn khaacutec nhau vagrave caacutec nguồn coacute tổ chức khaacutec nhau Cơ sở dữ liệu caacutec file excel caacutec flat file hoặc caacutec raw file Khi đưa vagraveo kho dữ liệu caacutec dữ liệu được lagravem sạch vagrave tiacutech hợp dữ liệu nhằm đảm bảo tiacutenh nhất quaacuten của dữ liệu
10Kiến truacutec kho dữ liệu Tầng cơ sở dữ liệu hoạt động Tầng truy xuất thocircng tin Tầng truy xuất dữ liệu Tầng siecircu dữ liệu Tầng quản lyacute tiến trigravenh Tầng thocircng điệp của ứng dụng Tầng vật liacute của kho dữ liệu Tầng trigravenh diễn dữ liệu
11Higravenh trạng kho dữ liệu Kho dữ liệu ảo - người dugraveng cuối coacute thể truy cập trực tiếp đến kho dữ liệu
sử dụng caacutec cocircng cụ cho pheacutep ở tầng truy xuất dữ liệu Kho dữ liệu trung tacircm-1 cơ sở dữ liệu vật lyacute chứa tất cả dữ liệu cho một
vugraveng chuyecircn dụng nagraveo đoacute
Kho dữ liệu phacircn taacuten- Thagravenh phần được phacircn taacuten qua nhiều hệ cơ sở dữ liệu vật lyacute
12METADATA- Siecircu dữ liệu Định nghĩa Siecircu dữ liệu lagrave dữ liệu về dữ liệu Lagrave 1 lưu trữ dugraveng để
Miecircu tả kho dữ liệu tổng thể Nhận dạng kiểu kho dữ liệu Quản liacute quaacute trigravenh tiacutech hợp dữ liệu Quản liacute quaacute trigravenh cập nhật kho dữ liệu Quản liacute bảo mật
Lagrave chigravea khoacutea quyết định sự thagravenh cocircng của kho dữ liệu luocircn được thay đổi vagrave cập nhật theo sự phaacutet triển của kho dữ liệu
Dugraveng để quản liacute điều khiển kho dữ liệu Sự ra đời của kho dữ liệu như 1 cấu truacutec hỗ trợ ra quyết định siecircu dữ liệu
được xem như nguồn tagravei nguyecircn dữ liệu Siecircu dữ liệu lagrave trừu tượng Chuacuteng lagrave dữ liệu bậc cao cung cấp mocirc tả ngắn
gọn caacutec dữ liệu bậc thấp hơn 13Hoạt động của Siecircu dữ liệu
Siecircu dữ liệu rất cần thiết trong việc chuyển hoacutea thocircng tin trở thagravenh tri thức Lagrave chigravea khoacutea giuacutep chuacuteng ta xử lyacute được dữ liệu thocirc Viacute dụ một dograveng dữ liệu baacuten hagraveng 1023 K596 11121 agraveNoacute sẽ khocircng coacute nghĩa gigrave cho đến khi chuacuteng ta đưa vagraveo siecircu dữ liệu (thư
mục chứa dữ liệu) agrave cửa hagraveng 1023 sản phẩm K596 vagrave số tiền baacuten được lagrave 11121 đocirc la
14Sự cần thiết phải nhất quaacuten trong kho dữ liệu Kho dữ liệu được xacircy dựng cho lợi iacutech của những nhagrave phacircn tiacutech kinh
doanh caacutec nhagrave quản trị cho tất cả caacutec khu vực chức năng Trong cơ sở dữ liệu riecircng caacutec khu vực khaacutec nhau coacute thể định nghĩa vagrave lưu
trữ dữ liệu thocircng qua phiecircn bản của chiacutenh noacute Khi dữ liệu được lấy từ những vugraveng khaacutec nhau đoacute vagrave được đặt vagraveo kho dữ
liệu Việc chuyển đổi vagrave lagravem sạch caacutec tiến trigravenh sẽ đảm bảo noacute lagrave duy nhất được tiacutech hợp tại một mức của tổ chức
15Ragrave soaacutet lại dữ liệu ndash Thực thi siecircu dữ liệu
Bất kể cấu truacutec tự nhiecircn của 1 cacircu truy vấn thế nagraveo thigrave caacutec thagravenh phần của siecircu dữ liệu rất quan trọng đối với người ra quyết định
Bảng thuộc tiacutenh khoacutea được lưu trữ bởi kho dữ liệu Tập hợp dữ liệu được lấy từ đacircu Những chuyển đổi nagraveo được thực thi với việc lagravem sạch
16Siecircu dữ liệu lagrave gigrave Metadata - lagrave thocircng tin mocirc tả nội dung của cơ sở dữ liệu (CSDL) Metadata baacuteo cho người dugraveng biết thời gian cập nhật sau cugraveng của dữ liệu
định dạng vagrave mục điacutech sử dụng của noacute Những thocircng tin nagravey coacute thể hướng dẫn người dugraveng duyệt qua CSDL vagrave
giuacutep họ hiểu được yacute nghĩa vagrave ngữ cảnh của dữ liệu Trong CSDL metadata lagrave caacutec dạng biểu diễn khaacutec nhau của caacutec đối tượng
trong CSDL Trong CSDL quan hệ metadata lagrave caacutec định nghĩa của bảng cột CSDL
view vagrave nhiều đối tượng khaacutec Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột
một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi -gtMetadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu
Bảng chuyển đổi Ghi lại những chuyển đổi đatilde được thực hiện
Lịch sử thực thi Ghi lại những dữ liệu đatilde được
phacircn tiacutech
Higravenh thaacutei kết nốiGhi lại những dữ liệu được kết nối vagrave tần suất
17Aacutenh xạ thocircng thường của siecircu dữ liệu Bản ghi aacutenh xạ chuyển đổi bao gồm
Định danh của nguồn gốc Chuyển đổi thuộc tiacutenh Chuyển đổi thuộc tiacutenh vật lyacute Matilde hoacutea tham chiếu bảng chuyển đổi Đổi tecircn Đổi khoacutea Gaacuten giaacute trị cho thuộc tiacutenh mặc định Chọn logic cho caacutec nguồn nhiều giaacute trị Đổi thuật toaacuten
18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để
phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai
lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave
tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec
Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm
Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo
19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua
caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau
SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được
Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra
một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức
Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ
Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ
Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech
CHƯƠNG 11 KHAI PHAacute DỮ LIỆU
1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn
ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993
Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng
2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd
1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều
2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP
3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn
4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng
5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server
6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo
7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động
8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời
9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều
10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện
11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech
12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP
3 Xử lyacute phacircn tiacutech trực tuyến OLAP
MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave
dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu
ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave
thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu
HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave
ROLAP4 Khai phaacute dữ liệu
Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh
khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn
Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan
5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp
6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại
Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp
Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec
Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt
Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra
Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh
vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho
Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec
Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm
Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục
Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng
gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp
Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn
Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec
Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper
Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2
Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25
Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước
Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng
Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện
trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp
Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute
độ hỗ trợ ge ngưỡng minsup
độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan
Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn
Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết
Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu
MOLAP ROLAP HOLAP
Lưu trữ dữ liệu cơ sở
Khối Bảng quan hệ Bảng quan hệ
Lưu trữ thocircng tin tổng hợp
Khối Bảng quan hệ Khối
Hiệu suất thực hiện truy vấn
Nhanh nhất Chậm nhất Nhanh
Tiecircu thụ khocircng gian lưu trữ
Nhiều Thấp Trung bigravenh
Chi phiacute bảo trigrave Cao Thấp Trung bigravenh
- Việcphaacutet triểncấu truacutecnecircn được theo dotildeitừ quaacute trigravenh thiết kế đến quaacute trigravenhthực hiện
- Tuy nhiecircn một dự aacuten phaacutet triển EIScoacute xu hướnglagrave thống nhấtvagraveyecircu cầu hỗ trợ caacutec nhagrave quản lyacute latildenh đạo
- Xacircy dựng một EIScoacute thểphaacutet hiện ra đượccaacutectigravenh huống khoacute khănmagravemột nhagrave phaacutet triển chưabao giờ gặp phải
Mocirc higravenh EIS
Khung phaacutet triển một EIS
- Watson et al đề nghị xacircy dựngkhung với ba thagravenh phần+ Caacutech tiếp cận tập trung vagraveo yếu tốcon người vagrave dữ liệu coacute liecircn quan đến EIS+ Quaacute trigravenh phaacutet triển cần sự linh hoạt vagrave tương taacutec+ Người sử dụng - hệ thống hộp thoại bao gồm một ngocircn ngữ hagravenh động để xử lyacute caacutec lệnh
Lợi iacutech của EIS- Dễ duy trigrave caacutec mục tiecircu coacute tổ chức- Dễ truy xuất thocircng tin- Cho pheacutep người sử dụng nacircng cao hiệu suất hơn
- Tăng chất lượng ra quyết định- Cung cấp sự cải tiến cạnh tranh- Tiết kiệm thời gian của người sử dụng- Tăng khả năng vagrave chất lượng giao tiếp- Cung cấp khả năng điều khiển tốt hơn trong tổ chức- Cho pheacutep tham gia caacutec vấn đề vagrave caacutec cơ hội- Cho pheacutep hoạch định- Cho pheacutep tigravem kiếm nguyecircn nhacircn của một vấn đề- Thảo matilden caacutec yecircu cầu của người điều hagravenh
Hạn chế của EIS vagrave 1 số sai lầm cần traacutenh
- Chi phiacute một cuộc khảo saacutetnăm1991 chothấychi phiacute phaacutet triểntrungbigravenh365000USDvớichi phiacute vận hagravenhhagraveng năm lagrave$200000 (EIS)
- Cocircng nghệ hạn chếEIScần phảiđượctiacutech hợp hoagraven toagravenvagraveokiếntruacuteccủadoanh nghiệphiện tại do đoacute noacutelagrave một thaacutech thứclớn đối vớithiết kế
- Hạn chế tổ chức cơ cấu tổ chứccoacute thể khocircng phugrave hợp
Sự hạn chế về tổ chức- Chương trigravenh nghị sự vagrave thời gian chệch EIS mocirc tả một phần việc thực hiện một
chương trigravenh nghị sự vagrave coacute thể dễ dagraveng đạt được sự tin cậy một caacutech chắc chắn- Đồng bộ hoacutea việc quản lyacute sự tin cậy đuacuteng luacutec đặc biệt baacuteo caacuteo EIS coacute thể phaacute
vỡ sự ổn định thiết lập caacutec chu trigravenh baacuteo caacuteo một caacutech tốt nhất- Sự bất ổn EIS phản ứng nhanh coacute thể gacircy ra việc taacutec động trở lại một caacutech
nhanh choacuteng dẫn đến sự thiếu ổn định trong tổ chức
Sự thất bại lagrave thay thế khocircng thể chấp nhận được- Một số yếu tố lagravem EIS thất bại
+ Thiếu sự hỗ trợ về mặt quản lyacute+ Vấn đề chiacutenh trị+ Thất bại của nhagrave phaacutet triển+ Lỗi về cocircng nghệ+ Giaacute cả+ Thời gian
66 Ra quyết định điều hagravenh trong tương lai vagrave EIS
- Coacute một vagravei điều kiện sẽ được hợp nhất cho việc chuyển đổi cocircng nghệ Trong đoacute một vagravei điều kiện coacute thể dễ dự đoaacuten Hai điều kiện magrave ta coacute thể thấy lagrave+ Phaacutet triển cocircng nghệ maacutey tiacutenh trong việc điều hagravenh sẽ tạo ra sự chuyển đổi được chấp nhận một caacutech dễ dagraveng hơn+ Mở rộng traacutech nhiệm điều hagravenh sẽ mở rộng nhu cầu thocircng tin
Tương lai của EIS- EIS thocircng minh Những tiến bộ trong cocircng nghệ AI sẽ được triển khai trong caacutec
EIS- EIS đa phương tiện Cơ sở dữ liệu đa phương tiện sẽ cho pheacutep tiacutech hợp văn bản
giọng noacutei vagrave higravenh ảnh trong tương lai- EIS thocircng tin Tương lai EIS sẽ mở rộng hơn trong việc sử dụng dữ liệu becircn
ngoagravei doanh nghiệp- EIS kết nối Giao tiếp với băng thocircng rộng cho pheacutep kết nối liecircn thocircng lớn hơn
Chương 7 HỆ CHUYEcircN GIA VAgrave TRIacute TUỆ NHAcircN TẠO
71 Caacutec khaacutei niệm
72 Triacute thocircng minh của triacute tuệ nhacircn tạo
73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia
74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia
75 Lợi iacutech vagrave hạn chế của hệ chuyecircn gia
71 Caacutec khaacutei niệm
Chuyecircn mocircn (Expertise) sự hiểu biết rộng trong 1 lĩnh vực hẹp
Hệ chuyecircn gia (Expert Systems)1 chương trigravenh maacutey tiacutenh sử dụng 1 tập caacutec luật dựa trecircn tri thức của con người để giải quyết caacutec vấn đề đogravei hogravei phải coacute sự chuyecircn mocircn
Một số hệ chuyecircn gia nổi tiếng
DENDRAL (Standford 1960s Edward Feigenbaum)
MYCIN (Standford1970s Edward Shortliffe)
PROSPECTOR (MIT 1979)
Triacute tuệ nhacircn tạo (Artificial Intelligence ndash AI)
Triacute tuệ nhacircn tạo một bộ phacircn của ngagravenh khoa học maacutey tiacutenh quan tacircm đến việc thiết kế caacutec hệ thống maacutey tiacutenh thocircng minh đoacute lagrave caacutec hệ thống đưa ra caacutec đặc điểm magrave từ đoacute chuacuteng ta liecircn hệ với sự thocircng minh trong hagravenh động của con người (Barr vagrave Feigenbaum 1981)
Mục điacutech của AI
Mục điacutech khoa học xaacutec định caacutec gợi yacute để giải thiacutech caacutec loại khaacutec nhau của triacute tuệ thực
Mục điacutech kỹ thuật giải quyết caacutec vấn đề trong thế giới thực
Triacute tuệ nhacircn tạo kế thừa nhiều yacute tưởng quan điểm kỹ thuật từ caacutec ngagravenh khoa học khaacutec
- Triết học
- Logic Toaacuten học
- Tiacutenh toaacuten
- Khoa học tacircm lyacute Khoa học nhận thức
- Sinh học Thần kinh học
- Tiến hoacutea
Caacutec lĩnh vực ứng dụng trong Triacute tuệ nhacircn tạo
Mạng nơ ron thần kinh (Neural Networks)
Tiacutenh toaacuten sự tiến hoacutea
(Evolutionary Computation)
Hệ chuyecircn gia (Expert Systems)
Kỹ thuật xử lyacute tiếng noacutei (Speech Processing)
Kỹ thuật xử lyacute ngocircn ngữ tự nhiecircn
(Natural Language Processing)
Lập kế hoạch (Planning)
Robot (Robotics)
Khoa học higravenh ảnh (Vision)
Caacutec kỹ thuật thocircng dụng dugraveng trong AI
Biểu diễn(Representation)
Học (Learning)
Caacutec luật (Rules)
Tigravem kiếm (Search)
72 Triacute thocircng minh của triacute tuệ nhacircn tạo
Con người suy diễn như thế nagraveo
Phacircn loại (Categorization)
Caacutec quy tắc cụ thể
Heuristics
Kinh nghiệm trước đoacute
Dự tiacutenh trước
Maacutey tiacutenh suy diễn như thế nagraveo
Lập luận dựa trecircn luật IF-THEN mocirc tả tri thức được matilde hoacutea dưới dạng caacutec luật
Caacutec khung (Frames) lagrave caacutec đại diện mocirc tả caacutec tigravenh huống giống nhau lagrave điển higravenh của một vagravei phacircn loại
Lập luận dựa trecircn caacutec trường hợp mocirc phỏng giải phaacutep trước đoacute cho một vấn đề hiện tại
Nhận dạng mẫu phaacutet hiện acircm thanh higravenh dạng hoặc caacutec chuỗi dagravei
Caacutec dạng khaacutec của Triacute tuệ nhacircn tạo
Học maacutey- mạng nơron vagrave giải thuật di truyền
Lập trigravenh tự động ndash lagrave những kỹ thuật tạo ra caacutec chương trigravenh để lagravem 1 nhiệm vụ riecircng biệt (cho pheacutep những người khocircng phải lagrave người lập trigravenh coacute thể lập trigravenh được)
Cuộc sống nhacircn tạo ndash nỗ lực để taacutei tạo caacutec hiện tượng sinh học trong caacutec hệ thống dựa trecircn maacutey tiacutenh
73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia(Expert Systems- ES)
Theo Jackson (1999) Một hệ chuyecircn gia lagrave một chương trigravenh maacutey tiacutenh mocirc tả vagrave suy diễn với tri thức của một vagravei lĩnh vực để giải quyết vấn đề hay đưa ra caacutec lời khuyecircn
Cấu truacutec cơ bản của ES được dựa theo cấu truacutec chung của DSS Sự khaacutec biệt chiacutenh giữa ES vagraveDSS lagrave hệ ES thu thập caacutec kiến thức từ những
chuyecircn gia trong lĩnh vực quan tacircmĐặc trưng của hệ chuyecircn gia Hiệu quả cao Thời gian trả lời thỏa đaacuteng Độ tin cậy cao Dễ hiểu
Giao diện người dugraveng trong ES
Thiết kế giao diện người dugraveng tập trung vagraveo caacutec yếu tố như dễ dagraveng sử dụngcoacute độ tin cậy cao giảm tải những khoacute khăn khi sử dụng
Thiết kế necircn coacute một số tương taacutec (đầu vagraveo kiểm soaacutet vagrave truy vấn)
Cấu tạo giao diện người dugraveng gồm coacute magraven higravenh cảm ứng bagraven phiacutem buacutet saacuteng lệnh thoại caacutec phiacutem chuyecircn dụng
Cơ sở tri thức (Knowledge Base)
Chứa đựng caacutec tri thức cụ thể miền thu được từ caacutec chuyecircn gia miền
Coacute thể chứa caacutec mocirc tả caacutec hagravenh vi giải quyết vấn đề caacutec ragraveng buộc caacutec heuristics
Thagravenh cocircng của một ES dựa trecircn tiacutenh đầy đủ vagrave tiacutenh chiacutenh xaacutec của cơ sở tri thức
Mocirc tơ suy diễn (Inference Engine)
Ở đacircy tri thức được đặt để sử dụng tạo ra caacutec giải phaacutep để giải quyết vấn đề
Mocirc tơ nagravey coacute khả năng thực hiện diễn dịch hoặc suy diễn dựa trecircn caacutec luật hay caacutec caacutec sự kiện
Đồng thời cũng coacute khả năng sử dụng caacutec suy diễn mờ hay khocircng chiacutenh xaacutec dựa trecircn xaacutec suất hay aacutenh xạ mẫu
Vograveng điều khiển suy diễn
1 Aacutenh xạ caacutec luật với caacutec sự kiện đatilde được cho
2 Chọn luật để thực hiện
3 Thực hiện luật bằng caacutech thecircm caacutec sự kiện được suy diễn ra vagraveo bộ nhớ lagravem việc
Chuỗi suy diễn (Chaining)
Suy diễn tiến (forward chaining) maacutey suy diễn bắt đầu từ dữ liệu ban đầu vagrave thực hiện việc suy luận để đưa ra caacutec kết luận cuối cugraveng
Suy diễn lugravei (backward chaining) maacutey suy diễn bắt đầu từ dữ liệu điacutech vagrave tigravem ra tri thức hỗ trợ cho dữ liệu điacutech đoacute
Viacute dụ suy diễn lugravei
R1 Nếu coacute A vagrave B thigrave suy ra coacute D
R2 Nếu coacute B thigrave suy ra coacute C
R3 Nếu coacute C vagrave D thigrave suy ra coacute E
Ta coacute E ta xem trong 3 luật R1 R2 R3 luật nagraveo coacute E ta thấy R3 chứa E đồng thời chứa C vagrave D Xeacutet tiếp trong 2 luật R1 R2 luật nagraveo chứa C vagrave D R2 chứa C R3 chứa D Từ đoacute ta coacute được caacutec tri thức hỗ trợ suy diễn vagrave kết luận lagrave nếu coacute A vagrave B thigrave sẽ coacute E Hay nếu A vagrave B đuacuteng thigrave sẽ coacute E
Viacute dụ suy diễn tiến
Giả sử coacute tập chứa 3 luật sau
R1 Nếu coacute A vagrave B thigrave suy ra coacute D
R2 Nếu coacute B thigrave suy ra coacute C
R3 Nếu coacute C vagrave D thigrave suy ra coacute E
Nếu ta coacute A vagrave B thigrave chuacuteng ta suy ra được D từ R1 vagrave suy ra C từ R2 Với D vagrave C đatilde được suy ra ở trecircn giờ chuacuteng ta suy ra được E từ R3
Viacute dụ thực tế
Giả sử muốn biết magraveu của một con vật nuocirci tecircn lagrave Fred biết rằng noacute kecircu ộp ộp vagrave ăn ruồi
Coacute tập 4 luật ban đầu như sau
R1 Nếu X kecircu ộp ộp vagrave ăn ruồi thigrave X lagrave con ếch
R2 Nếu X kecircu chiecircm chiếp vagrave biết hoacutet thigrave X lagrave con chim
R3 Nếu X lagrave con ếch thigrave X coacute magraveu xanh
R4 Nếu X lagrave con chim thigrave X coacute magraveu vagraveng
74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia
Expert system shells lagrave một tập caacutec goacutei phần mềm vagrave caacutec cocircng cụ dugraveng để phaacutet triển caacutec hệ chuyecircn gia
Những Expert system shells đầu tiecircn thường rất rườm ragrave Mặc dugrave vậy noacute vẫn giuacutep cho người sử dụng sẽ khocircng phải bắt đầu lại từ đầu khi xacircy dựng một hệ chuyecircn gia mới
Những shell hiện đại bao gồm hai mocirc-đun chiacutenh lagrave cocircng cụ xacircy dựng một tập quy tắc vagrave mocirc tơ suy diễn
Xacircy dựng hệ chuyecircn gia
Bước 1 xacircy dựng mocirc higravenh bagravei toaacuten xaacutec định vấn đề nhiệm vụ magrave hệ thống sẽ thực hiện Caacutec dạng bagravei toaacuten cần hệ chuyecircn gia
Bagravei toaacuten diễn giải (InterPretation)
Bagravei toaacuten dự baacuteo (Prediction)
Bagravei toaacuten chuẩn đoaacuten (Diagnose)
Bagravei toaacuten gỡ rối (Debugging)
Bagravei toaacuten thiết kế
Tương tự như một dự aacuten phần mềm để xacircy dựng một hệ chuyecircn gia cần phải coacute caacutec yếu tố về nhacircn lực tagravei nguyecircn vagrave thời gian Những yếu tố nagravey ảnh hưởng đến giaacute thah của một hệ chuyecircn giaTrong phần nagravey cacircu hỏi thường được đặt ra lagrave tại sao cần phải xacircy dựng một hệ chuyecircn giaTrước khi bắt đầu phải xaacute định rotilde bagravei toaacuten đạt ra lagrave jiAi lagrave chuyecircn giaAi lagrave người sử dụng
1 Diễn giải (InterPretation) Nghiecircn cứu 1 vấn đề -gt Dựa trecircn những biểu hiện thuộc tiacutenh đặc trưng becircn ngoagravei -gt Tư vấn
(hoặc đưa ra kết luận hay mocirc tả dễ hiểu từ tập dữ liệu thocirc)
2 Bagravei toaacuten dự baacuteo (Prediction) Coacute thể dự đoaacuten được hagravenh vi kết quả dựa trecircn caacutec hiện tượng -gt dự baacuteo
VD Dự baacuteo thời tiết động đấthellip
3 Bagravei toaacuten chẩn đoaacuten (Diagnoss) Xaacutec định caacutec lỗi caacutec bộ phận hỏng hoacutec của hệ thống dựa trecircn caacutec dữ liệu quan saacutet được
4 Bagravei toaacuten gỡ rối (Debugging) Mocirc tả caacutec phương phaacutep khắc phục hệ thống khi gặp sự cố
5 Bagravei toaacuten thiết kế Lựa chọn cấu higravenh caacutec đối tượng nhằm thoả matilden một số ragraveng buộc nagraveo đoacute
6 Giảng dạy Phần mềm dạy học coacute thể chuẩn đoaacuten vagrave sủa lỗi của học sinh trong quaacute trigravenh học tập
Để xaacutec định đuacuteng bagravei toaacuten magrave chuacuteng ta cần giải quyết thigrave phải trả lời đc một số cacircu hỏi
- cần hệ chuyecircn gia
Bước 2 thu thập tri thức lựa chọn cocircng cụ vagrave aacutep dụng
Trong bước thu thập tri thức vấn đề quan trọng lagrave lựa chọn chuyecircn gia những người magrave sẽ đoacuteng goacutep tri thức cho hệ thống Thocircng thường trong suốt quaacute trigravenh phaacutet triển thigrave chuyecircn gia được xem như một thagravenh viecircn của đội phaacutet triển
Hiện nay coacute rất nhiều cocircng cụ để xacircy dựng một hệ chuyecircn gia Phổ biến nhất lagrave JESS CLIPS vagrave OPS5
Bước 3 Thiết kế cơ sở tri thức thiết kế hệ thốngTri thức được biểu diễn trường minh trong cơ sở tri thức
Caacutec chuyecircn gia vagrave kỹ sư tri thức sẽ đối thoại với nhau bằng caacutec kỹ thuật đối thoại Suy diễn (SD) bảng Mocirc higravenh hoacutea SD quy nạp phacircn loại
Vấn đề bagraveo trigrave vagrave phaacutet triển
Caacutec hệ chuyecircn gia đogravei hỏi phải bảo trigrave vagrave phaacutet triển nhiều hơn so với caacutec hệ thống khaacutec Phải thường xuyecircn bổ sung tri thức mới vagrave thay đổi caacutec tri thức cũ để đổi mới hệ chuyecircn gia
Thu thập vagrave khắc phục lỗi do người sử dụng phaacutet hiện để kịp thời khắc phục những sai soacutet của hệ chuyecircn gia
75 Lợi iacutech vagrave hạn chế của caacutec hệ chuyecircn gia
Một số lợi iacutech chiacutenh
Thời gian trả lời hợp lyacute bằng hoặc nhanh hơn so với chuyecircn gia (người) để đi đến cugraveng một quyết định Hệ chuyecircn gia lagrave một hệ thống thời gian thực (real time system)
Khả năng trả lời với mức độ tinh thocircng bằng hoặc cao hơn so với chuyecircn gia (người) trong cugraveng lĩnh vực
Hệ chuyecircn gia giuacutep cho hiệu quả lagravem việc tăng bằng việc sử dụng tập caacutec luật một caacutech nhanh choacuteng magrave ko bị nhầm lẫn chuyecircn gia lagrave người coacute thể quecircn đi một số tri thức cơ sở lyacute luậ nhưng HCG thigrave ko
Quyết định của một người chuyecircn gia coacute thể bị thay đổi vagrave ko coacute tiacutenh thống nhất như quyết định của một hệ chuyecircn gia tạo ra
Hệ chuyecircn gia giuacutep cho người sử dụng coacute thể trau dồi sự hiểu biết trecircn lĩnh vuej cụ thể magrave noacute giải quyết hỗ trợ người ra quyết định coacute trigravenh độ như 1 chuyecircn gia trong quaacute trigravenh gia quyết định
Kiến thức của rất nhiều chuyecircn gia về một lĩnh vực nagraveo đoacute được đưa vagraveo hệ chuyecircn gia lagravem cho CSTT cuat HCG phong phuacute vagrave rộng lớn hơn rất nhiều
HCG giải thiacutech caacutec bước suy luận một caacutech dễ hiểu nhất quaacuten luacutec nagraveo cũng coacute thể sử dụng ko như chuyecircn gia con người
Hạn chế của caacutec hệ chuyecircn gia
Nhược điểm lớn nhất của hệ chuyecircn gia lagrave những yacute kiến chuyecircn mocircn thường rất khoacute matilde hoacutea vagrave giải neacuten
Hệ chuyecircn gia khocircng coacute khả năng tự học tự cập nhật kiến thức mới như caacutec chuyecircn gia magrave cần phải được matilde hoacutea lại khi noacute được cập nhật
Hệ chuyecircn gia khocircng thể nhận ra được vấn đề khocircng nằm trong miền kiến thức của hệ thống
Chương 8 Tri thức vagrave tiếp nhận
1 Bao gồm caacutec vấn đề
Dữ liệu thực tế đo lường hoặc quan saacutet coacute hoặc khocircng coacute bối cảnh
Thocircng tin dữ liệu được tổng hợp một caacutech hữu iacutech để giải quyết những khoacute khăn trong việc đưa ra quyết định
Tri thức bao gồm caacutec ứng dụng quy tắc thocircng tin hướng dẫn của người ra quyết định
2 Những caacutei nhigraven về tri thức
Đại diện lagravem thế nagraveo để diễn tả tri thức viacute dụ như một quyển saacutech khocircng phải lagrave tri thức nhưng noacute lại lagrave một đại diện của tri thức
Sản xuất tri thức lagrave một tập hơp của hagraveng tồn kho coacute thể được sản xuất cũng như mua lại
Tri thức lagrave 1 trong 6 trạng thaacutei của hệ thống
1Dữ liệu 2Thocircng tin 3Cấu truacutec thocircng tin 4Sự thấu hiểu 5Yacute kiến 6 Quyết định
3 Caacutec loại tri thức Phổ biến mocirc tả dữ liệu thocircng tin thủ tục mọi thứ lagravem như thế nagraveo lập luận chiacutenh saacutech hoặc caacutec quy tắc
4 Thu thập Tri thức hệ chuyecircn gia Hầu hết caacutec phương phaacutep đều bắt đầu với mocirc higravenh của caacutec taacutec vụ trong đoacute
hệ chuyecircn gia được xacircy dựng Trong đoacute mocirc tả về caacutec lĩnh vực được tạo ra Caacutec kỹ sư sử dụng caacutec mocirc higravenh giả thuyết vagrave nhận thức về quaacute trigravenh phacircn
tiacutech để gợi ra caacutech giải quyết vấn đề về tri thức từ caacutec chuyecircn gia
5 Caacutec chiều của thu thập tri thức KE- driven caacutec kỹ sư trao đổi trực tiếp với caacutec chuyecircn gia Expert-driven Caacutec chuyecircn gia trực tiếp đưa chuyecircn mocircn của họ vagraveo hệ
thống maacutey tiacutenh Machine-driven Sử dụng caacutec cocircng cụ suy luận để triacutech xuất tri thức từ một
tập caacutec viacute dụ
6 Kỹ thuật thu thập tri thức Trao đổi gồm 2 loại cơ bản lagrave coacute cấu truacutec(coacute kịch bản) vagrave khocircng coacute cấu
truacutec( đối thoại trực tiếp) Giao thức phacircn tiacutech bằng lời Khi caacutec chuyecircn gia thực hiện một cocircng việc
của họ thigrave một bản ghi về cocircng việc đoacute được thực hiện Caacutec kỹ sư sẽ xacircy dựng mocirc higravenh cho những gigrave được ghi lại trong bản ghi
Phương phaacutep sagraveng lọc caacutec chuyecircn gia so saacutenh caacutec nhoacutem liecircn tiếp trong ba đối tượng vagrave cho biết tại sao nhoacutem thứ hai lại khaacutec nhoacutem thứ ba
7 Thu thập tri thức từ nhiều nguồn Thu thập tri thức từ nhiều nguồn lagrave cần thiết để coacute được đầy đủ caacutec tri thức
cho một vấn đề quan điểm yacute kiến traacutei ngược nhau thường phaacutet sinh Phương phaacutep đồng thuận sẽ giuacutep giải quyết được vấn đề macircu thuẫn Kỹ thuật phacircn tiacutech Meta lagrave kỹ thuật được aacutep dụng trong caacutec trường hợp
khaacutec Caacutech tiếp cận bằng định lượng đogravei hỏi caacutec kỹ sư cần cacircn nhắc yếu tố đầu vagraveo của caacutec chuyecircn gia khaacutec nhau
8 Xaacutec nhận hợp lệ vagrave kiểm tra tri thức Một khi thu thập tri thức noacute phải được đaacutenh giaacute về khả năng sử dụng vagrave độ
chiacutenh xaacutec Hai vấn đề cụ thể lagrave hiệu lực của những kiến thức vagrave kiểm tra việc xacircy dựng cơ sở của tri thức
Cần xaacutec nhận xem liệu hệ thống coacute thể hoạt động ở mức độ tối thiểu khocircng
Xaacutec minh liecircn quan đến việc so saacutenh từng chi tiết kỹ thuật của hệ thống những gigrave đatilde được thực hiện cuối cugraveng
9 Một số caacutec biện phaacutep xaacutec nhận Độ chiacutenh xaacutec Khả năng thiacutech nghi Mức độ đầy đủ Bề rộng Độ sacircu Hiệu lực Tổng quan Chiacutenh xaacutec Hiện thực Độ tin cậy Tiacutenh hữu dụng Mức độ
Chương 9 Học maacutey
1 Logic mờ vagrave ngocircn ngữ mờ(Fuzzy Logic and Linguistic Ambiguity)
Ngocircn ngữ tự nhiecircn gồm những khaacutei niệm mơ hồ vagrave khocircng chiacutenh xaacutectruyền tải ngữ nghĩa thocircng qua tiacutenh xấp xỉkhocircng rotilde ragraveng
Những xấp xỉ nagravey giuacutep con người coacute thể truyền tải hết được yacute nghĩa nhưng maacutey thigrave khocircng hiểu
Lagravem sao biểu diễn caacutec tri thức sử dụng caacutec khaacutei niệm khocircng rotilde ragraveng(mờ) hoặc khocircng chiacutenh xaacutec
2 Khaacutei niệm cơ bản của logic mờ tập mờ lagrave những tập hợp khocircng coacute một giới hạn rotilde Mỗi phần tử của noacute chỉ
chứa một mức độ hagravem liecircn thuộc của từng phần tử Vigrave vậy tập mờ khocircng giống như tập cổ điển Tập mờ coacute thể kết hợp với nhau qua những luật mờ magrave đặc trưng cho những hagravenh động trạng thaacutei vagrave thuộc tiacutenh của logic mờ được tận dụng khi thực hiện một bộ điều khiển mờ
Logic mờ dựa trecircn yacute tưởng mỗi phần tử thuộc vagraveo một tập hợp ở một mức độ nagraveo đấy
Locircgic mờ cho pheacutep độ liecircn thuộc (microA )coacute giaacute trị trong khoảng (01) Locircgic mờ coacute thể được coi lagrave mặt ứng dụng của lyacute thuyết tập mờ để xử lyacute caacutec
giaacute trị trong thế giới thực cho caacutec bagravei toaacuten phức tạp
3 So saacutenh tiacutenh đuacuteng đắn logic mờ vagrave xaacutec suất Xaacutec suất thigrave đề cập đến khả năng xảy ra một biến cố hay một điều gigrave đoacute Logic mờ đề cập đến cấp độ magrave đặc tiacutenh ở hiện tại
o viacute dụ1 người coacute chiều cao 6 feet thigrave coacute cấp độ lagrave 05 về chiều cao
4 Ưu điểm của logic mờ Caacutech tiếp cận rất tự nhiecircnkhocircng phức tạp Coacute thể mocirc higravenh hoacutea caacutec hagravem phi tuyến tugravey yacute phức tạp
Coacute thể tận dụng được kinh nghiệm từ những chuyecircn gia hagraveng đầu trong mọi lĩnh vực
Logic mờ được xacircy dựng dựa trecircn ngocircn ngữ tự nhiecircnNền tảng của logic mờ lagrave dựa trecircn cơ sở giao tiếp của con người
5 Nhược điểm của logic mờ Trong 1 hệ thống phức tạpsử dụng logic mờ coacute thể trở thagravenh trở ngại cho
việc xaacutec thực độ tin cậy của hệ thống Cơ chế lập luận mờ khocircng thể học hỏi từ những lỗi sai
6 Mạng noron nhacircn tạo(ANN) Mạng noron nhacircn tạo lagrave một mocirc phỏng xử lyacute thocircng tinđược nghiecircn cứu ra
từ hệ thống thần kinh của sinh vậtgiống như bộ natildeo để xử lyacute thocircng tin ANNs lagrave chương trigravenh dựa trecircn maacutey tiacutenh đơn giản coacute chức năng lagrave một mocirc
higravenh bagravei toaacuten khocircng gian dựa trecircn thử nghiệm vagrave baacuteo lỗi
7 Học từ kinh nghiệm Tiến trigravenh Một mẫu dữ liệu được biểu diễn như một mạng lưới noronANN ldquodự
đoaacutenrdquo 1 đầu radự đoaacuten được so saacutenh với giaacute trị thực tế hoặc giaacute trị chiacutenh xaacutecNếu đoaacuten được chiacutenh xaacutec thigrave khocircng coacute hagravenh động nagraveo được thực hiện
Nếu dự đoaacuten sai ANN kiểm tra lại vagrave xaacutec định lại thocircng số để điều chỉnh Một mẫu dữ liệu khaacutec được biểu diễn vagrave quaacute trigravenh nagravey được lặp lại
8 Nguyecircn tắc cơ bản của cocircng nghệ nơron Caacutec yếu tố xử lyacute cơ bản trong hệ thống thần kinh của con người lagrave tế bagraveo
thần kinhMạng lưới của tế bagraveo nagravey lagrave liecircn kết với nhau nhận được thocircng tin từ caacutec cảm biến trong mắt taihellip
Thocircng tin nhận được bởi tế bagraveo thần kinh hoặc lagrave sẽ kiacutech thiacutech noacute(sẽ được chuyển qua 1 thocircng điệp dọc theo mạng lưới) hoặc lagrave sẽ ngăn cản noacute(ngăn cản dograveng thocircng tin)
Độ nhạy coacute thể thay đổi qua thời gian hoặc sau khi coacute được kinh nghiệm
9 Cấu truacutec mạng Một ANN gồm 3 lớp cơ bản
Lớp đầu vagraveo nhận dữ liệu Lớp becircn trong hoặc lagrave lớp ẩn xử lyacute dữ liệu Lớp đầu ra chuyển tiếp kết quả cuối cugraveng của mạng
10Mạng nơ ron Thường coacute nhiều đầu vagraveo mỗi đầu vagraveo với mức ảnh hưởng vagrave tầm quan
trọng riecircng của noacute Một đầu vagraveo quan trọng coacute thể được sử dụng để khuếch đại đầu ra caacutec hagravem trạng thaacutei tổng hợp caacutec trọng số của caacutec yếu tố
đầuvagraveo khaacutec nhauvagraveo một giaacute trị duy nhất Caacutec hagravem chuyển giao xử lyacute caacutec giaacute trị trạng thaacutei vagrave tạo đầu ra
11Huấn luyện mạng nơ ron Trong mocirc higravenh coacute giaacutem saacutetANN được đến so saacutenh dự đoaacuten của chiacutenh
noacute với thocircng tin phản hồi coacute chứa caacutec kết quả mong muốn ANN sẽ phải tigravem caacutech thay đổi caacutec tham số becircn trong củamigravenh (caacutec trọng số vagrave caacutec ngưỡng) để tạo necircn một aacutenh xạ coacute khả năng aacutenh xạcaacutec đầu vagraveo thagravenh caacutec đầu ra mong muốn Sự thay đổi nagravey được tiến hagravenh nhờ việc so saacutenh giữa đầu ra thực sự vagrave đầu ra mong muốn
Trong mocirc higravenh khocircng coacute giaacutem saacutetANN nhận được dữ liệu vagraveo nhưng khocircng phải coacute bất kỳ thocircng tin phản hồi về kết quả mong muốn
Phần lớn caacutec ứng dụng nằm trong vugraveng của caacutec bagravei toaacuten ước lượng như mocirc higravenh hoacuteathống kecirc neacuten lọc phacircn cụm
12Lợi iacutech Liecircn kết với mạng noron Traacutenh caacutech lập trigravenh tường minh Giảm nhu cầu của chuyecircn gia ANNs thigrave thiacutech nghi với caacutec yếu tố đầu vagraveo thay đổi Khocircng cần thiết cho cơ sở tri thức tinh chế ANNs coacute tiacutenh động vagrave cải thiện với việc sử dụng Coacute khả năng xử lyacute dữ liệu khocircng chiacutenh xaacutec hoặc khocircng đầy đủ Cho pheacutep tổng quaacutet hoacutea từ thocircng tin cụ thể Cho pheacutep thu thập cảm giaacutec thocircng thường vagraveo miền giải quyết vấn đề
13Hạn chế của việc liecircn kết với mạng noron ANNs khocircng thể giải thiacutech được suy luận Bản chất hộp đen thường khiến cho vấn đề traacutech nhiệm vagrave độ tin cậy phaacutet
sinh lagrave khoacute khăn Lặp đi lặp lại quaacute trigravenh huấn luyện rất tốn thời gian Nguồn lực caacutec nhagrave phacircn tiacutech vagrave thiết kế coacute tay nghề cao vẫn lagrave đaacuteng lo
ngại Cocircng nghệ ANN thuacutec đẩy hạn chế của phần cứng hiện tại ANN yecircu cầu phải coacute sự tin tưởng ở đầu ra
14Giới thiệu về thuật toaacuten di truyền Cũng như mạng lưới thần kinh caacutec thuật toaacuten di truyền được dựa trecircn lyacute
thuyết sinh học Thuật toaacuten di truyền tigravem thấy nguồn gốc của chuacuteng trong caacutec lyacute thuyết
tiến hoacutea của chọn lọc tự nhiecircn vagrave thiacutech ứng với biến đổi khiacute hậu Kết quả thuật toaacuten di truyền lagrave từ giao phối 2 caacute thể trong quần thế để tạo
ra con caacutei đocirci khi tốt hơn so với bậc cha mẹ của chuacuteng 15Caacutec thagravenh phần cơ bản của thuật toaacuten di truyền
Toaacuten tử chọn lọc Caacutec caacute thể tốt được chọn lọc để đưa vagraveo thế hệ sau Sự chọn lọc nagravey căn cứ vagraveo độ thiacutech nghi với mocirci trường của mỗi caacute thể
Toaacuten tử lai gheacutep (crossover) Hai caacute thể cha vagrave mẹ trao đổi caacutec gen với nhau để tạo ra caacute thể con
Toaacuten tử đột biến (mutation) Một caacute thể thay đổi một số gen để biến đổi thagravenh một caacute thể mớiTất cả caacutec toaacuten tử trecircn khi thực hiện đều mang tiacutenh ngẫu nhiecircn
16Quaacute trigravenh cơ bản của một thuật toaacuten di truyền Khởi tạo
Đaacutenh giaacute quần thể
Lựa chọn NST thiacutech hợp nhất vagrave loại bỏ NST yếu nhất
Quy trigravenh giao nhau vagrave cải thiện quần thể
đột biến tiến trigravenh để khaacutem phaacute ra NST mới
17Ưu nhược điểm của việc kết hợp với thuật toaacuten di truyền Kiacutech thước quần thể lagrave 1 yếu tố quan trọng trong tốc độ của việc tigravem
kiếmnhưng noacute tương đối dễ dagraveng để dự đoaacuten tốc độ nagravey Giao nhau hoặc đột biến lagrave khocircng necircn đc sử dụng quaacute thường xuyecircn Luocircn coacute được iacutet nhất 1 giải phaacutep hợp lyacute Necircn coacute thể aacutep dụng chuacuteng cho caacutec vấn đề magrave chuacuteng ta khocircng coacute hướng
về caacutech giải quyết Sức mạnh của thuật toaacuten xuất phaacutet từ khaacutei niệm đơn giảnkhocircng phải từ
một thủ tục thuật toaacuten phức tạp 18Tương lai của học maacutey
Mạng lưới thần kinh nhacircn tạo vượt quaacute năng lực của con người trong caacutec trường hợp bị cocirc lập
Về mặt lyacute thuyếtmột maacutey tiacutenh coacute thể xử lyacute dũ liệu nhanh hơn hagraveng triệu lần so với 1 con người
May mắn thay cho chuacuteng tacon người tốt hơn nhiều khi magrave coacute được dữ liệumaacutey tiacutenh khocircng coacute 1 số thứ như lagrave 5 giaacutec quan
CHƯƠNG 10 KHO DỮ LIỆU
1 Kho dữ liệu Kho dữ liệu lagrave tuyển tập caacutec cơ sở dữ liệu tiacutech hợp hướng chủ đề được
thiết kế để trợ giuacutep cho một hệ hỗ trợ quyết định
Theo John Ladley Cocircng nghệ kho dữ liệu lagrave tập caacutec phương phaacutep kỹ thuật vagrave caacutec cocircng cụ coacute thể kết hợp hỗ trợ nhau để cung cấp thocircng tin cho người sử dụng trecircn cơ sở tiacutech hợp từ nhiều nguồn dữ liệu nhiều mocirci trường khaacutec nhau
Kho dữ liệu thường rất lớn tới hagraveng trăm GB hay thậm chiacute hagraveng Terabyte
2 Kho dữ liệu vận hagravenh (ODS) Một kho dữ liệu vận hagravenh Aacutep dụng kỹ thuật kho dữ liệu vagraveo caacutec hệ xử
lyacute giao taacutec lưu trữ dữ liệu cho một ứng dụng đặc thugrave Noacute đưa vagraveo kho dữ liệu một dograveng caacutec dữ liệu thocirc được thiết kế
3 So saacutenh
Kho dữ liệu vận hagravenh Kho dữ liệu
Dữ liệu theo chủ đề Dữ liệu theo chủ đề
Dữ liệu tiacutech hợp Dữ liệu tiacutech hợp
Dữ liệu thay đổi Dữ liệu khocircng thay đổi
Dữ liệu được cập nhật khi thay đổi
Dữ liệu giữ nguyecircn
Chỉ coacute dữ liệu hiện tạiDữliệu hiện tại vagrave dữ liệu lịch sử
Chu kỳ lagravem tươi dữ liệu ngắn Chu kỳ lagravem tươi dữ liệu dagravei
Chỉ coacute dữ liệu chi tiết Dữ liệu chi tiết vagrave dữ liệu tổng kết
Dugraveng cho caacutec quyết định ngắn hạn
Dugraveng cho hoạch định dagravei hạn
4 Kho dữ liệu cục bộ (Data Mart - DM)
Kho dữ liệu cục bộ lagrave CSDL coacute những đặc điểm giống với kho dữ liệu nhưng với quy mocirc nhỏ hơn vagrave lưu trữ dữ liệu về một lĩnh vực một chuyecircn ngagravenh
Data mart phụ thuộc Chứa những dữ liệu được lấy từ DW vagrave những dữ liệu nagravey sẽ được triacutech lọc vagrave tinh chế tiacutech hợp lại ở mức cao hơn để phục vụ một chủ đề nhất định của Datamart
Data mart độc lập Khocircng giống như Datamart phụ thuộc Data mart độc lập được xacircy dựng trước DW vagrave dữ liệu được trực tiếp lấy từ caacutec nguồn khaacutec nhau
5 Siecircu dữ liệu Metadata lagrave dữ liệu để mocirc tả dữ liệu Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột
một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi Metadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu
6 Mocirci trường kho dữ liệu Hệ thống của tổ chức vagrave kho cung cấp dữ liệu để xacircy dựng kho dữ liệu Trong quaacute trigravenh chuyển dữ liệu từ caacutec nguồn khaacutec nhau dữ liệu coacute thể
được lagravem sạch hoặc chuyển đổi vagrave vigrave thế DW được xem như lagrave một chuẩn cho việc lưu trữ
Đồng thời siecircu dữ liệu được ghi lại Cuối cugraveng DW hoặc siecircu thị coacute thể được sử dụng để tạo ra một kho dữ
liệu ldquocaacute nhacircnrdquo 7 Caacutec đặc điểm của kho dữ liệu
Đặc điểm Mocirc tả
Hướng chủ đề - DL tổ chức theo caacutech thức người dugraveng tham chiếu
Tiacutech hợp - Dữ liệu ldquosạchrdquo loại bỏ tiacutenh thiếu nhất quaacuten
Khocircng thay đổi - DL ldquochỉ đọcrdquo người dugraveng khocircng thay đổi được
Chuỗi thời gian - DL lagrave chuỗi thời gian khocircng phải lagrave trạng thaacutei hiện tại
Được tổng kết - DL vận hagravenhthao taacutec khi cần thiết
được kết hợp lại thagravenh dạng coacute thể dugraveng được cho quyết định
Kiacutech cỡ lớn hơn - Lưu giữ theo chuỗi thời gian tức lagrave giữ lại nhiều DL
Khocircng được chuẩn hoacutea - Coacute thể dư thừa DLSiecircu dữ liệu - Dữ liệu của dữ liệu được lưu trữNguồn dữ liệu - DL vận hagravenh (caacutec hệ sẵn coacute) cugraveng
với caacutec nguồn ngoagravei 8 Kho dữ liệu hướng chủ đề
Hướng chủ để coacute nghĩa lagrave kho dữ liệu được tổ chức xung quanh caacutec chủ đề chiacutenh như khaacutech hagraveng sản phẩm sản xuất Tập trung vagraveo việc mocirc higravenh hoacutea vagrave phacircn tiacutech dữ liệu cho caacutec nhagrave ra quyết định magrave khocircng tập trung vagraveo caacutec xử lyacute thocircng thường Cung cấp cho người dugraveng một khung nhigraven toagraven vẹn đơn giản vagrave đầy đủ về caacutec sự kiện quanh caacutec chủ đề
9 Dữ liệu trong DW được tiacutech hợp Dữ liệu trong kho dữ liệu được xacircy dựng bằng caacutech tổng hợp dữ liệu từ
nhiều nguồn khaacutec nhau vagrave caacutec nguồn coacute tổ chức khaacutec nhau Cơ sở dữ liệu caacutec file excel caacutec flat file hoặc caacutec raw file Khi đưa vagraveo kho dữ liệu caacutec dữ liệu được lagravem sạch vagrave tiacutech hợp dữ liệu nhằm đảm bảo tiacutenh nhất quaacuten của dữ liệu
10Kiến truacutec kho dữ liệu Tầng cơ sở dữ liệu hoạt động Tầng truy xuất thocircng tin Tầng truy xuất dữ liệu Tầng siecircu dữ liệu Tầng quản lyacute tiến trigravenh Tầng thocircng điệp của ứng dụng Tầng vật liacute của kho dữ liệu Tầng trigravenh diễn dữ liệu
11Higravenh trạng kho dữ liệu Kho dữ liệu ảo - người dugraveng cuối coacute thể truy cập trực tiếp đến kho dữ liệu
sử dụng caacutec cocircng cụ cho pheacutep ở tầng truy xuất dữ liệu Kho dữ liệu trung tacircm-1 cơ sở dữ liệu vật lyacute chứa tất cả dữ liệu cho một
vugraveng chuyecircn dụng nagraveo đoacute
Kho dữ liệu phacircn taacuten- Thagravenh phần được phacircn taacuten qua nhiều hệ cơ sở dữ liệu vật lyacute
12METADATA- Siecircu dữ liệu Định nghĩa Siecircu dữ liệu lagrave dữ liệu về dữ liệu Lagrave 1 lưu trữ dugraveng để
Miecircu tả kho dữ liệu tổng thể Nhận dạng kiểu kho dữ liệu Quản liacute quaacute trigravenh tiacutech hợp dữ liệu Quản liacute quaacute trigravenh cập nhật kho dữ liệu Quản liacute bảo mật
Lagrave chigravea khoacutea quyết định sự thagravenh cocircng của kho dữ liệu luocircn được thay đổi vagrave cập nhật theo sự phaacutet triển của kho dữ liệu
Dugraveng để quản liacute điều khiển kho dữ liệu Sự ra đời của kho dữ liệu như 1 cấu truacutec hỗ trợ ra quyết định siecircu dữ liệu
được xem như nguồn tagravei nguyecircn dữ liệu Siecircu dữ liệu lagrave trừu tượng Chuacuteng lagrave dữ liệu bậc cao cung cấp mocirc tả ngắn
gọn caacutec dữ liệu bậc thấp hơn 13Hoạt động của Siecircu dữ liệu
Siecircu dữ liệu rất cần thiết trong việc chuyển hoacutea thocircng tin trở thagravenh tri thức Lagrave chigravea khoacutea giuacutep chuacuteng ta xử lyacute được dữ liệu thocirc Viacute dụ một dograveng dữ liệu baacuten hagraveng 1023 K596 11121 agraveNoacute sẽ khocircng coacute nghĩa gigrave cho đến khi chuacuteng ta đưa vagraveo siecircu dữ liệu (thư
mục chứa dữ liệu) agrave cửa hagraveng 1023 sản phẩm K596 vagrave số tiền baacuten được lagrave 11121 đocirc la
14Sự cần thiết phải nhất quaacuten trong kho dữ liệu Kho dữ liệu được xacircy dựng cho lợi iacutech của những nhagrave phacircn tiacutech kinh
doanh caacutec nhagrave quản trị cho tất cả caacutec khu vực chức năng Trong cơ sở dữ liệu riecircng caacutec khu vực khaacutec nhau coacute thể định nghĩa vagrave lưu
trữ dữ liệu thocircng qua phiecircn bản của chiacutenh noacute Khi dữ liệu được lấy từ những vugraveng khaacutec nhau đoacute vagrave được đặt vagraveo kho dữ
liệu Việc chuyển đổi vagrave lagravem sạch caacutec tiến trigravenh sẽ đảm bảo noacute lagrave duy nhất được tiacutech hợp tại một mức của tổ chức
15Ragrave soaacutet lại dữ liệu ndash Thực thi siecircu dữ liệu
Bất kể cấu truacutec tự nhiecircn của 1 cacircu truy vấn thế nagraveo thigrave caacutec thagravenh phần của siecircu dữ liệu rất quan trọng đối với người ra quyết định
Bảng thuộc tiacutenh khoacutea được lưu trữ bởi kho dữ liệu Tập hợp dữ liệu được lấy từ đacircu Những chuyển đổi nagraveo được thực thi với việc lagravem sạch
16Siecircu dữ liệu lagrave gigrave Metadata - lagrave thocircng tin mocirc tả nội dung của cơ sở dữ liệu (CSDL) Metadata baacuteo cho người dugraveng biết thời gian cập nhật sau cugraveng của dữ liệu
định dạng vagrave mục điacutech sử dụng của noacute Những thocircng tin nagravey coacute thể hướng dẫn người dugraveng duyệt qua CSDL vagrave
giuacutep họ hiểu được yacute nghĩa vagrave ngữ cảnh của dữ liệu Trong CSDL metadata lagrave caacutec dạng biểu diễn khaacutec nhau của caacutec đối tượng
trong CSDL Trong CSDL quan hệ metadata lagrave caacutec định nghĩa của bảng cột CSDL
view vagrave nhiều đối tượng khaacutec Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột
một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi -gtMetadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu
Bảng chuyển đổi Ghi lại những chuyển đổi đatilde được thực hiện
Lịch sử thực thi Ghi lại những dữ liệu đatilde được
phacircn tiacutech
Higravenh thaacutei kết nốiGhi lại những dữ liệu được kết nối vagrave tần suất
17Aacutenh xạ thocircng thường của siecircu dữ liệu Bản ghi aacutenh xạ chuyển đổi bao gồm
Định danh của nguồn gốc Chuyển đổi thuộc tiacutenh Chuyển đổi thuộc tiacutenh vật lyacute Matilde hoacutea tham chiếu bảng chuyển đổi Đổi tecircn Đổi khoacutea Gaacuten giaacute trị cho thuộc tiacutenh mặc định Chọn logic cho caacutec nguồn nhiều giaacute trị Đổi thuật toaacuten
18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để
phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai
lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave
tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec
Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm
Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo
19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua
caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau
SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được
Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra
một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức
Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ
Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ
Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech
CHƯƠNG 11 KHAI PHAacute DỮ LIỆU
1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn
ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993
Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng
2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd
1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều
2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP
3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn
4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng
5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server
6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo
7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động
8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời
9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều
10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện
11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech
12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP
3 Xử lyacute phacircn tiacutech trực tuyến OLAP
MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave
dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu
ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave
thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu
HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave
ROLAP4 Khai phaacute dữ liệu
Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh
khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn
Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan
5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp
6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại
Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp
Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec
Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt
Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra
Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh
vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho
Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec
Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm
Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục
Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng
gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp
Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn
Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec
Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper
Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2
Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25
Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước
Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng
Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện
trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp
Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute
độ hỗ trợ ge ngưỡng minsup
độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan
Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn
Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết
Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu
MOLAP ROLAP HOLAP
Lưu trữ dữ liệu cơ sở
Khối Bảng quan hệ Bảng quan hệ
Lưu trữ thocircng tin tổng hợp
Khối Bảng quan hệ Khối
Hiệu suất thực hiện truy vấn
Nhanh nhất Chậm nhất Nhanh
Tiecircu thụ khocircng gian lưu trữ
Nhiều Thấp Trung bigravenh
Chi phiacute bảo trigrave Cao Thấp Trung bigravenh
- Tăng chất lượng ra quyết định- Cung cấp sự cải tiến cạnh tranh- Tiết kiệm thời gian của người sử dụng- Tăng khả năng vagrave chất lượng giao tiếp- Cung cấp khả năng điều khiển tốt hơn trong tổ chức- Cho pheacutep tham gia caacutec vấn đề vagrave caacutec cơ hội- Cho pheacutep hoạch định- Cho pheacutep tigravem kiếm nguyecircn nhacircn của một vấn đề- Thảo matilden caacutec yecircu cầu của người điều hagravenh
Hạn chế của EIS vagrave 1 số sai lầm cần traacutenh
- Chi phiacute một cuộc khảo saacutetnăm1991 chothấychi phiacute phaacutet triểntrungbigravenh365000USDvớichi phiacute vận hagravenhhagraveng năm lagrave$200000 (EIS)
- Cocircng nghệ hạn chếEIScần phảiđượctiacutech hợp hoagraven toagravenvagraveokiếntruacuteccủadoanh nghiệphiện tại do đoacute noacutelagrave một thaacutech thứclớn đối vớithiết kế
- Hạn chế tổ chức cơ cấu tổ chứccoacute thể khocircng phugrave hợp
Sự hạn chế về tổ chức- Chương trigravenh nghị sự vagrave thời gian chệch EIS mocirc tả một phần việc thực hiện một
chương trigravenh nghị sự vagrave coacute thể dễ dagraveng đạt được sự tin cậy một caacutech chắc chắn- Đồng bộ hoacutea việc quản lyacute sự tin cậy đuacuteng luacutec đặc biệt baacuteo caacuteo EIS coacute thể phaacute
vỡ sự ổn định thiết lập caacutec chu trigravenh baacuteo caacuteo một caacutech tốt nhất- Sự bất ổn EIS phản ứng nhanh coacute thể gacircy ra việc taacutec động trở lại một caacutech
nhanh choacuteng dẫn đến sự thiếu ổn định trong tổ chức
Sự thất bại lagrave thay thế khocircng thể chấp nhận được- Một số yếu tố lagravem EIS thất bại
+ Thiếu sự hỗ trợ về mặt quản lyacute+ Vấn đề chiacutenh trị+ Thất bại của nhagrave phaacutet triển+ Lỗi về cocircng nghệ+ Giaacute cả+ Thời gian
66 Ra quyết định điều hagravenh trong tương lai vagrave EIS
- Coacute một vagravei điều kiện sẽ được hợp nhất cho việc chuyển đổi cocircng nghệ Trong đoacute một vagravei điều kiện coacute thể dễ dự đoaacuten Hai điều kiện magrave ta coacute thể thấy lagrave+ Phaacutet triển cocircng nghệ maacutey tiacutenh trong việc điều hagravenh sẽ tạo ra sự chuyển đổi được chấp nhận một caacutech dễ dagraveng hơn+ Mở rộng traacutech nhiệm điều hagravenh sẽ mở rộng nhu cầu thocircng tin
Tương lai của EIS- EIS thocircng minh Những tiến bộ trong cocircng nghệ AI sẽ được triển khai trong caacutec
EIS- EIS đa phương tiện Cơ sở dữ liệu đa phương tiện sẽ cho pheacutep tiacutech hợp văn bản
giọng noacutei vagrave higravenh ảnh trong tương lai- EIS thocircng tin Tương lai EIS sẽ mở rộng hơn trong việc sử dụng dữ liệu becircn
ngoagravei doanh nghiệp- EIS kết nối Giao tiếp với băng thocircng rộng cho pheacutep kết nối liecircn thocircng lớn hơn
Chương 7 HỆ CHUYEcircN GIA VAgrave TRIacute TUỆ NHAcircN TẠO
71 Caacutec khaacutei niệm
72 Triacute thocircng minh của triacute tuệ nhacircn tạo
73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia
74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia
75 Lợi iacutech vagrave hạn chế của hệ chuyecircn gia
71 Caacutec khaacutei niệm
Chuyecircn mocircn (Expertise) sự hiểu biết rộng trong 1 lĩnh vực hẹp
Hệ chuyecircn gia (Expert Systems)1 chương trigravenh maacutey tiacutenh sử dụng 1 tập caacutec luật dựa trecircn tri thức của con người để giải quyết caacutec vấn đề đogravei hogravei phải coacute sự chuyecircn mocircn
Một số hệ chuyecircn gia nổi tiếng
DENDRAL (Standford 1960s Edward Feigenbaum)
MYCIN (Standford1970s Edward Shortliffe)
PROSPECTOR (MIT 1979)
Triacute tuệ nhacircn tạo (Artificial Intelligence ndash AI)
Triacute tuệ nhacircn tạo một bộ phacircn của ngagravenh khoa học maacutey tiacutenh quan tacircm đến việc thiết kế caacutec hệ thống maacutey tiacutenh thocircng minh đoacute lagrave caacutec hệ thống đưa ra caacutec đặc điểm magrave từ đoacute chuacuteng ta liecircn hệ với sự thocircng minh trong hagravenh động của con người (Barr vagrave Feigenbaum 1981)
Mục điacutech của AI
Mục điacutech khoa học xaacutec định caacutec gợi yacute để giải thiacutech caacutec loại khaacutec nhau của triacute tuệ thực
Mục điacutech kỹ thuật giải quyết caacutec vấn đề trong thế giới thực
Triacute tuệ nhacircn tạo kế thừa nhiều yacute tưởng quan điểm kỹ thuật từ caacutec ngagravenh khoa học khaacutec
- Triết học
- Logic Toaacuten học
- Tiacutenh toaacuten
- Khoa học tacircm lyacute Khoa học nhận thức
- Sinh học Thần kinh học
- Tiến hoacutea
Caacutec lĩnh vực ứng dụng trong Triacute tuệ nhacircn tạo
Mạng nơ ron thần kinh (Neural Networks)
Tiacutenh toaacuten sự tiến hoacutea
(Evolutionary Computation)
Hệ chuyecircn gia (Expert Systems)
Kỹ thuật xử lyacute tiếng noacutei (Speech Processing)
Kỹ thuật xử lyacute ngocircn ngữ tự nhiecircn
(Natural Language Processing)
Lập kế hoạch (Planning)
Robot (Robotics)
Khoa học higravenh ảnh (Vision)
Caacutec kỹ thuật thocircng dụng dugraveng trong AI
Biểu diễn(Representation)
Học (Learning)
Caacutec luật (Rules)
Tigravem kiếm (Search)
72 Triacute thocircng minh của triacute tuệ nhacircn tạo
Con người suy diễn như thế nagraveo
Phacircn loại (Categorization)
Caacutec quy tắc cụ thể
Heuristics
Kinh nghiệm trước đoacute
Dự tiacutenh trước
Maacutey tiacutenh suy diễn như thế nagraveo
Lập luận dựa trecircn luật IF-THEN mocirc tả tri thức được matilde hoacutea dưới dạng caacutec luật
Caacutec khung (Frames) lagrave caacutec đại diện mocirc tả caacutec tigravenh huống giống nhau lagrave điển higravenh của một vagravei phacircn loại
Lập luận dựa trecircn caacutec trường hợp mocirc phỏng giải phaacutep trước đoacute cho một vấn đề hiện tại
Nhận dạng mẫu phaacutet hiện acircm thanh higravenh dạng hoặc caacutec chuỗi dagravei
Caacutec dạng khaacutec của Triacute tuệ nhacircn tạo
Học maacutey- mạng nơron vagrave giải thuật di truyền
Lập trigravenh tự động ndash lagrave những kỹ thuật tạo ra caacutec chương trigravenh để lagravem 1 nhiệm vụ riecircng biệt (cho pheacutep những người khocircng phải lagrave người lập trigravenh coacute thể lập trigravenh được)
Cuộc sống nhacircn tạo ndash nỗ lực để taacutei tạo caacutec hiện tượng sinh học trong caacutec hệ thống dựa trecircn maacutey tiacutenh
73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia(Expert Systems- ES)
Theo Jackson (1999) Một hệ chuyecircn gia lagrave một chương trigravenh maacutey tiacutenh mocirc tả vagrave suy diễn với tri thức của một vagravei lĩnh vực để giải quyết vấn đề hay đưa ra caacutec lời khuyecircn
Cấu truacutec cơ bản của ES được dựa theo cấu truacutec chung của DSS Sự khaacutec biệt chiacutenh giữa ES vagraveDSS lagrave hệ ES thu thập caacutec kiến thức từ những
chuyecircn gia trong lĩnh vực quan tacircmĐặc trưng của hệ chuyecircn gia Hiệu quả cao Thời gian trả lời thỏa đaacuteng Độ tin cậy cao Dễ hiểu
Giao diện người dugraveng trong ES
Thiết kế giao diện người dugraveng tập trung vagraveo caacutec yếu tố như dễ dagraveng sử dụngcoacute độ tin cậy cao giảm tải những khoacute khăn khi sử dụng
Thiết kế necircn coacute một số tương taacutec (đầu vagraveo kiểm soaacutet vagrave truy vấn)
Cấu tạo giao diện người dugraveng gồm coacute magraven higravenh cảm ứng bagraven phiacutem buacutet saacuteng lệnh thoại caacutec phiacutem chuyecircn dụng
Cơ sở tri thức (Knowledge Base)
Chứa đựng caacutec tri thức cụ thể miền thu được từ caacutec chuyecircn gia miền
Coacute thể chứa caacutec mocirc tả caacutec hagravenh vi giải quyết vấn đề caacutec ragraveng buộc caacutec heuristics
Thagravenh cocircng của một ES dựa trecircn tiacutenh đầy đủ vagrave tiacutenh chiacutenh xaacutec của cơ sở tri thức
Mocirc tơ suy diễn (Inference Engine)
Ở đacircy tri thức được đặt để sử dụng tạo ra caacutec giải phaacutep để giải quyết vấn đề
Mocirc tơ nagravey coacute khả năng thực hiện diễn dịch hoặc suy diễn dựa trecircn caacutec luật hay caacutec caacutec sự kiện
Đồng thời cũng coacute khả năng sử dụng caacutec suy diễn mờ hay khocircng chiacutenh xaacutec dựa trecircn xaacutec suất hay aacutenh xạ mẫu
Vograveng điều khiển suy diễn
1 Aacutenh xạ caacutec luật với caacutec sự kiện đatilde được cho
2 Chọn luật để thực hiện
3 Thực hiện luật bằng caacutech thecircm caacutec sự kiện được suy diễn ra vagraveo bộ nhớ lagravem việc
Chuỗi suy diễn (Chaining)
Suy diễn tiến (forward chaining) maacutey suy diễn bắt đầu từ dữ liệu ban đầu vagrave thực hiện việc suy luận để đưa ra caacutec kết luận cuối cugraveng
Suy diễn lugravei (backward chaining) maacutey suy diễn bắt đầu từ dữ liệu điacutech vagrave tigravem ra tri thức hỗ trợ cho dữ liệu điacutech đoacute
Viacute dụ suy diễn lugravei
R1 Nếu coacute A vagrave B thigrave suy ra coacute D
R2 Nếu coacute B thigrave suy ra coacute C
R3 Nếu coacute C vagrave D thigrave suy ra coacute E
Ta coacute E ta xem trong 3 luật R1 R2 R3 luật nagraveo coacute E ta thấy R3 chứa E đồng thời chứa C vagrave D Xeacutet tiếp trong 2 luật R1 R2 luật nagraveo chứa C vagrave D R2 chứa C R3 chứa D Từ đoacute ta coacute được caacutec tri thức hỗ trợ suy diễn vagrave kết luận lagrave nếu coacute A vagrave B thigrave sẽ coacute E Hay nếu A vagrave B đuacuteng thigrave sẽ coacute E
Viacute dụ suy diễn tiến
Giả sử coacute tập chứa 3 luật sau
R1 Nếu coacute A vagrave B thigrave suy ra coacute D
R2 Nếu coacute B thigrave suy ra coacute C
R3 Nếu coacute C vagrave D thigrave suy ra coacute E
Nếu ta coacute A vagrave B thigrave chuacuteng ta suy ra được D từ R1 vagrave suy ra C từ R2 Với D vagrave C đatilde được suy ra ở trecircn giờ chuacuteng ta suy ra được E từ R3
Viacute dụ thực tế
Giả sử muốn biết magraveu của một con vật nuocirci tecircn lagrave Fred biết rằng noacute kecircu ộp ộp vagrave ăn ruồi
Coacute tập 4 luật ban đầu như sau
R1 Nếu X kecircu ộp ộp vagrave ăn ruồi thigrave X lagrave con ếch
R2 Nếu X kecircu chiecircm chiếp vagrave biết hoacutet thigrave X lagrave con chim
R3 Nếu X lagrave con ếch thigrave X coacute magraveu xanh
R4 Nếu X lagrave con chim thigrave X coacute magraveu vagraveng
74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia
Expert system shells lagrave một tập caacutec goacutei phần mềm vagrave caacutec cocircng cụ dugraveng để phaacutet triển caacutec hệ chuyecircn gia
Những Expert system shells đầu tiecircn thường rất rườm ragrave Mặc dugrave vậy noacute vẫn giuacutep cho người sử dụng sẽ khocircng phải bắt đầu lại từ đầu khi xacircy dựng một hệ chuyecircn gia mới
Những shell hiện đại bao gồm hai mocirc-đun chiacutenh lagrave cocircng cụ xacircy dựng một tập quy tắc vagrave mocirc tơ suy diễn
Xacircy dựng hệ chuyecircn gia
Bước 1 xacircy dựng mocirc higravenh bagravei toaacuten xaacutec định vấn đề nhiệm vụ magrave hệ thống sẽ thực hiện Caacutec dạng bagravei toaacuten cần hệ chuyecircn gia
Bagravei toaacuten diễn giải (InterPretation)
Bagravei toaacuten dự baacuteo (Prediction)
Bagravei toaacuten chuẩn đoaacuten (Diagnose)
Bagravei toaacuten gỡ rối (Debugging)
Bagravei toaacuten thiết kế
Tương tự như một dự aacuten phần mềm để xacircy dựng một hệ chuyecircn gia cần phải coacute caacutec yếu tố về nhacircn lực tagravei nguyecircn vagrave thời gian Những yếu tố nagravey ảnh hưởng đến giaacute thah của một hệ chuyecircn giaTrong phần nagravey cacircu hỏi thường được đặt ra lagrave tại sao cần phải xacircy dựng một hệ chuyecircn giaTrước khi bắt đầu phải xaacute định rotilde bagravei toaacuten đạt ra lagrave jiAi lagrave chuyecircn giaAi lagrave người sử dụng
1 Diễn giải (InterPretation) Nghiecircn cứu 1 vấn đề -gt Dựa trecircn những biểu hiện thuộc tiacutenh đặc trưng becircn ngoagravei -gt Tư vấn
(hoặc đưa ra kết luận hay mocirc tả dễ hiểu từ tập dữ liệu thocirc)
2 Bagravei toaacuten dự baacuteo (Prediction) Coacute thể dự đoaacuten được hagravenh vi kết quả dựa trecircn caacutec hiện tượng -gt dự baacuteo
VD Dự baacuteo thời tiết động đấthellip
3 Bagravei toaacuten chẩn đoaacuten (Diagnoss) Xaacutec định caacutec lỗi caacutec bộ phận hỏng hoacutec của hệ thống dựa trecircn caacutec dữ liệu quan saacutet được
4 Bagravei toaacuten gỡ rối (Debugging) Mocirc tả caacutec phương phaacutep khắc phục hệ thống khi gặp sự cố
5 Bagravei toaacuten thiết kế Lựa chọn cấu higravenh caacutec đối tượng nhằm thoả matilden một số ragraveng buộc nagraveo đoacute
6 Giảng dạy Phần mềm dạy học coacute thể chuẩn đoaacuten vagrave sủa lỗi của học sinh trong quaacute trigravenh học tập
Để xaacutec định đuacuteng bagravei toaacuten magrave chuacuteng ta cần giải quyết thigrave phải trả lời đc một số cacircu hỏi
- cần hệ chuyecircn gia
Bước 2 thu thập tri thức lựa chọn cocircng cụ vagrave aacutep dụng
Trong bước thu thập tri thức vấn đề quan trọng lagrave lựa chọn chuyecircn gia những người magrave sẽ đoacuteng goacutep tri thức cho hệ thống Thocircng thường trong suốt quaacute trigravenh phaacutet triển thigrave chuyecircn gia được xem như một thagravenh viecircn của đội phaacutet triển
Hiện nay coacute rất nhiều cocircng cụ để xacircy dựng một hệ chuyecircn gia Phổ biến nhất lagrave JESS CLIPS vagrave OPS5
Bước 3 Thiết kế cơ sở tri thức thiết kế hệ thốngTri thức được biểu diễn trường minh trong cơ sở tri thức
Caacutec chuyecircn gia vagrave kỹ sư tri thức sẽ đối thoại với nhau bằng caacutec kỹ thuật đối thoại Suy diễn (SD) bảng Mocirc higravenh hoacutea SD quy nạp phacircn loại
Vấn đề bagraveo trigrave vagrave phaacutet triển
Caacutec hệ chuyecircn gia đogravei hỏi phải bảo trigrave vagrave phaacutet triển nhiều hơn so với caacutec hệ thống khaacutec Phải thường xuyecircn bổ sung tri thức mới vagrave thay đổi caacutec tri thức cũ để đổi mới hệ chuyecircn gia
Thu thập vagrave khắc phục lỗi do người sử dụng phaacutet hiện để kịp thời khắc phục những sai soacutet của hệ chuyecircn gia
75 Lợi iacutech vagrave hạn chế của caacutec hệ chuyecircn gia
Một số lợi iacutech chiacutenh
Thời gian trả lời hợp lyacute bằng hoặc nhanh hơn so với chuyecircn gia (người) để đi đến cugraveng một quyết định Hệ chuyecircn gia lagrave một hệ thống thời gian thực (real time system)
Khả năng trả lời với mức độ tinh thocircng bằng hoặc cao hơn so với chuyecircn gia (người) trong cugraveng lĩnh vực
Hệ chuyecircn gia giuacutep cho hiệu quả lagravem việc tăng bằng việc sử dụng tập caacutec luật một caacutech nhanh choacuteng magrave ko bị nhầm lẫn chuyecircn gia lagrave người coacute thể quecircn đi một số tri thức cơ sở lyacute luậ nhưng HCG thigrave ko
Quyết định của một người chuyecircn gia coacute thể bị thay đổi vagrave ko coacute tiacutenh thống nhất như quyết định của một hệ chuyecircn gia tạo ra
Hệ chuyecircn gia giuacutep cho người sử dụng coacute thể trau dồi sự hiểu biết trecircn lĩnh vuej cụ thể magrave noacute giải quyết hỗ trợ người ra quyết định coacute trigravenh độ như 1 chuyecircn gia trong quaacute trigravenh gia quyết định
Kiến thức của rất nhiều chuyecircn gia về một lĩnh vực nagraveo đoacute được đưa vagraveo hệ chuyecircn gia lagravem cho CSTT cuat HCG phong phuacute vagrave rộng lớn hơn rất nhiều
HCG giải thiacutech caacutec bước suy luận một caacutech dễ hiểu nhất quaacuten luacutec nagraveo cũng coacute thể sử dụng ko như chuyecircn gia con người
Hạn chế của caacutec hệ chuyecircn gia
Nhược điểm lớn nhất của hệ chuyecircn gia lagrave những yacute kiến chuyecircn mocircn thường rất khoacute matilde hoacutea vagrave giải neacuten
Hệ chuyecircn gia khocircng coacute khả năng tự học tự cập nhật kiến thức mới như caacutec chuyecircn gia magrave cần phải được matilde hoacutea lại khi noacute được cập nhật
Hệ chuyecircn gia khocircng thể nhận ra được vấn đề khocircng nằm trong miền kiến thức của hệ thống
Chương 8 Tri thức vagrave tiếp nhận
1 Bao gồm caacutec vấn đề
Dữ liệu thực tế đo lường hoặc quan saacutet coacute hoặc khocircng coacute bối cảnh
Thocircng tin dữ liệu được tổng hợp một caacutech hữu iacutech để giải quyết những khoacute khăn trong việc đưa ra quyết định
Tri thức bao gồm caacutec ứng dụng quy tắc thocircng tin hướng dẫn của người ra quyết định
2 Những caacutei nhigraven về tri thức
Đại diện lagravem thế nagraveo để diễn tả tri thức viacute dụ như một quyển saacutech khocircng phải lagrave tri thức nhưng noacute lại lagrave một đại diện của tri thức
Sản xuất tri thức lagrave một tập hơp của hagraveng tồn kho coacute thể được sản xuất cũng như mua lại
Tri thức lagrave 1 trong 6 trạng thaacutei của hệ thống
1Dữ liệu 2Thocircng tin 3Cấu truacutec thocircng tin 4Sự thấu hiểu 5Yacute kiến 6 Quyết định
3 Caacutec loại tri thức Phổ biến mocirc tả dữ liệu thocircng tin thủ tục mọi thứ lagravem như thế nagraveo lập luận chiacutenh saacutech hoặc caacutec quy tắc
4 Thu thập Tri thức hệ chuyecircn gia Hầu hết caacutec phương phaacutep đều bắt đầu với mocirc higravenh của caacutec taacutec vụ trong đoacute
hệ chuyecircn gia được xacircy dựng Trong đoacute mocirc tả về caacutec lĩnh vực được tạo ra Caacutec kỹ sư sử dụng caacutec mocirc higravenh giả thuyết vagrave nhận thức về quaacute trigravenh phacircn
tiacutech để gợi ra caacutech giải quyết vấn đề về tri thức từ caacutec chuyecircn gia
5 Caacutec chiều của thu thập tri thức KE- driven caacutec kỹ sư trao đổi trực tiếp với caacutec chuyecircn gia Expert-driven Caacutec chuyecircn gia trực tiếp đưa chuyecircn mocircn của họ vagraveo hệ
thống maacutey tiacutenh Machine-driven Sử dụng caacutec cocircng cụ suy luận để triacutech xuất tri thức từ một
tập caacutec viacute dụ
6 Kỹ thuật thu thập tri thức Trao đổi gồm 2 loại cơ bản lagrave coacute cấu truacutec(coacute kịch bản) vagrave khocircng coacute cấu
truacutec( đối thoại trực tiếp) Giao thức phacircn tiacutech bằng lời Khi caacutec chuyecircn gia thực hiện một cocircng việc
của họ thigrave một bản ghi về cocircng việc đoacute được thực hiện Caacutec kỹ sư sẽ xacircy dựng mocirc higravenh cho những gigrave được ghi lại trong bản ghi
Phương phaacutep sagraveng lọc caacutec chuyecircn gia so saacutenh caacutec nhoacutem liecircn tiếp trong ba đối tượng vagrave cho biết tại sao nhoacutem thứ hai lại khaacutec nhoacutem thứ ba
7 Thu thập tri thức từ nhiều nguồn Thu thập tri thức từ nhiều nguồn lagrave cần thiết để coacute được đầy đủ caacutec tri thức
cho một vấn đề quan điểm yacute kiến traacutei ngược nhau thường phaacutet sinh Phương phaacutep đồng thuận sẽ giuacutep giải quyết được vấn đề macircu thuẫn Kỹ thuật phacircn tiacutech Meta lagrave kỹ thuật được aacutep dụng trong caacutec trường hợp
khaacutec Caacutech tiếp cận bằng định lượng đogravei hỏi caacutec kỹ sư cần cacircn nhắc yếu tố đầu vagraveo của caacutec chuyecircn gia khaacutec nhau
8 Xaacutec nhận hợp lệ vagrave kiểm tra tri thức Một khi thu thập tri thức noacute phải được đaacutenh giaacute về khả năng sử dụng vagrave độ
chiacutenh xaacutec Hai vấn đề cụ thể lagrave hiệu lực của những kiến thức vagrave kiểm tra việc xacircy dựng cơ sở của tri thức
Cần xaacutec nhận xem liệu hệ thống coacute thể hoạt động ở mức độ tối thiểu khocircng
Xaacutec minh liecircn quan đến việc so saacutenh từng chi tiết kỹ thuật của hệ thống những gigrave đatilde được thực hiện cuối cugraveng
9 Một số caacutec biện phaacutep xaacutec nhận Độ chiacutenh xaacutec Khả năng thiacutech nghi Mức độ đầy đủ Bề rộng Độ sacircu Hiệu lực Tổng quan Chiacutenh xaacutec Hiện thực Độ tin cậy Tiacutenh hữu dụng Mức độ
Chương 9 Học maacutey
1 Logic mờ vagrave ngocircn ngữ mờ(Fuzzy Logic and Linguistic Ambiguity)
Ngocircn ngữ tự nhiecircn gồm những khaacutei niệm mơ hồ vagrave khocircng chiacutenh xaacutectruyền tải ngữ nghĩa thocircng qua tiacutenh xấp xỉkhocircng rotilde ragraveng
Những xấp xỉ nagravey giuacutep con người coacute thể truyền tải hết được yacute nghĩa nhưng maacutey thigrave khocircng hiểu
Lagravem sao biểu diễn caacutec tri thức sử dụng caacutec khaacutei niệm khocircng rotilde ragraveng(mờ) hoặc khocircng chiacutenh xaacutec
2 Khaacutei niệm cơ bản của logic mờ tập mờ lagrave những tập hợp khocircng coacute một giới hạn rotilde Mỗi phần tử của noacute chỉ
chứa một mức độ hagravem liecircn thuộc của từng phần tử Vigrave vậy tập mờ khocircng giống như tập cổ điển Tập mờ coacute thể kết hợp với nhau qua những luật mờ magrave đặc trưng cho những hagravenh động trạng thaacutei vagrave thuộc tiacutenh của logic mờ được tận dụng khi thực hiện một bộ điều khiển mờ
Logic mờ dựa trecircn yacute tưởng mỗi phần tử thuộc vagraveo một tập hợp ở một mức độ nagraveo đấy
Locircgic mờ cho pheacutep độ liecircn thuộc (microA )coacute giaacute trị trong khoảng (01) Locircgic mờ coacute thể được coi lagrave mặt ứng dụng của lyacute thuyết tập mờ để xử lyacute caacutec
giaacute trị trong thế giới thực cho caacutec bagravei toaacuten phức tạp
3 So saacutenh tiacutenh đuacuteng đắn logic mờ vagrave xaacutec suất Xaacutec suất thigrave đề cập đến khả năng xảy ra một biến cố hay một điều gigrave đoacute Logic mờ đề cập đến cấp độ magrave đặc tiacutenh ở hiện tại
o viacute dụ1 người coacute chiều cao 6 feet thigrave coacute cấp độ lagrave 05 về chiều cao
4 Ưu điểm của logic mờ Caacutech tiếp cận rất tự nhiecircnkhocircng phức tạp Coacute thể mocirc higravenh hoacutea caacutec hagravem phi tuyến tugravey yacute phức tạp
Coacute thể tận dụng được kinh nghiệm từ những chuyecircn gia hagraveng đầu trong mọi lĩnh vực
Logic mờ được xacircy dựng dựa trecircn ngocircn ngữ tự nhiecircnNền tảng của logic mờ lagrave dựa trecircn cơ sở giao tiếp của con người
5 Nhược điểm của logic mờ Trong 1 hệ thống phức tạpsử dụng logic mờ coacute thể trở thagravenh trở ngại cho
việc xaacutec thực độ tin cậy của hệ thống Cơ chế lập luận mờ khocircng thể học hỏi từ những lỗi sai
6 Mạng noron nhacircn tạo(ANN) Mạng noron nhacircn tạo lagrave một mocirc phỏng xử lyacute thocircng tinđược nghiecircn cứu ra
từ hệ thống thần kinh của sinh vậtgiống như bộ natildeo để xử lyacute thocircng tin ANNs lagrave chương trigravenh dựa trecircn maacutey tiacutenh đơn giản coacute chức năng lagrave một mocirc
higravenh bagravei toaacuten khocircng gian dựa trecircn thử nghiệm vagrave baacuteo lỗi
7 Học từ kinh nghiệm Tiến trigravenh Một mẫu dữ liệu được biểu diễn như một mạng lưới noronANN ldquodự
đoaacutenrdquo 1 đầu radự đoaacuten được so saacutenh với giaacute trị thực tế hoặc giaacute trị chiacutenh xaacutecNếu đoaacuten được chiacutenh xaacutec thigrave khocircng coacute hagravenh động nagraveo được thực hiện
Nếu dự đoaacuten sai ANN kiểm tra lại vagrave xaacutec định lại thocircng số để điều chỉnh Một mẫu dữ liệu khaacutec được biểu diễn vagrave quaacute trigravenh nagravey được lặp lại
8 Nguyecircn tắc cơ bản của cocircng nghệ nơron Caacutec yếu tố xử lyacute cơ bản trong hệ thống thần kinh của con người lagrave tế bagraveo
thần kinhMạng lưới của tế bagraveo nagravey lagrave liecircn kết với nhau nhận được thocircng tin từ caacutec cảm biến trong mắt taihellip
Thocircng tin nhận được bởi tế bagraveo thần kinh hoặc lagrave sẽ kiacutech thiacutech noacute(sẽ được chuyển qua 1 thocircng điệp dọc theo mạng lưới) hoặc lagrave sẽ ngăn cản noacute(ngăn cản dograveng thocircng tin)
Độ nhạy coacute thể thay đổi qua thời gian hoặc sau khi coacute được kinh nghiệm
9 Cấu truacutec mạng Một ANN gồm 3 lớp cơ bản
Lớp đầu vagraveo nhận dữ liệu Lớp becircn trong hoặc lagrave lớp ẩn xử lyacute dữ liệu Lớp đầu ra chuyển tiếp kết quả cuối cugraveng của mạng
10Mạng nơ ron Thường coacute nhiều đầu vagraveo mỗi đầu vagraveo với mức ảnh hưởng vagrave tầm quan
trọng riecircng của noacute Một đầu vagraveo quan trọng coacute thể được sử dụng để khuếch đại đầu ra caacutec hagravem trạng thaacutei tổng hợp caacutec trọng số của caacutec yếu tố
đầuvagraveo khaacutec nhauvagraveo một giaacute trị duy nhất Caacutec hagravem chuyển giao xử lyacute caacutec giaacute trị trạng thaacutei vagrave tạo đầu ra
11Huấn luyện mạng nơ ron Trong mocirc higravenh coacute giaacutem saacutetANN được đến so saacutenh dự đoaacuten của chiacutenh
noacute với thocircng tin phản hồi coacute chứa caacutec kết quả mong muốn ANN sẽ phải tigravem caacutech thay đổi caacutec tham số becircn trong củamigravenh (caacutec trọng số vagrave caacutec ngưỡng) để tạo necircn một aacutenh xạ coacute khả năng aacutenh xạcaacutec đầu vagraveo thagravenh caacutec đầu ra mong muốn Sự thay đổi nagravey được tiến hagravenh nhờ việc so saacutenh giữa đầu ra thực sự vagrave đầu ra mong muốn
Trong mocirc higravenh khocircng coacute giaacutem saacutetANN nhận được dữ liệu vagraveo nhưng khocircng phải coacute bất kỳ thocircng tin phản hồi về kết quả mong muốn
Phần lớn caacutec ứng dụng nằm trong vugraveng của caacutec bagravei toaacuten ước lượng như mocirc higravenh hoacuteathống kecirc neacuten lọc phacircn cụm
12Lợi iacutech Liecircn kết với mạng noron Traacutenh caacutech lập trigravenh tường minh Giảm nhu cầu của chuyecircn gia ANNs thigrave thiacutech nghi với caacutec yếu tố đầu vagraveo thay đổi Khocircng cần thiết cho cơ sở tri thức tinh chế ANNs coacute tiacutenh động vagrave cải thiện với việc sử dụng Coacute khả năng xử lyacute dữ liệu khocircng chiacutenh xaacutec hoặc khocircng đầy đủ Cho pheacutep tổng quaacutet hoacutea từ thocircng tin cụ thể Cho pheacutep thu thập cảm giaacutec thocircng thường vagraveo miền giải quyết vấn đề
13Hạn chế của việc liecircn kết với mạng noron ANNs khocircng thể giải thiacutech được suy luận Bản chất hộp đen thường khiến cho vấn đề traacutech nhiệm vagrave độ tin cậy phaacutet
sinh lagrave khoacute khăn Lặp đi lặp lại quaacute trigravenh huấn luyện rất tốn thời gian Nguồn lực caacutec nhagrave phacircn tiacutech vagrave thiết kế coacute tay nghề cao vẫn lagrave đaacuteng lo
ngại Cocircng nghệ ANN thuacutec đẩy hạn chế của phần cứng hiện tại ANN yecircu cầu phải coacute sự tin tưởng ở đầu ra
14Giới thiệu về thuật toaacuten di truyền Cũng như mạng lưới thần kinh caacutec thuật toaacuten di truyền được dựa trecircn lyacute
thuyết sinh học Thuật toaacuten di truyền tigravem thấy nguồn gốc của chuacuteng trong caacutec lyacute thuyết
tiến hoacutea của chọn lọc tự nhiecircn vagrave thiacutech ứng với biến đổi khiacute hậu Kết quả thuật toaacuten di truyền lagrave từ giao phối 2 caacute thể trong quần thế để tạo
ra con caacutei đocirci khi tốt hơn so với bậc cha mẹ của chuacuteng 15Caacutec thagravenh phần cơ bản của thuật toaacuten di truyền
Toaacuten tử chọn lọc Caacutec caacute thể tốt được chọn lọc để đưa vagraveo thế hệ sau Sự chọn lọc nagravey căn cứ vagraveo độ thiacutech nghi với mocirci trường của mỗi caacute thể
Toaacuten tử lai gheacutep (crossover) Hai caacute thể cha vagrave mẹ trao đổi caacutec gen với nhau để tạo ra caacute thể con
Toaacuten tử đột biến (mutation) Một caacute thể thay đổi một số gen để biến đổi thagravenh một caacute thể mớiTất cả caacutec toaacuten tử trecircn khi thực hiện đều mang tiacutenh ngẫu nhiecircn
16Quaacute trigravenh cơ bản của một thuật toaacuten di truyền Khởi tạo
Đaacutenh giaacute quần thể
Lựa chọn NST thiacutech hợp nhất vagrave loại bỏ NST yếu nhất
Quy trigravenh giao nhau vagrave cải thiện quần thể
đột biến tiến trigravenh để khaacutem phaacute ra NST mới
17Ưu nhược điểm của việc kết hợp với thuật toaacuten di truyền Kiacutech thước quần thể lagrave 1 yếu tố quan trọng trong tốc độ của việc tigravem
kiếmnhưng noacute tương đối dễ dagraveng để dự đoaacuten tốc độ nagravey Giao nhau hoặc đột biến lagrave khocircng necircn đc sử dụng quaacute thường xuyecircn Luocircn coacute được iacutet nhất 1 giải phaacutep hợp lyacute Necircn coacute thể aacutep dụng chuacuteng cho caacutec vấn đề magrave chuacuteng ta khocircng coacute hướng
về caacutech giải quyết Sức mạnh của thuật toaacuten xuất phaacutet từ khaacutei niệm đơn giảnkhocircng phải từ
một thủ tục thuật toaacuten phức tạp 18Tương lai của học maacutey
Mạng lưới thần kinh nhacircn tạo vượt quaacute năng lực của con người trong caacutec trường hợp bị cocirc lập
Về mặt lyacute thuyếtmột maacutey tiacutenh coacute thể xử lyacute dũ liệu nhanh hơn hagraveng triệu lần so với 1 con người
May mắn thay cho chuacuteng tacon người tốt hơn nhiều khi magrave coacute được dữ liệumaacutey tiacutenh khocircng coacute 1 số thứ như lagrave 5 giaacutec quan
CHƯƠNG 10 KHO DỮ LIỆU
1 Kho dữ liệu Kho dữ liệu lagrave tuyển tập caacutec cơ sở dữ liệu tiacutech hợp hướng chủ đề được
thiết kế để trợ giuacutep cho một hệ hỗ trợ quyết định
Theo John Ladley Cocircng nghệ kho dữ liệu lagrave tập caacutec phương phaacutep kỹ thuật vagrave caacutec cocircng cụ coacute thể kết hợp hỗ trợ nhau để cung cấp thocircng tin cho người sử dụng trecircn cơ sở tiacutech hợp từ nhiều nguồn dữ liệu nhiều mocirci trường khaacutec nhau
Kho dữ liệu thường rất lớn tới hagraveng trăm GB hay thậm chiacute hagraveng Terabyte
2 Kho dữ liệu vận hagravenh (ODS) Một kho dữ liệu vận hagravenh Aacutep dụng kỹ thuật kho dữ liệu vagraveo caacutec hệ xử
lyacute giao taacutec lưu trữ dữ liệu cho một ứng dụng đặc thugrave Noacute đưa vagraveo kho dữ liệu một dograveng caacutec dữ liệu thocirc được thiết kế
3 So saacutenh
Kho dữ liệu vận hagravenh Kho dữ liệu
Dữ liệu theo chủ đề Dữ liệu theo chủ đề
Dữ liệu tiacutech hợp Dữ liệu tiacutech hợp
Dữ liệu thay đổi Dữ liệu khocircng thay đổi
Dữ liệu được cập nhật khi thay đổi
Dữ liệu giữ nguyecircn
Chỉ coacute dữ liệu hiện tạiDữliệu hiện tại vagrave dữ liệu lịch sử
Chu kỳ lagravem tươi dữ liệu ngắn Chu kỳ lagravem tươi dữ liệu dagravei
Chỉ coacute dữ liệu chi tiết Dữ liệu chi tiết vagrave dữ liệu tổng kết
Dugraveng cho caacutec quyết định ngắn hạn
Dugraveng cho hoạch định dagravei hạn
4 Kho dữ liệu cục bộ (Data Mart - DM)
Kho dữ liệu cục bộ lagrave CSDL coacute những đặc điểm giống với kho dữ liệu nhưng với quy mocirc nhỏ hơn vagrave lưu trữ dữ liệu về một lĩnh vực một chuyecircn ngagravenh
Data mart phụ thuộc Chứa những dữ liệu được lấy từ DW vagrave những dữ liệu nagravey sẽ được triacutech lọc vagrave tinh chế tiacutech hợp lại ở mức cao hơn để phục vụ một chủ đề nhất định của Datamart
Data mart độc lập Khocircng giống như Datamart phụ thuộc Data mart độc lập được xacircy dựng trước DW vagrave dữ liệu được trực tiếp lấy từ caacutec nguồn khaacutec nhau
5 Siecircu dữ liệu Metadata lagrave dữ liệu để mocirc tả dữ liệu Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột
một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi Metadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu
6 Mocirci trường kho dữ liệu Hệ thống của tổ chức vagrave kho cung cấp dữ liệu để xacircy dựng kho dữ liệu Trong quaacute trigravenh chuyển dữ liệu từ caacutec nguồn khaacutec nhau dữ liệu coacute thể
được lagravem sạch hoặc chuyển đổi vagrave vigrave thế DW được xem như lagrave một chuẩn cho việc lưu trữ
Đồng thời siecircu dữ liệu được ghi lại Cuối cugraveng DW hoặc siecircu thị coacute thể được sử dụng để tạo ra một kho dữ
liệu ldquocaacute nhacircnrdquo 7 Caacutec đặc điểm của kho dữ liệu
Đặc điểm Mocirc tả
Hướng chủ đề - DL tổ chức theo caacutech thức người dugraveng tham chiếu
Tiacutech hợp - Dữ liệu ldquosạchrdquo loại bỏ tiacutenh thiếu nhất quaacuten
Khocircng thay đổi - DL ldquochỉ đọcrdquo người dugraveng khocircng thay đổi được
Chuỗi thời gian - DL lagrave chuỗi thời gian khocircng phải lagrave trạng thaacutei hiện tại
Được tổng kết - DL vận hagravenhthao taacutec khi cần thiết
được kết hợp lại thagravenh dạng coacute thể dugraveng được cho quyết định
Kiacutech cỡ lớn hơn - Lưu giữ theo chuỗi thời gian tức lagrave giữ lại nhiều DL
Khocircng được chuẩn hoacutea - Coacute thể dư thừa DLSiecircu dữ liệu - Dữ liệu của dữ liệu được lưu trữNguồn dữ liệu - DL vận hagravenh (caacutec hệ sẵn coacute) cugraveng
với caacutec nguồn ngoagravei 8 Kho dữ liệu hướng chủ đề
Hướng chủ để coacute nghĩa lagrave kho dữ liệu được tổ chức xung quanh caacutec chủ đề chiacutenh như khaacutech hagraveng sản phẩm sản xuất Tập trung vagraveo việc mocirc higravenh hoacutea vagrave phacircn tiacutech dữ liệu cho caacutec nhagrave ra quyết định magrave khocircng tập trung vagraveo caacutec xử lyacute thocircng thường Cung cấp cho người dugraveng một khung nhigraven toagraven vẹn đơn giản vagrave đầy đủ về caacutec sự kiện quanh caacutec chủ đề
9 Dữ liệu trong DW được tiacutech hợp Dữ liệu trong kho dữ liệu được xacircy dựng bằng caacutech tổng hợp dữ liệu từ
nhiều nguồn khaacutec nhau vagrave caacutec nguồn coacute tổ chức khaacutec nhau Cơ sở dữ liệu caacutec file excel caacutec flat file hoặc caacutec raw file Khi đưa vagraveo kho dữ liệu caacutec dữ liệu được lagravem sạch vagrave tiacutech hợp dữ liệu nhằm đảm bảo tiacutenh nhất quaacuten của dữ liệu
10Kiến truacutec kho dữ liệu Tầng cơ sở dữ liệu hoạt động Tầng truy xuất thocircng tin Tầng truy xuất dữ liệu Tầng siecircu dữ liệu Tầng quản lyacute tiến trigravenh Tầng thocircng điệp của ứng dụng Tầng vật liacute của kho dữ liệu Tầng trigravenh diễn dữ liệu
11Higravenh trạng kho dữ liệu Kho dữ liệu ảo - người dugraveng cuối coacute thể truy cập trực tiếp đến kho dữ liệu
sử dụng caacutec cocircng cụ cho pheacutep ở tầng truy xuất dữ liệu Kho dữ liệu trung tacircm-1 cơ sở dữ liệu vật lyacute chứa tất cả dữ liệu cho một
vugraveng chuyecircn dụng nagraveo đoacute
Kho dữ liệu phacircn taacuten- Thagravenh phần được phacircn taacuten qua nhiều hệ cơ sở dữ liệu vật lyacute
12METADATA- Siecircu dữ liệu Định nghĩa Siecircu dữ liệu lagrave dữ liệu về dữ liệu Lagrave 1 lưu trữ dugraveng để
Miecircu tả kho dữ liệu tổng thể Nhận dạng kiểu kho dữ liệu Quản liacute quaacute trigravenh tiacutech hợp dữ liệu Quản liacute quaacute trigravenh cập nhật kho dữ liệu Quản liacute bảo mật
Lagrave chigravea khoacutea quyết định sự thagravenh cocircng của kho dữ liệu luocircn được thay đổi vagrave cập nhật theo sự phaacutet triển của kho dữ liệu
Dugraveng để quản liacute điều khiển kho dữ liệu Sự ra đời của kho dữ liệu như 1 cấu truacutec hỗ trợ ra quyết định siecircu dữ liệu
được xem như nguồn tagravei nguyecircn dữ liệu Siecircu dữ liệu lagrave trừu tượng Chuacuteng lagrave dữ liệu bậc cao cung cấp mocirc tả ngắn
gọn caacutec dữ liệu bậc thấp hơn 13Hoạt động của Siecircu dữ liệu
Siecircu dữ liệu rất cần thiết trong việc chuyển hoacutea thocircng tin trở thagravenh tri thức Lagrave chigravea khoacutea giuacutep chuacuteng ta xử lyacute được dữ liệu thocirc Viacute dụ một dograveng dữ liệu baacuten hagraveng 1023 K596 11121 agraveNoacute sẽ khocircng coacute nghĩa gigrave cho đến khi chuacuteng ta đưa vagraveo siecircu dữ liệu (thư
mục chứa dữ liệu) agrave cửa hagraveng 1023 sản phẩm K596 vagrave số tiền baacuten được lagrave 11121 đocirc la
14Sự cần thiết phải nhất quaacuten trong kho dữ liệu Kho dữ liệu được xacircy dựng cho lợi iacutech của những nhagrave phacircn tiacutech kinh
doanh caacutec nhagrave quản trị cho tất cả caacutec khu vực chức năng Trong cơ sở dữ liệu riecircng caacutec khu vực khaacutec nhau coacute thể định nghĩa vagrave lưu
trữ dữ liệu thocircng qua phiecircn bản của chiacutenh noacute Khi dữ liệu được lấy từ những vugraveng khaacutec nhau đoacute vagrave được đặt vagraveo kho dữ
liệu Việc chuyển đổi vagrave lagravem sạch caacutec tiến trigravenh sẽ đảm bảo noacute lagrave duy nhất được tiacutech hợp tại một mức của tổ chức
15Ragrave soaacutet lại dữ liệu ndash Thực thi siecircu dữ liệu
Bất kể cấu truacutec tự nhiecircn của 1 cacircu truy vấn thế nagraveo thigrave caacutec thagravenh phần của siecircu dữ liệu rất quan trọng đối với người ra quyết định
Bảng thuộc tiacutenh khoacutea được lưu trữ bởi kho dữ liệu Tập hợp dữ liệu được lấy từ đacircu Những chuyển đổi nagraveo được thực thi với việc lagravem sạch
16Siecircu dữ liệu lagrave gigrave Metadata - lagrave thocircng tin mocirc tả nội dung của cơ sở dữ liệu (CSDL) Metadata baacuteo cho người dugraveng biết thời gian cập nhật sau cugraveng của dữ liệu
định dạng vagrave mục điacutech sử dụng của noacute Những thocircng tin nagravey coacute thể hướng dẫn người dugraveng duyệt qua CSDL vagrave
giuacutep họ hiểu được yacute nghĩa vagrave ngữ cảnh của dữ liệu Trong CSDL metadata lagrave caacutec dạng biểu diễn khaacutec nhau của caacutec đối tượng
trong CSDL Trong CSDL quan hệ metadata lagrave caacutec định nghĩa của bảng cột CSDL
view vagrave nhiều đối tượng khaacutec Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột
một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi -gtMetadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu
Bảng chuyển đổi Ghi lại những chuyển đổi đatilde được thực hiện
Lịch sử thực thi Ghi lại những dữ liệu đatilde được
phacircn tiacutech
Higravenh thaacutei kết nốiGhi lại những dữ liệu được kết nối vagrave tần suất
17Aacutenh xạ thocircng thường của siecircu dữ liệu Bản ghi aacutenh xạ chuyển đổi bao gồm
Định danh của nguồn gốc Chuyển đổi thuộc tiacutenh Chuyển đổi thuộc tiacutenh vật lyacute Matilde hoacutea tham chiếu bảng chuyển đổi Đổi tecircn Đổi khoacutea Gaacuten giaacute trị cho thuộc tiacutenh mặc định Chọn logic cho caacutec nguồn nhiều giaacute trị Đổi thuật toaacuten
18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để
phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai
lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave
tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec
Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm
Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo
19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua
caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau
SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được
Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra
một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức
Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ
Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ
Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech
CHƯƠNG 11 KHAI PHAacute DỮ LIỆU
1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn
ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993
Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng
2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd
1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều
2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP
3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn
4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng
5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server
6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo
7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động
8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời
9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều
10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện
11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech
12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP
3 Xử lyacute phacircn tiacutech trực tuyến OLAP
MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave
dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu
ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave
thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu
HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave
ROLAP4 Khai phaacute dữ liệu
Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh
khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn
Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan
5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp
6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại
Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp
Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec
Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt
Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra
Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh
vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho
Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec
Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm
Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục
Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng
gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp
Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn
Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec
Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper
Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2
Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25
Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước
Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng
Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện
trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp
Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute
độ hỗ trợ ge ngưỡng minsup
độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan
Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn
Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết
Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu
MOLAP ROLAP HOLAP
Lưu trữ dữ liệu cơ sở
Khối Bảng quan hệ Bảng quan hệ
Lưu trữ thocircng tin tổng hợp
Khối Bảng quan hệ Khối
Hiệu suất thực hiện truy vấn
Nhanh nhất Chậm nhất Nhanh
Tiecircu thụ khocircng gian lưu trữ
Nhiều Thấp Trung bigravenh
Chi phiacute bảo trigrave Cao Thấp Trung bigravenh
- Coacute một vagravei điều kiện sẽ được hợp nhất cho việc chuyển đổi cocircng nghệ Trong đoacute một vagravei điều kiện coacute thể dễ dự đoaacuten Hai điều kiện magrave ta coacute thể thấy lagrave+ Phaacutet triển cocircng nghệ maacutey tiacutenh trong việc điều hagravenh sẽ tạo ra sự chuyển đổi được chấp nhận một caacutech dễ dagraveng hơn+ Mở rộng traacutech nhiệm điều hagravenh sẽ mở rộng nhu cầu thocircng tin
Tương lai của EIS- EIS thocircng minh Những tiến bộ trong cocircng nghệ AI sẽ được triển khai trong caacutec
EIS- EIS đa phương tiện Cơ sở dữ liệu đa phương tiện sẽ cho pheacutep tiacutech hợp văn bản
giọng noacutei vagrave higravenh ảnh trong tương lai- EIS thocircng tin Tương lai EIS sẽ mở rộng hơn trong việc sử dụng dữ liệu becircn
ngoagravei doanh nghiệp- EIS kết nối Giao tiếp với băng thocircng rộng cho pheacutep kết nối liecircn thocircng lớn hơn
Chương 7 HỆ CHUYEcircN GIA VAgrave TRIacute TUỆ NHAcircN TẠO
71 Caacutec khaacutei niệm
72 Triacute thocircng minh của triacute tuệ nhacircn tạo
73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia
74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia
75 Lợi iacutech vagrave hạn chế của hệ chuyecircn gia
71 Caacutec khaacutei niệm
Chuyecircn mocircn (Expertise) sự hiểu biết rộng trong 1 lĩnh vực hẹp
Hệ chuyecircn gia (Expert Systems)1 chương trigravenh maacutey tiacutenh sử dụng 1 tập caacutec luật dựa trecircn tri thức của con người để giải quyết caacutec vấn đề đogravei hogravei phải coacute sự chuyecircn mocircn
Một số hệ chuyecircn gia nổi tiếng
DENDRAL (Standford 1960s Edward Feigenbaum)
MYCIN (Standford1970s Edward Shortliffe)
PROSPECTOR (MIT 1979)
Triacute tuệ nhacircn tạo (Artificial Intelligence ndash AI)
Triacute tuệ nhacircn tạo một bộ phacircn của ngagravenh khoa học maacutey tiacutenh quan tacircm đến việc thiết kế caacutec hệ thống maacutey tiacutenh thocircng minh đoacute lagrave caacutec hệ thống đưa ra caacutec đặc điểm magrave từ đoacute chuacuteng ta liecircn hệ với sự thocircng minh trong hagravenh động của con người (Barr vagrave Feigenbaum 1981)
Mục điacutech của AI
Mục điacutech khoa học xaacutec định caacutec gợi yacute để giải thiacutech caacutec loại khaacutec nhau của triacute tuệ thực
Mục điacutech kỹ thuật giải quyết caacutec vấn đề trong thế giới thực
Triacute tuệ nhacircn tạo kế thừa nhiều yacute tưởng quan điểm kỹ thuật từ caacutec ngagravenh khoa học khaacutec
- Triết học
- Logic Toaacuten học
- Tiacutenh toaacuten
- Khoa học tacircm lyacute Khoa học nhận thức
- Sinh học Thần kinh học
- Tiến hoacutea
Caacutec lĩnh vực ứng dụng trong Triacute tuệ nhacircn tạo
Mạng nơ ron thần kinh (Neural Networks)
Tiacutenh toaacuten sự tiến hoacutea
(Evolutionary Computation)
Hệ chuyecircn gia (Expert Systems)
Kỹ thuật xử lyacute tiếng noacutei (Speech Processing)
Kỹ thuật xử lyacute ngocircn ngữ tự nhiecircn
(Natural Language Processing)
Lập kế hoạch (Planning)
Robot (Robotics)
Khoa học higravenh ảnh (Vision)
Caacutec kỹ thuật thocircng dụng dugraveng trong AI
Biểu diễn(Representation)
Học (Learning)
Caacutec luật (Rules)
Tigravem kiếm (Search)
72 Triacute thocircng minh của triacute tuệ nhacircn tạo
Con người suy diễn như thế nagraveo
Phacircn loại (Categorization)
Caacutec quy tắc cụ thể
Heuristics
Kinh nghiệm trước đoacute
Dự tiacutenh trước
Maacutey tiacutenh suy diễn như thế nagraveo
Lập luận dựa trecircn luật IF-THEN mocirc tả tri thức được matilde hoacutea dưới dạng caacutec luật
Caacutec khung (Frames) lagrave caacutec đại diện mocirc tả caacutec tigravenh huống giống nhau lagrave điển higravenh của một vagravei phacircn loại
Lập luận dựa trecircn caacutec trường hợp mocirc phỏng giải phaacutep trước đoacute cho một vấn đề hiện tại
Nhận dạng mẫu phaacutet hiện acircm thanh higravenh dạng hoặc caacutec chuỗi dagravei
Caacutec dạng khaacutec của Triacute tuệ nhacircn tạo
Học maacutey- mạng nơron vagrave giải thuật di truyền
Lập trigravenh tự động ndash lagrave những kỹ thuật tạo ra caacutec chương trigravenh để lagravem 1 nhiệm vụ riecircng biệt (cho pheacutep những người khocircng phải lagrave người lập trigravenh coacute thể lập trigravenh được)
Cuộc sống nhacircn tạo ndash nỗ lực để taacutei tạo caacutec hiện tượng sinh học trong caacutec hệ thống dựa trecircn maacutey tiacutenh
73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia(Expert Systems- ES)
Theo Jackson (1999) Một hệ chuyecircn gia lagrave một chương trigravenh maacutey tiacutenh mocirc tả vagrave suy diễn với tri thức của một vagravei lĩnh vực để giải quyết vấn đề hay đưa ra caacutec lời khuyecircn
Cấu truacutec cơ bản của ES được dựa theo cấu truacutec chung của DSS Sự khaacutec biệt chiacutenh giữa ES vagraveDSS lagrave hệ ES thu thập caacutec kiến thức từ những
chuyecircn gia trong lĩnh vực quan tacircmĐặc trưng của hệ chuyecircn gia Hiệu quả cao Thời gian trả lời thỏa đaacuteng Độ tin cậy cao Dễ hiểu
Giao diện người dugraveng trong ES
Thiết kế giao diện người dugraveng tập trung vagraveo caacutec yếu tố như dễ dagraveng sử dụngcoacute độ tin cậy cao giảm tải những khoacute khăn khi sử dụng
Thiết kế necircn coacute một số tương taacutec (đầu vagraveo kiểm soaacutet vagrave truy vấn)
Cấu tạo giao diện người dugraveng gồm coacute magraven higravenh cảm ứng bagraven phiacutem buacutet saacuteng lệnh thoại caacutec phiacutem chuyecircn dụng
Cơ sở tri thức (Knowledge Base)
Chứa đựng caacutec tri thức cụ thể miền thu được từ caacutec chuyecircn gia miền
Coacute thể chứa caacutec mocirc tả caacutec hagravenh vi giải quyết vấn đề caacutec ragraveng buộc caacutec heuristics
Thagravenh cocircng của một ES dựa trecircn tiacutenh đầy đủ vagrave tiacutenh chiacutenh xaacutec của cơ sở tri thức
Mocirc tơ suy diễn (Inference Engine)
Ở đacircy tri thức được đặt để sử dụng tạo ra caacutec giải phaacutep để giải quyết vấn đề
Mocirc tơ nagravey coacute khả năng thực hiện diễn dịch hoặc suy diễn dựa trecircn caacutec luật hay caacutec caacutec sự kiện
Đồng thời cũng coacute khả năng sử dụng caacutec suy diễn mờ hay khocircng chiacutenh xaacutec dựa trecircn xaacutec suất hay aacutenh xạ mẫu
Vograveng điều khiển suy diễn
1 Aacutenh xạ caacutec luật với caacutec sự kiện đatilde được cho
2 Chọn luật để thực hiện
3 Thực hiện luật bằng caacutech thecircm caacutec sự kiện được suy diễn ra vagraveo bộ nhớ lagravem việc
Chuỗi suy diễn (Chaining)
Suy diễn tiến (forward chaining) maacutey suy diễn bắt đầu từ dữ liệu ban đầu vagrave thực hiện việc suy luận để đưa ra caacutec kết luận cuối cugraveng
Suy diễn lugravei (backward chaining) maacutey suy diễn bắt đầu từ dữ liệu điacutech vagrave tigravem ra tri thức hỗ trợ cho dữ liệu điacutech đoacute
Viacute dụ suy diễn lugravei
R1 Nếu coacute A vagrave B thigrave suy ra coacute D
R2 Nếu coacute B thigrave suy ra coacute C
R3 Nếu coacute C vagrave D thigrave suy ra coacute E
Ta coacute E ta xem trong 3 luật R1 R2 R3 luật nagraveo coacute E ta thấy R3 chứa E đồng thời chứa C vagrave D Xeacutet tiếp trong 2 luật R1 R2 luật nagraveo chứa C vagrave D R2 chứa C R3 chứa D Từ đoacute ta coacute được caacutec tri thức hỗ trợ suy diễn vagrave kết luận lagrave nếu coacute A vagrave B thigrave sẽ coacute E Hay nếu A vagrave B đuacuteng thigrave sẽ coacute E
Viacute dụ suy diễn tiến
Giả sử coacute tập chứa 3 luật sau
R1 Nếu coacute A vagrave B thigrave suy ra coacute D
R2 Nếu coacute B thigrave suy ra coacute C
R3 Nếu coacute C vagrave D thigrave suy ra coacute E
Nếu ta coacute A vagrave B thigrave chuacuteng ta suy ra được D từ R1 vagrave suy ra C từ R2 Với D vagrave C đatilde được suy ra ở trecircn giờ chuacuteng ta suy ra được E từ R3
Viacute dụ thực tế
Giả sử muốn biết magraveu của một con vật nuocirci tecircn lagrave Fred biết rằng noacute kecircu ộp ộp vagrave ăn ruồi
Coacute tập 4 luật ban đầu như sau
R1 Nếu X kecircu ộp ộp vagrave ăn ruồi thigrave X lagrave con ếch
R2 Nếu X kecircu chiecircm chiếp vagrave biết hoacutet thigrave X lagrave con chim
R3 Nếu X lagrave con ếch thigrave X coacute magraveu xanh
R4 Nếu X lagrave con chim thigrave X coacute magraveu vagraveng
74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia
Expert system shells lagrave một tập caacutec goacutei phần mềm vagrave caacutec cocircng cụ dugraveng để phaacutet triển caacutec hệ chuyecircn gia
Những Expert system shells đầu tiecircn thường rất rườm ragrave Mặc dugrave vậy noacute vẫn giuacutep cho người sử dụng sẽ khocircng phải bắt đầu lại từ đầu khi xacircy dựng một hệ chuyecircn gia mới
Những shell hiện đại bao gồm hai mocirc-đun chiacutenh lagrave cocircng cụ xacircy dựng một tập quy tắc vagrave mocirc tơ suy diễn
Xacircy dựng hệ chuyecircn gia
Bước 1 xacircy dựng mocirc higravenh bagravei toaacuten xaacutec định vấn đề nhiệm vụ magrave hệ thống sẽ thực hiện Caacutec dạng bagravei toaacuten cần hệ chuyecircn gia
Bagravei toaacuten diễn giải (InterPretation)
Bagravei toaacuten dự baacuteo (Prediction)
Bagravei toaacuten chuẩn đoaacuten (Diagnose)
Bagravei toaacuten gỡ rối (Debugging)
Bagravei toaacuten thiết kế
Tương tự như một dự aacuten phần mềm để xacircy dựng một hệ chuyecircn gia cần phải coacute caacutec yếu tố về nhacircn lực tagravei nguyecircn vagrave thời gian Những yếu tố nagravey ảnh hưởng đến giaacute thah của một hệ chuyecircn giaTrong phần nagravey cacircu hỏi thường được đặt ra lagrave tại sao cần phải xacircy dựng một hệ chuyecircn giaTrước khi bắt đầu phải xaacute định rotilde bagravei toaacuten đạt ra lagrave jiAi lagrave chuyecircn giaAi lagrave người sử dụng
1 Diễn giải (InterPretation) Nghiecircn cứu 1 vấn đề -gt Dựa trecircn những biểu hiện thuộc tiacutenh đặc trưng becircn ngoagravei -gt Tư vấn
(hoặc đưa ra kết luận hay mocirc tả dễ hiểu từ tập dữ liệu thocirc)
2 Bagravei toaacuten dự baacuteo (Prediction) Coacute thể dự đoaacuten được hagravenh vi kết quả dựa trecircn caacutec hiện tượng -gt dự baacuteo
VD Dự baacuteo thời tiết động đấthellip
3 Bagravei toaacuten chẩn đoaacuten (Diagnoss) Xaacutec định caacutec lỗi caacutec bộ phận hỏng hoacutec của hệ thống dựa trecircn caacutec dữ liệu quan saacutet được
4 Bagravei toaacuten gỡ rối (Debugging) Mocirc tả caacutec phương phaacutep khắc phục hệ thống khi gặp sự cố
5 Bagravei toaacuten thiết kế Lựa chọn cấu higravenh caacutec đối tượng nhằm thoả matilden một số ragraveng buộc nagraveo đoacute
6 Giảng dạy Phần mềm dạy học coacute thể chuẩn đoaacuten vagrave sủa lỗi của học sinh trong quaacute trigravenh học tập
Để xaacutec định đuacuteng bagravei toaacuten magrave chuacuteng ta cần giải quyết thigrave phải trả lời đc một số cacircu hỏi
- cần hệ chuyecircn gia
Bước 2 thu thập tri thức lựa chọn cocircng cụ vagrave aacutep dụng
Trong bước thu thập tri thức vấn đề quan trọng lagrave lựa chọn chuyecircn gia những người magrave sẽ đoacuteng goacutep tri thức cho hệ thống Thocircng thường trong suốt quaacute trigravenh phaacutet triển thigrave chuyecircn gia được xem như một thagravenh viecircn của đội phaacutet triển
Hiện nay coacute rất nhiều cocircng cụ để xacircy dựng một hệ chuyecircn gia Phổ biến nhất lagrave JESS CLIPS vagrave OPS5
Bước 3 Thiết kế cơ sở tri thức thiết kế hệ thốngTri thức được biểu diễn trường minh trong cơ sở tri thức
Caacutec chuyecircn gia vagrave kỹ sư tri thức sẽ đối thoại với nhau bằng caacutec kỹ thuật đối thoại Suy diễn (SD) bảng Mocirc higravenh hoacutea SD quy nạp phacircn loại
Vấn đề bagraveo trigrave vagrave phaacutet triển
Caacutec hệ chuyecircn gia đogravei hỏi phải bảo trigrave vagrave phaacutet triển nhiều hơn so với caacutec hệ thống khaacutec Phải thường xuyecircn bổ sung tri thức mới vagrave thay đổi caacutec tri thức cũ để đổi mới hệ chuyecircn gia
Thu thập vagrave khắc phục lỗi do người sử dụng phaacutet hiện để kịp thời khắc phục những sai soacutet của hệ chuyecircn gia
75 Lợi iacutech vagrave hạn chế của caacutec hệ chuyecircn gia
Một số lợi iacutech chiacutenh
Thời gian trả lời hợp lyacute bằng hoặc nhanh hơn so với chuyecircn gia (người) để đi đến cugraveng một quyết định Hệ chuyecircn gia lagrave một hệ thống thời gian thực (real time system)
Khả năng trả lời với mức độ tinh thocircng bằng hoặc cao hơn so với chuyecircn gia (người) trong cugraveng lĩnh vực
Hệ chuyecircn gia giuacutep cho hiệu quả lagravem việc tăng bằng việc sử dụng tập caacutec luật một caacutech nhanh choacuteng magrave ko bị nhầm lẫn chuyecircn gia lagrave người coacute thể quecircn đi một số tri thức cơ sở lyacute luậ nhưng HCG thigrave ko
Quyết định của một người chuyecircn gia coacute thể bị thay đổi vagrave ko coacute tiacutenh thống nhất như quyết định của một hệ chuyecircn gia tạo ra
Hệ chuyecircn gia giuacutep cho người sử dụng coacute thể trau dồi sự hiểu biết trecircn lĩnh vuej cụ thể magrave noacute giải quyết hỗ trợ người ra quyết định coacute trigravenh độ như 1 chuyecircn gia trong quaacute trigravenh gia quyết định
Kiến thức của rất nhiều chuyecircn gia về một lĩnh vực nagraveo đoacute được đưa vagraveo hệ chuyecircn gia lagravem cho CSTT cuat HCG phong phuacute vagrave rộng lớn hơn rất nhiều
HCG giải thiacutech caacutec bước suy luận một caacutech dễ hiểu nhất quaacuten luacutec nagraveo cũng coacute thể sử dụng ko như chuyecircn gia con người
Hạn chế của caacutec hệ chuyecircn gia
Nhược điểm lớn nhất của hệ chuyecircn gia lagrave những yacute kiến chuyecircn mocircn thường rất khoacute matilde hoacutea vagrave giải neacuten
Hệ chuyecircn gia khocircng coacute khả năng tự học tự cập nhật kiến thức mới như caacutec chuyecircn gia magrave cần phải được matilde hoacutea lại khi noacute được cập nhật
Hệ chuyecircn gia khocircng thể nhận ra được vấn đề khocircng nằm trong miền kiến thức của hệ thống
Chương 8 Tri thức vagrave tiếp nhận
1 Bao gồm caacutec vấn đề
Dữ liệu thực tế đo lường hoặc quan saacutet coacute hoặc khocircng coacute bối cảnh
Thocircng tin dữ liệu được tổng hợp một caacutech hữu iacutech để giải quyết những khoacute khăn trong việc đưa ra quyết định
Tri thức bao gồm caacutec ứng dụng quy tắc thocircng tin hướng dẫn của người ra quyết định
2 Những caacutei nhigraven về tri thức
Đại diện lagravem thế nagraveo để diễn tả tri thức viacute dụ như một quyển saacutech khocircng phải lagrave tri thức nhưng noacute lại lagrave một đại diện của tri thức
Sản xuất tri thức lagrave một tập hơp của hagraveng tồn kho coacute thể được sản xuất cũng như mua lại
Tri thức lagrave 1 trong 6 trạng thaacutei của hệ thống
1Dữ liệu 2Thocircng tin 3Cấu truacutec thocircng tin 4Sự thấu hiểu 5Yacute kiến 6 Quyết định
3 Caacutec loại tri thức Phổ biến mocirc tả dữ liệu thocircng tin thủ tục mọi thứ lagravem như thế nagraveo lập luận chiacutenh saacutech hoặc caacutec quy tắc
4 Thu thập Tri thức hệ chuyecircn gia Hầu hết caacutec phương phaacutep đều bắt đầu với mocirc higravenh của caacutec taacutec vụ trong đoacute
hệ chuyecircn gia được xacircy dựng Trong đoacute mocirc tả về caacutec lĩnh vực được tạo ra Caacutec kỹ sư sử dụng caacutec mocirc higravenh giả thuyết vagrave nhận thức về quaacute trigravenh phacircn
tiacutech để gợi ra caacutech giải quyết vấn đề về tri thức từ caacutec chuyecircn gia
5 Caacutec chiều của thu thập tri thức KE- driven caacutec kỹ sư trao đổi trực tiếp với caacutec chuyecircn gia Expert-driven Caacutec chuyecircn gia trực tiếp đưa chuyecircn mocircn của họ vagraveo hệ
thống maacutey tiacutenh Machine-driven Sử dụng caacutec cocircng cụ suy luận để triacutech xuất tri thức từ một
tập caacutec viacute dụ
6 Kỹ thuật thu thập tri thức Trao đổi gồm 2 loại cơ bản lagrave coacute cấu truacutec(coacute kịch bản) vagrave khocircng coacute cấu
truacutec( đối thoại trực tiếp) Giao thức phacircn tiacutech bằng lời Khi caacutec chuyecircn gia thực hiện một cocircng việc
của họ thigrave một bản ghi về cocircng việc đoacute được thực hiện Caacutec kỹ sư sẽ xacircy dựng mocirc higravenh cho những gigrave được ghi lại trong bản ghi
Phương phaacutep sagraveng lọc caacutec chuyecircn gia so saacutenh caacutec nhoacutem liecircn tiếp trong ba đối tượng vagrave cho biết tại sao nhoacutem thứ hai lại khaacutec nhoacutem thứ ba
7 Thu thập tri thức từ nhiều nguồn Thu thập tri thức từ nhiều nguồn lagrave cần thiết để coacute được đầy đủ caacutec tri thức
cho một vấn đề quan điểm yacute kiến traacutei ngược nhau thường phaacutet sinh Phương phaacutep đồng thuận sẽ giuacutep giải quyết được vấn đề macircu thuẫn Kỹ thuật phacircn tiacutech Meta lagrave kỹ thuật được aacutep dụng trong caacutec trường hợp
khaacutec Caacutech tiếp cận bằng định lượng đogravei hỏi caacutec kỹ sư cần cacircn nhắc yếu tố đầu vagraveo của caacutec chuyecircn gia khaacutec nhau
8 Xaacutec nhận hợp lệ vagrave kiểm tra tri thức Một khi thu thập tri thức noacute phải được đaacutenh giaacute về khả năng sử dụng vagrave độ
chiacutenh xaacutec Hai vấn đề cụ thể lagrave hiệu lực của những kiến thức vagrave kiểm tra việc xacircy dựng cơ sở của tri thức
Cần xaacutec nhận xem liệu hệ thống coacute thể hoạt động ở mức độ tối thiểu khocircng
Xaacutec minh liecircn quan đến việc so saacutenh từng chi tiết kỹ thuật của hệ thống những gigrave đatilde được thực hiện cuối cugraveng
9 Một số caacutec biện phaacutep xaacutec nhận Độ chiacutenh xaacutec Khả năng thiacutech nghi Mức độ đầy đủ Bề rộng Độ sacircu Hiệu lực Tổng quan Chiacutenh xaacutec Hiện thực Độ tin cậy Tiacutenh hữu dụng Mức độ
Chương 9 Học maacutey
1 Logic mờ vagrave ngocircn ngữ mờ(Fuzzy Logic and Linguistic Ambiguity)
Ngocircn ngữ tự nhiecircn gồm những khaacutei niệm mơ hồ vagrave khocircng chiacutenh xaacutectruyền tải ngữ nghĩa thocircng qua tiacutenh xấp xỉkhocircng rotilde ragraveng
Những xấp xỉ nagravey giuacutep con người coacute thể truyền tải hết được yacute nghĩa nhưng maacutey thigrave khocircng hiểu
Lagravem sao biểu diễn caacutec tri thức sử dụng caacutec khaacutei niệm khocircng rotilde ragraveng(mờ) hoặc khocircng chiacutenh xaacutec
2 Khaacutei niệm cơ bản của logic mờ tập mờ lagrave những tập hợp khocircng coacute một giới hạn rotilde Mỗi phần tử của noacute chỉ
chứa một mức độ hagravem liecircn thuộc của từng phần tử Vigrave vậy tập mờ khocircng giống như tập cổ điển Tập mờ coacute thể kết hợp với nhau qua những luật mờ magrave đặc trưng cho những hagravenh động trạng thaacutei vagrave thuộc tiacutenh của logic mờ được tận dụng khi thực hiện một bộ điều khiển mờ
Logic mờ dựa trecircn yacute tưởng mỗi phần tử thuộc vagraveo một tập hợp ở một mức độ nagraveo đấy
Locircgic mờ cho pheacutep độ liecircn thuộc (microA )coacute giaacute trị trong khoảng (01) Locircgic mờ coacute thể được coi lagrave mặt ứng dụng của lyacute thuyết tập mờ để xử lyacute caacutec
giaacute trị trong thế giới thực cho caacutec bagravei toaacuten phức tạp
3 So saacutenh tiacutenh đuacuteng đắn logic mờ vagrave xaacutec suất Xaacutec suất thigrave đề cập đến khả năng xảy ra một biến cố hay một điều gigrave đoacute Logic mờ đề cập đến cấp độ magrave đặc tiacutenh ở hiện tại
o viacute dụ1 người coacute chiều cao 6 feet thigrave coacute cấp độ lagrave 05 về chiều cao
4 Ưu điểm của logic mờ Caacutech tiếp cận rất tự nhiecircnkhocircng phức tạp Coacute thể mocirc higravenh hoacutea caacutec hagravem phi tuyến tugravey yacute phức tạp
Coacute thể tận dụng được kinh nghiệm từ những chuyecircn gia hagraveng đầu trong mọi lĩnh vực
Logic mờ được xacircy dựng dựa trecircn ngocircn ngữ tự nhiecircnNền tảng của logic mờ lagrave dựa trecircn cơ sở giao tiếp của con người
5 Nhược điểm của logic mờ Trong 1 hệ thống phức tạpsử dụng logic mờ coacute thể trở thagravenh trở ngại cho
việc xaacutec thực độ tin cậy của hệ thống Cơ chế lập luận mờ khocircng thể học hỏi từ những lỗi sai
6 Mạng noron nhacircn tạo(ANN) Mạng noron nhacircn tạo lagrave một mocirc phỏng xử lyacute thocircng tinđược nghiecircn cứu ra
từ hệ thống thần kinh của sinh vậtgiống như bộ natildeo để xử lyacute thocircng tin ANNs lagrave chương trigravenh dựa trecircn maacutey tiacutenh đơn giản coacute chức năng lagrave một mocirc
higravenh bagravei toaacuten khocircng gian dựa trecircn thử nghiệm vagrave baacuteo lỗi
7 Học từ kinh nghiệm Tiến trigravenh Một mẫu dữ liệu được biểu diễn như một mạng lưới noronANN ldquodự
đoaacutenrdquo 1 đầu radự đoaacuten được so saacutenh với giaacute trị thực tế hoặc giaacute trị chiacutenh xaacutecNếu đoaacuten được chiacutenh xaacutec thigrave khocircng coacute hagravenh động nagraveo được thực hiện
Nếu dự đoaacuten sai ANN kiểm tra lại vagrave xaacutec định lại thocircng số để điều chỉnh Một mẫu dữ liệu khaacutec được biểu diễn vagrave quaacute trigravenh nagravey được lặp lại
8 Nguyecircn tắc cơ bản của cocircng nghệ nơron Caacutec yếu tố xử lyacute cơ bản trong hệ thống thần kinh của con người lagrave tế bagraveo
thần kinhMạng lưới của tế bagraveo nagravey lagrave liecircn kết với nhau nhận được thocircng tin từ caacutec cảm biến trong mắt taihellip
Thocircng tin nhận được bởi tế bagraveo thần kinh hoặc lagrave sẽ kiacutech thiacutech noacute(sẽ được chuyển qua 1 thocircng điệp dọc theo mạng lưới) hoặc lagrave sẽ ngăn cản noacute(ngăn cản dograveng thocircng tin)
Độ nhạy coacute thể thay đổi qua thời gian hoặc sau khi coacute được kinh nghiệm
9 Cấu truacutec mạng Một ANN gồm 3 lớp cơ bản
Lớp đầu vagraveo nhận dữ liệu Lớp becircn trong hoặc lagrave lớp ẩn xử lyacute dữ liệu Lớp đầu ra chuyển tiếp kết quả cuối cugraveng của mạng
10Mạng nơ ron Thường coacute nhiều đầu vagraveo mỗi đầu vagraveo với mức ảnh hưởng vagrave tầm quan
trọng riecircng của noacute Một đầu vagraveo quan trọng coacute thể được sử dụng để khuếch đại đầu ra caacutec hagravem trạng thaacutei tổng hợp caacutec trọng số của caacutec yếu tố
đầuvagraveo khaacutec nhauvagraveo một giaacute trị duy nhất Caacutec hagravem chuyển giao xử lyacute caacutec giaacute trị trạng thaacutei vagrave tạo đầu ra
11Huấn luyện mạng nơ ron Trong mocirc higravenh coacute giaacutem saacutetANN được đến so saacutenh dự đoaacuten của chiacutenh
noacute với thocircng tin phản hồi coacute chứa caacutec kết quả mong muốn ANN sẽ phải tigravem caacutech thay đổi caacutec tham số becircn trong củamigravenh (caacutec trọng số vagrave caacutec ngưỡng) để tạo necircn một aacutenh xạ coacute khả năng aacutenh xạcaacutec đầu vagraveo thagravenh caacutec đầu ra mong muốn Sự thay đổi nagravey được tiến hagravenh nhờ việc so saacutenh giữa đầu ra thực sự vagrave đầu ra mong muốn
Trong mocirc higravenh khocircng coacute giaacutem saacutetANN nhận được dữ liệu vagraveo nhưng khocircng phải coacute bất kỳ thocircng tin phản hồi về kết quả mong muốn
Phần lớn caacutec ứng dụng nằm trong vugraveng của caacutec bagravei toaacuten ước lượng như mocirc higravenh hoacuteathống kecirc neacuten lọc phacircn cụm
12Lợi iacutech Liecircn kết với mạng noron Traacutenh caacutech lập trigravenh tường minh Giảm nhu cầu của chuyecircn gia ANNs thigrave thiacutech nghi với caacutec yếu tố đầu vagraveo thay đổi Khocircng cần thiết cho cơ sở tri thức tinh chế ANNs coacute tiacutenh động vagrave cải thiện với việc sử dụng Coacute khả năng xử lyacute dữ liệu khocircng chiacutenh xaacutec hoặc khocircng đầy đủ Cho pheacutep tổng quaacutet hoacutea từ thocircng tin cụ thể Cho pheacutep thu thập cảm giaacutec thocircng thường vagraveo miền giải quyết vấn đề
13Hạn chế của việc liecircn kết với mạng noron ANNs khocircng thể giải thiacutech được suy luận Bản chất hộp đen thường khiến cho vấn đề traacutech nhiệm vagrave độ tin cậy phaacutet
sinh lagrave khoacute khăn Lặp đi lặp lại quaacute trigravenh huấn luyện rất tốn thời gian Nguồn lực caacutec nhagrave phacircn tiacutech vagrave thiết kế coacute tay nghề cao vẫn lagrave đaacuteng lo
ngại Cocircng nghệ ANN thuacutec đẩy hạn chế của phần cứng hiện tại ANN yecircu cầu phải coacute sự tin tưởng ở đầu ra
14Giới thiệu về thuật toaacuten di truyền Cũng như mạng lưới thần kinh caacutec thuật toaacuten di truyền được dựa trecircn lyacute
thuyết sinh học Thuật toaacuten di truyền tigravem thấy nguồn gốc của chuacuteng trong caacutec lyacute thuyết
tiến hoacutea của chọn lọc tự nhiecircn vagrave thiacutech ứng với biến đổi khiacute hậu Kết quả thuật toaacuten di truyền lagrave từ giao phối 2 caacute thể trong quần thế để tạo
ra con caacutei đocirci khi tốt hơn so với bậc cha mẹ của chuacuteng 15Caacutec thagravenh phần cơ bản của thuật toaacuten di truyền
Toaacuten tử chọn lọc Caacutec caacute thể tốt được chọn lọc để đưa vagraveo thế hệ sau Sự chọn lọc nagravey căn cứ vagraveo độ thiacutech nghi với mocirci trường của mỗi caacute thể
Toaacuten tử lai gheacutep (crossover) Hai caacute thể cha vagrave mẹ trao đổi caacutec gen với nhau để tạo ra caacute thể con
Toaacuten tử đột biến (mutation) Một caacute thể thay đổi một số gen để biến đổi thagravenh một caacute thể mớiTất cả caacutec toaacuten tử trecircn khi thực hiện đều mang tiacutenh ngẫu nhiecircn
16Quaacute trigravenh cơ bản của một thuật toaacuten di truyền Khởi tạo
Đaacutenh giaacute quần thể
Lựa chọn NST thiacutech hợp nhất vagrave loại bỏ NST yếu nhất
Quy trigravenh giao nhau vagrave cải thiện quần thể
đột biến tiến trigravenh để khaacutem phaacute ra NST mới
17Ưu nhược điểm của việc kết hợp với thuật toaacuten di truyền Kiacutech thước quần thể lagrave 1 yếu tố quan trọng trong tốc độ của việc tigravem
kiếmnhưng noacute tương đối dễ dagraveng để dự đoaacuten tốc độ nagravey Giao nhau hoặc đột biến lagrave khocircng necircn đc sử dụng quaacute thường xuyecircn Luocircn coacute được iacutet nhất 1 giải phaacutep hợp lyacute Necircn coacute thể aacutep dụng chuacuteng cho caacutec vấn đề magrave chuacuteng ta khocircng coacute hướng
về caacutech giải quyết Sức mạnh của thuật toaacuten xuất phaacutet từ khaacutei niệm đơn giảnkhocircng phải từ
một thủ tục thuật toaacuten phức tạp 18Tương lai của học maacutey
Mạng lưới thần kinh nhacircn tạo vượt quaacute năng lực của con người trong caacutec trường hợp bị cocirc lập
Về mặt lyacute thuyếtmột maacutey tiacutenh coacute thể xử lyacute dũ liệu nhanh hơn hagraveng triệu lần so với 1 con người
May mắn thay cho chuacuteng tacon người tốt hơn nhiều khi magrave coacute được dữ liệumaacutey tiacutenh khocircng coacute 1 số thứ như lagrave 5 giaacutec quan
CHƯƠNG 10 KHO DỮ LIỆU
1 Kho dữ liệu Kho dữ liệu lagrave tuyển tập caacutec cơ sở dữ liệu tiacutech hợp hướng chủ đề được
thiết kế để trợ giuacutep cho một hệ hỗ trợ quyết định
Theo John Ladley Cocircng nghệ kho dữ liệu lagrave tập caacutec phương phaacutep kỹ thuật vagrave caacutec cocircng cụ coacute thể kết hợp hỗ trợ nhau để cung cấp thocircng tin cho người sử dụng trecircn cơ sở tiacutech hợp từ nhiều nguồn dữ liệu nhiều mocirci trường khaacutec nhau
Kho dữ liệu thường rất lớn tới hagraveng trăm GB hay thậm chiacute hagraveng Terabyte
2 Kho dữ liệu vận hagravenh (ODS) Một kho dữ liệu vận hagravenh Aacutep dụng kỹ thuật kho dữ liệu vagraveo caacutec hệ xử
lyacute giao taacutec lưu trữ dữ liệu cho một ứng dụng đặc thugrave Noacute đưa vagraveo kho dữ liệu một dograveng caacutec dữ liệu thocirc được thiết kế
3 So saacutenh
Kho dữ liệu vận hagravenh Kho dữ liệu
Dữ liệu theo chủ đề Dữ liệu theo chủ đề
Dữ liệu tiacutech hợp Dữ liệu tiacutech hợp
Dữ liệu thay đổi Dữ liệu khocircng thay đổi
Dữ liệu được cập nhật khi thay đổi
Dữ liệu giữ nguyecircn
Chỉ coacute dữ liệu hiện tạiDữliệu hiện tại vagrave dữ liệu lịch sử
Chu kỳ lagravem tươi dữ liệu ngắn Chu kỳ lagravem tươi dữ liệu dagravei
Chỉ coacute dữ liệu chi tiết Dữ liệu chi tiết vagrave dữ liệu tổng kết
Dugraveng cho caacutec quyết định ngắn hạn
Dugraveng cho hoạch định dagravei hạn
4 Kho dữ liệu cục bộ (Data Mart - DM)
Kho dữ liệu cục bộ lagrave CSDL coacute những đặc điểm giống với kho dữ liệu nhưng với quy mocirc nhỏ hơn vagrave lưu trữ dữ liệu về một lĩnh vực một chuyecircn ngagravenh
Data mart phụ thuộc Chứa những dữ liệu được lấy từ DW vagrave những dữ liệu nagravey sẽ được triacutech lọc vagrave tinh chế tiacutech hợp lại ở mức cao hơn để phục vụ một chủ đề nhất định của Datamart
Data mart độc lập Khocircng giống như Datamart phụ thuộc Data mart độc lập được xacircy dựng trước DW vagrave dữ liệu được trực tiếp lấy từ caacutec nguồn khaacutec nhau
5 Siecircu dữ liệu Metadata lagrave dữ liệu để mocirc tả dữ liệu Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột
một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi Metadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu
6 Mocirci trường kho dữ liệu Hệ thống của tổ chức vagrave kho cung cấp dữ liệu để xacircy dựng kho dữ liệu Trong quaacute trigravenh chuyển dữ liệu từ caacutec nguồn khaacutec nhau dữ liệu coacute thể
được lagravem sạch hoặc chuyển đổi vagrave vigrave thế DW được xem như lagrave một chuẩn cho việc lưu trữ
Đồng thời siecircu dữ liệu được ghi lại Cuối cugraveng DW hoặc siecircu thị coacute thể được sử dụng để tạo ra một kho dữ
liệu ldquocaacute nhacircnrdquo 7 Caacutec đặc điểm của kho dữ liệu
Đặc điểm Mocirc tả
Hướng chủ đề - DL tổ chức theo caacutech thức người dugraveng tham chiếu
Tiacutech hợp - Dữ liệu ldquosạchrdquo loại bỏ tiacutenh thiếu nhất quaacuten
Khocircng thay đổi - DL ldquochỉ đọcrdquo người dugraveng khocircng thay đổi được
Chuỗi thời gian - DL lagrave chuỗi thời gian khocircng phải lagrave trạng thaacutei hiện tại
Được tổng kết - DL vận hagravenhthao taacutec khi cần thiết
được kết hợp lại thagravenh dạng coacute thể dugraveng được cho quyết định
Kiacutech cỡ lớn hơn - Lưu giữ theo chuỗi thời gian tức lagrave giữ lại nhiều DL
Khocircng được chuẩn hoacutea - Coacute thể dư thừa DLSiecircu dữ liệu - Dữ liệu của dữ liệu được lưu trữNguồn dữ liệu - DL vận hagravenh (caacutec hệ sẵn coacute) cugraveng
với caacutec nguồn ngoagravei 8 Kho dữ liệu hướng chủ đề
Hướng chủ để coacute nghĩa lagrave kho dữ liệu được tổ chức xung quanh caacutec chủ đề chiacutenh như khaacutech hagraveng sản phẩm sản xuất Tập trung vagraveo việc mocirc higravenh hoacutea vagrave phacircn tiacutech dữ liệu cho caacutec nhagrave ra quyết định magrave khocircng tập trung vagraveo caacutec xử lyacute thocircng thường Cung cấp cho người dugraveng một khung nhigraven toagraven vẹn đơn giản vagrave đầy đủ về caacutec sự kiện quanh caacutec chủ đề
9 Dữ liệu trong DW được tiacutech hợp Dữ liệu trong kho dữ liệu được xacircy dựng bằng caacutech tổng hợp dữ liệu từ
nhiều nguồn khaacutec nhau vagrave caacutec nguồn coacute tổ chức khaacutec nhau Cơ sở dữ liệu caacutec file excel caacutec flat file hoặc caacutec raw file Khi đưa vagraveo kho dữ liệu caacutec dữ liệu được lagravem sạch vagrave tiacutech hợp dữ liệu nhằm đảm bảo tiacutenh nhất quaacuten của dữ liệu
10Kiến truacutec kho dữ liệu Tầng cơ sở dữ liệu hoạt động Tầng truy xuất thocircng tin Tầng truy xuất dữ liệu Tầng siecircu dữ liệu Tầng quản lyacute tiến trigravenh Tầng thocircng điệp của ứng dụng Tầng vật liacute của kho dữ liệu Tầng trigravenh diễn dữ liệu
11Higravenh trạng kho dữ liệu Kho dữ liệu ảo - người dugraveng cuối coacute thể truy cập trực tiếp đến kho dữ liệu
sử dụng caacutec cocircng cụ cho pheacutep ở tầng truy xuất dữ liệu Kho dữ liệu trung tacircm-1 cơ sở dữ liệu vật lyacute chứa tất cả dữ liệu cho một
vugraveng chuyecircn dụng nagraveo đoacute
Kho dữ liệu phacircn taacuten- Thagravenh phần được phacircn taacuten qua nhiều hệ cơ sở dữ liệu vật lyacute
12METADATA- Siecircu dữ liệu Định nghĩa Siecircu dữ liệu lagrave dữ liệu về dữ liệu Lagrave 1 lưu trữ dugraveng để
Miecircu tả kho dữ liệu tổng thể Nhận dạng kiểu kho dữ liệu Quản liacute quaacute trigravenh tiacutech hợp dữ liệu Quản liacute quaacute trigravenh cập nhật kho dữ liệu Quản liacute bảo mật
Lagrave chigravea khoacutea quyết định sự thagravenh cocircng của kho dữ liệu luocircn được thay đổi vagrave cập nhật theo sự phaacutet triển của kho dữ liệu
Dugraveng để quản liacute điều khiển kho dữ liệu Sự ra đời của kho dữ liệu như 1 cấu truacutec hỗ trợ ra quyết định siecircu dữ liệu
được xem như nguồn tagravei nguyecircn dữ liệu Siecircu dữ liệu lagrave trừu tượng Chuacuteng lagrave dữ liệu bậc cao cung cấp mocirc tả ngắn
gọn caacutec dữ liệu bậc thấp hơn 13Hoạt động của Siecircu dữ liệu
Siecircu dữ liệu rất cần thiết trong việc chuyển hoacutea thocircng tin trở thagravenh tri thức Lagrave chigravea khoacutea giuacutep chuacuteng ta xử lyacute được dữ liệu thocirc Viacute dụ một dograveng dữ liệu baacuten hagraveng 1023 K596 11121 agraveNoacute sẽ khocircng coacute nghĩa gigrave cho đến khi chuacuteng ta đưa vagraveo siecircu dữ liệu (thư
mục chứa dữ liệu) agrave cửa hagraveng 1023 sản phẩm K596 vagrave số tiền baacuten được lagrave 11121 đocirc la
14Sự cần thiết phải nhất quaacuten trong kho dữ liệu Kho dữ liệu được xacircy dựng cho lợi iacutech của những nhagrave phacircn tiacutech kinh
doanh caacutec nhagrave quản trị cho tất cả caacutec khu vực chức năng Trong cơ sở dữ liệu riecircng caacutec khu vực khaacutec nhau coacute thể định nghĩa vagrave lưu
trữ dữ liệu thocircng qua phiecircn bản của chiacutenh noacute Khi dữ liệu được lấy từ những vugraveng khaacutec nhau đoacute vagrave được đặt vagraveo kho dữ
liệu Việc chuyển đổi vagrave lagravem sạch caacutec tiến trigravenh sẽ đảm bảo noacute lagrave duy nhất được tiacutech hợp tại một mức của tổ chức
15Ragrave soaacutet lại dữ liệu ndash Thực thi siecircu dữ liệu
Bất kể cấu truacutec tự nhiecircn của 1 cacircu truy vấn thế nagraveo thigrave caacutec thagravenh phần của siecircu dữ liệu rất quan trọng đối với người ra quyết định
Bảng thuộc tiacutenh khoacutea được lưu trữ bởi kho dữ liệu Tập hợp dữ liệu được lấy từ đacircu Những chuyển đổi nagraveo được thực thi với việc lagravem sạch
16Siecircu dữ liệu lagrave gigrave Metadata - lagrave thocircng tin mocirc tả nội dung của cơ sở dữ liệu (CSDL) Metadata baacuteo cho người dugraveng biết thời gian cập nhật sau cugraveng của dữ liệu
định dạng vagrave mục điacutech sử dụng của noacute Những thocircng tin nagravey coacute thể hướng dẫn người dugraveng duyệt qua CSDL vagrave
giuacutep họ hiểu được yacute nghĩa vagrave ngữ cảnh của dữ liệu Trong CSDL metadata lagrave caacutec dạng biểu diễn khaacutec nhau của caacutec đối tượng
trong CSDL Trong CSDL quan hệ metadata lagrave caacutec định nghĩa của bảng cột CSDL
view vagrave nhiều đối tượng khaacutec Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột
một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi -gtMetadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu
Bảng chuyển đổi Ghi lại những chuyển đổi đatilde được thực hiện
Lịch sử thực thi Ghi lại những dữ liệu đatilde được
phacircn tiacutech
Higravenh thaacutei kết nốiGhi lại những dữ liệu được kết nối vagrave tần suất
17Aacutenh xạ thocircng thường của siecircu dữ liệu Bản ghi aacutenh xạ chuyển đổi bao gồm
Định danh của nguồn gốc Chuyển đổi thuộc tiacutenh Chuyển đổi thuộc tiacutenh vật lyacute Matilde hoacutea tham chiếu bảng chuyển đổi Đổi tecircn Đổi khoacutea Gaacuten giaacute trị cho thuộc tiacutenh mặc định Chọn logic cho caacutec nguồn nhiều giaacute trị Đổi thuật toaacuten
18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để
phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai
lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave
tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec
Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm
Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo
19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua
caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau
SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được
Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra
một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức
Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ
Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ
Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech
CHƯƠNG 11 KHAI PHAacute DỮ LIỆU
1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn
ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993
Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng
2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd
1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều
2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP
3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn
4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng
5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server
6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo
7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động
8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời
9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều
10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện
11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech
12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP
3 Xử lyacute phacircn tiacutech trực tuyến OLAP
MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave
dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu
ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave
thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu
HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave
ROLAP4 Khai phaacute dữ liệu
Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh
khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn
Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan
5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp
6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại
Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp
Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec
Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt
Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra
Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh
vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho
Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec
Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm
Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục
Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng
gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp
Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn
Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec
Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper
Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2
Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25
Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước
Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng
Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện
trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp
Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute
độ hỗ trợ ge ngưỡng minsup
độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan
Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn
Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết
Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu
MOLAP ROLAP HOLAP
Lưu trữ dữ liệu cơ sở
Khối Bảng quan hệ Bảng quan hệ
Lưu trữ thocircng tin tổng hợp
Khối Bảng quan hệ Khối
Hiệu suất thực hiện truy vấn
Nhanh nhất Chậm nhất Nhanh
Tiecircu thụ khocircng gian lưu trữ
Nhiều Thấp Trung bigravenh
Chi phiacute bảo trigrave Cao Thấp Trung bigravenh
MYCIN (Standford1970s Edward Shortliffe)
PROSPECTOR (MIT 1979)
Triacute tuệ nhacircn tạo (Artificial Intelligence ndash AI)
Triacute tuệ nhacircn tạo một bộ phacircn của ngagravenh khoa học maacutey tiacutenh quan tacircm đến việc thiết kế caacutec hệ thống maacutey tiacutenh thocircng minh đoacute lagrave caacutec hệ thống đưa ra caacutec đặc điểm magrave từ đoacute chuacuteng ta liecircn hệ với sự thocircng minh trong hagravenh động của con người (Barr vagrave Feigenbaum 1981)
Mục điacutech của AI
Mục điacutech khoa học xaacutec định caacutec gợi yacute để giải thiacutech caacutec loại khaacutec nhau của triacute tuệ thực
Mục điacutech kỹ thuật giải quyết caacutec vấn đề trong thế giới thực
Triacute tuệ nhacircn tạo kế thừa nhiều yacute tưởng quan điểm kỹ thuật từ caacutec ngagravenh khoa học khaacutec
- Triết học
- Logic Toaacuten học
- Tiacutenh toaacuten
- Khoa học tacircm lyacute Khoa học nhận thức
- Sinh học Thần kinh học
- Tiến hoacutea
Caacutec lĩnh vực ứng dụng trong Triacute tuệ nhacircn tạo
Mạng nơ ron thần kinh (Neural Networks)
Tiacutenh toaacuten sự tiến hoacutea
(Evolutionary Computation)
Hệ chuyecircn gia (Expert Systems)
Kỹ thuật xử lyacute tiếng noacutei (Speech Processing)
Kỹ thuật xử lyacute ngocircn ngữ tự nhiecircn
(Natural Language Processing)
Lập kế hoạch (Planning)
Robot (Robotics)
Khoa học higravenh ảnh (Vision)
Caacutec kỹ thuật thocircng dụng dugraveng trong AI
Biểu diễn(Representation)
Học (Learning)
Caacutec luật (Rules)
Tigravem kiếm (Search)
72 Triacute thocircng minh của triacute tuệ nhacircn tạo
Con người suy diễn như thế nagraveo
Phacircn loại (Categorization)
Caacutec quy tắc cụ thể
Heuristics
Kinh nghiệm trước đoacute
Dự tiacutenh trước
Maacutey tiacutenh suy diễn như thế nagraveo
Lập luận dựa trecircn luật IF-THEN mocirc tả tri thức được matilde hoacutea dưới dạng caacutec luật
Caacutec khung (Frames) lagrave caacutec đại diện mocirc tả caacutec tigravenh huống giống nhau lagrave điển higravenh của một vagravei phacircn loại
Lập luận dựa trecircn caacutec trường hợp mocirc phỏng giải phaacutep trước đoacute cho một vấn đề hiện tại
Nhận dạng mẫu phaacutet hiện acircm thanh higravenh dạng hoặc caacutec chuỗi dagravei
Caacutec dạng khaacutec của Triacute tuệ nhacircn tạo
Học maacutey- mạng nơron vagrave giải thuật di truyền
Lập trigravenh tự động ndash lagrave những kỹ thuật tạo ra caacutec chương trigravenh để lagravem 1 nhiệm vụ riecircng biệt (cho pheacutep những người khocircng phải lagrave người lập trigravenh coacute thể lập trigravenh được)
Cuộc sống nhacircn tạo ndash nỗ lực để taacutei tạo caacutec hiện tượng sinh học trong caacutec hệ thống dựa trecircn maacutey tiacutenh
73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia(Expert Systems- ES)
Theo Jackson (1999) Một hệ chuyecircn gia lagrave một chương trigravenh maacutey tiacutenh mocirc tả vagrave suy diễn với tri thức của một vagravei lĩnh vực để giải quyết vấn đề hay đưa ra caacutec lời khuyecircn
Cấu truacutec cơ bản của ES được dựa theo cấu truacutec chung của DSS Sự khaacutec biệt chiacutenh giữa ES vagraveDSS lagrave hệ ES thu thập caacutec kiến thức từ những
chuyecircn gia trong lĩnh vực quan tacircmĐặc trưng của hệ chuyecircn gia Hiệu quả cao Thời gian trả lời thỏa đaacuteng Độ tin cậy cao Dễ hiểu
Giao diện người dugraveng trong ES
Thiết kế giao diện người dugraveng tập trung vagraveo caacutec yếu tố như dễ dagraveng sử dụngcoacute độ tin cậy cao giảm tải những khoacute khăn khi sử dụng
Thiết kế necircn coacute một số tương taacutec (đầu vagraveo kiểm soaacutet vagrave truy vấn)
Cấu tạo giao diện người dugraveng gồm coacute magraven higravenh cảm ứng bagraven phiacutem buacutet saacuteng lệnh thoại caacutec phiacutem chuyecircn dụng
Cơ sở tri thức (Knowledge Base)
Chứa đựng caacutec tri thức cụ thể miền thu được từ caacutec chuyecircn gia miền
Coacute thể chứa caacutec mocirc tả caacutec hagravenh vi giải quyết vấn đề caacutec ragraveng buộc caacutec heuristics
Thagravenh cocircng của một ES dựa trecircn tiacutenh đầy đủ vagrave tiacutenh chiacutenh xaacutec của cơ sở tri thức
Mocirc tơ suy diễn (Inference Engine)
Ở đacircy tri thức được đặt để sử dụng tạo ra caacutec giải phaacutep để giải quyết vấn đề
Mocirc tơ nagravey coacute khả năng thực hiện diễn dịch hoặc suy diễn dựa trecircn caacutec luật hay caacutec caacutec sự kiện
Đồng thời cũng coacute khả năng sử dụng caacutec suy diễn mờ hay khocircng chiacutenh xaacutec dựa trecircn xaacutec suất hay aacutenh xạ mẫu
Vograveng điều khiển suy diễn
1 Aacutenh xạ caacutec luật với caacutec sự kiện đatilde được cho
2 Chọn luật để thực hiện
3 Thực hiện luật bằng caacutech thecircm caacutec sự kiện được suy diễn ra vagraveo bộ nhớ lagravem việc
Chuỗi suy diễn (Chaining)
Suy diễn tiến (forward chaining) maacutey suy diễn bắt đầu từ dữ liệu ban đầu vagrave thực hiện việc suy luận để đưa ra caacutec kết luận cuối cugraveng
Suy diễn lugravei (backward chaining) maacutey suy diễn bắt đầu từ dữ liệu điacutech vagrave tigravem ra tri thức hỗ trợ cho dữ liệu điacutech đoacute
Viacute dụ suy diễn lugravei
R1 Nếu coacute A vagrave B thigrave suy ra coacute D
R2 Nếu coacute B thigrave suy ra coacute C
R3 Nếu coacute C vagrave D thigrave suy ra coacute E
Ta coacute E ta xem trong 3 luật R1 R2 R3 luật nagraveo coacute E ta thấy R3 chứa E đồng thời chứa C vagrave D Xeacutet tiếp trong 2 luật R1 R2 luật nagraveo chứa C vagrave D R2 chứa C R3 chứa D Từ đoacute ta coacute được caacutec tri thức hỗ trợ suy diễn vagrave kết luận lagrave nếu coacute A vagrave B thigrave sẽ coacute E Hay nếu A vagrave B đuacuteng thigrave sẽ coacute E
Viacute dụ suy diễn tiến
Giả sử coacute tập chứa 3 luật sau
R1 Nếu coacute A vagrave B thigrave suy ra coacute D
R2 Nếu coacute B thigrave suy ra coacute C
R3 Nếu coacute C vagrave D thigrave suy ra coacute E
Nếu ta coacute A vagrave B thigrave chuacuteng ta suy ra được D từ R1 vagrave suy ra C từ R2 Với D vagrave C đatilde được suy ra ở trecircn giờ chuacuteng ta suy ra được E từ R3
Viacute dụ thực tế
Giả sử muốn biết magraveu của một con vật nuocirci tecircn lagrave Fred biết rằng noacute kecircu ộp ộp vagrave ăn ruồi
Coacute tập 4 luật ban đầu như sau
R1 Nếu X kecircu ộp ộp vagrave ăn ruồi thigrave X lagrave con ếch
R2 Nếu X kecircu chiecircm chiếp vagrave biết hoacutet thigrave X lagrave con chim
R3 Nếu X lagrave con ếch thigrave X coacute magraveu xanh
R4 Nếu X lagrave con chim thigrave X coacute magraveu vagraveng
74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia
Expert system shells lagrave một tập caacutec goacutei phần mềm vagrave caacutec cocircng cụ dugraveng để phaacutet triển caacutec hệ chuyecircn gia
Những Expert system shells đầu tiecircn thường rất rườm ragrave Mặc dugrave vậy noacute vẫn giuacutep cho người sử dụng sẽ khocircng phải bắt đầu lại từ đầu khi xacircy dựng một hệ chuyecircn gia mới
Những shell hiện đại bao gồm hai mocirc-đun chiacutenh lagrave cocircng cụ xacircy dựng một tập quy tắc vagrave mocirc tơ suy diễn
Xacircy dựng hệ chuyecircn gia
Bước 1 xacircy dựng mocirc higravenh bagravei toaacuten xaacutec định vấn đề nhiệm vụ magrave hệ thống sẽ thực hiện Caacutec dạng bagravei toaacuten cần hệ chuyecircn gia
Bagravei toaacuten diễn giải (InterPretation)
Bagravei toaacuten dự baacuteo (Prediction)
Bagravei toaacuten chuẩn đoaacuten (Diagnose)
Bagravei toaacuten gỡ rối (Debugging)
Bagravei toaacuten thiết kế
Tương tự như một dự aacuten phần mềm để xacircy dựng một hệ chuyecircn gia cần phải coacute caacutec yếu tố về nhacircn lực tagravei nguyecircn vagrave thời gian Những yếu tố nagravey ảnh hưởng đến giaacute thah của một hệ chuyecircn giaTrong phần nagravey cacircu hỏi thường được đặt ra lagrave tại sao cần phải xacircy dựng một hệ chuyecircn giaTrước khi bắt đầu phải xaacute định rotilde bagravei toaacuten đạt ra lagrave jiAi lagrave chuyecircn giaAi lagrave người sử dụng
1 Diễn giải (InterPretation) Nghiecircn cứu 1 vấn đề -gt Dựa trecircn những biểu hiện thuộc tiacutenh đặc trưng becircn ngoagravei -gt Tư vấn
(hoặc đưa ra kết luận hay mocirc tả dễ hiểu từ tập dữ liệu thocirc)
2 Bagravei toaacuten dự baacuteo (Prediction) Coacute thể dự đoaacuten được hagravenh vi kết quả dựa trecircn caacutec hiện tượng -gt dự baacuteo
VD Dự baacuteo thời tiết động đấthellip
3 Bagravei toaacuten chẩn đoaacuten (Diagnoss) Xaacutec định caacutec lỗi caacutec bộ phận hỏng hoacutec của hệ thống dựa trecircn caacutec dữ liệu quan saacutet được
4 Bagravei toaacuten gỡ rối (Debugging) Mocirc tả caacutec phương phaacutep khắc phục hệ thống khi gặp sự cố
5 Bagravei toaacuten thiết kế Lựa chọn cấu higravenh caacutec đối tượng nhằm thoả matilden một số ragraveng buộc nagraveo đoacute
6 Giảng dạy Phần mềm dạy học coacute thể chuẩn đoaacuten vagrave sủa lỗi của học sinh trong quaacute trigravenh học tập
Để xaacutec định đuacuteng bagravei toaacuten magrave chuacuteng ta cần giải quyết thigrave phải trả lời đc một số cacircu hỏi
- cần hệ chuyecircn gia
Bước 2 thu thập tri thức lựa chọn cocircng cụ vagrave aacutep dụng
Trong bước thu thập tri thức vấn đề quan trọng lagrave lựa chọn chuyecircn gia những người magrave sẽ đoacuteng goacutep tri thức cho hệ thống Thocircng thường trong suốt quaacute trigravenh phaacutet triển thigrave chuyecircn gia được xem như một thagravenh viecircn của đội phaacutet triển
Hiện nay coacute rất nhiều cocircng cụ để xacircy dựng một hệ chuyecircn gia Phổ biến nhất lagrave JESS CLIPS vagrave OPS5
Bước 3 Thiết kế cơ sở tri thức thiết kế hệ thốngTri thức được biểu diễn trường minh trong cơ sở tri thức
Caacutec chuyecircn gia vagrave kỹ sư tri thức sẽ đối thoại với nhau bằng caacutec kỹ thuật đối thoại Suy diễn (SD) bảng Mocirc higravenh hoacutea SD quy nạp phacircn loại
Vấn đề bagraveo trigrave vagrave phaacutet triển
Caacutec hệ chuyecircn gia đogravei hỏi phải bảo trigrave vagrave phaacutet triển nhiều hơn so với caacutec hệ thống khaacutec Phải thường xuyecircn bổ sung tri thức mới vagrave thay đổi caacutec tri thức cũ để đổi mới hệ chuyecircn gia
Thu thập vagrave khắc phục lỗi do người sử dụng phaacutet hiện để kịp thời khắc phục những sai soacutet của hệ chuyecircn gia
75 Lợi iacutech vagrave hạn chế của caacutec hệ chuyecircn gia
Một số lợi iacutech chiacutenh
Thời gian trả lời hợp lyacute bằng hoặc nhanh hơn so với chuyecircn gia (người) để đi đến cugraveng một quyết định Hệ chuyecircn gia lagrave một hệ thống thời gian thực (real time system)
Khả năng trả lời với mức độ tinh thocircng bằng hoặc cao hơn so với chuyecircn gia (người) trong cugraveng lĩnh vực
Hệ chuyecircn gia giuacutep cho hiệu quả lagravem việc tăng bằng việc sử dụng tập caacutec luật một caacutech nhanh choacuteng magrave ko bị nhầm lẫn chuyecircn gia lagrave người coacute thể quecircn đi một số tri thức cơ sở lyacute luậ nhưng HCG thigrave ko
Quyết định của một người chuyecircn gia coacute thể bị thay đổi vagrave ko coacute tiacutenh thống nhất như quyết định của một hệ chuyecircn gia tạo ra
Hệ chuyecircn gia giuacutep cho người sử dụng coacute thể trau dồi sự hiểu biết trecircn lĩnh vuej cụ thể magrave noacute giải quyết hỗ trợ người ra quyết định coacute trigravenh độ như 1 chuyecircn gia trong quaacute trigravenh gia quyết định
Kiến thức của rất nhiều chuyecircn gia về một lĩnh vực nagraveo đoacute được đưa vagraveo hệ chuyecircn gia lagravem cho CSTT cuat HCG phong phuacute vagrave rộng lớn hơn rất nhiều
HCG giải thiacutech caacutec bước suy luận một caacutech dễ hiểu nhất quaacuten luacutec nagraveo cũng coacute thể sử dụng ko như chuyecircn gia con người
Hạn chế của caacutec hệ chuyecircn gia
Nhược điểm lớn nhất của hệ chuyecircn gia lagrave những yacute kiến chuyecircn mocircn thường rất khoacute matilde hoacutea vagrave giải neacuten
Hệ chuyecircn gia khocircng coacute khả năng tự học tự cập nhật kiến thức mới như caacutec chuyecircn gia magrave cần phải được matilde hoacutea lại khi noacute được cập nhật
Hệ chuyecircn gia khocircng thể nhận ra được vấn đề khocircng nằm trong miền kiến thức của hệ thống
Chương 8 Tri thức vagrave tiếp nhận
1 Bao gồm caacutec vấn đề
Dữ liệu thực tế đo lường hoặc quan saacutet coacute hoặc khocircng coacute bối cảnh
Thocircng tin dữ liệu được tổng hợp một caacutech hữu iacutech để giải quyết những khoacute khăn trong việc đưa ra quyết định
Tri thức bao gồm caacutec ứng dụng quy tắc thocircng tin hướng dẫn của người ra quyết định
2 Những caacutei nhigraven về tri thức
Đại diện lagravem thế nagraveo để diễn tả tri thức viacute dụ như một quyển saacutech khocircng phải lagrave tri thức nhưng noacute lại lagrave một đại diện của tri thức
Sản xuất tri thức lagrave một tập hơp của hagraveng tồn kho coacute thể được sản xuất cũng như mua lại
Tri thức lagrave 1 trong 6 trạng thaacutei của hệ thống
1Dữ liệu 2Thocircng tin 3Cấu truacutec thocircng tin 4Sự thấu hiểu 5Yacute kiến 6 Quyết định
3 Caacutec loại tri thức Phổ biến mocirc tả dữ liệu thocircng tin thủ tục mọi thứ lagravem như thế nagraveo lập luận chiacutenh saacutech hoặc caacutec quy tắc
4 Thu thập Tri thức hệ chuyecircn gia Hầu hết caacutec phương phaacutep đều bắt đầu với mocirc higravenh của caacutec taacutec vụ trong đoacute
hệ chuyecircn gia được xacircy dựng Trong đoacute mocirc tả về caacutec lĩnh vực được tạo ra Caacutec kỹ sư sử dụng caacutec mocirc higravenh giả thuyết vagrave nhận thức về quaacute trigravenh phacircn
tiacutech để gợi ra caacutech giải quyết vấn đề về tri thức từ caacutec chuyecircn gia
5 Caacutec chiều của thu thập tri thức KE- driven caacutec kỹ sư trao đổi trực tiếp với caacutec chuyecircn gia Expert-driven Caacutec chuyecircn gia trực tiếp đưa chuyecircn mocircn của họ vagraveo hệ
thống maacutey tiacutenh Machine-driven Sử dụng caacutec cocircng cụ suy luận để triacutech xuất tri thức từ một
tập caacutec viacute dụ
6 Kỹ thuật thu thập tri thức Trao đổi gồm 2 loại cơ bản lagrave coacute cấu truacutec(coacute kịch bản) vagrave khocircng coacute cấu
truacutec( đối thoại trực tiếp) Giao thức phacircn tiacutech bằng lời Khi caacutec chuyecircn gia thực hiện một cocircng việc
của họ thigrave một bản ghi về cocircng việc đoacute được thực hiện Caacutec kỹ sư sẽ xacircy dựng mocirc higravenh cho những gigrave được ghi lại trong bản ghi
Phương phaacutep sagraveng lọc caacutec chuyecircn gia so saacutenh caacutec nhoacutem liecircn tiếp trong ba đối tượng vagrave cho biết tại sao nhoacutem thứ hai lại khaacutec nhoacutem thứ ba
7 Thu thập tri thức từ nhiều nguồn Thu thập tri thức từ nhiều nguồn lagrave cần thiết để coacute được đầy đủ caacutec tri thức
cho một vấn đề quan điểm yacute kiến traacutei ngược nhau thường phaacutet sinh Phương phaacutep đồng thuận sẽ giuacutep giải quyết được vấn đề macircu thuẫn Kỹ thuật phacircn tiacutech Meta lagrave kỹ thuật được aacutep dụng trong caacutec trường hợp
khaacutec Caacutech tiếp cận bằng định lượng đogravei hỏi caacutec kỹ sư cần cacircn nhắc yếu tố đầu vagraveo của caacutec chuyecircn gia khaacutec nhau
8 Xaacutec nhận hợp lệ vagrave kiểm tra tri thức Một khi thu thập tri thức noacute phải được đaacutenh giaacute về khả năng sử dụng vagrave độ
chiacutenh xaacutec Hai vấn đề cụ thể lagrave hiệu lực của những kiến thức vagrave kiểm tra việc xacircy dựng cơ sở của tri thức
Cần xaacutec nhận xem liệu hệ thống coacute thể hoạt động ở mức độ tối thiểu khocircng
Xaacutec minh liecircn quan đến việc so saacutenh từng chi tiết kỹ thuật của hệ thống những gigrave đatilde được thực hiện cuối cugraveng
9 Một số caacutec biện phaacutep xaacutec nhận Độ chiacutenh xaacutec Khả năng thiacutech nghi Mức độ đầy đủ Bề rộng Độ sacircu Hiệu lực Tổng quan Chiacutenh xaacutec Hiện thực Độ tin cậy Tiacutenh hữu dụng Mức độ
Chương 9 Học maacutey
1 Logic mờ vagrave ngocircn ngữ mờ(Fuzzy Logic and Linguistic Ambiguity)
Ngocircn ngữ tự nhiecircn gồm những khaacutei niệm mơ hồ vagrave khocircng chiacutenh xaacutectruyền tải ngữ nghĩa thocircng qua tiacutenh xấp xỉkhocircng rotilde ragraveng
Những xấp xỉ nagravey giuacutep con người coacute thể truyền tải hết được yacute nghĩa nhưng maacutey thigrave khocircng hiểu
Lagravem sao biểu diễn caacutec tri thức sử dụng caacutec khaacutei niệm khocircng rotilde ragraveng(mờ) hoặc khocircng chiacutenh xaacutec
2 Khaacutei niệm cơ bản của logic mờ tập mờ lagrave những tập hợp khocircng coacute một giới hạn rotilde Mỗi phần tử của noacute chỉ
chứa một mức độ hagravem liecircn thuộc của từng phần tử Vigrave vậy tập mờ khocircng giống như tập cổ điển Tập mờ coacute thể kết hợp với nhau qua những luật mờ magrave đặc trưng cho những hagravenh động trạng thaacutei vagrave thuộc tiacutenh của logic mờ được tận dụng khi thực hiện một bộ điều khiển mờ
Logic mờ dựa trecircn yacute tưởng mỗi phần tử thuộc vagraveo một tập hợp ở một mức độ nagraveo đấy
Locircgic mờ cho pheacutep độ liecircn thuộc (microA )coacute giaacute trị trong khoảng (01) Locircgic mờ coacute thể được coi lagrave mặt ứng dụng của lyacute thuyết tập mờ để xử lyacute caacutec
giaacute trị trong thế giới thực cho caacutec bagravei toaacuten phức tạp
3 So saacutenh tiacutenh đuacuteng đắn logic mờ vagrave xaacutec suất Xaacutec suất thigrave đề cập đến khả năng xảy ra một biến cố hay một điều gigrave đoacute Logic mờ đề cập đến cấp độ magrave đặc tiacutenh ở hiện tại
o viacute dụ1 người coacute chiều cao 6 feet thigrave coacute cấp độ lagrave 05 về chiều cao
4 Ưu điểm của logic mờ Caacutech tiếp cận rất tự nhiecircnkhocircng phức tạp Coacute thể mocirc higravenh hoacutea caacutec hagravem phi tuyến tugravey yacute phức tạp
Coacute thể tận dụng được kinh nghiệm từ những chuyecircn gia hagraveng đầu trong mọi lĩnh vực
Logic mờ được xacircy dựng dựa trecircn ngocircn ngữ tự nhiecircnNền tảng của logic mờ lagrave dựa trecircn cơ sở giao tiếp của con người
5 Nhược điểm của logic mờ Trong 1 hệ thống phức tạpsử dụng logic mờ coacute thể trở thagravenh trở ngại cho
việc xaacutec thực độ tin cậy của hệ thống Cơ chế lập luận mờ khocircng thể học hỏi từ những lỗi sai
6 Mạng noron nhacircn tạo(ANN) Mạng noron nhacircn tạo lagrave một mocirc phỏng xử lyacute thocircng tinđược nghiecircn cứu ra
từ hệ thống thần kinh của sinh vậtgiống như bộ natildeo để xử lyacute thocircng tin ANNs lagrave chương trigravenh dựa trecircn maacutey tiacutenh đơn giản coacute chức năng lagrave một mocirc
higravenh bagravei toaacuten khocircng gian dựa trecircn thử nghiệm vagrave baacuteo lỗi
7 Học từ kinh nghiệm Tiến trigravenh Một mẫu dữ liệu được biểu diễn như một mạng lưới noronANN ldquodự
đoaacutenrdquo 1 đầu radự đoaacuten được so saacutenh với giaacute trị thực tế hoặc giaacute trị chiacutenh xaacutecNếu đoaacuten được chiacutenh xaacutec thigrave khocircng coacute hagravenh động nagraveo được thực hiện
Nếu dự đoaacuten sai ANN kiểm tra lại vagrave xaacutec định lại thocircng số để điều chỉnh Một mẫu dữ liệu khaacutec được biểu diễn vagrave quaacute trigravenh nagravey được lặp lại
8 Nguyecircn tắc cơ bản của cocircng nghệ nơron Caacutec yếu tố xử lyacute cơ bản trong hệ thống thần kinh của con người lagrave tế bagraveo
thần kinhMạng lưới của tế bagraveo nagravey lagrave liecircn kết với nhau nhận được thocircng tin từ caacutec cảm biến trong mắt taihellip
Thocircng tin nhận được bởi tế bagraveo thần kinh hoặc lagrave sẽ kiacutech thiacutech noacute(sẽ được chuyển qua 1 thocircng điệp dọc theo mạng lưới) hoặc lagrave sẽ ngăn cản noacute(ngăn cản dograveng thocircng tin)
Độ nhạy coacute thể thay đổi qua thời gian hoặc sau khi coacute được kinh nghiệm
9 Cấu truacutec mạng Một ANN gồm 3 lớp cơ bản
Lớp đầu vagraveo nhận dữ liệu Lớp becircn trong hoặc lagrave lớp ẩn xử lyacute dữ liệu Lớp đầu ra chuyển tiếp kết quả cuối cugraveng của mạng
10Mạng nơ ron Thường coacute nhiều đầu vagraveo mỗi đầu vagraveo với mức ảnh hưởng vagrave tầm quan
trọng riecircng của noacute Một đầu vagraveo quan trọng coacute thể được sử dụng để khuếch đại đầu ra caacutec hagravem trạng thaacutei tổng hợp caacutec trọng số của caacutec yếu tố
đầuvagraveo khaacutec nhauvagraveo một giaacute trị duy nhất Caacutec hagravem chuyển giao xử lyacute caacutec giaacute trị trạng thaacutei vagrave tạo đầu ra
11Huấn luyện mạng nơ ron Trong mocirc higravenh coacute giaacutem saacutetANN được đến so saacutenh dự đoaacuten của chiacutenh
noacute với thocircng tin phản hồi coacute chứa caacutec kết quả mong muốn ANN sẽ phải tigravem caacutech thay đổi caacutec tham số becircn trong củamigravenh (caacutec trọng số vagrave caacutec ngưỡng) để tạo necircn một aacutenh xạ coacute khả năng aacutenh xạcaacutec đầu vagraveo thagravenh caacutec đầu ra mong muốn Sự thay đổi nagravey được tiến hagravenh nhờ việc so saacutenh giữa đầu ra thực sự vagrave đầu ra mong muốn
Trong mocirc higravenh khocircng coacute giaacutem saacutetANN nhận được dữ liệu vagraveo nhưng khocircng phải coacute bất kỳ thocircng tin phản hồi về kết quả mong muốn
Phần lớn caacutec ứng dụng nằm trong vugraveng của caacutec bagravei toaacuten ước lượng như mocirc higravenh hoacuteathống kecirc neacuten lọc phacircn cụm
12Lợi iacutech Liecircn kết với mạng noron Traacutenh caacutech lập trigravenh tường minh Giảm nhu cầu của chuyecircn gia ANNs thigrave thiacutech nghi với caacutec yếu tố đầu vagraveo thay đổi Khocircng cần thiết cho cơ sở tri thức tinh chế ANNs coacute tiacutenh động vagrave cải thiện với việc sử dụng Coacute khả năng xử lyacute dữ liệu khocircng chiacutenh xaacutec hoặc khocircng đầy đủ Cho pheacutep tổng quaacutet hoacutea từ thocircng tin cụ thể Cho pheacutep thu thập cảm giaacutec thocircng thường vagraveo miền giải quyết vấn đề
13Hạn chế của việc liecircn kết với mạng noron ANNs khocircng thể giải thiacutech được suy luận Bản chất hộp đen thường khiến cho vấn đề traacutech nhiệm vagrave độ tin cậy phaacutet
sinh lagrave khoacute khăn Lặp đi lặp lại quaacute trigravenh huấn luyện rất tốn thời gian Nguồn lực caacutec nhagrave phacircn tiacutech vagrave thiết kế coacute tay nghề cao vẫn lagrave đaacuteng lo
ngại Cocircng nghệ ANN thuacutec đẩy hạn chế của phần cứng hiện tại ANN yecircu cầu phải coacute sự tin tưởng ở đầu ra
14Giới thiệu về thuật toaacuten di truyền Cũng như mạng lưới thần kinh caacutec thuật toaacuten di truyền được dựa trecircn lyacute
thuyết sinh học Thuật toaacuten di truyền tigravem thấy nguồn gốc của chuacuteng trong caacutec lyacute thuyết
tiến hoacutea của chọn lọc tự nhiecircn vagrave thiacutech ứng với biến đổi khiacute hậu Kết quả thuật toaacuten di truyền lagrave từ giao phối 2 caacute thể trong quần thế để tạo
ra con caacutei đocirci khi tốt hơn so với bậc cha mẹ của chuacuteng 15Caacutec thagravenh phần cơ bản của thuật toaacuten di truyền
Toaacuten tử chọn lọc Caacutec caacute thể tốt được chọn lọc để đưa vagraveo thế hệ sau Sự chọn lọc nagravey căn cứ vagraveo độ thiacutech nghi với mocirci trường của mỗi caacute thể
Toaacuten tử lai gheacutep (crossover) Hai caacute thể cha vagrave mẹ trao đổi caacutec gen với nhau để tạo ra caacute thể con
Toaacuten tử đột biến (mutation) Một caacute thể thay đổi một số gen để biến đổi thagravenh một caacute thể mớiTất cả caacutec toaacuten tử trecircn khi thực hiện đều mang tiacutenh ngẫu nhiecircn
16Quaacute trigravenh cơ bản của một thuật toaacuten di truyền Khởi tạo
Đaacutenh giaacute quần thể
Lựa chọn NST thiacutech hợp nhất vagrave loại bỏ NST yếu nhất
Quy trigravenh giao nhau vagrave cải thiện quần thể
đột biến tiến trigravenh để khaacutem phaacute ra NST mới
17Ưu nhược điểm của việc kết hợp với thuật toaacuten di truyền Kiacutech thước quần thể lagrave 1 yếu tố quan trọng trong tốc độ của việc tigravem
kiếmnhưng noacute tương đối dễ dagraveng để dự đoaacuten tốc độ nagravey Giao nhau hoặc đột biến lagrave khocircng necircn đc sử dụng quaacute thường xuyecircn Luocircn coacute được iacutet nhất 1 giải phaacutep hợp lyacute Necircn coacute thể aacutep dụng chuacuteng cho caacutec vấn đề magrave chuacuteng ta khocircng coacute hướng
về caacutech giải quyết Sức mạnh của thuật toaacuten xuất phaacutet từ khaacutei niệm đơn giảnkhocircng phải từ
một thủ tục thuật toaacuten phức tạp 18Tương lai của học maacutey
Mạng lưới thần kinh nhacircn tạo vượt quaacute năng lực của con người trong caacutec trường hợp bị cocirc lập
Về mặt lyacute thuyếtmột maacutey tiacutenh coacute thể xử lyacute dũ liệu nhanh hơn hagraveng triệu lần so với 1 con người
May mắn thay cho chuacuteng tacon người tốt hơn nhiều khi magrave coacute được dữ liệumaacutey tiacutenh khocircng coacute 1 số thứ như lagrave 5 giaacutec quan
CHƯƠNG 10 KHO DỮ LIỆU
1 Kho dữ liệu Kho dữ liệu lagrave tuyển tập caacutec cơ sở dữ liệu tiacutech hợp hướng chủ đề được
thiết kế để trợ giuacutep cho một hệ hỗ trợ quyết định
Theo John Ladley Cocircng nghệ kho dữ liệu lagrave tập caacutec phương phaacutep kỹ thuật vagrave caacutec cocircng cụ coacute thể kết hợp hỗ trợ nhau để cung cấp thocircng tin cho người sử dụng trecircn cơ sở tiacutech hợp từ nhiều nguồn dữ liệu nhiều mocirci trường khaacutec nhau
Kho dữ liệu thường rất lớn tới hagraveng trăm GB hay thậm chiacute hagraveng Terabyte
2 Kho dữ liệu vận hagravenh (ODS) Một kho dữ liệu vận hagravenh Aacutep dụng kỹ thuật kho dữ liệu vagraveo caacutec hệ xử
lyacute giao taacutec lưu trữ dữ liệu cho một ứng dụng đặc thugrave Noacute đưa vagraveo kho dữ liệu một dograveng caacutec dữ liệu thocirc được thiết kế
3 So saacutenh
Kho dữ liệu vận hagravenh Kho dữ liệu
Dữ liệu theo chủ đề Dữ liệu theo chủ đề
Dữ liệu tiacutech hợp Dữ liệu tiacutech hợp
Dữ liệu thay đổi Dữ liệu khocircng thay đổi
Dữ liệu được cập nhật khi thay đổi
Dữ liệu giữ nguyecircn
Chỉ coacute dữ liệu hiện tạiDữliệu hiện tại vagrave dữ liệu lịch sử
Chu kỳ lagravem tươi dữ liệu ngắn Chu kỳ lagravem tươi dữ liệu dagravei
Chỉ coacute dữ liệu chi tiết Dữ liệu chi tiết vagrave dữ liệu tổng kết
Dugraveng cho caacutec quyết định ngắn hạn
Dugraveng cho hoạch định dagravei hạn
4 Kho dữ liệu cục bộ (Data Mart - DM)
Kho dữ liệu cục bộ lagrave CSDL coacute những đặc điểm giống với kho dữ liệu nhưng với quy mocirc nhỏ hơn vagrave lưu trữ dữ liệu về một lĩnh vực một chuyecircn ngagravenh
Data mart phụ thuộc Chứa những dữ liệu được lấy từ DW vagrave những dữ liệu nagravey sẽ được triacutech lọc vagrave tinh chế tiacutech hợp lại ở mức cao hơn để phục vụ một chủ đề nhất định của Datamart
Data mart độc lập Khocircng giống như Datamart phụ thuộc Data mart độc lập được xacircy dựng trước DW vagrave dữ liệu được trực tiếp lấy từ caacutec nguồn khaacutec nhau
5 Siecircu dữ liệu Metadata lagrave dữ liệu để mocirc tả dữ liệu Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột
một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi Metadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu
6 Mocirci trường kho dữ liệu Hệ thống của tổ chức vagrave kho cung cấp dữ liệu để xacircy dựng kho dữ liệu Trong quaacute trigravenh chuyển dữ liệu từ caacutec nguồn khaacutec nhau dữ liệu coacute thể
được lagravem sạch hoặc chuyển đổi vagrave vigrave thế DW được xem như lagrave một chuẩn cho việc lưu trữ
Đồng thời siecircu dữ liệu được ghi lại Cuối cugraveng DW hoặc siecircu thị coacute thể được sử dụng để tạo ra một kho dữ
liệu ldquocaacute nhacircnrdquo 7 Caacutec đặc điểm của kho dữ liệu
Đặc điểm Mocirc tả
Hướng chủ đề - DL tổ chức theo caacutech thức người dugraveng tham chiếu
Tiacutech hợp - Dữ liệu ldquosạchrdquo loại bỏ tiacutenh thiếu nhất quaacuten
Khocircng thay đổi - DL ldquochỉ đọcrdquo người dugraveng khocircng thay đổi được
Chuỗi thời gian - DL lagrave chuỗi thời gian khocircng phải lagrave trạng thaacutei hiện tại
Được tổng kết - DL vận hagravenhthao taacutec khi cần thiết
được kết hợp lại thagravenh dạng coacute thể dugraveng được cho quyết định
Kiacutech cỡ lớn hơn - Lưu giữ theo chuỗi thời gian tức lagrave giữ lại nhiều DL
Khocircng được chuẩn hoacutea - Coacute thể dư thừa DLSiecircu dữ liệu - Dữ liệu của dữ liệu được lưu trữNguồn dữ liệu - DL vận hagravenh (caacutec hệ sẵn coacute) cugraveng
với caacutec nguồn ngoagravei 8 Kho dữ liệu hướng chủ đề
Hướng chủ để coacute nghĩa lagrave kho dữ liệu được tổ chức xung quanh caacutec chủ đề chiacutenh như khaacutech hagraveng sản phẩm sản xuất Tập trung vagraveo việc mocirc higravenh hoacutea vagrave phacircn tiacutech dữ liệu cho caacutec nhagrave ra quyết định magrave khocircng tập trung vagraveo caacutec xử lyacute thocircng thường Cung cấp cho người dugraveng một khung nhigraven toagraven vẹn đơn giản vagrave đầy đủ về caacutec sự kiện quanh caacutec chủ đề
9 Dữ liệu trong DW được tiacutech hợp Dữ liệu trong kho dữ liệu được xacircy dựng bằng caacutech tổng hợp dữ liệu từ
nhiều nguồn khaacutec nhau vagrave caacutec nguồn coacute tổ chức khaacutec nhau Cơ sở dữ liệu caacutec file excel caacutec flat file hoặc caacutec raw file Khi đưa vagraveo kho dữ liệu caacutec dữ liệu được lagravem sạch vagrave tiacutech hợp dữ liệu nhằm đảm bảo tiacutenh nhất quaacuten của dữ liệu
10Kiến truacutec kho dữ liệu Tầng cơ sở dữ liệu hoạt động Tầng truy xuất thocircng tin Tầng truy xuất dữ liệu Tầng siecircu dữ liệu Tầng quản lyacute tiến trigravenh Tầng thocircng điệp của ứng dụng Tầng vật liacute của kho dữ liệu Tầng trigravenh diễn dữ liệu
11Higravenh trạng kho dữ liệu Kho dữ liệu ảo - người dugraveng cuối coacute thể truy cập trực tiếp đến kho dữ liệu
sử dụng caacutec cocircng cụ cho pheacutep ở tầng truy xuất dữ liệu Kho dữ liệu trung tacircm-1 cơ sở dữ liệu vật lyacute chứa tất cả dữ liệu cho một
vugraveng chuyecircn dụng nagraveo đoacute
Kho dữ liệu phacircn taacuten- Thagravenh phần được phacircn taacuten qua nhiều hệ cơ sở dữ liệu vật lyacute
12METADATA- Siecircu dữ liệu Định nghĩa Siecircu dữ liệu lagrave dữ liệu về dữ liệu Lagrave 1 lưu trữ dugraveng để
Miecircu tả kho dữ liệu tổng thể Nhận dạng kiểu kho dữ liệu Quản liacute quaacute trigravenh tiacutech hợp dữ liệu Quản liacute quaacute trigravenh cập nhật kho dữ liệu Quản liacute bảo mật
Lagrave chigravea khoacutea quyết định sự thagravenh cocircng của kho dữ liệu luocircn được thay đổi vagrave cập nhật theo sự phaacutet triển của kho dữ liệu
Dugraveng để quản liacute điều khiển kho dữ liệu Sự ra đời của kho dữ liệu như 1 cấu truacutec hỗ trợ ra quyết định siecircu dữ liệu
được xem như nguồn tagravei nguyecircn dữ liệu Siecircu dữ liệu lagrave trừu tượng Chuacuteng lagrave dữ liệu bậc cao cung cấp mocirc tả ngắn
gọn caacutec dữ liệu bậc thấp hơn 13Hoạt động của Siecircu dữ liệu
Siecircu dữ liệu rất cần thiết trong việc chuyển hoacutea thocircng tin trở thagravenh tri thức Lagrave chigravea khoacutea giuacutep chuacuteng ta xử lyacute được dữ liệu thocirc Viacute dụ một dograveng dữ liệu baacuten hagraveng 1023 K596 11121 agraveNoacute sẽ khocircng coacute nghĩa gigrave cho đến khi chuacuteng ta đưa vagraveo siecircu dữ liệu (thư
mục chứa dữ liệu) agrave cửa hagraveng 1023 sản phẩm K596 vagrave số tiền baacuten được lagrave 11121 đocirc la
14Sự cần thiết phải nhất quaacuten trong kho dữ liệu Kho dữ liệu được xacircy dựng cho lợi iacutech của những nhagrave phacircn tiacutech kinh
doanh caacutec nhagrave quản trị cho tất cả caacutec khu vực chức năng Trong cơ sở dữ liệu riecircng caacutec khu vực khaacutec nhau coacute thể định nghĩa vagrave lưu
trữ dữ liệu thocircng qua phiecircn bản của chiacutenh noacute Khi dữ liệu được lấy từ những vugraveng khaacutec nhau đoacute vagrave được đặt vagraveo kho dữ
liệu Việc chuyển đổi vagrave lagravem sạch caacutec tiến trigravenh sẽ đảm bảo noacute lagrave duy nhất được tiacutech hợp tại một mức của tổ chức
15Ragrave soaacutet lại dữ liệu ndash Thực thi siecircu dữ liệu
Bất kể cấu truacutec tự nhiecircn của 1 cacircu truy vấn thế nagraveo thigrave caacutec thagravenh phần của siecircu dữ liệu rất quan trọng đối với người ra quyết định
Bảng thuộc tiacutenh khoacutea được lưu trữ bởi kho dữ liệu Tập hợp dữ liệu được lấy từ đacircu Những chuyển đổi nagraveo được thực thi với việc lagravem sạch
16Siecircu dữ liệu lagrave gigrave Metadata - lagrave thocircng tin mocirc tả nội dung của cơ sở dữ liệu (CSDL) Metadata baacuteo cho người dugraveng biết thời gian cập nhật sau cugraveng của dữ liệu
định dạng vagrave mục điacutech sử dụng của noacute Những thocircng tin nagravey coacute thể hướng dẫn người dugraveng duyệt qua CSDL vagrave
giuacutep họ hiểu được yacute nghĩa vagrave ngữ cảnh của dữ liệu Trong CSDL metadata lagrave caacutec dạng biểu diễn khaacutec nhau của caacutec đối tượng
trong CSDL Trong CSDL quan hệ metadata lagrave caacutec định nghĩa của bảng cột CSDL
view vagrave nhiều đối tượng khaacutec Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột
một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi -gtMetadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu
Bảng chuyển đổi Ghi lại những chuyển đổi đatilde được thực hiện
Lịch sử thực thi Ghi lại những dữ liệu đatilde được
phacircn tiacutech
Higravenh thaacutei kết nốiGhi lại những dữ liệu được kết nối vagrave tần suất
17Aacutenh xạ thocircng thường của siecircu dữ liệu Bản ghi aacutenh xạ chuyển đổi bao gồm
Định danh của nguồn gốc Chuyển đổi thuộc tiacutenh Chuyển đổi thuộc tiacutenh vật lyacute Matilde hoacutea tham chiếu bảng chuyển đổi Đổi tecircn Đổi khoacutea Gaacuten giaacute trị cho thuộc tiacutenh mặc định Chọn logic cho caacutec nguồn nhiều giaacute trị Đổi thuật toaacuten
18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để
phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai
lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave
tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec
Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm
Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo
19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua
caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau
SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được
Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra
một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức
Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ
Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ
Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech
CHƯƠNG 11 KHAI PHAacute DỮ LIỆU
1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn
ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993
Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng
2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd
1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều
2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP
3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn
4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng
5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server
6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo
7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động
8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời
9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều
10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện
11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech
12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP
3 Xử lyacute phacircn tiacutech trực tuyến OLAP
MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave
dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu
ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave
thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu
HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave
ROLAP4 Khai phaacute dữ liệu
Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh
khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn
Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan
5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp
6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại
Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp
Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec
Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt
Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra
Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh
vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho
Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec
Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm
Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục
Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng
gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp
Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn
Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec
Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper
Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2
Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25
Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước
Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng
Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện
trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp
Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute
độ hỗ trợ ge ngưỡng minsup
độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan
Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn
Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết
Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu
MOLAP ROLAP HOLAP
Lưu trữ dữ liệu cơ sở
Khối Bảng quan hệ Bảng quan hệ
Lưu trữ thocircng tin tổng hợp
Khối Bảng quan hệ Khối
Hiệu suất thực hiện truy vấn
Nhanh nhất Chậm nhất Nhanh
Tiecircu thụ khocircng gian lưu trữ
Nhiều Thấp Trung bigravenh
Chi phiacute bảo trigrave Cao Thấp Trung bigravenh
Kỹ thuật xử lyacute tiếng noacutei (Speech Processing)
Kỹ thuật xử lyacute ngocircn ngữ tự nhiecircn
(Natural Language Processing)
Lập kế hoạch (Planning)
Robot (Robotics)
Khoa học higravenh ảnh (Vision)
Caacutec kỹ thuật thocircng dụng dugraveng trong AI
Biểu diễn(Representation)
Học (Learning)
Caacutec luật (Rules)
Tigravem kiếm (Search)
72 Triacute thocircng minh của triacute tuệ nhacircn tạo
Con người suy diễn như thế nagraveo
Phacircn loại (Categorization)
Caacutec quy tắc cụ thể
Heuristics
Kinh nghiệm trước đoacute
Dự tiacutenh trước
Maacutey tiacutenh suy diễn như thế nagraveo
Lập luận dựa trecircn luật IF-THEN mocirc tả tri thức được matilde hoacutea dưới dạng caacutec luật
Caacutec khung (Frames) lagrave caacutec đại diện mocirc tả caacutec tigravenh huống giống nhau lagrave điển higravenh của một vagravei phacircn loại
Lập luận dựa trecircn caacutec trường hợp mocirc phỏng giải phaacutep trước đoacute cho một vấn đề hiện tại
Nhận dạng mẫu phaacutet hiện acircm thanh higravenh dạng hoặc caacutec chuỗi dagravei
Caacutec dạng khaacutec của Triacute tuệ nhacircn tạo
Học maacutey- mạng nơron vagrave giải thuật di truyền
Lập trigravenh tự động ndash lagrave những kỹ thuật tạo ra caacutec chương trigravenh để lagravem 1 nhiệm vụ riecircng biệt (cho pheacutep những người khocircng phải lagrave người lập trigravenh coacute thể lập trigravenh được)
Cuộc sống nhacircn tạo ndash nỗ lực để taacutei tạo caacutec hiện tượng sinh học trong caacutec hệ thống dựa trecircn maacutey tiacutenh
73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia(Expert Systems- ES)
Theo Jackson (1999) Một hệ chuyecircn gia lagrave một chương trigravenh maacutey tiacutenh mocirc tả vagrave suy diễn với tri thức của một vagravei lĩnh vực để giải quyết vấn đề hay đưa ra caacutec lời khuyecircn
Cấu truacutec cơ bản của ES được dựa theo cấu truacutec chung của DSS Sự khaacutec biệt chiacutenh giữa ES vagraveDSS lagrave hệ ES thu thập caacutec kiến thức từ những
chuyecircn gia trong lĩnh vực quan tacircmĐặc trưng của hệ chuyecircn gia Hiệu quả cao Thời gian trả lời thỏa đaacuteng Độ tin cậy cao Dễ hiểu
Giao diện người dugraveng trong ES
Thiết kế giao diện người dugraveng tập trung vagraveo caacutec yếu tố như dễ dagraveng sử dụngcoacute độ tin cậy cao giảm tải những khoacute khăn khi sử dụng
Thiết kế necircn coacute một số tương taacutec (đầu vagraveo kiểm soaacutet vagrave truy vấn)
Cấu tạo giao diện người dugraveng gồm coacute magraven higravenh cảm ứng bagraven phiacutem buacutet saacuteng lệnh thoại caacutec phiacutem chuyecircn dụng
Cơ sở tri thức (Knowledge Base)
Chứa đựng caacutec tri thức cụ thể miền thu được từ caacutec chuyecircn gia miền
Coacute thể chứa caacutec mocirc tả caacutec hagravenh vi giải quyết vấn đề caacutec ragraveng buộc caacutec heuristics
Thagravenh cocircng của một ES dựa trecircn tiacutenh đầy đủ vagrave tiacutenh chiacutenh xaacutec của cơ sở tri thức
Mocirc tơ suy diễn (Inference Engine)
Ở đacircy tri thức được đặt để sử dụng tạo ra caacutec giải phaacutep để giải quyết vấn đề
Mocirc tơ nagravey coacute khả năng thực hiện diễn dịch hoặc suy diễn dựa trecircn caacutec luật hay caacutec caacutec sự kiện
Đồng thời cũng coacute khả năng sử dụng caacutec suy diễn mờ hay khocircng chiacutenh xaacutec dựa trecircn xaacutec suất hay aacutenh xạ mẫu
Vograveng điều khiển suy diễn
1 Aacutenh xạ caacutec luật với caacutec sự kiện đatilde được cho
2 Chọn luật để thực hiện
3 Thực hiện luật bằng caacutech thecircm caacutec sự kiện được suy diễn ra vagraveo bộ nhớ lagravem việc
Chuỗi suy diễn (Chaining)
Suy diễn tiến (forward chaining) maacutey suy diễn bắt đầu từ dữ liệu ban đầu vagrave thực hiện việc suy luận để đưa ra caacutec kết luận cuối cugraveng
Suy diễn lugravei (backward chaining) maacutey suy diễn bắt đầu từ dữ liệu điacutech vagrave tigravem ra tri thức hỗ trợ cho dữ liệu điacutech đoacute
Viacute dụ suy diễn lugravei
R1 Nếu coacute A vagrave B thigrave suy ra coacute D
R2 Nếu coacute B thigrave suy ra coacute C
R3 Nếu coacute C vagrave D thigrave suy ra coacute E
Ta coacute E ta xem trong 3 luật R1 R2 R3 luật nagraveo coacute E ta thấy R3 chứa E đồng thời chứa C vagrave D Xeacutet tiếp trong 2 luật R1 R2 luật nagraveo chứa C vagrave D R2 chứa C R3 chứa D Từ đoacute ta coacute được caacutec tri thức hỗ trợ suy diễn vagrave kết luận lagrave nếu coacute A vagrave B thigrave sẽ coacute E Hay nếu A vagrave B đuacuteng thigrave sẽ coacute E
Viacute dụ suy diễn tiến
Giả sử coacute tập chứa 3 luật sau
R1 Nếu coacute A vagrave B thigrave suy ra coacute D
R2 Nếu coacute B thigrave suy ra coacute C
R3 Nếu coacute C vagrave D thigrave suy ra coacute E
Nếu ta coacute A vagrave B thigrave chuacuteng ta suy ra được D từ R1 vagrave suy ra C từ R2 Với D vagrave C đatilde được suy ra ở trecircn giờ chuacuteng ta suy ra được E từ R3
Viacute dụ thực tế
Giả sử muốn biết magraveu của một con vật nuocirci tecircn lagrave Fred biết rằng noacute kecircu ộp ộp vagrave ăn ruồi
Coacute tập 4 luật ban đầu như sau
R1 Nếu X kecircu ộp ộp vagrave ăn ruồi thigrave X lagrave con ếch
R2 Nếu X kecircu chiecircm chiếp vagrave biết hoacutet thigrave X lagrave con chim
R3 Nếu X lagrave con ếch thigrave X coacute magraveu xanh
R4 Nếu X lagrave con chim thigrave X coacute magraveu vagraveng
74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia
Expert system shells lagrave một tập caacutec goacutei phần mềm vagrave caacutec cocircng cụ dugraveng để phaacutet triển caacutec hệ chuyecircn gia
Những Expert system shells đầu tiecircn thường rất rườm ragrave Mặc dugrave vậy noacute vẫn giuacutep cho người sử dụng sẽ khocircng phải bắt đầu lại từ đầu khi xacircy dựng một hệ chuyecircn gia mới
Những shell hiện đại bao gồm hai mocirc-đun chiacutenh lagrave cocircng cụ xacircy dựng một tập quy tắc vagrave mocirc tơ suy diễn
Xacircy dựng hệ chuyecircn gia
Bước 1 xacircy dựng mocirc higravenh bagravei toaacuten xaacutec định vấn đề nhiệm vụ magrave hệ thống sẽ thực hiện Caacutec dạng bagravei toaacuten cần hệ chuyecircn gia
Bagravei toaacuten diễn giải (InterPretation)
Bagravei toaacuten dự baacuteo (Prediction)
Bagravei toaacuten chuẩn đoaacuten (Diagnose)
Bagravei toaacuten gỡ rối (Debugging)
Bagravei toaacuten thiết kế
Tương tự như một dự aacuten phần mềm để xacircy dựng một hệ chuyecircn gia cần phải coacute caacutec yếu tố về nhacircn lực tagravei nguyecircn vagrave thời gian Những yếu tố nagravey ảnh hưởng đến giaacute thah của một hệ chuyecircn giaTrong phần nagravey cacircu hỏi thường được đặt ra lagrave tại sao cần phải xacircy dựng một hệ chuyecircn giaTrước khi bắt đầu phải xaacute định rotilde bagravei toaacuten đạt ra lagrave jiAi lagrave chuyecircn giaAi lagrave người sử dụng
1 Diễn giải (InterPretation) Nghiecircn cứu 1 vấn đề -gt Dựa trecircn những biểu hiện thuộc tiacutenh đặc trưng becircn ngoagravei -gt Tư vấn
(hoặc đưa ra kết luận hay mocirc tả dễ hiểu từ tập dữ liệu thocirc)
2 Bagravei toaacuten dự baacuteo (Prediction) Coacute thể dự đoaacuten được hagravenh vi kết quả dựa trecircn caacutec hiện tượng -gt dự baacuteo
VD Dự baacuteo thời tiết động đấthellip
3 Bagravei toaacuten chẩn đoaacuten (Diagnoss) Xaacutec định caacutec lỗi caacutec bộ phận hỏng hoacutec của hệ thống dựa trecircn caacutec dữ liệu quan saacutet được
4 Bagravei toaacuten gỡ rối (Debugging) Mocirc tả caacutec phương phaacutep khắc phục hệ thống khi gặp sự cố
5 Bagravei toaacuten thiết kế Lựa chọn cấu higravenh caacutec đối tượng nhằm thoả matilden một số ragraveng buộc nagraveo đoacute
6 Giảng dạy Phần mềm dạy học coacute thể chuẩn đoaacuten vagrave sủa lỗi của học sinh trong quaacute trigravenh học tập
Để xaacutec định đuacuteng bagravei toaacuten magrave chuacuteng ta cần giải quyết thigrave phải trả lời đc một số cacircu hỏi
- cần hệ chuyecircn gia
Bước 2 thu thập tri thức lựa chọn cocircng cụ vagrave aacutep dụng
Trong bước thu thập tri thức vấn đề quan trọng lagrave lựa chọn chuyecircn gia những người magrave sẽ đoacuteng goacutep tri thức cho hệ thống Thocircng thường trong suốt quaacute trigravenh phaacutet triển thigrave chuyecircn gia được xem như một thagravenh viecircn của đội phaacutet triển
Hiện nay coacute rất nhiều cocircng cụ để xacircy dựng một hệ chuyecircn gia Phổ biến nhất lagrave JESS CLIPS vagrave OPS5
Bước 3 Thiết kế cơ sở tri thức thiết kế hệ thốngTri thức được biểu diễn trường minh trong cơ sở tri thức
Caacutec chuyecircn gia vagrave kỹ sư tri thức sẽ đối thoại với nhau bằng caacutec kỹ thuật đối thoại Suy diễn (SD) bảng Mocirc higravenh hoacutea SD quy nạp phacircn loại
Vấn đề bagraveo trigrave vagrave phaacutet triển
Caacutec hệ chuyecircn gia đogravei hỏi phải bảo trigrave vagrave phaacutet triển nhiều hơn so với caacutec hệ thống khaacutec Phải thường xuyecircn bổ sung tri thức mới vagrave thay đổi caacutec tri thức cũ để đổi mới hệ chuyecircn gia
Thu thập vagrave khắc phục lỗi do người sử dụng phaacutet hiện để kịp thời khắc phục những sai soacutet của hệ chuyecircn gia
75 Lợi iacutech vagrave hạn chế của caacutec hệ chuyecircn gia
Một số lợi iacutech chiacutenh
Thời gian trả lời hợp lyacute bằng hoặc nhanh hơn so với chuyecircn gia (người) để đi đến cugraveng một quyết định Hệ chuyecircn gia lagrave một hệ thống thời gian thực (real time system)
Khả năng trả lời với mức độ tinh thocircng bằng hoặc cao hơn so với chuyecircn gia (người) trong cugraveng lĩnh vực
Hệ chuyecircn gia giuacutep cho hiệu quả lagravem việc tăng bằng việc sử dụng tập caacutec luật một caacutech nhanh choacuteng magrave ko bị nhầm lẫn chuyecircn gia lagrave người coacute thể quecircn đi một số tri thức cơ sở lyacute luậ nhưng HCG thigrave ko
Quyết định của một người chuyecircn gia coacute thể bị thay đổi vagrave ko coacute tiacutenh thống nhất như quyết định của một hệ chuyecircn gia tạo ra
Hệ chuyecircn gia giuacutep cho người sử dụng coacute thể trau dồi sự hiểu biết trecircn lĩnh vuej cụ thể magrave noacute giải quyết hỗ trợ người ra quyết định coacute trigravenh độ như 1 chuyecircn gia trong quaacute trigravenh gia quyết định
Kiến thức của rất nhiều chuyecircn gia về một lĩnh vực nagraveo đoacute được đưa vagraveo hệ chuyecircn gia lagravem cho CSTT cuat HCG phong phuacute vagrave rộng lớn hơn rất nhiều
HCG giải thiacutech caacutec bước suy luận một caacutech dễ hiểu nhất quaacuten luacutec nagraveo cũng coacute thể sử dụng ko như chuyecircn gia con người
Hạn chế của caacutec hệ chuyecircn gia
Nhược điểm lớn nhất của hệ chuyecircn gia lagrave những yacute kiến chuyecircn mocircn thường rất khoacute matilde hoacutea vagrave giải neacuten
Hệ chuyecircn gia khocircng coacute khả năng tự học tự cập nhật kiến thức mới như caacutec chuyecircn gia magrave cần phải được matilde hoacutea lại khi noacute được cập nhật
Hệ chuyecircn gia khocircng thể nhận ra được vấn đề khocircng nằm trong miền kiến thức của hệ thống
Chương 8 Tri thức vagrave tiếp nhận
1 Bao gồm caacutec vấn đề
Dữ liệu thực tế đo lường hoặc quan saacutet coacute hoặc khocircng coacute bối cảnh
Thocircng tin dữ liệu được tổng hợp một caacutech hữu iacutech để giải quyết những khoacute khăn trong việc đưa ra quyết định
Tri thức bao gồm caacutec ứng dụng quy tắc thocircng tin hướng dẫn của người ra quyết định
2 Những caacutei nhigraven về tri thức
Đại diện lagravem thế nagraveo để diễn tả tri thức viacute dụ như một quyển saacutech khocircng phải lagrave tri thức nhưng noacute lại lagrave một đại diện của tri thức
Sản xuất tri thức lagrave một tập hơp của hagraveng tồn kho coacute thể được sản xuất cũng như mua lại
Tri thức lagrave 1 trong 6 trạng thaacutei của hệ thống
1Dữ liệu 2Thocircng tin 3Cấu truacutec thocircng tin 4Sự thấu hiểu 5Yacute kiến 6 Quyết định
3 Caacutec loại tri thức Phổ biến mocirc tả dữ liệu thocircng tin thủ tục mọi thứ lagravem như thế nagraveo lập luận chiacutenh saacutech hoặc caacutec quy tắc
4 Thu thập Tri thức hệ chuyecircn gia Hầu hết caacutec phương phaacutep đều bắt đầu với mocirc higravenh của caacutec taacutec vụ trong đoacute
hệ chuyecircn gia được xacircy dựng Trong đoacute mocirc tả về caacutec lĩnh vực được tạo ra Caacutec kỹ sư sử dụng caacutec mocirc higravenh giả thuyết vagrave nhận thức về quaacute trigravenh phacircn
tiacutech để gợi ra caacutech giải quyết vấn đề về tri thức từ caacutec chuyecircn gia
5 Caacutec chiều của thu thập tri thức KE- driven caacutec kỹ sư trao đổi trực tiếp với caacutec chuyecircn gia Expert-driven Caacutec chuyecircn gia trực tiếp đưa chuyecircn mocircn của họ vagraveo hệ
thống maacutey tiacutenh Machine-driven Sử dụng caacutec cocircng cụ suy luận để triacutech xuất tri thức từ một
tập caacutec viacute dụ
6 Kỹ thuật thu thập tri thức Trao đổi gồm 2 loại cơ bản lagrave coacute cấu truacutec(coacute kịch bản) vagrave khocircng coacute cấu
truacutec( đối thoại trực tiếp) Giao thức phacircn tiacutech bằng lời Khi caacutec chuyecircn gia thực hiện một cocircng việc
của họ thigrave một bản ghi về cocircng việc đoacute được thực hiện Caacutec kỹ sư sẽ xacircy dựng mocirc higravenh cho những gigrave được ghi lại trong bản ghi
Phương phaacutep sagraveng lọc caacutec chuyecircn gia so saacutenh caacutec nhoacutem liecircn tiếp trong ba đối tượng vagrave cho biết tại sao nhoacutem thứ hai lại khaacutec nhoacutem thứ ba
7 Thu thập tri thức từ nhiều nguồn Thu thập tri thức từ nhiều nguồn lagrave cần thiết để coacute được đầy đủ caacutec tri thức
cho một vấn đề quan điểm yacute kiến traacutei ngược nhau thường phaacutet sinh Phương phaacutep đồng thuận sẽ giuacutep giải quyết được vấn đề macircu thuẫn Kỹ thuật phacircn tiacutech Meta lagrave kỹ thuật được aacutep dụng trong caacutec trường hợp
khaacutec Caacutech tiếp cận bằng định lượng đogravei hỏi caacutec kỹ sư cần cacircn nhắc yếu tố đầu vagraveo của caacutec chuyecircn gia khaacutec nhau
8 Xaacutec nhận hợp lệ vagrave kiểm tra tri thức Một khi thu thập tri thức noacute phải được đaacutenh giaacute về khả năng sử dụng vagrave độ
chiacutenh xaacutec Hai vấn đề cụ thể lagrave hiệu lực của những kiến thức vagrave kiểm tra việc xacircy dựng cơ sở của tri thức
Cần xaacutec nhận xem liệu hệ thống coacute thể hoạt động ở mức độ tối thiểu khocircng
Xaacutec minh liecircn quan đến việc so saacutenh từng chi tiết kỹ thuật của hệ thống những gigrave đatilde được thực hiện cuối cugraveng
9 Một số caacutec biện phaacutep xaacutec nhận Độ chiacutenh xaacutec Khả năng thiacutech nghi Mức độ đầy đủ Bề rộng Độ sacircu Hiệu lực Tổng quan Chiacutenh xaacutec Hiện thực Độ tin cậy Tiacutenh hữu dụng Mức độ
Chương 9 Học maacutey
1 Logic mờ vagrave ngocircn ngữ mờ(Fuzzy Logic and Linguistic Ambiguity)
Ngocircn ngữ tự nhiecircn gồm những khaacutei niệm mơ hồ vagrave khocircng chiacutenh xaacutectruyền tải ngữ nghĩa thocircng qua tiacutenh xấp xỉkhocircng rotilde ragraveng
Những xấp xỉ nagravey giuacutep con người coacute thể truyền tải hết được yacute nghĩa nhưng maacutey thigrave khocircng hiểu
Lagravem sao biểu diễn caacutec tri thức sử dụng caacutec khaacutei niệm khocircng rotilde ragraveng(mờ) hoặc khocircng chiacutenh xaacutec
2 Khaacutei niệm cơ bản của logic mờ tập mờ lagrave những tập hợp khocircng coacute một giới hạn rotilde Mỗi phần tử của noacute chỉ
chứa một mức độ hagravem liecircn thuộc của từng phần tử Vigrave vậy tập mờ khocircng giống như tập cổ điển Tập mờ coacute thể kết hợp với nhau qua những luật mờ magrave đặc trưng cho những hagravenh động trạng thaacutei vagrave thuộc tiacutenh của logic mờ được tận dụng khi thực hiện một bộ điều khiển mờ
Logic mờ dựa trecircn yacute tưởng mỗi phần tử thuộc vagraveo một tập hợp ở một mức độ nagraveo đấy
Locircgic mờ cho pheacutep độ liecircn thuộc (microA )coacute giaacute trị trong khoảng (01) Locircgic mờ coacute thể được coi lagrave mặt ứng dụng của lyacute thuyết tập mờ để xử lyacute caacutec
giaacute trị trong thế giới thực cho caacutec bagravei toaacuten phức tạp
3 So saacutenh tiacutenh đuacuteng đắn logic mờ vagrave xaacutec suất Xaacutec suất thigrave đề cập đến khả năng xảy ra một biến cố hay một điều gigrave đoacute Logic mờ đề cập đến cấp độ magrave đặc tiacutenh ở hiện tại
o viacute dụ1 người coacute chiều cao 6 feet thigrave coacute cấp độ lagrave 05 về chiều cao
4 Ưu điểm của logic mờ Caacutech tiếp cận rất tự nhiecircnkhocircng phức tạp Coacute thể mocirc higravenh hoacutea caacutec hagravem phi tuyến tugravey yacute phức tạp
Coacute thể tận dụng được kinh nghiệm từ những chuyecircn gia hagraveng đầu trong mọi lĩnh vực
Logic mờ được xacircy dựng dựa trecircn ngocircn ngữ tự nhiecircnNền tảng của logic mờ lagrave dựa trecircn cơ sở giao tiếp của con người
5 Nhược điểm của logic mờ Trong 1 hệ thống phức tạpsử dụng logic mờ coacute thể trở thagravenh trở ngại cho
việc xaacutec thực độ tin cậy của hệ thống Cơ chế lập luận mờ khocircng thể học hỏi từ những lỗi sai
6 Mạng noron nhacircn tạo(ANN) Mạng noron nhacircn tạo lagrave một mocirc phỏng xử lyacute thocircng tinđược nghiecircn cứu ra
từ hệ thống thần kinh của sinh vậtgiống như bộ natildeo để xử lyacute thocircng tin ANNs lagrave chương trigravenh dựa trecircn maacutey tiacutenh đơn giản coacute chức năng lagrave một mocirc
higravenh bagravei toaacuten khocircng gian dựa trecircn thử nghiệm vagrave baacuteo lỗi
7 Học từ kinh nghiệm Tiến trigravenh Một mẫu dữ liệu được biểu diễn như một mạng lưới noronANN ldquodự
đoaacutenrdquo 1 đầu radự đoaacuten được so saacutenh với giaacute trị thực tế hoặc giaacute trị chiacutenh xaacutecNếu đoaacuten được chiacutenh xaacutec thigrave khocircng coacute hagravenh động nagraveo được thực hiện
Nếu dự đoaacuten sai ANN kiểm tra lại vagrave xaacutec định lại thocircng số để điều chỉnh Một mẫu dữ liệu khaacutec được biểu diễn vagrave quaacute trigravenh nagravey được lặp lại
8 Nguyecircn tắc cơ bản của cocircng nghệ nơron Caacutec yếu tố xử lyacute cơ bản trong hệ thống thần kinh của con người lagrave tế bagraveo
thần kinhMạng lưới của tế bagraveo nagravey lagrave liecircn kết với nhau nhận được thocircng tin từ caacutec cảm biến trong mắt taihellip
Thocircng tin nhận được bởi tế bagraveo thần kinh hoặc lagrave sẽ kiacutech thiacutech noacute(sẽ được chuyển qua 1 thocircng điệp dọc theo mạng lưới) hoặc lagrave sẽ ngăn cản noacute(ngăn cản dograveng thocircng tin)
Độ nhạy coacute thể thay đổi qua thời gian hoặc sau khi coacute được kinh nghiệm
9 Cấu truacutec mạng Một ANN gồm 3 lớp cơ bản
Lớp đầu vagraveo nhận dữ liệu Lớp becircn trong hoặc lagrave lớp ẩn xử lyacute dữ liệu Lớp đầu ra chuyển tiếp kết quả cuối cugraveng của mạng
10Mạng nơ ron Thường coacute nhiều đầu vagraveo mỗi đầu vagraveo với mức ảnh hưởng vagrave tầm quan
trọng riecircng của noacute Một đầu vagraveo quan trọng coacute thể được sử dụng để khuếch đại đầu ra caacutec hagravem trạng thaacutei tổng hợp caacutec trọng số của caacutec yếu tố
đầuvagraveo khaacutec nhauvagraveo một giaacute trị duy nhất Caacutec hagravem chuyển giao xử lyacute caacutec giaacute trị trạng thaacutei vagrave tạo đầu ra
11Huấn luyện mạng nơ ron Trong mocirc higravenh coacute giaacutem saacutetANN được đến so saacutenh dự đoaacuten của chiacutenh
noacute với thocircng tin phản hồi coacute chứa caacutec kết quả mong muốn ANN sẽ phải tigravem caacutech thay đổi caacutec tham số becircn trong củamigravenh (caacutec trọng số vagrave caacutec ngưỡng) để tạo necircn một aacutenh xạ coacute khả năng aacutenh xạcaacutec đầu vagraveo thagravenh caacutec đầu ra mong muốn Sự thay đổi nagravey được tiến hagravenh nhờ việc so saacutenh giữa đầu ra thực sự vagrave đầu ra mong muốn
Trong mocirc higravenh khocircng coacute giaacutem saacutetANN nhận được dữ liệu vagraveo nhưng khocircng phải coacute bất kỳ thocircng tin phản hồi về kết quả mong muốn
Phần lớn caacutec ứng dụng nằm trong vugraveng của caacutec bagravei toaacuten ước lượng như mocirc higravenh hoacuteathống kecirc neacuten lọc phacircn cụm
12Lợi iacutech Liecircn kết với mạng noron Traacutenh caacutech lập trigravenh tường minh Giảm nhu cầu của chuyecircn gia ANNs thigrave thiacutech nghi với caacutec yếu tố đầu vagraveo thay đổi Khocircng cần thiết cho cơ sở tri thức tinh chế ANNs coacute tiacutenh động vagrave cải thiện với việc sử dụng Coacute khả năng xử lyacute dữ liệu khocircng chiacutenh xaacutec hoặc khocircng đầy đủ Cho pheacutep tổng quaacutet hoacutea từ thocircng tin cụ thể Cho pheacutep thu thập cảm giaacutec thocircng thường vagraveo miền giải quyết vấn đề
13Hạn chế của việc liecircn kết với mạng noron ANNs khocircng thể giải thiacutech được suy luận Bản chất hộp đen thường khiến cho vấn đề traacutech nhiệm vagrave độ tin cậy phaacutet
sinh lagrave khoacute khăn Lặp đi lặp lại quaacute trigravenh huấn luyện rất tốn thời gian Nguồn lực caacutec nhagrave phacircn tiacutech vagrave thiết kế coacute tay nghề cao vẫn lagrave đaacuteng lo
ngại Cocircng nghệ ANN thuacutec đẩy hạn chế của phần cứng hiện tại ANN yecircu cầu phải coacute sự tin tưởng ở đầu ra
14Giới thiệu về thuật toaacuten di truyền Cũng như mạng lưới thần kinh caacutec thuật toaacuten di truyền được dựa trecircn lyacute
thuyết sinh học Thuật toaacuten di truyền tigravem thấy nguồn gốc của chuacuteng trong caacutec lyacute thuyết
tiến hoacutea của chọn lọc tự nhiecircn vagrave thiacutech ứng với biến đổi khiacute hậu Kết quả thuật toaacuten di truyền lagrave từ giao phối 2 caacute thể trong quần thế để tạo
ra con caacutei đocirci khi tốt hơn so với bậc cha mẹ của chuacuteng 15Caacutec thagravenh phần cơ bản của thuật toaacuten di truyền
Toaacuten tử chọn lọc Caacutec caacute thể tốt được chọn lọc để đưa vagraveo thế hệ sau Sự chọn lọc nagravey căn cứ vagraveo độ thiacutech nghi với mocirci trường của mỗi caacute thể
Toaacuten tử lai gheacutep (crossover) Hai caacute thể cha vagrave mẹ trao đổi caacutec gen với nhau để tạo ra caacute thể con
Toaacuten tử đột biến (mutation) Một caacute thể thay đổi một số gen để biến đổi thagravenh một caacute thể mớiTất cả caacutec toaacuten tử trecircn khi thực hiện đều mang tiacutenh ngẫu nhiecircn
16Quaacute trigravenh cơ bản của một thuật toaacuten di truyền Khởi tạo
Đaacutenh giaacute quần thể
Lựa chọn NST thiacutech hợp nhất vagrave loại bỏ NST yếu nhất
Quy trigravenh giao nhau vagrave cải thiện quần thể
đột biến tiến trigravenh để khaacutem phaacute ra NST mới
17Ưu nhược điểm của việc kết hợp với thuật toaacuten di truyền Kiacutech thước quần thể lagrave 1 yếu tố quan trọng trong tốc độ của việc tigravem
kiếmnhưng noacute tương đối dễ dagraveng để dự đoaacuten tốc độ nagravey Giao nhau hoặc đột biến lagrave khocircng necircn đc sử dụng quaacute thường xuyecircn Luocircn coacute được iacutet nhất 1 giải phaacutep hợp lyacute Necircn coacute thể aacutep dụng chuacuteng cho caacutec vấn đề magrave chuacuteng ta khocircng coacute hướng
về caacutech giải quyết Sức mạnh của thuật toaacuten xuất phaacutet từ khaacutei niệm đơn giảnkhocircng phải từ
một thủ tục thuật toaacuten phức tạp 18Tương lai của học maacutey
Mạng lưới thần kinh nhacircn tạo vượt quaacute năng lực của con người trong caacutec trường hợp bị cocirc lập
Về mặt lyacute thuyếtmột maacutey tiacutenh coacute thể xử lyacute dũ liệu nhanh hơn hagraveng triệu lần so với 1 con người
May mắn thay cho chuacuteng tacon người tốt hơn nhiều khi magrave coacute được dữ liệumaacutey tiacutenh khocircng coacute 1 số thứ như lagrave 5 giaacutec quan
CHƯƠNG 10 KHO DỮ LIỆU
1 Kho dữ liệu Kho dữ liệu lagrave tuyển tập caacutec cơ sở dữ liệu tiacutech hợp hướng chủ đề được
thiết kế để trợ giuacutep cho một hệ hỗ trợ quyết định
Theo John Ladley Cocircng nghệ kho dữ liệu lagrave tập caacutec phương phaacutep kỹ thuật vagrave caacutec cocircng cụ coacute thể kết hợp hỗ trợ nhau để cung cấp thocircng tin cho người sử dụng trecircn cơ sở tiacutech hợp từ nhiều nguồn dữ liệu nhiều mocirci trường khaacutec nhau
Kho dữ liệu thường rất lớn tới hagraveng trăm GB hay thậm chiacute hagraveng Terabyte
2 Kho dữ liệu vận hagravenh (ODS) Một kho dữ liệu vận hagravenh Aacutep dụng kỹ thuật kho dữ liệu vagraveo caacutec hệ xử
lyacute giao taacutec lưu trữ dữ liệu cho một ứng dụng đặc thugrave Noacute đưa vagraveo kho dữ liệu một dograveng caacutec dữ liệu thocirc được thiết kế
3 So saacutenh
Kho dữ liệu vận hagravenh Kho dữ liệu
Dữ liệu theo chủ đề Dữ liệu theo chủ đề
Dữ liệu tiacutech hợp Dữ liệu tiacutech hợp
Dữ liệu thay đổi Dữ liệu khocircng thay đổi
Dữ liệu được cập nhật khi thay đổi
Dữ liệu giữ nguyecircn
Chỉ coacute dữ liệu hiện tạiDữliệu hiện tại vagrave dữ liệu lịch sử
Chu kỳ lagravem tươi dữ liệu ngắn Chu kỳ lagravem tươi dữ liệu dagravei
Chỉ coacute dữ liệu chi tiết Dữ liệu chi tiết vagrave dữ liệu tổng kết
Dugraveng cho caacutec quyết định ngắn hạn
Dugraveng cho hoạch định dagravei hạn
4 Kho dữ liệu cục bộ (Data Mart - DM)
Kho dữ liệu cục bộ lagrave CSDL coacute những đặc điểm giống với kho dữ liệu nhưng với quy mocirc nhỏ hơn vagrave lưu trữ dữ liệu về một lĩnh vực một chuyecircn ngagravenh
Data mart phụ thuộc Chứa những dữ liệu được lấy từ DW vagrave những dữ liệu nagravey sẽ được triacutech lọc vagrave tinh chế tiacutech hợp lại ở mức cao hơn để phục vụ một chủ đề nhất định của Datamart
Data mart độc lập Khocircng giống như Datamart phụ thuộc Data mart độc lập được xacircy dựng trước DW vagrave dữ liệu được trực tiếp lấy từ caacutec nguồn khaacutec nhau
5 Siecircu dữ liệu Metadata lagrave dữ liệu để mocirc tả dữ liệu Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột
một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi Metadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu
6 Mocirci trường kho dữ liệu Hệ thống của tổ chức vagrave kho cung cấp dữ liệu để xacircy dựng kho dữ liệu Trong quaacute trigravenh chuyển dữ liệu từ caacutec nguồn khaacutec nhau dữ liệu coacute thể
được lagravem sạch hoặc chuyển đổi vagrave vigrave thế DW được xem như lagrave một chuẩn cho việc lưu trữ
Đồng thời siecircu dữ liệu được ghi lại Cuối cugraveng DW hoặc siecircu thị coacute thể được sử dụng để tạo ra một kho dữ
liệu ldquocaacute nhacircnrdquo 7 Caacutec đặc điểm của kho dữ liệu
Đặc điểm Mocirc tả
Hướng chủ đề - DL tổ chức theo caacutech thức người dugraveng tham chiếu
Tiacutech hợp - Dữ liệu ldquosạchrdquo loại bỏ tiacutenh thiếu nhất quaacuten
Khocircng thay đổi - DL ldquochỉ đọcrdquo người dugraveng khocircng thay đổi được
Chuỗi thời gian - DL lagrave chuỗi thời gian khocircng phải lagrave trạng thaacutei hiện tại
Được tổng kết - DL vận hagravenhthao taacutec khi cần thiết
được kết hợp lại thagravenh dạng coacute thể dugraveng được cho quyết định
Kiacutech cỡ lớn hơn - Lưu giữ theo chuỗi thời gian tức lagrave giữ lại nhiều DL
Khocircng được chuẩn hoacutea - Coacute thể dư thừa DLSiecircu dữ liệu - Dữ liệu của dữ liệu được lưu trữNguồn dữ liệu - DL vận hagravenh (caacutec hệ sẵn coacute) cugraveng
với caacutec nguồn ngoagravei 8 Kho dữ liệu hướng chủ đề
Hướng chủ để coacute nghĩa lagrave kho dữ liệu được tổ chức xung quanh caacutec chủ đề chiacutenh như khaacutech hagraveng sản phẩm sản xuất Tập trung vagraveo việc mocirc higravenh hoacutea vagrave phacircn tiacutech dữ liệu cho caacutec nhagrave ra quyết định magrave khocircng tập trung vagraveo caacutec xử lyacute thocircng thường Cung cấp cho người dugraveng một khung nhigraven toagraven vẹn đơn giản vagrave đầy đủ về caacutec sự kiện quanh caacutec chủ đề
9 Dữ liệu trong DW được tiacutech hợp Dữ liệu trong kho dữ liệu được xacircy dựng bằng caacutech tổng hợp dữ liệu từ
nhiều nguồn khaacutec nhau vagrave caacutec nguồn coacute tổ chức khaacutec nhau Cơ sở dữ liệu caacutec file excel caacutec flat file hoặc caacutec raw file Khi đưa vagraveo kho dữ liệu caacutec dữ liệu được lagravem sạch vagrave tiacutech hợp dữ liệu nhằm đảm bảo tiacutenh nhất quaacuten của dữ liệu
10Kiến truacutec kho dữ liệu Tầng cơ sở dữ liệu hoạt động Tầng truy xuất thocircng tin Tầng truy xuất dữ liệu Tầng siecircu dữ liệu Tầng quản lyacute tiến trigravenh Tầng thocircng điệp của ứng dụng Tầng vật liacute của kho dữ liệu Tầng trigravenh diễn dữ liệu
11Higravenh trạng kho dữ liệu Kho dữ liệu ảo - người dugraveng cuối coacute thể truy cập trực tiếp đến kho dữ liệu
sử dụng caacutec cocircng cụ cho pheacutep ở tầng truy xuất dữ liệu Kho dữ liệu trung tacircm-1 cơ sở dữ liệu vật lyacute chứa tất cả dữ liệu cho một
vugraveng chuyecircn dụng nagraveo đoacute
Kho dữ liệu phacircn taacuten- Thagravenh phần được phacircn taacuten qua nhiều hệ cơ sở dữ liệu vật lyacute
12METADATA- Siecircu dữ liệu Định nghĩa Siecircu dữ liệu lagrave dữ liệu về dữ liệu Lagrave 1 lưu trữ dugraveng để
Miecircu tả kho dữ liệu tổng thể Nhận dạng kiểu kho dữ liệu Quản liacute quaacute trigravenh tiacutech hợp dữ liệu Quản liacute quaacute trigravenh cập nhật kho dữ liệu Quản liacute bảo mật
Lagrave chigravea khoacutea quyết định sự thagravenh cocircng của kho dữ liệu luocircn được thay đổi vagrave cập nhật theo sự phaacutet triển của kho dữ liệu
Dugraveng để quản liacute điều khiển kho dữ liệu Sự ra đời của kho dữ liệu như 1 cấu truacutec hỗ trợ ra quyết định siecircu dữ liệu
được xem như nguồn tagravei nguyecircn dữ liệu Siecircu dữ liệu lagrave trừu tượng Chuacuteng lagrave dữ liệu bậc cao cung cấp mocirc tả ngắn
gọn caacutec dữ liệu bậc thấp hơn 13Hoạt động của Siecircu dữ liệu
Siecircu dữ liệu rất cần thiết trong việc chuyển hoacutea thocircng tin trở thagravenh tri thức Lagrave chigravea khoacutea giuacutep chuacuteng ta xử lyacute được dữ liệu thocirc Viacute dụ một dograveng dữ liệu baacuten hagraveng 1023 K596 11121 agraveNoacute sẽ khocircng coacute nghĩa gigrave cho đến khi chuacuteng ta đưa vagraveo siecircu dữ liệu (thư
mục chứa dữ liệu) agrave cửa hagraveng 1023 sản phẩm K596 vagrave số tiền baacuten được lagrave 11121 đocirc la
14Sự cần thiết phải nhất quaacuten trong kho dữ liệu Kho dữ liệu được xacircy dựng cho lợi iacutech của những nhagrave phacircn tiacutech kinh
doanh caacutec nhagrave quản trị cho tất cả caacutec khu vực chức năng Trong cơ sở dữ liệu riecircng caacutec khu vực khaacutec nhau coacute thể định nghĩa vagrave lưu
trữ dữ liệu thocircng qua phiecircn bản của chiacutenh noacute Khi dữ liệu được lấy từ những vugraveng khaacutec nhau đoacute vagrave được đặt vagraveo kho dữ
liệu Việc chuyển đổi vagrave lagravem sạch caacutec tiến trigravenh sẽ đảm bảo noacute lagrave duy nhất được tiacutech hợp tại một mức của tổ chức
15Ragrave soaacutet lại dữ liệu ndash Thực thi siecircu dữ liệu
Bất kể cấu truacutec tự nhiecircn của 1 cacircu truy vấn thế nagraveo thigrave caacutec thagravenh phần của siecircu dữ liệu rất quan trọng đối với người ra quyết định
Bảng thuộc tiacutenh khoacutea được lưu trữ bởi kho dữ liệu Tập hợp dữ liệu được lấy từ đacircu Những chuyển đổi nagraveo được thực thi với việc lagravem sạch
16Siecircu dữ liệu lagrave gigrave Metadata - lagrave thocircng tin mocirc tả nội dung của cơ sở dữ liệu (CSDL) Metadata baacuteo cho người dugraveng biết thời gian cập nhật sau cugraveng của dữ liệu
định dạng vagrave mục điacutech sử dụng của noacute Những thocircng tin nagravey coacute thể hướng dẫn người dugraveng duyệt qua CSDL vagrave
giuacutep họ hiểu được yacute nghĩa vagrave ngữ cảnh của dữ liệu Trong CSDL metadata lagrave caacutec dạng biểu diễn khaacutec nhau của caacutec đối tượng
trong CSDL Trong CSDL quan hệ metadata lagrave caacutec định nghĩa của bảng cột CSDL
view vagrave nhiều đối tượng khaacutec Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột
một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi -gtMetadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu
Bảng chuyển đổi Ghi lại những chuyển đổi đatilde được thực hiện
Lịch sử thực thi Ghi lại những dữ liệu đatilde được
phacircn tiacutech
Higravenh thaacutei kết nốiGhi lại những dữ liệu được kết nối vagrave tần suất
17Aacutenh xạ thocircng thường của siecircu dữ liệu Bản ghi aacutenh xạ chuyển đổi bao gồm
Định danh của nguồn gốc Chuyển đổi thuộc tiacutenh Chuyển đổi thuộc tiacutenh vật lyacute Matilde hoacutea tham chiếu bảng chuyển đổi Đổi tecircn Đổi khoacutea Gaacuten giaacute trị cho thuộc tiacutenh mặc định Chọn logic cho caacutec nguồn nhiều giaacute trị Đổi thuật toaacuten
18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để
phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai
lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave
tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec
Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm
Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo
19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua
caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau
SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được
Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra
một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức
Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ
Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ
Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech
CHƯƠNG 11 KHAI PHAacute DỮ LIỆU
1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn
ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993
Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng
2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd
1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều
2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP
3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn
4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng
5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server
6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo
7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động
8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời
9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều
10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện
11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech
12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP
3 Xử lyacute phacircn tiacutech trực tuyến OLAP
MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave
dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu
ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave
thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu
HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave
ROLAP4 Khai phaacute dữ liệu
Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh
khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn
Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan
5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp
6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại
Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp
Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec
Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt
Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra
Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh
vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho
Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec
Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm
Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục
Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng
gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp
Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn
Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec
Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper
Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2
Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25
Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước
Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng
Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện
trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp
Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute
độ hỗ trợ ge ngưỡng minsup
độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan
Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn
Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết
Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu
MOLAP ROLAP HOLAP
Lưu trữ dữ liệu cơ sở
Khối Bảng quan hệ Bảng quan hệ
Lưu trữ thocircng tin tổng hợp
Khối Bảng quan hệ Khối
Hiệu suất thực hiện truy vấn
Nhanh nhất Chậm nhất Nhanh
Tiecircu thụ khocircng gian lưu trữ
Nhiều Thấp Trung bigravenh
Chi phiacute bảo trigrave Cao Thấp Trung bigravenh
Lập luận dựa trecircn caacutec trường hợp mocirc phỏng giải phaacutep trước đoacute cho một vấn đề hiện tại
Nhận dạng mẫu phaacutet hiện acircm thanh higravenh dạng hoặc caacutec chuỗi dagravei
Caacutec dạng khaacutec của Triacute tuệ nhacircn tạo
Học maacutey- mạng nơron vagrave giải thuật di truyền
Lập trigravenh tự động ndash lagrave những kỹ thuật tạo ra caacutec chương trigravenh để lagravem 1 nhiệm vụ riecircng biệt (cho pheacutep những người khocircng phải lagrave người lập trigravenh coacute thể lập trigravenh được)
Cuộc sống nhacircn tạo ndash nỗ lực để taacutei tạo caacutec hiện tượng sinh học trong caacutec hệ thống dựa trecircn maacutey tiacutenh
73 Khaacutei niệm vagrave cấu truacutec của hệ chuyecircn gia(Expert Systems- ES)
Theo Jackson (1999) Một hệ chuyecircn gia lagrave một chương trigravenh maacutey tiacutenh mocirc tả vagrave suy diễn với tri thức của một vagravei lĩnh vực để giải quyết vấn đề hay đưa ra caacutec lời khuyecircn
Cấu truacutec cơ bản của ES được dựa theo cấu truacutec chung của DSS Sự khaacutec biệt chiacutenh giữa ES vagraveDSS lagrave hệ ES thu thập caacutec kiến thức từ những
chuyecircn gia trong lĩnh vực quan tacircmĐặc trưng của hệ chuyecircn gia Hiệu quả cao Thời gian trả lời thỏa đaacuteng Độ tin cậy cao Dễ hiểu
Giao diện người dugraveng trong ES
Thiết kế giao diện người dugraveng tập trung vagraveo caacutec yếu tố như dễ dagraveng sử dụngcoacute độ tin cậy cao giảm tải những khoacute khăn khi sử dụng
Thiết kế necircn coacute một số tương taacutec (đầu vagraveo kiểm soaacutet vagrave truy vấn)
Cấu tạo giao diện người dugraveng gồm coacute magraven higravenh cảm ứng bagraven phiacutem buacutet saacuteng lệnh thoại caacutec phiacutem chuyecircn dụng
Cơ sở tri thức (Knowledge Base)
Chứa đựng caacutec tri thức cụ thể miền thu được từ caacutec chuyecircn gia miền
Coacute thể chứa caacutec mocirc tả caacutec hagravenh vi giải quyết vấn đề caacutec ragraveng buộc caacutec heuristics
Thagravenh cocircng của một ES dựa trecircn tiacutenh đầy đủ vagrave tiacutenh chiacutenh xaacutec của cơ sở tri thức
Mocirc tơ suy diễn (Inference Engine)
Ở đacircy tri thức được đặt để sử dụng tạo ra caacutec giải phaacutep để giải quyết vấn đề
Mocirc tơ nagravey coacute khả năng thực hiện diễn dịch hoặc suy diễn dựa trecircn caacutec luật hay caacutec caacutec sự kiện
Đồng thời cũng coacute khả năng sử dụng caacutec suy diễn mờ hay khocircng chiacutenh xaacutec dựa trecircn xaacutec suất hay aacutenh xạ mẫu
Vograveng điều khiển suy diễn
1 Aacutenh xạ caacutec luật với caacutec sự kiện đatilde được cho
2 Chọn luật để thực hiện
3 Thực hiện luật bằng caacutech thecircm caacutec sự kiện được suy diễn ra vagraveo bộ nhớ lagravem việc
Chuỗi suy diễn (Chaining)
Suy diễn tiến (forward chaining) maacutey suy diễn bắt đầu từ dữ liệu ban đầu vagrave thực hiện việc suy luận để đưa ra caacutec kết luận cuối cugraveng
Suy diễn lugravei (backward chaining) maacutey suy diễn bắt đầu từ dữ liệu điacutech vagrave tigravem ra tri thức hỗ trợ cho dữ liệu điacutech đoacute
Viacute dụ suy diễn lugravei
R1 Nếu coacute A vagrave B thigrave suy ra coacute D
R2 Nếu coacute B thigrave suy ra coacute C
R3 Nếu coacute C vagrave D thigrave suy ra coacute E
Ta coacute E ta xem trong 3 luật R1 R2 R3 luật nagraveo coacute E ta thấy R3 chứa E đồng thời chứa C vagrave D Xeacutet tiếp trong 2 luật R1 R2 luật nagraveo chứa C vagrave D R2 chứa C R3 chứa D Từ đoacute ta coacute được caacutec tri thức hỗ trợ suy diễn vagrave kết luận lagrave nếu coacute A vagrave B thigrave sẽ coacute E Hay nếu A vagrave B đuacuteng thigrave sẽ coacute E
Viacute dụ suy diễn tiến
Giả sử coacute tập chứa 3 luật sau
R1 Nếu coacute A vagrave B thigrave suy ra coacute D
R2 Nếu coacute B thigrave suy ra coacute C
R3 Nếu coacute C vagrave D thigrave suy ra coacute E
Nếu ta coacute A vagrave B thigrave chuacuteng ta suy ra được D từ R1 vagrave suy ra C từ R2 Với D vagrave C đatilde được suy ra ở trecircn giờ chuacuteng ta suy ra được E từ R3
Viacute dụ thực tế
Giả sử muốn biết magraveu của một con vật nuocirci tecircn lagrave Fred biết rằng noacute kecircu ộp ộp vagrave ăn ruồi
Coacute tập 4 luật ban đầu như sau
R1 Nếu X kecircu ộp ộp vagrave ăn ruồi thigrave X lagrave con ếch
R2 Nếu X kecircu chiecircm chiếp vagrave biết hoacutet thigrave X lagrave con chim
R3 Nếu X lagrave con ếch thigrave X coacute magraveu xanh
R4 Nếu X lagrave con chim thigrave X coacute magraveu vagraveng
74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia
Expert system shells lagrave một tập caacutec goacutei phần mềm vagrave caacutec cocircng cụ dugraveng để phaacutet triển caacutec hệ chuyecircn gia
Những Expert system shells đầu tiecircn thường rất rườm ragrave Mặc dugrave vậy noacute vẫn giuacutep cho người sử dụng sẽ khocircng phải bắt đầu lại từ đầu khi xacircy dựng một hệ chuyecircn gia mới
Những shell hiện đại bao gồm hai mocirc-đun chiacutenh lagrave cocircng cụ xacircy dựng một tập quy tắc vagrave mocirc tơ suy diễn
Xacircy dựng hệ chuyecircn gia
Bước 1 xacircy dựng mocirc higravenh bagravei toaacuten xaacutec định vấn đề nhiệm vụ magrave hệ thống sẽ thực hiện Caacutec dạng bagravei toaacuten cần hệ chuyecircn gia
Bagravei toaacuten diễn giải (InterPretation)
Bagravei toaacuten dự baacuteo (Prediction)
Bagravei toaacuten chuẩn đoaacuten (Diagnose)
Bagravei toaacuten gỡ rối (Debugging)
Bagravei toaacuten thiết kế
Tương tự như một dự aacuten phần mềm để xacircy dựng một hệ chuyecircn gia cần phải coacute caacutec yếu tố về nhacircn lực tagravei nguyecircn vagrave thời gian Những yếu tố nagravey ảnh hưởng đến giaacute thah của một hệ chuyecircn giaTrong phần nagravey cacircu hỏi thường được đặt ra lagrave tại sao cần phải xacircy dựng một hệ chuyecircn giaTrước khi bắt đầu phải xaacute định rotilde bagravei toaacuten đạt ra lagrave jiAi lagrave chuyecircn giaAi lagrave người sử dụng
1 Diễn giải (InterPretation) Nghiecircn cứu 1 vấn đề -gt Dựa trecircn những biểu hiện thuộc tiacutenh đặc trưng becircn ngoagravei -gt Tư vấn
(hoặc đưa ra kết luận hay mocirc tả dễ hiểu từ tập dữ liệu thocirc)
2 Bagravei toaacuten dự baacuteo (Prediction) Coacute thể dự đoaacuten được hagravenh vi kết quả dựa trecircn caacutec hiện tượng -gt dự baacuteo
VD Dự baacuteo thời tiết động đấthellip
3 Bagravei toaacuten chẩn đoaacuten (Diagnoss) Xaacutec định caacutec lỗi caacutec bộ phận hỏng hoacutec của hệ thống dựa trecircn caacutec dữ liệu quan saacutet được
4 Bagravei toaacuten gỡ rối (Debugging) Mocirc tả caacutec phương phaacutep khắc phục hệ thống khi gặp sự cố
5 Bagravei toaacuten thiết kế Lựa chọn cấu higravenh caacutec đối tượng nhằm thoả matilden một số ragraveng buộc nagraveo đoacute
6 Giảng dạy Phần mềm dạy học coacute thể chuẩn đoaacuten vagrave sủa lỗi của học sinh trong quaacute trigravenh học tập
Để xaacutec định đuacuteng bagravei toaacuten magrave chuacuteng ta cần giải quyết thigrave phải trả lời đc một số cacircu hỏi
- cần hệ chuyecircn gia
Bước 2 thu thập tri thức lựa chọn cocircng cụ vagrave aacutep dụng
Trong bước thu thập tri thức vấn đề quan trọng lagrave lựa chọn chuyecircn gia những người magrave sẽ đoacuteng goacutep tri thức cho hệ thống Thocircng thường trong suốt quaacute trigravenh phaacutet triển thigrave chuyecircn gia được xem như một thagravenh viecircn của đội phaacutet triển
Hiện nay coacute rất nhiều cocircng cụ để xacircy dựng một hệ chuyecircn gia Phổ biến nhất lagrave JESS CLIPS vagrave OPS5
Bước 3 Thiết kế cơ sở tri thức thiết kế hệ thốngTri thức được biểu diễn trường minh trong cơ sở tri thức
Caacutec chuyecircn gia vagrave kỹ sư tri thức sẽ đối thoại với nhau bằng caacutec kỹ thuật đối thoại Suy diễn (SD) bảng Mocirc higravenh hoacutea SD quy nạp phacircn loại
Vấn đề bagraveo trigrave vagrave phaacutet triển
Caacutec hệ chuyecircn gia đogravei hỏi phải bảo trigrave vagrave phaacutet triển nhiều hơn so với caacutec hệ thống khaacutec Phải thường xuyecircn bổ sung tri thức mới vagrave thay đổi caacutec tri thức cũ để đổi mới hệ chuyecircn gia
Thu thập vagrave khắc phục lỗi do người sử dụng phaacutet hiện để kịp thời khắc phục những sai soacutet của hệ chuyecircn gia
75 Lợi iacutech vagrave hạn chế của caacutec hệ chuyecircn gia
Một số lợi iacutech chiacutenh
Thời gian trả lời hợp lyacute bằng hoặc nhanh hơn so với chuyecircn gia (người) để đi đến cugraveng một quyết định Hệ chuyecircn gia lagrave một hệ thống thời gian thực (real time system)
Khả năng trả lời với mức độ tinh thocircng bằng hoặc cao hơn so với chuyecircn gia (người) trong cugraveng lĩnh vực
Hệ chuyecircn gia giuacutep cho hiệu quả lagravem việc tăng bằng việc sử dụng tập caacutec luật một caacutech nhanh choacuteng magrave ko bị nhầm lẫn chuyecircn gia lagrave người coacute thể quecircn đi một số tri thức cơ sở lyacute luậ nhưng HCG thigrave ko
Quyết định của một người chuyecircn gia coacute thể bị thay đổi vagrave ko coacute tiacutenh thống nhất như quyết định của một hệ chuyecircn gia tạo ra
Hệ chuyecircn gia giuacutep cho người sử dụng coacute thể trau dồi sự hiểu biết trecircn lĩnh vuej cụ thể magrave noacute giải quyết hỗ trợ người ra quyết định coacute trigravenh độ như 1 chuyecircn gia trong quaacute trigravenh gia quyết định
Kiến thức của rất nhiều chuyecircn gia về một lĩnh vực nagraveo đoacute được đưa vagraveo hệ chuyecircn gia lagravem cho CSTT cuat HCG phong phuacute vagrave rộng lớn hơn rất nhiều
HCG giải thiacutech caacutec bước suy luận một caacutech dễ hiểu nhất quaacuten luacutec nagraveo cũng coacute thể sử dụng ko như chuyecircn gia con người
Hạn chế của caacutec hệ chuyecircn gia
Nhược điểm lớn nhất của hệ chuyecircn gia lagrave những yacute kiến chuyecircn mocircn thường rất khoacute matilde hoacutea vagrave giải neacuten
Hệ chuyecircn gia khocircng coacute khả năng tự học tự cập nhật kiến thức mới như caacutec chuyecircn gia magrave cần phải được matilde hoacutea lại khi noacute được cập nhật
Hệ chuyecircn gia khocircng thể nhận ra được vấn đề khocircng nằm trong miền kiến thức của hệ thống
Chương 8 Tri thức vagrave tiếp nhận
1 Bao gồm caacutec vấn đề
Dữ liệu thực tế đo lường hoặc quan saacutet coacute hoặc khocircng coacute bối cảnh
Thocircng tin dữ liệu được tổng hợp một caacutech hữu iacutech để giải quyết những khoacute khăn trong việc đưa ra quyết định
Tri thức bao gồm caacutec ứng dụng quy tắc thocircng tin hướng dẫn của người ra quyết định
2 Những caacutei nhigraven về tri thức
Đại diện lagravem thế nagraveo để diễn tả tri thức viacute dụ như một quyển saacutech khocircng phải lagrave tri thức nhưng noacute lại lagrave một đại diện của tri thức
Sản xuất tri thức lagrave một tập hơp của hagraveng tồn kho coacute thể được sản xuất cũng như mua lại
Tri thức lagrave 1 trong 6 trạng thaacutei của hệ thống
1Dữ liệu 2Thocircng tin 3Cấu truacutec thocircng tin 4Sự thấu hiểu 5Yacute kiến 6 Quyết định
3 Caacutec loại tri thức Phổ biến mocirc tả dữ liệu thocircng tin thủ tục mọi thứ lagravem như thế nagraveo lập luận chiacutenh saacutech hoặc caacutec quy tắc
4 Thu thập Tri thức hệ chuyecircn gia Hầu hết caacutec phương phaacutep đều bắt đầu với mocirc higravenh của caacutec taacutec vụ trong đoacute
hệ chuyecircn gia được xacircy dựng Trong đoacute mocirc tả về caacutec lĩnh vực được tạo ra Caacutec kỹ sư sử dụng caacutec mocirc higravenh giả thuyết vagrave nhận thức về quaacute trigravenh phacircn
tiacutech để gợi ra caacutech giải quyết vấn đề về tri thức từ caacutec chuyecircn gia
5 Caacutec chiều của thu thập tri thức KE- driven caacutec kỹ sư trao đổi trực tiếp với caacutec chuyecircn gia Expert-driven Caacutec chuyecircn gia trực tiếp đưa chuyecircn mocircn của họ vagraveo hệ
thống maacutey tiacutenh Machine-driven Sử dụng caacutec cocircng cụ suy luận để triacutech xuất tri thức từ một
tập caacutec viacute dụ
6 Kỹ thuật thu thập tri thức Trao đổi gồm 2 loại cơ bản lagrave coacute cấu truacutec(coacute kịch bản) vagrave khocircng coacute cấu
truacutec( đối thoại trực tiếp) Giao thức phacircn tiacutech bằng lời Khi caacutec chuyecircn gia thực hiện một cocircng việc
của họ thigrave một bản ghi về cocircng việc đoacute được thực hiện Caacutec kỹ sư sẽ xacircy dựng mocirc higravenh cho những gigrave được ghi lại trong bản ghi
Phương phaacutep sagraveng lọc caacutec chuyecircn gia so saacutenh caacutec nhoacutem liecircn tiếp trong ba đối tượng vagrave cho biết tại sao nhoacutem thứ hai lại khaacutec nhoacutem thứ ba
7 Thu thập tri thức từ nhiều nguồn Thu thập tri thức từ nhiều nguồn lagrave cần thiết để coacute được đầy đủ caacutec tri thức
cho một vấn đề quan điểm yacute kiến traacutei ngược nhau thường phaacutet sinh Phương phaacutep đồng thuận sẽ giuacutep giải quyết được vấn đề macircu thuẫn Kỹ thuật phacircn tiacutech Meta lagrave kỹ thuật được aacutep dụng trong caacutec trường hợp
khaacutec Caacutech tiếp cận bằng định lượng đogravei hỏi caacutec kỹ sư cần cacircn nhắc yếu tố đầu vagraveo của caacutec chuyecircn gia khaacutec nhau
8 Xaacutec nhận hợp lệ vagrave kiểm tra tri thức Một khi thu thập tri thức noacute phải được đaacutenh giaacute về khả năng sử dụng vagrave độ
chiacutenh xaacutec Hai vấn đề cụ thể lagrave hiệu lực của những kiến thức vagrave kiểm tra việc xacircy dựng cơ sở của tri thức
Cần xaacutec nhận xem liệu hệ thống coacute thể hoạt động ở mức độ tối thiểu khocircng
Xaacutec minh liecircn quan đến việc so saacutenh từng chi tiết kỹ thuật của hệ thống những gigrave đatilde được thực hiện cuối cugraveng
9 Một số caacutec biện phaacutep xaacutec nhận Độ chiacutenh xaacutec Khả năng thiacutech nghi Mức độ đầy đủ Bề rộng Độ sacircu Hiệu lực Tổng quan Chiacutenh xaacutec Hiện thực Độ tin cậy Tiacutenh hữu dụng Mức độ
Chương 9 Học maacutey
1 Logic mờ vagrave ngocircn ngữ mờ(Fuzzy Logic and Linguistic Ambiguity)
Ngocircn ngữ tự nhiecircn gồm những khaacutei niệm mơ hồ vagrave khocircng chiacutenh xaacutectruyền tải ngữ nghĩa thocircng qua tiacutenh xấp xỉkhocircng rotilde ragraveng
Những xấp xỉ nagravey giuacutep con người coacute thể truyền tải hết được yacute nghĩa nhưng maacutey thigrave khocircng hiểu
Lagravem sao biểu diễn caacutec tri thức sử dụng caacutec khaacutei niệm khocircng rotilde ragraveng(mờ) hoặc khocircng chiacutenh xaacutec
2 Khaacutei niệm cơ bản của logic mờ tập mờ lagrave những tập hợp khocircng coacute một giới hạn rotilde Mỗi phần tử của noacute chỉ
chứa một mức độ hagravem liecircn thuộc của từng phần tử Vigrave vậy tập mờ khocircng giống như tập cổ điển Tập mờ coacute thể kết hợp với nhau qua những luật mờ magrave đặc trưng cho những hagravenh động trạng thaacutei vagrave thuộc tiacutenh của logic mờ được tận dụng khi thực hiện một bộ điều khiển mờ
Logic mờ dựa trecircn yacute tưởng mỗi phần tử thuộc vagraveo một tập hợp ở một mức độ nagraveo đấy
Locircgic mờ cho pheacutep độ liecircn thuộc (microA )coacute giaacute trị trong khoảng (01) Locircgic mờ coacute thể được coi lagrave mặt ứng dụng của lyacute thuyết tập mờ để xử lyacute caacutec
giaacute trị trong thế giới thực cho caacutec bagravei toaacuten phức tạp
3 So saacutenh tiacutenh đuacuteng đắn logic mờ vagrave xaacutec suất Xaacutec suất thigrave đề cập đến khả năng xảy ra một biến cố hay một điều gigrave đoacute Logic mờ đề cập đến cấp độ magrave đặc tiacutenh ở hiện tại
o viacute dụ1 người coacute chiều cao 6 feet thigrave coacute cấp độ lagrave 05 về chiều cao
4 Ưu điểm của logic mờ Caacutech tiếp cận rất tự nhiecircnkhocircng phức tạp Coacute thể mocirc higravenh hoacutea caacutec hagravem phi tuyến tugravey yacute phức tạp
Coacute thể tận dụng được kinh nghiệm từ những chuyecircn gia hagraveng đầu trong mọi lĩnh vực
Logic mờ được xacircy dựng dựa trecircn ngocircn ngữ tự nhiecircnNền tảng của logic mờ lagrave dựa trecircn cơ sở giao tiếp của con người
5 Nhược điểm của logic mờ Trong 1 hệ thống phức tạpsử dụng logic mờ coacute thể trở thagravenh trở ngại cho
việc xaacutec thực độ tin cậy của hệ thống Cơ chế lập luận mờ khocircng thể học hỏi từ những lỗi sai
6 Mạng noron nhacircn tạo(ANN) Mạng noron nhacircn tạo lagrave một mocirc phỏng xử lyacute thocircng tinđược nghiecircn cứu ra
từ hệ thống thần kinh của sinh vậtgiống như bộ natildeo để xử lyacute thocircng tin ANNs lagrave chương trigravenh dựa trecircn maacutey tiacutenh đơn giản coacute chức năng lagrave một mocirc
higravenh bagravei toaacuten khocircng gian dựa trecircn thử nghiệm vagrave baacuteo lỗi
7 Học từ kinh nghiệm Tiến trigravenh Một mẫu dữ liệu được biểu diễn như một mạng lưới noronANN ldquodự
đoaacutenrdquo 1 đầu radự đoaacuten được so saacutenh với giaacute trị thực tế hoặc giaacute trị chiacutenh xaacutecNếu đoaacuten được chiacutenh xaacutec thigrave khocircng coacute hagravenh động nagraveo được thực hiện
Nếu dự đoaacuten sai ANN kiểm tra lại vagrave xaacutec định lại thocircng số để điều chỉnh Một mẫu dữ liệu khaacutec được biểu diễn vagrave quaacute trigravenh nagravey được lặp lại
8 Nguyecircn tắc cơ bản của cocircng nghệ nơron Caacutec yếu tố xử lyacute cơ bản trong hệ thống thần kinh của con người lagrave tế bagraveo
thần kinhMạng lưới của tế bagraveo nagravey lagrave liecircn kết với nhau nhận được thocircng tin từ caacutec cảm biến trong mắt taihellip
Thocircng tin nhận được bởi tế bagraveo thần kinh hoặc lagrave sẽ kiacutech thiacutech noacute(sẽ được chuyển qua 1 thocircng điệp dọc theo mạng lưới) hoặc lagrave sẽ ngăn cản noacute(ngăn cản dograveng thocircng tin)
Độ nhạy coacute thể thay đổi qua thời gian hoặc sau khi coacute được kinh nghiệm
9 Cấu truacutec mạng Một ANN gồm 3 lớp cơ bản
Lớp đầu vagraveo nhận dữ liệu Lớp becircn trong hoặc lagrave lớp ẩn xử lyacute dữ liệu Lớp đầu ra chuyển tiếp kết quả cuối cugraveng của mạng
10Mạng nơ ron Thường coacute nhiều đầu vagraveo mỗi đầu vagraveo với mức ảnh hưởng vagrave tầm quan
trọng riecircng của noacute Một đầu vagraveo quan trọng coacute thể được sử dụng để khuếch đại đầu ra caacutec hagravem trạng thaacutei tổng hợp caacutec trọng số của caacutec yếu tố
đầuvagraveo khaacutec nhauvagraveo một giaacute trị duy nhất Caacutec hagravem chuyển giao xử lyacute caacutec giaacute trị trạng thaacutei vagrave tạo đầu ra
11Huấn luyện mạng nơ ron Trong mocirc higravenh coacute giaacutem saacutetANN được đến so saacutenh dự đoaacuten của chiacutenh
noacute với thocircng tin phản hồi coacute chứa caacutec kết quả mong muốn ANN sẽ phải tigravem caacutech thay đổi caacutec tham số becircn trong củamigravenh (caacutec trọng số vagrave caacutec ngưỡng) để tạo necircn một aacutenh xạ coacute khả năng aacutenh xạcaacutec đầu vagraveo thagravenh caacutec đầu ra mong muốn Sự thay đổi nagravey được tiến hagravenh nhờ việc so saacutenh giữa đầu ra thực sự vagrave đầu ra mong muốn
Trong mocirc higravenh khocircng coacute giaacutem saacutetANN nhận được dữ liệu vagraveo nhưng khocircng phải coacute bất kỳ thocircng tin phản hồi về kết quả mong muốn
Phần lớn caacutec ứng dụng nằm trong vugraveng của caacutec bagravei toaacuten ước lượng như mocirc higravenh hoacuteathống kecirc neacuten lọc phacircn cụm
12Lợi iacutech Liecircn kết với mạng noron Traacutenh caacutech lập trigravenh tường minh Giảm nhu cầu của chuyecircn gia ANNs thigrave thiacutech nghi với caacutec yếu tố đầu vagraveo thay đổi Khocircng cần thiết cho cơ sở tri thức tinh chế ANNs coacute tiacutenh động vagrave cải thiện với việc sử dụng Coacute khả năng xử lyacute dữ liệu khocircng chiacutenh xaacutec hoặc khocircng đầy đủ Cho pheacutep tổng quaacutet hoacutea từ thocircng tin cụ thể Cho pheacutep thu thập cảm giaacutec thocircng thường vagraveo miền giải quyết vấn đề
13Hạn chế của việc liecircn kết với mạng noron ANNs khocircng thể giải thiacutech được suy luận Bản chất hộp đen thường khiến cho vấn đề traacutech nhiệm vagrave độ tin cậy phaacutet
sinh lagrave khoacute khăn Lặp đi lặp lại quaacute trigravenh huấn luyện rất tốn thời gian Nguồn lực caacutec nhagrave phacircn tiacutech vagrave thiết kế coacute tay nghề cao vẫn lagrave đaacuteng lo
ngại Cocircng nghệ ANN thuacutec đẩy hạn chế của phần cứng hiện tại ANN yecircu cầu phải coacute sự tin tưởng ở đầu ra
14Giới thiệu về thuật toaacuten di truyền Cũng như mạng lưới thần kinh caacutec thuật toaacuten di truyền được dựa trecircn lyacute
thuyết sinh học Thuật toaacuten di truyền tigravem thấy nguồn gốc của chuacuteng trong caacutec lyacute thuyết
tiến hoacutea của chọn lọc tự nhiecircn vagrave thiacutech ứng với biến đổi khiacute hậu Kết quả thuật toaacuten di truyền lagrave từ giao phối 2 caacute thể trong quần thế để tạo
ra con caacutei đocirci khi tốt hơn so với bậc cha mẹ của chuacuteng 15Caacutec thagravenh phần cơ bản của thuật toaacuten di truyền
Toaacuten tử chọn lọc Caacutec caacute thể tốt được chọn lọc để đưa vagraveo thế hệ sau Sự chọn lọc nagravey căn cứ vagraveo độ thiacutech nghi với mocirci trường của mỗi caacute thể
Toaacuten tử lai gheacutep (crossover) Hai caacute thể cha vagrave mẹ trao đổi caacutec gen với nhau để tạo ra caacute thể con
Toaacuten tử đột biến (mutation) Một caacute thể thay đổi một số gen để biến đổi thagravenh một caacute thể mớiTất cả caacutec toaacuten tử trecircn khi thực hiện đều mang tiacutenh ngẫu nhiecircn
16Quaacute trigravenh cơ bản của một thuật toaacuten di truyền Khởi tạo
Đaacutenh giaacute quần thể
Lựa chọn NST thiacutech hợp nhất vagrave loại bỏ NST yếu nhất
Quy trigravenh giao nhau vagrave cải thiện quần thể
đột biến tiến trigravenh để khaacutem phaacute ra NST mới
17Ưu nhược điểm của việc kết hợp với thuật toaacuten di truyền Kiacutech thước quần thể lagrave 1 yếu tố quan trọng trong tốc độ của việc tigravem
kiếmnhưng noacute tương đối dễ dagraveng để dự đoaacuten tốc độ nagravey Giao nhau hoặc đột biến lagrave khocircng necircn đc sử dụng quaacute thường xuyecircn Luocircn coacute được iacutet nhất 1 giải phaacutep hợp lyacute Necircn coacute thể aacutep dụng chuacuteng cho caacutec vấn đề magrave chuacuteng ta khocircng coacute hướng
về caacutech giải quyết Sức mạnh của thuật toaacuten xuất phaacutet từ khaacutei niệm đơn giảnkhocircng phải từ
một thủ tục thuật toaacuten phức tạp 18Tương lai của học maacutey
Mạng lưới thần kinh nhacircn tạo vượt quaacute năng lực của con người trong caacutec trường hợp bị cocirc lập
Về mặt lyacute thuyếtmột maacutey tiacutenh coacute thể xử lyacute dũ liệu nhanh hơn hagraveng triệu lần so với 1 con người
May mắn thay cho chuacuteng tacon người tốt hơn nhiều khi magrave coacute được dữ liệumaacutey tiacutenh khocircng coacute 1 số thứ như lagrave 5 giaacutec quan
CHƯƠNG 10 KHO DỮ LIỆU
1 Kho dữ liệu Kho dữ liệu lagrave tuyển tập caacutec cơ sở dữ liệu tiacutech hợp hướng chủ đề được
thiết kế để trợ giuacutep cho một hệ hỗ trợ quyết định
Theo John Ladley Cocircng nghệ kho dữ liệu lagrave tập caacutec phương phaacutep kỹ thuật vagrave caacutec cocircng cụ coacute thể kết hợp hỗ trợ nhau để cung cấp thocircng tin cho người sử dụng trecircn cơ sở tiacutech hợp từ nhiều nguồn dữ liệu nhiều mocirci trường khaacutec nhau
Kho dữ liệu thường rất lớn tới hagraveng trăm GB hay thậm chiacute hagraveng Terabyte
2 Kho dữ liệu vận hagravenh (ODS) Một kho dữ liệu vận hagravenh Aacutep dụng kỹ thuật kho dữ liệu vagraveo caacutec hệ xử
lyacute giao taacutec lưu trữ dữ liệu cho một ứng dụng đặc thugrave Noacute đưa vagraveo kho dữ liệu một dograveng caacutec dữ liệu thocirc được thiết kế
3 So saacutenh
Kho dữ liệu vận hagravenh Kho dữ liệu
Dữ liệu theo chủ đề Dữ liệu theo chủ đề
Dữ liệu tiacutech hợp Dữ liệu tiacutech hợp
Dữ liệu thay đổi Dữ liệu khocircng thay đổi
Dữ liệu được cập nhật khi thay đổi
Dữ liệu giữ nguyecircn
Chỉ coacute dữ liệu hiện tạiDữliệu hiện tại vagrave dữ liệu lịch sử
Chu kỳ lagravem tươi dữ liệu ngắn Chu kỳ lagravem tươi dữ liệu dagravei
Chỉ coacute dữ liệu chi tiết Dữ liệu chi tiết vagrave dữ liệu tổng kết
Dugraveng cho caacutec quyết định ngắn hạn
Dugraveng cho hoạch định dagravei hạn
4 Kho dữ liệu cục bộ (Data Mart - DM)
Kho dữ liệu cục bộ lagrave CSDL coacute những đặc điểm giống với kho dữ liệu nhưng với quy mocirc nhỏ hơn vagrave lưu trữ dữ liệu về một lĩnh vực một chuyecircn ngagravenh
Data mart phụ thuộc Chứa những dữ liệu được lấy từ DW vagrave những dữ liệu nagravey sẽ được triacutech lọc vagrave tinh chế tiacutech hợp lại ở mức cao hơn để phục vụ một chủ đề nhất định của Datamart
Data mart độc lập Khocircng giống như Datamart phụ thuộc Data mart độc lập được xacircy dựng trước DW vagrave dữ liệu được trực tiếp lấy từ caacutec nguồn khaacutec nhau
5 Siecircu dữ liệu Metadata lagrave dữ liệu để mocirc tả dữ liệu Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột
một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi Metadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu
6 Mocirci trường kho dữ liệu Hệ thống của tổ chức vagrave kho cung cấp dữ liệu để xacircy dựng kho dữ liệu Trong quaacute trigravenh chuyển dữ liệu từ caacutec nguồn khaacutec nhau dữ liệu coacute thể
được lagravem sạch hoặc chuyển đổi vagrave vigrave thế DW được xem như lagrave một chuẩn cho việc lưu trữ
Đồng thời siecircu dữ liệu được ghi lại Cuối cugraveng DW hoặc siecircu thị coacute thể được sử dụng để tạo ra một kho dữ
liệu ldquocaacute nhacircnrdquo 7 Caacutec đặc điểm của kho dữ liệu
Đặc điểm Mocirc tả
Hướng chủ đề - DL tổ chức theo caacutech thức người dugraveng tham chiếu
Tiacutech hợp - Dữ liệu ldquosạchrdquo loại bỏ tiacutenh thiếu nhất quaacuten
Khocircng thay đổi - DL ldquochỉ đọcrdquo người dugraveng khocircng thay đổi được
Chuỗi thời gian - DL lagrave chuỗi thời gian khocircng phải lagrave trạng thaacutei hiện tại
Được tổng kết - DL vận hagravenhthao taacutec khi cần thiết
được kết hợp lại thagravenh dạng coacute thể dugraveng được cho quyết định
Kiacutech cỡ lớn hơn - Lưu giữ theo chuỗi thời gian tức lagrave giữ lại nhiều DL
Khocircng được chuẩn hoacutea - Coacute thể dư thừa DLSiecircu dữ liệu - Dữ liệu của dữ liệu được lưu trữNguồn dữ liệu - DL vận hagravenh (caacutec hệ sẵn coacute) cugraveng
với caacutec nguồn ngoagravei 8 Kho dữ liệu hướng chủ đề
Hướng chủ để coacute nghĩa lagrave kho dữ liệu được tổ chức xung quanh caacutec chủ đề chiacutenh như khaacutech hagraveng sản phẩm sản xuất Tập trung vagraveo việc mocirc higravenh hoacutea vagrave phacircn tiacutech dữ liệu cho caacutec nhagrave ra quyết định magrave khocircng tập trung vagraveo caacutec xử lyacute thocircng thường Cung cấp cho người dugraveng một khung nhigraven toagraven vẹn đơn giản vagrave đầy đủ về caacutec sự kiện quanh caacutec chủ đề
9 Dữ liệu trong DW được tiacutech hợp Dữ liệu trong kho dữ liệu được xacircy dựng bằng caacutech tổng hợp dữ liệu từ
nhiều nguồn khaacutec nhau vagrave caacutec nguồn coacute tổ chức khaacutec nhau Cơ sở dữ liệu caacutec file excel caacutec flat file hoặc caacutec raw file Khi đưa vagraveo kho dữ liệu caacutec dữ liệu được lagravem sạch vagrave tiacutech hợp dữ liệu nhằm đảm bảo tiacutenh nhất quaacuten của dữ liệu
10Kiến truacutec kho dữ liệu Tầng cơ sở dữ liệu hoạt động Tầng truy xuất thocircng tin Tầng truy xuất dữ liệu Tầng siecircu dữ liệu Tầng quản lyacute tiến trigravenh Tầng thocircng điệp của ứng dụng Tầng vật liacute của kho dữ liệu Tầng trigravenh diễn dữ liệu
11Higravenh trạng kho dữ liệu Kho dữ liệu ảo - người dugraveng cuối coacute thể truy cập trực tiếp đến kho dữ liệu
sử dụng caacutec cocircng cụ cho pheacutep ở tầng truy xuất dữ liệu Kho dữ liệu trung tacircm-1 cơ sở dữ liệu vật lyacute chứa tất cả dữ liệu cho một
vugraveng chuyecircn dụng nagraveo đoacute
Kho dữ liệu phacircn taacuten- Thagravenh phần được phacircn taacuten qua nhiều hệ cơ sở dữ liệu vật lyacute
12METADATA- Siecircu dữ liệu Định nghĩa Siecircu dữ liệu lagrave dữ liệu về dữ liệu Lagrave 1 lưu trữ dugraveng để
Miecircu tả kho dữ liệu tổng thể Nhận dạng kiểu kho dữ liệu Quản liacute quaacute trigravenh tiacutech hợp dữ liệu Quản liacute quaacute trigravenh cập nhật kho dữ liệu Quản liacute bảo mật
Lagrave chigravea khoacutea quyết định sự thagravenh cocircng của kho dữ liệu luocircn được thay đổi vagrave cập nhật theo sự phaacutet triển của kho dữ liệu
Dugraveng để quản liacute điều khiển kho dữ liệu Sự ra đời của kho dữ liệu như 1 cấu truacutec hỗ trợ ra quyết định siecircu dữ liệu
được xem như nguồn tagravei nguyecircn dữ liệu Siecircu dữ liệu lagrave trừu tượng Chuacuteng lagrave dữ liệu bậc cao cung cấp mocirc tả ngắn
gọn caacutec dữ liệu bậc thấp hơn 13Hoạt động của Siecircu dữ liệu
Siecircu dữ liệu rất cần thiết trong việc chuyển hoacutea thocircng tin trở thagravenh tri thức Lagrave chigravea khoacutea giuacutep chuacuteng ta xử lyacute được dữ liệu thocirc Viacute dụ một dograveng dữ liệu baacuten hagraveng 1023 K596 11121 agraveNoacute sẽ khocircng coacute nghĩa gigrave cho đến khi chuacuteng ta đưa vagraveo siecircu dữ liệu (thư
mục chứa dữ liệu) agrave cửa hagraveng 1023 sản phẩm K596 vagrave số tiền baacuten được lagrave 11121 đocirc la
14Sự cần thiết phải nhất quaacuten trong kho dữ liệu Kho dữ liệu được xacircy dựng cho lợi iacutech của những nhagrave phacircn tiacutech kinh
doanh caacutec nhagrave quản trị cho tất cả caacutec khu vực chức năng Trong cơ sở dữ liệu riecircng caacutec khu vực khaacutec nhau coacute thể định nghĩa vagrave lưu
trữ dữ liệu thocircng qua phiecircn bản của chiacutenh noacute Khi dữ liệu được lấy từ những vugraveng khaacutec nhau đoacute vagrave được đặt vagraveo kho dữ
liệu Việc chuyển đổi vagrave lagravem sạch caacutec tiến trigravenh sẽ đảm bảo noacute lagrave duy nhất được tiacutech hợp tại một mức của tổ chức
15Ragrave soaacutet lại dữ liệu ndash Thực thi siecircu dữ liệu
Bất kể cấu truacutec tự nhiecircn của 1 cacircu truy vấn thế nagraveo thigrave caacutec thagravenh phần của siecircu dữ liệu rất quan trọng đối với người ra quyết định
Bảng thuộc tiacutenh khoacutea được lưu trữ bởi kho dữ liệu Tập hợp dữ liệu được lấy từ đacircu Những chuyển đổi nagraveo được thực thi với việc lagravem sạch
16Siecircu dữ liệu lagrave gigrave Metadata - lagrave thocircng tin mocirc tả nội dung của cơ sở dữ liệu (CSDL) Metadata baacuteo cho người dugraveng biết thời gian cập nhật sau cugraveng của dữ liệu
định dạng vagrave mục điacutech sử dụng của noacute Những thocircng tin nagravey coacute thể hướng dẫn người dugraveng duyệt qua CSDL vagrave
giuacutep họ hiểu được yacute nghĩa vagrave ngữ cảnh của dữ liệu Trong CSDL metadata lagrave caacutec dạng biểu diễn khaacutec nhau của caacutec đối tượng
trong CSDL Trong CSDL quan hệ metadata lagrave caacutec định nghĩa của bảng cột CSDL
view vagrave nhiều đối tượng khaacutec Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột
một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi -gtMetadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu
Bảng chuyển đổi Ghi lại những chuyển đổi đatilde được thực hiện
Lịch sử thực thi Ghi lại những dữ liệu đatilde được
phacircn tiacutech
Higravenh thaacutei kết nốiGhi lại những dữ liệu được kết nối vagrave tần suất
17Aacutenh xạ thocircng thường của siecircu dữ liệu Bản ghi aacutenh xạ chuyển đổi bao gồm
Định danh của nguồn gốc Chuyển đổi thuộc tiacutenh Chuyển đổi thuộc tiacutenh vật lyacute Matilde hoacutea tham chiếu bảng chuyển đổi Đổi tecircn Đổi khoacutea Gaacuten giaacute trị cho thuộc tiacutenh mặc định Chọn logic cho caacutec nguồn nhiều giaacute trị Đổi thuật toaacuten
18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để
phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai
lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave
tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec
Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm
Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo
19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua
caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau
SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được
Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra
một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức
Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ
Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ
Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech
CHƯƠNG 11 KHAI PHAacute DỮ LIỆU
1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn
ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993
Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng
2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd
1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều
2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP
3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn
4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng
5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server
6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo
7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động
8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời
9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều
10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện
11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech
12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP
3 Xử lyacute phacircn tiacutech trực tuyến OLAP
MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave
dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu
ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave
thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu
HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave
ROLAP4 Khai phaacute dữ liệu
Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh
khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn
Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan
5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp
6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại
Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp
Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec
Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt
Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra
Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh
vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho
Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec
Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm
Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục
Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng
gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp
Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn
Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec
Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper
Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2
Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25
Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước
Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng
Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện
trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp
Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute
độ hỗ trợ ge ngưỡng minsup
độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan
Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn
Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết
Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu
MOLAP ROLAP HOLAP
Lưu trữ dữ liệu cơ sở
Khối Bảng quan hệ Bảng quan hệ
Lưu trữ thocircng tin tổng hợp
Khối Bảng quan hệ Khối
Hiệu suất thực hiện truy vấn
Nhanh nhất Chậm nhất Nhanh
Tiecircu thụ khocircng gian lưu trữ
Nhiều Thấp Trung bigravenh
Chi phiacute bảo trigrave Cao Thấp Trung bigravenh
Giao diện người dugraveng trong ES
Thiết kế giao diện người dugraveng tập trung vagraveo caacutec yếu tố như dễ dagraveng sử dụngcoacute độ tin cậy cao giảm tải những khoacute khăn khi sử dụng
Thiết kế necircn coacute một số tương taacutec (đầu vagraveo kiểm soaacutet vagrave truy vấn)
Cấu tạo giao diện người dugraveng gồm coacute magraven higravenh cảm ứng bagraven phiacutem buacutet saacuteng lệnh thoại caacutec phiacutem chuyecircn dụng
Cơ sở tri thức (Knowledge Base)
Chứa đựng caacutec tri thức cụ thể miền thu được từ caacutec chuyecircn gia miền
Coacute thể chứa caacutec mocirc tả caacutec hagravenh vi giải quyết vấn đề caacutec ragraveng buộc caacutec heuristics
Thagravenh cocircng của một ES dựa trecircn tiacutenh đầy đủ vagrave tiacutenh chiacutenh xaacutec của cơ sở tri thức
Mocirc tơ suy diễn (Inference Engine)
Ở đacircy tri thức được đặt để sử dụng tạo ra caacutec giải phaacutep để giải quyết vấn đề
Mocirc tơ nagravey coacute khả năng thực hiện diễn dịch hoặc suy diễn dựa trecircn caacutec luật hay caacutec caacutec sự kiện
Đồng thời cũng coacute khả năng sử dụng caacutec suy diễn mờ hay khocircng chiacutenh xaacutec dựa trecircn xaacutec suất hay aacutenh xạ mẫu
Vograveng điều khiển suy diễn
1 Aacutenh xạ caacutec luật với caacutec sự kiện đatilde được cho
2 Chọn luật để thực hiện
3 Thực hiện luật bằng caacutech thecircm caacutec sự kiện được suy diễn ra vagraveo bộ nhớ lagravem việc
Chuỗi suy diễn (Chaining)
Suy diễn tiến (forward chaining) maacutey suy diễn bắt đầu từ dữ liệu ban đầu vagrave thực hiện việc suy luận để đưa ra caacutec kết luận cuối cugraveng
Suy diễn lugravei (backward chaining) maacutey suy diễn bắt đầu từ dữ liệu điacutech vagrave tigravem ra tri thức hỗ trợ cho dữ liệu điacutech đoacute
Viacute dụ suy diễn lugravei
R1 Nếu coacute A vagrave B thigrave suy ra coacute D
R2 Nếu coacute B thigrave suy ra coacute C
R3 Nếu coacute C vagrave D thigrave suy ra coacute E
Ta coacute E ta xem trong 3 luật R1 R2 R3 luật nagraveo coacute E ta thấy R3 chứa E đồng thời chứa C vagrave D Xeacutet tiếp trong 2 luật R1 R2 luật nagraveo chứa C vagrave D R2 chứa C R3 chứa D Từ đoacute ta coacute được caacutec tri thức hỗ trợ suy diễn vagrave kết luận lagrave nếu coacute A vagrave B thigrave sẽ coacute E Hay nếu A vagrave B đuacuteng thigrave sẽ coacute E
Viacute dụ suy diễn tiến
Giả sử coacute tập chứa 3 luật sau
R1 Nếu coacute A vagrave B thigrave suy ra coacute D
R2 Nếu coacute B thigrave suy ra coacute C
R3 Nếu coacute C vagrave D thigrave suy ra coacute E
Nếu ta coacute A vagrave B thigrave chuacuteng ta suy ra được D từ R1 vagrave suy ra C từ R2 Với D vagrave C đatilde được suy ra ở trecircn giờ chuacuteng ta suy ra được E từ R3
Viacute dụ thực tế
Giả sử muốn biết magraveu của một con vật nuocirci tecircn lagrave Fred biết rằng noacute kecircu ộp ộp vagrave ăn ruồi
Coacute tập 4 luật ban đầu như sau
R1 Nếu X kecircu ộp ộp vagrave ăn ruồi thigrave X lagrave con ếch
R2 Nếu X kecircu chiecircm chiếp vagrave biết hoacutet thigrave X lagrave con chim
R3 Nếu X lagrave con ếch thigrave X coacute magraveu xanh
R4 Nếu X lagrave con chim thigrave X coacute magraveu vagraveng
74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia
Expert system shells lagrave một tập caacutec goacutei phần mềm vagrave caacutec cocircng cụ dugraveng để phaacutet triển caacutec hệ chuyecircn gia
Những Expert system shells đầu tiecircn thường rất rườm ragrave Mặc dugrave vậy noacute vẫn giuacutep cho người sử dụng sẽ khocircng phải bắt đầu lại từ đầu khi xacircy dựng một hệ chuyecircn gia mới
Những shell hiện đại bao gồm hai mocirc-đun chiacutenh lagrave cocircng cụ xacircy dựng một tập quy tắc vagrave mocirc tơ suy diễn
Xacircy dựng hệ chuyecircn gia
Bước 1 xacircy dựng mocirc higravenh bagravei toaacuten xaacutec định vấn đề nhiệm vụ magrave hệ thống sẽ thực hiện Caacutec dạng bagravei toaacuten cần hệ chuyecircn gia
Bagravei toaacuten diễn giải (InterPretation)
Bagravei toaacuten dự baacuteo (Prediction)
Bagravei toaacuten chuẩn đoaacuten (Diagnose)
Bagravei toaacuten gỡ rối (Debugging)
Bagravei toaacuten thiết kế
Tương tự như một dự aacuten phần mềm để xacircy dựng một hệ chuyecircn gia cần phải coacute caacutec yếu tố về nhacircn lực tagravei nguyecircn vagrave thời gian Những yếu tố nagravey ảnh hưởng đến giaacute thah của một hệ chuyecircn giaTrong phần nagravey cacircu hỏi thường được đặt ra lagrave tại sao cần phải xacircy dựng một hệ chuyecircn giaTrước khi bắt đầu phải xaacute định rotilde bagravei toaacuten đạt ra lagrave jiAi lagrave chuyecircn giaAi lagrave người sử dụng
1 Diễn giải (InterPretation) Nghiecircn cứu 1 vấn đề -gt Dựa trecircn những biểu hiện thuộc tiacutenh đặc trưng becircn ngoagravei -gt Tư vấn
(hoặc đưa ra kết luận hay mocirc tả dễ hiểu từ tập dữ liệu thocirc)
2 Bagravei toaacuten dự baacuteo (Prediction) Coacute thể dự đoaacuten được hagravenh vi kết quả dựa trecircn caacutec hiện tượng -gt dự baacuteo
VD Dự baacuteo thời tiết động đấthellip
3 Bagravei toaacuten chẩn đoaacuten (Diagnoss) Xaacutec định caacutec lỗi caacutec bộ phận hỏng hoacutec của hệ thống dựa trecircn caacutec dữ liệu quan saacutet được
4 Bagravei toaacuten gỡ rối (Debugging) Mocirc tả caacutec phương phaacutep khắc phục hệ thống khi gặp sự cố
5 Bagravei toaacuten thiết kế Lựa chọn cấu higravenh caacutec đối tượng nhằm thoả matilden một số ragraveng buộc nagraveo đoacute
6 Giảng dạy Phần mềm dạy học coacute thể chuẩn đoaacuten vagrave sủa lỗi của học sinh trong quaacute trigravenh học tập
Để xaacutec định đuacuteng bagravei toaacuten magrave chuacuteng ta cần giải quyết thigrave phải trả lời đc một số cacircu hỏi
- cần hệ chuyecircn gia
Bước 2 thu thập tri thức lựa chọn cocircng cụ vagrave aacutep dụng
Trong bước thu thập tri thức vấn đề quan trọng lagrave lựa chọn chuyecircn gia những người magrave sẽ đoacuteng goacutep tri thức cho hệ thống Thocircng thường trong suốt quaacute trigravenh phaacutet triển thigrave chuyecircn gia được xem như một thagravenh viecircn của đội phaacutet triển
Hiện nay coacute rất nhiều cocircng cụ để xacircy dựng một hệ chuyecircn gia Phổ biến nhất lagrave JESS CLIPS vagrave OPS5
Bước 3 Thiết kế cơ sở tri thức thiết kế hệ thốngTri thức được biểu diễn trường minh trong cơ sở tri thức
Caacutec chuyecircn gia vagrave kỹ sư tri thức sẽ đối thoại với nhau bằng caacutec kỹ thuật đối thoại Suy diễn (SD) bảng Mocirc higravenh hoacutea SD quy nạp phacircn loại
Vấn đề bagraveo trigrave vagrave phaacutet triển
Caacutec hệ chuyecircn gia đogravei hỏi phải bảo trigrave vagrave phaacutet triển nhiều hơn so với caacutec hệ thống khaacutec Phải thường xuyecircn bổ sung tri thức mới vagrave thay đổi caacutec tri thức cũ để đổi mới hệ chuyecircn gia
Thu thập vagrave khắc phục lỗi do người sử dụng phaacutet hiện để kịp thời khắc phục những sai soacutet của hệ chuyecircn gia
75 Lợi iacutech vagrave hạn chế của caacutec hệ chuyecircn gia
Một số lợi iacutech chiacutenh
Thời gian trả lời hợp lyacute bằng hoặc nhanh hơn so với chuyecircn gia (người) để đi đến cugraveng một quyết định Hệ chuyecircn gia lagrave một hệ thống thời gian thực (real time system)
Khả năng trả lời với mức độ tinh thocircng bằng hoặc cao hơn so với chuyecircn gia (người) trong cugraveng lĩnh vực
Hệ chuyecircn gia giuacutep cho hiệu quả lagravem việc tăng bằng việc sử dụng tập caacutec luật một caacutech nhanh choacuteng magrave ko bị nhầm lẫn chuyecircn gia lagrave người coacute thể quecircn đi một số tri thức cơ sở lyacute luậ nhưng HCG thigrave ko
Quyết định của một người chuyecircn gia coacute thể bị thay đổi vagrave ko coacute tiacutenh thống nhất như quyết định của một hệ chuyecircn gia tạo ra
Hệ chuyecircn gia giuacutep cho người sử dụng coacute thể trau dồi sự hiểu biết trecircn lĩnh vuej cụ thể magrave noacute giải quyết hỗ trợ người ra quyết định coacute trigravenh độ như 1 chuyecircn gia trong quaacute trigravenh gia quyết định
Kiến thức của rất nhiều chuyecircn gia về một lĩnh vực nagraveo đoacute được đưa vagraveo hệ chuyecircn gia lagravem cho CSTT cuat HCG phong phuacute vagrave rộng lớn hơn rất nhiều
HCG giải thiacutech caacutec bước suy luận một caacutech dễ hiểu nhất quaacuten luacutec nagraveo cũng coacute thể sử dụng ko như chuyecircn gia con người
Hạn chế của caacutec hệ chuyecircn gia
Nhược điểm lớn nhất của hệ chuyecircn gia lagrave những yacute kiến chuyecircn mocircn thường rất khoacute matilde hoacutea vagrave giải neacuten
Hệ chuyecircn gia khocircng coacute khả năng tự học tự cập nhật kiến thức mới như caacutec chuyecircn gia magrave cần phải được matilde hoacutea lại khi noacute được cập nhật
Hệ chuyecircn gia khocircng thể nhận ra được vấn đề khocircng nằm trong miền kiến thức của hệ thống
Chương 8 Tri thức vagrave tiếp nhận
1 Bao gồm caacutec vấn đề
Dữ liệu thực tế đo lường hoặc quan saacutet coacute hoặc khocircng coacute bối cảnh
Thocircng tin dữ liệu được tổng hợp một caacutech hữu iacutech để giải quyết những khoacute khăn trong việc đưa ra quyết định
Tri thức bao gồm caacutec ứng dụng quy tắc thocircng tin hướng dẫn của người ra quyết định
2 Những caacutei nhigraven về tri thức
Đại diện lagravem thế nagraveo để diễn tả tri thức viacute dụ như một quyển saacutech khocircng phải lagrave tri thức nhưng noacute lại lagrave một đại diện của tri thức
Sản xuất tri thức lagrave một tập hơp của hagraveng tồn kho coacute thể được sản xuất cũng như mua lại
Tri thức lagrave 1 trong 6 trạng thaacutei của hệ thống
1Dữ liệu 2Thocircng tin 3Cấu truacutec thocircng tin 4Sự thấu hiểu 5Yacute kiến 6 Quyết định
3 Caacutec loại tri thức Phổ biến mocirc tả dữ liệu thocircng tin thủ tục mọi thứ lagravem như thế nagraveo lập luận chiacutenh saacutech hoặc caacutec quy tắc
4 Thu thập Tri thức hệ chuyecircn gia Hầu hết caacutec phương phaacutep đều bắt đầu với mocirc higravenh của caacutec taacutec vụ trong đoacute
hệ chuyecircn gia được xacircy dựng Trong đoacute mocirc tả về caacutec lĩnh vực được tạo ra Caacutec kỹ sư sử dụng caacutec mocirc higravenh giả thuyết vagrave nhận thức về quaacute trigravenh phacircn
tiacutech để gợi ra caacutech giải quyết vấn đề về tri thức từ caacutec chuyecircn gia
5 Caacutec chiều của thu thập tri thức KE- driven caacutec kỹ sư trao đổi trực tiếp với caacutec chuyecircn gia Expert-driven Caacutec chuyecircn gia trực tiếp đưa chuyecircn mocircn của họ vagraveo hệ
thống maacutey tiacutenh Machine-driven Sử dụng caacutec cocircng cụ suy luận để triacutech xuất tri thức từ một
tập caacutec viacute dụ
6 Kỹ thuật thu thập tri thức Trao đổi gồm 2 loại cơ bản lagrave coacute cấu truacutec(coacute kịch bản) vagrave khocircng coacute cấu
truacutec( đối thoại trực tiếp) Giao thức phacircn tiacutech bằng lời Khi caacutec chuyecircn gia thực hiện một cocircng việc
của họ thigrave một bản ghi về cocircng việc đoacute được thực hiện Caacutec kỹ sư sẽ xacircy dựng mocirc higravenh cho những gigrave được ghi lại trong bản ghi
Phương phaacutep sagraveng lọc caacutec chuyecircn gia so saacutenh caacutec nhoacutem liecircn tiếp trong ba đối tượng vagrave cho biết tại sao nhoacutem thứ hai lại khaacutec nhoacutem thứ ba
7 Thu thập tri thức từ nhiều nguồn Thu thập tri thức từ nhiều nguồn lagrave cần thiết để coacute được đầy đủ caacutec tri thức
cho một vấn đề quan điểm yacute kiến traacutei ngược nhau thường phaacutet sinh Phương phaacutep đồng thuận sẽ giuacutep giải quyết được vấn đề macircu thuẫn Kỹ thuật phacircn tiacutech Meta lagrave kỹ thuật được aacutep dụng trong caacutec trường hợp
khaacutec Caacutech tiếp cận bằng định lượng đogravei hỏi caacutec kỹ sư cần cacircn nhắc yếu tố đầu vagraveo của caacutec chuyecircn gia khaacutec nhau
8 Xaacutec nhận hợp lệ vagrave kiểm tra tri thức Một khi thu thập tri thức noacute phải được đaacutenh giaacute về khả năng sử dụng vagrave độ
chiacutenh xaacutec Hai vấn đề cụ thể lagrave hiệu lực của những kiến thức vagrave kiểm tra việc xacircy dựng cơ sở của tri thức
Cần xaacutec nhận xem liệu hệ thống coacute thể hoạt động ở mức độ tối thiểu khocircng
Xaacutec minh liecircn quan đến việc so saacutenh từng chi tiết kỹ thuật của hệ thống những gigrave đatilde được thực hiện cuối cugraveng
9 Một số caacutec biện phaacutep xaacutec nhận Độ chiacutenh xaacutec Khả năng thiacutech nghi Mức độ đầy đủ Bề rộng Độ sacircu Hiệu lực Tổng quan Chiacutenh xaacutec Hiện thực Độ tin cậy Tiacutenh hữu dụng Mức độ
Chương 9 Học maacutey
1 Logic mờ vagrave ngocircn ngữ mờ(Fuzzy Logic and Linguistic Ambiguity)
Ngocircn ngữ tự nhiecircn gồm những khaacutei niệm mơ hồ vagrave khocircng chiacutenh xaacutectruyền tải ngữ nghĩa thocircng qua tiacutenh xấp xỉkhocircng rotilde ragraveng
Những xấp xỉ nagravey giuacutep con người coacute thể truyền tải hết được yacute nghĩa nhưng maacutey thigrave khocircng hiểu
Lagravem sao biểu diễn caacutec tri thức sử dụng caacutec khaacutei niệm khocircng rotilde ragraveng(mờ) hoặc khocircng chiacutenh xaacutec
2 Khaacutei niệm cơ bản của logic mờ tập mờ lagrave những tập hợp khocircng coacute một giới hạn rotilde Mỗi phần tử của noacute chỉ
chứa một mức độ hagravem liecircn thuộc của từng phần tử Vigrave vậy tập mờ khocircng giống như tập cổ điển Tập mờ coacute thể kết hợp với nhau qua những luật mờ magrave đặc trưng cho những hagravenh động trạng thaacutei vagrave thuộc tiacutenh của logic mờ được tận dụng khi thực hiện một bộ điều khiển mờ
Logic mờ dựa trecircn yacute tưởng mỗi phần tử thuộc vagraveo một tập hợp ở một mức độ nagraveo đấy
Locircgic mờ cho pheacutep độ liecircn thuộc (microA )coacute giaacute trị trong khoảng (01) Locircgic mờ coacute thể được coi lagrave mặt ứng dụng của lyacute thuyết tập mờ để xử lyacute caacutec
giaacute trị trong thế giới thực cho caacutec bagravei toaacuten phức tạp
3 So saacutenh tiacutenh đuacuteng đắn logic mờ vagrave xaacutec suất Xaacutec suất thigrave đề cập đến khả năng xảy ra một biến cố hay một điều gigrave đoacute Logic mờ đề cập đến cấp độ magrave đặc tiacutenh ở hiện tại
o viacute dụ1 người coacute chiều cao 6 feet thigrave coacute cấp độ lagrave 05 về chiều cao
4 Ưu điểm của logic mờ Caacutech tiếp cận rất tự nhiecircnkhocircng phức tạp Coacute thể mocirc higravenh hoacutea caacutec hagravem phi tuyến tugravey yacute phức tạp
Coacute thể tận dụng được kinh nghiệm từ những chuyecircn gia hagraveng đầu trong mọi lĩnh vực
Logic mờ được xacircy dựng dựa trecircn ngocircn ngữ tự nhiecircnNền tảng của logic mờ lagrave dựa trecircn cơ sở giao tiếp của con người
5 Nhược điểm của logic mờ Trong 1 hệ thống phức tạpsử dụng logic mờ coacute thể trở thagravenh trở ngại cho
việc xaacutec thực độ tin cậy của hệ thống Cơ chế lập luận mờ khocircng thể học hỏi từ những lỗi sai
6 Mạng noron nhacircn tạo(ANN) Mạng noron nhacircn tạo lagrave một mocirc phỏng xử lyacute thocircng tinđược nghiecircn cứu ra
từ hệ thống thần kinh của sinh vậtgiống như bộ natildeo để xử lyacute thocircng tin ANNs lagrave chương trigravenh dựa trecircn maacutey tiacutenh đơn giản coacute chức năng lagrave một mocirc
higravenh bagravei toaacuten khocircng gian dựa trecircn thử nghiệm vagrave baacuteo lỗi
7 Học từ kinh nghiệm Tiến trigravenh Một mẫu dữ liệu được biểu diễn như một mạng lưới noronANN ldquodự
đoaacutenrdquo 1 đầu radự đoaacuten được so saacutenh với giaacute trị thực tế hoặc giaacute trị chiacutenh xaacutecNếu đoaacuten được chiacutenh xaacutec thigrave khocircng coacute hagravenh động nagraveo được thực hiện
Nếu dự đoaacuten sai ANN kiểm tra lại vagrave xaacutec định lại thocircng số để điều chỉnh Một mẫu dữ liệu khaacutec được biểu diễn vagrave quaacute trigravenh nagravey được lặp lại
8 Nguyecircn tắc cơ bản của cocircng nghệ nơron Caacutec yếu tố xử lyacute cơ bản trong hệ thống thần kinh của con người lagrave tế bagraveo
thần kinhMạng lưới của tế bagraveo nagravey lagrave liecircn kết với nhau nhận được thocircng tin từ caacutec cảm biến trong mắt taihellip
Thocircng tin nhận được bởi tế bagraveo thần kinh hoặc lagrave sẽ kiacutech thiacutech noacute(sẽ được chuyển qua 1 thocircng điệp dọc theo mạng lưới) hoặc lagrave sẽ ngăn cản noacute(ngăn cản dograveng thocircng tin)
Độ nhạy coacute thể thay đổi qua thời gian hoặc sau khi coacute được kinh nghiệm
9 Cấu truacutec mạng Một ANN gồm 3 lớp cơ bản
Lớp đầu vagraveo nhận dữ liệu Lớp becircn trong hoặc lagrave lớp ẩn xử lyacute dữ liệu Lớp đầu ra chuyển tiếp kết quả cuối cugraveng của mạng
10Mạng nơ ron Thường coacute nhiều đầu vagraveo mỗi đầu vagraveo với mức ảnh hưởng vagrave tầm quan
trọng riecircng của noacute Một đầu vagraveo quan trọng coacute thể được sử dụng để khuếch đại đầu ra caacutec hagravem trạng thaacutei tổng hợp caacutec trọng số của caacutec yếu tố
đầuvagraveo khaacutec nhauvagraveo một giaacute trị duy nhất Caacutec hagravem chuyển giao xử lyacute caacutec giaacute trị trạng thaacutei vagrave tạo đầu ra
11Huấn luyện mạng nơ ron Trong mocirc higravenh coacute giaacutem saacutetANN được đến so saacutenh dự đoaacuten của chiacutenh
noacute với thocircng tin phản hồi coacute chứa caacutec kết quả mong muốn ANN sẽ phải tigravem caacutech thay đổi caacutec tham số becircn trong củamigravenh (caacutec trọng số vagrave caacutec ngưỡng) để tạo necircn một aacutenh xạ coacute khả năng aacutenh xạcaacutec đầu vagraveo thagravenh caacutec đầu ra mong muốn Sự thay đổi nagravey được tiến hagravenh nhờ việc so saacutenh giữa đầu ra thực sự vagrave đầu ra mong muốn
Trong mocirc higravenh khocircng coacute giaacutem saacutetANN nhận được dữ liệu vagraveo nhưng khocircng phải coacute bất kỳ thocircng tin phản hồi về kết quả mong muốn
Phần lớn caacutec ứng dụng nằm trong vugraveng của caacutec bagravei toaacuten ước lượng như mocirc higravenh hoacuteathống kecirc neacuten lọc phacircn cụm
12Lợi iacutech Liecircn kết với mạng noron Traacutenh caacutech lập trigravenh tường minh Giảm nhu cầu của chuyecircn gia ANNs thigrave thiacutech nghi với caacutec yếu tố đầu vagraveo thay đổi Khocircng cần thiết cho cơ sở tri thức tinh chế ANNs coacute tiacutenh động vagrave cải thiện với việc sử dụng Coacute khả năng xử lyacute dữ liệu khocircng chiacutenh xaacutec hoặc khocircng đầy đủ Cho pheacutep tổng quaacutet hoacutea từ thocircng tin cụ thể Cho pheacutep thu thập cảm giaacutec thocircng thường vagraveo miền giải quyết vấn đề
13Hạn chế của việc liecircn kết với mạng noron ANNs khocircng thể giải thiacutech được suy luận Bản chất hộp đen thường khiến cho vấn đề traacutech nhiệm vagrave độ tin cậy phaacutet
sinh lagrave khoacute khăn Lặp đi lặp lại quaacute trigravenh huấn luyện rất tốn thời gian Nguồn lực caacutec nhagrave phacircn tiacutech vagrave thiết kế coacute tay nghề cao vẫn lagrave đaacuteng lo
ngại Cocircng nghệ ANN thuacutec đẩy hạn chế của phần cứng hiện tại ANN yecircu cầu phải coacute sự tin tưởng ở đầu ra
14Giới thiệu về thuật toaacuten di truyền Cũng như mạng lưới thần kinh caacutec thuật toaacuten di truyền được dựa trecircn lyacute
thuyết sinh học Thuật toaacuten di truyền tigravem thấy nguồn gốc của chuacuteng trong caacutec lyacute thuyết
tiến hoacutea của chọn lọc tự nhiecircn vagrave thiacutech ứng với biến đổi khiacute hậu Kết quả thuật toaacuten di truyền lagrave từ giao phối 2 caacute thể trong quần thế để tạo
ra con caacutei đocirci khi tốt hơn so với bậc cha mẹ của chuacuteng 15Caacutec thagravenh phần cơ bản của thuật toaacuten di truyền
Toaacuten tử chọn lọc Caacutec caacute thể tốt được chọn lọc để đưa vagraveo thế hệ sau Sự chọn lọc nagravey căn cứ vagraveo độ thiacutech nghi với mocirci trường của mỗi caacute thể
Toaacuten tử lai gheacutep (crossover) Hai caacute thể cha vagrave mẹ trao đổi caacutec gen với nhau để tạo ra caacute thể con
Toaacuten tử đột biến (mutation) Một caacute thể thay đổi một số gen để biến đổi thagravenh một caacute thể mớiTất cả caacutec toaacuten tử trecircn khi thực hiện đều mang tiacutenh ngẫu nhiecircn
16Quaacute trigravenh cơ bản của một thuật toaacuten di truyền Khởi tạo
Đaacutenh giaacute quần thể
Lựa chọn NST thiacutech hợp nhất vagrave loại bỏ NST yếu nhất
Quy trigravenh giao nhau vagrave cải thiện quần thể
đột biến tiến trigravenh để khaacutem phaacute ra NST mới
17Ưu nhược điểm của việc kết hợp với thuật toaacuten di truyền Kiacutech thước quần thể lagrave 1 yếu tố quan trọng trong tốc độ của việc tigravem
kiếmnhưng noacute tương đối dễ dagraveng để dự đoaacuten tốc độ nagravey Giao nhau hoặc đột biến lagrave khocircng necircn đc sử dụng quaacute thường xuyecircn Luocircn coacute được iacutet nhất 1 giải phaacutep hợp lyacute Necircn coacute thể aacutep dụng chuacuteng cho caacutec vấn đề magrave chuacuteng ta khocircng coacute hướng
về caacutech giải quyết Sức mạnh của thuật toaacuten xuất phaacutet từ khaacutei niệm đơn giảnkhocircng phải từ
một thủ tục thuật toaacuten phức tạp 18Tương lai của học maacutey
Mạng lưới thần kinh nhacircn tạo vượt quaacute năng lực của con người trong caacutec trường hợp bị cocirc lập
Về mặt lyacute thuyếtmột maacutey tiacutenh coacute thể xử lyacute dũ liệu nhanh hơn hagraveng triệu lần so với 1 con người
May mắn thay cho chuacuteng tacon người tốt hơn nhiều khi magrave coacute được dữ liệumaacutey tiacutenh khocircng coacute 1 số thứ như lagrave 5 giaacutec quan
CHƯƠNG 10 KHO DỮ LIỆU
1 Kho dữ liệu Kho dữ liệu lagrave tuyển tập caacutec cơ sở dữ liệu tiacutech hợp hướng chủ đề được
thiết kế để trợ giuacutep cho một hệ hỗ trợ quyết định
Theo John Ladley Cocircng nghệ kho dữ liệu lagrave tập caacutec phương phaacutep kỹ thuật vagrave caacutec cocircng cụ coacute thể kết hợp hỗ trợ nhau để cung cấp thocircng tin cho người sử dụng trecircn cơ sở tiacutech hợp từ nhiều nguồn dữ liệu nhiều mocirci trường khaacutec nhau
Kho dữ liệu thường rất lớn tới hagraveng trăm GB hay thậm chiacute hagraveng Terabyte
2 Kho dữ liệu vận hagravenh (ODS) Một kho dữ liệu vận hagravenh Aacutep dụng kỹ thuật kho dữ liệu vagraveo caacutec hệ xử
lyacute giao taacutec lưu trữ dữ liệu cho một ứng dụng đặc thugrave Noacute đưa vagraveo kho dữ liệu một dograveng caacutec dữ liệu thocirc được thiết kế
3 So saacutenh
Kho dữ liệu vận hagravenh Kho dữ liệu
Dữ liệu theo chủ đề Dữ liệu theo chủ đề
Dữ liệu tiacutech hợp Dữ liệu tiacutech hợp
Dữ liệu thay đổi Dữ liệu khocircng thay đổi
Dữ liệu được cập nhật khi thay đổi
Dữ liệu giữ nguyecircn
Chỉ coacute dữ liệu hiện tạiDữliệu hiện tại vagrave dữ liệu lịch sử
Chu kỳ lagravem tươi dữ liệu ngắn Chu kỳ lagravem tươi dữ liệu dagravei
Chỉ coacute dữ liệu chi tiết Dữ liệu chi tiết vagrave dữ liệu tổng kết
Dugraveng cho caacutec quyết định ngắn hạn
Dugraveng cho hoạch định dagravei hạn
4 Kho dữ liệu cục bộ (Data Mart - DM)
Kho dữ liệu cục bộ lagrave CSDL coacute những đặc điểm giống với kho dữ liệu nhưng với quy mocirc nhỏ hơn vagrave lưu trữ dữ liệu về một lĩnh vực một chuyecircn ngagravenh
Data mart phụ thuộc Chứa những dữ liệu được lấy từ DW vagrave những dữ liệu nagravey sẽ được triacutech lọc vagrave tinh chế tiacutech hợp lại ở mức cao hơn để phục vụ một chủ đề nhất định của Datamart
Data mart độc lập Khocircng giống như Datamart phụ thuộc Data mart độc lập được xacircy dựng trước DW vagrave dữ liệu được trực tiếp lấy từ caacutec nguồn khaacutec nhau
5 Siecircu dữ liệu Metadata lagrave dữ liệu để mocirc tả dữ liệu Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột
một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi Metadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu
6 Mocirci trường kho dữ liệu Hệ thống của tổ chức vagrave kho cung cấp dữ liệu để xacircy dựng kho dữ liệu Trong quaacute trigravenh chuyển dữ liệu từ caacutec nguồn khaacutec nhau dữ liệu coacute thể
được lagravem sạch hoặc chuyển đổi vagrave vigrave thế DW được xem như lagrave một chuẩn cho việc lưu trữ
Đồng thời siecircu dữ liệu được ghi lại Cuối cugraveng DW hoặc siecircu thị coacute thể được sử dụng để tạo ra một kho dữ
liệu ldquocaacute nhacircnrdquo 7 Caacutec đặc điểm của kho dữ liệu
Đặc điểm Mocirc tả
Hướng chủ đề - DL tổ chức theo caacutech thức người dugraveng tham chiếu
Tiacutech hợp - Dữ liệu ldquosạchrdquo loại bỏ tiacutenh thiếu nhất quaacuten
Khocircng thay đổi - DL ldquochỉ đọcrdquo người dugraveng khocircng thay đổi được
Chuỗi thời gian - DL lagrave chuỗi thời gian khocircng phải lagrave trạng thaacutei hiện tại
Được tổng kết - DL vận hagravenhthao taacutec khi cần thiết
được kết hợp lại thagravenh dạng coacute thể dugraveng được cho quyết định
Kiacutech cỡ lớn hơn - Lưu giữ theo chuỗi thời gian tức lagrave giữ lại nhiều DL
Khocircng được chuẩn hoacutea - Coacute thể dư thừa DLSiecircu dữ liệu - Dữ liệu của dữ liệu được lưu trữNguồn dữ liệu - DL vận hagravenh (caacutec hệ sẵn coacute) cugraveng
với caacutec nguồn ngoagravei 8 Kho dữ liệu hướng chủ đề
Hướng chủ để coacute nghĩa lagrave kho dữ liệu được tổ chức xung quanh caacutec chủ đề chiacutenh như khaacutech hagraveng sản phẩm sản xuất Tập trung vagraveo việc mocirc higravenh hoacutea vagrave phacircn tiacutech dữ liệu cho caacutec nhagrave ra quyết định magrave khocircng tập trung vagraveo caacutec xử lyacute thocircng thường Cung cấp cho người dugraveng một khung nhigraven toagraven vẹn đơn giản vagrave đầy đủ về caacutec sự kiện quanh caacutec chủ đề
9 Dữ liệu trong DW được tiacutech hợp Dữ liệu trong kho dữ liệu được xacircy dựng bằng caacutech tổng hợp dữ liệu từ
nhiều nguồn khaacutec nhau vagrave caacutec nguồn coacute tổ chức khaacutec nhau Cơ sở dữ liệu caacutec file excel caacutec flat file hoặc caacutec raw file Khi đưa vagraveo kho dữ liệu caacutec dữ liệu được lagravem sạch vagrave tiacutech hợp dữ liệu nhằm đảm bảo tiacutenh nhất quaacuten của dữ liệu
10Kiến truacutec kho dữ liệu Tầng cơ sở dữ liệu hoạt động Tầng truy xuất thocircng tin Tầng truy xuất dữ liệu Tầng siecircu dữ liệu Tầng quản lyacute tiến trigravenh Tầng thocircng điệp của ứng dụng Tầng vật liacute của kho dữ liệu Tầng trigravenh diễn dữ liệu
11Higravenh trạng kho dữ liệu Kho dữ liệu ảo - người dugraveng cuối coacute thể truy cập trực tiếp đến kho dữ liệu
sử dụng caacutec cocircng cụ cho pheacutep ở tầng truy xuất dữ liệu Kho dữ liệu trung tacircm-1 cơ sở dữ liệu vật lyacute chứa tất cả dữ liệu cho một
vugraveng chuyecircn dụng nagraveo đoacute
Kho dữ liệu phacircn taacuten- Thagravenh phần được phacircn taacuten qua nhiều hệ cơ sở dữ liệu vật lyacute
12METADATA- Siecircu dữ liệu Định nghĩa Siecircu dữ liệu lagrave dữ liệu về dữ liệu Lagrave 1 lưu trữ dugraveng để
Miecircu tả kho dữ liệu tổng thể Nhận dạng kiểu kho dữ liệu Quản liacute quaacute trigravenh tiacutech hợp dữ liệu Quản liacute quaacute trigravenh cập nhật kho dữ liệu Quản liacute bảo mật
Lagrave chigravea khoacutea quyết định sự thagravenh cocircng của kho dữ liệu luocircn được thay đổi vagrave cập nhật theo sự phaacutet triển của kho dữ liệu
Dugraveng để quản liacute điều khiển kho dữ liệu Sự ra đời của kho dữ liệu như 1 cấu truacutec hỗ trợ ra quyết định siecircu dữ liệu
được xem như nguồn tagravei nguyecircn dữ liệu Siecircu dữ liệu lagrave trừu tượng Chuacuteng lagrave dữ liệu bậc cao cung cấp mocirc tả ngắn
gọn caacutec dữ liệu bậc thấp hơn 13Hoạt động của Siecircu dữ liệu
Siecircu dữ liệu rất cần thiết trong việc chuyển hoacutea thocircng tin trở thagravenh tri thức Lagrave chigravea khoacutea giuacutep chuacuteng ta xử lyacute được dữ liệu thocirc Viacute dụ một dograveng dữ liệu baacuten hagraveng 1023 K596 11121 agraveNoacute sẽ khocircng coacute nghĩa gigrave cho đến khi chuacuteng ta đưa vagraveo siecircu dữ liệu (thư
mục chứa dữ liệu) agrave cửa hagraveng 1023 sản phẩm K596 vagrave số tiền baacuten được lagrave 11121 đocirc la
14Sự cần thiết phải nhất quaacuten trong kho dữ liệu Kho dữ liệu được xacircy dựng cho lợi iacutech của những nhagrave phacircn tiacutech kinh
doanh caacutec nhagrave quản trị cho tất cả caacutec khu vực chức năng Trong cơ sở dữ liệu riecircng caacutec khu vực khaacutec nhau coacute thể định nghĩa vagrave lưu
trữ dữ liệu thocircng qua phiecircn bản của chiacutenh noacute Khi dữ liệu được lấy từ những vugraveng khaacutec nhau đoacute vagrave được đặt vagraveo kho dữ
liệu Việc chuyển đổi vagrave lagravem sạch caacutec tiến trigravenh sẽ đảm bảo noacute lagrave duy nhất được tiacutech hợp tại một mức của tổ chức
15Ragrave soaacutet lại dữ liệu ndash Thực thi siecircu dữ liệu
Bất kể cấu truacutec tự nhiecircn của 1 cacircu truy vấn thế nagraveo thigrave caacutec thagravenh phần của siecircu dữ liệu rất quan trọng đối với người ra quyết định
Bảng thuộc tiacutenh khoacutea được lưu trữ bởi kho dữ liệu Tập hợp dữ liệu được lấy từ đacircu Những chuyển đổi nagraveo được thực thi với việc lagravem sạch
16Siecircu dữ liệu lagrave gigrave Metadata - lagrave thocircng tin mocirc tả nội dung của cơ sở dữ liệu (CSDL) Metadata baacuteo cho người dugraveng biết thời gian cập nhật sau cugraveng của dữ liệu
định dạng vagrave mục điacutech sử dụng của noacute Những thocircng tin nagravey coacute thể hướng dẫn người dugraveng duyệt qua CSDL vagrave
giuacutep họ hiểu được yacute nghĩa vagrave ngữ cảnh của dữ liệu Trong CSDL metadata lagrave caacutec dạng biểu diễn khaacutec nhau của caacutec đối tượng
trong CSDL Trong CSDL quan hệ metadata lagrave caacutec định nghĩa của bảng cột CSDL
view vagrave nhiều đối tượng khaacutec Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột
một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi -gtMetadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu
Bảng chuyển đổi Ghi lại những chuyển đổi đatilde được thực hiện
Lịch sử thực thi Ghi lại những dữ liệu đatilde được
phacircn tiacutech
Higravenh thaacutei kết nốiGhi lại những dữ liệu được kết nối vagrave tần suất
17Aacutenh xạ thocircng thường của siecircu dữ liệu Bản ghi aacutenh xạ chuyển đổi bao gồm
Định danh của nguồn gốc Chuyển đổi thuộc tiacutenh Chuyển đổi thuộc tiacutenh vật lyacute Matilde hoacutea tham chiếu bảng chuyển đổi Đổi tecircn Đổi khoacutea Gaacuten giaacute trị cho thuộc tiacutenh mặc định Chọn logic cho caacutec nguồn nhiều giaacute trị Đổi thuật toaacuten
18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để
phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai
lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave
tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec
Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm
Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo
19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua
caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau
SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được
Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra
một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức
Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ
Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ
Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech
CHƯƠNG 11 KHAI PHAacute DỮ LIỆU
1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn
ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993
Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng
2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd
1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều
2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP
3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn
4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng
5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server
6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo
7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động
8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời
9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều
10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện
11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech
12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP
3 Xử lyacute phacircn tiacutech trực tuyến OLAP
MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave
dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu
ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave
thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu
HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave
ROLAP4 Khai phaacute dữ liệu
Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh
khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn
Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan
5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp
6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại
Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp
Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec
Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt
Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra
Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh
vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho
Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec
Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm
Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục
Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng
gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp
Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn
Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec
Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper
Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2
Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25
Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước
Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng
Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện
trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp
Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute
độ hỗ trợ ge ngưỡng minsup
độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan
Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn
Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết
Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu
MOLAP ROLAP HOLAP
Lưu trữ dữ liệu cơ sở
Khối Bảng quan hệ Bảng quan hệ
Lưu trữ thocircng tin tổng hợp
Khối Bảng quan hệ Khối
Hiệu suất thực hiện truy vấn
Nhanh nhất Chậm nhất Nhanh
Tiecircu thụ khocircng gian lưu trữ
Nhiều Thấp Trung bigravenh
Chi phiacute bảo trigrave Cao Thấp Trung bigravenh
Ở đacircy tri thức được đặt để sử dụng tạo ra caacutec giải phaacutep để giải quyết vấn đề
Mocirc tơ nagravey coacute khả năng thực hiện diễn dịch hoặc suy diễn dựa trecircn caacutec luật hay caacutec caacutec sự kiện
Đồng thời cũng coacute khả năng sử dụng caacutec suy diễn mờ hay khocircng chiacutenh xaacutec dựa trecircn xaacutec suất hay aacutenh xạ mẫu
Vograveng điều khiển suy diễn
1 Aacutenh xạ caacutec luật với caacutec sự kiện đatilde được cho
2 Chọn luật để thực hiện
3 Thực hiện luật bằng caacutech thecircm caacutec sự kiện được suy diễn ra vagraveo bộ nhớ lagravem việc
Chuỗi suy diễn (Chaining)
Suy diễn tiến (forward chaining) maacutey suy diễn bắt đầu từ dữ liệu ban đầu vagrave thực hiện việc suy luận để đưa ra caacutec kết luận cuối cugraveng
Suy diễn lugravei (backward chaining) maacutey suy diễn bắt đầu từ dữ liệu điacutech vagrave tigravem ra tri thức hỗ trợ cho dữ liệu điacutech đoacute
Viacute dụ suy diễn lugravei
R1 Nếu coacute A vagrave B thigrave suy ra coacute D
R2 Nếu coacute B thigrave suy ra coacute C
R3 Nếu coacute C vagrave D thigrave suy ra coacute E
Ta coacute E ta xem trong 3 luật R1 R2 R3 luật nagraveo coacute E ta thấy R3 chứa E đồng thời chứa C vagrave D Xeacutet tiếp trong 2 luật R1 R2 luật nagraveo chứa C vagrave D R2 chứa C R3 chứa D Từ đoacute ta coacute được caacutec tri thức hỗ trợ suy diễn vagrave kết luận lagrave nếu coacute A vagrave B thigrave sẽ coacute E Hay nếu A vagrave B đuacuteng thigrave sẽ coacute E
Viacute dụ suy diễn tiến
Giả sử coacute tập chứa 3 luật sau
R1 Nếu coacute A vagrave B thigrave suy ra coacute D
R2 Nếu coacute B thigrave suy ra coacute C
R3 Nếu coacute C vagrave D thigrave suy ra coacute E
Nếu ta coacute A vagrave B thigrave chuacuteng ta suy ra được D từ R1 vagrave suy ra C từ R2 Với D vagrave C đatilde được suy ra ở trecircn giờ chuacuteng ta suy ra được E từ R3
Viacute dụ thực tế
Giả sử muốn biết magraveu của một con vật nuocirci tecircn lagrave Fred biết rằng noacute kecircu ộp ộp vagrave ăn ruồi
Coacute tập 4 luật ban đầu như sau
R1 Nếu X kecircu ộp ộp vagrave ăn ruồi thigrave X lagrave con ếch
R2 Nếu X kecircu chiecircm chiếp vagrave biết hoacutet thigrave X lagrave con chim
R3 Nếu X lagrave con ếch thigrave X coacute magraveu xanh
R4 Nếu X lagrave con chim thigrave X coacute magraveu vagraveng
74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia
Expert system shells lagrave một tập caacutec goacutei phần mềm vagrave caacutec cocircng cụ dugraveng để phaacutet triển caacutec hệ chuyecircn gia
Những Expert system shells đầu tiecircn thường rất rườm ragrave Mặc dugrave vậy noacute vẫn giuacutep cho người sử dụng sẽ khocircng phải bắt đầu lại từ đầu khi xacircy dựng một hệ chuyecircn gia mới
Những shell hiện đại bao gồm hai mocirc-đun chiacutenh lagrave cocircng cụ xacircy dựng một tập quy tắc vagrave mocirc tơ suy diễn
Xacircy dựng hệ chuyecircn gia
Bước 1 xacircy dựng mocirc higravenh bagravei toaacuten xaacutec định vấn đề nhiệm vụ magrave hệ thống sẽ thực hiện Caacutec dạng bagravei toaacuten cần hệ chuyecircn gia
Bagravei toaacuten diễn giải (InterPretation)
Bagravei toaacuten dự baacuteo (Prediction)
Bagravei toaacuten chuẩn đoaacuten (Diagnose)
Bagravei toaacuten gỡ rối (Debugging)
Bagravei toaacuten thiết kế
Tương tự như một dự aacuten phần mềm để xacircy dựng một hệ chuyecircn gia cần phải coacute caacutec yếu tố về nhacircn lực tagravei nguyecircn vagrave thời gian Những yếu tố nagravey ảnh hưởng đến giaacute thah của một hệ chuyecircn giaTrong phần nagravey cacircu hỏi thường được đặt ra lagrave tại sao cần phải xacircy dựng một hệ chuyecircn giaTrước khi bắt đầu phải xaacute định rotilde bagravei toaacuten đạt ra lagrave jiAi lagrave chuyecircn giaAi lagrave người sử dụng
1 Diễn giải (InterPretation) Nghiecircn cứu 1 vấn đề -gt Dựa trecircn những biểu hiện thuộc tiacutenh đặc trưng becircn ngoagravei -gt Tư vấn
(hoặc đưa ra kết luận hay mocirc tả dễ hiểu từ tập dữ liệu thocirc)
2 Bagravei toaacuten dự baacuteo (Prediction) Coacute thể dự đoaacuten được hagravenh vi kết quả dựa trecircn caacutec hiện tượng -gt dự baacuteo
VD Dự baacuteo thời tiết động đấthellip
3 Bagravei toaacuten chẩn đoaacuten (Diagnoss) Xaacutec định caacutec lỗi caacutec bộ phận hỏng hoacutec của hệ thống dựa trecircn caacutec dữ liệu quan saacutet được
4 Bagravei toaacuten gỡ rối (Debugging) Mocirc tả caacutec phương phaacutep khắc phục hệ thống khi gặp sự cố
5 Bagravei toaacuten thiết kế Lựa chọn cấu higravenh caacutec đối tượng nhằm thoả matilden một số ragraveng buộc nagraveo đoacute
6 Giảng dạy Phần mềm dạy học coacute thể chuẩn đoaacuten vagrave sủa lỗi của học sinh trong quaacute trigravenh học tập
Để xaacutec định đuacuteng bagravei toaacuten magrave chuacuteng ta cần giải quyết thigrave phải trả lời đc một số cacircu hỏi
- cần hệ chuyecircn gia
Bước 2 thu thập tri thức lựa chọn cocircng cụ vagrave aacutep dụng
Trong bước thu thập tri thức vấn đề quan trọng lagrave lựa chọn chuyecircn gia những người magrave sẽ đoacuteng goacutep tri thức cho hệ thống Thocircng thường trong suốt quaacute trigravenh phaacutet triển thigrave chuyecircn gia được xem như một thagravenh viecircn của đội phaacutet triển
Hiện nay coacute rất nhiều cocircng cụ để xacircy dựng một hệ chuyecircn gia Phổ biến nhất lagrave JESS CLIPS vagrave OPS5
Bước 3 Thiết kế cơ sở tri thức thiết kế hệ thốngTri thức được biểu diễn trường minh trong cơ sở tri thức
Caacutec chuyecircn gia vagrave kỹ sư tri thức sẽ đối thoại với nhau bằng caacutec kỹ thuật đối thoại Suy diễn (SD) bảng Mocirc higravenh hoacutea SD quy nạp phacircn loại
Vấn đề bagraveo trigrave vagrave phaacutet triển
Caacutec hệ chuyecircn gia đogravei hỏi phải bảo trigrave vagrave phaacutet triển nhiều hơn so với caacutec hệ thống khaacutec Phải thường xuyecircn bổ sung tri thức mới vagrave thay đổi caacutec tri thức cũ để đổi mới hệ chuyecircn gia
Thu thập vagrave khắc phục lỗi do người sử dụng phaacutet hiện để kịp thời khắc phục những sai soacutet của hệ chuyecircn gia
75 Lợi iacutech vagrave hạn chế của caacutec hệ chuyecircn gia
Một số lợi iacutech chiacutenh
Thời gian trả lời hợp lyacute bằng hoặc nhanh hơn so với chuyecircn gia (người) để đi đến cugraveng một quyết định Hệ chuyecircn gia lagrave một hệ thống thời gian thực (real time system)
Khả năng trả lời với mức độ tinh thocircng bằng hoặc cao hơn so với chuyecircn gia (người) trong cugraveng lĩnh vực
Hệ chuyecircn gia giuacutep cho hiệu quả lagravem việc tăng bằng việc sử dụng tập caacutec luật một caacutech nhanh choacuteng magrave ko bị nhầm lẫn chuyecircn gia lagrave người coacute thể quecircn đi một số tri thức cơ sở lyacute luậ nhưng HCG thigrave ko
Quyết định của một người chuyecircn gia coacute thể bị thay đổi vagrave ko coacute tiacutenh thống nhất như quyết định của một hệ chuyecircn gia tạo ra
Hệ chuyecircn gia giuacutep cho người sử dụng coacute thể trau dồi sự hiểu biết trecircn lĩnh vuej cụ thể magrave noacute giải quyết hỗ trợ người ra quyết định coacute trigravenh độ như 1 chuyecircn gia trong quaacute trigravenh gia quyết định
Kiến thức của rất nhiều chuyecircn gia về một lĩnh vực nagraveo đoacute được đưa vagraveo hệ chuyecircn gia lagravem cho CSTT cuat HCG phong phuacute vagrave rộng lớn hơn rất nhiều
HCG giải thiacutech caacutec bước suy luận một caacutech dễ hiểu nhất quaacuten luacutec nagraveo cũng coacute thể sử dụng ko như chuyecircn gia con người
Hạn chế của caacutec hệ chuyecircn gia
Nhược điểm lớn nhất của hệ chuyecircn gia lagrave những yacute kiến chuyecircn mocircn thường rất khoacute matilde hoacutea vagrave giải neacuten
Hệ chuyecircn gia khocircng coacute khả năng tự học tự cập nhật kiến thức mới như caacutec chuyecircn gia magrave cần phải được matilde hoacutea lại khi noacute được cập nhật
Hệ chuyecircn gia khocircng thể nhận ra được vấn đề khocircng nằm trong miền kiến thức của hệ thống
Chương 8 Tri thức vagrave tiếp nhận
1 Bao gồm caacutec vấn đề
Dữ liệu thực tế đo lường hoặc quan saacutet coacute hoặc khocircng coacute bối cảnh
Thocircng tin dữ liệu được tổng hợp một caacutech hữu iacutech để giải quyết những khoacute khăn trong việc đưa ra quyết định
Tri thức bao gồm caacutec ứng dụng quy tắc thocircng tin hướng dẫn của người ra quyết định
2 Những caacutei nhigraven về tri thức
Đại diện lagravem thế nagraveo để diễn tả tri thức viacute dụ như một quyển saacutech khocircng phải lagrave tri thức nhưng noacute lại lagrave một đại diện của tri thức
Sản xuất tri thức lagrave một tập hơp của hagraveng tồn kho coacute thể được sản xuất cũng như mua lại
Tri thức lagrave 1 trong 6 trạng thaacutei của hệ thống
1Dữ liệu 2Thocircng tin 3Cấu truacutec thocircng tin 4Sự thấu hiểu 5Yacute kiến 6 Quyết định
3 Caacutec loại tri thức Phổ biến mocirc tả dữ liệu thocircng tin thủ tục mọi thứ lagravem như thế nagraveo lập luận chiacutenh saacutech hoặc caacutec quy tắc
4 Thu thập Tri thức hệ chuyecircn gia Hầu hết caacutec phương phaacutep đều bắt đầu với mocirc higravenh của caacutec taacutec vụ trong đoacute
hệ chuyecircn gia được xacircy dựng Trong đoacute mocirc tả về caacutec lĩnh vực được tạo ra Caacutec kỹ sư sử dụng caacutec mocirc higravenh giả thuyết vagrave nhận thức về quaacute trigravenh phacircn
tiacutech để gợi ra caacutech giải quyết vấn đề về tri thức từ caacutec chuyecircn gia
5 Caacutec chiều của thu thập tri thức KE- driven caacutec kỹ sư trao đổi trực tiếp với caacutec chuyecircn gia Expert-driven Caacutec chuyecircn gia trực tiếp đưa chuyecircn mocircn của họ vagraveo hệ
thống maacutey tiacutenh Machine-driven Sử dụng caacutec cocircng cụ suy luận để triacutech xuất tri thức từ một
tập caacutec viacute dụ
6 Kỹ thuật thu thập tri thức Trao đổi gồm 2 loại cơ bản lagrave coacute cấu truacutec(coacute kịch bản) vagrave khocircng coacute cấu
truacutec( đối thoại trực tiếp) Giao thức phacircn tiacutech bằng lời Khi caacutec chuyecircn gia thực hiện một cocircng việc
của họ thigrave một bản ghi về cocircng việc đoacute được thực hiện Caacutec kỹ sư sẽ xacircy dựng mocirc higravenh cho những gigrave được ghi lại trong bản ghi
Phương phaacutep sagraveng lọc caacutec chuyecircn gia so saacutenh caacutec nhoacutem liecircn tiếp trong ba đối tượng vagrave cho biết tại sao nhoacutem thứ hai lại khaacutec nhoacutem thứ ba
7 Thu thập tri thức từ nhiều nguồn Thu thập tri thức từ nhiều nguồn lagrave cần thiết để coacute được đầy đủ caacutec tri thức
cho một vấn đề quan điểm yacute kiến traacutei ngược nhau thường phaacutet sinh Phương phaacutep đồng thuận sẽ giuacutep giải quyết được vấn đề macircu thuẫn Kỹ thuật phacircn tiacutech Meta lagrave kỹ thuật được aacutep dụng trong caacutec trường hợp
khaacutec Caacutech tiếp cận bằng định lượng đogravei hỏi caacutec kỹ sư cần cacircn nhắc yếu tố đầu vagraveo của caacutec chuyecircn gia khaacutec nhau
8 Xaacutec nhận hợp lệ vagrave kiểm tra tri thức Một khi thu thập tri thức noacute phải được đaacutenh giaacute về khả năng sử dụng vagrave độ
chiacutenh xaacutec Hai vấn đề cụ thể lagrave hiệu lực của những kiến thức vagrave kiểm tra việc xacircy dựng cơ sở của tri thức
Cần xaacutec nhận xem liệu hệ thống coacute thể hoạt động ở mức độ tối thiểu khocircng
Xaacutec minh liecircn quan đến việc so saacutenh từng chi tiết kỹ thuật của hệ thống những gigrave đatilde được thực hiện cuối cugraveng
9 Một số caacutec biện phaacutep xaacutec nhận Độ chiacutenh xaacutec Khả năng thiacutech nghi Mức độ đầy đủ Bề rộng Độ sacircu Hiệu lực Tổng quan Chiacutenh xaacutec Hiện thực Độ tin cậy Tiacutenh hữu dụng Mức độ
Chương 9 Học maacutey
1 Logic mờ vagrave ngocircn ngữ mờ(Fuzzy Logic and Linguistic Ambiguity)
Ngocircn ngữ tự nhiecircn gồm những khaacutei niệm mơ hồ vagrave khocircng chiacutenh xaacutectruyền tải ngữ nghĩa thocircng qua tiacutenh xấp xỉkhocircng rotilde ragraveng
Những xấp xỉ nagravey giuacutep con người coacute thể truyền tải hết được yacute nghĩa nhưng maacutey thigrave khocircng hiểu
Lagravem sao biểu diễn caacutec tri thức sử dụng caacutec khaacutei niệm khocircng rotilde ragraveng(mờ) hoặc khocircng chiacutenh xaacutec
2 Khaacutei niệm cơ bản của logic mờ tập mờ lagrave những tập hợp khocircng coacute một giới hạn rotilde Mỗi phần tử của noacute chỉ
chứa một mức độ hagravem liecircn thuộc của từng phần tử Vigrave vậy tập mờ khocircng giống như tập cổ điển Tập mờ coacute thể kết hợp với nhau qua những luật mờ magrave đặc trưng cho những hagravenh động trạng thaacutei vagrave thuộc tiacutenh của logic mờ được tận dụng khi thực hiện một bộ điều khiển mờ
Logic mờ dựa trecircn yacute tưởng mỗi phần tử thuộc vagraveo một tập hợp ở một mức độ nagraveo đấy
Locircgic mờ cho pheacutep độ liecircn thuộc (microA )coacute giaacute trị trong khoảng (01) Locircgic mờ coacute thể được coi lagrave mặt ứng dụng của lyacute thuyết tập mờ để xử lyacute caacutec
giaacute trị trong thế giới thực cho caacutec bagravei toaacuten phức tạp
3 So saacutenh tiacutenh đuacuteng đắn logic mờ vagrave xaacutec suất Xaacutec suất thigrave đề cập đến khả năng xảy ra một biến cố hay một điều gigrave đoacute Logic mờ đề cập đến cấp độ magrave đặc tiacutenh ở hiện tại
o viacute dụ1 người coacute chiều cao 6 feet thigrave coacute cấp độ lagrave 05 về chiều cao
4 Ưu điểm của logic mờ Caacutech tiếp cận rất tự nhiecircnkhocircng phức tạp Coacute thể mocirc higravenh hoacutea caacutec hagravem phi tuyến tugravey yacute phức tạp
Coacute thể tận dụng được kinh nghiệm từ những chuyecircn gia hagraveng đầu trong mọi lĩnh vực
Logic mờ được xacircy dựng dựa trecircn ngocircn ngữ tự nhiecircnNền tảng của logic mờ lagrave dựa trecircn cơ sở giao tiếp của con người
5 Nhược điểm của logic mờ Trong 1 hệ thống phức tạpsử dụng logic mờ coacute thể trở thagravenh trở ngại cho
việc xaacutec thực độ tin cậy của hệ thống Cơ chế lập luận mờ khocircng thể học hỏi từ những lỗi sai
6 Mạng noron nhacircn tạo(ANN) Mạng noron nhacircn tạo lagrave một mocirc phỏng xử lyacute thocircng tinđược nghiecircn cứu ra
từ hệ thống thần kinh của sinh vậtgiống như bộ natildeo để xử lyacute thocircng tin ANNs lagrave chương trigravenh dựa trecircn maacutey tiacutenh đơn giản coacute chức năng lagrave một mocirc
higravenh bagravei toaacuten khocircng gian dựa trecircn thử nghiệm vagrave baacuteo lỗi
7 Học từ kinh nghiệm Tiến trigravenh Một mẫu dữ liệu được biểu diễn như một mạng lưới noronANN ldquodự
đoaacutenrdquo 1 đầu radự đoaacuten được so saacutenh với giaacute trị thực tế hoặc giaacute trị chiacutenh xaacutecNếu đoaacuten được chiacutenh xaacutec thigrave khocircng coacute hagravenh động nagraveo được thực hiện
Nếu dự đoaacuten sai ANN kiểm tra lại vagrave xaacutec định lại thocircng số để điều chỉnh Một mẫu dữ liệu khaacutec được biểu diễn vagrave quaacute trigravenh nagravey được lặp lại
8 Nguyecircn tắc cơ bản của cocircng nghệ nơron Caacutec yếu tố xử lyacute cơ bản trong hệ thống thần kinh của con người lagrave tế bagraveo
thần kinhMạng lưới của tế bagraveo nagravey lagrave liecircn kết với nhau nhận được thocircng tin từ caacutec cảm biến trong mắt taihellip
Thocircng tin nhận được bởi tế bagraveo thần kinh hoặc lagrave sẽ kiacutech thiacutech noacute(sẽ được chuyển qua 1 thocircng điệp dọc theo mạng lưới) hoặc lagrave sẽ ngăn cản noacute(ngăn cản dograveng thocircng tin)
Độ nhạy coacute thể thay đổi qua thời gian hoặc sau khi coacute được kinh nghiệm
9 Cấu truacutec mạng Một ANN gồm 3 lớp cơ bản
Lớp đầu vagraveo nhận dữ liệu Lớp becircn trong hoặc lagrave lớp ẩn xử lyacute dữ liệu Lớp đầu ra chuyển tiếp kết quả cuối cugraveng của mạng
10Mạng nơ ron Thường coacute nhiều đầu vagraveo mỗi đầu vagraveo với mức ảnh hưởng vagrave tầm quan
trọng riecircng của noacute Một đầu vagraveo quan trọng coacute thể được sử dụng để khuếch đại đầu ra caacutec hagravem trạng thaacutei tổng hợp caacutec trọng số của caacutec yếu tố
đầuvagraveo khaacutec nhauvagraveo một giaacute trị duy nhất Caacutec hagravem chuyển giao xử lyacute caacutec giaacute trị trạng thaacutei vagrave tạo đầu ra
11Huấn luyện mạng nơ ron Trong mocirc higravenh coacute giaacutem saacutetANN được đến so saacutenh dự đoaacuten của chiacutenh
noacute với thocircng tin phản hồi coacute chứa caacutec kết quả mong muốn ANN sẽ phải tigravem caacutech thay đổi caacutec tham số becircn trong củamigravenh (caacutec trọng số vagrave caacutec ngưỡng) để tạo necircn một aacutenh xạ coacute khả năng aacutenh xạcaacutec đầu vagraveo thagravenh caacutec đầu ra mong muốn Sự thay đổi nagravey được tiến hagravenh nhờ việc so saacutenh giữa đầu ra thực sự vagrave đầu ra mong muốn
Trong mocirc higravenh khocircng coacute giaacutem saacutetANN nhận được dữ liệu vagraveo nhưng khocircng phải coacute bất kỳ thocircng tin phản hồi về kết quả mong muốn
Phần lớn caacutec ứng dụng nằm trong vugraveng của caacutec bagravei toaacuten ước lượng như mocirc higravenh hoacuteathống kecirc neacuten lọc phacircn cụm
12Lợi iacutech Liecircn kết với mạng noron Traacutenh caacutech lập trigravenh tường minh Giảm nhu cầu của chuyecircn gia ANNs thigrave thiacutech nghi với caacutec yếu tố đầu vagraveo thay đổi Khocircng cần thiết cho cơ sở tri thức tinh chế ANNs coacute tiacutenh động vagrave cải thiện với việc sử dụng Coacute khả năng xử lyacute dữ liệu khocircng chiacutenh xaacutec hoặc khocircng đầy đủ Cho pheacutep tổng quaacutet hoacutea từ thocircng tin cụ thể Cho pheacutep thu thập cảm giaacutec thocircng thường vagraveo miền giải quyết vấn đề
13Hạn chế của việc liecircn kết với mạng noron ANNs khocircng thể giải thiacutech được suy luận Bản chất hộp đen thường khiến cho vấn đề traacutech nhiệm vagrave độ tin cậy phaacutet
sinh lagrave khoacute khăn Lặp đi lặp lại quaacute trigravenh huấn luyện rất tốn thời gian Nguồn lực caacutec nhagrave phacircn tiacutech vagrave thiết kế coacute tay nghề cao vẫn lagrave đaacuteng lo
ngại Cocircng nghệ ANN thuacutec đẩy hạn chế của phần cứng hiện tại ANN yecircu cầu phải coacute sự tin tưởng ở đầu ra
14Giới thiệu về thuật toaacuten di truyền Cũng như mạng lưới thần kinh caacutec thuật toaacuten di truyền được dựa trecircn lyacute
thuyết sinh học Thuật toaacuten di truyền tigravem thấy nguồn gốc của chuacuteng trong caacutec lyacute thuyết
tiến hoacutea của chọn lọc tự nhiecircn vagrave thiacutech ứng với biến đổi khiacute hậu Kết quả thuật toaacuten di truyền lagrave từ giao phối 2 caacute thể trong quần thế để tạo
ra con caacutei đocirci khi tốt hơn so với bậc cha mẹ của chuacuteng 15Caacutec thagravenh phần cơ bản của thuật toaacuten di truyền
Toaacuten tử chọn lọc Caacutec caacute thể tốt được chọn lọc để đưa vagraveo thế hệ sau Sự chọn lọc nagravey căn cứ vagraveo độ thiacutech nghi với mocirci trường của mỗi caacute thể
Toaacuten tử lai gheacutep (crossover) Hai caacute thể cha vagrave mẹ trao đổi caacutec gen với nhau để tạo ra caacute thể con
Toaacuten tử đột biến (mutation) Một caacute thể thay đổi một số gen để biến đổi thagravenh một caacute thể mớiTất cả caacutec toaacuten tử trecircn khi thực hiện đều mang tiacutenh ngẫu nhiecircn
16Quaacute trigravenh cơ bản của một thuật toaacuten di truyền Khởi tạo
Đaacutenh giaacute quần thể
Lựa chọn NST thiacutech hợp nhất vagrave loại bỏ NST yếu nhất
Quy trigravenh giao nhau vagrave cải thiện quần thể
đột biến tiến trigravenh để khaacutem phaacute ra NST mới
17Ưu nhược điểm của việc kết hợp với thuật toaacuten di truyền Kiacutech thước quần thể lagrave 1 yếu tố quan trọng trong tốc độ của việc tigravem
kiếmnhưng noacute tương đối dễ dagraveng để dự đoaacuten tốc độ nagravey Giao nhau hoặc đột biến lagrave khocircng necircn đc sử dụng quaacute thường xuyecircn Luocircn coacute được iacutet nhất 1 giải phaacutep hợp lyacute Necircn coacute thể aacutep dụng chuacuteng cho caacutec vấn đề magrave chuacuteng ta khocircng coacute hướng
về caacutech giải quyết Sức mạnh của thuật toaacuten xuất phaacutet từ khaacutei niệm đơn giảnkhocircng phải từ
một thủ tục thuật toaacuten phức tạp 18Tương lai của học maacutey
Mạng lưới thần kinh nhacircn tạo vượt quaacute năng lực của con người trong caacutec trường hợp bị cocirc lập
Về mặt lyacute thuyếtmột maacutey tiacutenh coacute thể xử lyacute dũ liệu nhanh hơn hagraveng triệu lần so với 1 con người
May mắn thay cho chuacuteng tacon người tốt hơn nhiều khi magrave coacute được dữ liệumaacutey tiacutenh khocircng coacute 1 số thứ như lagrave 5 giaacutec quan
CHƯƠNG 10 KHO DỮ LIỆU
1 Kho dữ liệu Kho dữ liệu lagrave tuyển tập caacutec cơ sở dữ liệu tiacutech hợp hướng chủ đề được
thiết kế để trợ giuacutep cho một hệ hỗ trợ quyết định
Theo John Ladley Cocircng nghệ kho dữ liệu lagrave tập caacutec phương phaacutep kỹ thuật vagrave caacutec cocircng cụ coacute thể kết hợp hỗ trợ nhau để cung cấp thocircng tin cho người sử dụng trecircn cơ sở tiacutech hợp từ nhiều nguồn dữ liệu nhiều mocirci trường khaacutec nhau
Kho dữ liệu thường rất lớn tới hagraveng trăm GB hay thậm chiacute hagraveng Terabyte
2 Kho dữ liệu vận hagravenh (ODS) Một kho dữ liệu vận hagravenh Aacutep dụng kỹ thuật kho dữ liệu vagraveo caacutec hệ xử
lyacute giao taacutec lưu trữ dữ liệu cho một ứng dụng đặc thugrave Noacute đưa vagraveo kho dữ liệu một dograveng caacutec dữ liệu thocirc được thiết kế
3 So saacutenh
Kho dữ liệu vận hagravenh Kho dữ liệu
Dữ liệu theo chủ đề Dữ liệu theo chủ đề
Dữ liệu tiacutech hợp Dữ liệu tiacutech hợp
Dữ liệu thay đổi Dữ liệu khocircng thay đổi
Dữ liệu được cập nhật khi thay đổi
Dữ liệu giữ nguyecircn
Chỉ coacute dữ liệu hiện tạiDữliệu hiện tại vagrave dữ liệu lịch sử
Chu kỳ lagravem tươi dữ liệu ngắn Chu kỳ lagravem tươi dữ liệu dagravei
Chỉ coacute dữ liệu chi tiết Dữ liệu chi tiết vagrave dữ liệu tổng kết
Dugraveng cho caacutec quyết định ngắn hạn
Dugraveng cho hoạch định dagravei hạn
4 Kho dữ liệu cục bộ (Data Mart - DM)
Kho dữ liệu cục bộ lagrave CSDL coacute những đặc điểm giống với kho dữ liệu nhưng với quy mocirc nhỏ hơn vagrave lưu trữ dữ liệu về một lĩnh vực một chuyecircn ngagravenh
Data mart phụ thuộc Chứa những dữ liệu được lấy từ DW vagrave những dữ liệu nagravey sẽ được triacutech lọc vagrave tinh chế tiacutech hợp lại ở mức cao hơn để phục vụ một chủ đề nhất định của Datamart
Data mart độc lập Khocircng giống như Datamart phụ thuộc Data mart độc lập được xacircy dựng trước DW vagrave dữ liệu được trực tiếp lấy từ caacutec nguồn khaacutec nhau
5 Siecircu dữ liệu Metadata lagrave dữ liệu để mocirc tả dữ liệu Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột
một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi Metadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu
6 Mocirci trường kho dữ liệu Hệ thống của tổ chức vagrave kho cung cấp dữ liệu để xacircy dựng kho dữ liệu Trong quaacute trigravenh chuyển dữ liệu từ caacutec nguồn khaacutec nhau dữ liệu coacute thể
được lagravem sạch hoặc chuyển đổi vagrave vigrave thế DW được xem như lagrave một chuẩn cho việc lưu trữ
Đồng thời siecircu dữ liệu được ghi lại Cuối cugraveng DW hoặc siecircu thị coacute thể được sử dụng để tạo ra một kho dữ
liệu ldquocaacute nhacircnrdquo 7 Caacutec đặc điểm của kho dữ liệu
Đặc điểm Mocirc tả
Hướng chủ đề - DL tổ chức theo caacutech thức người dugraveng tham chiếu
Tiacutech hợp - Dữ liệu ldquosạchrdquo loại bỏ tiacutenh thiếu nhất quaacuten
Khocircng thay đổi - DL ldquochỉ đọcrdquo người dugraveng khocircng thay đổi được
Chuỗi thời gian - DL lagrave chuỗi thời gian khocircng phải lagrave trạng thaacutei hiện tại
Được tổng kết - DL vận hagravenhthao taacutec khi cần thiết
được kết hợp lại thagravenh dạng coacute thể dugraveng được cho quyết định
Kiacutech cỡ lớn hơn - Lưu giữ theo chuỗi thời gian tức lagrave giữ lại nhiều DL
Khocircng được chuẩn hoacutea - Coacute thể dư thừa DLSiecircu dữ liệu - Dữ liệu của dữ liệu được lưu trữNguồn dữ liệu - DL vận hagravenh (caacutec hệ sẵn coacute) cugraveng
với caacutec nguồn ngoagravei 8 Kho dữ liệu hướng chủ đề
Hướng chủ để coacute nghĩa lagrave kho dữ liệu được tổ chức xung quanh caacutec chủ đề chiacutenh như khaacutech hagraveng sản phẩm sản xuất Tập trung vagraveo việc mocirc higravenh hoacutea vagrave phacircn tiacutech dữ liệu cho caacutec nhagrave ra quyết định magrave khocircng tập trung vagraveo caacutec xử lyacute thocircng thường Cung cấp cho người dugraveng một khung nhigraven toagraven vẹn đơn giản vagrave đầy đủ về caacutec sự kiện quanh caacutec chủ đề
9 Dữ liệu trong DW được tiacutech hợp Dữ liệu trong kho dữ liệu được xacircy dựng bằng caacutech tổng hợp dữ liệu từ
nhiều nguồn khaacutec nhau vagrave caacutec nguồn coacute tổ chức khaacutec nhau Cơ sở dữ liệu caacutec file excel caacutec flat file hoặc caacutec raw file Khi đưa vagraveo kho dữ liệu caacutec dữ liệu được lagravem sạch vagrave tiacutech hợp dữ liệu nhằm đảm bảo tiacutenh nhất quaacuten của dữ liệu
10Kiến truacutec kho dữ liệu Tầng cơ sở dữ liệu hoạt động Tầng truy xuất thocircng tin Tầng truy xuất dữ liệu Tầng siecircu dữ liệu Tầng quản lyacute tiến trigravenh Tầng thocircng điệp của ứng dụng Tầng vật liacute của kho dữ liệu Tầng trigravenh diễn dữ liệu
11Higravenh trạng kho dữ liệu Kho dữ liệu ảo - người dugraveng cuối coacute thể truy cập trực tiếp đến kho dữ liệu
sử dụng caacutec cocircng cụ cho pheacutep ở tầng truy xuất dữ liệu Kho dữ liệu trung tacircm-1 cơ sở dữ liệu vật lyacute chứa tất cả dữ liệu cho một
vugraveng chuyecircn dụng nagraveo đoacute
Kho dữ liệu phacircn taacuten- Thagravenh phần được phacircn taacuten qua nhiều hệ cơ sở dữ liệu vật lyacute
12METADATA- Siecircu dữ liệu Định nghĩa Siecircu dữ liệu lagrave dữ liệu về dữ liệu Lagrave 1 lưu trữ dugraveng để
Miecircu tả kho dữ liệu tổng thể Nhận dạng kiểu kho dữ liệu Quản liacute quaacute trigravenh tiacutech hợp dữ liệu Quản liacute quaacute trigravenh cập nhật kho dữ liệu Quản liacute bảo mật
Lagrave chigravea khoacutea quyết định sự thagravenh cocircng của kho dữ liệu luocircn được thay đổi vagrave cập nhật theo sự phaacutet triển của kho dữ liệu
Dugraveng để quản liacute điều khiển kho dữ liệu Sự ra đời của kho dữ liệu như 1 cấu truacutec hỗ trợ ra quyết định siecircu dữ liệu
được xem như nguồn tagravei nguyecircn dữ liệu Siecircu dữ liệu lagrave trừu tượng Chuacuteng lagrave dữ liệu bậc cao cung cấp mocirc tả ngắn
gọn caacutec dữ liệu bậc thấp hơn 13Hoạt động của Siecircu dữ liệu
Siecircu dữ liệu rất cần thiết trong việc chuyển hoacutea thocircng tin trở thagravenh tri thức Lagrave chigravea khoacutea giuacutep chuacuteng ta xử lyacute được dữ liệu thocirc Viacute dụ một dograveng dữ liệu baacuten hagraveng 1023 K596 11121 agraveNoacute sẽ khocircng coacute nghĩa gigrave cho đến khi chuacuteng ta đưa vagraveo siecircu dữ liệu (thư
mục chứa dữ liệu) agrave cửa hagraveng 1023 sản phẩm K596 vagrave số tiền baacuten được lagrave 11121 đocirc la
14Sự cần thiết phải nhất quaacuten trong kho dữ liệu Kho dữ liệu được xacircy dựng cho lợi iacutech của những nhagrave phacircn tiacutech kinh
doanh caacutec nhagrave quản trị cho tất cả caacutec khu vực chức năng Trong cơ sở dữ liệu riecircng caacutec khu vực khaacutec nhau coacute thể định nghĩa vagrave lưu
trữ dữ liệu thocircng qua phiecircn bản của chiacutenh noacute Khi dữ liệu được lấy từ những vugraveng khaacutec nhau đoacute vagrave được đặt vagraveo kho dữ
liệu Việc chuyển đổi vagrave lagravem sạch caacutec tiến trigravenh sẽ đảm bảo noacute lagrave duy nhất được tiacutech hợp tại một mức của tổ chức
15Ragrave soaacutet lại dữ liệu ndash Thực thi siecircu dữ liệu
Bất kể cấu truacutec tự nhiecircn của 1 cacircu truy vấn thế nagraveo thigrave caacutec thagravenh phần của siecircu dữ liệu rất quan trọng đối với người ra quyết định
Bảng thuộc tiacutenh khoacutea được lưu trữ bởi kho dữ liệu Tập hợp dữ liệu được lấy từ đacircu Những chuyển đổi nagraveo được thực thi với việc lagravem sạch
16Siecircu dữ liệu lagrave gigrave Metadata - lagrave thocircng tin mocirc tả nội dung của cơ sở dữ liệu (CSDL) Metadata baacuteo cho người dugraveng biết thời gian cập nhật sau cugraveng của dữ liệu
định dạng vagrave mục điacutech sử dụng của noacute Những thocircng tin nagravey coacute thể hướng dẫn người dugraveng duyệt qua CSDL vagrave
giuacutep họ hiểu được yacute nghĩa vagrave ngữ cảnh của dữ liệu Trong CSDL metadata lagrave caacutec dạng biểu diễn khaacutec nhau của caacutec đối tượng
trong CSDL Trong CSDL quan hệ metadata lagrave caacutec định nghĩa của bảng cột CSDL
view vagrave nhiều đối tượng khaacutec Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột
một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi -gtMetadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu
Bảng chuyển đổi Ghi lại những chuyển đổi đatilde được thực hiện
Lịch sử thực thi Ghi lại những dữ liệu đatilde được
phacircn tiacutech
Higravenh thaacutei kết nốiGhi lại những dữ liệu được kết nối vagrave tần suất
17Aacutenh xạ thocircng thường của siecircu dữ liệu Bản ghi aacutenh xạ chuyển đổi bao gồm
Định danh của nguồn gốc Chuyển đổi thuộc tiacutenh Chuyển đổi thuộc tiacutenh vật lyacute Matilde hoacutea tham chiếu bảng chuyển đổi Đổi tecircn Đổi khoacutea Gaacuten giaacute trị cho thuộc tiacutenh mặc định Chọn logic cho caacutec nguồn nhiều giaacute trị Đổi thuật toaacuten
18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để
phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai
lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave
tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec
Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm
Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo
19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua
caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau
SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được
Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra
một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức
Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ
Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ
Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech
CHƯƠNG 11 KHAI PHAacute DỮ LIỆU
1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn
ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993
Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng
2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd
1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều
2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP
3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn
4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng
5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server
6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo
7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động
8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời
9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều
10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện
11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech
12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP
3 Xử lyacute phacircn tiacutech trực tuyến OLAP
MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave
dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu
ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave
thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu
HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave
ROLAP4 Khai phaacute dữ liệu
Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh
khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn
Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan
5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp
6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại
Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp
Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec
Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt
Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra
Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh
vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho
Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec
Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm
Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục
Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng
gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp
Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn
Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec
Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper
Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2
Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25
Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước
Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng
Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện
trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp
Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute
độ hỗ trợ ge ngưỡng minsup
độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan
Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn
Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết
Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu
MOLAP ROLAP HOLAP
Lưu trữ dữ liệu cơ sở
Khối Bảng quan hệ Bảng quan hệ
Lưu trữ thocircng tin tổng hợp
Khối Bảng quan hệ Khối
Hiệu suất thực hiện truy vấn
Nhanh nhất Chậm nhất Nhanh
Tiecircu thụ khocircng gian lưu trữ
Nhiều Thấp Trung bigravenh
Chi phiacute bảo trigrave Cao Thấp Trung bigravenh
R2 Nếu coacute B thigrave suy ra coacute C
R3 Nếu coacute C vagrave D thigrave suy ra coacute E
Nếu ta coacute A vagrave B thigrave chuacuteng ta suy ra được D từ R1 vagrave suy ra C từ R2 Với D vagrave C đatilde được suy ra ở trecircn giờ chuacuteng ta suy ra được E từ R3
Viacute dụ thực tế
Giả sử muốn biết magraveu của một con vật nuocirci tecircn lagrave Fred biết rằng noacute kecircu ộp ộp vagrave ăn ruồi
Coacute tập 4 luật ban đầu như sau
R1 Nếu X kecircu ộp ộp vagrave ăn ruồi thigrave X lagrave con ếch
R2 Nếu X kecircu chiecircm chiếp vagrave biết hoacutet thigrave X lagrave con chim
R3 Nếu X lagrave con ếch thigrave X coacute magraveu xanh
R4 Nếu X lagrave con chim thigrave X coacute magraveu vagraveng
74 Thiết kế vagrave xacircy dựng hệ chuyecircn gia
Expert system shells lagrave một tập caacutec goacutei phần mềm vagrave caacutec cocircng cụ dugraveng để phaacutet triển caacutec hệ chuyecircn gia
Những Expert system shells đầu tiecircn thường rất rườm ragrave Mặc dugrave vậy noacute vẫn giuacutep cho người sử dụng sẽ khocircng phải bắt đầu lại từ đầu khi xacircy dựng một hệ chuyecircn gia mới
Những shell hiện đại bao gồm hai mocirc-đun chiacutenh lagrave cocircng cụ xacircy dựng một tập quy tắc vagrave mocirc tơ suy diễn
Xacircy dựng hệ chuyecircn gia
Bước 1 xacircy dựng mocirc higravenh bagravei toaacuten xaacutec định vấn đề nhiệm vụ magrave hệ thống sẽ thực hiện Caacutec dạng bagravei toaacuten cần hệ chuyecircn gia
Bagravei toaacuten diễn giải (InterPretation)
Bagravei toaacuten dự baacuteo (Prediction)
Bagravei toaacuten chuẩn đoaacuten (Diagnose)
Bagravei toaacuten gỡ rối (Debugging)
Bagravei toaacuten thiết kế
Tương tự như một dự aacuten phần mềm để xacircy dựng một hệ chuyecircn gia cần phải coacute caacutec yếu tố về nhacircn lực tagravei nguyecircn vagrave thời gian Những yếu tố nagravey ảnh hưởng đến giaacute thah của một hệ chuyecircn giaTrong phần nagravey cacircu hỏi thường được đặt ra lagrave tại sao cần phải xacircy dựng một hệ chuyecircn giaTrước khi bắt đầu phải xaacute định rotilde bagravei toaacuten đạt ra lagrave jiAi lagrave chuyecircn giaAi lagrave người sử dụng
1 Diễn giải (InterPretation) Nghiecircn cứu 1 vấn đề -gt Dựa trecircn những biểu hiện thuộc tiacutenh đặc trưng becircn ngoagravei -gt Tư vấn
(hoặc đưa ra kết luận hay mocirc tả dễ hiểu từ tập dữ liệu thocirc)
2 Bagravei toaacuten dự baacuteo (Prediction) Coacute thể dự đoaacuten được hagravenh vi kết quả dựa trecircn caacutec hiện tượng -gt dự baacuteo
VD Dự baacuteo thời tiết động đấthellip
3 Bagravei toaacuten chẩn đoaacuten (Diagnoss) Xaacutec định caacutec lỗi caacutec bộ phận hỏng hoacutec của hệ thống dựa trecircn caacutec dữ liệu quan saacutet được
4 Bagravei toaacuten gỡ rối (Debugging) Mocirc tả caacutec phương phaacutep khắc phục hệ thống khi gặp sự cố
5 Bagravei toaacuten thiết kế Lựa chọn cấu higravenh caacutec đối tượng nhằm thoả matilden một số ragraveng buộc nagraveo đoacute
6 Giảng dạy Phần mềm dạy học coacute thể chuẩn đoaacuten vagrave sủa lỗi của học sinh trong quaacute trigravenh học tập
Để xaacutec định đuacuteng bagravei toaacuten magrave chuacuteng ta cần giải quyết thigrave phải trả lời đc một số cacircu hỏi
- cần hệ chuyecircn gia
Bước 2 thu thập tri thức lựa chọn cocircng cụ vagrave aacutep dụng
Trong bước thu thập tri thức vấn đề quan trọng lagrave lựa chọn chuyecircn gia những người magrave sẽ đoacuteng goacutep tri thức cho hệ thống Thocircng thường trong suốt quaacute trigravenh phaacutet triển thigrave chuyecircn gia được xem như một thagravenh viecircn của đội phaacutet triển
Hiện nay coacute rất nhiều cocircng cụ để xacircy dựng một hệ chuyecircn gia Phổ biến nhất lagrave JESS CLIPS vagrave OPS5
Bước 3 Thiết kế cơ sở tri thức thiết kế hệ thốngTri thức được biểu diễn trường minh trong cơ sở tri thức
Caacutec chuyecircn gia vagrave kỹ sư tri thức sẽ đối thoại với nhau bằng caacutec kỹ thuật đối thoại Suy diễn (SD) bảng Mocirc higravenh hoacutea SD quy nạp phacircn loại
Vấn đề bagraveo trigrave vagrave phaacutet triển
Caacutec hệ chuyecircn gia đogravei hỏi phải bảo trigrave vagrave phaacutet triển nhiều hơn so với caacutec hệ thống khaacutec Phải thường xuyecircn bổ sung tri thức mới vagrave thay đổi caacutec tri thức cũ để đổi mới hệ chuyecircn gia
Thu thập vagrave khắc phục lỗi do người sử dụng phaacutet hiện để kịp thời khắc phục những sai soacutet của hệ chuyecircn gia
75 Lợi iacutech vagrave hạn chế của caacutec hệ chuyecircn gia
Một số lợi iacutech chiacutenh
Thời gian trả lời hợp lyacute bằng hoặc nhanh hơn so với chuyecircn gia (người) để đi đến cugraveng một quyết định Hệ chuyecircn gia lagrave một hệ thống thời gian thực (real time system)
Khả năng trả lời với mức độ tinh thocircng bằng hoặc cao hơn so với chuyecircn gia (người) trong cugraveng lĩnh vực
Hệ chuyecircn gia giuacutep cho hiệu quả lagravem việc tăng bằng việc sử dụng tập caacutec luật một caacutech nhanh choacuteng magrave ko bị nhầm lẫn chuyecircn gia lagrave người coacute thể quecircn đi một số tri thức cơ sở lyacute luậ nhưng HCG thigrave ko
Quyết định của một người chuyecircn gia coacute thể bị thay đổi vagrave ko coacute tiacutenh thống nhất như quyết định của một hệ chuyecircn gia tạo ra
Hệ chuyecircn gia giuacutep cho người sử dụng coacute thể trau dồi sự hiểu biết trecircn lĩnh vuej cụ thể magrave noacute giải quyết hỗ trợ người ra quyết định coacute trigravenh độ như 1 chuyecircn gia trong quaacute trigravenh gia quyết định
Kiến thức của rất nhiều chuyecircn gia về một lĩnh vực nagraveo đoacute được đưa vagraveo hệ chuyecircn gia lagravem cho CSTT cuat HCG phong phuacute vagrave rộng lớn hơn rất nhiều
HCG giải thiacutech caacutec bước suy luận một caacutech dễ hiểu nhất quaacuten luacutec nagraveo cũng coacute thể sử dụng ko như chuyecircn gia con người
Hạn chế của caacutec hệ chuyecircn gia
Nhược điểm lớn nhất của hệ chuyecircn gia lagrave những yacute kiến chuyecircn mocircn thường rất khoacute matilde hoacutea vagrave giải neacuten
Hệ chuyecircn gia khocircng coacute khả năng tự học tự cập nhật kiến thức mới như caacutec chuyecircn gia magrave cần phải được matilde hoacutea lại khi noacute được cập nhật
Hệ chuyecircn gia khocircng thể nhận ra được vấn đề khocircng nằm trong miền kiến thức của hệ thống
Chương 8 Tri thức vagrave tiếp nhận
1 Bao gồm caacutec vấn đề
Dữ liệu thực tế đo lường hoặc quan saacutet coacute hoặc khocircng coacute bối cảnh
Thocircng tin dữ liệu được tổng hợp một caacutech hữu iacutech để giải quyết những khoacute khăn trong việc đưa ra quyết định
Tri thức bao gồm caacutec ứng dụng quy tắc thocircng tin hướng dẫn của người ra quyết định
2 Những caacutei nhigraven về tri thức
Đại diện lagravem thế nagraveo để diễn tả tri thức viacute dụ như một quyển saacutech khocircng phải lagrave tri thức nhưng noacute lại lagrave một đại diện của tri thức
Sản xuất tri thức lagrave một tập hơp của hagraveng tồn kho coacute thể được sản xuất cũng như mua lại
Tri thức lagrave 1 trong 6 trạng thaacutei của hệ thống
1Dữ liệu 2Thocircng tin 3Cấu truacutec thocircng tin 4Sự thấu hiểu 5Yacute kiến 6 Quyết định
3 Caacutec loại tri thức Phổ biến mocirc tả dữ liệu thocircng tin thủ tục mọi thứ lagravem như thế nagraveo lập luận chiacutenh saacutech hoặc caacutec quy tắc
4 Thu thập Tri thức hệ chuyecircn gia Hầu hết caacutec phương phaacutep đều bắt đầu với mocirc higravenh của caacutec taacutec vụ trong đoacute
hệ chuyecircn gia được xacircy dựng Trong đoacute mocirc tả về caacutec lĩnh vực được tạo ra Caacutec kỹ sư sử dụng caacutec mocirc higravenh giả thuyết vagrave nhận thức về quaacute trigravenh phacircn
tiacutech để gợi ra caacutech giải quyết vấn đề về tri thức từ caacutec chuyecircn gia
5 Caacutec chiều của thu thập tri thức KE- driven caacutec kỹ sư trao đổi trực tiếp với caacutec chuyecircn gia Expert-driven Caacutec chuyecircn gia trực tiếp đưa chuyecircn mocircn của họ vagraveo hệ
thống maacutey tiacutenh Machine-driven Sử dụng caacutec cocircng cụ suy luận để triacutech xuất tri thức từ một
tập caacutec viacute dụ
6 Kỹ thuật thu thập tri thức Trao đổi gồm 2 loại cơ bản lagrave coacute cấu truacutec(coacute kịch bản) vagrave khocircng coacute cấu
truacutec( đối thoại trực tiếp) Giao thức phacircn tiacutech bằng lời Khi caacutec chuyecircn gia thực hiện một cocircng việc
của họ thigrave một bản ghi về cocircng việc đoacute được thực hiện Caacutec kỹ sư sẽ xacircy dựng mocirc higravenh cho những gigrave được ghi lại trong bản ghi
Phương phaacutep sagraveng lọc caacutec chuyecircn gia so saacutenh caacutec nhoacutem liecircn tiếp trong ba đối tượng vagrave cho biết tại sao nhoacutem thứ hai lại khaacutec nhoacutem thứ ba
7 Thu thập tri thức từ nhiều nguồn Thu thập tri thức từ nhiều nguồn lagrave cần thiết để coacute được đầy đủ caacutec tri thức
cho một vấn đề quan điểm yacute kiến traacutei ngược nhau thường phaacutet sinh Phương phaacutep đồng thuận sẽ giuacutep giải quyết được vấn đề macircu thuẫn Kỹ thuật phacircn tiacutech Meta lagrave kỹ thuật được aacutep dụng trong caacutec trường hợp
khaacutec Caacutech tiếp cận bằng định lượng đogravei hỏi caacutec kỹ sư cần cacircn nhắc yếu tố đầu vagraveo của caacutec chuyecircn gia khaacutec nhau
8 Xaacutec nhận hợp lệ vagrave kiểm tra tri thức Một khi thu thập tri thức noacute phải được đaacutenh giaacute về khả năng sử dụng vagrave độ
chiacutenh xaacutec Hai vấn đề cụ thể lagrave hiệu lực của những kiến thức vagrave kiểm tra việc xacircy dựng cơ sở của tri thức
Cần xaacutec nhận xem liệu hệ thống coacute thể hoạt động ở mức độ tối thiểu khocircng
Xaacutec minh liecircn quan đến việc so saacutenh từng chi tiết kỹ thuật của hệ thống những gigrave đatilde được thực hiện cuối cugraveng
9 Một số caacutec biện phaacutep xaacutec nhận Độ chiacutenh xaacutec Khả năng thiacutech nghi Mức độ đầy đủ Bề rộng Độ sacircu Hiệu lực Tổng quan Chiacutenh xaacutec Hiện thực Độ tin cậy Tiacutenh hữu dụng Mức độ
Chương 9 Học maacutey
1 Logic mờ vagrave ngocircn ngữ mờ(Fuzzy Logic and Linguistic Ambiguity)
Ngocircn ngữ tự nhiecircn gồm những khaacutei niệm mơ hồ vagrave khocircng chiacutenh xaacutectruyền tải ngữ nghĩa thocircng qua tiacutenh xấp xỉkhocircng rotilde ragraveng
Những xấp xỉ nagravey giuacutep con người coacute thể truyền tải hết được yacute nghĩa nhưng maacutey thigrave khocircng hiểu
Lagravem sao biểu diễn caacutec tri thức sử dụng caacutec khaacutei niệm khocircng rotilde ragraveng(mờ) hoặc khocircng chiacutenh xaacutec
2 Khaacutei niệm cơ bản của logic mờ tập mờ lagrave những tập hợp khocircng coacute một giới hạn rotilde Mỗi phần tử của noacute chỉ
chứa một mức độ hagravem liecircn thuộc của từng phần tử Vigrave vậy tập mờ khocircng giống như tập cổ điển Tập mờ coacute thể kết hợp với nhau qua những luật mờ magrave đặc trưng cho những hagravenh động trạng thaacutei vagrave thuộc tiacutenh của logic mờ được tận dụng khi thực hiện một bộ điều khiển mờ
Logic mờ dựa trecircn yacute tưởng mỗi phần tử thuộc vagraveo một tập hợp ở một mức độ nagraveo đấy
Locircgic mờ cho pheacutep độ liecircn thuộc (microA )coacute giaacute trị trong khoảng (01) Locircgic mờ coacute thể được coi lagrave mặt ứng dụng của lyacute thuyết tập mờ để xử lyacute caacutec
giaacute trị trong thế giới thực cho caacutec bagravei toaacuten phức tạp
3 So saacutenh tiacutenh đuacuteng đắn logic mờ vagrave xaacutec suất Xaacutec suất thigrave đề cập đến khả năng xảy ra một biến cố hay một điều gigrave đoacute Logic mờ đề cập đến cấp độ magrave đặc tiacutenh ở hiện tại
o viacute dụ1 người coacute chiều cao 6 feet thigrave coacute cấp độ lagrave 05 về chiều cao
4 Ưu điểm của logic mờ Caacutech tiếp cận rất tự nhiecircnkhocircng phức tạp Coacute thể mocirc higravenh hoacutea caacutec hagravem phi tuyến tugravey yacute phức tạp
Coacute thể tận dụng được kinh nghiệm từ những chuyecircn gia hagraveng đầu trong mọi lĩnh vực
Logic mờ được xacircy dựng dựa trecircn ngocircn ngữ tự nhiecircnNền tảng của logic mờ lagrave dựa trecircn cơ sở giao tiếp của con người
5 Nhược điểm của logic mờ Trong 1 hệ thống phức tạpsử dụng logic mờ coacute thể trở thagravenh trở ngại cho
việc xaacutec thực độ tin cậy của hệ thống Cơ chế lập luận mờ khocircng thể học hỏi từ những lỗi sai
6 Mạng noron nhacircn tạo(ANN) Mạng noron nhacircn tạo lagrave một mocirc phỏng xử lyacute thocircng tinđược nghiecircn cứu ra
từ hệ thống thần kinh của sinh vậtgiống như bộ natildeo để xử lyacute thocircng tin ANNs lagrave chương trigravenh dựa trecircn maacutey tiacutenh đơn giản coacute chức năng lagrave một mocirc
higravenh bagravei toaacuten khocircng gian dựa trecircn thử nghiệm vagrave baacuteo lỗi
7 Học từ kinh nghiệm Tiến trigravenh Một mẫu dữ liệu được biểu diễn như một mạng lưới noronANN ldquodự
đoaacutenrdquo 1 đầu radự đoaacuten được so saacutenh với giaacute trị thực tế hoặc giaacute trị chiacutenh xaacutecNếu đoaacuten được chiacutenh xaacutec thigrave khocircng coacute hagravenh động nagraveo được thực hiện
Nếu dự đoaacuten sai ANN kiểm tra lại vagrave xaacutec định lại thocircng số để điều chỉnh Một mẫu dữ liệu khaacutec được biểu diễn vagrave quaacute trigravenh nagravey được lặp lại
8 Nguyecircn tắc cơ bản của cocircng nghệ nơron Caacutec yếu tố xử lyacute cơ bản trong hệ thống thần kinh của con người lagrave tế bagraveo
thần kinhMạng lưới của tế bagraveo nagravey lagrave liecircn kết với nhau nhận được thocircng tin từ caacutec cảm biến trong mắt taihellip
Thocircng tin nhận được bởi tế bagraveo thần kinh hoặc lagrave sẽ kiacutech thiacutech noacute(sẽ được chuyển qua 1 thocircng điệp dọc theo mạng lưới) hoặc lagrave sẽ ngăn cản noacute(ngăn cản dograveng thocircng tin)
Độ nhạy coacute thể thay đổi qua thời gian hoặc sau khi coacute được kinh nghiệm
9 Cấu truacutec mạng Một ANN gồm 3 lớp cơ bản
Lớp đầu vagraveo nhận dữ liệu Lớp becircn trong hoặc lagrave lớp ẩn xử lyacute dữ liệu Lớp đầu ra chuyển tiếp kết quả cuối cugraveng của mạng
10Mạng nơ ron Thường coacute nhiều đầu vagraveo mỗi đầu vagraveo với mức ảnh hưởng vagrave tầm quan
trọng riecircng của noacute Một đầu vagraveo quan trọng coacute thể được sử dụng để khuếch đại đầu ra caacutec hagravem trạng thaacutei tổng hợp caacutec trọng số của caacutec yếu tố
đầuvagraveo khaacutec nhauvagraveo một giaacute trị duy nhất Caacutec hagravem chuyển giao xử lyacute caacutec giaacute trị trạng thaacutei vagrave tạo đầu ra
11Huấn luyện mạng nơ ron Trong mocirc higravenh coacute giaacutem saacutetANN được đến so saacutenh dự đoaacuten của chiacutenh
noacute với thocircng tin phản hồi coacute chứa caacutec kết quả mong muốn ANN sẽ phải tigravem caacutech thay đổi caacutec tham số becircn trong củamigravenh (caacutec trọng số vagrave caacutec ngưỡng) để tạo necircn một aacutenh xạ coacute khả năng aacutenh xạcaacutec đầu vagraveo thagravenh caacutec đầu ra mong muốn Sự thay đổi nagravey được tiến hagravenh nhờ việc so saacutenh giữa đầu ra thực sự vagrave đầu ra mong muốn
Trong mocirc higravenh khocircng coacute giaacutem saacutetANN nhận được dữ liệu vagraveo nhưng khocircng phải coacute bất kỳ thocircng tin phản hồi về kết quả mong muốn
Phần lớn caacutec ứng dụng nằm trong vugraveng của caacutec bagravei toaacuten ước lượng như mocirc higravenh hoacuteathống kecirc neacuten lọc phacircn cụm
12Lợi iacutech Liecircn kết với mạng noron Traacutenh caacutech lập trigravenh tường minh Giảm nhu cầu của chuyecircn gia ANNs thigrave thiacutech nghi với caacutec yếu tố đầu vagraveo thay đổi Khocircng cần thiết cho cơ sở tri thức tinh chế ANNs coacute tiacutenh động vagrave cải thiện với việc sử dụng Coacute khả năng xử lyacute dữ liệu khocircng chiacutenh xaacutec hoặc khocircng đầy đủ Cho pheacutep tổng quaacutet hoacutea từ thocircng tin cụ thể Cho pheacutep thu thập cảm giaacutec thocircng thường vagraveo miền giải quyết vấn đề
13Hạn chế của việc liecircn kết với mạng noron ANNs khocircng thể giải thiacutech được suy luận Bản chất hộp đen thường khiến cho vấn đề traacutech nhiệm vagrave độ tin cậy phaacutet
sinh lagrave khoacute khăn Lặp đi lặp lại quaacute trigravenh huấn luyện rất tốn thời gian Nguồn lực caacutec nhagrave phacircn tiacutech vagrave thiết kế coacute tay nghề cao vẫn lagrave đaacuteng lo
ngại Cocircng nghệ ANN thuacutec đẩy hạn chế của phần cứng hiện tại ANN yecircu cầu phải coacute sự tin tưởng ở đầu ra
14Giới thiệu về thuật toaacuten di truyền Cũng như mạng lưới thần kinh caacutec thuật toaacuten di truyền được dựa trecircn lyacute
thuyết sinh học Thuật toaacuten di truyền tigravem thấy nguồn gốc của chuacuteng trong caacutec lyacute thuyết
tiến hoacutea của chọn lọc tự nhiecircn vagrave thiacutech ứng với biến đổi khiacute hậu Kết quả thuật toaacuten di truyền lagrave từ giao phối 2 caacute thể trong quần thế để tạo
ra con caacutei đocirci khi tốt hơn so với bậc cha mẹ của chuacuteng 15Caacutec thagravenh phần cơ bản của thuật toaacuten di truyền
Toaacuten tử chọn lọc Caacutec caacute thể tốt được chọn lọc để đưa vagraveo thế hệ sau Sự chọn lọc nagravey căn cứ vagraveo độ thiacutech nghi với mocirci trường của mỗi caacute thể
Toaacuten tử lai gheacutep (crossover) Hai caacute thể cha vagrave mẹ trao đổi caacutec gen với nhau để tạo ra caacute thể con
Toaacuten tử đột biến (mutation) Một caacute thể thay đổi một số gen để biến đổi thagravenh một caacute thể mớiTất cả caacutec toaacuten tử trecircn khi thực hiện đều mang tiacutenh ngẫu nhiecircn
16Quaacute trigravenh cơ bản của một thuật toaacuten di truyền Khởi tạo
Đaacutenh giaacute quần thể
Lựa chọn NST thiacutech hợp nhất vagrave loại bỏ NST yếu nhất
Quy trigravenh giao nhau vagrave cải thiện quần thể
đột biến tiến trigravenh để khaacutem phaacute ra NST mới
17Ưu nhược điểm của việc kết hợp với thuật toaacuten di truyền Kiacutech thước quần thể lagrave 1 yếu tố quan trọng trong tốc độ của việc tigravem
kiếmnhưng noacute tương đối dễ dagraveng để dự đoaacuten tốc độ nagravey Giao nhau hoặc đột biến lagrave khocircng necircn đc sử dụng quaacute thường xuyecircn Luocircn coacute được iacutet nhất 1 giải phaacutep hợp lyacute Necircn coacute thể aacutep dụng chuacuteng cho caacutec vấn đề magrave chuacuteng ta khocircng coacute hướng
về caacutech giải quyết Sức mạnh của thuật toaacuten xuất phaacutet từ khaacutei niệm đơn giảnkhocircng phải từ
một thủ tục thuật toaacuten phức tạp 18Tương lai của học maacutey
Mạng lưới thần kinh nhacircn tạo vượt quaacute năng lực của con người trong caacutec trường hợp bị cocirc lập
Về mặt lyacute thuyếtmột maacutey tiacutenh coacute thể xử lyacute dũ liệu nhanh hơn hagraveng triệu lần so với 1 con người
May mắn thay cho chuacuteng tacon người tốt hơn nhiều khi magrave coacute được dữ liệumaacutey tiacutenh khocircng coacute 1 số thứ như lagrave 5 giaacutec quan
CHƯƠNG 10 KHO DỮ LIỆU
1 Kho dữ liệu Kho dữ liệu lagrave tuyển tập caacutec cơ sở dữ liệu tiacutech hợp hướng chủ đề được
thiết kế để trợ giuacutep cho một hệ hỗ trợ quyết định
Theo John Ladley Cocircng nghệ kho dữ liệu lagrave tập caacutec phương phaacutep kỹ thuật vagrave caacutec cocircng cụ coacute thể kết hợp hỗ trợ nhau để cung cấp thocircng tin cho người sử dụng trecircn cơ sở tiacutech hợp từ nhiều nguồn dữ liệu nhiều mocirci trường khaacutec nhau
Kho dữ liệu thường rất lớn tới hagraveng trăm GB hay thậm chiacute hagraveng Terabyte
2 Kho dữ liệu vận hagravenh (ODS) Một kho dữ liệu vận hagravenh Aacutep dụng kỹ thuật kho dữ liệu vagraveo caacutec hệ xử
lyacute giao taacutec lưu trữ dữ liệu cho một ứng dụng đặc thugrave Noacute đưa vagraveo kho dữ liệu một dograveng caacutec dữ liệu thocirc được thiết kế
3 So saacutenh
Kho dữ liệu vận hagravenh Kho dữ liệu
Dữ liệu theo chủ đề Dữ liệu theo chủ đề
Dữ liệu tiacutech hợp Dữ liệu tiacutech hợp
Dữ liệu thay đổi Dữ liệu khocircng thay đổi
Dữ liệu được cập nhật khi thay đổi
Dữ liệu giữ nguyecircn
Chỉ coacute dữ liệu hiện tạiDữliệu hiện tại vagrave dữ liệu lịch sử
Chu kỳ lagravem tươi dữ liệu ngắn Chu kỳ lagravem tươi dữ liệu dagravei
Chỉ coacute dữ liệu chi tiết Dữ liệu chi tiết vagrave dữ liệu tổng kết
Dugraveng cho caacutec quyết định ngắn hạn
Dugraveng cho hoạch định dagravei hạn
4 Kho dữ liệu cục bộ (Data Mart - DM)
Kho dữ liệu cục bộ lagrave CSDL coacute những đặc điểm giống với kho dữ liệu nhưng với quy mocirc nhỏ hơn vagrave lưu trữ dữ liệu về một lĩnh vực một chuyecircn ngagravenh
Data mart phụ thuộc Chứa những dữ liệu được lấy từ DW vagrave những dữ liệu nagravey sẽ được triacutech lọc vagrave tinh chế tiacutech hợp lại ở mức cao hơn để phục vụ một chủ đề nhất định của Datamart
Data mart độc lập Khocircng giống như Datamart phụ thuộc Data mart độc lập được xacircy dựng trước DW vagrave dữ liệu được trực tiếp lấy từ caacutec nguồn khaacutec nhau
5 Siecircu dữ liệu Metadata lagrave dữ liệu để mocirc tả dữ liệu Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột
một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi Metadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu
6 Mocirci trường kho dữ liệu Hệ thống của tổ chức vagrave kho cung cấp dữ liệu để xacircy dựng kho dữ liệu Trong quaacute trigravenh chuyển dữ liệu từ caacutec nguồn khaacutec nhau dữ liệu coacute thể
được lagravem sạch hoặc chuyển đổi vagrave vigrave thế DW được xem như lagrave một chuẩn cho việc lưu trữ
Đồng thời siecircu dữ liệu được ghi lại Cuối cugraveng DW hoặc siecircu thị coacute thể được sử dụng để tạo ra một kho dữ
liệu ldquocaacute nhacircnrdquo 7 Caacutec đặc điểm của kho dữ liệu
Đặc điểm Mocirc tả
Hướng chủ đề - DL tổ chức theo caacutech thức người dugraveng tham chiếu
Tiacutech hợp - Dữ liệu ldquosạchrdquo loại bỏ tiacutenh thiếu nhất quaacuten
Khocircng thay đổi - DL ldquochỉ đọcrdquo người dugraveng khocircng thay đổi được
Chuỗi thời gian - DL lagrave chuỗi thời gian khocircng phải lagrave trạng thaacutei hiện tại
Được tổng kết - DL vận hagravenhthao taacutec khi cần thiết
được kết hợp lại thagravenh dạng coacute thể dugraveng được cho quyết định
Kiacutech cỡ lớn hơn - Lưu giữ theo chuỗi thời gian tức lagrave giữ lại nhiều DL
Khocircng được chuẩn hoacutea - Coacute thể dư thừa DLSiecircu dữ liệu - Dữ liệu của dữ liệu được lưu trữNguồn dữ liệu - DL vận hagravenh (caacutec hệ sẵn coacute) cugraveng
với caacutec nguồn ngoagravei 8 Kho dữ liệu hướng chủ đề
Hướng chủ để coacute nghĩa lagrave kho dữ liệu được tổ chức xung quanh caacutec chủ đề chiacutenh như khaacutech hagraveng sản phẩm sản xuất Tập trung vagraveo việc mocirc higravenh hoacutea vagrave phacircn tiacutech dữ liệu cho caacutec nhagrave ra quyết định magrave khocircng tập trung vagraveo caacutec xử lyacute thocircng thường Cung cấp cho người dugraveng một khung nhigraven toagraven vẹn đơn giản vagrave đầy đủ về caacutec sự kiện quanh caacutec chủ đề
9 Dữ liệu trong DW được tiacutech hợp Dữ liệu trong kho dữ liệu được xacircy dựng bằng caacutech tổng hợp dữ liệu từ
nhiều nguồn khaacutec nhau vagrave caacutec nguồn coacute tổ chức khaacutec nhau Cơ sở dữ liệu caacutec file excel caacutec flat file hoặc caacutec raw file Khi đưa vagraveo kho dữ liệu caacutec dữ liệu được lagravem sạch vagrave tiacutech hợp dữ liệu nhằm đảm bảo tiacutenh nhất quaacuten của dữ liệu
10Kiến truacutec kho dữ liệu Tầng cơ sở dữ liệu hoạt động Tầng truy xuất thocircng tin Tầng truy xuất dữ liệu Tầng siecircu dữ liệu Tầng quản lyacute tiến trigravenh Tầng thocircng điệp của ứng dụng Tầng vật liacute của kho dữ liệu Tầng trigravenh diễn dữ liệu
11Higravenh trạng kho dữ liệu Kho dữ liệu ảo - người dugraveng cuối coacute thể truy cập trực tiếp đến kho dữ liệu
sử dụng caacutec cocircng cụ cho pheacutep ở tầng truy xuất dữ liệu Kho dữ liệu trung tacircm-1 cơ sở dữ liệu vật lyacute chứa tất cả dữ liệu cho một
vugraveng chuyecircn dụng nagraveo đoacute
Kho dữ liệu phacircn taacuten- Thagravenh phần được phacircn taacuten qua nhiều hệ cơ sở dữ liệu vật lyacute
12METADATA- Siecircu dữ liệu Định nghĩa Siecircu dữ liệu lagrave dữ liệu về dữ liệu Lagrave 1 lưu trữ dugraveng để
Miecircu tả kho dữ liệu tổng thể Nhận dạng kiểu kho dữ liệu Quản liacute quaacute trigravenh tiacutech hợp dữ liệu Quản liacute quaacute trigravenh cập nhật kho dữ liệu Quản liacute bảo mật
Lagrave chigravea khoacutea quyết định sự thagravenh cocircng của kho dữ liệu luocircn được thay đổi vagrave cập nhật theo sự phaacutet triển của kho dữ liệu
Dugraveng để quản liacute điều khiển kho dữ liệu Sự ra đời của kho dữ liệu như 1 cấu truacutec hỗ trợ ra quyết định siecircu dữ liệu
được xem như nguồn tagravei nguyecircn dữ liệu Siecircu dữ liệu lagrave trừu tượng Chuacuteng lagrave dữ liệu bậc cao cung cấp mocirc tả ngắn
gọn caacutec dữ liệu bậc thấp hơn 13Hoạt động của Siecircu dữ liệu
Siecircu dữ liệu rất cần thiết trong việc chuyển hoacutea thocircng tin trở thagravenh tri thức Lagrave chigravea khoacutea giuacutep chuacuteng ta xử lyacute được dữ liệu thocirc Viacute dụ một dograveng dữ liệu baacuten hagraveng 1023 K596 11121 agraveNoacute sẽ khocircng coacute nghĩa gigrave cho đến khi chuacuteng ta đưa vagraveo siecircu dữ liệu (thư
mục chứa dữ liệu) agrave cửa hagraveng 1023 sản phẩm K596 vagrave số tiền baacuten được lagrave 11121 đocirc la
14Sự cần thiết phải nhất quaacuten trong kho dữ liệu Kho dữ liệu được xacircy dựng cho lợi iacutech của những nhagrave phacircn tiacutech kinh
doanh caacutec nhagrave quản trị cho tất cả caacutec khu vực chức năng Trong cơ sở dữ liệu riecircng caacutec khu vực khaacutec nhau coacute thể định nghĩa vagrave lưu
trữ dữ liệu thocircng qua phiecircn bản của chiacutenh noacute Khi dữ liệu được lấy từ những vugraveng khaacutec nhau đoacute vagrave được đặt vagraveo kho dữ
liệu Việc chuyển đổi vagrave lagravem sạch caacutec tiến trigravenh sẽ đảm bảo noacute lagrave duy nhất được tiacutech hợp tại một mức của tổ chức
15Ragrave soaacutet lại dữ liệu ndash Thực thi siecircu dữ liệu
Bất kể cấu truacutec tự nhiecircn của 1 cacircu truy vấn thế nagraveo thigrave caacutec thagravenh phần của siecircu dữ liệu rất quan trọng đối với người ra quyết định
Bảng thuộc tiacutenh khoacutea được lưu trữ bởi kho dữ liệu Tập hợp dữ liệu được lấy từ đacircu Những chuyển đổi nagraveo được thực thi với việc lagravem sạch
16Siecircu dữ liệu lagrave gigrave Metadata - lagrave thocircng tin mocirc tả nội dung của cơ sở dữ liệu (CSDL) Metadata baacuteo cho người dugraveng biết thời gian cập nhật sau cugraveng của dữ liệu
định dạng vagrave mục điacutech sử dụng của noacute Những thocircng tin nagravey coacute thể hướng dẫn người dugraveng duyệt qua CSDL vagrave
giuacutep họ hiểu được yacute nghĩa vagrave ngữ cảnh của dữ liệu Trong CSDL metadata lagrave caacutec dạng biểu diễn khaacutec nhau của caacutec đối tượng
trong CSDL Trong CSDL quan hệ metadata lagrave caacutec định nghĩa của bảng cột CSDL
view vagrave nhiều đối tượng khaacutec Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột
một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi -gtMetadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu
Bảng chuyển đổi Ghi lại những chuyển đổi đatilde được thực hiện
Lịch sử thực thi Ghi lại những dữ liệu đatilde được
phacircn tiacutech
Higravenh thaacutei kết nốiGhi lại những dữ liệu được kết nối vagrave tần suất
17Aacutenh xạ thocircng thường của siecircu dữ liệu Bản ghi aacutenh xạ chuyển đổi bao gồm
Định danh của nguồn gốc Chuyển đổi thuộc tiacutenh Chuyển đổi thuộc tiacutenh vật lyacute Matilde hoacutea tham chiếu bảng chuyển đổi Đổi tecircn Đổi khoacutea Gaacuten giaacute trị cho thuộc tiacutenh mặc định Chọn logic cho caacutec nguồn nhiều giaacute trị Đổi thuật toaacuten
18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để
phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai
lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave
tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec
Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm
Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo
19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua
caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau
SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được
Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra
một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức
Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ
Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ
Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech
CHƯƠNG 11 KHAI PHAacute DỮ LIỆU
1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn
ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993
Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng
2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd
1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều
2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP
3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn
4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng
5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server
6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo
7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động
8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời
9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều
10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện
11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech
12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP
3 Xử lyacute phacircn tiacutech trực tuyến OLAP
MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave
dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu
ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave
thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu
HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave
ROLAP4 Khai phaacute dữ liệu
Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh
khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn
Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan
5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp
6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại
Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp
Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec
Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt
Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra
Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh
vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho
Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec
Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm
Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục
Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng
gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp
Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn
Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec
Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper
Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2
Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25
Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước
Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng
Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện
trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp
Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute
độ hỗ trợ ge ngưỡng minsup
độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan
Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn
Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết
Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu
MOLAP ROLAP HOLAP
Lưu trữ dữ liệu cơ sở
Khối Bảng quan hệ Bảng quan hệ
Lưu trữ thocircng tin tổng hợp
Khối Bảng quan hệ Khối
Hiệu suất thực hiện truy vấn
Nhanh nhất Chậm nhất Nhanh
Tiecircu thụ khocircng gian lưu trữ
Nhiều Thấp Trung bigravenh
Chi phiacute bảo trigrave Cao Thấp Trung bigravenh
Bagravei toaacuten chuẩn đoaacuten (Diagnose)
Bagravei toaacuten gỡ rối (Debugging)
Bagravei toaacuten thiết kế
Tương tự như một dự aacuten phần mềm để xacircy dựng một hệ chuyecircn gia cần phải coacute caacutec yếu tố về nhacircn lực tagravei nguyecircn vagrave thời gian Những yếu tố nagravey ảnh hưởng đến giaacute thah của một hệ chuyecircn giaTrong phần nagravey cacircu hỏi thường được đặt ra lagrave tại sao cần phải xacircy dựng một hệ chuyecircn giaTrước khi bắt đầu phải xaacute định rotilde bagravei toaacuten đạt ra lagrave jiAi lagrave chuyecircn giaAi lagrave người sử dụng
1 Diễn giải (InterPretation) Nghiecircn cứu 1 vấn đề -gt Dựa trecircn những biểu hiện thuộc tiacutenh đặc trưng becircn ngoagravei -gt Tư vấn
(hoặc đưa ra kết luận hay mocirc tả dễ hiểu từ tập dữ liệu thocirc)
2 Bagravei toaacuten dự baacuteo (Prediction) Coacute thể dự đoaacuten được hagravenh vi kết quả dựa trecircn caacutec hiện tượng -gt dự baacuteo
VD Dự baacuteo thời tiết động đấthellip
3 Bagravei toaacuten chẩn đoaacuten (Diagnoss) Xaacutec định caacutec lỗi caacutec bộ phận hỏng hoacutec của hệ thống dựa trecircn caacutec dữ liệu quan saacutet được
4 Bagravei toaacuten gỡ rối (Debugging) Mocirc tả caacutec phương phaacutep khắc phục hệ thống khi gặp sự cố
5 Bagravei toaacuten thiết kế Lựa chọn cấu higravenh caacutec đối tượng nhằm thoả matilden một số ragraveng buộc nagraveo đoacute
6 Giảng dạy Phần mềm dạy học coacute thể chuẩn đoaacuten vagrave sủa lỗi của học sinh trong quaacute trigravenh học tập
Để xaacutec định đuacuteng bagravei toaacuten magrave chuacuteng ta cần giải quyết thigrave phải trả lời đc một số cacircu hỏi
- cần hệ chuyecircn gia
Bước 2 thu thập tri thức lựa chọn cocircng cụ vagrave aacutep dụng
Trong bước thu thập tri thức vấn đề quan trọng lagrave lựa chọn chuyecircn gia những người magrave sẽ đoacuteng goacutep tri thức cho hệ thống Thocircng thường trong suốt quaacute trigravenh phaacutet triển thigrave chuyecircn gia được xem như một thagravenh viecircn của đội phaacutet triển
Hiện nay coacute rất nhiều cocircng cụ để xacircy dựng một hệ chuyecircn gia Phổ biến nhất lagrave JESS CLIPS vagrave OPS5
Bước 3 Thiết kế cơ sở tri thức thiết kế hệ thốngTri thức được biểu diễn trường minh trong cơ sở tri thức
Caacutec chuyecircn gia vagrave kỹ sư tri thức sẽ đối thoại với nhau bằng caacutec kỹ thuật đối thoại Suy diễn (SD) bảng Mocirc higravenh hoacutea SD quy nạp phacircn loại
Vấn đề bagraveo trigrave vagrave phaacutet triển
Caacutec hệ chuyecircn gia đogravei hỏi phải bảo trigrave vagrave phaacutet triển nhiều hơn so với caacutec hệ thống khaacutec Phải thường xuyecircn bổ sung tri thức mới vagrave thay đổi caacutec tri thức cũ để đổi mới hệ chuyecircn gia
Thu thập vagrave khắc phục lỗi do người sử dụng phaacutet hiện để kịp thời khắc phục những sai soacutet của hệ chuyecircn gia
75 Lợi iacutech vagrave hạn chế của caacutec hệ chuyecircn gia
Một số lợi iacutech chiacutenh
Thời gian trả lời hợp lyacute bằng hoặc nhanh hơn so với chuyecircn gia (người) để đi đến cugraveng một quyết định Hệ chuyecircn gia lagrave một hệ thống thời gian thực (real time system)
Khả năng trả lời với mức độ tinh thocircng bằng hoặc cao hơn so với chuyecircn gia (người) trong cugraveng lĩnh vực
Hệ chuyecircn gia giuacutep cho hiệu quả lagravem việc tăng bằng việc sử dụng tập caacutec luật một caacutech nhanh choacuteng magrave ko bị nhầm lẫn chuyecircn gia lagrave người coacute thể quecircn đi một số tri thức cơ sở lyacute luậ nhưng HCG thigrave ko
Quyết định của một người chuyecircn gia coacute thể bị thay đổi vagrave ko coacute tiacutenh thống nhất như quyết định của một hệ chuyecircn gia tạo ra
Hệ chuyecircn gia giuacutep cho người sử dụng coacute thể trau dồi sự hiểu biết trecircn lĩnh vuej cụ thể magrave noacute giải quyết hỗ trợ người ra quyết định coacute trigravenh độ như 1 chuyecircn gia trong quaacute trigravenh gia quyết định
Kiến thức của rất nhiều chuyecircn gia về một lĩnh vực nagraveo đoacute được đưa vagraveo hệ chuyecircn gia lagravem cho CSTT cuat HCG phong phuacute vagrave rộng lớn hơn rất nhiều
HCG giải thiacutech caacutec bước suy luận một caacutech dễ hiểu nhất quaacuten luacutec nagraveo cũng coacute thể sử dụng ko như chuyecircn gia con người
Hạn chế của caacutec hệ chuyecircn gia
Nhược điểm lớn nhất của hệ chuyecircn gia lagrave những yacute kiến chuyecircn mocircn thường rất khoacute matilde hoacutea vagrave giải neacuten
Hệ chuyecircn gia khocircng coacute khả năng tự học tự cập nhật kiến thức mới như caacutec chuyecircn gia magrave cần phải được matilde hoacutea lại khi noacute được cập nhật
Hệ chuyecircn gia khocircng thể nhận ra được vấn đề khocircng nằm trong miền kiến thức của hệ thống
Chương 8 Tri thức vagrave tiếp nhận
1 Bao gồm caacutec vấn đề
Dữ liệu thực tế đo lường hoặc quan saacutet coacute hoặc khocircng coacute bối cảnh
Thocircng tin dữ liệu được tổng hợp một caacutech hữu iacutech để giải quyết những khoacute khăn trong việc đưa ra quyết định
Tri thức bao gồm caacutec ứng dụng quy tắc thocircng tin hướng dẫn của người ra quyết định
2 Những caacutei nhigraven về tri thức
Đại diện lagravem thế nagraveo để diễn tả tri thức viacute dụ như một quyển saacutech khocircng phải lagrave tri thức nhưng noacute lại lagrave một đại diện của tri thức
Sản xuất tri thức lagrave một tập hơp của hagraveng tồn kho coacute thể được sản xuất cũng như mua lại
Tri thức lagrave 1 trong 6 trạng thaacutei của hệ thống
1Dữ liệu 2Thocircng tin 3Cấu truacutec thocircng tin 4Sự thấu hiểu 5Yacute kiến 6 Quyết định
3 Caacutec loại tri thức Phổ biến mocirc tả dữ liệu thocircng tin thủ tục mọi thứ lagravem như thế nagraveo lập luận chiacutenh saacutech hoặc caacutec quy tắc
4 Thu thập Tri thức hệ chuyecircn gia Hầu hết caacutec phương phaacutep đều bắt đầu với mocirc higravenh của caacutec taacutec vụ trong đoacute
hệ chuyecircn gia được xacircy dựng Trong đoacute mocirc tả về caacutec lĩnh vực được tạo ra Caacutec kỹ sư sử dụng caacutec mocirc higravenh giả thuyết vagrave nhận thức về quaacute trigravenh phacircn
tiacutech để gợi ra caacutech giải quyết vấn đề về tri thức từ caacutec chuyecircn gia
5 Caacutec chiều của thu thập tri thức KE- driven caacutec kỹ sư trao đổi trực tiếp với caacutec chuyecircn gia Expert-driven Caacutec chuyecircn gia trực tiếp đưa chuyecircn mocircn của họ vagraveo hệ
thống maacutey tiacutenh Machine-driven Sử dụng caacutec cocircng cụ suy luận để triacutech xuất tri thức từ một
tập caacutec viacute dụ
6 Kỹ thuật thu thập tri thức Trao đổi gồm 2 loại cơ bản lagrave coacute cấu truacutec(coacute kịch bản) vagrave khocircng coacute cấu
truacutec( đối thoại trực tiếp) Giao thức phacircn tiacutech bằng lời Khi caacutec chuyecircn gia thực hiện một cocircng việc
của họ thigrave một bản ghi về cocircng việc đoacute được thực hiện Caacutec kỹ sư sẽ xacircy dựng mocirc higravenh cho những gigrave được ghi lại trong bản ghi
Phương phaacutep sagraveng lọc caacutec chuyecircn gia so saacutenh caacutec nhoacutem liecircn tiếp trong ba đối tượng vagrave cho biết tại sao nhoacutem thứ hai lại khaacutec nhoacutem thứ ba
7 Thu thập tri thức từ nhiều nguồn Thu thập tri thức từ nhiều nguồn lagrave cần thiết để coacute được đầy đủ caacutec tri thức
cho một vấn đề quan điểm yacute kiến traacutei ngược nhau thường phaacutet sinh Phương phaacutep đồng thuận sẽ giuacutep giải quyết được vấn đề macircu thuẫn Kỹ thuật phacircn tiacutech Meta lagrave kỹ thuật được aacutep dụng trong caacutec trường hợp
khaacutec Caacutech tiếp cận bằng định lượng đogravei hỏi caacutec kỹ sư cần cacircn nhắc yếu tố đầu vagraveo của caacutec chuyecircn gia khaacutec nhau
8 Xaacutec nhận hợp lệ vagrave kiểm tra tri thức Một khi thu thập tri thức noacute phải được đaacutenh giaacute về khả năng sử dụng vagrave độ
chiacutenh xaacutec Hai vấn đề cụ thể lagrave hiệu lực của những kiến thức vagrave kiểm tra việc xacircy dựng cơ sở của tri thức
Cần xaacutec nhận xem liệu hệ thống coacute thể hoạt động ở mức độ tối thiểu khocircng
Xaacutec minh liecircn quan đến việc so saacutenh từng chi tiết kỹ thuật của hệ thống những gigrave đatilde được thực hiện cuối cugraveng
9 Một số caacutec biện phaacutep xaacutec nhận Độ chiacutenh xaacutec Khả năng thiacutech nghi Mức độ đầy đủ Bề rộng Độ sacircu Hiệu lực Tổng quan Chiacutenh xaacutec Hiện thực Độ tin cậy Tiacutenh hữu dụng Mức độ
Chương 9 Học maacutey
1 Logic mờ vagrave ngocircn ngữ mờ(Fuzzy Logic and Linguistic Ambiguity)
Ngocircn ngữ tự nhiecircn gồm những khaacutei niệm mơ hồ vagrave khocircng chiacutenh xaacutectruyền tải ngữ nghĩa thocircng qua tiacutenh xấp xỉkhocircng rotilde ragraveng
Những xấp xỉ nagravey giuacutep con người coacute thể truyền tải hết được yacute nghĩa nhưng maacutey thigrave khocircng hiểu
Lagravem sao biểu diễn caacutec tri thức sử dụng caacutec khaacutei niệm khocircng rotilde ragraveng(mờ) hoặc khocircng chiacutenh xaacutec
2 Khaacutei niệm cơ bản của logic mờ tập mờ lagrave những tập hợp khocircng coacute một giới hạn rotilde Mỗi phần tử của noacute chỉ
chứa một mức độ hagravem liecircn thuộc của từng phần tử Vigrave vậy tập mờ khocircng giống như tập cổ điển Tập mờ coacute thể kết hợp với nhau qua những luật mờ magrave đặc trưng cho những hagravenh động trạng thaacutei vagrave thuộc tiacutenh của logic mờ được tận dụng khi thực hiện một bộ điều khiển mờ
Logic mờ dựa trecircn yacute tưởng mỗi phần tử thuộc vagraveo một tập hợp ở một mức độ nagraveo đấy
Locircgic mờ cho pheacutep độ liecircn thuộc (microA )coacute giaacute trị trong khoảng (01) Locircgic mờ coacute thể được coi lagrave mặt ứng dụng của lyacute thuyết tập mờ để xử lyacute caacutec
giaacute trị trong thế giới thực cho caacutec bagravei toaacuten phức tạp
3 So saacutenh tiacutenh đuacuteng đắn logic mờ vagrave xaacutec suất Xaacutec suất thigrave đề cập đến khả năng xảy ra một biến cố hay một điều gigrave đoacute Logic mờ đề cập đến cấp độ magrave đặc tiacutenh ở hiện tại
o viacute dụ1 người coacute chiều cao 6 feet thigrave coacute cấp độ lagrave 05 về chiều cao
4 Ưu điểm của logic mờ Caacutech tiếp cận rất tự nhiecircnkhocircng phức tạp Coacute thể mocirc higravenh hoacutea caacutec hagravem phi tuyến tugravey yacute phức tạp
Coacute thể tận dụng được kinh nghiệm từ những chuyecircn gia hagraveng đầu trong mọi lĩnh vực
Logic mờ được xacircy dựng dựa trecircn ngocircn ngữ tự nhiecircnNền tảng của logic mờ lagrave dựa trecircn cơ sở giao tiếp của con người
5 Nhược điểm của logic mờ Trong 1 hệ thống phức tạpsử dụng logic mờ coacute thể trở thagravenh trở ngại cho
việc xaacutec thực độ tin cậy của hệ thống Cơ chế lập luận mờ khocircng thể học hỏi từ những lỗi sai
6 Mạng noron nhacircn tạo(ANN) Mạng noron nhacircn tạo lagrave một mocirc phỏng xử lyacute thocircng tinđược nghiecircn cứu ra
từ hệ thống thần kinh của sinh vậtgiống như bộ natildeo để xử lyacute thocircng tin ANNs lagrave chương trigravenh dựa trecircn maacutey tiacutenh đơn giản coacute chức năng lagrave một mocirc
higravenh bagravei toaacuten khocircng gian dựa trecircn thử nghiệm vagrave baacuteo lỗi
7 Học từ kinh nghiệm Tiến trigravenh Một mẫu dữ liệu được biểu diễn như một mạng lưới noronANN ldquodự
đoaacutenrdquo 1 đầu radự đoaacuten được so saacutenh với giaacute trị thực tế hoặc giaacute trị chiacutenh xaacutecNếu đoaacuten được chiacutenh xaacutec thigrave khocircng coacute hagravenh động nagraveo được thực hiện
Nếu dự đoaacuten sai ANN kiểm tra lại vagrave xaacutec định lại thocircng số để điều chỉnh Một mẫu dữ liệu khaacutec được biểu diễn vagrave quaacute trigravenh nagravey được lặp lại
8 Nguyecircn tắc cơ bản của cocircng nghệ nơron Caacutec yếu tố xử lyacute cơ bản trong hệ thống thần kinh của con người lagrave tế bagraveo
thần kinhMạng lưới của tế bagraveo nagravey lagrave liecircn kết với nhau nhận được thocircng tin từ caacutec cảm biến trong mắt taihellip
Thocircng tin nhận được bởi tế bagraveo thần kinh hoặc lagrave sẽ kiacutech thiacutech noacute(sẽ được chuyển qua 1 thocircng điệp dọc theo mạng lưới) hoặc lagrave sẽ ngăn cản noacute(ngăn cản dograveng thocircng tin)
Độ nhạy coacute thể thay đổi qua thời gian hoặc sau khi coacute được kinh nghiệm
9 Cấu truacutec mạng Một ANN gồm 3 lớp cơ bản
Lớp đầu vagraveo nhận dữ liệu Lớp becircn trong hoặc lagrave lớp ẩn xử lyacute dữ liệu Lớp đầu ra chuyển tiếp kết quả cuối cugraveng của mạng
10Mạng nơ ron Thường coacute nhiều đầu vagraveo mỗi đầu vagraveo với mức ảnh hưởng vagrave tầm quan
trọng riecircng của noacute Một đầu vagraveo quan trọng coacute thể được sử dụng để khuếch đại đầu ra caacutec hagravem trạng thaacutei tổng hợp caacutec trọng số của caacutec yếu tố
đầuvagraveo khaacutec nhauvagraveo một giaacute trị duy nhất Caacutec hagravem chuyển giao xử lyacute caacutec giaacute trị trạng thaacutei vagrave tạo đầu ra
11Huấn luyện mạng nơ ron Trong mocirc higravenh coacute giaacutem saacutetANN được đến so saacutenh dự đoaacuten của chiacutenh
noacute với thocircng tin phản hồi coacute chứa caacutec kết quả mong muốn ANN sẽ phải tigravem caacutech thay đổi caacutec tham số becircn trong củamigravenh (caacutec trọng số vagrave caacutec ngưỡng) để tạo necircn một aacutenh xạ coacute khả năng aacutenh xạcaacutec đầu vagraveo thagravenh caacutec đầu ra mong muốn Sự thay đổi nagravey được tiến hagravenh nhờ việc so saacutenh giữa đầu ra thực sự vagrave đầu ra mong muốn
Trong mocirc higravenh khocircng coacute giaacutem saacutetANN nhận được dữ liệu vagraveo nhưng khocircng phải coacute bất kỳ thocircng tin phản hồi về kết quả mong muốn
Phần lớn caacutec ứng dụng nằm trong vugraveng của caacutec bagravei toaacuten ước lượng như mocirc higravenh hoacuteathống kecirc neacuten lọc phacircn cụm
12Lợi iacutech Liecircn kết với mạng noron Traacutenh caacutech lập trigravenh tường minh Giảm nhu cầu của chuyecircn gia ANNs thigrave thiacutech nghi với caacutec yếu tố đầu vagraveo thay đổi Khocircng cần thiết cho cơ sở tri thức tinh chế ANNs coacute tiacutenh động vagrave cải thiện với việc sử dụng Coacute khả năng xử lyacute dữ liệu khocircng chiacutenh xaacutec hoặc khocircng đầy đủ Cho pheacutep tổng quaacutet hoacutea từ thocircng tin cụ thể Cho pheacutep thu thập cảm giaacutec thocircng thường vagraveo miền giải quyết vấn đề
13Hạn chế của việc liecircn kết với mạng noron ANNs khocircng thể giải thiacutech được suy luận Bản chất hộp đen thường khiến cho vấn đề traacutech nhiệm vagrave độ tin cậy phaacutet
sinh lagrave khoacute khăn Lặp đi lặp lại quaacute trigravenh huấn luyện rất tốn thời gian Nguồn lực caacutec nhagrave phacircn tiacutech vagrave thiết kế coacute tay nghề cao vẫn lagrave đaacuteng lo
ngại Cocircng nghệ ANN thuacutec đẩy hạn chế của phần cứng hiện tại ANN yecircu cầu phải coacute sự tin tưởng ở đầu ra
14Giới thiệu về thuật toaacuten di truyền Cũng như mạng lưới thần kinh caacutec thuật toaacuten di truyền được dựa trecircn lyacute
thuyết sinh học Thuật toaacuten di truyền tigravem thấy nguồn gốc của chuacuteng trong caacutec lyacute thuyết
tiến hoacutea của chọn lọc tự nhiecircn vagrave thiacutech ứng với biến đổi khiacute hậu Kết quả thuật toaacuten di truyền lagrave từ giao phối 2 caacute thể trong quần thế để tạo
ra con caacutei đocirci khi tốt hơn so với bậc cha mẹ của chuacuteng 15Caacutec thagravenh phần cơ bản của thuật toaacuten di truyền
Toaacuten tử chọn lọc Caacutec caacute thể tốt được chọn lọc để đưa vagraveo thế hệ sau Sự chọn lọc nagravey căn cứ vagraveo độ thiacutech nghi với mocirci trường của mỗi caacute thể
Toaacuten tử lai gheacutep (crossover) Hai caacute thể cha vagrave mẹ trao đổi caacutec gen với nhau để tạo ra caacute thể con
Toaacuten tử đột biến (mutation) Một caacute thể thay đổi một số gen để biến đổi thagravenh một caacute thể mớiTất cả caacutec toaacuten tử trecircn khi thực hiện đều mang tiacutenh ngẫu nhiecircn
16Quaacute trigravenh cơ bản của một thuật toaacuten di truyền Khởi tạo
Đaacutenh giaacute quần thể
Lựa chọn NST thiacutech hợp nhất vagrave loại bỏ NST yếu nhất
Quy trigravenh giao nhau vagrave cải thiện quần thể
đột biến tiến trigravenh để khaacutem phaacute ra NST mới
17Ưu nhược điểm của việc kết hợp với thuật toaacuten di truyền Kiacutech thước quần thể lagrave 1 yếu tố quan trọng trong tốc độ của việc tigravem
kiếmnhưng noacute tương đối dễ dagraveng để dự đoaacuten tốc độ nagravey Giao nhau hoặc đột biến lagrave khocircng necircn đc sử dụng quaacute thường xuyecircn Luocircn coacute được iacutet nhất 1 giải phaacutep hợp lyacute Necircn coacute thể aacutep dụng chuacuteng cho caacutec vấn đề magrave chuacuteng ta khocircng coacute hướng
về caacutech giải quyết Sức mạnh của thuật toaacuten xuất phaacutet từ khaacutei niệm đơn giảnkhocircng phải từ
một thủ tục thuật toaacuten phức tạp 18Tương lai của học maacutey
Mạng lưới thần kinh nhacircn tạo vượt quaacute năng lực của con người trong caacutec trường hợp bị cocirc lập
Về mặt lyacute thuyếtmột maacutey tiacutenh coacute thể xử lyacute dũ liệu nhanh hơn hagraveng triệu lần so với 1 con người
May mắn thay cho chuacuteng tacon người tốt hơn nhiều khi magrave coacute được dữ liệumaacutey tiacutenh khocircng coacute 1 số thứ như lagrave 5 giaacutec quan
CHƯƠNG 10 KHO DỮ LIỆU
1 Kho dữ liệu Kho dữ liệu lagrave tuyển tập caacutec cơ sở dữ liệu tiacutech hợp hướng chủ đề được
thiết kế để trợ giuacutep cho một hệ hỗ trợ quyết định
Theo John Ladley Cocircng nghệ kho dữ liệu lagrave tập caacutec phương phaacutep kỹ thuật vagrave caacutec cocircng cụ coacute thể kết hợp hỗ trợ nhau để cung cấp thocircng tin cho người sử dụng trecircn cơ sở tiacutech hợp từ nhiều nguồn dữ liệu nhiều mocirci trường khaacutec nhau
Kho dữ liệu thường rất lớn tới hagraveng trăm GB hay thậm chiacute hagraveng Terabyte
2 Kho dữ liệu vận hagravenh (ODS) Một kho dữ liệu vận hagravenh Aacutep dụng kỹ thuật kho dữ liệu vagraveo caacutec hệ xử
lyacute giao taacutec lưu trữ dữ liệu cho một ứng dụng đặc thugrave Noacute đưa vagraveo kho dữ liệu một dograveng caacutec dữ liệu thocirc được thiết kế
3 So saacutenh
Kho dữ liệu vận hagravenh Kho dữ liệu
Dữ liệu theo chủ đề Dữ liệu theo chủ đề
Dữ liệu tiacutech hợp Dữ liệu tiacutech hợp
Dữ liệu thay đổi Dữ liệu khocircng thay đổi
Dữ liệu được cập nhật khi thay đổi
Dữ liệu giữ nguyecircn
Chỉ coacute dữ liệu hiện tạiDữliệu hiện tại vagrave dữ liệu lịch sử
Chu kỳ lagravem tươi dữ liệu ngắn Chu kỳ lagravem tươi dữ liệu dagravei
Chỉ coacute dữ liệu chi tiết Dữ liệu chi tiết vagrave dữ liệu tổng kết
Dugraveng cho caacutec quyết định ngắn hạn
Dugraveng cho hoạch định dagravei hạn
4 Kho dữ liệu cục bộ (Data Mart - DM)
Kho dữ liệu cục bộ lagrave CSDL coacute những đặc điểm giống với kho dữ liệu nhưng với quy mocirc nhỏ hơn vagrave lưu trữ dữ liệu về một lĩnh vực một chuyecircn ngagravenh
Data mart phụ thuộc Chứa những dữ liệu được lấy từ DW vagrave những dữ liệu nagravey sẽ được triacutech lọc vagrave tinh chế tiacutech hợp lại ở mức cao hơn để phục vụ một chủ đề nhất định của Datamart
Data mart độc lập Khocircng giống như Datamart phụ thuộc Data mart độc lập được xacircy dựng trước DW vagrave dữ liệu được trực tiếp lấy từ caacutec nguồn khaacutec nhau
5 Siecircu dữ liệu Metadata lagrave dữ liệu để mocirc tả dữ liệu Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột
một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi Metadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu
6 Mocirci trường kho dữ liệu Hệ thống của tổ chức vagrave kho cung cấp dữ liệu để xacircy dựng kho dữ liệu Trong quaacute trigravenh chuyển dữ liệu từ caacutec nguồn khaacutec nhau dữ liệu coacute thể
được lagravem sạch hoặc chuyển đổi vagrave vigrave thế DW được xem như lagrave một chuẩn cho việc lưu trữ
Đồng thời siecircu dữ liệu được ghi lại Cuối cugraveng DW hoặc siecircu thị coacute thể được sử dụng để tạo ra một kho dữ
liệu ldquocaacute nhacircnrdquo 7 Caacutec đặc điểm của kho dữ liệu
Đặc điểm Mocirc tả
Hướng chủ đề - DL tổ chức theo caacutech thức người dugraveng tham chiếu
Tiacutech hợp - Dữ liệu ldquosạchrdquo loại bỏ tiacutenh thiếu nhất quaacuten
Khocircng thay đổi - DL ldquochỉ đọcrdquo người dugraveng khocircng thay đổi được
Chuỗi thời gian - DL lagrave chuỗi thời gian khocircng phải lagrave trạng thaacutei hiện tại
Được tổng kết - DL vận hagravenhthao taacutec khi cần thiết
được kết hợp lại thagravenh dạng coacute thể dugraveng được cho quyết định
Kiacutech cỡ lớn hơn - Lưu giữ theo chuỗi thời gian tức lagrave giữ lại nhiều DL
Khocircng được chuẩn hoacutea - Coacute thể dư thừa DLSiecircu dữ liệu - Dữ liệu của dữ liệu được lưu trữNguồn dữ liệu - DL vận hagravenh (caacutec hệ sẵn coacute) cugraveng
với caacutec nguồn ngoagravei 8 Kho dữ liệu hướng chủ đề
Hướng chủ để coacute nghĩa lagrave kho dữ liệu được tổ chức xung quanh caacutec chủ đề chiacutenh như khaacutech hagraveng sản phẩm sản xuất Tập trung vagraveo việc mocirc higravenh hoacutea vagrave phacircn tiacutech dữ liệu cho caacutec nhagrave ra quyết định magrave khocircng tập trung vagraveo caacutec xử lyacute thocircng thường Cung cấp cho người dugraveng một khung nhigraven toagraven vẹn đơn giản vagrave đầy đủ về caacutec sự kiện quanh caacutec chủ đề
9 Dữ liệu trong DW được tiacutech hợp Dữ liệu trong kho dữ liệu được xacircy dựng bằng caacutech tổng hợp dữ liệu từ
nhiều nguồn khaacutec nhau vagrave caacutec nguồn coacute tổ chức khaacutec nhau Cơ sở dữ liệu caacutec file excel caacutec flat file hoặc caacutec raw file Khi đưa vagraveo kho dữ liệu caacutec dữ liệu được lagravem sạch vagrave tiacutech hợp dữ liệu nhằm đảm bảo tiacutenh nhất quaacuten của dữ liệu
10Kiến truacutec kho dữ liệu Tầng cơ sở dữ liệu hoạt động Tầng truy xuất thocircng tin Tầng truy xuất dữ liệu Tầng siecircu dữ liệu Tầng quản lyacute tiến trigravenh Tầng thocircng điệp của ứng dụng Tầng vật liacute của kho dữ liệu Tầng trigravenh diễn dữ liệu
11Higravenh trạng kho dữ liệu Kho dữ liệu ảo - người dugraveng cuối coacute thể truy cập trực tiếp đến kho dữ liệu
sử dụng caacutec cocircng cụ cho pheacutep ở tầng truy xuất dữ liệu Kho dữ liệu trung tacircm-1 cơ sở dữ liệu vật lyacute chứa tất cả dữ liệu cho một
vugraveng chuyecircn dụng nagraveo đoacute
Kho dữ liệu phacircn taacuten- Thagravenh phần được phacircn taacuten qua nhiều hệ cơ sở dữ liệu vật lyacute
12METADATA- Siecircu dữ liệu Định nghĩa Siecircu dữ liệu lagrave dữ liệu về dữ liệu Lagrave 1 lưu trữ dugraveng để
Miecircu tả kho dữ liệu tổng thể Nhận dạng kiểu kho dữ liệu Quản liacute quaacute trigravenh tiacutech hợp dữ liệu Quản liacute quaacute trigravenh cập nhật kho dữ liệu Quản liacute bảo mật
Lagrave chigravea khoacutea quyết định sự thagravenh cocircng của kho dữ liệu luocircn được thay đổi vagrave cập nhật theo sự phaacutet triển của kho dữ liệu
Dugraveng để quản liacute điều khiển kho dữ liệu Sự ra đời của kho dữ liệu như 1 cấu truacutec hỗ trợ ra quyết định siecircu dữ liệu
được xem như nguồn tagravei nguyecircn dữ liệu Siecircu dữ liệu lagrave trừu tượng Chuacuteng lagrave dữ liệu bậc cao cung cấp mocirc tả ngắn
gọn caacutec dữ liệu bậc thấp hơn 13Hoạt động của Siecircu dữ liệu
Siecircu dữ liệu rất cần thiết trong việc chuyển hoacutea thocircng tin trở thagravenh tri thức Lagrave chigravea khoacutea giuacutep chuacuteng ta xử lyacute được dữ liệu thocirc Viacute dụ một dograveng dữ liệu baacuten hagraveng 1023 K596 11121 agraveNoacute sẽ khocircng coacute nghĩa gigrave cho đến khi chuacuteng ta đưa vagraveo siecircu dữ liệu (thư
mục chứa dữ liệu) agrave cửa hagraveng 1023 sản phẩm K596 vagrave số tiền baacuten được lagrave 11121 đocirc la
14Sự cần thiết phải nhất quaacuten trong kho dữ liệu Kho dữ liệu được xacircy dựng cho lợi iacutech của những nhagrave phacircn tiacutech kinh
doanh caacutec nhagrave quản trị cho tất cả caacutec khu vực chức năng Trong cơ sở dữ liệu riecircng caacutec khu vực khaacutec nhau coacute thể định nghĩa vagrave lưu
trữ dữ liệu thocircng qua phiecircn bản của chiacutenh noacute Khi dữ liệu được lấy từ những vugraveng khaacutec nhau đoacute vagrave được đặt vagraveo kho dữ
liệu Việc chuyển đổi vagrave lagravem sạch caacutec tiến trigravenh sẽ đảm bảo noacute lagrave duy nhất được tiacutech hợp tại một mức của tổ chức
15Ragrave soaacutet lại dữ liệu ndash Thực thi siecircu dữ liệu
Bất kể cấu truacutec tự nhiecircn của 1 cacircu truy vấn thế nagraveo thigrave caacutec thagravenh phần của siecircu dữ liệu rất quan trọng đối với người ra quyết định
Bảng thuộc tiacutenh khoacutea được lưu trữ bởi kho dữ liệu Tập hợp dữ liệu được lấy từ đacircu Những chuyển đổi nagraveo được thực thi với việc lagravem sạch
16Siecircu dữ liệu lagrave gigrave Metadata - lagrave thocircng tin mocirc tả nội dung của cơ sở dữ liệu (CSDL) Metadata baacuteo cho người dugraveng biết thời gian cập nhật sau cugraveng của dữ liệu
định dạng vagrave mục điacutech sử dụng của noacute Những thocircng tin nagravey coacute thể hướng dẫn người dugraveng duyệt qua CSDL vagrave
giuacutep họ hiểu được yacute nghĩa vagrave ngữ cảnh của dữ liệu Trong CSDL metadata lagrave caacutec dạng biểu diễn khaacutec nhau của caacutec đối tượng
trong CSDL Trong CSDL quan hệ metadata lagrave caacutec định nghĩa của bảng cột CSDL
view vagrave nhiều đối tượng khaacutec Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột
một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi -gtMetadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu
Bảng chuyển đổi Ghi lại những chuyển đổi đatilde được thực hiện
Lịch sử thực thi Ghi lại những dữ liệu đatilde được
phacircn tiacutech
Higravenh thaacutei kết nốiGhi lại những dữ liệu được kết nối vagrave tần suất
17Aacutenh xạ thocircng thường của siecircu dữ liệu Bản ghi aacutenh xạ chuyển đổi bao gồm
Định danh của nguồn gốc Chuyển đổi thuộc tiacutenh Chuyển đổi thuộc tiacutenh vật lyacute Matilde hoacutea tham chiếu bảng chuyển đổi Đổi tecircn Đổi khoacutea Gaacuten giaacute trị cho thuộc tiacutenh mặc định Chọn logic cho caacutec nguồn nhiều giaacute trị Đổi thuật toaacuten
18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để
phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai
lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave
tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec
Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm
Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo
19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua
caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau
SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được
Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra
một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức
Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ
Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ
Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech
CHƯƠNG 11 KHAI PHAacute DỮ LIỆU
1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn
ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993
Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng
2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd
1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều
2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP
3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn
4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng
5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server
6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo
7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động
8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời
9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều
10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện
11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech
12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP
3 Xử lyacute phacircn tiacutech trực tuyến OLAP
MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave
dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu
ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave
thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu
HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave
ROLAP4 Khai phaacute dữ liệu
Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh
khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn
Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan
5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp
6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại
Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp
Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec
Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt
Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra
Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh
vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho
Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec
Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm
Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục
Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng
gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp
Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn
Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec
Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper
Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2
Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25
Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước
Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng
Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện
trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp
Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute
độ hỗ trợ ge ngưỡng minsup
độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan
Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn
Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết
Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu
MOLAP ROLAP HOLAP
Lưu trữ dữ liệu cơ sở
Khối Bảng quan hệ Bảng quan hệ
Lưu trữ thocircng tin tổng hợp
Khối Bảng quan hệ Khối
Hiệu suất thực hiện truy vấn
Nhanh nhất Chậm nhất Nhanh
Tiecircu thụ khocircng gian lưu trữ
Nhiều Thấp Trung bigravenh
Chi phiacute bảo trigrave Cao Thấp Trung bigravenh
Trong bước thu thập tri thức vấn đề quan trọng lagrave lựa chọn chuyecircn gia những người magrave sẽ đoacuteng goacutep tri thức cho hệ thống Thocircng thường trong suốt quaacute trigravenh phaacutet triển thigrave chuyecircn gia được xem như một thagravenh viecircn của đội phaacutet triển
Hiện nay coacute rất nhiều cocircng cụ để xacircy dựng một hệ chuyecircn gia Phổ biến nhất lagrave JESS CLIPS vagrave OPS5
Bước 3 Thiết kế cơ sở tri thức thiết kế hệ thốngTri thức được biểu diễn trường minh trong cơ sở tri thức
Caacutec chuyecircn gia vagrave kỹ sư tri thức sẽ đối thoại với nhau bằng caacutec kỹ thuật đối thoại Suy diễn (SD) bảng Mocirc higravenh hoacutea SD quy nạp phacircn loại
Vấn đề bagraveo trigrave vagrave phaacutet triển
Caacutec hệ chuyecircn gia đogravei hỏi phải bảo trigrave vagrave phaacutet triển nhiều hơn so với caacutec hệ thống khaacutec Phải thường xuyecircn bổ sung tri thức mới vagrave thay đổi caacutec tri thức cũ để đổi mới hệ chuyecircn gia
Thu thập vagrave khắc phục lỗi do người sử dụng phaacutet hiện để kịp thời khắc phục những sai soacutet của hệ chuyecircn gia
75 Lợi iacutech vagrave hạn chế của caacutec hệ chuyecircn gia
Một số lợi iacutech chiacutenh
Thời gian trả lời hợp lyacute bằng hoặc nhanh hơn so với chuyecircn gia (người) để đi đến cugraveng một quyết định Hệ chuyecircn gia lagrave một hệ thống thời gian thực (real time system)
Khả năng trả lời với mức độ tinh thocircng bằng hoặc cao hơn so với chuyecircn gia (người) trong cugraveng lĩnh vực
Hệ chuyecircn gia giuacutep cho hiệu quả lagravem việc tăng bằng việc sử dụng tập caacutec luật một caacutech nhanh choacuteng magrave ko bị nhầm lẫn chuyecircn gia lagrave người coacute thể quecircn đi một số tri thức cơ sở lyacute luậ nhưng HCG thigrave ko
Quyết định của một người chuyecircn gia coacute thể bị thay đổi vagrave ko coacute tiacutenh thống nhất như quyết định của một hệ chuyecircn gia tạo ra
Hệ chuyecircn gia giuacutep cho người sử dụng coacute thể trau dồi sự hiểu biết trecircn lĩnh vuej cụ thể magrave noacute giải quyết hỗ trợ người ra quyết định coacute trigravenh độ như 1 chuyecircn gia trong quaacute trigravenh gia quyết định
Kiến thức của rất nhiều chuyecircn gia về một lĩnh vực nagraveo đoacute được đưa vagraveo hệ chuyecircn gia lagravem cho CSTT cuat HCG phong phuacute vagrave rộng lớn hơn rất nhiều
HCG giải thiacutech caacutec bước suy luận một caacutech dễ hiểu nhất quaacuten luacutec nagraveo cũng coacute thể sử dụng ko như chuyecircn gia con người
Hạn chế của caacutec hệ chuyecircn gia
Nhược điểm lớn nhất của hệ chuyecircn gia lagrave những yacute kiến chuyecircn mocircn thường rất khoacute matilde hoacutea vagrave giải neacuten
Hệ chuyecircn gia khocircng coacute khả năng tự học tự cập nhật kiến thức mới như caacutec chuyecircn gia magrave cần phải được matilde hoacutea lại khi noacute được cập nhật
Hệ chuyecircn gia khocircng thể nhận ra được vấn đề khocircng nằm trong miền kiến thức của hệ thống
Chương 8 Tri thức vagrave tiếp nhận
1 Bao gồm caacutec vấn đề
Dữ liệu thực tế đo lường hoặc quan saacutet coacute hoặc khocircng coacute bối cảnh
Thocircng tin dữ liệu được tổng hợp một caacutech hữu iacutech để giải quyết những khoacute khăn trong việc đưa ra quyết định
Tri thức bao gồm caacutec ứng dụng quy tắc thocircng tin hướng dẫn của người ra quyết định
2 Những caacutei nhigraven về tri thức
Đại diện lagravem thế nagraveo để diễn tả tri thức viacute dụ như một quyển saacutech khocircng phải lagrave tri thức nhưng noacute lại lagrave một đại diện của tri thức
Sản xuất tri thức lagrave một tập hơp của hagraveng tồn kho coacute thể được sản xuất cũng như mua lại
Tri thức lagrave 1 trong 6 trạng thaacutei của hệ thống
1Dữ liệu 2Thocircng tin 3Cấu truacutec thocircng tin 4Sự thấu hiểu 5Yacute kiến 6 Quyết định
3 Caacutec loại tri thức Phổ biến mocirc tả dữ liệu thocircng tin thủ tục mọi thứ lagravem như thế nagraveo lập luận chiacutenh saacutech hoặc caacutec quy tắc
4 Thu thập Tri thức hệ chuyecircn gia Hầu hết caacutec phương phaacutep đều bắt đầu với mocirc higravenh của caacutec taacutec vụ trong đoacute
hệ chuyecircn gia được xacircy dựng Trong đoacute mocirc tả về caacutec lĩnh vực được tạo ra Caacutec kỹ sư sử dụng caacutec mocirc higravenh giả thuyết vagrave nhận thức về quaacute trigravenh phacircn
tiacutech để gợi ra caacutech giải quyết vấn đề về tri thức từ caacutec chuyecircn gia
5 Caacutec chiều của thu thập tri thức KE- driven caacutec kỹ sư trao đổi trực tiếp với caacutec chuyecircn gia Expert-driven Caacutec chuyecircn gia trực tiếp đưa chuyecircn mocircn của họ vagraveo hệ
thống maacutey tiacutenh Machine-driven Sử dụng caacutec cocircng cụ suy luận để triacutech xuất tri thức từ một
tập caacutec viacute dụ
6 Kỹ thuật thu thập tri thức Trao đổi gồm 2 loại cơ bản lagrave coacute cấu truacutec(coacute kịch bản) vagrave khocircng coacute cấu
truacutec( đối thoại trực tiếp) Giao thức phacircn tiacutech bằng lời Khi caacutec chuyecircn gia thực hiện một cocircng việc
của họ thigrave một bản ghi về cocircng việc đoacute được thực hiện Caacutec kỹ sư sẽ xacircy dựng mocirc higravenh cho những gigrave được ghi lại trong bản ghi
Phương phaacutep sagraveng lọc caacutec chuyecircn gia so saacutenh caacutec nhoacutem liecircn tiếp trong ba đối tượng vagrave cho biết tại sao nhoacutem thứ hai lại khaacutec nhoacutem thứ ba
7 Thu thập tri thức từ nhiều nguồn Thu thập tri thức từ nhiều nguồn lagrave cần thiết để coacute được đầy đủ caacutec tri thức
cho một vấn đề quan điểm yacute kiến traacutei ngược nhau thường phaacutet sinh Phương phaacutep đồng thuận sẽ giuacutep giải quyết được vấn đề macircu thuẫn Kỹ thuật phacircn tiacutech Meta lagrave kỹ thuật được aacutep dụng trong caacutec trường hợp
khaacutec Caacutech tiếp cận bằng định lượng đogravei hỏi caacutec kỹ sư cần cacircn nhắc yếu tố đầu vagraveo của caacutec chuyecircn gia khaacutec nhau
8 Xaacutec nhận hợp lệ vagrave kiểm tra tri thức Một khi thu thập tri thức noacute phải được đaacutenh giaacute về khả năng sử dụng vagrave độ
chiacutenh xaacutec Hai vấn đề cụ thể lagrave hiệu lực của những kiến thức vagrave kiểm tra việc xacircy dựng cơ sở của tri thức
Cần xaacutec nhận xem liệu hệ thống coacute thể hoạt động ở mức độ tối thiểu khocircng
Xaacutec minh liecircn quan đến việc so saacutenh từng chi tiết kỹ thuật của hệ thống những gigrave đatilde được thực hiện cuối cugraveng
9 Một số caacutec biện phaacutep xaacutec nhận Độ chiacutenh xaacutec Khả năng thiacutech nghi Mức độ đầy đủ Bề rộng Độ sacircu Hiệu lực Tổng quan Chiacutenh xaacutec Hiện thực Độ tin cậy Tiacutenh hữu dụng Mức độ
Chương 9 Học maacutey
1 Logic mờ vagrave ngocircn ngữ mờ(Fuzzy Logic and Linguistic Ambiguity)
Ngocircn ngữ tự nhiecircn gồm những khaacutei niệm mơ hồ vagrave khocircng chiacutenh xaacutectruyền tải ngữ nghĩa thocircng qua tiacutenh xấp xỉkhocircng rotilde ragraveng
Những xấp xỉ nagravey giuacutep con người coacute thể truyền tải hết được yacute nghĩa nhưng maacutey thigrave khocircng hiểu
Lagravem sao biểu diễn caacutec tri thức sử dụng caacutec khaacutei niệm khocircng rotilde ragraveng(mờ) hoặc khocircng chiacutenh xaacutec
2 Khaacutei niệm cơ bản của logic mờ tập mờ lagrave những tập hợp khocircng coacute một giới hạn rotilde Mỗi phần tử của noacute chỉ
chứa một mức độ hagravem liecircn thuộc của từng phần tử Vigrave vậy tập mờ khocircng giống như tập cổ điển Tập mờ coacute thể kết hợp với nhau qua những luật mờ magrave đặc trưng cho những hagravenh động trạng thaacutei vagrave thuộc tiacutenh của logic mờ được tận dụng khi thực hiện một bộ điều khiển mờ
Logic mờ dựa trecircn yacute tưởng mỗi phần tử thuộc vagraveo một tập hợp ở một mức độ nagraveo đấy
Locircgic mờ cho pheacutep độ liecircn thuộc (microA )coacute giaacute trị trong khoảng (01) Locircgic mờ coacute thể được coi lagrave mặt ứng dụng của lyacute thuyết tập mờ để xử lyacute caacutec
giaacute trị trong thế giới thực cho caacutec bagravei toaacuten phức tạp
3 So saacutenh tiacutenh đuacuteng đắn logic mờ vagrave xaacutec suất Xaacutec suất thigrave đề cập đến khả năng xảy ra một biến cố hay một điều gigrave đoacute Logic mờ đề cập đến cấp độ magrave đặc tiacutenh ở hiện tại
o viacute dụ1 người coacute chiều cao 6 feet thigrave coacute cấp độ lagrave 05 về chiều cao
4 Ưu điểm của logic mờ Caacutech tiếp cận rất tự nhiecircnkhocircng phức tạp Coacute thể mocirc higravenh hoacutea caacutec hagravem phi tuyến tugravey yacute phức tạp
Coacute thể tận dụng được kinh nghiệm từ những chuyecircn gia hagraveng đầu trong mọi lĩnh vực
Logic mờ được xacircy dựng dựa trecircn ngocircn ngữ tự nhiecircnNền tảng của logic mờ lagrave dựa trecircn cơ sở giao tiếp của con người
5 Nhược điểm của logic mờ Trong 1 hệ thống phức tạpsử dụng logic mờ coacute thể trở thagravenh trở ngại cho
việc xaacutec thực độ tin cậy của hệ thống Cơ chế lập luận mờ khocircng thể học hỏi từ những lỗi sai
6 Mạng noron nhacircn tạo(ANN) Mạng noron nhacircn tạo lagrave một mocirc phỏng xử lyacute thocircng tinđược nghiecircn cứu ra
từ hệ thống thần kinh của sinh vậtgiống như bộ natildeo để xử lyacute thocircng tin ANNs lagrave chương trigravenh dựa trecircn maacutey tiacutenh đơn giản coacute chức năng lagrave một mocirc
higravenh bagravei toaacuten khocircng gian dựa trecircn thử nghiệm vagrave baacuteo lỗi
7 Học từ kinh nghiệm Tiến trigravenh Một mẫu dữ liệu được biểu diễn như một mạng lưới noronANN ldquodự
đoaacutenrdquo 1 đầu radự đoaacuten được so saacutenh với giaacute trị thực tế hoặc giaacute trị chiacutenh xaacutecNếu đoaacuten được chiacutenh xaacutec thigrave khocircng coacute hagravenh động nagraveo được thực hiện
Nếu dự đoaacuten sai ANN kiểm tra lại vagrave xaacutec định lại thocircng số để điều chỉnh Một mẫu dữ liệu khaacutec được biểu diễn vagrave quaacute trigravenh nagravey được lặp lại
8 Nguyecircn tắc cơ bản của cocircng nghệ nơron Caacutec yếu tố xử lyacute cơ bản trong hệ thống thần kinh của con người lagrave tế bagraveo
thần kinhMạng lưới của tế bagraveo nagravey lagrave liecircn kết với nhau nhận được thocircng tin từ caacutec cảm biến trong mắt taihellip
Thocircng tin nhận được bởi tế bagraveo thần kinh hoặc lagrave sẽ kiacutech thiacutech noacute(sẽ được chuyển qua 1 thocircng điệp dọc theo mạng lưới) hoặc lagrave sẽ ngăn cản noacute(ngăn cản dograveng thocircng tin)
Độ nhạy coacute thể thay đổi qua thời gian hoặc sau khi coacute được kinh nghiệm
9 Cấu truacutec mạng Một ANN gồm 3 lớp cơ bản
Lớp đầu vagraveo nhận dữ liệu Lớp becircn trong hoặc lagrave lớp ẩn xử lyacute dữ liệu Lớp đầu ra chuyển tiếp kết quả cuối cugraveng của mạng
10Mạng nơ ron Thường coacute nhiều đầu vagraveo mỗi đầu vagraveo với mức ảnh hưởng vagrave tầm quan
trọng riecircng của noacute Một đầu vagraveo quan trọng coacute thể được sử dụng để khuếch đại đầu ra caacutec hagravem trạng thaacutei tổng hợp caacutec trọng số của caacutec yếu tố
đầuvagraveo khaacutec nhauvagraveo một giaacute trị duy nhất Caacutec hagravem chuyển giao xử lyacute caacutec giaacute trị trạng thaacutei vagrave tạo đầu ra
11Huấn luyện mạng nơ ron Trong mocirc higravenh coacute giaacutem saacutetANN được đến so saacutenh dự đoaacuten của chiacutenh
noacute với thocircng tin phản hồi coacute chứa caacutec kết quả mong muốn ANN sẽ phải tigravem caacutech thay đổi caacutec tham số becircn trong củamigravenh (caacutec trọng số vagrave caacutec ngưỡng) để tạo necircn một aacutenh xạ coacute khả năng aacutenh xạcaacutec đầu vagraveo thagravenh caacutec đầu ra mong muốn Sự thay đổi nagravey được tiến hagravenh nhờ việc so saacutenh giữa đầu ra thực sự vagrave đầu ra mong muốn
Trong mocirc higravenh khocircng coacute giaacutem saacutetANN nhận được dữ liệu vagraveo nhưng khocircng phải coacute bất kỳ thocircng tin phản hồi về kết quả mong muốn
Phần lớn caacutec ứng dụng nằm trong vugraveng của caacutec bagravei toaacuten ước lượng như mocirc higravenh hoacuteathống kecirc neacuten lọc phacircn cụm
12Lợi iacutech Liecircn kết với mạng noron Traacutenh caacutech lập trigravenh tường minh Giảm nhu cầu của chuyecircn gia ANNs thigrave thiacutech nghi với caacutec yếu tố đầu vagraveo thay đổi Khocircng cần thiết cho cơ sở tri thức tinh chế ANNs coacute tiacutenh động vagrave cải thiện với việc sử dụng Coacute khả năng xử lyacute dữ liệu khocircng chiacutenh xaacutec hoặc khocircng đầy đủ Cho pheacutep tổng quaacutet hoacutea từ thocircng tin cụ thể Cho pheacutep thu thập cảm giaacutec thocircng thường vagraveo miền giải quyết vấn đề
13Hạn chế của việc liecircn kết với mạng noron ANNs khocircng thể giải thiacutech được suy luận Bản chất hộp đen thường khiến cho vấn đề traacutech nhiệm vagrave độ tin cậy phaacutet
sinh lagrave khoacute khăn Lặp đi lặp lại quaacute trigravenh huấn luyện rất tốn thời gian Nguồn lực caacutec nhagrave phacircn tiacutech vagrave thiết kế coacute tay nghề cao vẫn lagrave đaacuteng lo
ngại Cocircng nghệ ANN thuacutec đẩy hạn chế của phần cứng hiện tại ANN yecircu cầu phải coacute sự tin tưởng ở đầu ra
14Giới thiệu về thuật toaacuten di truyền Cũng như mạng lưới thần kinh caacutec thuật toaacuten di truyền được dựa trecircn lyacute
thuyết sinh học Thuật toaacuten di truyền tigravem thấy nguồn gốc của chuacuteng trong caacutec lyacute thuyết
tiến hoacutea của chọn lọc tự nhiecircn vagrave thiacutech ứng với biến đổi khiacute hậu Kết quả thuật toaacuten di truyền lagrave từ giao phối 2 caacute thể trong quần thế để tạo
ra con caacutei đocirci khi tốt hơn so với bậc cha mẹ của chuacuteng 15Caacutec thagravenh phần cơ bản của thuật toaacuten di truyền
Toaacuten tử chọn lọc Caacutec caacute thể tốt được chọn lọc để đưa vagraveo thế hệ sau Sự chọn lọc nagravey căn cứ vagraveo độ thiacutech nghi với mocirci trường của mỗi caacute thể
Toaacuten tử lai gheacutep (crossover) Hai caacute thể cha vagrave mẹ trao đổi caacutec gen với nhau để tạo ra caacute thể con
Toaacuten tử đột biến (mutation) Một caacute thể thay đổi một số gen để biến đổi thagravenh một caacute thể mớiTất cả caacutec toaacuten tử trecircn khi thực hiện đều mang tiacutenh ngẫu nhiecircn
16Quaacute trigravenh cơ bản của một thuật toaacuten di truyền Khởi tạo
Đaacutenh giaacute quần thể
Lựa chọn NST thiacutech hợp nhất vagrave loại bỏ NST yếu nhất
Quy trigravenh giao nhau vagrave cải thiện quần thể
đột biến tiến trigravenh để khaacutem phaacute ra NST mới
17Ưu nhược điểm của việc kết hợp với thuật toaacuten di truyền Kiacutech thước quần thể lagrave 1 yếu tố quan trọng trong tốc độ của việc tigravem
kiếmnhưng noacute tương đối dễ dagraveng để dự đoaacuten tốc độ nagravey Giao nhau hoặc đột biến lagrave khocircng necircn đc sử dụng quaacute thường xuyecircn Luocircn coacute được iacutet nhất 1 giải phaacutep hợp lyacute Necircn coacute thể aacutep dụng chuacuteng cho caacutec vấn đề magrave chuacuteng ta khocircng coacute hướng
về caacutech giải quyết Sức mạnh của thuật toaacuten xuất phaacutet từ khaacutei niệm đơn giảnkhocircng phải từ
một thủ tục thuật toaacuten phức tạp 18Tương lai của học maacutey
Mạng lưới thần kinh nhacircn tạo vượt quaacute năng lực của con người trong caacutec trường hợp bị cocirc lập
Về mặt lyacute thuyếtmột maacutey tiacutenh coacute thể xử lyacute dũ liệu nhanh hơn hagraveng triệu lần so với 1 con người
May mắn thay cho chuacuteng tacon người tốt hơn nhiều khi magrave coacute được dữ liệumaacutey tiacutenh khocircng coacute 1 số thứ như lagrave 5 giaacutec quan
CHƯƠNG 10 KHO DỮ LIỆU
1 Kho dữ liệu Kho dữ liệu lagrave tuyển tập caacutec cơ sở dữ liệu tiacutech hợp hướng chủ đề được
thiết kế để trợ giuacutep cho một hệ hỗ trợ quyết định
Theo John Ladley Cocircng nghệ kho dữ liệu lagrave tập caacutec phương phaacutep kỹ thuật vagrave caacutec cocircng cụ coacute thể kết hợp hỗ trợ nhau để cung cấp thocircng tin cho người sử dụng trecircn cơ sở tiacutech hợp từ nhiều nguồn dữ liệu nhiều mocirci trường khaacutec nhau
Kho dữ liệu thường rất lớn tới hagraveng trăm GB hay thậm chiacute hagraveng Terabyte
2 Kho dữ liệu vận hagravenh (ODS) Một kho dữ liệu vận hagravenh Aacutep dụng kỹ thuật kho dữ liệu vagraveo caacutec hệ xử
lyacute giao taacutec lưu trữ dữ liệu cho một ứng dụng đặc thugrave Noacute đưa vagraveo kho dữ liệu một dograveng caacutec dữ liệu thocirc được thiết kế
3 So saacutenh
Kho dữ liệu vận hagravenh Kho dữ liệu
Dữ liệu theo chủ đề Dữ liệu theo chủ đề
Dữ liệu tiacutech hợp Dữ liệu tiacutech hợp
Dữ liệu thay đổi Dữ liệu khocircng thay đổi
Dữ liệu được cập nhật khi thay đổi
Dữ liệu giữ nguyecircn
Chỉ coacute dữ liệu hiện tạiDữliệu hiện tại vagrave dữ liệu lịch sử
Chu kỳ lagravem tươi dữ liệu ngắn Chu kỳ lagravem tươi dữ liệu dagravei
Chỉ coacute dữ liệu chi tiết Dữ liệu chi tiết vagrave dữ liệu tổng kết
Dugraveng cho caacutec quyết định ngắn hạn
Dugraveng cho hoạch định dagravei hạn
4 Kho dữ liệu cục bộ (Data Mart - DM)
Kho dữ liệu cục bộ lagrave CSDL coacute những đặc điểm giống với kho dữ liệu nhưng với quy mocirc nhỏ hơn vagrave lưu trữ dữ liệu về một lĩnh vực một chuyecircn ngagravenh
Data mart phụ thuộc Chứa những dữ liệu được lấy từ DW vagrave những dữ liệu nagravey sẽ được triacutech lọc vagrave tinh chế tiacutech hợp lại ở mức cao hơn để phục vụ một chủ đề nhất định của Datamart
Data mart độc lập Khocircng giống như Datamart phụ thuộc Data mart độc lập được xacircy dựng trước DW vagrave dữ liệu được trực tiếp lấy từ caacutec nguồn khaacutec nhau
5 Siecircu dữ liệu Metadata lagrave dữ liệu để mocirc tả dữ liệu Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột
một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi Metadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu
6 Mocirci trường kho dữ liệu Hệ thống của tổ chức vagrave kho cung cấp dữ liệu để xacircy dựng kho dữ liệu Trong quaacute trigravenh chuyển dữ liệu từ caacutec nguồn khaacutec nhau dữ liệu coacute thể
được lagravem sạch hoặc chuyển đổi vagrave vigrave thế DW được xem như lagrave một chuẩn cho việc lưu trữ
Đồng thời siecircu dữ liệu được ghi lại Cuối cugraveng DW hoặc siecircu thị coacute thể được sử dụng để tạo ra một kho dữ
liệu ldquocaacute nhacircnrdquo 7 Caacutec đặc điểm của kho dữ liệu
Đặc điểm Mocirc tả
Hướng chủ đề - DL tổ chức theo caacutech thức người dugraveng tham chiếu
Tiacutech hợp - Dữ liệu ldquosạchrdquo loại bỏ tiacutenh thiếu nhất quaacuten
Khocircng thay đổi - DL ldquochỉ đọcrdquo người dugraveng khocircng thay đổi được
Chuỗi thời gian - DL lagrave chuỗi thời gian khocircng phải lagrave trạng thaacutei hiện tại
Được tổng kết - DL vận hagravenhthao taacutec khi cần thiết
được kết hợp lại thagravenh dạng coacute thể dugraveng được cho quyết định
Kiacutech cỡ lớn hơn - Lưu giữ theo chuỗi thời gian tức lagrave giữ lại nhiều DL
Khocircng được chuẩn hoacutea - Coacute thể dư thừa DLSiecircu dữ liệu - Dữ liệu của dữ liệu được lưu trữNguồn dữ liệu - DL vận hagravenh (caacutec hệ sẵn coacute) cugraveng
với caacutec nguồn ngoagravei 8 Kho dữ liệu hướng chủ đề
Hướng chủ để coacute nghĩa lagrave kho dữ liệu được tổ chức xung quanh caacutec chủ đề chiacutenh như khaacutech hagraveng sản phẩm sản xuất Tập trung vagraveo việc mocirc higravenh hoacutea vagrave phacircn tiacutech dữ liệu cho caacutec nhagrave ra quyết định magrave khocircng tập trung vagraveo caacutec xử lyacute thocircng thường Cung cấp cho người dugraveng một khung nhigraven toagraven vẹn đơn giản vagrave đầy đủ về caacutec sự kiện quanh caacutec chủ đề
9 Dữ liệu trong DW được tiacutech hợp Dữ liệu trong kho dữ liệu được xacircy dựng bằng caacutech tổng hợp dữ liệu từ
nhiều nguồn khaacutec nhau vagrave caacutec nguồn coacute tổ chức khaacutec nhau Cơ sở dữ liệu caacutec file excel caacutec flat file hoặc caacutec raw file Khi đưa vagraveo kho dữ liệu caacutec dữ liệu được lagravem sạch vagrave tiacutech hợp dữ liệu nhằm đảm bảo tiacutenh nhất quaacuten của dữ liệu
10Kiến truacutec kho dữ liệu Tầng cơ sở dữ liệu hoạt động Tầng truy xuất thocircng tin Tầng truy xuất dữ liệu Tầng siecircu dữ liệu Tầng quản lyacute tiến trigravenh Tầng thocircng điệp của ứng dụng Tầng vật liacute của kho dữ liệu Tầng trigravenh diễn dữ liệu
11Higravenh trạng kho dữ liệu Kho dữ liệu ảo - người dugraveng cuối coacute thể truy cập trực tiếp đến kho dữ liệu
sử dụng caacutec cocircng cụ cho pheacutep ở tầng truy xuất dữ liệu Kho dữ liệu trung tacircm-1 cơ sở dữ liệu vật lyacute chứa tất cả dữ liệu cho một
vugraveng chuyecircn dụng nagraveo đoacute
Kho dữ liệu phacircn taacuten- Thagravenh phần được phacircn taacuten qua nhiều hệ cơ sở dữ liệu vật lyacute
12METADATA- Siecircu dữ liệu Định nghĩa Siecircu dữ liệu lagrave dữ liệu về dữ liệu Lagrave 1 lưu trữ dugraveng để
Miecircu tả kho dữ liệu tổng thể Nhận dạng kiểu kho dữ liệu Quản liacute quaacute trigravenh tiacutech hợp dữ liệu Quản liacute quaacute trigravenh cập nhật kho dữ liệu Quản liacute bảo mật
Lagrave chigravea khoacutea quyết định sự thagravenh cocircng của kho dữ liệu luocircn được thay đổi vagrave cập nhật theo sự phaacutet triển của kho dữ liệu
Dugraveng để quản liacute điều khiển kho dữ liệu Sự ra đời của kho dữ liệu như 1 cấu truacutec hỗ trợ ra quyết định siecircu dữ liệu
được xem như nguồn tagravei nguyecircn dữ liệu Siecircu dữ liệu lagrave trừu tượng Chuacuteng lagrave dữ liệu bậc cao cung cấp mocirc tả ngắn
gọn caacutec dữ liệu bậc thấp hơn 13Hoạt động của Siecircu dữ liệu
Siecircu dữ liệu rất cần thiết trong việc chuyển hoacutea thocircng tin trở thagravenh tri thức Lagrave chigravea khoacutea giuacutep chuacuteng ta xử lyacute được dữ liệu thocirc Viacute dụ một dograveng dữ liệu baacuten hagraveng 1023 K596 11121 agraveNoacute sẽ khocircng coacute nghĩa gigrave cho đến khi chuacuteng ta đưa vagraveo siecircu dữ liệu (thư
mục chứa dữ liệu) agrave cửa hagraveng 1023 sản phẩm K596 vagrave số tiền baacuten được lagrave 11121 đocirc la
14Sự cần thiết phải nhất quaacuten trong kho dữ liệu Kho dữ liệu được xacircy dựng cho lợi iacutech của những nhagrave phacircn tiacutech kinh
doanh caacutec nhagrave quản trị cho tất cả caacutec khu vực chức năng Trong cơ sở dữ liệu riecircng caacutec khu vực khaacutec nhau coacute thể định nghĩa vagrave lưu
trữ dữ liệu thocircng qua phiecircn bản của chiacutenh noacute Khi dữ liệu được lấy từ những vugraveng khaacutec nhau đoacute vagrave được đặt vagraveo kho dữ
liệu Việc chuyển đổi vagrave lagravem sạch caacutec tiến trigravenh sẽ đảm bảo noacute lagrave duy nhất được tiacutech hợp tại một mức của tổ chức
15Ragrave soaacutet lại dữ liệu ndash Thực thi siecircu dữ liệu
Bất kể cấu truacutec tự nhiecircn của 1 cacircu truy vấn thế nagraveo thigrave caacutec thagravenh phần của siecircu dữ liệu rất quan trọng đối với người ra quyết định
Bảng thuộc tiacutenh khoacutea được lưu trữ bởi kho dữ liệu Tập hợp dữ liệu được lấy từ đacircu Những chuyển đổi nagraveo được thực thi với việc lagravem sạch
16Siecircu dữ liệu lagrave gigrave Metadata - lagrave thocircng tin mocirc tả nội dung của cơ sở dữ liệu (CSDL) Metadata baacuteo cho người dugraveng biết thời gian cập nhật sau cugraveng của dữ liệu
định dạng vagrave mục điacutech sử dụng của noacute Những thocircng tin nagravey coacute thể hướng dẫn người dugraveng duyệt qua CSDL vagrave
giuacutep họ hiểu được yacute nghĩa vagrave ngữ cảnh của dữ liệu Trong CSDL metadata lagrave caacutec dạng biểu diễn khaacutec nhau của caacutec đối tượng
trong CSDL Trong CSDL quan hệ metadata lagrave caacutec định nghĩa của bảng cột CSDL
view vagrave nhiều đối tượng khaacutec Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột
một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi -gtMetadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu
Bảng chuyển đổi Ghi lại những chuyển đổi đatilde được thực hiện
Lịch sử thực thi Ghi lại những dữ liệu đatilde được
phacircn tiacutech
Higravenh thaacutei kết nốiGhi lại những dữ liệu được kết nối vagrave tần suất
17Aacutenh xạ thocircng thường của siecircu dữ liệu Bản ghi aacutenh xạ chuyển đổi bao gồm
Định danh của nguồn gốc Chuyển đổi thuộc tiacutenh Chuyển đổi thuộc tiacutenh vật lyacute Matilde hoacutea tham chiếu bảng chuyển đổi Đổi tecircn Đổi khoacutea Gaacuten giaacute trị cho thuộc tiacutenh mặc định Chọn logic cho caacutec nguồn nhiều giaacute trị Đổi thuật toaacuten
18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để
phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai
lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave
tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec
Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm
Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo
19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua
caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau
SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được
Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra
một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức
Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ
Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ
Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech
CHƯƠNG 11 KHAI PHAacute DỮ LIỆU
1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn
ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993
Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng
2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd
1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều
2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP
3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn
4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng
5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server
6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo
7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động
8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời
9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều
10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện
11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech
12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP
3 Xử lyacute phacircn tiacutech trực tuyến OLAP
MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave
dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu
ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave
thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu
HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave
ROLAP4 Khai phaacute dữ liệu
Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh
khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn
Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan
5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp
6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại
Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp
Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec
Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt
Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra
Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh
vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho
Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec
Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm
Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục
Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng
gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp
Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn
Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec
Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper
Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2
Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25
Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước
Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng
Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện
trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp
Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute
độ hỗ trợ ge ngưỡng minsup
độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan
Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn
Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết
Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu
MOLAP ROLAP HOLAP
Lưu trữ dữ liệu cơ sở
Khối Bảng quan hệ Bảng quan hệ
Lưu trữ thocircng tin tổng hợp
Khối Bảng quan hệ Khối
Hiệu suất thực hiện truy vấn
Nhanh nhất Chậm nhất Nhanh
Tiecircu thụ khocircng gian lưu trữ
Nhiều Thấp Trung bigravenh
Chi phiacute bảo trigrave Cao Thấp Trung bigravenh
Hệ chuyecircn gia giuacutep cho người sử dụng coacute thể trau dồi sự hiểu biết trecircn lĩnh vuej cụ thể magrave noacute giải quyết hỗ trợ người ra quyết định coacute trigravenh độ như 1 chuyecircn gia trong quaacute trigravenh gia quyết định
Kiến thức của rất nhiều chuyecircn gia về một lĩnh vực nagraveo đoacute được đưa vagraveo hệ chuyecircn gia lagravem cho CSTT cuat HCG phong phuacute vagrave rộng lớn hơn rất nhiều
HCG giải thiacutech caacutec bước suy luận một caacutech dễ hiểu nhất quaacuten luacutec nagraveo cũng coacute thể sử dụng ko như chuyecircn gia con người
Hạn chế của caacutec hệ chuyecircn gia
Nhược điểm lớn nhất của hệ chuyecircn gia lagrave những yacute kiến chuyecircn mocircn thường rất khoacute matilde hoacutea vagrave giải neacuten
Hệ chuyecircn gia khocircng coacute khả năng tự học tự cập nhật kiến thức mới như caacutec chuyecircn gia magrave cần phải được matilde hoacutea lại khi noacute được cập nhật
Hệ chuyecircn gia khocircng thể nhận ra được vấn đề khocircng nằm trong miền kiến thức của hệ thống
Chương 8 Tri thức vagrave tiếp nhận
1 Bao gồm caacutec vấn đề
Dữ liệu thực tế đo lường hoặc quan saacutet coacute hoặc khocircng coacute bối cảnh
Thocircng tin dữ liệu được tổng hợp một caacutech hữu iacutech để giải quyết những khoacute khăn trong việc đưa ra quyết định
Tri thức bao gồm caacutec ứng dụng quy tắc thocircng tin hướng dẫn của người ra quyết định
2 Những caacutei nhigraven về tri thức
Đại diện lagravem thế nagraveo để diễn tả tri thức viacute dụ như một quyển saacutech khocircng phải lagrave tri thức nhưng noacute lại lagrave một đại diện của tri thức
Sản xuất tri thức lagrave một tập hơp của hagraveng tồn kho coacute thể được sản xuất cũng như mua lại
Tri thức lagrave 1 trong 6 trạng thaacutei của hệ thống
1Dữ liệu 2Thocircng tin 3Cấu truacutec thocircng tin 4Sự thấu hiểu 5Yacute kiến 6 Quyết định
3 Caacutec loại tri thức Phổ biến mocirc tả dữ liệu thocircng tin thủ tục mọi thứ lagravem như thế nagraveo lập luận chiacutenh saacutech hoặc caacutec quy tắc
4 Thu thập Tri thức hệ chuyecircn gia Hầu hết caacutec phương phaacutep đều bắt đầu với mocirc higravenh của caacutec taacutec vụ trong đoacute
hệ chuyecircn gia được xacircy dựng Trong đoacute mocirc tả về caacutec lĩnh vực được tạo ra Caacutec kỹ sư sử dụng caacutec mocirc higravenh giả thuyết vagrave nhận thức về quaacute trigravenh phacircn
tiacutech để gợi ra caacutech giải quyết vấn đề về tri thức từ caacutec chuyecircn gia
5 Caacutec chiều của thu thập tri thức KE- driven caacutec kỹ sư trao đổi trực tiếp với caacutec chuyecircn gia Expert-driven Caacutec chuyecircn gia trực tiếp đưa chuyecircn mocircn của họ vagraveo hệ
thống maacutey tiacutenh Machine-driven Sử dụng caacutec cocircng cụ suy luận để triacutech xuất tri thức từ một
tập caacutec viacute dụ
6 Kỹ thuật thu thập tri thức Trao đổi gồm 2 loại cơ bản lagrave coacute cấu truacutec(coacute kịch bản) vagrave khocircng coacute cấu
truacutec( đối thoại trực tiếp) Giao thức phacircn tiacutech bằng lời Khi caacutec chuyecircn gia thực hiện một cocircng việc
của họ thigrave một bản ghi về cocircng việc đoacute được thực hiện Caacutec kỹ sư sẽ xacircy dựng mocirc higravenh cho những gigrave được ghi lại trong bản ghi
Phương phaacutep sagraveng lọc caacutec chuyecircn gia so saacutenh caacutec nhoacutem liecircn tiếp trong ba đối tượng vagrave cho biết tại sao nhoacutem thứ hai lại khaacutec nhoacutem thứ ba
7 Thu thập tri thức từ nhiều nguồn Thu thập tri thức từ nhiều nguồn lagrave cần thiết để coacute được đầy đủ caacutec tri thức
cho một vấn đề quan điểm yacute kiến traacutei ngược nhau thường phaacutet sinh Phương phaacutep đồng thuận sẽ giuacutep giải quyết được vấn đề macircu thuẫn Kỹ thuật phacircn tiacutech Meta lagrave kỹ thuật được aacutep dụng trong caacutec trường hợp
khaacutec Caacutech tiếp cận bằng định lượng đogravei hỏi caacutec kỹ sư cần cacircn nhắc yếu tố đầu vagraveo của caacutec chuyecircn gia khaacutec nhau
8 Xaacutec nhận hợp lệ vagrave kiểm tra tri thức Một khi thu thập tri thức noacute phải được đaacutenh giaacute về khả năng sử dụng vagrave độ
chiacutenh xaacutec Hai vấn đề cụ thể lagrave hiệu lực của những kiến thức vagrave kiểm tra việc xacircy dựng cơ sở của tri thức
Cần xaacutec nhận xem liệu hệ thống coacute thể hoạt động ở mức độ tối thiểu khocircng
Xaacutec minh liecircn quan đến việc so saacutenh từng chi tiết kỹ thuật của hệ thống những gigrave đatilde được thực hiện cuối cugraveng
9 Một số caacutec biện phaacutep xaacutec nhận Độ chiacutenh xaacutec Khả năng thiacutech nghi Mức độ đầy đủ Bề rộng Độ sacircu Hiệu lực Tổng quan Chiacutenh xaacutec Hiện thực Độ tin cậy Tiacutenh hữu dụng Mức độ
Chương 9 Học maacutey
1 Logic mờ vagrave ngocircn ngữ mờ(Fuzzy Logic and Linguistic Ambiguity)
Ngocircn ngữ tự nhiecircn gồm những khaacutei niệm mơ hồ vagrave khocircng chiacutenh xaacutectruyền tải ngữ nghĩa thocircng qua tiacutenh xấp xỉkhocircng rotilde ragraveng
Những xấp xỉ nagravey giuacutep con người coacute thể truyền tải hết được yacute nghĩa nhưng maacutey thigrave khocircng hiểu
Lagravem sao biểu diễn caacutec tri thức sử dụng caacutec khaacutei niệm khocircng rotilde ragraveng(mờ) hoặc khocircng chiacutenh xaacutec
2 Khaacutei niệm cơ bản của logic mờ tập mờ lagrave những tập hợp khocircng coacute một giới hạn rotilde Mỗi phần tử của noacute chỉ
chứa một mức độ hagravem liecircn thuộc của từng phần tử Vigrave vậy tập mờ khocircng giống như tập cổ điển Tập mờ coacute thể kết hợp với nhau qua những luật mờ magrave đặc trưng cho những hagravenh động trạng thaacutei vagrave thuộc tiacutenh của logic mờ được tận dụng khi thực hiện một bộ điều khiển mờ
Logic mờ dựa trecircn yacute tưởng mỗi phần tử thuộc vagraveo một tập hợp ở một mức độ nagraveo đấy
Locircgic mờ cho pheacutep độ liecircn thuộc (microA )coacute giaacute trị trong khoảng (01) Locircgic mờ coacute thể được coi lagrave mặt ứng dụng của lyacute thuyết tập mờ để xử lyacute caacutec
giaacute trị trong thế giới thực cho caacutec bagravei toaacuten phức tạp
3 So saacutenh tiacutenh đuacuteng đắn logic mờ vagrave xaacutec suất Xaacutec suất thigrave đề cập đến khả năng xảy ra một biến cố hay một điều gigrave đoacute Logic mờ đề cập đến cấp độ magrave đặc tiacutenh ở hiện tại
o viacute dụ1 người coacute chiều cao 6 feet thigrave coacute cấp độ lagrave 05 về chiều cao
4 Ưu điểm của logic mờ Caacutech tiếp cận rất tự nhiecircnkhocircng phức tạp Coacute thể mocirc higravenh hoacutea caacutec hagravem phi tuyến tugravey yacute phức tạp
Coacute thể tận dụng được kinh nghiệm từ những chuyecircn gia hagraveng đầu trong mọi lĩnh vực
Logic mờ được xacircy dựng dựa trecircn ngocircn ngữ tự nhiecircnNền tảng của logic mờ lagrave dựa trecircn cơ sở giao tiếp của con người
5 Nhược điểm của logic mờ Trong 1 hệ thống phức tạpsử dụng logic mờ coacute thể trở thagravenh trở ngại cho
việc xaacutec thực độ tin cậy của hệ thống Cơ chế lập luận mờ khocircng thể học hỏi từ những lỗi sai
6 Mạng noron nhacircn tạo(ANN) Mạng noron nhacircn tạo lagrave một mocirc phỏng xử lyacute thocircng tinđược nghiecircn cứu ra
từ hệ thống thần kinh của sinh vậtgiống như bộ natildeo để xử lyacute thocircng tin ANNs lagrave chương trigravenh dựa trecircn maacutey tiacutenh đơn giản coacute chức năng lagrave một mocirc
higravenh bagravei toaacuten khocircng gian dựa trecircn thử nghiệm vagrave baacuteo lỗi
7 Học từ kinh nghiệm Tiến trigravenh Một mẫu dữ liệu được biểu diễn như một mạng lưới noronANN ldquodự
đoaacutenrdquo 1 đầu radự đoaacuten được so saacutenh với giaacute trị thực tế hoặc giaacute trị chiacutenh xaacutecNếu đoaacuten được chiacutenh xaacutec thigrave khocircng coacute hagravenh động nagraveo được thực hiện
Nếu dự đoaacuten sai ANN kiểm tra lại vagrave xaacutec định lại thocircng số để điều chỉnh Một mẫu dữ liệu khaacutec được biểu diễn vagrave quaacute trigravenh nagravey được lặp lại
8 Nguyecircn tắc cơ bản của cocircng nghệ nơron Caacutec yếu tố xử lyacute cơ bản trong hệ thống thần kinh của con người lagrave tế bagraveo
thần kinhMạng lưới của tế bagraveo nagravey lagrave liecircn kết với nhau nhận được thocircng tin từ caacutec cảm biến trong mắt taihellip
Thocircng tin nhận được bởi tế bagraveo thần kinh hoặc lagrave sẽ kiacutech thiacutech noacute(sẽ được chuyển qua 1 thocircng điệp dọc theo mạng lưới) hoặc lagrave sẽ ngăn cản noacute(ngăn cản dograveng thocircng tin)
Độ nhạy coacute thể thay đổi qua thời gian hoặc sau khi coacute được kinh nghiệm
9 Cấu truacutec mạng Một ANN gồm 3 lớp cơ bản
Lớp đầu vagraveo nhận dữ liệu Lớp becircn trong hoặc lagrave lớp ẩn xử lyacute dữ liệu Lớp đầu ra chuyển tiếp kết quả cuối cugraveng của mạng
10Mạng nơ ron Thường coacute nhiều đầu vagraveo mỗi đầu vagraveo với mức ảnh hưởng vagrave tầm quan
trọng riecircng của noacute Một đầu vagraveo quan trọng coacute thể được sử dụng để khuếch đại đầu ra caacutec hagravem trạng thaacutei tổng hợp caacutec trọng số của caacutec yếu tố
đầuvagraveo khaacutec nhauvagraveo một giaacute trị duy nhất Caacutec hagravem chuyển giao xử lyacute caacutec giaacute trị trạng thaacutei vagrave tạo đầu ra
11Huấn luyện mạng nơ ron Trong mocirc higravenh coacute giaacutem saacutetANN được đến so saacutenh dự đoaacuten của chiacutenh
noacute với thocircng tin phản hồi coacute chứa caacutec kết quả mong muốn ANN sẽ phải tigravem caacutech thay đổi caacutec tham số becircn trong củamigravenh (caacutec trọng số vagrave caacutec ngưỡng) để tạo necircn một aacutenh xạ coacute khả năng aacutenh xạcaacutec đầu vagraveo thagravenh caacutec đầu ra mong muốn Sự thay đổi nagravey được tiến hagravenh nhờ việc so saacutenh giữa đầu ra thực sự vagrave đầu ra mong muốn
Trong mocirc higravenh khocircng coacute giaacutem saacutetANN nhận được dữ liệu vagraveo nhưng khocircng phải coacute bất kỳ thocircng tin phản hồi về kết quả mong muốn
Phần lớn caacutec ứng dụng nằm trong vugraveng của caacutec bagravei toaacuten ước lượng như mocirc higravenh hoacuteathống kecirc neacuten lọc phacircn cụm
12Lợi iacutech Liecircn kết với mạng noron Traacutenh caacutech lập trigravenh tường minh Giảm nhu cầu của chuyecircn gia ANNs thigrave thiacutech nghi với caacutec yếu tố đầu vagraveo thay đổi Khocircng cần thiết cho cơ sở tri thức tinh chế ANNs coacute tiacutenh động vagrave cải thiện với việc sử dụng Coacute khả năng xử lyacute dữ liệu khocircng chiacutenh xaacutec hoặc khocircng đầy đủ Cho pheacutep tổng quaacutet hoacutea từ thocircng tin cụ thể Cho pheacutep thu thập cảm giaacutec thocircng thường vagraveo miền giải quyết vấn đề
13Hạn chế của việc liecircn kết với mạng noron ANNs khocircng thể giải thiacutech được suy luận Bản chất hộp đen thường khiến cho vấn đề traacutech nhiệm vagrave độ tin cậy phaacutet
sinh lagrave khoacute khăn Lặp đi lặp lại quaacute trigravenh huấn luyện rất tốn thời gian Nguồn lực caacutec nhagrave phacircn tiacutech vagrave thiết kế coacute tay nghề cao vẫn lagrave đaacuteng lo
ngại Cocircng nghệ ANN thuacutec đẩy hạn chế của phần cứng hiện tại ANN yecircu cầu phải coacute sự tin tưởng ở đầu ra
14Giới thiệu về thuật toaacuten di truyền Cũng như mạng lưới thần kinh caacutec thuật toaacuten di truyền được dựa trecircn lyacute
thuyết sinh học Thuật toaacuten di truyền tigravem thấy nguồn gốc của chuacuteng trong caacutec lyacute thuyết
tiến hoacutea của chọn lọc tự nhiecircn vagrave thiacutech ứng với biến đổi khiacute hậu Kết quả thuật toaacuten di truyền lagrave từ giao phối 2 caacute thể trong quần thế để tạo
ra con caacutei đocirci khi tốt hơn so với bậc cha mẹ của chuacuteng 15Caacutec thagravenh phần cơ bản của thuật toaacuten di truyền
Toaacuten tử chọn lọc Caacutec caacute thể tốt được chọn lọc để đưa vagraveo thế hệ sau Sự chọn lọc nagravey căn cứ vagraveo độ thiacutech nghi với mocirci trường của mỗi caacute thể
Toaacuten tử lai gheacutep (crossover) Hai caacute thể cha vagrave mẹ trao đổi caacutec gen với nhau để tạo ra caacute thể con
Toaacuten tử đột biến (mutation) Một caacute thể thay đổi một số gen để biến đổi thagravenh một caacute thể mớiTất cả caacutec toaacuten tử trecircn khi thực hiện đều mang tiacutenh ngẫu nhiecircn
16Quaacute trigravenh cơ bản của một thuật toaacuten di truyền Khởi tạo
Đaacutenh giaacute quần thể
Lựa chọn NST thiacutech hợp nhất vagrave loại bỏ NST yếu nhất
Quy trigravenh giao nhau vagrave cải thiện quần thể
đột biến tiến trigravenh để khaacutem phaacute ra NST mới
17Ưu nhược điểm của việc kết hợp với thuật toaacuten di truyền Kiacutech thước quần thể lagrave 1 yếu tố quan trọng trong tốc độ của việc tigravem
kiếmnhưng noacute tương đối dễ dagraveng để dự đoaacuten tốc độ nagravey Giao nhau hoặc đột biến lagrave khocircng necircn đc sử dụng quaacute thường xuyecircn Luocircn coacute được iacutet nhất 1 giải phaacutep hợp lyacute Necircn coacute thể aacutep dụng chuacuteng cho caacutec vấn đề magrave chuacuteng ta khocircng coacute hướng
về caacutech giải quyết Sức mạnh của thuật toaacuten xuất phaacutet từ khaacutei niệm đơn giảnkhocircng phải từ
một thủ tục thuật toaacuten phức tạp 18Tương lai của học maacutey
Mạng lưới thần kinh nhacircn tạo vượt quaacute năng lực của con người trong caacutec trường hợp bị cocirc lập
Về mặt lyacute thuyếtmột maacutey tiacutenh coacute thể xử lyacute dũ liệu nhanh hơn hagraveng triệu lần so với 1 con người
May mắn thay cho chuacuteng tacon người tốt hơn nhiều khi magrave coacute được dữ liệumaacutey tiacutenh khocircng coacute 1 số thứ như lagrave 5 giaacutec quan
CHƯƠNG 10 KHO DỮ LIỆU
1 Kho dữ liệu Kho dữ liệu lagrave tuyển tập caacutec cơ sở dữ liệu tiacutech hợp hướng chủ đề được
thiết kế để trợ giuacutep cho một hệ hỗ trợ quyết định
Theo John Ladley Cocircng nghệ kho dữ liệu lagrave tập caacutec phương phaacutep kỹ thuật vagrave caacutec cocircng cụ coacute thể kết hợp hỗ trợ nhau để cung cấp thocircng tin cho người sử dụng trecircn cơ sở tiacutech hợp từ nhiều nguồn dữ liệu nhiều mocirci trường khaacutec nhau
Kho dữ liệu thường rất lớn tới hagraveng trăm GB hay thậm chiacute hagraveng Terabyte
2 Kho dữ liệu vận hagravenh (ODS) Một kho dữ liệu vận hagravenh Aacutep dụng kỹ thuật kho dữ liệu vagraveo caacutec hệ xử
lyacute giao taacutec lưu trữ dữ liệu cho một ứng dụng đặc thugrave Noacute đưa vagraveo kho dữ liệu một dograveng caacutec dữ liệu thocirc được thiết kế
3 So saacutenh
Kho dữ liệu vận hagravenh Kho dữ liệu
Dữ liệu theo chủ đề Dữ liệu theo chủ đề
Dữ liệu tiacutech hợp Dữ liệu tiacutech hợp
Dữ liệu thay đổi Dữ liệu khocircng thay đổi
Dữ liệu được cập nhật khi thay đổi
Dữ liệu giữ nguyecircn
Chỉ coacute dữ liệu hiện tạiDữliệu hiện tại vagrave dữ liệu lịch sử
Chu kỳ lagravem tươi dữ liệu ngắn Chu kỳ lagravem tươi dữ liệu dagravei
Chỉ coacute dữ liệu chi tiết Dữ liệu chi tiết vagrave dữ liệu tổng kết
Dugraveng cho caacutec quyết định ngắn hạn
Dugraveng cho hoạch định dagravei hạn
4 Kho dữ liệu cục bộ (Data Mart - DM)
Kho dữ liệu cục bộ lagrave CSDL coacute những đặc điểm giống với kho dữ liệu nhưng với quy mocirc nhỏ hơn vagrave lưu trữ dữ liệu về một lĩnh vực một chuyecircn ngagravenh
Data mart phụ thuộc Chứa những dữ liệu được lấy từ DW vagrave những dữ liệu nagravey sẽ được triacutech lọc vagrave tinh chế tiacutech hợp lại ở mức cao hơn để phục vụ một chủ đề nhất định của Datamart
Data mart độc lập Khocircng giống như Datamart phụ thuộc Data mart độc lập được xacircy dựng trước DW vagrave dữ liệu được trực tiếp lấy từ caacutec nguồn khaacutec nhau
5 Siecircu dữ liệu Metadata lagrave dữ liệu để mocirc tả dữ liệu Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột
một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi Metadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu
6 Mocirci trường kho dữ liệu Hệ thống của tổ chức vagrave kho cung cấp dữ liệu để xacircy dựng kho dữ liệu Trong quaacute trigravenh chuyển dữ liệu từ caacutec nguồn khaacutec nhau dữ liệu coacute thể
được lagravem sạch hoặc chuyển đổi vagrave vigrave thế DW được xem như lagrave một chuẩn cho việc lưu trữ
Đồng thời siecircu dữ liệu được ghi lại Cuối cugraveng DW hoặc siecircu thị coacute thể được sử dụng để tạo ra một kho dữ
liệu ldquocaacute nhacircnrdquo 7 Caacutec đặc điểm của kho dữ liệu
Đặc điểm Mocirc tả
Hướng chủ đề - DL tổ chức theo caacutech thức người dugraveng tham chiếu
Tiacutech hợp - Dữ liệu ldquosạchrdquo loại bỏ tiacutenh thiếu nhất quaacuten
Khocircng thay đổi - DL ldquochỉ đọcrdquo người dugraveng khocircng thay đổi được
Chuỗi thời gian - DL lagrave chuỗi thời gian khocircng phải lagrave trạng thaacutei hiện tại
Được tổng kết - DL vận hagravenhthao taacutec khi cần thiết
được kết hợp lại thagravenh dạng coacute thể dugraveng được cho quyết định
Kiacutech cỡ lớn hơn - Lưu giữ theo chuỗi thời gian tức lagrave giữ lại nhiều DL
Khocircng được chuẩn hoacutea - Coacute thể dư thừa DLSiecircu dữ liệu - Dữ liệu của dữ liệu được lưu trữNguồn dữ liệu - DL vận hagravenh (caacutec hệ sẵn coacute) cugraveng
với caacutec nguồn ngoagravei 8 Kho dữ liệu hướng chủ đề
Hướng chủ để coacute nghĩa lagrave kho dữ liệu được tổ chức xung quanh caacutec chủ đề chiacutenh như khaacutech hagraveng sản phẩm sản xuất Tập trung vagraveo việc mocirc higravenh hoacutea vagrave phacircn tiacutech dữ liệu cho caacutec nhagrave ra quyết định magrave khocircng tập trung vagraveo caacutec xử lyacute thocircng thường Cung cấp cho người dugraveng một khung nhigraven toagraven vẹn đơn giản vagrave đầy đủ về caacutec sự kiện quanh caacutec chủ đề
9 Dữ liệu trong DW được tiacutech hợp Dữ liệu trong kho dữ liệu được xacircy dựng bằng caacutech tổng hợp dữ liệu từ
nhiều nguồn khaacutec nhau vagrave caacutec nguồn coacute tổ chức khaacutec nhau Cơ sở dữ liệu caacutec file excel caacutec flat file hoặc caacutec raw file Khi đưa vagraveo kho dữ liệu caacutec dữ liệu được lagravem sạch vagrave tiacutech hợp dữ liệu nhằm đảm bảo tiacutenh nhất quaacuten của dữ liệu
10Kiến truacutec kho dữ liệu Tầng cơ sở dữ liệu hoạt động Tầng truy xuất thocircng tin Tầng truy xuất dữ liệu Tầng siecircu dữ liệu Tầng quản lyacute tiến trigravenh Tầng thocircng điệp của ứng dụng Tầng vật liacute của kho dữ liệu Tầng trigravenh diễn dữ liệu
11Higravenh trạng kho dữ liệu Kho dữ liệu ảo - người dugraveng cuối coacute thể truy cập trực tiếp đến kho dữ liệu
sử dụng caacutec cocircng cụ cho pheacutep ở tầng truy xuất dữ liệu Kho dữ liệu trung tacircm-1 cơ sở dữ liệu vật lyacute chứa tất cả dữ liệu cho một
vugraveng chuyecircn dụng nagraveo đoacute
Kho dữ liệu phacircn taacuten- Thagravenh phần được phacircn taacuten qua nhiều hệ cơ sở dữ liệu vật lyacute
12METADATA- Siecircu dữ liệu Định nghĩa Siecircu dữ liệu lagrave dữ liệu về dữ liệu Lagrave 1 lưu trữ dugraveng để
Miecircu tả kho dữ liệu tổng thể Nhận dạng kiểu kho dữ liệu Quản liacute quaacute trigravenh tiacutech hợp dữ liệu Quản liacute quaacute trigravenh cập nhật kho dữ liệu Quản liacute bảo mật
Lagrave chigravea khoacutea quyết định sự thagravenh cocircng của kho dữ liệu luocircn được thay đổi vagrave cập nhật theo sự phaacutet triển của kho dữ liệu
Dugraveng để quản liacute điều khiển kho dữ liệu Sự ra đời của kho dữ liệu như 1 cấu truacutec hỗ trợ ra quyết định siecircu dữ liệu
được xem như nguồn tagravei nguyecircn dữ liệu Siecircu dữ liệu lagrave trừu tượng Chuacuteng lagrave dữ liệu bậc cao cung cấp mocirc tả ngắn
gọn caacutec dữ liệu bậc thấp hơn 13Hoạt động của Siecircu dữ liệu
Siecircu dữ liệu rất cần thiết trong việc chuyển hoacutea thocircng tin trở thagravenh tri thức Lagrave chigravea khoacutea giuacutep chuacuteng ta xử lyacute được dữ liệu thocirc Viacute dụ một dograveng dữ liệu baacuten hagraveng 1023 K596 11121 agraveNoacute sẽ khocircng coacute nghĩa gigrave cho đến khi chuacuteng ta đưa vagraveo siecircu dữ liệu (thư
mục chứa dữ liệu) agrave cửa hagraveng 1023 sản phẩm K596 vagrave số tiền baacuten được lagrave 11121 đocirc la
14Sự cần thiết phải nhất quaacuten trong kho dữ liệu Kho dữ liệu được xacircy dựng cho lợi iacutech của những nhagrave phacircn tiacutech kinh
doanh caacutec nhagrave quản trị cho tất cả caacutec khu vực chức năng Trong cơ sở dữ liệu riecircng caacutec khu vực khaacutec nhau coacute thể định nghĩa vagrave lưu
trữ dữ liệu thocircng qua phiecircn bản của chiacutenh noacute Khi dữ liệu được lấy từ những vugraveng khaacutec nhau đoacute vagrave được đặt vagraveo kho dữ
liệu Việc chuyển đổi vagrave lagravem sạch caacutec tiến trigravenh sẽ đảm bảo noacute lagrave duy nhất được tiacutech hợp tại một mức của tổ chức
15Ragrave soaacutet lại dữ liệu ndash Thực thi siecircu dữ liệu
Bất kể cấu truacutec tự nhiecircn của 1 cacircu truy vấn thế nagraveo thigrave caacutec thagravenh phần của siecircu dữ liệu rất quan trọng đối với người ra quyết định
Bảng thuộc tiacutenh khoacutea được lưu trữ bởi kho dữ liệu Tập hợp dữ liệu được lấy từ đacircu Những chuyển đổi nagraveo được thực thi với việc lagravem sạch
16Siecircu dữ liệu lagrave gigrave Metadata - lagrave thocircng tin mocirc tả nội dung của cơ sở dữ liệu (CSDL) Metadata baacuteo cho người dugraveng biết thời gian cập nhật sau cugraveng của dữ liệu
định dạng vagrave mục điacutech sử dụng của noacute Những thocircng tin nagravey coacute thể hướng dẫn người dugraveng duyệt qua CSDL vagrave
giuacutep họ hiểu được yacute nghĩa vagrave ngữ cảnh của dữ liệu Trong CSDL metadata lagrave caacutec dạng biểu diễn khaacutec nhau của caacutec đối tượng
trong CSDL Trong CSDL quan hệ metadata lagrave caacutec định nghĩa của bảng cột CSDL
view vagrave nhiều đối tượng khaacutec Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột
một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi -gtMetadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu
Bảng chuyển đổi Ghi lại những chuyển đổi đatilde được thực hiện
Lịch sử thực thi Ghi lại những dữ liệu đatilde được
phacircn tiacutech
Higravenh thaacutei kết nốiGhi lại những dữ liệu được kết nối vagrave tần suất
17Aacutenh xạ thocircng thường của siecircu dữ liệu Bản ghi aacutenh xạ chuyển đổi bao gồm
Định danh của nguồn gốc Chuyển đổi thuộc tiacutenh Chuyển đổi thuộc tiacutenh vật lyacute Matilde hoacutea tham chiếu bảng chuyển đổi Đổi tecircn Đổi khoacutea Gaacuten giaacute trị cho thuộc tiacutenh mặc định Chọn logic cho caacutec nguồn nhiều giaacute trị Đổi thuật toaacuten
18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để
phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai
lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave
tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec
Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm
Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo
19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua
caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau
SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được
Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra
một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức
Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ
Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ
Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech
CHƯƠNG 11 KHAI PHAacute DỮ LIỆU
1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn
ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993
Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng
2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd
1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều
2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP
3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn
4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng
5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server
6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo
7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động
8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời
9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều
10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện
11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech
12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP
3 Xử lyacute phacircn tiacutech trực tuyến OLAP
MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave
dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu
ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave
thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu
HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave
ROLAP4 Khai phaacute dữ liệu
Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh
khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn
Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan
5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp
6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại
Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp
Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec
Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt
Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra
Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh
vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho
Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec
Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm
Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục
Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng
gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp
Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn
Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec
Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper
Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2
Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25
Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước
Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng
Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện
trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp
Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute
độ hỗ trợ ge ngưỡng minsup
độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan
Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn
Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết
Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu
MOLAP ROLAP HOLAP
Lưu trữ dữ liệu cơ sở
Khối Bảng quan hệ Bảng quan hệ
Lưu trữ thocircng tin tổng hợp
Khối Bảng quan hệ Khối
Hiệu suất thực hiện truy vấn
Nhanh nhất Chậm nhất Nhanh
Tiecircu thụ khocircng gian lưu trữ
Nhiều Thấp Trung bigravenh
Chi phiacute bảo trigrave Cao Thấp Trung bigravenh
Tri thức lagrave 1 trong 6 trạng thaacutei của hệ thống
1Dữ liệu 2Thocircng tin 3Cấu truacutec thocircng tin 4Sự thấu hiểu 5Yacute kiến 6 Quyết định
3 Caacutec loại tri thức Phổ biến mocirc tả dữ liệu thocircng tin thủ tục mọi thứ lagravem như thế nagraveo lập luận chiacutenh saacutech hoặc caacutec quy tắc
4 Thu thập Tri thức hệ chuyecircn gia Hầu hết caacutec phương phaacutep đều bắt đầu với mocirc higravenh của caacutec taacutec vụ trong đoacute
hệ chuyecircn gia được xacircy dựng Trong đoacute mocirc tả về caacutec lĩnh vực được tạo ra Caacutec kỹ sư sử dụng caacutec mocirc higravenh giả thuyết vagrave nhận thức về quaacute trigravenh phacircn
tiacutech để gợi ra caacutech giải quyết vấn đề về tri thức từ caacutec chuyecircn gia
5 Caacutec chiều của thu thập tri thức KE- driven caacutec kỹ sư trao đổi trực tiếp với caacutec chuyecircn gia Expert-driven Caacutec chuyecircn gia trực tiếp đưa chuyecircn mocircn của họ vagraveo hệ
thống maacutey tiacutenh Machine-driven Sử dụng caacutec cocircng cụ suy luận để triacutech xuất tri thức từ một
tập caacutec viacute dụ
6 Kỹ thuật thu thập tri thức Trao đổi gồm 2 loại cơ bản lagrave coacute cấu truacutec(coacute kịch bản) vagrave khocircng coacute cấu
truacutec( đối thoại trực tiếp) Giao thức phacircn tiacutech bằng lời Khi caacutec chuyecircn gia thực hiện một cocircng việc
của họ thigrave một bản ghi về cocircng việc đoacute được thực hiện Caacutec kỹ sư sẽ xacircy dựng mocirc higravenh cho những gigrave được ghi lại trong bản ghi
Phương phaacutep sagraveng lọc caacutec chuyecircn gia so saacutenh caacutec nhoacutem liecircn tiếp trong ba đối tượng vagrave cho biết tại sao nhoacutem thứ hai lại khaacutec nhoacutem thứ ba
7 Thu thập tri thức từ nhiều nguồn Thu thập tri thức từ nhiều nguồn lagrave cần thiết để coacute được đầy đủ caacutec tri thức
cho một vấn đề quan điểm yacute kiến traacutei ngược nhau thường phaacutet sinh Phương phaacutep đồng thuận sẽ giuacutep giải quyết được vấn đề macircu thuẫn Kỹ thuật phacircn tiacutech Meta lagrave kỹ thuật được aacutep dụng trong caacutec trường hợp
khaacutec Caacutech tiếp cận bằng định lượng đogravei hỏi caacutec kỹ sư cần cacircn nhắc yếu tố đầu vagraveo của caacutec chuyecircn gia khaacutec nhau
8 Xaacutec nhận hợp lệ vagrave kiểm tra tri thức Một khi thu thập tri thức noacute phải được đaacutenh giaacute về khả năng sử dụng vagrave độ
chiacutenh xaacutec Hai vấn đề cụ thể lagrave hiệu lực của những kiến thức vagrave kiểm tra việc xacircy dựng cơ sở của tri thức
Cần xaacutec nhận xem liệu hệ thống coacute thể hoạt động ở mức độ tối thiểu khocircng
Xaacutec minh liecircn quan đến việc so saacutenh từng chi tiết kỹ thuật của hệ thống những gigrave đatilde được thực hiện cuối cugraveng
9 Một số caacutec biện phaacutep xaacutec nhận Độ chiacutenh xaacutec Khả năng thiacutech nghi Mức độ đầy đủ Bề rộng Độ sacircu Hiệu lực Tổng quan Chiacutenh xaacutec Hiện thực Độ tin cậy Tiacutenh hữu dụng Mức độ
Chương 9 Học maacutey
1 Logic mờ vagrave ngocircn ngữ mờ(Fuzzy Logic and Linguistic Ambiguity)
Ngocircn ngữ tự nhiecircn gồm những khaacutei niệm mơ hồ vagrave khocircng chiacutenh xaacutectruyền tải ngữ nghĩa thocircng qua tiacutenh xấp xỉkhocircng rotilde ragraveng
Những xấp xỉ nagravey giuacutep con người coacute thể truyền tải hết được yacute nghĩa nhưng maacutey thigrave khocircng hiểu
Lagravem sao biểu diễn caacutec tri thức sử dụng caacutec khaacutei niệm khocircng rotilde ragraveng(mờ) hoặc khocircng chiacutenh xaacutec
2 Khaacutei niệm cơ bản của logic mờ tập mờ lagrave những tập hợp khocircng coacute một giới hạn rotilde Mỗi phần tử của noacute chỉ
chứa một mức độ hagravem liecircn thuộc của từng phần tử Vigrave vậy tập mờ khocircng giống như tập cổ điển Tập mờ coacute thể kết hợp với nhau qua những luật mờ magrave đặc trưng cho những hagravenh động trạng thaacutei vagrave thuộc tiacutenh của logic mờ được tận dụng khi thực hiện một bộ điều khiển mờ
Logic mờ dựa trecircn yacute tưởng mỗi phần tử thuộc vagraveo một tập hợp ở một mức độ nagraveo đấy
Locircgic mờ cho pheacutep độ liecircn thuộc (microA )coacute giaacute trị trong khoảng (01) Locircgic mờ coacute thể được coi lagrave mặt ứng dụng của lyacute thuyết tập mờ để xử lyacute caacutec
giaacute trị trong thế giới thực cho caacutec bagravei toaacuten phức tạp
3 So saacutenh tiacutenh đuacuteng đắn logic mờ vagrave xaacutec suất Xaacutec suất thigrave đề cập đến khả năng xảy ra một biến cố hay một điều gigrave đoacute Logic mờ đề cập đến cấp độ magrave đặc tiacutenh ở hiện tại
o viacute dụ1 người coacute chiều cao 6 feet thigrave coacute cấp độ lagrave 05 về chiều cao
4 Ưu điểm của logic mờ Caacutech tiếp cận rất tự nhiecircnkhocircng phức tạp Coacute thể mocirc higravenh hoacutea caacutec hagravem phi tuyến tugravey yacute phức tạp
Coacute thể tận dụng được kinh nghiệm từ những chuyecircn gia hagraveng đầu trong mọi lĩnh vực
Logic mờ được xacircy dựng dựa trecircn ngocircn ngữ tự nhiecircnNền tảng của logic mờ lagrave dựa trecircn cơ sở giao tiếp của con người
5 Nhược điểm của logic mờ Trong 1 hệ thống phức tạpsử dụng logic mờ coacute thể trở thagravenh trở ngại cho
việc xaacutec thực độ tin cậy của hệ thống Cơ chế lập luận mờ khocircng thể học hỏi từ những lỗi sai
6 Mạng noron nhacircn tạo(ANN) Mạng noron nhacircn tạo lagrave một mocirc phỏng xử lyacute thocircng tinđược nghiecircn cứu ra
từ hệ thống thần kinh của sinh vậtgiống như bộ natildeo để xử lyacute thocircng tin ANNs lagrave chương trigravenh dựa trecircn maacutey tiacutenh đơn giản coacute chức năng lagrave một mocirc
higravenh bagravei toaacuten khocircng gian dựa trecircn thử nghiệm vagrave baacuteo lỗi
7 Học từ kinh nghiệm Tiến trigravenh Một mẫu dữ liệu được biểu diễn như một mạng lưới noronANN ldquodự
đoaacutenrdquo 1 đầu radự đoaacuten được so saacutenh với giaacute trị thực tế hoặc giaacute trị chiacutenh xaacutecNếu đoaacuten được chiacutenh xaacutec thigrave khocircng coacute hagravenh động nagraveo được thực hiện
Nếu dự đoaacuten sai ANN kiểm tra lại vagrave xaacutec định lại thocircng số để điều chỉnh Một mẫu dữ liệu khaacutec được biểu diễn vagrave quaacute trigravenh nagravey được lặp lại
8 Nguyecircn tắc cơ bản của cocircng nghệ nơron Caacutec yếu tố xử lyacute cơ bản trong hệ thống thần kinh của con người lagrave tế bagraveo
thần kinhMạng lưới của tế bagraveo nagravey lagrave liecircn kết với nhau nhận được thocircng tin từ caacutec cảm biến trong mắt taihellip
Thocircng tin nhận được bởi tế bagraveo thần kinh hoặc lagrave sẽ kiacutech thiacutech noacute(sẽ được chuyển qua 1 thocircng điệp dọc theo mạng lưới) hoặc lagrave sẽ ngăn cản noacute(ngăn cản dograveng thocircng tin)
Độ nhạy coacute thể thay đổi qua thời gian hoặc sau khi coacute được kinh nghiệm
9 Cấu truacutec mạng Một ANN gồm 3 lớp cơ bản
Lớp đầu vagraveo nhận dữ liệu Lớp becircn trong hoặc lagrave lớp ẩn xử lyacute dữ liệu Lớp đầu ra chuyển tiếp kết quả cuối cugraveng của mạng
10Mạng nơ ron Thường coacute nhiều đầu vagraveo mỗi đầu vagraveo với mức ảnh hưởng vagrave tầm quan
trọng riecircng của noacute Một đầu vagraveo quan trọng coacute thể được sử dụng để khuếch đại đầu ra caacutec hagravem trạng thaacutei tổng hợp caacutec trọng số của caacutec yếu tố
đầuvagraveo khaacutec nhauvagraveo một giaacute trị duy nhất Caacutec hagravem chuyển giao xử lyacute caacutec giaacute trị trạng thaacutei vagrave tạo đầu ra
11Huấn luyện mạng nơ ron Trong mocirc higravenh coacute giaacutem saacutetANN được đến so saacutenh dự đoaacuten của chiacutenh
noacute với thocircng tin phản hồi coacute chứa caacutec kết quả mong muốn ANN sẽ phải tigravem caacutech thay đổi caacutec tham số becircn trong củamigravenh (caacutec trọng số vagrave caacutec ngưỡng) để tạo necircn một aacutenh xạ coacute khả năng aacutenh xạcaacutec đầu vagraveo thagravenh caacutec đầu ra mong muốn Sự thay đổi nagravey được tiến hagravenh nhờ việc so saacutenh giữa đầu ra thực sự vagrave đầu ra mong muốn
Trong mocirc higravenh khocircng coacute giaacutem saacutetANN nhận được dữ liệu vagraveo nhưng khocircng phải coacute bất kỳ thocircng tin phản hồi về kết quả mong muốn
Phần lớn caacutec ứng dụng nằm trong vugraveng của caacutec bagravei toaacuten ước lượng như mocirc higravenh hoacuteathống kecirc neacuten lọc phacircn cụm
12Lợi iacutech Liecircn kết với mạng noron Traacutenh caacutech lập trigravenh tường minh Giảm nhu cầu của chuyecircn gia ANNs thigrave thiacutech nghi với caacutec yếu tố đầu vagraveo thay đổi Khocircng cần thiết cho cơ sở tri thức tinh chế ANNs coacute tiacutenh động vagrave cải thiện với việc sử dụng Coacute khả năng xử lyacute dữ liệu khocircng chiacutenh xaacutec hoặc khocircng đầy đủ Cho pheacutep tổng quaacutet hoacutea từ thocircng tin cụ thể Cho pheacutep thu thập cảm giaacutec thocircng thường vagraveo miền giải quyết vấn đề
13Hạn chế của việc liecircn kết với mạng noron ANNs khocircng thể giải thiacutech được suy luận Bản chất hộp đen thường khiến cho vấn đề traacutech nhiệm vagrave độ tin cậy phaacutet
sinh lagrave khoacute khăn Lặp đi lặp lại quaacute trigravenh huấn luyện rất tốn thời gian Nguồn lực caacutec nhagrave phacircn tiacutech vagrave thiết kế coacute tay nghề cao vẫn lagrave đaacuteng lo
ngại Cocircng nghệ ANN thuacutec đẩy hạn chế của phần cứng hiện tại ANN yecircu cầu phải coacute sự tin tưởng ở đầu ra
14Giới thiệu về thuật toaacuten di truyền Cũng như mạng lưới thần kinh caacutec thuật toaacuten di truyền được dựa trecircn lyacute
thuyết sinh học Thuật toaacuten di truyền tigravem thấy nguồn gốc của chuacuteng trong caacutec lyacute thuyết
tiến hoacutea của chọn lọc tự nhiecircn vagrave thiacutech ứng với biến đổi khiacute hậu Kết quả thuật toaacuten di truyền lagrave từ giao phối 2 caacute thể trong quần thế để tạo
ra con caacutei đocirci khi tốt hơn so với bậc cha mẹ của chuacuteng 15Caacutec thagravenh phần cơ bản của thuật toaacuten di truyền
Toaacuten tử chọn lọc Caacutec caacute thể tốt được chọn lọc để đưa vagraveo thế hệ sau Sự chọn lọc nagravey căn cứ vagraveo độ thiacutech nghi với mocirci trường của mỗi caacute thể
Toaacuten tử lai gheacutep (crossover) Hai caacute thể cha vagrave mẹ trao đổi caacutec gen với nhau để tạo ra caacute thể con
Toaacuten tử đột biến (mutation) Một caacute thể thay đổi một số gen để biến đổi thagravenh một caacute thể mớiTất cả caacutec toaacuten tử trecircn khi thực hiện đều mang tiacutenh ngẫu nhiecircn
16Quaacute trigravenh cơ bản của một thuật toaacuten di truyền Khởi tạo
Đaacutenh giaacute quần thể
Lựa chọn NST thiacutech hợp nhất vagrave loại bỏ NST yếu nhất
Quy trigravenh giao nhau vagrave cải thiện quần thể
đột biến tiến trigravenh để khaacutem phaacute ra NST mới
17Ưu nhược điểm của việc kết hợp với thuật toaacuten di truyền Kiacutech thước quần thể lagrave 1 yếu tố quan trọng trong tốc độ của việc tigravem
kiếmnhưng noacute tương đối dễ dagraveng để dự đoaacuten tốc độ nagravey Giao nhau hoặc đột biến lagrave khocircng necircn đc sử dụng quaacute thường xuyecircn Luocircn coacute được iacutet nhất 1 giải phaacutep hợp lyacute Necircn coacute thể aacutep dụng chuacuteng cho caacutec vấn đề magrave chuacuteng ta khocircng coacute hướng
về caacutech giải quyết Sức mạnh của thuật toaacuten xuất phaacutet từ khaacutei niệm đơn giảnkhocircng phải từ
một thủ tục thuật toaacuten phức tạp 18Tương lai của học maacutey
Mạng lưới thần kinh nhacircn tạo vượt quaacute năng lực của con người trong caacutec trường hợp bị cocirc lập
Về mặt lyacute thuyếtmột maacutey tiacutenh coacute thể xử lyacute dũ liệu nhanh hơn hagraveng triệu lần so với 1 con người
May mắn thay cho chuacuteng tacon người tốt hơn nhiều khi magrave coacute được dữ liệumaacutey tiacutenh khocircng coacute 1 số thứ như lagrave 5 giaacutec quan
CHƯƠNG 10 KHO DỮ LIỆU
1 Kho dữ liệu Kho dữ liệu lagrave tuyển tập caacutec cơ sở dữ liệu tiacutech hợp hướng chủ đề được
thiết kế để trợ giuacutep cho một hệ hỗ trợ quyết định
Theo John Ladley Cocircng nghệ kho dữ liệu lagrave tập caacutec phương phaacutep kỹ thuật vagrave caacutec cocircng cụ coacute thể kết hợp hỗ trợ nhau để cung cấp thocircng tin cho người sử dụng trecircn cơ sở tiacutech hợp từ nhiều nguồn dữ liệu nhiều mocirci trường khaacutec nhau
Kho dữ liệu thường rất lớn tới hagraveng trăm GB hay thậm chiacute hagraveng Terabyte
2 Kho dữ liệu vận hagravenh (ODS) Một kho dữ liệu vận hagravenh Aacutep dụng kỹ thuật kho dữ liệu vagraveo caacutec hệ xử
lyacute giao taacutec lưu trữ dữ liệu cho một ứng dụng đặc thugrave Noacute đưa vagraveo kho dữ liệu một dograveng caacutec dữ liệu thocirc được thiết kế
3 So saacutenh
Kho dữ liệu vận hagravenh Kho dữ liệu
Dữ liệu theo chủ đề Dữ liệu theo chủ đề
Dữ liệu tiacutech hợp Dữ liệu tiacutech hợp
Dữ liệu thay đổi Dữ liệu khocircng thay đổi
Dữ liệu được cập nhật khi thay đổi
Dữ liệu giữ nguyecircn
Chỉ coacute dữ liệu hiện tạiDữliệu hiện tại vagrave dữ liệu lịch sử
Chu kỳ lagravem tươi dữ liệu ngắn Chu kỳ lagravem tươi dữ liệu dagravei
Chỉ coacute dữ liệu chi tiết Dữ liệu chi tiết vagrave dữ liệu tổng kết
Dugraveng cho caacutec quyết định ngắn hạn
Dugraveng cho hoạch định dagravei hạn
4 Kho dữ liệu cục bộ (Data Mart - DM)
Kho dữ liệu cục bộ lagrave CSDL coacute những đặc điểm giống với kho dữ liệu nhưng với quy mocirc nhỏ hơn vagrave lưu trữ dữ liệu về một lĩnh vực một chuyecircn ngagravenh
Data mart phụ thuộc Chứa những dữ liệu được lấy từ DW vagrave những dữ liệu nagravey sẽ được triacutech lọc vagrave tinh chế tiacutech hợp lại ở mức cao hơn để phục vụ một chủ đề nhất định của Datamart
Data mart độc lập Khocircng giống như Datamart phụ thuộc Data mart độc lập được xacircy dựng trước DW vagrave dữ liệu được trực tiếp lấy từ caacutec nguồn khaacutec nhau
5 Siecircu dữ liệu Metadata lagrave dữ liệu để mocirc tả dữ liệu Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột
một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi Metadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu
6 Mocirci trường kho dữ liệu Hệ thống của tổ chức vagrave kho cung cấp dữ liệu để xacircy dựng kho dữ liệu Trong quaacute trigravenh chuyển dữ liệu từ caacutec nguồn khaacutec nhau dữ liệu coacute thể
được lagravem sạch hoặc chuyển đổi vagrave vigrave thế DW được xem như lagrave một chuẩn cho việc lưu trữ
Đồng thời siecircu dữ liệu được ghi lại Cuối cugraveng DW hoặc siecircu thị coacute thể được sử dụng để tạo ra một kho dữ
liệu ldquocaacute nhacircnrdquo 7 Caacutec đặc điểm của kho dữ liệu
Đặc điểm Mocirc tả
Hướng chủ đề - DL tổ chức theo caacutech thức người dugraveng tham chiếu
Tiacutech hợp - Dữ liệu ldquosạchrdquo loại bỏ tiacutenh thiếu nhất quaacuten
Khocircng thay đổi - DL ldquochỉ đọcrdquo người dugraveng khocircng thay đổi được
Chuỗi thời gian - DL lagrave chuỗi thời gian khocircng phải lagrave trạng thaacutei hiện tại
Được tổng kết - DL vận hagravenhthao taacutec khi cần thiết
được kết hợp lại thagravenh dạng coacute thể dugraveng được cho quyết định
Kiacutech cỡ lớn hơn - Lưu giữ theo chuỗi thời gian tức lagrave giữ lại nhiều DL
Khocircng được chuẩn hoacutea - Coacute thể dư thừa DLSiecircu dữ liệu - Dữ liệu của dữ liệu được lưu trữNguồn dữ liệu - DL vận hagravenh (caacutec hệ sẵn coacute) cugraveng
với caacutec nguồn ngoagravei 8 Kho dữ liệu hướng chủ đề
Hướng chủ để coacute nghĩa lagrave kho dữ liệu được tổ chức xung quanh caacutec chủ đề chiacutenh như khaacutech hagraveng sản phẩm sản xuất Tập trung vagraveo việc mocirc higravenh hoacutea vagrave phacircn tiacutech dữ liệu cho caacutec nhagrave ra quyết định magrave khocircng tập trung vagraveo caacutec xử lyacute thocircng thường Cung cấp cho người dugraveng một khung nhigraven toagraven vẹn đơn giản vagrave đầy đủ về caacutec sự kiện quanh caacutec chủ đề
9 Dữ liệu trong DW được tiacutech hợp Dữ liệu trong kho dữ liệu được xacircy dựng bằng caacutech tổng hợp dữ liệu từ
nhiều nguồn khaacutec nhau vagrave caacutec nguồn coacute tổ chức khaacutec nhau Cơ sở dữ liệu caacutec file excel caacutec flat file hoặc caacutec raw file Khi đưa vagraveo kho dữ liệu caacutec dữ liệu được lagravem sạch vagrave tiacutech hợp dữ liệu nhằm đảm bảo tiacutenh nhất quaacuten của dữ liệu
10Kiến truacutec kho dữ liệu Tầng cơ sở dữ liệu hoạt động Tầng truy xuất thocircng tin Tầng truy xuất dữ liệu Tầng siecircu dữ liệu Tầng quản lyacute tiến trigravenh Tầng thocircng điệp của ứng dụng Tầng vật liacute của kho dữ liệu Tầng trigravenh diễn dữ liệu
11Higravenh trạng kho dữ liệu Kho dữ liệu ảo - người dugraveng cuối coacute thể truy cập trực tiếp đến kho dữ liệu
sử dụng caacutec cocircng cụ cho pheacutep ở tầng truy xuất dữ liệu Kho dữ liệu trung tacircm-1 cơ sở dữ liệu vật lyacute chứa tất cả dữ liệu cho một
vugraveng chuyecircn dụng nagraveo đoacute
Kho dữ liệu phacircn taacuten- Thagravenh phần được phacircn taacuten qua nhiều hệ cơ sở dữ liệu vật lyacute
12METADATA- Siecircu dữ liệu Định nghĩa Siecircu dữ liệu lagrave dữ liệu về dữ liệu Lagrave 1 lưu trữ dugraveng để
Miecircu tả kho dữ liệu tổng thể Nhận dạng kiểu kho dữ liệu Quản liacute quaacute trigravenh tiacutech hợp dữ liệu Quản liacute quaacute trigravenh cập nhật kho dữ liệu Quản liacute bảo mật
Lagrave chigravea khoacutea quyết định sự thagravenh cocircng của kho dữ liệu luocircn được thay đổi vagrave cập nhật theo sự phaacutet triển của kho dữ liệu
Dugraveng để quản liacute điều khiển kho dữ liệu Sự ra đời của kho dữ liệu như 1 cấu truacutec hỗ trợ ra quyết định siecircu dữ liệu
được xem như nguồn tagravei nguyecircn dữ liệu Siecircu dữ liệu lagrave trừu tượng Chuacuteng lagrave dữ liệu bậc cao cung cấp mocirc tả ngắn
gọn caacutec dữ liệu bậc thấp hơn 13Hoạt động của Siecircu dữ liệu
Siecircu dữ liệu rất cần thiết trong việc chuyển hoacutea thocircng tin trở thagravenh tri thức Lagrave chigravea khoacutea giuacutep chuacuteng ta xử lyacute được dữ liệu thocirc Viacute dụ một dograveng dữ liệu baacuten hagraveng 1023 K596 11121 agraveNoacute sẽ khocircng coacute nghĩa gigrave cho đến khi chuacuteng ta đưa vagraveo siecircu dữ liệu (thư
mục chứa dữ liệu) agrave cửa hagraveng 1023 sản phẩm K596 vagrave số tiền baacuten được lagrave 11121 đocirc la
14Sự cần thiết phải nhất quaacuten trong kho dữ liệu Kho dữ liệu được xacircy dựng cho lợi iacutech của những nhagrave phacircn tiacutech kinh
doanh caacutec nhagrave quản trị cho tất cả caacutec khu vực chức năng Trong cơ sở dữ liệu riecircng caacutec khu vực khaacutec nhau coacute thể định nghĩa vagrave lưu
trữ dữ liệu thocircng qua phiecircn bản của chiacutenh noacute Khi dữ liệu được lấy từ những vugraveng khaacutec nhau đoacute vagrave được đặt vagraveo kho dữ
liệu Việc chuyển đổi vagrave lagravem sạch caacutec tiến trigravenh sẽ đảm bảo noacute lagrave duy nhất được tiacutech hợp tại một mức của tổ chức
15Ragrave soaacutet lại dữ liệu ndash Thực thi siecircu dữ liệu
Bất kể cấu truacutec tự nhiecircn của 1 cacircu truy vấn thế nagraveo thigrave caacutec thagravenh phần của siecircu dữ liệu rất quan trọng đối với người ra quyết định
Bảng thuộc tiacutenh khoacutea được lưu trữ bởi kho dữ liệu Tập hợp dữ liệu được lấy từ đacircu Những chuyển đổi nagraveo được thực thi với việc lagravem sạch
16Siecircu dữ liệu lagrave gigrave Metadata - lagrave thocircng tin mocirc tả nội dung của cơ sở dữ liệu (CSDL) Metadata baacuteo cho người dugraveng biết thời gian cập nhật sau cugraveng của dữ liệu
định dạng vagrave mục điacutech sử dụng của noacute Những thocircng tin nagravey coacute thể hướng dẫn người dugraveng duyệt qua CSDL vagrave
giuacutep họ hiểu được yacute nghĩa vagrave ngữ cảnh của dữ liệu Trong CSDL metadata lagrave caacutec dạng biểu diễn khaacutec nhau của caacutec đối tượng
trong CSDL Trong CSDL quan hệ metadata lagrave caacutec định nghĩa của bảng cột CSDL
view vagrave nhiều đối tượng khaacutec Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột
một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi -gtMetadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu
Bảng chuyển đổi Ghi lại những chuyển đổi đatilde được thực hiện
Lịch sử thực thi Ghi lại những dữ liệu đatilde được
phacircn tiacutech
Higravenh thaacutei kết nốiGhi lại những dữ liệu được kết nối vagrave tần suất
17Aacutenh xạ thocircng thường của siecircu dữ liệu Bản ghi aacutenh xạ chuyển đổi bao gồm
Định danh của nguồn gốc Chuyển đổi thuộc tiacutenh Chuyển đổi thuộc tiacutenh vật lyacute Matilde hoacutea tham chiếu bảng chuyển đổi Đổi tecircn Đổi khoacutea Gaacuten giaacute trị cho thuộc tiacutenh mặc định Chọn logic cho caacutec nguồn nhiều giaacute trị Đổi thuật toaacuten
18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để
phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai
lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave
tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec
Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm
Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo
19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua
caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau
SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được
Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra
một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức
Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ
Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ
Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech
CHƯƠNG 11 KHAI PHAacute DỮ LIỆU
1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn
ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993
Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng
2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd
1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều
2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP
3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn
4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng
5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server
6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo
7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động
8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời
9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều
10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện
11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech
12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP
3 Xử lyacute phacircn tiacutech trực tuyến OLAP
MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave
dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu
ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave
thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu
HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave
ROLAP4 Khai phaacute dữ liệu
Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh
khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn
Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan
5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp
6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại
Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp
Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec
Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt
Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra
Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh
vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho
Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec
Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm
Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục
Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng
gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp
Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn
Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec
Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper
Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2
Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25
Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước
Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng
Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện
trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp
Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute
độ hỗ trợ ge ngưỡng minsup
độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan
Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn
Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết
Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu
MOLAP ROLAP HOLAP
Lưu trữ dữ liệu cơ sở
Khối Bảng quan hệ Bảng quan hệ
Lưu trữ thocircng tin tổng hợp
Khối Bảng quan hệ Khối
Hiệu suất thực hiện truy vấn
Nhanh nhất Chậm nhất Nhanh
Tiecircu thụ khocircng gian lưu trữ
Nhiều Thấp Trung bigravenh
Chi phiacute bảo trigrave Cao Thấp Trung bigravenh
Phương phaacutep sagraveng lọc caacutec chuyecircn gia so saacutenh caacutec nhoacutem liecircn tiếp trong ba đối tượng vagrave cho biết tại sao nhoacutem thứ hai lại khaacutec nhoacutem thứ ba
7 Thu thập tri thức từ nhiều nguồn Thu thập tri thức từ nhiều nguồn lagrave cần thiết để coacute được đầy đủ caacutec tri thức
cho một vấn đề quan điểm yacute kiến traacutei ngược nhau thường phaacutet sinh Phương phaacutep đồng thuận sẽ giuacutep giải quyết được vấn đề macircu thuẫn Kỹ thuật phacircn tiacutech Meta lagrave kỹ thuật được aacutep dụng trong caacutec trường hợp
khaacutec Caacutech tiếp cận bằng định lượng đogravei hỏi caacutec kỹ sư cần cacircn nhắc yếu tố đầu vagraveo của caacutec chuyecircn gia khaacutec nhau
8 Xaacutec nhận hợp lệ vagrave kiểm tra tri thức Một khi thu thập tri thức noacute phải được đaacutenh giaacute về khả năng sử dụng vagrave độ
chiacutenh xaacutec Hai vấn đề cụ thể lagrave hiệu lực của những kiến thức vagrave kiểm tra việc xacircy dựng cơ sở của tri thức
Cần xaacutec nhận xem liệu hệ thống coacute thể hoạt động ở mức độ tối thiểu khocircng
Xaacutec minh liecircn quan đến việc so saacutenh từng chi tiết kỹ thuật của hệ thống những gigrave đatilde được thực hiện cuối cugraveng
9 Một số caacutec biện phaacutep xaacutec nhận Độ chiacutenh xaacutec Khả năng thiacutech nghi Mức độ đầy đủ Bề rộng Độ sacircu Hiệu lực Tổng quan Chiacutenh xaacutec Hiện thực Độ tin cậy Tiacutenh hữu dụng Mức độ
Chương 9 Học maacutey
1 Logic mờ vagrave ngocircn ngữ mờ(Fuzzy Logic and Linguistic Ambiguity)
Ngocircn ngữ tự nhiecircn gồm những khaacutei niệm mơ hồ vagrave khocircng chiacutenh xaacutectruyền tải ngữ nghĩa thocircng qua tiacutenh xấp xỉkhocircng rotilde ragraveng
Những xấp xỉ nagravey giuacutep con người coacute thể truyền tải hết được yacute nghĩa nhưng maacutey thigrave khocircng hiểu
Lagravem sao biểu diễn caacutec tri thức sử dụng caacutec khaacutei niệm khocircng rotilde ragraveng(mờ) hoặc khocircng chiacutenh xaacutec
2 Khaacutei niệm cơ bản của logic mờ tập mờ lagrave những tập hợp khocircng coacute một giới hạn rotilde Mỗi phần tử của noacute chỉ
chứa một mức độ hagravem liecircn thuộc của từng phần tử Vigrave vậy tập mờ khocircng giống như tập cổ điển Tập mờ coacute thể kết hợp với nhau qua những luật mờ magrave đặc trưng cho những hagravenh động trạng thaacutei vagrave thuộc tiacutenh của logic mờ được tận dụng khi thực hiện một bộ điều khiển mờ
Logic mờ dựa trecircn yacute tưởng mỗi phần tử thuộc vagraveo một tập hợp ở một mức độ nagraveo đấy
Locircgic mờ cho pheacutep độ liecircn thuộc (microA )coacute giaacute trị trong khoảng (01) Locircgic mờ coacute thể được coi lagrave mặt ứng dụng của lyacute thuyết tập mờ để xử lyacute caacutec
giaacute trị trong thế giới thực cho caacutec bagravei toaacuten phức tạp
3 So saacutenh tiacutenh đuacuteng đắn logic mờ vagrave xaacutec suất Xaacutec suất thigrave đề cập đến khả năng xảy ra một biến cố hay một điều gigrave đoacute Logic mờ đề cập đến cấp độ magrave đặc tiacutenh ở hiện tại
o viacute dụ1 người coacute chiều cao 6 feet thigrave coacute cấp độ lagrave 05 về chiều cao
4 Ưu điểm của logic mờ Caacutech tiếp cận rất tự nhiecircnkhocircng phức tạp Coacute thể mocirc higravenh hoacutea caacutec hagravem phi tuyến tugravey yacute phức tạp
Coacute thể tận dụng được kinh nghiệm từ những chuyecircn gia hagraveng đầu trong mọi lĩnh vực
Logic mờ được xacircy dựng dựa trecircn ngocircn ngữ tự nhiecircnNền tảng của logic mờ lagrave dựa trecircn cơ sở giao tiếp của con người
5 Nhược điểm của logic mờ Trong 1 hệ thống phức tạpsử dụng logic mờ coacute thể trở thagravenh trở ngại cho
việc xaacutec thực độ tin cậy của hệ thống Cơ chế lập luận mờ khocircng thể học hỏi từ những lỗi sai
6 Mạng noron nhacircn tạo(ANN) Mạng noron nhacircn tạo lagrave một mocirc phỏng xử lyacute thocircng tinđược nghiecircn cứu ra
từ hệ thống thần kinh của sinh vậtgiống như bộ natildeo để xử lyacute thocircng tin ANNs lagrave chương trigravenh dựa trecircn maacutey tiacutenh đơn giản coacute chức năng lagrave một mocirc
higravenh bagravei toaacuten khocircng gian dựa trecircn thử nghiệm vagrave baacuteo lỗi
7 Học từ kinh nghiệm Tiến trigravenh Một mẫu dữ liệu được biểu diễn như một mạng lưới noronANN ldquodự
đoaacutenrdquo 1 đầu radự đoaacuten được so saacutenh với giaacute trị thực tế hoặc giaacute trị chiacutenh xaacutecNếu đoaacuten được chiacutenh xaacutec thigrave khocircng coacute hagravenh động nagraveo được thực hiện
Nếu dự đoaacuten sai ANN kiểm tra lại vagrave xaacutec định lại thocircng số để điều chỉnh Một mẫu dữ liệu khaacutec được biểu diễn vagrave quaacute trigravenh nagravey được lặp lại
8 Nguyecircn tắc cơ bản của cocircng nghệ nơron Caacutec yếu tố xử lyacute cơ bản trong hệ thống thần kinh của con người lagrave tế bagraveo
thần kinhMạng lưới của tế bagraveo nagravey lagrave liecircn kết với nhau nhận được thocircng tin từ caacutec cảm biến trong mắt taihellip
Thocircng tin nhận được bởi tế bagraveo thần kinh hoặc lagrave sẽ kiacutech thiacutech noacute(sẽ được chuyển qua 1 thocircng điệp dọc theo mạng lưới) hoặc lagrave sẽ ngăn cản noacute(ngăn cản dograveng thocircng tin)
Độ nhạy coacute thể thay đổi qua thời gian hoặc sau khi coacute được kinh nghiệm
9 Cấu truacutec mạng Một ANN gồm 3 lớp cơ bản
Lớp đầu vagraveo nhận dữ liệu Lớp becircn trong hoặc lagrave lớp ẩn xử lyacute dữ liệu Lớp đầu ra chuyển tiếp kết quả cuối cugraveng của mạng
10Mạng nơ ron Thường coacute nhiều đầu vagraveo mỗi đầu vagraveo với mức ảnh hưởng vagrave tầm quan
trọng riecircng của noacute Một đầu vagraveo quan trọng coacute thể được sử dụng để khuếch đại đầu ra caacutec hagravem trạng thaacutei tổng hợp caacutec trọng số của caacutec yếu tố
đầuvagraveo khaacutec nhauvagraveo một giaacute trị duy nhất Caacutec hagravem chuyển giao xử lyacute caacutec giaacute trị trạng thaacutei vagrave tạo đầu ra
11Huấn luyện mạng nơ ron Trong mocirc higravenh coacute giaacutem saacutetANN được đến so saacutenh dự đoaacuten của chiacutenh
noacute với thocircng tin phản hồi coacute chứa caacutec kết quả mong muốn ANN sẽ phải tigravem caacutech thay đổi caacutec tham số becircn trong củamigravenh (caacutec trọng số vagrave caacutec ngưỡng) để tạo necircn một aacutenh xạ coacute khả năng aacutenh xạcaacutec đầu vagraveo thagravenh caacutec đầu ra mong muốn Sự thay đổi nagravey được tiến hagravenh nhờ việc so saacutenh giữa đầu ra thực sự vagrave đầu ra mong muốn
Trong mocirc higravenh khocircng coacute giaacutem saacutetANN nhận được dữ liệu vagraveo nhưng khocircng phải coacute bất kỳ thocircng tin phản hồi về kết quả mong muốn
Phần lớn caacutec ứng dụng nằm trong vugraveng của caacutec bagravei toaacuten ước lượng như mocirc higravenh hoacuteathống kecirc neacuten lọc phacircn cụm
12Lợi iacutech Liecircn kết với mạng noron Traacutenh caacutech lập trigravenh tường minh Giảm nhu cầu của chuyecircn gia ANNs thigrave thiacutech nghi với caacutec yếu tố đầu vagraveo thay đổi Khocircng cần thiết cho cơ sở tri thức tinh chế ANNs coacute tiacutenh động vagrave cải thiện với việc sử dụng Coacute khả năng xử lyacute dữ liệu khocircng chiacutenh xaacutec hoặc khocircng đầy đủ Cho pheacutep tổng quaacutet hoacutea từ thocircng tin cụ thể Cho pheacutep thu thập cảm giaacutec thocircng thường vagraveo miền giải quyết vấn đề
13Hạn chế của việc liecircn kết với mạng noron ANNs khocircng thể giải thiacutech được suy luận Bản chất hộp đen thường khiến cho vấn đề traacutech nhiệm vagrave độ tin cậy phaacutet
sinh lagrave khoacute khăn Lặp đi lặp lại quaacute trigravenh huấn luyện rất tốn thời gian Nguồn lực caacutec nhagrave phacircn tiacutech vagrave thiết kế coacute tay nghề cao vẫn lagrave đaacuteng lo
ngại Cocircng nghệ ANN thuacutec đẩy hạn chế của phần cứng hiện tại ANN yecircu cầu phải coacute sự tin tưởng ở đầu ra
14Giới thiệu về thuật toaacuten di truyền Cũng như mạng lưới thần kinh caacutec thuật toaacuten di truyền được dựa trecircn lyacute
thuyết sinh học Thuật toaacuten di truyền tigravem thấy nguồn gốc của chuacuteng trong caacutec lyacute thuyết
tiến hoacutea của chọn lọc tự nhiecircn vagrave thiacutech ứng với biến đổi khiacute hậu Kết quả thuật toaacuten di truyền lagrave từ giao phối 2 caacute thể trong quần thế để tạo
ra con caacutei đocirci khi tốt hơn so với bậc cha mẹ của chuacuteng 15Caacutec thagravenh phần cơ bản của thuật toaacuten di truyền
Toaacuten tử chọn lọc Caacutec caacute thể tốt được chọn lọc để đưa vagraveo thế hệ sau Sự chọn lọc nagravey căn cứ vagraveo độ thiacutech nghi với mocirci trường của mỗi caacute thể
Toaacuten tử lai gheacutep (crossover) Hai caacute thể cha vagrave mẹ trao đổi caacutec gen với nhau để tạo ra caacute thể con
Toaacuten tử đột biến (mutation) Một caacute thể thay đổi một số gen để biến đổi thagravenh một caacute thể mớiTất cả caacutec toaacuten tử trecircn khi thực hiện đều mang tiacutenh ngẫu nhiecircn
16Quaacute trigravenh cơ bản của một thuật toaacuten di truyền Khởi tạo
Đaacutenh giaacute quần thể
Lựa chọn NST thiacutech hợp nhất vagrave loại bỏ NST yếu nhất
Quy trigravenh giao nhau vagrave cải thiện quần thể
đột biến tiến trigravenh để khaacutem phaacute ra NST mới
17Ưu nhược điểm của việc kết hợp với thuật toaacuten di truyền Kiacutech thước quần thể lagrave 1 yếu tố quan trọng trong tốc độ của việc tigravem
kiếmnhưng noacute tương đối dễ dagraveng để dự đoaacuten tốc độ nagravey Giao nhau hoặc đột biến lagrave khocircng necircn đc sử dụng quaacute thường xuyecircn Luocircn coacute được iacutet nhất 1 giải phaacutep hợp lyacute Necircn coacute thể aacutep dụng chuacuteng cho caacutec vấn đề magrave chuacuteng ta khocircng coacute hướng
về caacutech giải quyết Sức mạnh của thuật toaacuten xuất phaacutet từ khaacutei niệm đơn giảnkhocircng phải từ
một thủ tục thuật toaacuten phức tạp 18Tương lai của học maacutey
Mạng lưới thần kinh nhacircn tạo vượt quaacute năng lực của con người trong caacutec trường hợp bị cocirc lập
Về mặt lyacute thuyếtmột maacutey tiacutenh coacute thể xử lyacute dũ liệu nhanh hơn hagraveng triệu lần so với 1 con người
May mắn thay cho chuacuteng tacon người tốt hơn nhiều khi magrave coacute được dữ liệumaacutey tiacutenh khocircng coacute 1 số thứ như lagrave 5 giaacutec quan
CHƯƠNG 10 KHO DỮ LIỆU
1 Kho dữ liệu Kho dữ liệu lagrave tuyển tập caacutec cơ sở dữ liệu tiacutech hợp hướng chủ đề được
thiết kế để trợ giuacutep cho một hệ hỗ trợ quyết định
Theo John Ladley Cocircng nghệ kho dữ liệu lagrave tập caacutec phương phaacutep kỹ thuật vagrave caacutec cocircng cụ coacute thể kết hợp hỗ trợ nhau để cung cấp thocircng tin cho người sử dụng trecircn cơ sở tiacutech hợp từ nhiều nguồn dữ liệu nhiều mocirci trường khaacutec nhau
Kho dữ liệu thường rất lớn tới hagraveng trăm GB hay thậm chiacute hagraveng Terabyte
2 Kho dữ liệu vận hagravenh (ODS) Một kho dữ liệu vận hagravenh Aacutep dụng kỹ thuật kho dữ liệu vagraveo caacutec hệ xử
lyacute giao taacutec lưu trữ dữ liệu cho một ứng dụng đặc thugrave Noacute đưa vagraveo kho dữ liệu một dograveng caacutec dữ liệu thocirc được thiết kế
3 So saacutenh
Kho dữ liệu vận hagravenh Kho dữ liệu
Dữ liệu theo chủ đề Dữ liệu theo chủ đề
Dữ liệu tiacutech hợp Dữ liệu tiacutech hợp
Dữ liệu thay đổi Dữ liệu khocircng thay đổi
Dữ liệu được cập nhật khi thay đổi
Dữ liệu giữ nguyecircn
Chỉ coacute dữ liệu hiện tạiDữliệu hiện tại vagrave dữ liệu lịch sử
Chu kỳ lagravem tươi dữ liệu ngắn Chu kỳ lagravem tươi dữ liệu dagravei
Chỉ coacute dữ liệu chi tiết Dữ liệu chi tiết vagrave dữ liệu tổng kết
Dugraveng cho caacutec quyết định ngắn hạn
Dugraveng cho hoạch định dagravei hạn
4 Kho dữ liệu cục bộ (Data Mart - DM)
Kho dữ liệu cục bộ lagrave CSDL coacute những đặc điểm giống với kho dữ liệu nhưng với quy mocirc nhỏ hơn vagrave lưu trữ dữ liệu về một lĩnh vực một chuyecircn ngagravenh
Data mart phụ thuộc Chứa những dữ liệu được lấy từ DW vagrave những dữ liệu nagravey sẽ được triacutech lọc vagrave tinh chế tiacutech hợp lại ở mức cao hơn để phục vụ một chủ đề nhất định của Datamart
Data mart độc lập Khocircng giống như Datamart phụ thuộc Data mart độc lập được xacircy dựng trước DW vagrave dữ liệu được trực tiếp lấy từ caacutec nguồn khaacutec nhau
5 Siecircu dữ liệu Metadata lagrave dữ liệu để mocirc tả dữ liệu Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột
một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi Metadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu
6 Mocirci trường kho dữ liệu Hệ thống của tổ chức vagrave kho cung cấp dữ liệu để xacircy dựng kho dữ liệu Trong quaacute trigravenh chuyển dữ liệu từ caacutec nguồn khaacutec nhau dữ liệu coacute thể
được lagravem sạch hoặc chuyển đổi vagrave vigrave thế DW được xem như lagrave một chuẩn cho việc lưu trữ
Đồng thời siecircu dữ liệu được ghi lại Cuối cugraveng DW hoặc siecircu thị coacute thể được sử dụng để tạo ra một kho dữ
liệu ldquocaacute nhacircnrdquo 7 Caacutec đặc điểm của kho dữ liệu
Đặc điểm Mocirc tả
Hướng chủ đề - DL tổ chức theo caacutech thức người dugraveng tham chiếu
Tiacutech hợp - Dữ liệu ldquosạchrdquo loại bỏ tiacutenh thiếu nhất quaacuten
Khocircng thay đổi - DL ldquochỉ đọcrdquo người dugraveng khocircng thay đổi được
Chuỗi thời gian - DL lagrave chuỗi thời gian khocircng phải lagrave trạng thaacutei hiện tại
Được tổng kết - DL vận hagravenhthao taacutec khi cần thiết
được kết hợp lại thagravenh dạng coacute thể dugraveng được cho quyết định
Kiacutech cỡ lớn hơn - Lưu giữ theo chuỗi thời gian tức lagrave giữ lại nhiều DL
Khocircng được chuẩn hoacutea - Coacute thể dư thừa DLSiecircu dữ liệu - Dữ liệu của dữ liệu được lưu trữNguồn dữ liệu - DL vận hagravenh (caacutec hệ sẵn coacute) cugraveng
với caacutec nguồn ngoagravei 8 Kho dữ liệu hướng chủ đề
Hướng chủ để coacute nghĩa lagrave kho dữ liệu được tổ chức xung quanh caacutec chủ đề chiacutenh như khaacutech hagraveng sản phẩm sản xuất Tập trung vagraveo việc mocirc higravenh hoacutea vagrave phacircn tiacutech dữ liệu cho caacutec nhagrave ra quyết định magrave khocircng tập trung vagraveo caacutec xử lyacute thocircng thường Cung cấp cho người dugraveng một khung nhigraven toagraven vẹn đơn giản vagrave đầy đủ về caacutec sự kiện quanh caacutec chủ đề
9 Dữ liệu trong DW được tiacutech hợp Dữ liệu trong kho dữ liệu được xacircy dựng bằng caacutech tổng hợp dữ liệu từ
nhiều nguồn khaacutec nhau vagrave caacutec nguồn coacute tổ chức khaacutec nhau Cơ sở dữ liệu caacutec file excel caacutec flat file hoặc caacutec raw file Khi đưa vagraveo kho dữ liệu caacutec dữ liệu được lagravem sạch vagrave tiacutech hợp dữ liệu nhằm đảm bảo tiacutenh nhất quaacuten của dữ liệu
10Kiến truacutec kho dữ liệu Tầng cơ sở dữ liệu hoạt động Tầng truy xuất thocircng tin Tầng truy xuất dữ liệu Tầng siecircu dữ liệu Tầng quản lyacute tiến trigravenh Tầng thocircng điệp của ứng dụng Tầng vật liacute của kho dữ liệu Tầng trigravenh diễn dữ liệu
11Higravenh trạng kho dữ liệu Kho dữ liệu ảo - người dugraveng cuối coacute thể truy cập trực tiếp đến kho dữ liệu
sử dụng caacutec cocircng cụ cho pheacutep ở tầng truy xuất dữ liệu Kho dữ liệu trung tacircm-1 cơ sở dữ liệu vật lyacute chứa tất cả dữ liệu cho một
vugraveng chuyecircn dụng nagraveo đoacute
Kho dữ liệu phacircn taacuten- Thagravenh phần được phacircn taacuten qua nhiều hệ cơ sở dữ liệu vật lyacute
12METADATA- Siecircu dữ liệu Định nghĩa Siecircu dữ liệu lagrave dữ liệu về dữ liệu Lagrave 1 lưu trữ dugraveng để
Miecircu tả kho dữ liệu tổng thể Nhận dạng kiểu kho dữ liệu Quản liacute quaacute trigravenh tiacutech hợp dữ liệu Quản liacute quaacute trigravenh cập nhật kho dữ liệu Quản liacute bảo mật
Lagrave chigravea khoacutea quyết định sự thagravenh cocircng của kho dữ liệu luocircn được thay đổi vagrave cập nhật theo sự phaacutet triển của kho dữ liệu
Dugraveng để quản liacute điều khiển kho dữ liệu Sự ra đời của kho dữ liệu như 1 cấu truacutec hỗ trợ ra quyết định siecircu dữ liệu
được xem như nguồn tagravei nguyecircn dữ liệu Siecircu dữ liệu lagrave trừu tượng Chuacuteng lagrave dữ liệu bậc cao cung cấp mocirc tả ngắn
gọn caacutec dữ liệu bậc thấp hơn 13Hoạt động của Siecircu dữ liệu
Siecircu dữ liệu rất cần thiết trong việc chuyển hoacutea thocircng tin trở thagravenh tri thức Lagrave chigravea khoacutea giuacutep chuacuteng ta xử lyacute được dữ liệu thocirc Viacute dụ một dograveng dữ liệu baacuten hagraveng 1023 K596 11121 agraveNoacute sẽ khocircng coacute nghĩa gigrave cho đến khi chuacuteng ta đưa vagraveo siecircu dữ liệu (thư
mục chứa dữ liệu) agrave cửa hagraveng 1023 sản phẩm K596 vagrave số tiền baacuten được lagrave 11121 đocirc la
14Sự cần thiết phải nhất quaacuten trong kho dữ liệu Kho dữ liệu được xacircy dựng cho lợi iacutech của những nhagrave phacircn tiacutech kinh
doanh caacutec nhagrave quản trị cho tất cả caacutec khu vực chức năng Trong cơ sở dữ liệu riecircng caacutec khu vực khaacutec nhau coacute thể định nghĩa vagrave lưu
trữ dữ liệu thocircng qua phiecircn bản của chiacutenh noacute Khi dữ liệu được lấy từ những vugraveng khaacutec nhau đoacute vagrave được đặt vagraveo kho dữ
liệu Việc chuyển đổi vagrave lagravem sạch caacutec tiến trigravenh sẽ đảm bảo noacute lagrave duy nhất được tiacutech hợp tại một mức của tổ chức
15Ragrave soaacutet lại dữ liệu ndash Thực thi siecircu dữ liệu
Bất kể cấu truacutec tự nhiecircn của 1 cacircu truy vấn thế nagraveo thigrave caacutec thagravenh phần của siecircu dữ liệu rất quan trọng đối với người ra quyết định
Bảng thuộc tiacutenh khoacutea được lưu trữ bởi kho dữ liệu Tập hợp dữ liệu được lấy từ đacircu Những chuyển đổi nagraveo được thực thi với việc lagravem sạch
16Siecircu dữ liệu lagrave gigrave Metadata - lagrave thocircng tin mocirc tả nội dung của cơ sở dữ liệu (CSDL) Metadata baacuteo cho người dugraveng biết thời gian cập nhật sau cugraveng của dữ liệu
định dạng vagrave mục điacutech sử dụng của noacute Những thocircng tin nagravey coacute thể hướng dẫn người dugraveng duyệt qua CSDL vagrave
giuacutep họ hiểu được yacute nghĩa vagrave ngữ cảnh của dữ liệu Trong CSDL metadata lagrave caacutec dạng biểu diễn khaacutec nhau của caacutec đối tượng
trong CSDL Trong CSDL quan hệ metadata lagrave caacutec định nghĩa của bảng cột CSDL
view vagrave nhiều đối tượng khaacutec Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột
một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi -gtMetadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu
Bảng chuyển đổi Ghi lại những chuyển đổi đatilde được thực hiện
Lịch sử thực thi Ghi lại những dữ liệu đatilde được
phacircn tiacutech
Higravenh thaacutei kết nốiGhi lại những dữ liệu được kết nối vagrave tần suất
17Aacutenh xạ thocircng thường của siecircu dữ liệu Bản ghi aacutenh xạ chuyển đổi bao gồm
Định danh của nguồn gốc Chuyển đổi thuộc tiacutenh Chuyển đổi thuộc tiacutenh vật lyacute Matilde hoacutea tham chiếu bảng chuyển đổi Đổi tecircn Đổi khoacutea Gaacuten giaacute trị cho thuộc tiacutenh mặc định Chọn logic cho caacutec nguồn nhiều giaacute trị Đổi thuật toaacuten
18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để
phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai
lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave
tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec
Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm
Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo
19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua
caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau
SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được
Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra
một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức
Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ
Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ
Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech
CHƯƠNG 11 KHAI PHAacute DỮ LIỆU
1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn
ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993
Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng
2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd
1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều
2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP
3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn
4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng
5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server
6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo
7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động
8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời
9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều
10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện
11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech
12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP
3 Xử lyacute phacircn tiacutech trực tuyến OLAP
MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave
dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu
ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave
thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu
HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave
ROLAP4 Khai phaacute dữ liệu
Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh
khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn
Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan
5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp
6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại
Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp
Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec
Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt
Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra
Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh
vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho
Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec
Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm
Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục
Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng
gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp
Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn
Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec
Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper
Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2
Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25
Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước
Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng
Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện
trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp
Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute
độ hỗ trợ ge ngưỡng minsup
độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan
Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn
Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết
Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu
MOLAP ROLAP HOLAP
Lưu trữ dữ liệu cơ sở
Khối Bảng quan hệ Bảng quan hệ
Lưu trữ thocircng tin tổng hợp
Khối Bảng quan hệ Khối
Hiệu suất thực hiện truy vấn
Nhanh nhất Chậm nhất Nhanh
Tiecircu thụ khocircng gian lưu trữ
Nhiều Thấp Trung bigravenh
Chi phiacute bảo trigrave Cao Thấp Trung bigravenh
Chương 9 Học maacutey
1 Logic mờ vagrave ngocircn ngữ mờ(Fuzzy Logic and Linguistic Ambiguity)
Ngocircn ngữ tự nhiecircn gồm những khaacutei niệm mơ hồ vagrave khocircng chiacutenh xaacutectruyền tải ngữ nghĩa thocircng qua tiacutenh xấp xỉkhocircng rotilde ragraveng
Những xấp xỉ nagravey giuacutep con người coacute thể truyền tải hết được yacute nghĩa nhưng maacutey thigrave khocircng hiểu
Lagravem sao biểu diễn caacutec tri thức sử dụng caacutec khaacutei niệm khocircng rotilde ragraveng(mờ) hoặc khocircng chiacutenh xaacutec
2 Khaacutei niệm cơ bản của logic mờ tập mờ lagrave những tập hợp khocircng coacute một giới hạn rotilde Mỗi phần tử của noacute chỉ
chứa một mức độ hagravem liecircn thuộc của từng phần tử Vigrave vậy tập mờ khocircng giống như tập cổ điển Tập mờ coacute thể kết hợp với nhau qua những luật mờ magrave đặc trưng cho những hagravenh động trạng thaacutei vagrave thuộc tiacutenh của logic mờ được tận dụng khi thực hiện một bộ điều khiển mờ
Logic mờ dựa trecircn yacute tưởng mỗi phần tử thuộc vagraveo một tập hợp ở một mức độ nagraveo đấy
Locircgic mờ cho pheacutep độ liecircn thuộc (microA )coacute giaacute trị trong khoảng (01) Locircgic mờ coacute thể được coi lagrave mặt ứng dụng của lyacute thuyết tập mờ để xử lyacute caacutec
giaacute trị trong thế giới thực cho caacutec bagravei toaacuten phức tạp
3 So saacutenh tiacutenh đuacuteng đắn logic mờ vagrave xaacutec suất Xaacutec suất thigrave đề cập đến khả năng xảy ra một biến cố hay một điều gigrave đoacute Logic mờ đề cập đến cấp độ magrave đặc tiacutenh ở hiện tại
o viacute dụ1 người coacute chiều cao 6 feet thigrave coacute cấp độ lagrave 05 về chiều cao
4 Ưu điểm của logic mờ Caacutech tiếp cận rất tự nhiecircnkhocircng phức tạp Coacute thể mocirc higravenh hoacutea caacutec hagravem phi tuyến tugravey yacute phức tạp
Coacute thể tận dụng được kinh nghiệm từ những chuyecircn gia hagraveng đầu trong mọi lĩnh vực
Logic mờ được xacircy dựng dựa trecircn ngocircn ngữ tự nhiecircnNền tảng của logic mờ lagrave dựa trecircn cơ sở giao tiếp của con người
5 Nhược điểm của logic mờ Trong 1 hệ thống phức tạpsử dụng logic mờ coacute thể trở thagravenh trở ngại cho
việc xaacutec thực độ tin cậy của hệ thống Cơ chế lập luận mờ khocircng thể học hỏi từ những lỗi sai
6 Mạng noron nhacircn tạo(ANN) Mạng noron nhacircn tạo lagrave một mocirc phỏng xử lyacute thocircng tinđược nghiecircn cứu ra
từ hệ thống thần kinh của sinh vậtgiống như bộ natildeo để xử lyacute thocircng tin ANNs lagrave chương trigravenh dựa trecircn maacutey tiacutenh đơn giản coacute chức năng lagrave một mocirc
higravenh bagravei toaacuten khocircng gian dựa trecircn thử nghiệm vagrave baacuteo lỗi
7 Học từ kinh nghiệm Tiến trigravenh Một mẫu dữ liệu được biểu diễn như một mạng lưới noronANN ldquodự
đoaacutenrdquo 1 đầu radự đoaacuten được so saacutenh với giaacute trị thực tế hoặc giaacute trị chiacutenh xaacutecNếu đoaacuten được chiacutenh xaacutec thigrave khocircng coacute hagravenh động nagraveo được thực hiện
Nếu dự đoaacuten sai ANN kiểm tra lại vagrave xaacutec định lại thocircng số để điều chỉnh Một mẫu dữ liệu khaacutec được biểu diễn vagrave quaacute trigravenh nagravey được lặp lại
8 Nguyecircn tắc cơ bản của cocircng nghệ nơron Caacutec yếu tố xử lyacute cơ bản trong hệ thống thần kinh của con người lagrave tế bagraveo
thần kinhMạng lưới của tế bagraveo nagravey lagrave liecircn kết với nhau nhận được thocircng tin từ caacutec cảm biến trong mắt taihellip
Thocircng tin nhận được bởi tế bagraveo thần kinh hoặc lagrave sẽ kiacutech thiacutech noacute(sẽ được chuyển qua 1 thocircng điệp dọc theo mạng lưới) hoặc lagrave sẽ ngăn cản noacute(ngăn cản dograveng thocircng tin)
Độ nhạy coacute thể thay đổi qua thời gian hoặc sau khi coacute được kinh nghiệm
9 Cấu truacutec mạng Một ANN gồm 3 lớp cơ bản
Lớp đầu vagraveo nhận dữ liệu Lớp becircn trong hoặc lagrave lớp ẩn xử lyacute dữ liệu Lớp đầu ra chuyển tiếp kết quả cuối cugraveng của mạng
10Mạng nơ ron Thường coacute nhiều đầu vagraveo mỗi đầu vagraveo với mức ảnh hưởng vagrave tầm quan
trọng riecircng của noacute Một đầu vagraveo quan trọng coacute thể được sử dụng để khuếch đại đầu ra caacutec hagravem trạng thaacutei tổng hợp caacutec trọng số của caacutec yếu tố
đầuvagraveo khaacutec nhauvagraveo một giaacute trị duy nhất Caacutec hagravem chuyển giao xử lyacute caacutec giaacute trị trạng thaacutei vagrave tạo đầu ra
11Huấn luyện mạng nơ ron Trong mocirc higravenh coacute giaacutem saacutetANN được đến so saacutenh dự đoaacuten của chiacutenh
noacute với thocircng tin phản hồi coacute chứa caacutec kết quả mong muốn ANN sẽ phải tigravem caacutech thay đổi caacutec tham số becircn trong củamigravenh (caacutec trọng số vagrave caacutec ngưỡng) để tạo necircn một aacutenh xạ coacute khả năng aacutenh xạcaacutec đầu vagraveo thagravenh caacutec đầu ra mong muốn Sự thay đổi nagravey được tiến hagravenh nhờ việc so saacutenh giữa đầu ra thực sự vagrave đầu ra mong muốn
Trong mocirc higravenh khocircng coacute giaacutem saacutetANN nhận được dữ liệu vagraveo nhưng khocircng phải coacute bất kỳ thocircng tin phản hồi về kết quả mong muốn
Phần lớn caacutec ứng dụng nằm trong vugraveng của caacutec bagravei toaacuten ước lượng như mocirc higravenh hoacuteathống kecirc neacuten lọc phacircn cụm
12Lợi iacutech Liecircn kết với mạng noron Traacutenh caacutech lập trigravenh tường minh Giảm nhu cầu của chuyecircn gia ANNs thigrave thiacutech nghi với caacutec yếu tố đầu vagraveo thay đổi Khocircng cần thiết cho cơ sở tri thức tinh chế ANNs coacute tiacutenh động vagrave cải thiện với việc sử dụng Coacute khả năng xử lyacute dữ liệu khocircng chiacutenh xaacutec hoặc khocircng đầy đủ Cho pheacutep tổng quaacutet hoacutea từ thocircng tin cụ thể Cho pheacutep thu thập cảm giaacutec thocircng thường vagraveo miền giải quyết vấn đề
13Hạn chế của việc liecircn kết với mạng noron ANNs khocircng thể giải thiacutech được suy luận Bản chất hộp đen thường khiến cho vấn đề traacutech nhiệm vagrave độ tin cậy phaacutet
sinh lagrave khoacute khăn Lặp đi lặp lại quaacute trigravenh huấn luyện rất tốn thời gian Nguồn lực caacutec nhagrave phacircn tiacutech vagrave thiết kế coacute tay nghề cao vẫn lagrave đaacuteng lo
ngại Cocircng nghệ ANN thuacutec đẩy hạn chế của phần cứng hiện tại ANN yecircu cầu phải coacute sự tin tưởng ở đầu ra
14Giới thiệu về thuật toaacuten di truyền Cũng như mạng lưới thần kinh caacutec thuật toaacuten di truyền được dựa trecircn lyacute
thuyết sinh học Thuật toaacuten di truyền tigravem thấy nguồn gốc của chuacuteng trong caacutec lyacute thuyết
tiến hoacutea của chọn lọc tự nhiecircn vagrave thiacutech ứng với biến đổi khiacute hậu Kết quả thuật toaacuten di truyền lagrave từ giao phối 2 caacute thể trong quần thế để tạo
ra con caacutei đocirci khi tốt hơn so với bậc cha mẹ của chuacuteng 15Caacutec thagravenh phần cơ bản của thuật toaacuten di truyền
Toaacuten tử chọn lọc Caacutec caacute thể tốt được chọn lọc để đưa vagraveo thế hệ sau Sự chọn lọc nagravey căn cứ vagraveo độ thiacutech nghi với mocirci trường của mỗi caacute thể
Toaacuten tử lai gheacutep (crossover) Hai caacute thể cha vagrave mẹ trao đổi caacutec gen với nhau để tạo ra caacute thể con
Toaacuten tử đột biến (mutation) Một caacute thể thay đổi một số gen để biến đổi thagravenh một caacute thể mớiTất cả caacutec toaacuten tử trecircn khi thực hiện đều mang tiacutenh ngẫu nhiecircn
16Quaacute trigravenh cơ bản của một thuật toaacuten di truyền Khởi tạo
Đaacutenh giaacute quần thể
Lựa chọn NST thiacutech hợp nhất vagrave loại bỏ NST yếu nhất
Quy trigravenh giao nhau vagrave cải thiện quần thể
đột biến tiến trigravenh để khaacutem phaacute ra NST mới
17Ưu nhược điểm của việc kết hợp với thuật toaacuten di truyền Kiacutech thước quần thể lagrave 1 yếu tố quan trọng trong tốc độ của việc tigravem
kiếmnhưng noacute tương đối dễ dagraveng để dự đoaacuten tốc độ nagravey Giao nhau hoặc đột biến lagrave khocircng necircn đc sử dụng quaacute thường xuyecircn Luocircn coacute được iacutet nhất 1 giải phaacutep hợp lyacute Necircn coacute thể aacutep dụng chuacuteng cho caacutec vấn đề magrave chuacuteng ta khocircng coacute hướng
về caacutech giải quyết Sức mạnh của thuật toaacuten xuất phaacutet từ khaacutei niệm đơn giảnkhocircng phải từ
một thủ tục thuật toaacuten phức tạp 18Tương lai của học maacutey
Mạng lưới thần kinh nhacircn tạo vượt quaacute năng lực của con người trong caacutec trường hợp bị cocirc lập
Về mặt lyacute thuyếtmột maacutey tiacutenh coacute thể xử lyacute dũ liệu nhanh hơn hagraveng triệu lần so với 1 con người
May mắn thay cho chuacuteng tacon người tốt hơn nhiều khi magrave coacute được dữ liệumaacutey tiacutenh khocircng coacute 1 số thứ như lagrave 5 giaacutec quan
CHƯƠNG 10 KHO DỮ LIỆU
1 Kho dữ liệu Kho dữ liệu lagrave tuyển tập caacutec cơ sở dữ liệu tiacutech hợp hướng chủ đề được
thiết kế để trợ giuacutep cho một hệ hỗ trợ quyết định
Theo John Ladley Cocircng nghệ kho dữ liệu lagrave tập caacutec phương phaacutep kỹ thuật vagrave caacutec cocircng cụ coacute thể kết hợp hỗ trợ nhau để cung cấp thocircng tin cho người sử dụng trecircn cơ sở tiacutech hợp từ nhiều nguồn dữ liệu nhiều mocirci trường khaacutec nhau
Kho dữ liệu thường rất lớn tới hagraveng trăm GB hay thậm chiacute hagraveng Terabyte
2 Kho dữ liệu vận hagravenh (ODS) Một kho dữ liệu vận hagravenh Aacutep dụng kỹ thuật kho dữ liệu vagraveo caacutec hệ xử
lyacute giao taacutec lưu trữ dữ liệu cho một ứng dụng đặc thugrave Noacute đưa vagraveo kho dữ liệu một dograveng caacutec dữ liệu thocirc được thiết kế
3 So saacutenh
Kho dữ liệu vận hagravenh Kho dữ liệu
Dữ liệu theo chủ đề Dữ liệu theo chủ đề
Dữ liệu tiacutech hợp Dữ liệu tiacutech hợp
Dữ liệu thay đổi Dữ liệu khocircng thay đổi
Dữ liệu được cập nhật khi thay đổi
Dữ liệu giữ nguyecircn
Chỉ coacute dữ liệu hiện tạiDữliệu hiện tại vagrave dữ liệu lịch sử
Chu kỳ lagravem tươi dữ liệu ngắn Chu kỳ lagravem tươi dữ liệu dagravei
Chỉ coacute dữ liệu chi tiết Dữ liệu chi tiết vagrave dữ liệu tổng kết
Dugraveng cho caacutec quyết định ngắn hạn
Dugraveng cho hoạch định dagravei hạn
4 Kho dữ liệu cục bộ (Data Mart - DM)
Kho dữ liệu cục bộ lagrave CSDL coacute những đặc điểm giống với kho dữ liệu nhưng với quy mocirc nhỏ hơn vagrave lưu trữ dữ liệu về một lĩnh vực một chuyecircn ngagravenh
Data mart phụ thuộc Chứa những dữ liệu được lấy từ DW vagrave những dữ liệu nagravey sẽ được triacutech lọc vagrave tinh chế tiacutech hợp lại ở mức cao hơn để phục vụ một chủ đề nhất định của Datamart
Data mart độc lập Khocircng giống như Datamart phụ thuộc Data mart độc lập được xacircy dựng trước DW vagrave dữ liệu được trực tiếp lấy từ caacutec nguồn khaacutec nhau
5 Siecircu dữ liệu Metadata lagrave dữ liệu để mocirc tả dữ liệu Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột
một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi Metadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu
6 Mocirci trường kho dữ liệu Hệ thống của tổ chức vagrave kho cung cấp dữ liệu để xacircy dựng kho dữ liệu Trong quaacute trigravenh chuyển dữ liệu từ caacutec nguồn khaacutec nhau dữ liệu coacute thể
được lagravem sạch hoặc chuyển đổi vagrave vigrave thế DW được xem như lagrave một chuẩn cho việc lưu trữ
Đồng thời siecircu dữ liệu được ghi lại Cuối cugraveng DW hoặc siecircu thị coacute thể được sử dụng để tạo ra một kho dữ
liệu ldquocaacute nhacircnrdquo 7 Caacutec đặc điểm của kho dữ liệu
Đặc điểm Mocirc tả
Hướng chủ đề - DL tổ chức theo caacutech thức người dugraveng tham chiếu
Tiacutech hợp - Dữ liệu ldquosạchrdquo loại bỏ tiacutenh thiếu nhất quaacuten
Khocircng thay đổi - DL ldquochỉ đọcrdquo người dugraveng khocircng thay đổi được
Chuỗi thời gian - DL lagrave chuỗi thời gian khocircng phải lagrave trạng thaacutei hiện tại
Được tổng kết - DL vận hagravenhthao taacutec khi cần thiết
được kết hợp lại thagravenh dạng coacute thể dugraveng được cho quyết định
Kiacutech cỡ lớn hơn - Lưu giữ theo chuỗi thời gian tức lagrave giữ lại nhiều DL
Khocircng được chuẩn hoacutea - Coacute thể dư thừa DLSiecircu dữ liệu - Dữ liệu của dữ liệu được lưu trữNguồn dữ liệu - DL vận hagravenh (caacutec hệ sẵn coacute) cugraveng
với caacutec nguồn ngoagravei 8 Kho dữ liệu hướng chủ đề
Hướng chủ để coacute nghĩa lagrave kho dữ liệu được tổ chức xung quanh caacutec chủ đề chiacutenh như khaacutech hagraveng sản phẩm sản xuất Tập trung vagraveo việc mocirc higravenh hoacutea vagrave phacircn tiacutech dữ liệu cho caacutec nhagrave ra quyết định magrave khocircng tập trung vagraveo caacutec xử lyacute thocircng thường Cung cấp cho người dugraveng một khung nhigraven toagraven vẹn đơn giản vagrave đầy đủ về caacutec sự kiện quanh caacutec chủ đề
9 Dữ liệu trong DW được tiacutech hợp Dữ liệu trong kho dữ liệu được xacircy dựng bằng caacutech tổng hợp dữ liệu từ
nhiều nguồn khaacutec nhau vagrave caacutec nguồn coacute tổ chức khaacutec nhau Cơ sở dữ liệu caacutec file excel caacutec flat file hoặc caacutec raw file Khi đưa vagraveo kho dữ liệu caacutec dữ liệu được lagravem sạch vagrave tiacutech hợp dữ liệu nhằm đảm bảo tiacutenh nhất quaacuten của dữ liệu
10Kiến truacutec kho dữ liệu Tầng cơ sở dữ liệu hoạt động Tầng truy xuất thocircng tin Tầng truy xuất dữ liệu Tầng siecircu dữ liệu Tầng quản lyacute tiến trigravenh Tầng thocircng điệp của ứng dụng Tầng vật liacute của kho dữ liệu Tầng trigravenh diễn dữ liệu
11Higravenh trạng kho dữ liệu Kho dữ liệu ảo - người dugraveng cuối coacute thể truy cập trực tiếp đến kho dữ liệu
sử dụng caacutec cocircng cụ cho pheacutep ở tầng truy xuất dữ liệu Kho dữ liệu trung tacircm-1 cơ sở dữ liệu vật lyacute chứa tất cả dữ liệu cho một
vugraveng chuyecircn dụng nagraveo đoacute
Kho dữ liệu phacircn taacuten- Thagravenh phần được phacircn taacuten qua nhiều hệ cơ sở dữ liệu vật lyacute
12METADATA- Siecircu dữ liệu Định nghĩa Siecircu dữ liệu lagrave dữ liệu về dữ liệu Lagrave 1 lưu trữ dugraveng để
Miecircu tả kho dữ liệu tổng thể Nhận dạng kiểu kho dữ liệu Quản liacute quaacute trigravenh tiacutech hợp dữ liệu Quản liacute quaacute trigravenh cập nhật kho dữ liệu Quản liacute bảo mật
Lagrave chigravea khoacutea quyết định sự thagravenh cocircng của kho dữ liệu luocircn được thay đổi vagrave cập nhật theo sự phaacutet triển của kho dữ liệu
Dugraveng để quản liacute điều khiển kho dữ liệu Sự ra đời của kho dữ liệu như 1 cấu truacutec hỗ trợ ra quyết định siecircu dữ liệu
được xem như nguồn tagravei nguyecircn dữ liệu Siecircu dữ liệu lagrave trừu tượng Chuacuteng lagrave dữ liệu bậc cao cung cấp mocirc tả ngắn
gọn caacutec dữ liệu bậc thấp hơn 13Hoạt động của Siecircu dữ liệu
Siecircu dữ liệu rất cần thiết trong việc chuyển hoacutea thocircng tin trở thagravenh tri thức Lagrave chigravea khoacutea giuacutep chuacuteng ta xử lyacute được dữ liệu thocirc Viacute dụ một dograveng dữ liệu baacuten hagraveng 1023 K596 11121 agraveNoacute sẽ khocircng coacute nghĩa gigrave cho đến khi chuacuteng ta đưa vagraveo siecircu dữ liệu (thư
mục chứa dữ liệu) agrave cửa hagraveng 1023 sản phẩm K596 vagrave số tiền baacuten được lagrave 11121 đocirc la
14Sự cần thiết phải nhất quaacuten trong kho dữ liệu Kho dữ liệu được xacircy dựng cho lợi iacutech của những nhagrave phacircn tiacutech kinh
doanh caacutec nhagrave quản trị cho tất cả caacutec khu vực chức năng Trong cơ sở dữ liệu riecircng caacutec khu vực khaacutec nhau coacute thể định nghĩa vagrave lưu
trữ dữ liệu thocircng qua phiecircn bản của chiacutenh noacute Khi dữ liệu được lấy từ những vugraveng khaacutec nhau đoacute vagrave được đặt vagraveo kho dữ
liệu Việc chuyển đổi vagrave lagravem sạch caacutec tiến trigravenh sẽ đảm bảo noacute lagrave duy nhất được tiacutech hợp tại một mức của tổ chức
15Ragrave soaacutet lại dữ liệu ndash Thực thi siecircu dữ liệu
Bất kể cấu truacutec tự nhiecircn của 1 cacircu truy vấn thế nagraveo thigrave caacutec thagravenh phần của siecircu dữ liệu rất quan trọng đối với người ra quyết định
Bảng thuộc tiacutenh khoacutea được lưu trữ bởi kho dữ liệu Tập hợp dữ liệu được lấy từ đacircu Những chuyển đổi nagraveo được thực thi với việc lagravem sạch
16Siecircu dữ liệu lagrave gigrave Metadata - lagrave thocircng tin mocirc tả nội dung của cơ sở dữ liệu (CSDL) Metadata baacuteo cho người dugraveng biết thời gian cập nhật sau cugraveng của dữ liệu
định dạng vagrave mục điacutech sử dụng của noacute Những thocircng tin nagravey coacute thể hướng dẫn người dugraveng duyệt qua CSDL vagrave
giuacutep họ hiểu được yacute nghĩa vagrave ngữ cảnh của dữ liệu Trong CSDL metadata lagrave caacutec dạng biểu diễn khaacutec nhau của caacutec đối tượng
trong CSDL Trong CSDL quan hệ metadata lagrave caacutec định nghĩa của bảng cột CSDL
view vagrave nhiều đối tượng khaacutec Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột
một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi -gtMetadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu
Bảng chuyển đổi Ghi lại những chuyển đổi đatilde được thực hiện
Lịch sử thực thi Ghi lại những dữ liệu đatilde được
phacircn tiacutech
Higravenh thaacutei kết nốiGhi lại những dữ liệu được kết nối vagrave tần suất
17Aacutenh xạ thocircng thường của siecircu dữ liệu Bản ghi aacutenh xạ chuyển đổi bao gồm
Định danh của nguồn gốc Chuyển đổi thuộc tiacutenh Chuyển đổi thuộc tiacutenh vật lyacute Matilde hoacutea tham chiếu bảng chuyển đổi Đổi tecircn Đổi khoacutea Gaacuten giaacute trị cho thuộc tiacutenh mặc định Chọn logic cho caacutec nguồn nhiều giaacute trị Đổi thuật toaacuten
18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để
phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai
lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave
tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec
Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm
Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo
19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua
caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau
SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được
Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra
một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức
Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ
Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ
Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech
CHƯƠNG 11 KHAI PHAacute DỮ LIỆU
1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn
ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993
Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng
2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd
1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều
2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP
3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn
4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng
5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server
6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo
7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động
8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời
9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều
10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện
11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech
12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP
3 Xử lyacute phacircn tiacutech trực tuyến OLAP
MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave
dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu
ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave
thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu
HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave
ROLAP4 Khai phaacute dữ liệu
Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh
khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn
Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan
5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp
6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại
Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp
Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec
Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt
Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra
Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh
vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho
Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec
Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm
Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục
Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng
gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp
Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn
Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec
Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper
Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2
Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25
Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước
Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng
Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện
trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp
Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute
độ hỗ trợ ge ngưỡng minsup
độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan
Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn
Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết
Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu
MOLAP ROLAP HOLAP
Lưu trữ dữ liệu cơ sở
Khối Bảng quan hệ Bảng quan hệ
Lưu trữ thocircng tin tổng hợp
Khối Bảng quan hệ Khối
Hiệu suất thực hiện truy vấn
Nhanh nhất Chậm nhất Nhanh
Tiecircu thụ khocircng gian lưu trữ
Nhiều Thấp Trung bigravenh
Chi phiacute bảo trigrave Cao Thấp Trung bigravenh
Coacute thể tận dụng được kinh nghiệm từ những chuyecircn gia hagraveng đầu trong mọi lĩnh vực
Logic mờ được xacircy dựng dựa trecircn ngocircn ngữ tự nhiecircnNền tảng của logic mờ lagrave dựa trecircn cơ sở giao tiếp của con người
5 Nhược điểm của logic mờ Trong 1 hệ thống phức tạpsử dụng logic mờ coacute thể trở thagravenh trở ngại cho
việc xaacutec thực độ tin cậy của hệ thống Cơ chế lập luận mờ khocircng thể học hỏi từ những lỗi sai
6 Mạng noron nhacircn tạo(ANN) Mạng noron nhacircn tạo lagrave một mocirc phỏng xử lyacute thocircng tinđược nghiecircn cứu ra
từ hệ thống thần kinh của sinh vậtgiống như bộ natildeo để xử lyacute thocircng tin ANNs lagrave chương trigravenh dựa trecircn maacutey tiacutenh đơn giản coacute chức năng lagrave một mocirc
higravenh bagravei toaacuten khocircng gian dựa trecircn thử nghiệm vagrave baacuteo lỗi
7 Học từ kinh nghiệm Tiến trigravenh Một mẫu dữ liệu được biểu diễn như một mạng lưới noronANN ldquodự
đoaacutenrdquo 1 đầu radự đoaacuten được so saacutenh với giaacute trị thực tế hoặc giaacute trị chiacutenh xaacutecNếu đoaacuten được chiacutenh xaacutec thigrave khocircng coacute hagravenh động nagraveo được thực hiện
Nếu dự đoaacuten sai ANN kiểm tra lại vagrave xaacutec định lại thocircng số để điều chỉnh Một mẫu dữ liệu khaacutec được biểu diễn vagrave quaacute trigravenh nagravey được lặp lại
8 Nguyecircn tắc cơ bản của cocircng nghệ nơron Caacutec yếu tố xử lyacute cơ bản trong hệ thống thần kinh của con người lagrave tế bagraveo
thần kinhMạng lưới của tế bagraveo nagravey lagrave liecircn kết với nhau nhận được thocircng tin từ caacutec cảm biến trong mắt taihellip
Thocircng tin nhận được bởi tế bagraveo thần kinh hoặc lagrave sẽ kiacutech thiacutech noacute(sẽ được chuyển qua 1 thocircng điệp dọc theo mạng lưới) hoặc lagrave sẽ ngăn cản noacute(ngăn cản dograveng thocircng tin)
Độ nhạy coacute thể thay đổi qua thời gian hoặc sau khi coacute được kinh nghiệm
9 Cấu truacutec mạng Một ANN gồm 3 lớp cơ bản
Lớp đầu vagraveo nhận dữ liệu Lớp becircn trong hoặc lagrave lớp ẩn xử lyacute dữ liệu Lớp đầu ra chuyển tiếp kết quả cuối cugraveng của mạng
10Mạng nơ ron Thường coacute nhiều đầu vagraveo mỗi đầu vagraveo với mức ảnh hưởng vagrave tầm quan
trọng riecircng của noacute Một đầu vagraveo quan trọng coacute thể được sử dụng để khuếch đại đầu ra caacutec hagravem trạng thaacutei tổng hợp caacutec trọng số của caacutec yếu tố
đầuvagraveo khaacutec nhauvagraveo một giaacute trị duy nhất Caacutec hagravem chuyển giao xử lyacute caacutec giaacute trị trạng thaacutei vagrave tạo đầu ra
11Huấn luyện mạng nơ ron Trong mocirc higravenh coacute giaacutem saacutetANN được đến so saacutenh dự đoaacuten của chiacutenh
noacute với thocircng tin phản hồi coacute chứa caacutec kết quả mong muốn ANN sẽ phải tigravem caacutech thay đổi caacutec tham số becircn trong củamigravenh (caacutec trọng số vagrave caacutec ngưỡng) để tạo necircn một aacutenh xạ coacute khả năng aacutenh xạcaacutec đầu vagraveo thagravenh caacutec đầu ra mong muốn Sự thay đổi nagravey được tiến hagravenh nhờ việc so saacutenh giữa đầu ra thực sự vagrave đầu ra mong muốn
Trong mocirc higravenh khocircng coacute giaacutem saacutetANN nhận được dữ liệu vagraveo nhưng khocircng phải coacute bất kỳ thocircng tin phản hồi về kết quả mong muốn
Phần lớn caacutec ứng dụng nằm trong vugraveng của caacutec bagravei toaacuten ước lượng như mocirc higravenh hoacuteathống kecirc neacuten lọc phacircn cụm
12Lợi iacutech Liecircn kết với mạng noron Traacutenh caacutech lập trigravenh tường minh Giảm nhu cầu của chuyecircn gia ANNs thigrave thiacutech nghi với caacutec yếu tố đầu vagraveo thay đổi Khocircng cần thiết cho cơ sở tri thức tinh chế ANNs coacute tiacutenh động vagrave cải thiện với việc sử dụng Coacute khả năng xử lyacute dữ liệu khocircng chiacutenh xaacutec hoặc khocircng đầy đủ Cho pheacutep tổng quaacutet hoacutea từ thocircng tin cụ thể Cho pheacutep thu thập cảm giaacutec thocircng thường vagraveo miền giải quyết vấn đề
13Hạn chế của việc liecircn kết với mạng noron ANNs khocircng thể giải thiacutech được suy luận Bản chất hộp đen thường khiến cho vấn đề traacutech nhiệm vagrave độ tin cậy phaacutet
sinh lagrave khoacute khăn Lặp đi lặp lại quaacute trigravenh huấn luyện rất tốn thời gian Nguồn lực caacutec nhagrave phacircn tiacutech vagrave thiết kế coacute tay nghề cao vẫn lagrave đaacuteng lo
ngại Cocircng nghệ ANN thuacutec đẩy hạn chế của phần cứng hiện tại ANN yecircu cầu phải coacute sự tin tưởng ở đầu ra
14Giới thiệu về thuật toaacuten di truyền Cũng như mạng lưới thần kinh caacutec thuật toaacuten di truyền được dựa trecircn lyacute
thuyết sinh học Thuật toaacuten di truyền tigravem thấy nguồn gốc của chuacuteng trong caacutec lyacute thuyết
tiến hoacutea của chọn lọc tự nhiecircn vagrave thiacutech ứng với biến đổi khiacute hậu Kết quả thuật toaacuten di truyền lagrave từ giao phối 2 caacute thể trong quần thế để tạo
ra con caacutei đocirci khi tốt hơn so với bậc cha mẹ của chuacuteng 15Caacutec thagravenh phần cơ bản của thuật toaacuten di truyền
Toaacuten tử chọn lọc Caacutec caacute thể tốt được chọn lọc để đưa vagraveo thế hệ sau Sự chọn lọc nagravey căn cứ vagraveo độ thiacutech nghi với mocirci trường của mỗi caacute thể
Toaacuten tử lai gheacutep (crossover) Hai caacute thể cha vagrave mẹ trao đổi caacutec gen với nhau để tạo ra caacute thể con
Toaacuten tử đột biến (mutation) Một caacute thể thay đổi một số gen để biến đổi thagravenh một caacute thể mớiTất cả caacutec toaacuten tử trecircn khi thực hiện đều mang tiacutenh ngẫu nhiecircn
16Quaacute trigravenh cơ bản của một thuật toaacuten di truyền Khởi tạo
Đaacutenh giaacute quần thể
Lựa chọn NST thiacutech hợp nhất vagrave loại bỏ NST yếu nhất
Quy trigravenh giao nhau vagrave cải thiện quần thể
đột biến tiến trigravenh để khaacutem phaacute ra NST mới
17Ưu nhược điểm của việc kết hợp với thuật toaacuten di truyền Kiacutech thước quần thể lagrave 1 yếu tố quan trọng trong tốc độ của việc tigravem
kiếmnhưng noacute tương đối dễ dagraveng để dự đoaacuten tốc độ nagravey Giao nhau hoặc đột biến lagrave khocircng necircn đc sử dụng quaacute thường xuyecircn Luocircn coacute được iacutet nhất 1 giải phaacutep hợp lyacute Necircn coacute thể aacutep dụng chuacuteng cho caacutec vấn đề magrave chuacuteng ta khocircng coacute hướng
về caacutech giải quyết Sức mạnh của thuật toaacuten xuất phaacutet từ khaacutei niệm đơn giảnkhocircng phải từ
một thủ tục thuật toaacuten phức tạp 18Tương lai của học maacutey
Mạng lưới thần kinh nhacircn tạo vượt quaacute năng lực của con người trong caacutec trường hợp bị cocirc lập
Về mặt lyacute thuyếtmột maacutey tiacutenh coacute thể xử lyacute dũ liệu nhanh hơn hagraveng triệu lần so với 1 con người
May mắn thay cho chuacuteng tacon người tốt hơn nhiều khi magrave coacute được dữ liệumaacutey tiacutenh khocircng coacute 1 số thứ như lagrave 5 giaacutec quan
CHƯƠNG 10 KHO DỮ LIỆU
1 Kho dữ liệu Kho dữ liệu lagrave tuyển tập caacutec cơ sở dữ liệu tiacutech hợp hướng chủ đề được
thiết kế để trợ giuacutep cho một hệ hỗ trợ quyết định
Theo John Ladley Cocircng nghệ kho dữ liệu lagrave tập caacutec phương phaacutep kỹ thuật vagrave caacutec cocircng cụ coacute thể kết hợp hỗ trợ nhau để cung cấp thocircng tin cho người sử dụng trecircn cơ sở tiacutech hợp từ nhiều nguồn dữ liệu nhiều mocirci trường khaacutec nhau
Kho dữ liệu thường rất lớn tới hagraveng trăm GB hay thậm chiacute hagraveng Terabyte
2 Kho dữ liệu vận hagravenh (ODS) Một kho dữ liệu vận hagravenh Aacutep dụng kỹ thuật kho dữ liệu vagraveo caacutec hệ xử
lyacute giao taacutec lưu trữ dữ liệu cho một ứng dụng đặc thugrave Noacute đưa vagraveo kho dữ liệu một dograveng caacutec dữ liệu thocirc được thiết kế
3 So saacutenh
Kho dữ liệu vận hagravenh Kho dữ liệu
Dữ liệu theo chủ đề Dữ liệu theo chủ đề
Dữ liệu tiacutech hợp Dữ liệu tiacutech hợp
Dữ liệu thay đổi Dữ liệu khocircng thay đổi
Dữ liệu được cập nhật khi thay đổi
Dữ liệu giữ nguyecircn
Chỉ coacute dữ liệu hiện tạiDữliệu hiện tại vagrave dữ liệu lịch sử
Chu kỳ lagravem tươi dữ liệu ngắn Chu kỳ lagravem tươi dữ liệu dagravei
Chỉ coacute dữ liệu chi tiết Dữ liệu chi tiết vagrave dữ liệu tổng kết
Dugraveng cho caacutec quyết định ngắn hạn
Dugraveng cho hoạch định dagravei hạn
4 Kho dữ liệu cục bộ (Data Mart - DM)
Kho dữ liệu cục bộ lagrave CSDL coacute những đặc điểm giống với kho dữ liệu nhưng với quy mocirc nhỏ hơn vagrave lưu trữ dữ liệu về một lĩnh vực một chuyecircn ngagravenh
Data mart phụ thuộc Chứa những dữ liệu được lấy từ DW vagrave những dữ liệu nagravey sẽ được triacutech lọc vagrave tinh chế tiacutech hợp lại ở mức cao hơn để phục vụ một chủ đề nhất định của Datamart
Data mart độc lập Khocircng giống như Datamart phụ thuộc Data mart độc lập được xacircy dựng trước DW vagrave dữ liệu được trực tiếp lấy từ caacutec nguồn khaacutec nhau
5 Siecircu dữ liệu Metadata lagrave dữ liệu để mocirc tả dữ liệu Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột
một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi Metadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu
6 Mocirci trường kho dữ liệu Hệ thống của tổ chức vagrave kho cung cấp dữ liệu để xacircy dựng kho dữ liệu Trong quaacute trigravenh chuyển dữ liệu từ caacutec nguồn khaacutec nhau dữ liệu coacute thể
được lagravem sạch hoặc chuyển đổi vagrave vigrave thế DW được xem như lagrave một chuẩn cho việc lưu trữ
Đồng thời siecircu dữ liệu được ghi lại Cuối cugraveng DW hoặc siecircu thị coacute thể được sử dụng để tạo ra một kho dữ
liệu ldquocaacute nhacircnrdquo 7 Caacutec đặc điểm của kho dữ liệu
Đặc điểm Mocirc tả
Hướng chủ đề - DL tổ chức theo caacutech thức người dugraveng tham chiếu
Tiacutech hợp - Dữ liệu ldquosạchrdquo loại bỏ tiacutenh thiếu nhất quaacuten
Khocircng thay đổi - DL ldquochỉ đọcrdquo người dugraveng khocircng thay đổi được
Chuỗi thời gian - DL lagrave chuỗi thời gian khocircng phải lagrave trạng thaacutei hiện tại
Được tổng kết - DL vận hagravenhthao taacutec khi cần thiết
được kết hợp lại thagravenh dạng coacute thể dugraveng được cho quyết định
Kiacutech cỡ lớn hơn - Lưu giữ theo chuỗi thời gian tức lagrave giữ lại nhiều DL
Khocircng được chuẩn hoacutea - Coacute thể dư thừa DLSiecircu dữ liệu - Dữ liệu của dữ liệu được lưu trữNguồn dữ liệu - DL vận hagravenh (caacutec hệ sẵn coacute) cugraveng
với caacutec nguồn ngoagravei 8 Kho dữ liệu hướng chủ đề
Hướng chủ để coacute nghĩa lagrave kho dữ liệu được tổ chức xung quanh caacutec chủ đề chiacutenh như khaacutech hagraveng sản phẩm sản xuất Tập trung vagraveo việc mocirc higravenh hoacutea vagrave phacircn tiacutech dữ liệu cho caacutec nhagrave ra quyết định magrave khocircng tập trung vagraveo caacutec xử lyacute thocircng thường Cung cấp cho người dugraveng một khung nhigraven toagraven vẹn đơn giản vagrave đầy đủ về caacutec sự kiện quanh caacutec chủ đề
9 Dữ liệu trong DW được tiacutech hợp Dữ liệu trong kho dữ liệu được xacircy dựng bằng caacutech tổng hợp dữ liệu từ
nhiều nguồn khaacutec nhau vagrave caacutec nguồn coacute tổ chức khaacutec nhau Cơ sở dữ liệu caacutec file excel caacutec flat file hoặc caacutec raw file Khi đưa vagraveo kho dữ liệu caacutec dữ liệu được lagravem sạch vagrave tiacutech hợp dữ liệu nhằm đảm bảo tiacutenh nhất quaacuten của dữ liệu
10Kiến truacutec kho dữ liệu Tầng cơ sở dữ liệu hoạt động Tầng truy xuất thocircng tin Tầng truy xuất dữ liệu Tầng siecircu dữ liệu Tầng quản lyacute tiến trigravenh Tầng thocircng điệp của ứng dụng Tầng vật liacute của kho dữ liệu Tầng trigravenh diễn dữ liệu
11Higravenh trạng kho dữ liệu Kho dữ liệu ảo - người dugraveng cuối coacute thể truy cập trực tiếp đến kho dữ liệu
sử dụng caacutec cocircng cụ cho pheacutep ở tầng truy xuất dữ liệu Kho dữ liệu trung tacircm-1 cơ sở dữ liệu vật lyacute chứa tất cả dữ liệu cho một
vugraveng chuyecircn dụng nagraveo đoacute
Kho dữ liệu phacircn taacuten- Thagravenh phần được phacircn taacuten qua nhiều hệ cơ sở dữ liệu vật lyacute
12METADATA- Siecircu dữ liệu Định nghĩa Siecircu dữ liệu lagrave dữ liệu về dữ liệu Lagrave 1 lưu trữ dugraveng để
Miecircu tả kho dữ liệu tổng thể Nhận dạng kiểu kho dữ liệu Quản liacute quaacute trigravenh tiacutech hợp dữ liệu Quản liacute quaacute trigravenh cập nhật kho dữ liệu Quản liacute bảo mật
Lagrave chigravea khoacutea quyết định sự thagravenh cocircng của kho dữ liệu luocircn được thay đổi vagrave cập nhật theo sự phaacutet triển của kho dữ liệu
Dugraveng để quản liacute điều khiển kho dữ liệu Sự ra đời của kho dữ liệu như 1 cấu truacutec hỗ trợ ra quyết định siecircu dữ liệu
được xem như nguồn tagravei nguyecircn dữ liệu Siecircu dữ liệu lagrave trừu tượng Chuacuteng lagrave dữ liệu bậc cao cung cấp mocirc tả ngắn
gọn caacutec dữ liệu bậc thấp hơn 13Hoạt động của Siecircu dữ liệu
Siecircu dữ liệu rất cần thiết trong việc chuyển hoacutea thocircng tin trở thagravenh tri thức Lagrave chigravea khoacutea giuacutep chuacuteng ta xử lyacute được dữ liệu thocirc Viacute dụ một dograveng dữ liệu baacuten hagraveng 1023 K596 11121 agraveNoacute sẽ khocircng coacute nghĩa gigrave cho đến khi chuacuteng ta đưa vagraveo siecircu dữ liệu (thư
mục chứa dữ liệu) agrave cửa hagraveng 1023 sản phẩm K596 vagrave số tiền baacuten được lagrave 11121 đocirc la
14Sự cần thiết phải nhất quaacuten trong kho dữ liệu Kho dữ liệu được xacircy dựng cho lợi iacutech của những nhagrave phacircn tiacutech kinh
doanh caacutec nhagrave quản trị cho tất cả caacutec khu vực chức năng Trong cơ sở dữ liệu riecircng caacutec khu vực khaacutec nhau coacute thể định nghĩa vagrave lưu
trữ dữ liệu thocircng qua phiecircn bản của chiacutenh noacute Khi dữ liệu được lấy từ những vugraveng khaacutec nhau đoacute vagrave được đặt vagraveo kho dữ
liệu Việc chuyển đổi vagrave lagravem sạch caacutec tiến trigravenh sẽ đảm bảo noacute lagrave duy nhất được tiacutech hợp tại một mức của tổ chức
15Ragrave soaacutet lại dữ liệu ndash Thực thi siecircu dữ liệu
Bất kể cấu truacutec tự nhiecircn của 1 cacircu truy vấn thế nagraveo thigrave caacutec thagravenh phần của siecircu dữ liệu rất quan trọng đối với người ra quyết định
Bảng thuộc tiacutenh khoacutea được lưu trữ bởi kho dữ liệu Tập hợp dữ liệu được lấy từ đacircu Những chuyển đổi nagraveo được thực thi với việc lagravem sạch
16Siecircu dữ liệu lagrave gigrave Metadata - lagrave thocircng tin mocirc tả nội dung của cơ sở dữ liệu (CSDL) Metadata baacuteo cho người dugraveng biết thời gian cập nhật sau cugraveng của dữ liệu
định dạng vagrave mục điacutech sử dụng của noacute Những thocircng tin nagravey coacute thể hướng dẫn người dugraveng duyệt qua CSDL vagrave
giuacutep họ hiểu được yacute nghĩa vagrave ngữ cảnh của dữ liệu Trong CSDL metadata lagrave caacutec dạng biểu diễn khaacutec nhau của caacutec đối tượng
trong CSDL Trong CSDL quan hệ metadata lagrave caacutec định nghĩa của bảng cột CSDL
view vagrave nhiều đối tượng khaacutec Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột
một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi -gtMetadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu
Bảng chuyển đổi Ghi lại những chuyển đổi đatilde được thực hiện
Lịch sử thực thi Ghi lại những dữ liệu đatilde được
phacircn tiacutech
Higravenh thaacutei kết nốiGhi lại những dữ liệu được kết nối vagrave tần suất
17Aacutenh xạ thocircng thường của siecircu dữ liệu Bản ghi aacutenh xạ chuyển đổi bao gồm
Định danh của nguồn gốc Chuyển đổi thuộc tiacutenh Chuyển đổi thuộc tiacutenh vật lyacute Matilde hoacutea tham chiếu bảng chuyển đổi Đổi tecircn Đổi khoacutea Gaacuten giaacute trị cho thuộc tiacutenh mặc định Chọn logic cho caacutec nguồn nhiều giaacute trị Đổi thuật toaacuten
18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để
phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai
lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave
tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec
Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm
Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo
19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua
caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau
SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được
Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra
một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức
Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ
Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ
Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech
CHƯƠNG 11 KHAI PHAacute DỮ LIỆU
1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn
ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993
Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng
2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd
1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều
2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP
3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn
4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng
5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server
6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo
7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động
8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời
9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều
10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện
11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech
12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP
3 Xử lyacute phacircn tiacutech trực tuyến OLAP
MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave
dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu
ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave
thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu
HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave
ROLAP4 Khai phaacute dữ liệu
Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh
khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn
Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan
5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp
6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại
Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp
Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec
Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt
Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra
Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh
vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho
Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec
Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm
Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục
Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng
gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp
Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn
Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec
Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper
Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2
Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25
Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước
Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng
Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện
trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp
Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute
độ hỗ trợ ge ngưỡng minsup
độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan
Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn
Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết
Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu
MOLAP ROLAP HOLAP
Lưu trữ dữ liệu cơ sở
Khối Bảng quan hệ Bảng quan hệ
Lưu trữ thocircng tin tổng hợp
Khối Bảng quan hệ Khối
Hiệu suất thực hiện truy vấn
Nhanh nhất Chậm nhất Nhanh
Tiecircu thụ khocircng gian lưu trữ
Nhiều Thấp Trung bigravenh
Chi phiacute bảo trigrave Cao Thấp Trung bigravenh
Lớp đầu vagraveo nhận dữ liệu Lớp becircn trong hoặc lagrave lớp ẩn xử lyacute dữ liệu Lớp đầu ra chuyển tiếp kết quả cuối cugraveng của mạng
10Mạng nơ ron Thường coacute nhiều đầu vagraveo mỗi đầu vagraveo với mức ảnh hưởng vagrave tầm quan
trọng riecircng của noacute Một đầu vagraveo quan trọng coacute thể được sử dụng để khuếch đại đầu ra caacutec hagravem trạng thaacutei tổng hợp caacutec trọng số của caacutec yếu tố
đầuvagraveo khaacutec nhauvagraveo một giaacute trị duy nhất Caacutec hagravem chuyển giao xử lyacute caacutec giaacute trị trạng thaacutei vagrave tạo đầu ra
11Huấn luyện mạng nơ ron Trong mocirc higravenh coacute giaacutem saacutetANN được đến so saacutenh dự đoaacuten của chiacutenh
noacute với thocircng tin phản hồi coacute chứa caacutec kết quả mong muốn ANN sẽ phải tigravem caacutech thay đổi caacutec tham số becircn trong củamigravenh (caacutec trọng số vagrave caacutec ngưỡng) để tạo necircn một aacutenh xạ coacute khả năng aacutenh xạcaacutec đầu vagraveo thagravenh caacutec đầu ra mong muốn Sự thay đổi nagravey được tiến hagravenh nhờ việc so saacutenh giữa đầu ra thực sự vagrave đầu ra mong muốn
Trong mocirc higravenh khocircng coacute giaacutem saacutetANN nhận được dữ liệu vagraveo nhưng khocircng phải coacute bất kỳ thocircng tin phản hồi về kết quả mong muốn
Phần lớn caacutec ứng dụng nằm trong vugraveng của caacutec bagravei toaacuten ước lượng như mocirc higravenh hoacuteathống kecirc neacuten lọc phacircn cụm
12Lợi iacutech Liecircn kết với mạng noron Traacutenh caacutech lập trigravenh tường minh Giảm nhu cầu của chuyecircn gia ANNs thigrave thiacutech nghi với caacutec yếu tố đầu vagraveo thay đổi Khocircng cần thiết cho cơ sở tri thức tinh chế ANNs coacute tiacutenh động vagrave cải thiện với việc sử dụng Coacute khả năng xử lyacute dữ liệu khocircng chiacutenh xaacutec hoặc khocircng đầy đủ Cho pheacutep tổng quaacutet hoacutea từ thocircng tin cụ thể Cho pheacutep thu thập cảm giaacutec thocircng thường vagraveo miền giải quyết vấn đề
13Hạn chế của việc liecircn kết với mạng noron ANNs khocircng thể giải thiacutech được suy luận Bản chất hộp đen thường khiến cho vấn đề traacutech nhiệm vagrave độ tin cậy phaacutet
sinh lagrave khoacute khăn Lặp đi lặp lại quaacute trigravenh huấn luyện rất tốn thời gian Nguồn lực caacutec nhagrave phacircn tiacutech vagrave thiết kế coacute tay nghề cao vẫn lagrave đaacuteng lo
ngại Cocircng nghệ ANN thuacutec đẩy hạn chế của phần cứng hiện tại ANN yecircu cầu phải coacute sự tin tưởng ở đầu ra
14Giới thiệu về thuật toaacuten di truyền Cũng như mạng lưới thần kinh caacutec thuật toaacuten di truyền được dựa trecircn lyacute
thuyết sinh học Thuật toaacuten di truyền tigravem thấy nguồn gốc của chuacuteng trong caacutec lyacute thuyết
tiến hoacutea của chọn lọc tự nhiecircn vagrave thiacutech ứng với biến đổi khiacute hậu Kết quả thuật toaacuten di truyền lagrave từ giao phối 2 caacute thể trong quần thế để tạo
ra con caacutei đocirci khi tốt hơn so với bậc cha mẹ của chuacuteng 15Caacutec thagravenh phần cơ bản của thuật toaacuten di truyền
Toaacuten tử chọn lọc Caacutec caacute thể tốt được chọn lọc để đưa vagraveo thế hệ sau Sự chọn lọc nagravey căn cứ vagraveo độ thiacutech nghi với mocirci trường của mỗi caacute thể
Toaacuten tử lai gheacutep (crossover) Hai caacute thể cha vagrave mẹ trao đổi caacutec gen với nhau để tạo ra caacute thể con
Toaacuten tử đột biến (mutation) Một caacute thể thay đổi một số gen để biến đổi thagravenh một caacute thể mớiTất cả caacutec toaacuten tử trecircn khi thực hiện đều mang tiacutenh ngẫu nhiecircn
16Quaacute trigravenh cơ bản của một thuật toaacuten di truyền Khởi tạo
Đaacutenh giaacute quần thể
Lựa chọn NST thiacutech hợp nhất vagrave loại bỏ NST yếu nhất
Quy trigravenh giao nhau vagrave cải thiện quần thể
đột biến tiến trigravenh để khaacutem phaacute ra NST mới
17Ưu nhược điểm của việc kết hợp với thuật toaacuten di truyền Kiacutech thước quần thể lagrave 1 yếu tố quan trọng trong tốc độ của việc tigravem
kiếmnhưng noacute tương đối dễ dagraveng để dự đoaacuten tốc độ nagravey Giao nhau hoặc đột biến lagrave khocircng necircn đc sử dụng quaacute thường xuyecircn Luocircn coacute được iacutet nhất 1 giải phaacutep hợp lyacute Necircn coacute thể aacutep dụng chuacuteng cho caacutec vấn đề magrave chuacuteng ta khocircng coacute hướng
về caacutech giải quyết Sức mạnh của thuật toaacuten xuất phaacutet từ khaacutei niệm đơn giảnkhocircng phải từ
một thủ tục thuật toaacuten phức tạp 18Tương lai của học maacutey
Mạng lưới thần kinh nhacircn tạo vượt quaacute năng lực của con người trong caacutec trường hợp bị cocirc lập
Về mặt lyacute thuyếtmột maacutey tiacutenh coacute thể xử lyacute dũ liệu nhanh hơn hagraveng triệu lần so với 1 con người
May mắn thay cho chuacuteng tacon người tốt hơn nhiều khi magrave coacute được dữ liệumaacutey tiacutenh khocircng coacute 1 số thứ như lagrave 5 giaacutec quan
CHƯƠNG 10 KHO DỮ LIỆU
1 Kho dữ liệu Kho dữ liệu lagrave tuyển tập caacutec cơ sở dữ liệu tiacutech hợp hướng chủ đề được
thiết kế để trợ giuacutep cho một hệ hỗ trợ quyết định
Theo John Ladley Cocircng nghệ kho dữ liệu lagrave tập caacutec phương phaacutep kỹ thuật vagrave caacutec cocircng cụ coacute thể kết hợp hỗ trợ nhau để cung cấp thocircng tin cho người sử dụng trecircn cơ sở tiacutech hợp từ nhiều nguồn dữ liệu nhiều mocirci trường khaacutec nhau
Kho dữ liệu thường rất lớn tới hagraveng trăm GB hay thậm chiacute hagraveng Terabyte
2 Kho dữ liệu vận hagravenh (ODS) Một kho dữ liệu vận hagravenh Aacutep dụng kỹ thuật kho dữ liệu vagraveo caacutec hệ xử
lyacute giao taacutec lưu trữ dữ liệu cho một ứng dụng đặc thugrave Noacute đưa vagraveo kho dữ liệu một dograveng caacutec dữ liệu thocirc được thiết kế
3 So saacutenh
Kho dữ liệu vận hagravenh Kho dữ liệu
Dữ liệu theo chủ đề Dữ liệu theo chủ đề
Dữ liệu tiacutech hợp Dữ liệu tiacutech hợp
Dữ liệu thay đổi Dữ liệu khocircng thay đổi
Dữ liệu được cập nhật khi thay đổi
Dữ liệu giữ nguyecircn
Chỉ coacute dữ liệu hiện tạiDữliệu hiện tại vagrave dữ liệu lịch sử
Chu kỳ lagravem tươi dữ liệu ngắn Chu kỳ lagravem tươi dữ liệu dagravei
Chỉ coacute dữ liệu chi tiết Dữ liệu chi tiết vagrave dữ liệu tổng kết
Dugraveng cho caacutec quyết định ngắn hạn
Dugraveng cho hoạch định dagravei hạn
4 Kho dữ liệu cục bộ (Data Mart - DM)
Kho dữ liệu cục bộ lagrave CSDL coacute những đặc điểm giống với kho dữ liệu nhưng với quy mocirc nhỏ hơn vagrave lưu trữ dữ liệu về một lĩnh vực một chuyecircn ngagravenh
Data mart phụ thuộc Chứa những dữ liệu được lấy từ DW vagrave những dữ liệu nagravey sẽ được triacutech lọc vagrave tinh chế tiacutech hợp lại ở mức cao hơn để phục vụ một chủ đề nhất định của Datamart
Data mart độc lập Khocircng giống như Datamart phụ thuộc Data mart độc lập được xacircy dựng trước DW vagrave dữ liệu được trực tiếp lấy từ caacutec nguồn khaacutec nhau
5 Siecircu dữ liệu Metadata lagrave dữ liệu để mocirc tả dữ liệu Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột
một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi Metadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu
6 Mocirci trường kho dữ liệu Hệ thống của tổ chức vagrave kho cung cấp dữ liệu để xacircy dựng kho dữ liệu Trong quaacute trigravenh chuyển dữ liệu từ caacutec nguồn khaacutec nhau dữ liệu coacute thể
được lagravem sạch hoặc chuyển đổi vagrave vigrave thế DW được xem như lagrave một chuẩn cho việc lưu trữ
Đồng thời siecircu dữ liệu được ghi lại Cuối cugraveng DW hoặc siecircu thị coacute thể được sử dụng để tạo ra một kho dữ
liệu ldquocaacute nhacircnrdquo 7 Caacutec đặc điểm của kho dữ liệu
Đặc điểm Mocirc tả
Hướng chủ đề - DL tổ chức theo caacutech thức người dugraveng tham chiếu
Tiacutech hợp - Dữ liệu ldquosạchrdquo loại bỏ tiacutenh thiếu nhất quaacuten
Khocircng thay đổi - DL ldquochỉ đọcrdquo người dugraveng khocircng thay đổi được
Chuỗi thời gian - DL lagrave chuỗi thời gian khocircng phải lagrave trạng thaacutei hiện tại
Được tổng kết - DL vận hagravenhthao taacutec khi cần thiết
được kết hợp lại thagravenh dạng coacute thể dugraveng được cho quyết định
Kiacutech cỡ lớn hơn - Lưu giữ theo chuỗi thời gian tức lagrave giữ lại nhiều DL
Khocircng được chuẩn hoacutea - Coacute thể dư thừa DLSiecircu dữ liệu - Dữ liệu của dữ liệu được lưu trữNguồn dữ liệu - DL vận hagravenh (caacutec hệ sẵn coacute) cugraveng
với caacutec nguồn ngoagravei 8 Kho dữ liệu hướng chủ đề
Hướng chủ để coacute nghĩa lagrave kho dữ liệu được tổ chức xung quanh caacutec chủ đề chiacutenh như khaacutech hagraveng sản phẩm sản xuất Tập trung vagraveo việc mocirc higravenh hoacutea vagrave phacircn tiacutech dữ liệu cho caacutec nhagrave ra quyết định magrave khocircng tập trung vagraveo caacutec xử lyacute thocircng thường Cung cấp cho người dugraveng một khung nhigraven toagraven vẹn đơn giản vagrave đầy đủ về caacutec sự kiện quanh caacutec chủ đề
9 Dữ liệu trong DW được tiacutech hợp Dữ liệu trong kho dữ liệu được xacircy dựng bằng caacutech tổng hợp dữ liệu từ
nhiều nguồn khaacutec nhau vagrave caacutec nguồn coacute tổ chức khaacutec nhau Cơ sở dữ liệu caacutec file excel caacutec flat file hoặc caacutec raw file Khi đưa vagraveo kho dữ liệu caacutec dữ liệu được lagravem sạch vagrave tiacutech hợp dữ liệu nhằm đảm bảo tiacutenh nhất quaacuten của dữ liệu
10Kiến truacutec kho dữ liệu Tầng cơ sở dữ liệu hoạt động Tầng truy xuất thocircng tin Tầng truy xuất dữ liệu Tầng siecircu dữ liệu Tầng quản lyacute tiến trigravenh Tầng thocircng điệp của ứng dụng Tầng vật liacute của kho dữ liệu Tầng trigravenh diễn dữ liệu
11Higravenh trạng kho dữ liệu Kho dữ liệu ảo - người dugraveng cuối coacute thể truy cập trực tiếp đến kho dữ liệu
sử dụng caacutec cocircng cụ cho pheacutep ở tầng truy xuất dữ liệu Kho dữ liệu trung tacircm-1 cơ sở dữ liệu vật lyacute chứa tất cả dữ liệu cho một
vugraveng chuyecircn dụng nagraveo đoacute
Kho dữ liệu phacircn taacuten- Thagravenh phần được phacircn taacuten qua nhiều hệ cơ sở dữ liệu vật lyacute
12METADATA- Siecircu dữ liệu Định nghĩa Siecircu dữ liệu lagrave dữ liệu về dữ liệu Lagrave 1 lưu trữ dugraveng để
Miecircu tả kho dữ liệu tổng thể Nhận dạng kiểu kho dữ liệu Quản liacute quaacute trigravenh tiacutech hợp dữ liệu Quản liacute quaacute trigravenh cập nhật kho dữ liệu Quản liacute bảo mật
Lagrave chigravea khoacutea quyết định sự thagravenh cocircng của kho dữ liệu luocircn được thay đổi vagrave cập nhật theo sự phaacutet triển của kho dữ liệu
Dugraveng để quản liacute điều khiển kho dữ liệu Sự ra đời của kho dữ liệu như 1 cấu truacutec hỗ trợ ra quyết định siecircu dữ liệu
được xem như nguồn tagravei nguyecircn dữ liệu Siecircu dữ liệu lagrave trừu tượng Chuacuteng lagrave dữ liệu bậc cao cung cấp mocirc tả ngắn
gọn caacutec dữ liệu bậc thấp hơn 13Hoạt động của Siecircu dữ liệu
Siecircu dữ liệu rất cần thiết trong việc chuyển hoacutea thocircng tin trở thagravenh tri thức Lagrave chigravea khoacutea giuacutep chuacuteng ta xử lyacute được dữ liệu thocirc Viacute dụ một dograveng dữ liệu baacuten hagraveng 1023 K596 11121 agraveNoacute sẽ khocircng coacute nghĩa gigrave cho đến khi chuacuteng ta đưa vagraveo siecircu dữ liệu (thư
mục chứa dữ liệu) agrave cửa hagraveng 1023 sản phẩm K596 vagrave số tiền baacuten được lagrave 11121 đocirc la
14Sự cần thiết phải nhất quaacuten trong kho dữ liệu Kho dữ liệu được xacircy dựng cho lợi iacutech của những nhagrave phacircn tiacutech kinh
doanh caacutec nhagrave quản trị cho tất cả caacutec khu vực chức năng Trong cơ sở dữ liệu riecircng caacutec khu vực khaacutec nhau coacute thể định nghĩa vagrave lưu
trữ dữ liệu thocircng qua phiecircn bản của chiacutenh noacute Khi dữ liệu được lấy từ những vugraveng khaacutec nhau đoacute vagrave được đặt vagraveo kho dữ
liệu Việc chuyển đổi vagrave lagravem sạch caacutec tiến trigravenh sẽ đảm bảo noacute lagrave duy nhất được tiacutech hợp tại một mức của tổ chức
15Ragrave soaacutet lại dữ liệu ndash Thực thi siecircu dữ liệu
Bất kể cấu truacutec tự nhiecircn của 1 cacircu truy vấn thế nagraveo thigrave caacutec thagravenh phần của siecircu dữ liệu rất quan trọng đối với người ra quyết định
Bảng thuộc tiacutenh khoacutea được lưu trữ bởi kho dữ liệu Tập hợp dữ liệu được lấy từ đacircu Những chuyển đổi nagraveo được thực thi với việc lagravem sạch
16Siecircu dữ liệu lagrave gigrave Metadata - lagrave thocircng tin mocirc tả nội dung của cơ sở dữ liệu (CSDL) Metadata baacuteo cho người dugraveng biết thời gian cập nhật sau cugraveng của dữ liệu
định dạng vagrave mục điacutech sử dụng của noacute Những thocircng tin nagravey coacute thể hướng dẫn người dugraveng duyệt qua CSDL vagrave
giuacutep họ hiểu được yacute nghĩa vagrave ngữ cảnh của dữ liệu Trong CSDL metadata lagrave caacutec dạng biểu diễn khaacutec nhau của caacutec đối tượng
trong CSDL Trong CSDL quan hệ metadata lagrave caacutec định nghĩa của bảng cột CSDL
view vagrave nhiều đối tượng khaacutec Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột
một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi -gtMetadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu
Bảng chuyển đổi Ghi lại những chuyển đổi đatilde được thực hiện
Lịch sử thực thi Ghi lại những dữ liệu đatilde được
phacircn tiacutech
Higravenh thaacutei kết nốiGhi lại những dữ liệu được kết nối vagrave tần suất
17Aacutenh xạ thocircng thường của siecircu dữ liệu Bản ghi aacutenh xạ chuyển đổi bao gồm
Định danh của nguồn gốc Chuyển đổi thuộc tiacutenh Chuyển đổi thuộc tiacutenh vật lyacute Matilde hoacutea tham chiếu bảng chuyển đổi Đổi tecircn Đổi khoacutea Gaacuten giaacute trị cho thuộc tiacutenh mặc định Chọn logic cho caacutec nguồn nhiều giaacute trị Đổi thuật toaacuten
18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để
phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai
lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave
tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec
Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm
Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo
19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua
caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau
SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được
Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra
một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức
Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ
Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ
Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech
CHƯƠNG 11 KHAI PHAacute DỮ LIỆU
1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn
ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993
Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng
2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd
1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều
2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP
3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn
4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng
5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server
6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo
7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động
8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời
9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều
10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện
11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech
12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP
3 Xử lyacute phacircn tiacutech trực tuyến OLAP
MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave
dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu
ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave
thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu
HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave
ROLAP4 Khai phaacute dữ liệu
Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh
khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn
Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan
5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp
6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại
Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp
Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec
Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt
Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra
Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh
vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho
Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec
Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm
Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục
Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng
gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp
Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn
Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec
Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper
Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2
Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25
Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước
Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng
Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện
trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp
Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute
độ hỗ trợ ge ngưỡng minsup
độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan
Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn
Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết
Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu
MOLAP ROLAP HOLAP
Lưu trữ dữ liệu cơ sở
Khối Bảng quan hệ Bảng quan hệ
Lưu trữ thocircng tin tổng hợp
Khối Bảng quan hệ Khối
Hiệu suất thực hiện truy vấn
Nhanh nhất Chậm nhất Nhanh
Tiecircu thụ khocircng gian lưu trữ
Nhiều Thấp Trung bigravenh
Chi phiacute bảo trigrave Cao Thấp Trung bigravenh
Phần lớn caacutec ứng dụng nằm trong vugraveng của caacutec bagravei toaacuten ước lượng như mocirc higravenh hoacuteathống kecirc neacuten lọc phacircn cụm
12Lợi iacutech Liecircn kết với mạng noron Traacutenh caacutech lập trigravenh tường minh Giảm nhu cầu của chuyecircn gia ANNs thigrave thiacutech nghi với caacutec yếu tố đầu vagraveo thay đổi Khocircng cần thiết cho cơ sở tri thức tinh chế ANNs coacute tiacutenh động vagrave cải thiện với việc sử dụng Coacute khả năng xử lyacute dữ liệu khocircng chiacutenh xaacutec hoặc khocircng đầy đủ Cho pheacutep tổng quaacutet hoacutea từ thocircng tin cụ thể Cho pheacutep thu thập cảm giaacutec thocircng thường vagraveo miền giải quyết vấn đề
13Hạn chế của việc liecircn kết với mạng noron ANNs khocircng thể giải thiacutech được suy luận Bản chất hộp đen thường khiến cho vấn đề traacutech nhiệm vagrave độ tin cậy phaacutet
sinh lagrave khoacute khăn Lặp đi lặp lại quaacute trigravenh huấn luyện rất tốn thời gian Nguồn lực caacutec nhagrave phacircn tiacutech vagrave thiết kế coacute tay nghề cao vẫn lagrave đaacuteng lo
ngại Cocircng nghệ ANN thuacutec đẩy hạn chế của phần cứng hiện tại ANN yecircu cầu phải coacute sự tin tưởng ở đầu ra
14Giới thiệu về thuật toaacuten di truyền Cũng như mạng lưới thần kinh caacutec thuật toaacuten di truyền được dựa trecircn lyacute
thuyết sinh học Thuật toaacuten di truyền tigravem thấy nguồn gốc của chuacuteng trong caacutec lyacute thuyết
tiến hoacutea của chọn lọc tự nhiecircn vagrave thiacutech ứng với biến đổi khiacute hậu Kết quả thuật toaacuten di truyền lagrave từ giao phối 2 caacute thể trong quần thế để tạo
ra con caacutei đocirci khi tốt hơn so với bậc cha mẹ của chuacuteng 15Caacutec thagravenh phần cơ bản của thuật toaacuten di truyền
Toaacuten tử chọn lọc Caacutec caacute thể tốt được chọn lọc để đưa vagraveo thế hệ sau Sự chọn lọc nagravey căn cứ vagraveo độ thiacutech nghi với mocirci trường của mỗi caacute thể
Toaacuten tử lai gheacutep (crossover) Hai caacute thể cha vagrave mẹ trao đổi caacutec gen với nhau để tạo ra caacute thể con
Toaacuten tử đột biến (mutation) Một caacute thể thay đổi một số gen để biến đổi thagravenh một caacute thể mớiTất cả caacutec toaacuten tử trecircn khi thực hiện đều mang tiacutenh ngẫu nhiecircn
16Quaacute trigravenh cơ bản của một thuật toaacuten di truyền Khởi tạo
Đaacutenh giaacute quần thể
Lựa chọn NST thiacutech hợp nhất vagrave loại bỏ NST yếu nhất
Quy trigravenh giao nhau vagrave cải thiện quần thể
đột biến tiến trigravenh để khaacutem phaacute ra NST mới
17Ưu nhược điểm của việc kết hợp với thuật toaacuten di truyền Kiacutech thước quần thể lagrave 1 yếu tố quan trọng trong tốc độ của việc tigravem
kiếmnhưng noacute tương đối dễ dagraveng để dự đoaacuten tốc độ nagravey Giao nhau hoặc đột biến lagrave khocircng necircn đc sử dụng quaacute thường xuyecircn Luocircn coacute được iacutet nhất 1 giải phaacutep hợp lyacute Necircn coacute thể aacutep dụng chuacuteng cho caacutec vấn đề magrave chuacuteng ta khocircng coacute hướng
về caacutech giải quyết Sức mạnh của thuật toaacuten xuất phaacutet từ khaacutei niệm đơn giảnkhocircng phải từ
một thủ tục thuật toaacuten phức tạp 18Tương lai của học maacutey
Mạng lưới thần kinh nhacircn tạo vượt quaacute năng lực của con người trong caacutec trường hợp bị cocirc lập
Về mặt lyacute thuyếtmột maacutey tiacutenh coacute thể xử lyacute dũ liệu nhanh hơn hagraveng triệu lần so với 1 con người
May mắn thay cho chuacuteng tacon người tốt hơn nhiều khi magrave coacute được dữ liệumaacutey tiacutenh khocircng coacute 1 số thứ như lagrave 5 giaacutec quan
CHƯƠNG 10 KHO DỮ LIỆU
1 Kho dữ liệu Kho dữ liệu lagrave tuyển tập caacutec cơ sở dữ liệu tiacutech hợp hướng chủ đề được
thiết kế để trợ giuacutep cho một hệ hỗ trợ quyết định
Theo John Ladley Cocircng nghệ kho dữ liệu lagrave tập caacutec phương phaacutep kỹ thuật vagrave caacutec cocircng cụ coacute thể kết hợp hỗ trợ nhau để cung cấp thocircng tin cho người sử dụng trecircn cơ sở tiacutech hợp từ nhiều nguồn dữ liệu nhiều mocirci trường khaacutec nhau
Kho dữ liệu thường rất lớn tới hagraveng trăm GB hay thậm chiacute hagraveng Terabyte
2 Kho dữ liệu vận hagravenh (ODS) Một kho dữ liệu vận hagravenh Aacutep dụng kỹ thuật kho dữ liệu vagraveo caacutec hệ xử
lyacute giao taacutec lưu trữ dữ liệu cho một ứng dụng đặc thugrave Noacute đưa vagraveo kho dữ liệu một dograveng caacutec dữ liệu thocirc được thiết kế
3 So saacutenh
Kho dữ liệu vận hagravenh Kho dữ liệu
Dữ liệu theo chủ đề Dữ liệu theo chủ đề
Dữ liệu tiacutech hợp Dữ liệu tiacutech hợp
Dữ liệu thay đổi Dữ liệu khocircng thay đổi
Dữ liệu được cập nhật khi thay đổi
Dữ liệu giữ nguyecircn
Chỉ coacute dữ liệu hiện tạiDữliệu hiện tại vagrave dữ liệu lịch sử
Chu kỳ lagravem tươi dữ liệu ngắn Chu kỳ lagravem tươi dữ liệu dagravei
Chỉ coacute dữ liệu chi tiết Dữ liệu chi tiết vagrave dữ liệu tổng kết
Dugraveng cho caacutec quyết định ngắn hạn
Dugraveng cho hoạch định dagravei hạn
4 Kho dữ liệu cục bộ (Data Mart - DM)
Kho dữ liệu cục bộ lagrave CSDL coacute những đặc điểm giống với kho dữ liệu nhưng với quy mocirc nhỏ hơn vagrave lưu trữ dữ liệu về một lĩnh vực một chuyecircn ngagravenh
Data mart phụ thuộc Chứa những dữ liệu được lấy từ DW vagrave những dữ liệu nagravey sẽ được triacutech lọc vagrave tinh chế tiacutech hợp lại ở mức cao hơn để phục vụ một chủ đề nhất định của Datamart
Data mart độc lập Khocircng giống như Datamart phụ thuộc Data mart độc lập được xacircy dựng trước DW vagrave dữ liệu được trực tiếp lấy từ caacutec nguồn khaacutec nhau
5 Siecircu dữ liệu Metadata lagrave dữ liệu để mocirc tả dữ liệu Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột
một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi Metadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu
6 Mocirci trường kho dữ liệu Hệ thống của tổ chức vagrave kho cung cấp dữ liệu để xacircy dựng kho dữ liệu Trong quaacute trigravenh chuyển dữ liệu từ caacutec nguồn khaacutec nhau dữ liệu coacute thể
được lagravem sạch hoặc chuyển đổi vagrave vigrave thế DW được xem như lagrave một chuẩn cho việc lưu trữ
Đồng thời siecircu dữ liệu được ghi lại Cuối cugraveng DW hoặc siecircu thị coacute thể được sử dụng để tạo ra một kho dữ
liệu ldquocaacute nhacircnrdquo 7 Caacutec đặc điểm của kho dữ liệu
Đặc điểm Mocirc tả
Hướng chủ đề - DL tổ chức theo caacutech thức người dugraveng tham chiếu
Tiacutech hợp - Dữ liệu ldquosạchrdquo loại bỏ tiacutenh thiếu nhất quaacuten
Khocircng thay đổi - DL ldquochỉ đọcrdquo người dugraveng khocircng thay đổi được
Chuỗi thời gian - DL lagrave chuỗi thời gian khocircng phải lagrave trạng thaacutei hiện tại
Được tổng kết - DL vận hagravenhthao taacutec khi cần thiết
được kết hợp lại thagravenh dạng coacute thể dugraveng được cho quyết định
Kiacutech cỡ lớn hơn - Lưu giữ theo chuỗi thời gian tức lagrave giữ lại nhiều DL
Khocircng được chuẩn hoacutea - Coacute thể dư thừa DLSiecircu dữ liệu - Dữ liệu của dữ liệu được lưu trữNguồn dữ liệu - DL vận hagravenh (caacutec hệ sẵn coacute) cugraveng
với caacutec nguồn ngoagravei 8 Kho dữ liệu hướng chủ đề
Hướng chủ để coacute nghĩa lagrave kho dữ liệu được tổ chức xung quanh caacutec chủ đề chiacutenh như khaacutech hagraveng sản phẩm sản xuất Tập trung vagraveo việc mocirc higravenh hoacutea vagrave phacircn tiacutech dữ liệu cho caacutec nhagrave ra quyết định magrave khocircng tập trung vagraveo caacutec xử lyacute thocircng thường Cung cấp cho người dugraveng một khung nhigraven toagraven vẹn đơn giản vagrave đầy đủ về caacutec sự kiện quanh caacutec chủ đề
9 Dữ liệu trong DW được tiacutech hợp Dữ liệu trong kho dữ liệu được xacircy dựng bằng caacutech tổng hợp dữ liệu từ
nhiều nguồn khaacutec nhau vagrave caacutec nguồn coacute tổ chức khaacutec nhau Cơ sở dữ liệu caacutec file excel caacutec flat file hoặc caacutec raw file Khi đưa vagraveo kho dữ liệu caacutec dữ liệu được lagravem sạch vagrave tiacutech hợp dữ liệu nhằm đảm bảo tiacutenh nhất quaacuten của dữ liệu
10Kiến truacutec kho dữ liệu Tầng cơ sở dữ liệu hoạt động Tầng truy xuất thocircng tin Tầng truy xuất dữ liệu Tầng siecircu dữ liệu Tầng quản lyacute tiến trigravenh Tầng thocircng điệp của ứng dụng Tầng vật liacute của kho dữ liệu Tầng trigravenh diễn dữ liệu
11Higravenh trạng kho dữ liệu Kho dữ liệu ảo - người dugraveng cuối coacute thể truy cập trực tiếp đến kho dữ liệu
sử dụng caacutec cocircng cụ cho pheacutep ở tầng truy xuất dữ liệu Kho dữ liệu trung tacircm-1 cơ sở dữ liệu vật lyacute chứa tất cả dữ liệu cho một
vugraveng chuyecircn dụng nagraveo đoacute
Kho dữ liệu phacircn taacuten- Thagravenh phần được phacircn taacuten qua nhiều hệ cơ sở dữ liệu vật lyacute
12METADATA- Siecircu dữ liệu Định nghĩa Siecircu dữ liệu lagrave dữ liệu về dữ liệu Lagrave 1 lưu trữ dugraveng để
Miecircu tả kho dữ liệu tổng thể Nhận dạng kiểu kho dữ liệu Quản liacute quaacute trigravenh tiacutech hợp dữ liệu Quản liacute quaacute trigravenh cập nhật kho dữ liệu Quản liacute bảo mật
Lagrave chigravea khoacutea quyết định sự thagravenh cocircng của kho dữ liệu luocircn được thay đổi vagrave cập nhật theo sự phaacutet triển của kho dữ liệu
Dugraveng để quản liacute điều khiển kho dữ liệu Sự ra đời của kho dữ liệu như 1 cấu truacutec hỗ trợ ra quyết định siecircu dữ liệu
được xem như nguồn tagravei nguyecircn dữ liệu Siecircu dữ liệu lagrave trừu tượng Chuacuteng lagrave dữ liệu bậc cao cung cấp mocirc tả ngắn
gọn caacutec dữ liệu bậc thấp hơn 13Hoạt động của Siecircu dữ liệu
Siecircu dữ liệu rất cần thiết trong việc chuyển hoacutea thocircng tin trở thagravenh tri thức Lagrave chigravea khoacutea giuacutep chuacuteng ta xử lyacute được dữ liệu thocirc Viacute dụ một dograveng dữ liệu baacuten hagraveng 1023 K596 11121 agraveNoacute sẽ khocircng coacute nghĩa gigrave cho đến khi chuacuteng ta đưa vagraveo siecircu dữ liệu (thư
mục chứa dữ liệu) agrave cửa hagraveng 1023 sản phẩm K596 vagrave số tiền baacuten được lagrave 11121 đocirc la
14Sự cần thiết phải nhất quaacuten trong kho dữ liệu Kho dữ liệu được xacircy dựng cho lợi iacutech của những nhagrave phacircn tiacutech kinh
doanh caacutec nhagrave quản trị cho tất cả caacutec khu vực chức năng Trong cơ sở dữ liệu riecircng caacutec khu vực khaacutec nhau coacute thể định nghĩa vagrave lưu
trữ dữ liệu thocircng qua phiecircn bản của chiacutenh noacute Khi dữ liệu được lấy từ những vugraveng khaacutec nhau đoacute vagrave được đặt vagraveo kho dữ
liệu Việc chuyển đổi vagrave lagravem sạch caacutec tiến trigravenh sẽ đảm bảo noacute lagrave duy nhất được tiacutech hợp tại một mức của tổ chức
15Ragrave soaacutet lại dữ liệu ndash Thực thi siecircu dữ liệu
Bất kể cấu truacutec tự nhiecircn của 1 cacircu truy vấn thế nagraveo thigrave caacutec thagravenh phần của siecircu dữ liệu rất quan trọng đối với người ra quyết định
Bảng thuộc tiacutenh khoacutea được lưu trữ bởi kho dữ liệu Tập hợp dữ liệu được lấy từ đacircu Những chuyển đổi nagraveo được thực thi với việc lagravem sạch
16Siecircu dữ liệu lagrave gigrave Metadata - lagrave thocircng tin mocirc tả nội dung của cơ sở dữ liệu (CSDL) Metadata baacuteo cho người dugraveng biết thời gian cập nhật sau cugraveng của dữ liệu
định dạng vagrave mục điacutech sử dụng của noacute Những thocircng tin nagravey coacute thể hướng dẫn người dugraveng duyệt qua CSDL vagrave
giuacutep họ hiểu được yacute nghĩa vagrave ngữ cảnh của dữ liệu Trong CSDL metadata lagrave caacutec dạng biểu diễn khaacutec nhau của caacutec đối tượng
trong CSDL Trong CSDL quan hệ metadata lagrave caacutec định nghĩa của bảng cột CSDL
view vagrave nhiều đối tượng khaacutec Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột
một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi -gtMetadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu
Bảng chuyển đổi Ghi lại những chuyển đổi đatilde được thực hiện
Lịch sử thực thi Ghi lại những dữ liệu đatilde được
phacircn tiacutech
Higravenh thaacutei kết nốiGhi lại những dữ liệu được kết nối vagrave tần suất
17Aacutenh xạ thocircng thường của siecircu dữ liệu Bản ghi aacutenh xạ chuyển đổi bao gồm
Định danh của nguồn gốc Chuyển đổi thuộc tiacutenh Chuyển đổi thuộc tiacutenh vật lyacute Matilde hoacutea tham chiếu bảng chuyển đổi Đổi tecircn Đổi khoacutea Gaacuten giaacute trị cho thuộc tiacutenh mặc định Chọn logic cho caacutec nguồn nhiều giaacute trị Đổi thuật toaacuten
18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để
phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai
lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave
tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec
Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm
Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo
19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua
caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau
SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được
Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra
một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức
Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ
Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ
Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech
CHƯƠNG 11 KHAI PHAacute DỮ LIỆU
1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn
ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993
Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng
2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd
1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều
2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP
3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn
4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng
5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server
6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo
7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động
8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời
9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều
10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện
11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech
12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP
3 Xử lyacute phacircn tiacutech trực tuyến OLAP
MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave
dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu
ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave
thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu
HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave
ROLAP4 Khai phaacute dữ liệu
Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh
khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn
Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan
5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp
6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại
Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp
Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec
Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt
Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra
Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh
vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho
Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec
Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm
Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục
Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng
gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp
Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn
Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec
Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper
Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2
Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25
Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước
Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng
Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện
trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp
Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute
độ hỗ trợ ge ngưỡng minsup
độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan
Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn
Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết
Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu
MOLAP ROLAP HOLAP
Lưu trữ dữ liệu cơ sở
Khối Bảng quan hệ Bảng quan hệ
Lưu trữ thocircng tin tổng hợp
Khối Bảng quan hệ Khối
Hiệu suất thực hiện truy vấn
Nhanh nhất Chậm nhất Nhanh
Tiecircu thụ khocircng gian lưu trữ
Nhiều Thấp Trung bigravenh
Chi phiacute bảo trigrave Cao Thấp Trung bigravenh
Toaacuten tử đột biến (mutation) Một caacute thể thay đổi một số gen để biến đổi thagravenh một caacute thể mớiTất cả caacutec toaacuten tử trecircn khi thực hiện đều mang tiacutenh ngẫu nhiecircn
16Quaacute trigravenh cơ bản của một thuật toaacuten di truyền Khởi tạo
Đaacutenh giaacute quần thể
Lựa chọn NST thiacutech hợp nhất vagrave loại bỏ NST yếu nhất
Quy trigravenh giao nhau vagrave cải thiện quần thể
đột biến tiến trigravenh để khaacutem phaacute ra NST mới
17Ưu nhược điểm của việc kết hợp với thuật toaacuten di truyền Kiacutech thước quần thể lagrave 1 yếu tố quan trọng trong tốc độ của việc tigravem
kiếmnhưng noacute tương đối dễ dagraveng để dự đoaacuten tốc độ nagravey Giao nhau hoặc đột biến lagrave khocircng necircn đc sử dụng quaacute thường xuyecircn Luocircn coacute được iacutet nhất 1 giải phaacutep hợp lyacute Necircn coacute thể aacutep dụng chuacuteng cho caacutec vấn đề magrave chuacuteng ta khocircng coacute hướng
về caacutech giải quyết Sức mạnh của thuật toaacuten xuất phaacutet từ khaacutei niệm đơn giảnkhocircng phải từ
một thủ tục thuật toaacuten phức tạp 18Tương lai của học maacutey
Mạng lưới thần kinh nhacircn tạo vượt quaacute năng lực của con người trong caacutec trường hợp bị cocirc lập
Về mặt lyacute thuyếtmột maacutey tiacutenh coacute thể xử lyacute dũ liệu nhanh hơn hagraveng triệu lần so với 1 con người
May mắn thay cho chuacuteng tacon người tốt hơn nhiều khi magrave coacute được dữ liệumaacutey tiacutenh khocircng coacute 1 số thứ như lagrave 5 giaacutec quan
CHƯƠNG 10 KHO DỮ LIỆU
1 Kho dữ liệu Kho dữ liệu lagrave tuyển tập caacutec cơ sở dữ liệu tiacutech hợp hướng chủ đề được
thiết kế để trợ giuacutep cho một hệ hỗ trợ quyết định
Theo John Ladley Cocircng nghệ kho dữ liệu lagrave tập caacutec phương phaacutep kỹ thuật vagrave caacutec cocircng cụ coacute thể kết hợp hỗ trợ nhau để cung cấp thocircng tin cho người sử dụng trecircn cơ sở tiacutech hợp từ nhiều nguồn dữ liệu nhiều mocirci trường khaacutec nhau
Kho dữ liệu thường rất lớn tới hagraveng trăm GB hay thậm chiacute hagraveng Terabyte
2 Kho dữ liệu vận hagravenh (ODS) Một kho dữ liệu vận hagravenh Aacutep dụng kỹ thuật kho dữ liệu vagraveo caacutec hệ xử
lyacute giao taacutec lưu trữ dữ liệu cho một ứng dụng đặc thugrave Noacute đưa vagraveo kho dữ liệu một dograveng caacutec dữ liệu thocirc được thiết kế
3 So saacutenh
Kho dữ liệu vận hagravenh Kho dữ liệu
Dữ liệu theo chủ đề Dữ liệu theo chủ đề
Dữ liệu tiacutech hợp Dữ liệu tiacutech hợp
Dữ liệu thay đổi Dữ liệu khocircng thay đổi
Dữ liệu được cập nhật khi thay đổi
Dữ liệu giữ nguyecircn
Chỉ coacute dữ liệu hiện tạiDữliệu hiện tại vagrave dữ liệu lịch sử
Chu kỳ lagravem tươi dữ liệu ngắn Chu kỳ lagravem tươi dữ liệu dagravei
Chỉ coacute dữ liệu chi tiết Dữ liệu chi tiết vagrave dữ liệu tổng kết
Dugraveng cho caacutec quyết định ngắn hạn
Dugraveng cho hoạch định dagravei hạn
4 Kho dữ liệu cục bộ (Data Mart - DM)
Kho dữ liệu cục bộ lagrave CSDL coacute những đặc điểm giống với kho dữ liệu nhưng với quy mocirc nhỏ hơn vagrave lưu trữ dữ liệu về một lĩnh vực một chuyecircn ngagravenh
Data mart phụ thuộc Chứa những dữ liệu được lấy từ DW vagrave những dữ liệu nagravey sẽ được triacutech lọc vagrave tinh chế tiacutech hợp lại ở mức cao hơn để phục vụ một chủ đề nhất định của Datamart
Data mart độc lập Khocircng giống như Datamart phụ thuộc Data mart độc lập được xacircy dựng trước DW vagrave dữ liệu được trực tiếp lấy từ caacutec nguồn khaacutec nhau
5 Siecircu dữ liệu Metadata lagrave dữ liệu để mocirc tả dữ liệu Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột
một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi Metadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu
6 Mocirci trường kho dữ liệu Hệ thống của tổ chức vagrave kho cung cấp dữ liệu để xacircy dựng kho dữ liệu Trong quaacute trigravenh chuyển dữ liệu từ caacutec nguồn khaacutec nhau dữ liệu coacute thể
được lagravem sạch hoặc chuyển đổi vagrave vigrave thế DW được xem như lagrave một chuẩn cho việc lưu trữ
Đồng thời siecircu dữ liệu được ghi lại Cuối cugraveng DW hoặc siecircu thị coacute thể được sử dụng để tạo ra một kho dữ
liệu ldquocaacute nhacircnrdquo 7 Caacutec đặc điểm của kho dữ liệu
Đặc điểm Mocirc tả
Hướng chủ đề - DL tổ chức theo caacutech thức người dugraveng tham chiếu
Tiacutech hợp - Dữ liệu ldquosạchrdquo loại bỏ tiacutenh thiếu nhất quaacuten
Khocircng thay đổi - DL ldquochỉ đọcrdquo người dugraveng khocircng thay đổi được
Chuỗi thời gian - DL lagrave chuỗi thời gian khocircng phải lagrave trạng thaacutei hiện tại
Được tổng kết - DL vận hagravenhthao taacutec khi cần thiết
được kết hợp lại thagravenh dạng coacute thể dugraveng được cho quyết định
Kiacutech cỡ lớn hơn - Lưu giữ theo chuỗi thời gian tức lagrave giữ lại nhiều DL
Khocircng được chuẩn hoacutea - Coacute thể dư thừa DLSiecircu dữ liệu - Dữ liệu của dữ liệu được lưu trữNguồn dữ liệu - DL vận hagravenh (caacutec hệ sẵn coacute) cugraveng
với caacutec nguồn ngoagravei 8 Kho dữ liệu hướng chủ đề
Hướng chủ để coacute nghĩa lagrave kho dữ liệu được tổ chức xung quanh caacutec chủ đề chiacutenh như khaacutech hagraveng sản phẩm sản xuất Tập trung vagraveo việc mocirc higravenh hoacutea vagrave phacircn tiacutech dữ liệu cho caacutec nhagrave ra quyết định magrave khocircng tập trung vagraveo caacutec xử lyacute thocircng thường Cung cấp cho người dugraveng một khung nhigraven toagraven vẹn đơn giản vagrave đầy đủ về caacutec sự kiện quanh caacutec chủ đề
9 Dữ liệu trong DW được tiacutech hợp Dữ liệu trong kho dữ liệu được xacircy dựng bằng caacutech tổng hợp dữ liệu từ
nhiều nguồn khaacutec nhau vagrave caacutec nguồn coacute tổ chức khaacutec nhau Cơ sở dữ liệu caacutec file excel caacutec flat file hoặc caacutec raw file Khi đưa vagraveo kho dữ liệu caacutec dữ liệu được lagravem sạch vagrave tiacutech hợp dữ liệu nhằm đảm bảo tiacutenh nhất quaacuten của dữ liệu
10Kiến truacutec kho dữ liệu Tầng cơ sở dữ liệu hoạt động Tầng truy xuất thocircng tin Tầng truy xuất dữ liệu Tầng siecircu dữ liệu Tầng quản lyacute tiến trigravenh Tầng thocircng điệp của ứng dụng Tầng vật liacute của kho dữ liệu Tầng trigravenh diễn dữ liệu
11Higravenh trạng kho dữ liệu Kho dữ liệu ảo - người dugraveng cuối coacute thể truy cập trực tiếp đến kho dữ liệu
sử dụng caacutec cocircng cụ cho pheacutep ở tầng truy xuất dữ liệu Kho dữ liệu trung tacircm-1 cơ sở dữ liệu vật lyacute chứa tất cả dữ liệu cho một
vugraveng chuyecircn dụng nagraveo đoacute
Kho dữ liệu phacircn taacuten- Thagravenh phần được phacircn taacuten qua nhiều hệ cơ sở dữ liệu vật lyacute
12METADATA- Siecircu dữ liệu Định nghĩa Siecircu dữ liệu lagrave dữ liệu về dữ liệu Lagrave 1 lưu trữ dugraveng để
Miecircu tả kho dữ liệu tổng thể Nhận dạng kiểu kho dữ liệu Quản liacute quaacute trigravenh tiacutech hợp dữ liệu Quản liacute quaacute trigravenh cập nhật kho dữ liệu Quản liacute bảo mật
Lagrave chigravea khoacutea quyết định sự thagravenh cocircng của kho dữ liệu luocircn được thay đổi vagrave cập nhật theo sự phaacutet triển của kho dữ liệu
Dugraveng để quản liacute điều khiển kho dữ liệu Sự ra đời của kho dữ liệu như 1 cấu truacutec hỗ trợ ra quyết định siecircu dữ liệu
được xem như nguồn tagravei nguyecircn dữ liệu Siecircu dữ liệu lagrave trừu tượng Chuacuteng lagrave dữ liệu bậc cao cung cấp mocirc tả ngắn
gọn caacutec dữ liệu bậc thấp hơn 13Hoạt động của Siecircu dữ liệu
Siecircu dữ liệu rất cần thiết trong việc chuyển hoacutea thocircng tin trở thagravenh tri thức Lagrave chigravea khoacutea giuacutep chuacuteng ta xử lyacute được dữ liệu thocirc Viacute dụ một dograveng dữ liệu baacuten hagraveng 1023 K596 11121 agraveNoacute sẽ khocircng coacute nghĩa gigrave cho đến khi chuacuteng ta đưa vagraveo siecircu dữ liệu (thư
mục chứa dữ liệu) agrave cửa hagraveng 1023 sản phẩm K596 vagrave số tiền baacuten được lagrave 11121 đocirc la
14Sự cần thiết phải nhất quaacuten trong kho dữ liệu Kho dữ liệu được xacircy dựng cho lợi iacutech của những nhagrave phacircn tiacutech kinh
doanh caacutec nhagrave quản trị cho tất cả caacutec khu vực chức năng Trong cơ sở dữ liệu riecircng caacutec khu vực khaacutec nhau coacute thể định nghĩa vagrave lưu
trữ dữ liệu thocircng qua phiecircn bản của chiacutenh noacute Khi dữ liệu được lấy từ những vugraveng khaacutec nhau đoacute vagrave được đặt vagraveo kho dữ
liệu Việc chuyển đổi vagrave lagravem sạch caacutec tiến trigravenh sẽ đảm bảo noacute lagrave duy nhất được tiacutech hợp tại một mức của tổ chức
15Ragrave soaacutet lại dữ liệu ndash Thực thi siecircu dữ liệu
Bất kể cấu truacutec tự nhiecircn của 1 cacircu truy vấn thế nagraveo thigrave caacutec thagravenh phần của siecircu dữ liệu rất quan trọng đối với người ra quyết định
Bảng thuộc tiacutenh khoacutea được lưu trữ bởi kho dữ liệu Tập hợp dữ liệu được lấy từ đacircu Những chuyển đổi nagraveo được thực thi với việc lagravem sạch
16Siecircu dữ liệu lagrave gigrave Metadata - lagrave thocircng tin mocirc tả nội dung của cơ sở dữ liệu (CSDL) Metadata baacuteo cho người dugraveng biết thời gian cập nhật sau cugraveng của dữ liệu
định dạng vagrave mục điacutech sử dụng của noacute Những thocircng tin nagravey coacute thể hướng dẫn người dugraveng duyệt qua CSDL vagrave
giuacutep họ hiểu được yacute nghĩa vagrave ngữ cảnh của dữ liệu Trong CSDL metadata lagrave caacutec dạng biểu diễn khaacutec nhau của caacutec đối tượng
trong CSDL Trong CSDL quan hệ metadata lagrave caacutec định nghĩa của bảng cột CSDL
view vagrave nhiều đối tượng khaacutec Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột
một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi -gtMetadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu
Bảng chuyển đổi Ghi lại những chuyển đổi đatilde được thực hiện
Lịch sử thực thi Ghi lại những dữ liệu đatilde được
phacircn tiacutech
Higravenh thaacutei kết nốiGhi lại những dữ liệu được kết nối vagrave tần suất
17Aacutenh xạ thocircng thường của siecircu dữ liệu Bản ghi aacutenh xạ chuyển đổi bao gồm
Định danh của nguồn gốc Chuyển đổi thuộc tiacutenh Chuyển đổi thuộc tiacutenh vật lyacute Matilde hoacutea tham chiếu bảng chuyển đổi Đổi tecircn Đổi khoacutea Gaacuten giaacute trị cho thuộc tiacutenh mặc định Chọn logic cho caacutec nguồn nhiều giaacute trị Đổi thuật toaacuten
18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để
phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai
lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave
tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec
Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm
Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo
19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua
caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau
SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được
Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra
một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức
Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ
Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ
Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech
CHƯƠNG 11 KHAI PHAacute DỮ LIỆU
1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn
ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993
Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng
2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd
1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều
2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP
3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn
4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng
5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server
6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo
7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động
8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời
9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều
10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện
11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech
12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP
3 Xử lyacute phacircn tiacutech trực tuyến OLAP
MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave
dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu
ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave
thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu
HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave
ROLAP4 Khai phaacute dữ liệu
Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh
khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn
Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan
5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp
6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại
Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp
Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec
Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt
Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra
Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh
vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho
Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec
Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm
Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục
Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng
gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp
Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn
Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec
Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper
Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2
Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25
Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước
Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng
Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện
trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp
Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute
độ hỗ trợ ge ngưỡng minsup
độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan
Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn
Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết
Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu
MOLAP ROLAP HOLAP
Lưu trữ dữ liệu cơ sở
Khối Bảng quan hệ Bảng quan hệ
Lưu trữ thocircng tin tổng hợp
Khối Bảng quan hệ Khối
Hiệu suất thực hiện truy vấn
Nhanh nhất Chậm nhất Nhanh
Tiecircu thụ khocircng gian lưu trữ
Nhiều Thấp Trung bigravenh
Chi phiacute bảo trigrave Cao Thấp Trung bigravenh
Theo John Ladley Cocircng nghệ kho dữ liệu lagrave tập caacutec phương phaacutep kỹ thuật vagrave caacutec cocircng cụ coacute thể kết hợp hỗ trợ nhau để cung cấp thocircng tin cho người sử dụng trecircn cơ sở tiacutech hợp từ nhiều nguồn dữ liệu nhiều mocirci trường khaacutec nhau
Kho dữ liệu thường rất lớn tới hagraveng trăm GB hay thậm chiacute hagraveng Terabyte
2 Kho dữ liệu vận hagravenh (ODS) Một kho dữ liệu vận hagravenh Aacutep dụng kỹ thuật kho dữ liệu vagraveo caacutec hệ xử
lyacute giao taacutec lưu trữ dữ liệu cho một ứng dụng đặc thugrave Noacute đưa vagraveo kho dữ liệu một dograveng caacutec dữ liệu thocirc được thiết kế
3 So saacutenh
Kho dữ liệu vận hagravenh Kho dữ liệu
Dữ liệu theo chủ đề Dữ liệu theo chủ đề
Dữ liệu tiacutech hợp Dữ liệu tiacutech hợp
Dữ liệu thay đổi Dữ liệu khocircng thay đổi
Dữ liệu được cập nhật khi thay đổi
Dữ liệu giữ nguyecircn
Chỉ coacute dữ liệu hiện tạiDữliệu hiện tại vagrave dữ liệu lịch sử
Chu kỳ lagravem tươi dữ liệu ngắn Chu kỳ lagravem tươi dữ liệu dagravei
Chỉ coacute dữ liệu chi tiết Dữ liệu chi tiết vagrave dữ liệu tổng kết
Dugraveng cho caacutec quyết định ngắn hạn
Dugraveng cho hoạch định dagravei hạn
4 Kho dữ liệu cục bộ (Data Mart - DM)
Kho dữ liệu cục bộ lagrave CSDL coacute những đặc điểm giống với kho dữ liệu nhưng với quy mocirc nhỏ hơn vagrave lưu trữ dữ liệu về một lĩnh vực một chuyecircn ngagravenh
Data mart phụ thuộc Chứa những dữ liệu được lấy từ DW vagrave những dữ liệu nagravey sẽ được triacutech lọc vagrave tinh chế tiacutech hợp lại ở mức cao hơn để phục vụ một chủ đề nhất định của Datamart
Data mart độc lập Khocircng giống như Datamart phụ thuộc Data mart độc lập được xacircy dựng trước DW vagrave dữ liệu được trực tiếp lấy từ caacutec nguồn khaacutec nhau
5 Siecircu dữ liệu Metadata lagrave dữ liệu để mocirc tả dữ liệu Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột
một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi Metadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu
6 Mocirci trường kho dữ liệu Hệ thống của tổ chức vagrave kho cung cấp dữ liệu để xacircy dựng kho dữ liệu Trong quaacute trigravenh chuyển dữ liệu từ caacutec nguồn khaacutec nhau dữ liệu coacute thể
được lagravem sạch hoặc chuyển đổi vagrave vigrave thế DW được xem như lagrave một chuẩn cho việc lưu trữ
Đồng thời siecircu dữ liệu được ghi lại Cuối cugraveng DW hoặc siecircu thị coacute thể được sử dụng để tạo ra một kho dữ
liệu ldquocaacute nhacircnrdquo 7 Caacutec đặc điểm của kho dữ liệu
Đặc điểm Mocirc tả
Hướng chủ đề - DL tổ chức theo caacutech thức người dugraveng tham chiếu
Tiacutech hợp - Dữ liệu ldquosạchrdquo loại bỏ tiacutenh thiếu nhất quaacuten
Khocircng thay đổi - DL ldquochỉ đọcrdquo người dugraveng khocircng thay đổi được
Chuỗi thời gian - DL lagrave chuỗi thời gian khocircng phải lagrave trạng thaacutei hiện tại
Được tổng kết - DL vận hagravenhthao taacutec khi cần thiết
được kết hợp lại thagravenh dạng coacute thể dugraveng được cho quyết định
Kiacutech cỡ lớn hơn - Lưu giữ theo chuỗi thời gian tức lagrave giữ lại nhiều DL
Khocircng được chuẩn hoacutea - Coacute thể dư thừa DLSiecircu dữ liệu - Dữ liệu của dữ liệu được lưu trữNguồn dữ liệu - DL vận hagravenh (caacutec hệ sẵn coacute) cugraveng
với caacutec nguồn ngoagravei 8 Kho dữ liệu hướng chủ đề
Hướng chủ để coacute nghĩa lagrave kho dữ liệu được tổ chức xung quanh caacutec chủ đề chiacutenh như khaacutech hagraveng sản phẩm sản xuất Tập trung vagraveo việc mocirc higravenh hoacutea vagrave phacircn tiacutech dữ liệu cho caacutec nhagrave ra quyết định magrave khocircng tập trung vagraveo caacutec xử lyacute thocircng thường Cung cấp cho người dugraveng một khung nhigraven toagraven vẹn đơn giản vagrave đầy đủ về caacutec sự kiện quanh caacutec chủ đề
9 Dữ liệu trong DW được tiacutech hợp Dữ liệu trong kho dữ liệu được xacircy dựng bằng caacutech tổng hợp dữ liệu từ
nhiều nguồn khaacutec nhau vagrave caacutec nguồn coacute tổ chức khaacutec nhau Cơ sở dữ liệu caacutec file excel caacutec flat file hoặc caacutec raw file Khi đưa vagraveo kho dữ liệu caacutec dữ liệu được lagravem sạch vagrave tiacutech hợp dữ liệu nhằm đảm bảo tiacutenh nhất quaacuten của dữ liệu
10Kiến truacutec kho dữ liệu Tầng cơ sở dữ liệu hoạt động Tầng truy xuất thocircng tin Tầng truy xuất dữ liệu Tầng siecircu dữ liệu Tầng quản lyacute tiến trigravenh Tầng thocircng điệp của ứng dụng Tầng vật liacute của kho dữ liệu Tầng trigravenh diễn dữ liệu
11Higravenh trạng kho dữ liệu Kho dữ liệu ảo - người dugraveng cuối coacute thể truy cập trực tiếp đến kho dữ liệu
sử dụng caacutec cocircng cụ cho pheacutep ở tầng truy xuất dữ liệu Kho dữ liệu trung tacircm-1 cơ sở dữ liệu vật lyacute chứa tất cả dữ liệu cho một
vugraveng chuyecircn dụng nagraveo đoacute
Kho dữ liệu phacircn taacuten- Thagravenh phần được phacircn taacuten qua nhiều hệ cơ sở dữ liệu vật lyacute
12METADATA- Siecircu dữ liệu Định nghĩa Siecircu dữ liệu lagrave dữ liệu về dữ liệu Lagrave 1 lưu trữ dugraveng để
Miecircu tả kho dữ liệu tổng thể Nhận dạng kiểu kho dữ liệu Quản liacute quaacute trigravenh tiacutech hợp dữ liệu Quản liacute quaacute trigravenh cập nhật kho dữ liệu Quản liacute bảo mật
Lagrave chigravea khoacutea quyết định sự thagravenh cocircng của kho dữ liệu luocircn được thay đổi vagrave cập nhật theo sự phaacutet triển của kho dữ liệu
Dugraveng để quản liacute điều khiển kho dữ liệu Sự ra đời của kho dữ liệu như 1 cấu truacutec hỗ trợ ra quyết định siecircu dữ liệu
được xem như nguồn tagravei nguyecircn dữ liệu Siecircu dữ liệu lagrave trừu tượng Chuacuteng lagrave dữ liệu bậc cao cung cấp mocirc tả ngắn
gọn caacutec dữ liệu bậc thấp hơn 13Hoạt động của Siecircu dữ liệu
Siecircu dữ liệu rất cần thiết trong việc chuyển hoacutea thocircng tin trở thagravenh tri thức Lagrave chigravea khoacutea giuacutep chuacuteng ta xử lyacute được dữ liệu thocirc Viacute dụ một dograveng dữ liệu baacuten hagraveng 1023 K596 11121 agraveNoacute sẽ khocircng coacute nghĩa gigrave cho đến khi chuacuteng ta đưa vagraveo siecircu dữ liệu (thư
mục chứa dữ liệu) agrave cửa hagraveng 1023 sản phẩm K596 vagrave số tiền baacuten được lagrave 11121 đocirc la
14Sự cần thiết phải nhất quaacuten trong kho dữ liệu Kho dữ liệu được xacircy dựng cho lợi iacutech của những nhagrave phacircn tiacutech kinh
doanh caacutec nhagrave quản trị cho tất cả caacutec khu vực chức năng Trong cơ sở dữ liệu riecircng caacutec khu vực khaacutec nhau coacute thể định nghĩa vagrave lưu
trữ dữ liệu thocircng qua phiecircn bản của chiacutenh noacute Khi dữ liệu được lấy từ những vugraveng khaacutec nhau đoacute vagrave được đặt vagraveo kho dữ
liệu Việc chuyển đổi vagrave lagravem sạch caacutec tiến trigravenh sẽ đảm bảo noacute lagrave duy nhất được tiacutech hợp tại một mức của tổ chức
15Ragrave soaacutet lại dữ liệu ndash Thực thi siecircu dữ liệu
Bất kể cấu truacutec tự nhiecircn của 1 cacircu truy vấn thế nagraveo thigrave caacutec thagravenh phần của siecircu dữ liệu rất quan trọng đối với người ra quyết định
Bảng thuộc tiacutenh khoacutea được lưu trữ bởi kho dữ liệu Tập hợp dữ liệu được lấy từ đacircu Những chuyển đổi nagraveo được thực thi với việc lagravem sạch
16Siecircu dữ liệu lagrave gigrave Metadata - lagrave thocircng tin mocirc tả nội dung của cơ sở dữ liệu (CSDL) Metadata baacuteo cho người dugraveng biết thời gian cập nhật sau cugraveng của dữ liệu
định dạng vagrave mục điacutech sử dụng của noacute Những thocircng tin nagravey coacute thể hướng dẫn người dugraveng duyệt qua CSDL vagrave
giuacutep họ hiểu được yacute nghĩa vagrave ngữ cảnh của dữ liệu Trong CSDL metadata lagrave caacutec dạng biểu diễn khaacutec nhau của caacutec đối tượng
trong CSDL Trong CSDL quan hệ metadata lagrave caacutec định nghĩa của bảng cột CSDL
view vagrave nhiều đối tượng khaacutec Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột
một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi -gtMetadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu
Bảng chuyển đổi Ghi lại những chuyển đổi đatilde được thực hiện
Lịch sử thực thi Ghi lại những dữ liệu đatilde được
phacircn tiacutech
Higravenh thaacutei kết nốiGhi lại những dữ liệu được kết nối vagrave tần suất
17Aacutenh xạ thocircng thường của siecircu dữ liệu Bản ghi aacutenh xạ chuyển đổi bao gồm
Định danh của nguồn gốc Chuyển đổi thuộc tiacutenh Chuyển đổi thuộc tiacutenh vật lyacute Matilde hoacutea tham chiếu bảng chuyển đổi Đổi tecircn Đổi khoacutea Gaacuten giaacute trị cho thuộc tiacutenh mặc định Chọn logic cho caacutec nguồn nhiều giaacute trị Đổi thuật toaacuten
18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để
phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai
lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave
tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec
Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm
Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo
19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua
caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau
SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được
Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra
một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức
Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ
Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ
Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech
CHƯƠNG 11 KHAI PHAacute DỮ LIỆU
1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn
ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993
Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng
2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd
1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều
2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP
3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn
4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng
5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server
6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo
7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động
8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời
9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều
10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện
11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech
12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP
3 Xử lyacute phacircn tiacutech trực tuyến OLAP
MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave
dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu
ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave
thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu
HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave
ROLAP4 Khai phaacute dữ liệu
Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh
khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn
Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan
5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp
6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại
Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp
Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec
Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt
Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra
Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh
vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho
Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec
Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm
Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục
Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng
gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp
Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn
Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec
Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper
Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2
Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25
Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước
Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng
Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện
trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp
Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute
độ hỗ trợ ge ngưỡng minsup
độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan
Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn
Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết
Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu
MOLAP ROLAP HOLAP
Lưu trữ dữ liệu cơ sở
Khối Bảng quan hệ Bảng quan hệ
Lưu trữ thocircng tin tổng hợp
Khối Bảng quan hệ Khối
Hiệu suất thực hiện truy vấn
Nhanh nhất Chậm nhất Nhanh
Tiecircu thụ khocircng gian lưu trữ
Nhiều Thấp Trung bigravenh
Chi phiacute bảo trigrave Cao Thấp Trung bigravenh
Kho dữ liệu cục bộ lagrave CSDL coacute những đặc điểm giống với kho dữ liệu nhưng với quy mocirc nhỏ hơn vagrave lưu trữ dữ liệu về một lĩnh vực một chuyecircn ngagravenh
Data mart phụ thuộc Chứa những dữ liệu được lấy từ DW vagrave những dữ liệu nagravey sẽ được triacutech lọc vagrave tinh chế tiacutech hợp lại ở mức cao hơn để phục vụ một chủ đề nhất định của Datamart
Data mart độc lập Khocircng giống như Datamart phụ thuộc Data mart độc lập được xacircy dựng trước DW vagrave dữ liệu được trực tiếp lấy từ caacutec nguồn khaacutec nhau
5 Siecircu dữ liệu Metadata lagrave dữ liệu để mocirc tả dữ liệu Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột
một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi Metadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu
6 Mocirci trường kho dữ liệu Hệ thống của tổ chức vagrave kho cung cấp dữ liệu để xacircy dựng kho dữ liệu Trong quaacute trigravenh chuyển dữ liệu từ caacutec nguồn khaacutec nhau dữ liệu coacute thể
được lagravem sạch hoặc chuyển đổi vagrave vigrave thế DW được xem như lagrave một chuẩn cho việc lưu trữ
Đồng thời siecircu dữ liệu được ghi lại Cuối cugraveng DW hoặc siecircu thị coacute thể được sử dụng để tạo ra một kho dữ
liệu ldquocaacute nhacircnrdquo 7 Caacutec đặc điểm của kho dữ liệu
Đặc điểm Mocirc tả
Hướng chủ đề - DL tổ chức theo caacutech thức người dugraveng tham chiếu
Tiacutech hợp - Dữ liệu ldquosạchrdquo loại bỏ tiacutenh thiếu nhất quaacuten
Khocircng thay đổi - DL ldquochỉ đọcrdquo người dugraveng khocircng thay đổi được
Chuỗi thời gian - DL lagrave chuỗi thời gian khocircng phải lagrave trạng thaacutei hiện tại
Được tổng kết - DL vận hagravenhthao taacutec khi cần thiết
được kết hợp lại thagravenh dạng coacute thể dugraveng được cho quyết định
Kiacutech cỡ lớn hơn - Lưu giữ theo chuỗi thời gian tức lagrave giữ lại nhiều DL
Khocircng được chuẩn hoacutea - Coacute thể dư thừa DLSiecircu dữ liệu - Dữ liệu của dữ liệu được lưu trữNguồn dữ liệu - DL vận hagravenh (caacutec hệ sẵn coacute) cugraveng
với caacutec nguồn ngoagravei 8 Kho dữ liệu hướng chủ đề
Hướng chủ để coacute nghĩa lagrave kho dữ liệu được tổ chức xung quanh caacutec chủ đề chiacutenh như khaacutech hagraveng sản phẩm sản xuất Tập trung vagraveo việc mocirc higravenh hoacutea vagrave phacircn tiacutech dữ liệu cho caacutec nhagrave ra quyết định magrave khocircng tập trung vagraveo caacutec xử lyacute thocircng thường Cung cấp cho người dugraveng một khung nhigraven toagraven vẹn đơn giản vagrave đầy đủ về caacutec sự kiện quanh caacutec chủ đề
9 Dữ liệu trong DW được tiacutech hợp Dữ liệu trong kho dữ liệu được xacircy dựng bằng caacutech tổng hợp dữ liệu từ
nhiều nguồn khaacutec nhau vagrave caacutec nguồn coacute tổ chức khaacutec nhau Cơ sở dữ liệu caacutec file excel caacutec flat file hoặc caacutec raw file Khi đưa vagraveo kho dữ liệu caacutec dữ liệu được lagravem sạch vagrave tiacutech hợp dữ liệu nhằm đảm bảo tiacutenh nhất quaacuten của dữ liệu
10Kiến truacutec kho dữ liệu Tầng cơ sở dữ liệu hoạt động Tầng truy xuất thocircng tin Tầng truy xuất dữ liệu Tầng siecircu dữ liệu Tầng quản lyacute tiến trigravenh Tầng thocircng điệp của ứng dụng Tầng vật liacute của kho dữ liệu Tầng trigravenh diễn dữ liệu
11Higravenh trạng kho dữ liệu Kho dữ liệu ảo - người dugraveng cuối coacute thể truy cập trực tiếp đến kho dữ liệu
sử dụng caacutec cocircng cụ cho pheacutep ở tầng truy xuất dữ liệu Kho dữ liệu trung tacircm-1 cơ sở dữ liệu vật lyacute chứa tất cả dữ liệu cho một
vugraveng chuyecircn dụng nagraveo đoacute
Kho dữ liệu phacircn taacuten- Thagravenh phần được phacircn taacuten qua nhiều hệ cơ sở dữ liệu vật lyacute
12METADATA- Siecircu dữ liệu Định nghĩa Siecircu dữ liệu lagrave dữ liệu về dữ liệu Lagrave 1 lưu trữ dugraveng để
Miecircu tả kho dữ liệu tổng thể Nhận dạng kiểu kho dữ liệu Quản liacute quaacute trigravenh tiacutech hợp dữ liệu Quản liacute quaacute trigravenh cập nhật kho dữ liệu Quản liacute bảo mật
Lagrave chigravea khoacutea quyết định sự thagravenh cocircng của kho dữ liệu luocircn được thay đổi vagrave cập nhật theo sự phaacutet triển của kho dữ liệu
Dugraveng để quản liacute điều khiển kho dữ liệu Sự ra đời của kho dữ liệu như 1 cấu truacutec hỗ trợ ra quyết định siecircu dữ liệu
được xem như nguồn tagravei nguyecircn dữ liệu Siecircu dữ liệu lagrave trừu tượng Chuacuteng lagrave dữ liệu bậc cao cung cấp mocirc tả ngắn
gọn caacutec dữ liệu bậc thấp hơn 13Hoạt động của Siecircu dữ liệu
Siecircu dữ liệu rất cần thiết trong việc chuyển hoacutea thocircng tin trở thagravenh tri thức Lagrave chigravea khoacutea giuacutep chuacuteng ta xử lyacute được dữ liệu thocirc Viacute dụ một dograveng dữ liệu baacuten hagraveng 1023 K596 11121 agraveNoacute sẽ khocircng coacute nghĩa gigrave cho đến khi chuacuteng ta đưa vagraveo siecircu dữ liệu (thư
mục chứa dữ liệu) agrave cửa hagraveng 1023 sản phẩm K596 vagrave số tiền baacuten được lagrave 11121 đocirc la
14Sự cần thiết phải nhất quaacuten trong kho dữ liệu Kho dữ liệu được xacircy dựng cho lợi iacutech của những nhagrave phacircn tiacutech kinh
doanh caacutec nhagrave quản trị cho tất cả caacutec khu vực chức năng Trong cơ sở dữ liệu riecircng caacutec khu vực khaacutec nhau coacute thể định nghĩa vagrave lưu
trữ dữ liệu thocircng qua phiecircn bản của chiacutenh noacute Khi dữ liệu được lấy từ những vugraveng khaacutec nhau đoacute vagrave được đặt vagraveo kho dữ
liệu Việc chuyển đổi vagrave lagravem sạch caacutec tiến trigravenh sẽ đảm bảo noacute lagrave duy nhất được tiacutech hợp tại một mức của tổ chức
15Ragrave soaacutet lại dữ liệu ndash Thực thi siecircu dữ liệu
Bất kể cấu truacutec tự nhiecircn của 1 cacircu truy vấn thế nagraveo thigrave caacutec thagravenh phần của siecircu dữ liệu rất quan trọng đối với người ra quyết định
Bảng thuộc tiacutenh khoacutea được lưu trữ bởi kho dữ liệu Tập hợp dữ liệu được lấy từ đacircu Những chuyển đổi nagraveo được thực thi với việc lagravem sạch
16Siecircu dữ liệu lagrave gigrave Metadata - lagrave thocircng tin mocirc tả nội dung của cơ sở dữ liệu (CSDL) Metadata baacuteo cho người dugraveng biết thời gian cập nhật sau cugraveng của dữ liệu
định dạng vagrave mục điacutech sử dụng của noacute Những thocircng tin nagravey coacute thể hướng dẫn người dugraveng duyệt qua CSDL vagrave
giuacutep họ hiểu được yacute nghĩa vagrave ngữ cảnh của dữ liệu Trong CSDL metadata lagrave caacutec dạng biểu diễn khaacutec nhau của caacutec đối tượng
trong CSDL Trong CSDL quan hệ metadata lagrave caacutec định nghĩa của bảng cột CSDL
view vagrave nhiều đối tượng khaacutec Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột
một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi -gtMetadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu
Bảng chuyển đổi Ghi lại những chuyển đổi đatilde được thực hiện
Lịch sử thực thi Ghi lại những dữ liệu đatilde được
phacircn tiacutech
Higravenh thaacutei kết nốiGhi lại những dữ liệu được kết nối vagrave tần suất
17Aacutenh xạ thocircng thường của siecircu dữ liệu Bản ghi aacutenh xạ chuyển đổi bao gồm
Định danh của nguồn gốc Chuyển đổi thuộc tiacutenh Chuyển đổi thuộc tiacutenh vật lyacute Matilde hoacutea tham chiếu bảng chuyển đổi Đổi tecircn Đổi khoacutea Gaacuten giaacute trị cho thuộc tiacutenh mặc định Chọn logic cho caacutec nguồn nhiều giaacute trị Đổi thuật toaacuten
18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để
phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai
lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave
tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec
Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm
Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo
19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua
caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau
SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được
Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra
một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức
Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ
Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ
Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech
CHƯƠNG 11 KHAI PHAacute DỮ LIỆU
1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn
ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993
Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng
2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd
1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều
2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP
3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn
4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng
5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server
6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo
7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động
8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời
9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều
10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện
11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech
12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP
3 Xử lyacute phacircn tiacutech trực tuyến OLAP
MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave
dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu
ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave
thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu
HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave
ROLAP4 Khai phaacute dữ liệu
Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh
khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn
Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan
5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp
6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại
Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp
Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec
Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt
Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra
Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh
vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho
Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec
Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm
Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục
Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng
gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp
Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn
Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec
Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper
Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2
Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25
Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước
Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng
Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện
trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp
Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute
độ hỗ trợ ge ngưỡng minsup
độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan
Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn
Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết
Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu
MOLAP ROLAP HOLAP
Lưu trữ dữ liệu cơ sở
Khối Bảng quan hệ Bảng quan hệ
Lưu trữ thocircng tin tổng hợp
Khối Bảng quan hệ Khối
Hiệu suất thực hiện truy vấn
Nhanh nhất Chậm nhất Nhanh
Tiecircu thụ khocircng gian lưu trữ
Nhiều Thấp Trung bigravenh
Chi phiacute bảo trigrave Cao Thấp Trung bigravenh
được kết hợp lại thagravenh dạng coacute thể dugraveng được cho quyết định
Kiacutech cỡ lớn hơn - Lưu giữ theo chuỗi thời gian tức lagrave giữ lại nhiều DL
Khocircng được chuẩn hoacutea - Coacute thể dư thừa DLSiecircu dữ liệu - Dữ liệu của dữ liệu được lưu trữNguồn dữ liệu - DL vận hagravenh (caacutec hệ sẵn coacute) cugraveng
với caacutec nguồn ngoagravei 8 Kho dữ liệu hướng chủ đề
Hướng chủ để coacute nghĩa lagrave kho dữ liệu được tổ chức xung quanh caacutec chủ đề chiacutenh như khaacutech hagraveng sản phẩm sản xuất Tập trung vagraveo việc mocirc higravenh hoacutea vagrave phacircn tiacutech dữ liệu cho caacutec nhagrave ra quyết định magrave khocircng tập trung vagraveo caacutec xử lyacute thocircng thường Cung cấp cho người dugraveng một khung nhigraven toagraven vẹn đơn giản vagrave đầy đủ về caacutec sự kiện quanh caacutec chủ đề
9 Dữ liệu trong DW được tiacutech hợp Dữ liệu trong kho dữ liệu được xacircy dựng bằng caacutech tổng hợp dữ liệu từ
nhiều nguồn khaacutec nhau vagrave caacutec nguồn coacute tổ chức khaacutec nhau Cơ sở dữ liệu caacutec file excel caacutec flat file hoặc caacutec raw file Khi đưa vagraveo kho dữ liệu caacutec dữ liệu được lagravem sạch vagrave tiacutech hợp dữ liệu nhằm đảm bảo tiacutenh nhất quaacuten của dữ liệu
10Kiến truacutec kho dữ liệu Tầng cơ sở dữ liệu hoạt động Tầng truy xuất thocircng tin Tầng truy xuất dữ liệu Tầng siecircu dữ liệu Tầng quản lyacute tiến trigravenh Tầng thocircng điệp của ứng dụng Tầng vật liacute của kho dữ liệu Tầng trigravenh diễn dữ liệu
11Higravenh trạng kho dữ liệu Kho dữ liệu ảo - người dugraveng cuối coacute thể truy cập trực tiếp đến kho dữ liệu
sử dụng caacutec cocircng cụ cho pheacutep ở tầng truy xuất dữ liệu Kho dữ liệu trung tacircm-1 cơ sở dữ liệu vật lyacute chứa tất cả dữ liệu cho một
vugraveng chuyecircn dụng nagraveo đoacute
Kho dữ liệu phacircn taacuten- Thagravenh phần được phacircn taacuten qua nhiều hệ cơ sở dữ liệu vật lyacute
12METADATA- Siecircu dữ liệu Định nghĩa Siecircu dữ liệu lagrave dữ liệu về dữ liệu Lagrave 1 lưu trữ dugraveng để
Miecircu tả kho dữ liệu tổng thể Nhận dạng kiểu kho dữ liệu Quản liacute quaacute trigravenh tiacutech hợp dữ liệu Quản liacute quaacute trigravenh cập nhật kho dữ liệu Quản liacute bảo mật
Lagrave chigravea khoacutea quyết định sự thagravenh cocircng của kho dữ liệu luocircn được thay đổi vagrave cập nhật theo sự phaacutet triển của kho dữ liệu
Dugraveng để quản liacute điều khiển kho dữ liệu Sự ra đời của kho dữ liệu như 1 cấu truacutec hỗ trợ ra quyết định siecircu dữ liệu
được xem như nguồn tagravei nguyecircn dữ liệu Siecircu dữ liệu lagrave trừu tượng Chuacuteng lagrave dữ liệu bậc cao cung cấp mocirc tả ngắn
gọn caacutec dữ liệu bậc thấp hơn 13Hoạt động của Siecircu dữ liệu
Siecircu dữ liệu rất cần thiết trong việc chuyển hoacutea thocircng tin trở thagravenh tri thức Lagrave chigravea khoacutea giuacutep chuacuteng ta xử lyacute được dữ liệu thocirc Viacute dụ một dograveng dữ liệu baacuten hagraveng 1023 K596 11121 agraveNoacute sẽ khocircng coacute nghĩa gigrave cho đến khi chuacuteng ta đưa vagraveo siecircu dữ liệu (thư
mục chứa dữ liệu) agrave cửa hagraveng 1023 sản phẩm K596 vagrave số tiền baacuten được lagrave 11121 đocirc la
14Sự cần thiết phải nhất quaacuten trong kho dữ liệu Kho dữ liệu được xacircy dựng cho lợi iacutech của những nhagrave phacircn tiacutech kinh
doanh caacutec nhagrave quản trị cho tất cả caacutec khu vực chức năng Trong cơ sở dữ liệu riecircng caacutec khu vực khaacutec nhau coacute thể định nghĩa vagrave lưu
trữ dữ liệu thocircng qua phiecircn bản của chiacutenh noacute Khi dữ liệu được lấy từ những vugraveng khaacutec nhau đoacute vagrave được đặt vagraveo kho dữ
liệu Việc chuyển đổi vagrave lagravem sạch caacutec tiến trigravenh sẽ đảm bảo noacute lagrave duy nhất được tiacutech hợp tại một mức của tổ chức
15Ragrave soaacutet lại dữ liệu ndash Thực thi siecircu dữ liệu
Bất kể cấu truacutec tự nhiecircn của 1 cacircu truy vấn thế nagraveo thigrave caacutec thagravenh phần của siecircu dữ liệu rất quan trọng đối với người ra quyết định
Bảng thuộc tiacutenh khoacutea được lưu trữ bởi kho dữ liệu Tập hợp dữ liệu được lấy từ đacircu Những chuyển đổi nagraveo được thực thi với việc lagravem sạch
16Siecircu dữ liệu lagrave gigrave Metadata - lagrave thocircng tin mocirc tả nội dung của cơ sở dữ liệu (CSDL) Metadata baacuteo cho người dugraveng biết thời gian cập nhật sau cugraveng của dữ liệu
định dạng vagrave mục điacutech sử dụng của noacute Những thocircng tin nagravey coacute thể hướng dẫn người dugraveng duyệt qua CSDL vagrave
giuacutep họ hiểu được yacute nghĩa vagrave ngữ cảnh của dữ liệu Trong CSDL metadata lagrave caacutec dạng biểu diễn khaacutec nhau của caacutec đối tượng
trong CSDL Trong CSDL quan hệ metadata lagrave caacutec định nghĩa của bảng cột CSDL
view vagrave nhiều đối tượng khaacutec Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột
một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi -gtMetadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu
Bảng chuyển đổi Ghi lại những chuyển đổi đatilde được thực hiện
Lịch sử thực thi Ghi lại những dữ liệu đatilde được
phacircn tiacutech
Higravenh thaacutei kết nốiGhi lại những dữ liệu được kết nối vagrave tần suất
17Aacutenh xạ thocircng thường của siecircu dữ liệu Bản ghi aacutenh xạ chuyển đổi bao gồm
Định danh của nguồn gốc Chuyển đổi thuộc tiacutenh Chuyển đổi thuộc tiacutenh vật lyacute Matilde hoacutea tham chiếu bảng chuyển đổi Đổi tecircn Đổi khoacutea Gaacuten giaacute trị cho thuộc tiacutenh mặc định Chọn logic cho caacutec nguồn nhiều giaacute trị Đổi thuật toaacuten
18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để
phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai
lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave
tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec
Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm
Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo
19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua
caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau
SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được
Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra
một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức
Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ
Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ
Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech
CHƯƠNG 11 KHAI PHAacute DỮ LIỆU
1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn
ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993
Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng
2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd
1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều
2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP
3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn
4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng
5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server
6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo
7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động
8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời
9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều
10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện
11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech
12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP
3 Xử lyacute phacircn tiacutech trực tuyến OLAP
MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave
dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu
ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave
thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu
HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave
ROLAP4 Khai phaacute dữ liệu
Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh
khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn
Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan
5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp
6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại
Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp
Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec
Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt
Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra
Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh
vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho
Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec
Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm
Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục
Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng
gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp
Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn
Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec
Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper
Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2
Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25
Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước
Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng
Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện
trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp
Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute
độ hỗ trợ ge ngưỡng minsup
độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan
Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn
Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết
Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu
MOLAP ROLAP HOLAP
Lưu trữ dữ liệu cơ sở
Khối Bảng quan hệ Bảng quan hệ
Lưu trữ thocircng tin tổng hợp
Khối Bảng quan hệ Khối
Hiệu suất thực hiện truy vấn
Nhanh nhất Chậm nhất Nhanh
Tiecircu thụ khocircng gian lưu trữ
Nhiều Thấp Trung bigravenh
Chi phiacute bảo trigrave Cao Thấp Trung bigravenh
Kho dữ liệu phacircn taacuten- Thagravenh phần được phacircn taacuten qua nhiều hệ cơ sở dữ liệu vật lyacute
12METADATA- Siecircu dữ liệu Định nghĩa Siecircu dữ liệu lagrave dữ liệu về dữ liệu Lagrave 1 lưu trữ dugraveng để
Miecircu tả kho dữ liệu tổng thể Nhận dạng kiểu kho dữ liệu Quản liacute quaacute trigravenh tiacutech hợp dữ liệu Quản liacute quaacute trigravenh cập nhật kho dữ liệu Quản liacute bảo mật
Lagrave chigravea khoacutea quyết định sự thagravenh cocircng của kho dữ liệu luocircn được thay đổi vagrave cập nhật theo sự phaacutet triển của kho dữ liệu
Dugraveng để quản liacute điều khiển kho dữ liệu Sự ra đời của kho dữ liệu như 1 cấu truacutec hỗ trợ ra quyết định siecircu dữ liệu
được xem như nguồn tagravei nguyecircn dữ liệu Siecircu dữ liệu lagrave trừu tượng Chuacuteng lagrave dữ liệu bậc cao cung cấp mocirc tả ngắn
gọn caacutec dữ liệu bậc thấp hơn 13Hoạt động của Siecircu dữ liệu
Siecircu dữ liệu rất cần thiết trong việc chuyển hoacutea thocircng tin trở thagravenh tri thức Lagrave chigravea khoacutea giuacutep chuacuteng ta xử lyacute được dữ liệu thocirc Viacute dụ một dograveng dữ liệu baacuten hagraveng 1023 K596 11121 agraveNoacute sẽ khocircng coacute nghĩa gigrave cho đến khi chuacuteng ta đưa vagraveo siecircu dữ liệu (thư
mục chứa dữ liệu) agrave cửa hagraveng 1023 sản phẩm K596 vagrave số tiền baacuten được lagrave 11121 đocirc la
14Sự cần thiết phải nhất quaacuten trong kho dữ liệu Kho dữ liệu được xacircy dựng cho lợi iacutech của những nhagrave phacircn tiacutech kinh
doanh caacutec nhagrave quản trị cho tất cả caacutec khu vực chức năng Trong cơ sở dữ liệu riecircng caacutec khu vực khaacutec nhau coacute thể định nghĩa vagrave lưu
trữ dữ liệu thocircng qua phiecircn bản của chiacutenh noacute Khi dữ liệu được lấy từ những vugraveng khaacutec nhau đoacute vagrave được đặt vagraveo kho dữ
liệu Việc chuyển đổi vagrave lagravem sạch caacutec tiến trigravenh sẽ đảm bảo noacute lagrave duy nhất được tiacutech hợp tại một mức của tổ chức
15Ragrave soaacutet lại dữ liệu ndash Thực thi siecircu dữ liệu
Bất kể cấu truacutec tự nhiecircn của 1 cacircu truy vấn thế nagraveo thigrave caacutec thagravenh phần của siecircu dữ liệu rất quan trọng đối với người ra quyết định
Bảng thuộc tiacutenh khoacutea được lưu trữ bởi kho dữ liệu Tập hợp dữ liệu được lấy từ đacircu Những chuyển đổi nagraveo được thực thi với việc lagravem sạch
16Siecircu dữ liệu lagrave gigrave Metadata - lagrave thocircng tin mocirc tả nội dung của cơ sở dữ liệu (CSDL) Metadata baacuteo cho người dugraveng biết thời gian cập nhật sau cugraveng của dữ liệu
định dạng vagrave mục điacutech sử dụng của noacute Những thocircng tin nagravey coacute thể hướng dẫn người dugraveng duyệt qua CSDL vagrave
giuacutep họ hiểu được yacute nghĩa vagrave ngữ cảnh của dữ liệu Trong CSDL metadata lagrave caacutec dạng biểu diễn khaacutec nhau của caacutec đối tượng
trong CSDL Trong CSDL quan hệ metadata lagrave caacutec định nghĩa của bảng cột CSDL
view vagrave nhiều đối tượng khaacutec Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột
một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi -gtMetadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu
Bảng chuyển đổi Ghi lại những chuyển đổi đatilde được thực hiện
Lịch sử thực thi Ghi lại những dữ liệu đatilde được
phacircn tiacutech
Higravenh thaacutei kết nốiGhi lại những dữ liệu được kết nối vagrave tần suất
17Aacutenh xạ thocircng thường của siecircu dữ liệu Bản ghi aacutenh xạ chuyển đổi bao gồm
Định danh của nguồn gốc Chuyển đổi thuộc tiacutenh Chuyển đổi thuộc tiacutenh vật lyacute Matilde hoacutea tham chiếu bảng chuyển đổi Đổi tecircn Đổi khoacutea Gaacuten giaacute trị cho thuộc tiacutenh mặc định Chọn logic cho caacutec nguồn nhiều giaacute trị Đổi thuật toaacuten
18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để
phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai
lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave
tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec
Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm
Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo
19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua
caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau
SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được
Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra
một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức
Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ
Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ
Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech
CHƯƠNG 11 KHAI PHAacute DỮ LIỆU
1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn
ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993
Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng
2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd
1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều
2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP
3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn
4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng
5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server
6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo
7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động
8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời
9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều
10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện
11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech
12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP
3 Xử lyacute phacircn tiacutech trực tuyến OLAP
MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave
dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu
ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave
thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu
HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave
ROLAP4 Khai phaacute dữ liệu
Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh
khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn
Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan
5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp
6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại
Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp
Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec
Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt
Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra
Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh
vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho
Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec
Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm
Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục
Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng
gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp
Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn
Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec
Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper
Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2
Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25
Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước
Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng
Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện
trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp
Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute
độ hỗ trợ ge ngưỡng minsup
độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan
Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn
Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết
Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu
MOLAP ROLAP HOLAP
Lưu trữ dữ liệu cơ sở
Khối Bảng quan hệ Bảng quan hệ
Lưu trữ thocircng tin tổng hợp
Khối Bảng quan hệ Khối
Hiệu suất thực hiện truy vấn
Nhanh nhất Chậm nhất Nhanh
Tiecircu thụ khocircng gian lưu trữ
Nhiều Thấp Trung bigravenh
Chi phiacute bảo trigrave Cao Thấp Trung bigravenh
Bất kể cấu truacutec tự nhiecircn của 1 cacircu truy vấn thế nagraveo thigrave caacutec thagravenh phần của siecircu dữ liệu rất quan trọng đối với người ra quyết định
Bảng thuộc tiacutenh khoacutea được lưu trữ bởi kho dữ liệu Tập hợp dữ liệu được lấy từ đacircu Những chuyển đổi nagraveo được thực thi với việc lagravem sạch
16Siecircu dữ liệu lagrave gigrave Metadata - lagrave thocircng tin mocirc tả nội dung của cơ sở dữ liệu (CSDL) Metadata baacuteo cho người dugraveng biết thời gian cập nhật sau cugraveng của dữ liệu
định dạng vagrave mục điacutech sử dụng của noacute Những thocircng tin nagravey coacute thể hướng dẫn người dugraveng duyệt qua CSDL vagrave
giuacutep họ hiểu được yacute nghĩa vagrave ngữ cảnh của dữ liệu Trong CSDL metadata lagrave caacutec dạng biểu diễn khaacutec nhau của caacutec đối tượng
trong CSDL Trong CSDL quan hệ metadata lagrave caacutec định nghĩa của bảng cột CSDL
view vagrave nhiều đối tượng khaacutec Trong kho dữ liệu metadata lagrave dạng định nghĩa dữ liệu như bảng cột
một baacuteo caacuteo caacutec luật doanh nghiệp hay những quy tắc biến đổi -gtMetadata bao quaacutet tất cả caacutec phương diện của kho dữ liệu
Bảng chuyển đổi Ghi lại những chuyển đổi đatilde được thực hiện
Lịch sử thực thi Ghi lại những dữ liệu đatilde được
phacircn tiacutech
Higravenh thaacutei kết nốiGhi lại những dữ liệu được kết nối vagrave tần suất
17Aacutenh xạ thocircng thường của siecircu dữ liệu Bản ghi aacutenh xạ chuyển đổi bao gồm
Định danh của nguồn gốc Chuyển đổi thuộc tiacutenh Chuyển đổi thuộc tiacutenh vật lyacute Matilde hoacutea tham chiếu bảng chuyển đổi Đổi tecircn Đổi khoacutea Gaacuten giaacute trị cho thuộc tiacutenh mặc định Chọn logic cho caacutec nguồn nhiều giaacute trị Đổi thuật toaacuten
18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để
phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai
lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave
tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec
Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm
Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo
19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua
caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau
SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được
Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra
một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức
Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ
Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ
Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech
CHƯƠNG 11 KHAI PHAacute DỮ LIỆU
1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn
ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993
Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng
2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd
1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều
2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP
3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn
4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng
5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server
6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo
7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động
8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời
9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều
10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện
11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech
12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP
3 Xử lyacute phacircn tiacutech trực tuyến OLAP
MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave
dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu
ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave
thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu
HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave
ROLAP4 Khai phaacute dữ liệu
Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh
khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn
Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan
5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp
6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại
Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp
Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec
Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt
Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra
Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh
vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho
Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec
Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm
Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục
Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng
gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp
Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn
Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec
Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper
Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2
Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25
Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước
Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng
Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện
trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp
Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute
độ hỗ trợ ge ngưỡng minsup
độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan
Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn
Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết
Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu
MOLAP ROLAP HOLAP
Lưu trữ dữ liệu cơ sở
Khối Bảng quan hệ Bảng quan hệ
Lưu trữ thocircng tin tổng hợp
Khối Bảng quan hệ Khối
Hiệu suất thực hiện truy vấn
Nhanh nhất Chậm nhất Nhanh
Tiecircu thụ khocircng gian lưu trữ
Nhiều Thấp Trung bigravenh
Chi phiacute bảo trigrave Cao Thấp Trung bigravenh
Bảng chuyển đổi Ghi lại những chuyển đổi đatilde được thực hiện
Lịch sử thực thi Ghi lại những dữ liệu đatilde được
phacircn tiacutech
Higravenh thaacutei kết nốiGhi lại những dữ liệu được kết nối vagrave tần suất
17Aacutenh xạ thocircng thường của siecircu dữ liệu Bản ghi aacutenh xạ chuyển đổi bao gồm
Định danh của nguồn gốc Chuyển đổi thuộc tiacutenh Chuyển đổi thuộc tiacutenh vật lyacute Matilde hoacutea tham chiếu bảng chuyển đổi Đổi tecircn Đổi khoacutea Gaacuten giaacute trị cho thuộc tiacutenh mặc định Chọn logic cho caacutec nguồn nhiều giaacute trị Đổi thuật toaacuten
18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để
phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai
lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave
tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec
Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm
Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo
19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua
caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau
SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được
Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra
một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức
Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ
Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ
Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech
CHƯƠNG 11 KHAI PHAacute DỮ LIỆU
1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn
ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993
Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng
2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd
1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều
2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP
3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn
4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng
5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server
6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo
7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động
8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời
9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều
10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện
11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech
12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP
3 Xử lyacute phacircn tiacutech trực tuyến OLAP
MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave
dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu
ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave
thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu
HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave
ROLAP4 Khai phaacute dữ liệu
Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh
khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn
Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan
5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp
6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại
Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp
Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec
Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt
Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra
Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh
vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho
Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec
Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm
Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục
Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng
gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp
Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn
Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec
Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper
Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2
Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25
Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước
Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng
Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện
trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp
Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute
độ hỗ trợ ge ngưỡng minsup
độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan
Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn
Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết
Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu
MOLAP ROLAP HOLAP
Lưu trữ dữ liệu cơ sở
Khối Bảng quan hệ Bảng quan hệ
Lưu trữ thocircng tin tổng hợp
Khối Bảng quan hệ Khối
Hiệu suất thực hiện truy vấn
Nhanh nhất Chậm nhất Nhanh
Tiecircu thụ khocircng gian lưu trữ
Nhiều Thấp Trung bigravenh
Chi phiacute bảo trigrave Cao Thấp Trung bigravenh
18Đặc tả kho dữ liệu kho dữ liệu cần được thiết kế để phugrave hợp với nhu cầu của người dugraveng Bạn cần chuacute yacute đến người dugraveng khối dữ liệu vograveng cập nhật Caacutec giả định vagrave khả năng xảy ra xung đột phải được tiacutenh đến trong khung Một dự aacuten kho dữ liệu cần nhiều cocircng cụ khaacutec nhau nhiều hơn cocircng cụ để
phaacutet triển 1 ứng dụng Trong một kho dữ liệu vograveng đời khocircng bao giờ hết Giải quyết noacute sẽ hiệu quả hơn rất nhiều Khi một dự aacuten mới được higravenh thagravenh thigrave việc ruacutet kinh nghiệm từ những sai
lầm trước đoacute sẽ giuacutep nacircng cao chất lượng Triacutech thocircng tin đặc tả coacute yacute nghĩa quan trọng trong việc khai phaacute dữ liệu vagrave
tổng hợp nội dungVới những loại dữ liệu khaacutec nhau chuacuteng ta coacute những dữ liệu đặc tả khaacutec
Trong một vagravei hệ thống Search đặc tả dữ liệu trở thagravenh những thagravenh phần quan trọng nhất đaacutenh giaacute độ chiacutenh xaacutec của dữ liệu với yecircu cầu của người tigravem kiếm
Đặc tả dữ liệu cograven gọi lagrave meta data lagrave những thocircng tin cơ bản cho một loại dữ liệu nhất định Chẳng hạn một tập nhạc bao gồm tecircn nhạc sĩ ngagravey tạo
19Cocircng nghệ kho dữ liệu Khocircng ai chagraveo baacuten một giải phaacutep kho dữ liệu kiểu caacute nhacircn Tổ chức mua
caacutec phần dữ liệu từ một số nhagrave sản xuất vagrave mong noacute hoạt động được cugraveng nhau
SAS IBM Software AG Information Builders vagrave Platinum chagraveo baacuten caacutec giải phaacutep magrave coacute thể tạm chấp nhận được
Thị trường rất cạnh tranh Khi Kho dữ liệu trở thagravenh phần tiecircu chuẩn của một tổ chức noacute sẽ tigravem ra
một đường mới để sử dụng dữ liệu Như lagrave việc mang lại một vagravei thaacutech thức
Những ragraveng buộc sẽ hạn chế khả năng liecircn kết dữ liệu của caacutec dữ liệu riecircng rẽ
Những nguồn khaacutec nhau coacute thể coacute caacutec dữ liệu phi cấu truacutec vagrave như vậy rất khoacute để lưu trữ
Internet lagravem cho dữ liệu coacute thể được truy nhập từ mọi nơi Đương nhiecircn điều nagravey sẽ lagravem tăng những khoảng caacutech
CHƯƠNG 11 KHAI PHAacute DỮ LIỆU
1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn
ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993
Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng
2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd
1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều
2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP
3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn
4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng
5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server
6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo
7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động
8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời
9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều
10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện
11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech
12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP
3 Xử lyacute phacircn tiacutech trực tuyến OLAP
MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave
dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu
ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave
thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu
HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave
ROLAP4 Khai phaacute dữ liệu
Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh
khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn
Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan
5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp
6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại
Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp
Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec
Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt
Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra
Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh
vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho
Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec
Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm
Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục
Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng
gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp
Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn
Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec
Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper
Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2
Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25
Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước
Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng
Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện
trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp
Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute
độ hỗ trợ ge ngưỡng minsup
độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan
Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn
Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết
Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu
MOLAP ROLAP HOLAP
Lưu trữ dữ liệu cơ sở
Khối Bảng quan hệ Bảng quan hệ
Lưu trữ thocircng tin tổng hợp
Khối Bảng quan hệ Khối
Hiệu suất thực hiện truy vấn
Nhanh nhất Chậm nhất Nhanh
Tiecircu thụ khocircng gian lưu trữ
Nhiều Thấp Trung bigravenh
Chi phiacute bảo trigrave Cao Thấp Trung bigravenh
CHƯƠNG 11 KHAI PHAacute DỮ LIỆU
1 Xử lyacute phacircn tiacutech trực tuyến OLAP Thuật ngữ OLAP được E F Codd đưa ra trong một bagravei baacuteo coacute tecircn
ldquoProviding On-Line Analytical Processing to User Analystsrdquo được cocircng bố vagraveo thaacuteng 8 năm 1993
Trong bagravei baacuteo nagravey ocircng cũng đưa ra 12 quy tắc magrave một hệ thống OLAP phải tuacircn theo Từ đoacute OLAP được biết đến như một kỹ thuật phacircn tiacutech dữ liệu sử dụng caacutec thể hiện dữ liệu đa chiều gọi lagrave caacutec khối (cube) OLAP cung cấp khả năng tạo ra caacutec khối dữ liệu vagrave thực hiện caacutec truy vấn tinh vi trecircn caacutec ứng dụng người dugraveng
2 12 tiecircu chuẩn để đaacutenh giaacute một hệ thống OLAP của E F Codd
1 Khung nhigraven đa chiều (Multidimensional View) Dữ liệu sẽ được trigravenh bagravey cho người dugraveng trecircn khuacircn mẫu đa chiều
2 Trong suốt (Transparent to user) Người dugraveng khocircng cần biết họ đang sử dụng CSDL đa chiều OLAP
3 Tiacutenh truy cập (Accessible) Caacutec cocircng cụ OLAP necircn chọn dữ liệu nguồn tốt nhất đểhỗ trợ truy vấn
4 Nhất quaacuten trong thực thi baacuteo caacuteo (Consistent Reporting) Sự thực thi baacuteo caacuteo phải như nhau khocircng phụ thuộc vagraveo dung lượng CSDL vagrave số chiều được sử dụng
5 Coacute kiến truacutec Client-Server (Client-Server Architecture) Caacutec cocircng cụ OLAP được triển khai trecircn mocirc higravenh Client-Server
6 Phacircn chiều tổng quaacutet (Generic Dimensionality) Đảm bảo caacutec chiều dữ liệu lagrave như nhau trong cấu truacutec vagrave tiacutenh toaacuten Khocircng thiecircn vị trong việc truy cập bất cứ chiều nagraveo
7 Xử lyacute động Ma trận dữ liệu thừa (Dynamic Sparse Matrix Handling) Caacutec giaacute trị null được tổ chức lưu trữ hiệu quả trecircn ma trận động
8 Hỗ trợ đa người dugraveng (Multi-User Support) Cocircng cụ OLAP phải hỗ trợ nhiều người dugraveng đồng thời
9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều
10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện
11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech
12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP
3 Xử lyacute phacircn tiacutech trực tuyến OLAP
MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave
dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu
ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave
thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu
HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave
ROLAP4 Khai phaacute dữ liệu
Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh
khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn
Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan
5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp
6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại
Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp
Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec
Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt
Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra
Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh
vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho
Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec
Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm
Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục
Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng
gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp
Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn
Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec
Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper
Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2
Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25
Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước
Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng
Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện
trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp
Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute
độ hỗ trợ ge ngưỡng minsup
độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan
Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn
Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết
Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu
MOLAP ROLAP HOLAP
Lưu trữ dữ liệu cơ sở
Khối Bảng quan hệ Bảng quan hệ
Lưu trữ thocircng tin tổng hợp
Khối Bảng quan hệ Khối
Hiệu suất thực hiện truy vấn
Nhanh nhất Chậm nhất Nhanh
Tiecircu thụ khocircng gian lưu trữ
Nhiều Thấp Trung bigravenh
Chi phiacute bảo trigrave Cao Thấp Trung bigravenh
9Caacutec toaacuten tử qua caacutec chiều khocircng giới hạn (Unrestricted Cross-Dimensional Operations) Quy tắc kết hợp được aacutep dụng trecircn tất cả caacutec chiều
10 Thao taacutec dữ liệu bằng trực giaacutec (Intuitive Data Manipulation) Người dugraveng nhigraven thấy mọi dữ liệu cần thiết trecircn giao diện traacutenh phải sử dụng qua menu hoặc qua nhiều thao taacutec mới mở được giao diện
11 Lập baacuteo caacuteo động (Flexible Reporting) Cho pheacutep người dugraveng trigravenh bagravey baacuteo caacuteo dữ liệu theo bất kỳ caacutech nagraveo magrave họ thiacutech
12 Mức độ kết hợp vagrave số chiều khocircng hạn chế (Unlimited Dimensions and Aggregation Levels) Sẽ khocircng coacute giới hạn số chiều vagrave mức kết hợp trong mocirc higravenh OLAP
3 Xử lyacute phacircn tiacutech trực tuyến OLAP
MOLAP Mocirc higravenh OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (lagrave
dữ liệu từ caacutec bảng của kho dữ liệu hoặc data mart) vagrave thocircng tin tổng hợp (lagrave caacutec độ đo được tiacutenh toaacuten từ caacutec bảng) trong caacutec cấu truacutec đa chiều gọi lagrave caacutec khối (cube) Caacutec cấu truacutec nagravey được lưu becircn ngoagravei cơ sở dữ liệu data mart hoặc kho dữ liệu
ROLAP Mocirc higravenh OLAP quan hệ (ROLAP) lưu trữ dữ liệu cơ sở vagrave
thocircng tin tổng hợp trong caacutec bảng quan hệ Caacutec bảng nagravey được lưu trữ trong cugraveng cơ sở dữ liệu như lagrave caacutec bảng của data mart hoặc kho dữ liệu
HOLAP Mocirc higravenh OLAP lai (HOLAP) lagrave sự kết hợp giữa MOLAP vagrave
ROLAP4 Khai phaacute dữ liệu
Khai phaacute dữ liệu (phaacutet hiện tri thức trong cơ sở dữ liệu sẵn coacute) lagrave việc triacutech lọc ra những thocircng tin coacute iacutech (khocircng hiển nhiecircnkhocircng tường minh
khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn
Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan
5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp
6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại
Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp
Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec
Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt
Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra
Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh
vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho
Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec
Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm
Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục
Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng
gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp
Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn
Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec
Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper
Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2
Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25
Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước
Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng
Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện
trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp
Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute
độ hỗ trợ ge ngưỡng minsup
độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan
Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn
Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết
Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu
MOLAP ROLAP HOLAP
Lưu trữ dữ liệu cơ sở
Khối Bảng quan hệ Bảng quan hệ
Lưu trữ thocircng tin tổng hợp
Khối Bảng quan hệ Khối
Hiệu suất thực hiện truy vấn
Nhanh nhất Chậm nhất Nhanh
Tiecircu thụ khocircng gian lưu trữ
Nhiều Thấp Trung bigravenh
Chi phiacute bảo trigrave Cao Thấp Trung bigravenh
khocircng biết trước vagrave coacute iacutech một caacutech tiềm năng) những mẫu dữ liệu trong caacutec cơ sở dữ liệu lớn
Khai phaacute dữ liệu thường được biết đến với tecircn gọi lagrave quaacute trigravenh khaacutem phaacute tri thức KDD (Knowledge Data Discovery) bao gồm phacircn tiacutech thống kecirc logic mờ mạng nơron taacutec tử thocircng minh biểu diễn dữ liệu trực quan
5 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại Phacircn cụm Phaacutet hiện luật kết hợp
6 Caacutec phương phaacutep cơ bản trong khai phaacute dữ liệu Phacircn loại
Cho một tập caacutec bản ghi được gọi lagrave tập huấn luyện mỗi bản ghi chứa một tập caacutec thuộc tiacutenh một thuộc tiacutenh trong đoacute gắn nhatilden phacircn loại được gọi lagrave thuộc tiacutenh lớp
Nhiệm vụ của bagravei toaacuten phacircn loại lagrave tigravem ra một mocirc higravenh thể hiện thuộc tiacutenh lớp lagrave một hagravem của giaacute trị của caacutec thuộc tiacutenh khaacutec
Sau khi tigravem được mocirc higravenh thiacutech hợp nhất cho bagravei toaacuten mục điacutech cuối cugraveng lagrave aacutep dụng mocirc higravenh (hagravem tigravem được) đoacute để tiecircn đoaacuten caacutec bản ghi chưa được biết đến trước đoacute thuộc lớp nagraveo một caacutech cagraveng chiacutenh xaacutec cagraveng tốt
Một tập bản ghi kiểm thử được dugraveng để xaacutec định độ chiacutenh xaacutec của mocirc higravenh Thocircng thường một tập dữ liệu được đưa ra sẽ được chia thagravenh tập huấn luyện vagrave tập kiểm thử tập huấn luyện được dugraveng để xacircy dựng mocirc higravenh vagrave tập kiểm thử được dugraveng để kiểm tra
Phacircn cụm Cho một tập caacutec điểm dữ liệu mỗi điểm coacute một tập thuộc tiacutenh
vagrave coacute một độ đo sự tương đồng giữa chuacuteng để phacircn cụm sao cho
Những điểm dữ liệu trong cugraveng một cụm thigrave coacute sự tương đồng cao nhiều hơn với caacutec điểm khaacutec
Những điểm dữ liệu trong caacutec cụm riecircng rẽ thigrave iacutet tương đồng hơn caacutec điểm thuộc cugraveng một cụm
Caacutec độ đo sự tương đồng coacute thể kể đến Khoảng caacutech Ơclit nếu caacutec thuộc tiacutenh lagrave giaacute trị liecircn tục
Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng
gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp
Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn
Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec
Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper
Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2
Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25
Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước
Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng
Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện
trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp
Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute
độ hỗ trợ ge ngưỡng minsup
độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan
Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn
Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết
Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu
MOLAP ROLAP HOLAP
Lưu trữ dữ liệu cơ sở
Khối Bảng quan hệ Bảng quan hệ
Lưu trữ thocircng tin tổng hợp
Khối Bảng quan hệ Khối
Hiệu suất thực hiện truy vấn
Nhanh nhất Chậm nhất Nhanh
Tiecircu thụ khocircng gian lưu trữ
Nhiều Thấp Trung bigravenh
Chi phiacute bảo trigrave Cao Thấp Trung bigravenh
Caacutec độ đo khaacutec theo từng bagravei toaacuten vagrave lĩnh vực Mocirc tả một phacircn cụm dựa trecircn khoảng caacutech Ơclit trong khocircng
gian 3 chiều được thể hiện trong higravenh vẽ dưới đacircy Phaacutet hiện luật kết hợp
Cho một tập caacutec bản ghi mỗi bản ghi đều coacute chứa một số mặt hagraveng nằm trong một tập caacutec mặt hagraveng cho sẵn
Phương phaacutep phaacutet hiện luật kết hợp sẽ tạo ra caacutec luật phụ thuộc thể hiện sự tiecircn đoaacuten về sự xuất hiện của mặt hagraveng nagravey dựa trecircn sự xuất hiện của caacutec mặt hagraveng khaacutec
Một số khaacutei niệm Tập mặt hagraveng lagrave tập hợp gồm 1 hoặc nhiều mặt hagraveng Viacute dụ Milk Bread Diaper
Đếm số hỗ trợ s lagrave số lần xuất hiện của tập mặt hagraveng trong tổng số caacutec giao dịch T Viacute dụ s(Milk BreadDiaper) = 2
Độ hỗ trợ s lagrave tỷ lệ caacutec giao dịch coacute chứa tập mặt hagraveng Viacute dụ s(Milk Bread Diaper) = 25
Tập mặt hagraveng thường xuyecircn lagrave tập mặt hagraveng coacute độ hỗ trợ lớn hơn hoặc bằng ngưỡng minsup cho trước
Luật kết hợp được thể hiện dưới dạng X =gt Ytrong đoacute XY lagrave tập caacutec mặt hagraveng
Caacutec độ đo để đaacutenh giaacute một luật kết hợp Độ hỗ trợ (s) lagrave tỷ lệ caacutec giao dịch chứa cả X vagrave Y Độ tin cậy (c) dugraveng để đo caacutec mặt hagraveng của Y xuất hiện
trong caacutec giao dịch coacute chứa X Nhiệm vụ khai phaacute tigravem luật kết hợp
Cho trước một tập caacutec giao dich T mục tiecircu của khai phaacute luật kết hợp lagrave tigravem ra tất cả caacutec luật coacute
độ hỗ trợ ge ngưỡng minsup
độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan
Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn
Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết
Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu
MOLAP ROLAP HOLAP
Lưu trữ dữ liệu cơ sở
Khối Bảng quan hệ Bảng quan hệ
Lưu trữ thocircng tin tổng hợp
Khối Bảng quan hệ Khối
Hiệu suất thực hiện truy vấn
Nhanh nhất Chậm nhất Nhanh
Tiecircu thụ khocircng gian lưu trữ
Nhiều Thấp Trung bigravenh
Chi phiacute bảo trigrave Cao Thấp Trung bigravenh
độ tin cậy ge ngưỡngminconf7 Biểu diễn dữ liệu trực quan
Hệ thống trực giaacutec của con người được điều khiển bởi mắt vagrave bộ natildeo Đacircy lagrave hệ thống coacute hiệu năng xử lyacute cao vagrave khả năng tiacutenh toaacuten song song lớn
Dữ liệu coacute thể được trigravenh bagravey dưới nhiều higravenh thức trực quan khaacutec nhau chẳng hạn như khối 3D (3D cubes) biểu đồ phacircn phối dữ liệu caacutec đường cong bề mặt đồ thị liecircn kết
Biểu diễn dữ liệu trực quan coacute thể giuacutep cung cấp cho người dugraveng một ấn tượng rotilde ragraveng vagrave tổng quan về caacutec đặc tiacutenh của dữ liệu
MOLAP ROLAP HOLAP
Lưu trữ dữ liệu cơ sở
Khối Bảng quan hệ Bảng quan hệ
Lưu trữ thocircng tin tổng hợp
Khối Bảng quan hệ Khối
Hiệu suất thực hiện truy vấn
Nhanh nhất Chậm nhất Nhanh
Tiecircu thụ khocircng gian lưu trữ
Nhiều Thấp Trung bigravenh
Chi phiacute bảo trigrave Cao Thấp Trung bigravenh