Thong Ke Trong Kinh Doanh- Excel
-
Upload
khac-hieu-nguyen -
Category
Documents
-
view
653 -
download
4
description
Transcript of Thong Ke Trong Kinh Doanh- Excel
5/12/2009
1
NGUYỄN DUY TÂM
Nguyễn Duy Tâm _ IDR5/12/20091
Con người –Tầm nhìn mớiCon người –Tầm nhìn mới
NỘI DUNG
1. Nhập dữ liệu vào excel
2. Thống kê dữ liệu dạng bảng
3. Thống kê dữ liệu dạng đồ thị
4. Thống kê dữ liệu bằng các đại lượng thống kê mô tả
5. Ước lượng và kiểm định giả thiết
6. Phân tích phương sai ANOVA
7. Hồi quy tương quan
8. Kiểm định phi tham số
9. Lý thuyết quyết định
Nguyễn Duy Tâm _ IDR5/12/2009 2
5/12/2009
2
Con người –Tầm nhìn mớiCon người –Tầm nhìn mới
5/12/2009 Nguyễn Duy Tâm _ IDR 3
Nhập số liệu vào Excel
OBS Y_PT Z1_MALE Z2_AGE Z3_NOYM Z4_CHILD Z8_SATISFACTION
1 0 0 22 4 1 4
2 1 1 22 0.125 0 5
3 0 0 18 10 0 5
4 0 1 22 0.75 0 3
5 12 0 42 15 1 2
6 0 0 37 15 1 4
7 0 1 52 15 1 4
8 7 0 27 1.5 0 5
9 0 1 27 4 0 4
10 0 0 27 1.5 1 2 Sử dụng file Excel: Business Statistics/ Resources/Learning-by-Doing/ Affair.xls
OBS = Số thứ tự của người được phỏng vấn
Y-PT = Số lần quan hệ tình dục ngoài hôn nhân trong năm
Z1_MALE = 1 nếu là nam, 0 nếu là nữ
Z2_AGE = Tuổi
Z3_NOYM = Số năm kết hôn
Z4_CHILD = 1 nếu có con, 0 nếu chưa có con
Z8_SATISFACTION = Mức độ thỏa mãn về hôn nhân, thang Likert 1-5
Ghi chú : Biến số theo cột, quan sát ghi theo hàng
Con người –Tầm nhìn mớiCon người –Tầm nhìn mới
5/12/2009 Nguyễn Duy Tâm _ IDR 4
Tạo biểu nhập liệu (Form)
Trên một trang bảng tính mới (New worksheet) Tạo dòng tiêu đề (biến số) ở dòng 1. Quét khối dòng tiêu đề, rồi vào Data/ Form
5/12/2009
3
Con người –Tầm nhìn mớiCon người –Tầm nhìn mới
5/12/2009 Nguyễn Duy Tâm _ IDR 5
Tạo biểu nhập liệu (Form)
Vì chúng ta không định nghĩa chính xác số dòng của bảng tính, nên Excel có hỏi như bảng giao diện ở trên. Đơn giản là chọn OK.
Con người –Tầm nhìn mớiCon người –Tầm nhìn mới
5/12/2009 Nguyễn Duy Tâm _ IDR 6
Bản ghi cho ngƣời thứ nhất
Nhập cho người thứ nhất Bảng số liệu điều tra của người này như sau OBS = 1 Người thứ nhất Y-PT = 0 Chưa ngoại tình Z1_MALE = 0 Nữ Z2_AGE = 22 22 tuổi Z3_NOYM = 4 Kết hôn được 4 năm Z4_CHILD = 1 Đã có con Z8_SATISFACTION = 4 Hài lòng về cuộc hôn
nhân của mình
5/12/2009
4
Con người –Tầm nhìn mớiCon người –Tầm nhìn mới
5/12/2009 Nguyễn Duy Tâm _ IDR 7
Bản ghi cho ngƣời thứ nhất
Con người –Tầm nhìn mớiCon người –Tầm nhìn mới
5/12/2009 Nguyễn Duy Tâm _ IDR 8
Bản ghi cho ngƣời thứ hai
Từ Form nhập liệu, click New để nhập một bản ghi (record) hay quan sát (observation) mới.
Bảng số liệu điều tra của người thứ hai như sau OBS = 2 Người thứ hai Y-PT = 1 Đã ngoại tình Z1_MALE = 1 Nam Z2_AGE = 22 22 tuổi Z3_NOYM = 0.125 Kết hôn được 1.5 tháng
(1.5/12) Z4_CHILD = 0 Chưa có con Z8_SATISFACTION = 5 Rất hài lòng về cuộc hôn
nhân của mình
5/12/2009
5
Con người –Tầm nhìn mớiCon người –Tầm nhìn mới
5/12/2009 Nguyễn Duy Tâm _ IDR 9
Bản ghi cho ngƣời thứ hai
Làm tương tự cho đến người thứ 10 ở slide 3.
Con người –Tầm nhìn mớiCon người –Tầm nhìn mới
5/12/2009 Nguyễn Duy Tâm _ IDR 10
Mảng thứ tự
Chọn biến Z2_AGE
Sắp xếp thành mảng thứ
tự từ nhỏ đến lớn
Quét khối toàn bộ số
liệu, kể cả dòng tên
biến.
Data/ Sort
5/12/2009
6
Con người –Tầm nhìn mớiCon người –Tầm nhìn mới
5/12/2009 Nguyễn Duy Tâm _ IDR 11
Giao diện Sort
Chọn Sort by: Z2_AGE Chọn Asending: Sắp xếp theo thứ tự tăng dần
OBS Z2_AGE
3 18
1 22
2 22
4 22
8 27
9 27
10 27
6 37
5 42
7 52
Kết quả
Con người –Tầm nhìn mớiCon người –Tầm nhìn mới
1. THỐNG KÊ DỮ LiỆU DẠNG BẢNG
Yêu cầu của nội dung: Lập bảng thống kê cho các biến thuộc
tính và thuộc lượng.
Đối với biến ít biểu hiện: mỗi biểu hiện 1 phân tổ
Đối với biến nhiều biểu hiện: tiến hành phân tổ lại (Lập Bin)
Công cụ trên excel:
Dùng lệnh =FREQUENCY[ (data_array, bins_array)]
Nguyễn Duy Tâm _ IDR5/12/2009 12
5/12/2009
7
Con người –Tầm nhìn mớiCon người –Tầm nhìn mới
1. THỐNG KÊ DỮ LiỆU DẠNG BẢNG
Quy trình dùng lệnh FREQUENCY
Đối với biến có ít biểu hiện
B1: Lập cột các biểu hiện (cột BIN): là giá trị các biểu hiện
B2: Chọn vùng dữ liệu bảng thống kê, lập lệnh Frequency
Cú pháp: = FREQUENCY(data_array, bins_array)
Data_array: Dữ liệu cần lập bảng
Bins_array: các biểu hiện
Chú ý: Với các lệnh thông thường, sau khi lập lệnh, chỉ cần
ENTER, nhưng với lệnh FREQUENCY, ta cần gõ tổ hợp fím
[ctrl+shift+enter]
Ví dụ: lập bảng thống kê cho tình trạng hôn nhân [Marital]
Nguyễn Duy Tâm _ IDR5/12/2009 13
Con người –Tầm nhìn mớiCon người –Tầm nhìn mới
1. THỐNG KÊ DỮ LiỆU DẠNG BẢNG
Quy trình dùng lệnh FREQUENCY
Đối với biến có nhiều biểu hiện:
B1: Cần lập các [giới hạn dưới] và [giới hạn trên] của mỗi
phân tổ.
B2: Lập cột Bin chỉ gồm các số giới hạn trên của mỗi phân tổ.
Ví dụ biến [trình độ học vấn]_edu
B3: dùng lệnh FREQUENCY để lập bảng.
Bài tập: lập bảng tần số theo trình độ học vấn, độ tuổi và trình độ
kết hôn.
Chú ý: phân tổ do sinh viên tự phân, có thể phân tổ đều hoặc
không đều
Nguyễn Duy Tâm _ IDR5/12/2009 14
5/12/2009
8
Con người –Tầm nhìn mớiCon người –Tầm nhìn mới
5/12/2009 Nguyễn Duy Tâm _ IDR 15
Biểu đồ tần số-Thủ tục Data Analysis
Dùng thủ tục Data Analysis trong thư viện hàm Add-Ins của Excel
Kiểm tra xem có thủ tục Data Analysis trong Tools hay chưa?
Tools/ Add-Ins/ Check vào Analysis ToolPak/ OK
Con người –Tầm nhìn mớiCon người –Tầm nhìn mới
5/12/2009 Nguyễn Duy Tâm _ IDR 16
Biểu đồ tần số-Thủ tục Data Analysis
Tools/ Data Analysis/ Histogram
5/12/2009
9
Con người –Tầm nhìn mớiCon người –Tầm nhìn mới
5/12/2009 Nguyễn Duy Tâm _ IDR 17
Biểu đồ tần số-Thủ tục Data Analysis
Input Range: Quét khối số liệu, nhớ có cả tên biến Bin Range: Quét biên khối biên trên của biểu đồ tần số, nhớ có cả tên Labels: Khai báo có dòng đầu tiên là tên biến Chọn Output range: ô đầu tiên chứa kết quả Khai báo các kết quả cần nhận: Pareto, Cumulative Percentage, Chart
Output
Con người –Tầm nhìn mớiCon người –Tầm nhìn mới
5/12/2009 Nguyễn Duy Tâm _ IDR 18
Biểu đồ tần số-Thủ tục Data Analysis
Bảng tần số, tần suất tích lũy và phân phối Pareto
BIN Frequency Cumulative
% BIN Frequency Cumulative
%
20 1 10.00% 30 6 60.00%
30 6 70.00% 20 1 70.00%
40 1 80.00% 40 1 80.00%
50 1 90.00% 50 1 90.00%
60 1 100.00% 60 1 100.00%
More 0 100.00% More 0 100.00%
5/12/2009
10
Con người –Tầm nhìn mớiCon người –Tầm nhìn mới
5/12/2009 Nguyễn Duy Tâm _ IDR 19
Biểu đồ tần số-Thủ tục Data Analysis
Biểu đồ Pareto
Histogram
0
1
2
3
4
5
6
7
30 20 40 50 60 More
BIN
Fre
qu
en
cy
0.00%
20.00%
40.00%
60.00%
80.00%
100.00%
120.00%
Frequency
Cumulative %
Con người –Tầm nhìn mớiCon người –Tầm nhìn mới
2. THỐNG KÊ DỮ LiỆU DẠNG ĐỒ THỊ
Các dạng đồ thị:
1. Hình thanh : Column, Bar,
2. Hình tròn, (bánh) : Pie
3. Đường gấp khúc : Line
4. Phân tán : Scatter
Nguyễn Duy Tâm _ IDR5/12/2009 20
5/12/2009
11
Con người –Tầm nhìn mớiCon người –Tầm nhìn mới
2. THỐNG KÊ DỮ LiỆU DẠNG ĐỒ THỊ
QUY TRÌNH VẼ ĐỒ THỊ
B1: chọn vùng dữ liệu
B2: chọn biểu tượng đồ thị
[chart wizart] hoặc
insert/chart
B3: Chọn các hiệu chỉnh
tương ứng
ĐỒ THỊ HÌNH TRÕN
1% 5%12%
33%
49%
Tần số
Rất không hài lòng
Không hài lòng
Bình thường
Hài lòng
Rất hài lòng
5/12/2009 Nguyễn Duy Tâm _ IDR 21
Đồ thị hình tròn thường dùng tần
suất (%) để hiển thị
Con người –Tầm nhìn mớiCon người –Tầm nhìn mới
2. THỐNG KÊ DỮ LiỆU DẠNG ĐỒ THỊ
ĐỒ THỊ HÌNH THANH
[COLUMN]
ĐỒ THỊ HÌNH THANH
[BAR]
Nguyễn Duy Tâm _ IDR5/12/2009 22
Tên thuộc tính dài
Tên thuộc tính ngắn
5/12/2009
12
ĐỒ THỊ ĐƯỜNG
GẤP KHÚC _ LINE
Đồ thị Line: thường
dùng cho trường hợp dữ
liệu theo dõi qua thời
gian
5/12/2009 Nguyễn Duy Tâm _ IDR 23
0
20
40
60
80
100
120
140
160
180
Jan-95
Jan-96
Jan-97
Jan-98
Jan-99
Jan-00
Jan-01
Jan-02
Jan-03
Jan-04
Jan-05
chỉ số CPI
Con người –Tầm nhìn mớiCon người –Tầm nhìn mới
5/12/2009 Nguyễn Duy Tâm _ IDR 24
Bảng tóm tắt-Pivot Table
Data/ Pivot Table
5/12/2009
13
Con người –Tầm nhìn mớiCon người –Tầm nhìn mới
5/12/2009 Nguyễn Duy Tâm _ IDR 25
Bảng tóm tắt-Pivot Table
Quét khối dữ liệu cần tính toán, kể cả tên biến, sẽ được xem là tên trường(Field)
Con người –Tầm nhìn mớiCon người –Tầm nhìn mới
5/12/2009 Nguyễn Duy Tâm _ IDR 26
Bảng tóm tắt-Pivot Table
Nên chọn trang bảng tính mới
5/12/2009
14
Con người –Tầm nhìn mớiCon người –Tầm nhìn mới
5/12/2009 Nguyễn Duy Tâm _ IDR 27
Bảng tóm tắt-Pivot Table
Kéo và nhả (Drag and Drop) Z8_SATISFACTION vào Row Fields và Data Items
Con người –Tầm nhìn mớiCon người –Tầm nhìn mới
5/12/2009 Nguyễn Duy Tâm _ IDR 28
Bảng tóm tắt-Pivot Table
Nhấp đúp vào A3 (ô giao giữa Row Fields và Column Fields) và chọn Count of Z8_SATISFACTION.
Ưu điểm: có thể tính Tổng, tần số và nhiều lệnh khác
5/12/2009
15
Con người –Tầm nhìn mớiCon người –Tầm nhìn mới
5/12/2009 Nguyễn Duy Tâm _ IDR 29
Pivot Table với 2 biến phân loại
Count of Z8_SATISFACTION Z1_MALE
Z8_SATISFACTION 0 1 Grand Total
1 11 5 16
2 35 31 66
3 46 47 93
4 93 101 194
5 130 102 232
Grand Total 315 286 601
Con người –Tầm nhìn mớiCon người –Tầm nhìn mới
5/12/2009 Nguyễn Duy Tâm _ IDR 30
Pivot Table với 2 biến phân loại
Click vào A3, kéo và thả trường Z1_MALE vào Column Fields.
Ưu điểm: lập bảng tần số chéo cho nhiều biến.
5/12/2009
16
Con người –Tầm nhìn mớiCon người –Tầm nhìn mới
5/12/2009 Nguyễn Duy Tâm _ IDR 31
Pivot Table với 3 biến phân loại
Kéo và thả Z4_Child vào Page Fields
Con người –Tầm nhìn mớiCon người –Tầm nhìn mới
Một số yêu cầu
Dùng công cụ Pivot table:
1. Lập bảng tổng số con của các hộ gia đình có 1,2,…,n con cụ thể.
2. Lập bảng tổng số anh,chị em trong nhà ứng với từng loại gia đình cụ thể.
3. Lập bảng tần số cho biến Marital, vẽ biểu đồ và cho biết loại tình trạng
hôn nhân nào chiếm đa số
4. Lập bảng tần số cho biến marita (column) và biến sex (row). Vẽ biểu đồ
và cho biết giới tính nào ứng với tình trạng hôn nhân nào chiếm đa số. Vẽ
biểu đồ tương ứng.
5. Lập bảng tần số giữa hai biến marital (column) và wrkstat (row).
6. Lập bảng tần số giữa hai biến marital (column) và wrkstat (row) <chỉ
thống kê cho giới tính nữ> và <chỉ thống kê cho giới tính nam>.
5/12/2009 Nguyễn Duy Tâm _ IDR 32
5/12/2009
17
Con người –Tầm nhìn mớiCon người –Tầm nhìn mới
Thống kê dữ liệu bằng các đại lƣợng thống kê mô tả
CHỈ TIÊU TẬP TRUNG
Trung bình : average
=average(data)
Trung vị : Median
=median(data)
Mode : Mode
=mode(data)
Tứ phân vị : quartile
=quartile(data,số phân vị)
(1: Q1; 2:Q2; 3:Q3)
CHỈ TIÊU PHÂN TÁN
Phương sai : var
=var(data)
Độ lệch chuẩn : stdev
=stdev(data)
5/12/2009 Nguyễn Duy Tâm _ IDR 33
Con người –Tầm nhìn mớiCon người –Tầm nhìn mới
Thống kê dữ liệu bằng các đại lƣợng thống kê mô tả
MỘT SỐ LỆNH KHÁC
Tính tổng thoả điều kiện
=sumif(vùng ĐK, ĐK,
Vùng tính tổng)
Đếm thỏa điều kiện
=countif(vùng ĐK,ĐK)
MỘT SỐ LỆNH CÓ TRONG
EXCEL 2007
Tính tổng thỏa điều kiện
nâng cao.
=sumifs(vùng tính tổng,
vùng ĐK1, ĐK1, vùng
ĐK2, ĐK2)
Đếm thỏa điều kiện nâng
cao.
=countifs(vùng ĐK1,
ĐK1,vùng ĐK2, ĐK2,…)
5/12/2009Nguyễn Duy Tâm _ IDR
34
5/12/2009
18
Con người –Tầm nhìn mớiCon người –Tầm nhìn mới
Thống kê dữ liệu bằng các đại lƣợng thống kê mô tả
MỘT SỐ LỆNH CÓ TRONG
EXCEL 2007
Trung bình thỏa điều kiện
=averageif(vùng ĐK, ĐK,
Vùng tính mean)
=averageifs(vùng tính
mean,vùng ĐK1, ĐK1,
Vùng ĐK2, ĐK2)
BÀI TẬP (AFFAIR)
1. Tính giá trị trung bình, trung vị,
mode, tứ phân vị, phương sai,
độ lệch chuẩn cho các biến:
Z2_age, Z4_child, Z6_edu. Nêu
ý nghĩa của các số trên.
2. Tính tổng số con của những
người có độ tuổi dưới 30. hoặc
của những người hài lòng về
tình trạng hôn nhân.
3. Đếm những người có 1 con
5/12/2009 Nguyễn Duy Tâm _ IDR 35
Con người –Tầm nhìn mớiCon người –Tầm nhìn mới
Thống kê dữ liệu bằng các đại lƣợng thống kê mô tả
BÀI TẬP (THUC HANH
EXCEL)
1. Đếm những người làm
việc toàn thời gian trong
mẫu khảo sát
2. Đếm những người đã lập
gia đình, chưa lập gia đình
BÀI TẬP (THUC HANH
EXCEL)
1. Tính tổng số anh/chị/em
của những người lý dị, ly
thân.
2. Tính tổng số con của
những người là nữ giới.
5/12/2009 Nguyễn Duy Tâm _ IDR 36
5/12/2009
19
Con người –Tầm nhìn mớiCon người –Tầm nhìn mới
5/12/2009 Nguyễn Duy Tâm _ IDR 37
Tính trị thống kê bằng thủ tục Data Analysis
Tools/ Data Analysis/ Descriptive Statistics
Nhập số liệu và các tùy chọn vào giao diện
Con người –Tầm nhìn mớiCon người –Tầm nhìn mới
5/12/2009 Nguyễn Duy Tâm _ IDR 38
Tính trị thống kê bằng thủ tục Data Analysis
Tools/ Data Analysis/ Descriptive Statistics
Kết quả sau khi đã hiệu chỉnh. Bài tập: Tính các chỉ tiêu thống kê mô tả bằng công
cụ DATA ANALYSIS cho các biến: agewed sibschilds age educ trong bài tập thực hành excel
Y_PT Z1_MALE Z2_AGE Z3_NOYM Z4_CHILD Z8_SATISFACTIONZ5_RELIGIOUS Z6_EDU Z7_OCCUPATION
Mean 1.46 0.48 32.49 8.18 0.72 3.93 3.12 16.17 4.19
Standard Error 0.13 0.02 0.38 0.23 0.02 0.04 0.05 0.10 0.07
Median 0.00 0.00 32.00 7.00 1.00 4.00 3.00 16.00 5.00
Mode 0.00 0.00 27.00 15.00 1.00 5.00 4.00 14.00 5.00
Standard Deviation 3.30 0.50 9.29 5.57 0.45 1.10 1.17 2.40 1.82
Sample Variance 10.88 0.25 86.28 31.04 0.20 1.22 1.36 5.77 3.31
Kurtosis 4.26 -2.00 0.23 -1.57 -1.09 -0.20 -1.01 -0.30 -0.78
Skewness 2.35 0.10 0.89 0.08 -0.96 -0.84 -0.09 -0.25 -0.74
Range 12 1 39.5 14.875 1 4 4 11 6
Minimum 0 0 17.5 0.125 0 1 1 9 1
Maximum 12 1 57 15 1 5 5 20 7
Sum 875 286 19525 4914.795 430 2363 1873 9716 2521
Count 601 601 601 601 601 601 601 601 601
5/12/2009
20
Con người –Tầm nhìn mớiCon người –Tầm nhìn mới
HỆ SỐ TƢƠNG QUAN
Đối tượng biến áp dụng: biến định lượng (scale) hoặc biến
thuộc thang đo thứ bậc (ordinal), biến thuộc thang đo khoảng
(interval).
Chú ý: Đối với thang đo định danh (norminal): những chỉ số
tính toán không có ý nghĩa thống kê.
Công thức lệnh: tính rxy =correl(data_X, data_Y)
Ý nghĩa:
Đo lường về mức độ quan hệ tuyến tính giữa hai biến X và Y
-1 < = rxy < 0 : X và Y nghịch biến
0< rxy <=1 : X và Y đồng biến
5/12/2009 Nguyễn Duy Tâm _ IDR 39
Con người –Tầm nhìn mớiCon người –Tầm nhìn mới
5/12/2009 Nguyễn Duy Tâm _ IDR 40
Dùng thủ tục Data Analysis để tính ma trận
tƣơng quan
Tools/ Data Analysis/ Correlation
5/12/2009
21
Con người –Tầm nhìn mớiCon người –Tầm nhìn mới
5/12/2009 Nguyễn Duy Tâm _ IDR 41
Dùng thủ tục Data Analysis để tính ma trận
tƣơng quan
Kết quả. BT thực hành excel: Tính matrận hệ số tương quan
cho các biến agewed sibs childs age educ và nhận xét về mối quan hệ giữa các biến
Y_PT Z1_MALE Z2_AGE Z3_NOYM Z4_CHILDZ8_SATISFACTIONZ5_RELIGIOUSZ6_EDUZ7_OCCUPATION
Y_PT 1
Z1_MALE 0.011736 1
Z2_AGE 0.095237 0.190641 1
Z3_NOYM 0.186842 0.030283 0.777546 1
Z4_CHILD 0.10401 0.069222 0.421931 0.572857 1
Z8_SATISFACTION-0.27951 -0.00752 -0.199 -0.24312 -0.19628 1
Z5_RELIGIOUS-0.1445 0.007679 0.193777 0.218261 0.129351 0.024296 1
Z6_EDU -0.00244 0.397505 0.134596 0.040003 -0.00699 0.109303 -0.04257 1
Z7_OCCUPATION0.049612 0.467923 0.166413 0.044592 -0.09273 0.017422 -0.03972 0.533605 1
Con người –Tầm nhìn mớiCon người –Tầm nhìn mới
5/12/2009 Nguyễn Duy Tâm _ IDR 42
Đồ thị phân tán: Hài lòng phụ thuộc vào học vấn
Chọn loại đồ thị là Scatter
5/12/2009
22
Con người –Tầm nhìn mớiCon người –Tầm nhìn mới
5/12/2009 Nguyễn Duy Tâm _ IDR 43
Đồ thị phân tán: Hài lòng phụ thuộc vào học vấn
Nhập số liệu
Con người –Tầm nhìn mớiCon người –Tầm nhìn mới
5/12/2009 Nguyễn Duy Tâm _ IDR 44
Đồ thị phân tán:Hài lòng phụ thuộc vào học vấn
Các tùy chọn
5/12/2009
23
Con người –Tầm nhìn mớiCon người –Tầm nhìn mới
5/12/2009 Nguyễn Duy Tâm _ IDR 45
Đồ thị phân tán: Hài lòng phụ thuộc vào học vấn
Xuất ra trang riêng
Con người –Tầm nhìn mớiCon người –Tầm nhìn mới
5/12/2009 Nguyễn Duy Tâm _ IDR 46
Đồ thị phân tán:
Hài lòng phụ thuộc vào học vấn
Chọn loại đồ thị là Scatter
5/12/2009
24
Con người –Tầm nhìn mớiCon người –Tầm nhìn mới
5/12/2009 Nguyễn Duy Tâm _ IDR 47
Đồ thị phân tán:
Hài lòng phụ thuộc vào học vấn
Nhập số liệu
Con người –Tầm nhìn mớiCon người –Tầm nhìn mới
5/12/2009 Nguyễn Duy Tâm _ IDR 48
Đồ thị phân tán:
Hài lòng phụ thuộc vào học vấn
Các tùy chọn
5/12/2009
25
Con người –Tầm nhìn mớiCon người –Tầm nhìn mới
5/12/2009 Nguyễn Duy Tâm _ IDR 49
Đồ thị phân tán:
Hài lòng phụ thuộc vào học vấn
Xuất ra trang riêng
Con người –Tầm nhìn mớiCon người –Tầm nhìn mới
5/12/2009 Nguyễn Duy Tâm _ IDR 50
MÔ PHỎNG LẤY MẪU LẶP LẠI
CHỌN CỠ MẪU n = 9 TỪ Z2_AGE
Số thứ tự trong tổng thể: Hàm Randbetween
5/12/2009
26
Con người –Tầm nhìn mớiCon người –Tầm nhìn mới
5/12/2009 Nguyễn Duy Tâm _ IDR 51
MÔ PHỎNG LẤY MẪU LẶP LẠI
CHỌN CỠ MẪU n = 9 TỪ Z2_AGE
Điền kết quả lấy mẫu: Hàm Vlookup
Con người –Tầm nhìn mớiCon người –Tầm nhìn mới
5/12/2009 Nguyễn Duy Tâm _ IDR 52
MÔ PHỎNG LẤY MẪU LẶP LẠI
CHỌN CỠ MẪU n = 9 TỪ Z2_AGE
MÔ PHỎNG BẰNG THỦ TỤC SAMPLING
Tools/ Data Analysis/ Sampling
5/12/2009
27
Con người –Tầm nhìn mớiCon người –Tầm nhìn mới
5/12/2009 Nguyễn Duy Tâm _ IDR 53
MÔ PHỎNG LẤY MẪU LẶP LẠI
CHỌN CỠ MẪU n = 9 TỪ Z2_AGE
KẾT QUẢ MÔ PHỎNG BẰNG THỦ TỤC SAMPLING 10 MẪU
LƢU Ý: KẾT QUẢ NHẬN ĐƢỢC LÀ NGẪU NHIÊN
STT MẪU MẪU 1 MẪU 2 MẪU 3 MẪU 4 MẪU 5 MẪU 6 MẪU 7 MẪU 8 MẪU 9 MẪU 10
1 27 37 42 32 52 27 42 22 32 32
2 22 32 27 57 32 27 32 47 42 27
3 22 22 52 32 22 42 42 27 37 37
4 42 27 22 22 37 52 27 32 22 22
5 42 47 32 27 32 27 37 27 27 27
6 32 37 22 37 27 37 27 22 42 52
7 27 37 32 42 22 37 32 27 32 32
8 27 57 27 27 37 27 27 22 22 22
9 27 42 52 22 47 32 32 27 27 27
TRUNG BÌNH 29.78 37.56 34.22 33.11 34.22 34.22 33.11 28.11 31.44 30.89
Tạo 10 mẫu theo bảng trên (dùng công cụ Sample, số quan sát mỗi mẫu là 9)
Con người –Tầm nhìn mớiCon người –Tầm nhìn mới
5/12/2009 Nguyễn Duy Tâm _ IDR 54
MÔ PHỎNG LẤY MẪU LẶP LẠI
CHỌN CỠ MẪU n = 9 TỪ Z2_AGE
TRUNG BÌNH: HÀM AVERAGE ĐỘ LỆCH CHUẨN: HÀM STDEV LƢU Ý: THEO LÝ THUYẾT THÌ VÀ CÓ THỂ ĐẠT ĐƢỢC ĐiỀU NÀY VỚI VÔ SỐ LẦN LẤY MẪU
X
TRUNG BÌNH CỦA TRUNG BÌNH MẪU 32.46
TRUNG BÌNH CỦA TỔNG THỂ 32.488
ĐỘ LỆCH CHUẨN CỦA TRUNG BÌNH MẪU 2.4237
ĐỘ LỆCH CHUẨN CỦA TỔNG THỂ 9.2888
ĐỘ LỆCH CHUẨN CỦA TỔNG THỂ/3 3.0963
Xn
5/12/2009
28
Con người –Tầm nhìn mớiCon người –Tầm nhìn mới
5/12/2009 Nguyễn Duy Tâm _ IDR 55
ƢỚC LƢỢNG KHOẢNG TÌN CẬY CHO GIÁ TRỊ TRUNG
BÌNH (BiẾT )
Chọn a = 0.05 =>P(1-a/2)= 0.975 Tra Za/2 = 1.96 Tính trung bình = 32.49 Ƣớc lƣợng khỏang tin cậy 95%: (31.77; 33.21)
/ 2 / 2X Z X Zn n
a a
Con người –Tầm nhìn mớiCon người –Tầm nhìn mới
5/12/2009 Nguyễn Duy Tâm _ IDR 56
ƢỚC LƢỢNG KHOẢNG TÌN CẬY CHO
GIÁ TRỊ TRUNG BÌNH (CHƢA BiẾT )
Chọn a = 0.05 =>P(1-a/2)= 0.975 Tra ta/2 = 1.964 Tính trung bình = 32.49 và độ lệch chuẩn mẫu =9.29 Ƣớc lƣợng khỏang tin cậy 95%: (31.74; 33.23)
/ 2, 1 / 2, 1n n
S SX t X t
n na a
5/12/2009
29
Con người –Tầm nhìn mớiCon người –Tầm nhìn mới
5/12/2009 Nguyễn Duy Tâm _ IDR 57
ƢỚC LƢỢNG KHOẢNG TÌN CẬY CHO GIÁ TRỊ TRUNG
BÌNH (CHƢA BiẾT )_THỦ TỤC DATA ANALYSIS
Tools/ Data Analysis/ Descriptive Statistics Chọn Summary Statistics và Confidence Level for Mean
Con người –Tầm nhìn mớiCon người –Tầm nhìn mới
5/12/2009 Nguyễn Duy Tâm _ IDR 58
ƢỚC LƢỢNG KHOẢNG TÌN CẬY CHO GIÁ TRỊ TRUNG
BÌNH (CHƢA BiẾT )_THỦ TỤC DATA ANALYSIS
Cận dƣới = Mean – Confidence Level (95%) Cận trên = Mean + Confidence Level (95%)
/ 2, 1 / 2, 1n n
S SX t X t
n na a
5/12/2009
30
Con người –Tầm nhìn mớiCon người –Tầm nhìn mới
Bài tập ƣớc lƣợng
BÀI TẬP AFFAIR
1. Ước lượng độ tuổi bình
quân (age) của những
người được khảo sát.
BÀI TẬP “THUC HANH
EXCEL
1. Ước lượng độ tuổi bình
quân (age) của những
người được khảo sát
2. Ước lượng độ tuổi bình
quân kết hôn (agewed).
3. Ước lượng trình độ học
vấn (educ) bình quân của
những người được khảo
sát.
5/12/2009 Nguyễn Duy Tâm _ IDR 59
Con người –Tầm nhìn mớiCon người –Tầm nhìn mới
5/12/2009 60
Kiểm định 1 đuôi (Biết s)Ho: Số năm học trung bình của ngƣời Mỹ tối đa là 15 năm
Nhắc lại đường dẫn hàm thống kê: fx/ Statistical/ Average…
Nguyễn Duy Tâm _ IDR
5/12/2009
31
Con người –Tầm nhìn mớiCon người –Tầm nhìn mới
5/12/2009 61
Kiểm định 1 đuôi (Biết s)Ho: Số năm học trung bình của ngƣời Mỹ tối đa là 15 năm
Giá trị Z = 11.44 nằm ở miền bác bỏ =>Có bằng chứng thống kê cho thấy số năm học trung bình của
người Mỹ lớn hơn 15 năm.
Nguyễn Duy Tâm _ IDR
Con người –Tầm nhìn mớiCon người –Tầm nhìn mới
5/12/2009 62
Kiểm định 1 đuôi (Không biết s)Ho: Số năm học trung bình của ngƣời Mỹ tối đa là 16 năm
Lưu ý: Hàm TINV ứng với tra t hai đuôi nên khi tra t một đuôi cần tra ứng với 2a.
Nguyễn Duy Tâm _ IDR
5/12/2009
32
Con người –Tầm nhìn mớiCon người –Tầm nhìn mới
5/12/2009 63
Kiểm định 1 đuôi (Không biết s)Ho: Số năm học trung bình của ngƣời Mỹ tối đa là 16 năm
Vì trị thống kê t = 1.70 nằm ở miền bác bỏ nên chúng ta bác bỏ Ho. Vậy số năm học trung bình của người Mỹ cao hơn 16.
Nguyễn Duy Tâm _ IDR
Con người –Tầm nhìn mớiCon người –Tầm nhìn mới
5/12/2009 64
Kiểm định 2 đuôi (Biết s)Ho: Số năm học trung bình của ngƣời Mỹ là 16 năm
Hàm NORMINV trả về giá trị Z ứng với xác suất tích lũy nên phải nhập tham số là (1-a/2)
Nguyễn Duy Tâm _ IDR
5/12/2009
33
Con người –Tầm nhìn mớiCon người –Tầm nhìn mới
5/12/2009 65
Kiểm định 2 đuôi (Biết s)Ho: Số năm học trung bình của ngƣời Mỹ là 16 năm
Hàm NORMINV trả về giá trị Z ứng với xác suất tích lũy nên phải nhập tham số là (1-a/2)
Vì trị thống kê Z = 1.63 nằm trong miền chấp nhận nên ta không thể bác bỏ Ho.
Nguyễn Duy Tâm _ IDR
Con người –Tầm nhìn mớiCon người –Tầm nhìn mới
5/12/2009 66
Kiểm định 2 đuôi (Chƣa biết s)Ho: Số năm học trung bình của ngƣời Mỹ là 16 năm
Hàm TINV(a, n-1)
Nguyễn Duy Tâm _ IDR
5/12/2009
34
Con người –Tầm nhìn mớiCon người –Tầm nhìn mới
5/12/2009 67
Kiểm định 2 đuôi (Chƣa biết s)Ho: Số năm học trung bình của ngƣời Mỹ là 16 năm
Vì trị thống kê t = 1.70 nằm trong miền chấp nhận nên ta không thể bác bỏ Ho.
Z6_EDU Trung bình 16.17
9 Độ lệch chuẩn = 2.40
16 Cỡ mẫu n= 601
14 Sai số chuẩn = 0.10
17 a = 0.05
14 t a/2 = 1.964
14
18 Ho: = 16
17 H1 <> 16
20
17 Trị thống kê t= 1.70
Nguyễn Duy Tâm _ IDR
Con người –Tầm nhìn mớiCon người –Tầm nhìn mới
Bài tập kiểm định
BÀI TẬP AFFAIR
1. Có giả thiết cho rằng,
độ tuổi (age) bình quân
của những người được
khảo sát là dưới 30.
Bạn hãy kiểm định giả
thiết này với mức ý
nghĩa α=5%.
2. Có giả thiết cho rằng,
độ tuổi (age) bình quân
của những người được
khảo sát là 33. Theo
bạn, giả thiết này đúng
hay sai? (α=10%)
BTẬP THỰC HÀNH EXCEL
1. Có giả thiết cho rằng, độ tuổi (age) bình
quân của những người được khảo sát là
dưới 40. Bạn hãy kiểm định giả thiết
nàyα=5%.
2. Có giả thiết cho rằng, độ tuổi (age) bình
quân của những người được khảo sát là
46. Theo bạn, đúng hay sai α=3%?
3. Có giả thiết cho rằng, độ tuổi (agewed)
bình quân của những người được khảo
sát là dưới 40. Bạn hãy kiểm định giả
thiết này α=4%.
5/12/2009 Nguyễn Duy Tâm _ IDR 68
5/12/2009
35
Con người –Tầm nhìn mớiCon người –Tầm nhìn mới
5/12/2009 69
Kiểm định 2 đuôi (Biết và Chƣa biết )-Giá trị pHo: Số năm học trung bình của ngƣời Mỹ là 16 năm
ZTEST(Array, x, sigma) với Array: Số liệu cần kiểm địnhx: Giá trị của phát biểu Ho, Sigma: Nhập nếu biết hoặc để trống
nếu không biết.
Nguyễn Duy Tâm _ IDR
Con người –Tầm nhìn mớiCon người –Tầm nhìn mới
5/12/2009 70
Kiểm định 2 đuôi (Biết và Chƣa biết )-Giá trị pHo: Số năm học trung bình của ngƣời Mỹ là 16 năm
P_Value = 2*Min(ZTEST, 1-ZTEST)P_Value = 0.09> a = 0.05 => Không thể bác bỏ Ho.
Nguyễn Duy Tâm _ IDR
5/12/2009
36
Con người –Tầm nhìn mớiCon người –Tầm nhìn mới
5/12/2009 Nguyễn Duy Tâm _ IDR 71
Kiểm định sự khác biệt về trung bình của hai tổng
thể-Biết độ lệch chuẩn Affair.xls trang Edu
Ho: Không có sự khác biệt về học vấn trung bình của
hai giới
Kết quả khảo sát cho thấy học vấn trung bình của
nam nhỉnh hơn của nữ nhưng độ lệch chuẩn cao hơn.
Kiểm định Ho bằng thủ tục
Tools | Data Analysis | z-test: Two Sample for Means
OBS MALE EDU(FEMALE) OBS MALE EDU(MALE) EDU(FEMALE) EDU(MALE)
1 0 9 1 1 9 Trung bình 15.26 17.17
2 0 9 2 1 9 Độ lệch chuẩn 2.02 2.39
3 0 9 3 1 9 Số quan sát 315 286
4 0 9 4 1 12
5 0 12 5 1 12
Con người –Tầm nhìn mớiCon người –Tầm nhìn mới
5/12/2009 Nguyễn Duy Tâm _ IDR 72
Kiểm định sự khác biệt về trung bình của hai
tổng thể-Biết độ lệch chuẩn
Tools | Data Analysis | z-test: Two Sample for Means
5/12/2009
37
Con người –Tầm nhìn mớiCon người –Tầm nhìn mới
5/12/2009 Nguyễn Duy Tâm _ IDR 73
Kiểm định sự khác biệt về trung bình của hai tổng
thể-Biết độ lệch chuẩn
Kết quả kiểm định: Bác bỏ Ho
Con người –Tầm nhìn mớiCon người –Tầm nhìn mới
5/12/2009 Nguyễn Duy Tâm _ IDR 74
Kiểm định sự khác biệt về trung bình của hai tổng
thể-Chƣa biết độ lệch chuẩn
Ho: Không có sự khác biệt về học vấn trung bình của hai giớiTools | Data Analysis | t-Test: Two Sample Assuming Equal
Variances
5/12/2009
38
Con người –Tầm nhìn mớiCon người –Tầm nhìn mới
5/12/2009 Nguyễn Duy Tâm _ IDR 75
Kiểm định sự khác biệt về trung bình của hai tổng
thể-Chƣa biết độ lệch chuẩn
Ho: Không có sự khác biệt về học vấn trung bình của hai giớiTools | Data Analysis | t-Test: Two Sample Assuming Equal
VariancesKết quả: Bác bỏ Ho
Con người –Tầm nhìn mớiCon người –Tầm nhìn mới
Bài tập kiểm định mức lƣơng trung bình theo giới tính
1. Có ý kiến cho rằng mức lương trung bình theo giới tính giữa
nam và nữ là như nhau. Với số liệu của bài tập Tien luong
khoi diem theo gioi tinh nam - nu.xls, bạn hãy kiểm định giả
thiết trên.
2. Có giả thiết cho rằng, việc cải tiến phần mềm làm việc hiện
tại không có hiệu quả. Bằng dữ liệu bài tập hieu qua
software.xls, bạn hãy kiểm định hiệu quả của phần mềm mới
và cũ.
5/12/2009 Nguyễn Duy Tâm _ IDR 76
5/12/2009
39
Con người –Tầm nhìn mớiCon người –Tầm nhìn mới
5/12/2009 Nguyễn Duy Tâm _ IDR 77
Kiểm định F cho sự khác biệt về phƣơng sai của
hai tổng thể
Ho: Không có sự khác biệt về phương sai của học vấn trên hai giớiTools | Data Analysis | F-Test: Two-Sample for Variances
Con người –Tầm nhìn mớiCon người –Tầm nhìn mới
5/12/2009 Nguyễn Duy Tâm _ IDR 78
Kiểm định F cho sự khác biệt về phƣơng sai của
hai tổng thể
Ho: Không có sự khác biệt về phương sai của học vấn trên hai giớiKết quả: Bác bỏ Ho
5/12/2009
40
Con người –Tầm nhìn mớiCon người –Tầm nhìn mới
5/12/2009 Nguyễn Duy Tâm _ IDR 79
Kiểm định mẫu cặp: Vợ và chồng có cảm nhận khác biệt
về hạnh phúc không? Affair.xls/ Satisfaction
Ho: Vợ và chồng thỏa mãn về hôn nhân như nhau. Tools | Data Analysis… | t-test: Paired Two Sample for Means
Con người –Tầm nhìn mớiCon người –Tầm nhìn mới
5/12/2009 Nguyễn Duy Tâm _ IDR 80
Kiểm định mẫu cặp: Vợ và chồng có cảm nhận
khác biệt về hạnh phúc không?
Ho: Vợ và chồng thỏa mãn về hôn nhân như nhau. Kết quả: Chấp nhận Ho.
5/12/2009
41
Con người –Tầm nhìn mớiCon người –Tầm nhìn mới
Bài tập kiểm định cặp
Có giả định cho rằng, hiệu quả của một phương pháp quảng
cáo được tiến hành cho nhiều công ty khác nhau hiện tại
không có hiệu quả. Bằng số liệu của bài tập truoc - sau quang
cao ve doanh thu.xls, anh chị hãy kiểm định giả thiết trên
5/12/2009 Nguyễn Duy Tâm _ IDR 81
Con người –Tầm nhìn mớiCon người –Tầm nhìn mới
5/12/2009 Nguyễn Duy Tâm _ IDR 82
HÀM TTEST-Kiểm định sự khác biệt
fx/ Statistical/ TTEST Type: 1 cho mẫu cặp, 2 cho phƣơng sai bằng nhau, 3 cho
phƣơng sai khác nhau
5/12/2009
42
Con người –Tầm nhìn mớiCon người –Tầm nhìn mới
5/12/2009 Nguyễn Duy Tâm _ IDR 83
ANOVA: Vợ và chồng có có mức độ hài lòng về hôn
nhân trung bình khác nhau không?
Ho: Vợ và chồng thỏa mãn về hôn nhân như nhau. Tools/ Data Analysis/ ANOVA-Single Factor
Con người –Tầm nhìn mớiCon người –Tầm nhìn mới
5/12/2009 Nguyễn Duy Tâm _ IDR 84
ANOVA: Nam và nữ có có mức độ hài
lòng về hôn nhân khác nhau không?
Ho: Hai giới thỏa mãn về hôn nhân trung bình như nhau. Kết quả: Chấp nhận Ho
Anova: Single Factor
SUMMARY
Groups Count Sum Average Variance
WIFE 250 999 4.00 1.30
HUSBAND 250 984 3.94 1.06
ANOVA
Source of Variation SS df MS F P-value F crit
Between Groups 0.45 1.00 0.45 0.38 0.54 3.86
Within Groups 586 498 1.18
Total 586 499
5/12/2009
43
Con người –Tầm nhìn mớiCon người –Tầm nhìn mới
5/12/2009 Nguyễn Duy Tâm _ IDR 85
ANOVA một nhân tố-Ví dụ chƣơng 8 Worksheet in
Chapter8(V)
So sánh năng suất của 3 máy Ho: Năng suất của 3 máy là như nhau
Con người –Tầm nhìn mớiCon người –Tầm nhìn mới
5/12/2009 Nguyễn Duy Tâm _ IDR 86
ANOVA một nhân tố-Ví dụ chƣơng 8
Ho: Năng suất của 3 máy là như nhauKết quả kiểm định: Bác bỏ Ho
Anova: Single Factor
SUMMARY
Groups Count Sum Average Variance
Machine 1 5 124.65 24.93 1.06
Machine 2 5 113.05 22.61 0.78
Machine 3 5 102.95 20.59 0.92
ANOVA
Source of Variation SS df MS F P-value F crit
Between Groups 47.16 2 23.58 25.60 0.00 3.89
Within Groups 11.05 12 0.92
Total 58.22 14
5/12/2009
44
Con người –Tầm nhìn mớiCon người –Tầm nhìn mới
5/12/2009 Nguyễn Duy Tâm _ IDR 87
Thủ tục Tukey-Kramer
Tools/ Lumenaut Statistics/ Tukey-Kramer Test Lumenaut là một phần mềm Add-Ins miễn phí, chạy trên nền Excel.
Con người –Tầm nhìn mớiCon người –Tầm nhìn mới
5/12/2009 Nguyễn Duy Tâm _ IDR 88
Thủ tục Tukey-Kramer
Tools/ Lumenaut Statistics/ Tukey-Kramer Test
5/12/2009
45
Con người –Tầm nhìn mớiCon người –Tầm nhìn mới
5/12/2009 Nguyễn Duy Tâm _ IDR 89
Thủ tục Tukey-Kramer
Tools/ Lumenaut Statistics/ Tukey-Kramer Test
Tukey-Kramer Test
v k
Critical
Value Q MS within
9 3 3.948 0.921
MSD Values
Stack Machine 1 Machine 2 Machine 3
Machine 1 1.695 1.695
Machine 2 2.320 1.695
Machine 3 4.340 2.020
If Meani-Meanj > MSD value then pair is significantly different at the 5% level (1 Tailed)
Significant pair values are in bold and underlined in above Table
Me
an
i -Me
an
j
Con người –Tầm nhìn mớiCon người –Tầm nhìn mới
5/12/2009 Nguyễn Duy Tâm _ IDR 90
Tìm hệ số chặn và độ dốc
Hệ số chặn: fx/ Statistical/ INTERCEPT Độ dốc: fx/ Statistical/ SLOPE
5/12/2009
46
Con người –Tầm nhìn mớiCon người –Tầm nhìn mới
5/12/2009 Nguyễn Duy Tâm _ IDR 91
Tìm hệ số chặn và độ dốc
Hệ số chặn: fx/ Statistical/ INTERCEPT Độ dốc: fx/ Statistical/ SLOPE
Con người –Tầm nhìn mớiCon người –Tầm nhìn mới
5/12/2009 Nguyễn Duy Tâm _ IDR 92
Vẽ đƣờng xu hƣớng trong Chart
Click phải/ Add Trendline/
5/12/2009
47
Con người –Tầm nhìn mớiCon người –Tầm nhìn mới
5/12/2009 Nguyễn Duy Tâm _ IDR 93
Vẽ đƣờng xu hƣớng trong Chart
Type: Linear Options: Display Equation on chart
Con người –Tầm nhìn mớiCon người –Tầm nhìn mới
5/12/2009 Nguyễn Duy Tâm _ IDR 94
Vẽ đƣờng xu hƣớng trong Chart
Kết quả
y = 1.5x + 1636.4
R2 = 0.9
0
2,000
4,000
6,000
8,000
10,000
12,000
0 1,000 2,000 3,000 4,000 5,000 6,000
Footage
Sale
s Sales
Linear (Sales)
5/12/2009
48
Con người –Tầm nhìn mớiCon người –Tầm nhìn mới
5/12/2009 Nguyễn Duy Tâm _ IDR 95
Thủ tục REGRESSION
Tools/ Data Analysis/ REGRESSION
Con người –Tầm nhìn mớiCon người –Tầm nhìn mới
5/12/2009 Nguyễn Duy Tâm _ IDR 96
KẾT QUẢ
SUMMARY OUTPUT
Regression Statistics
Multiple R 0.97
R Square 0.94
Adjusted R Square 0.93
Standard Error 611.75
Observations 7
ANOVA
df SS MS F Significance F
Regression 1 30,380,456 30380456 81.18 0.00
Residual 5 1,871,200 374240
Total 6 32,251,656
Coefficients Standard Error t Stat P-value Lower 95% Upper 95%
Intercept 1,636.41 451.50 3.62 0.02 475.81 2,797.02
Footage 1.49 0.16 9.01 0.00 1.06 1.91
5/12/2009
49
Con người –Tầm nhìn mớiCon người –Tầm nhìn mới
5/12/2009 Nguyễn Duy Tâm _ IDR 97
Từ bảng kết xuất của Excel
Residuals
-2000
0
2000
4000
6000
8000
10000
12000
0 2 4 6 8
Observations
Pre
dic
ted
Sale
s a
nd
Resid
uals
Predicted Sales
Residuals
Con người –Tầm nhìn mớiCon người –Tầm nhìn mới
5/12/2009 Nguyễn Duy Tâm _ IDR 98
Phần dƣ theo biến độc lập
Footage Residual Plot
-800
-600
-400
-200
0
200
400
600
800
1000
0 1,000 2,000 3,000 4,000 5,000 6,000
Footage
Resid
uals
5/12/2009
50
Con người –Tầm nhìn mớiCon người –Tầm nhìn mới
5/12/2009 Nguyễn Duy Tâm _ IDR 99
Real and Fitted Values
Footage Line Fit Plot
y = 1.4866x + 1636.4
R2 = 1
0
2,000
4,000
6,000
8,000
10,000
12,000
0 1,000 2,000 3,000 4,000 5,000 6,000
Footage
Sale
s
Sales
Predicted Sales
Linear (PredictedSales)
Con người –Tầm nhìn mớiCon người –Tầm nhìn mới
5/12/2009 Lê Tấn Luật 100
Tools/ Data Analysis/ Regression
Hồi quy đơn: Oil theo Temp
5/12/2009
51
Con người –Tầm nhìn mớiCon người –Tầm nhìn mới
5/12/2009 Lê Tấn Luật 101
Hồi quy đơn: Oil theo Temp
SUMMARY OUTPUT
Regression Statistics
Multiple R 0.87
R Square 0.76
Adjusted R Square 0.74
Standard Error 66.51
Observations 15
ANOVA
df SS MS F Significance F
Regression 1 178624 178624 40 0.00
Residual 13 57511 4424
Total 14 236135
Coefficients Standard Error t Stat P-value Lower 95% Upper 95%
Intercept 436.43823 38.63970893 11.29507 4.3E-08 352.962214 519.914246
Temp -5.4622077 0.859608768 -6.3543 2.52E-05 -7.3192795 -3.6051359
Con người –Tầm nhìn mớiCon người –Tầm nhìn mới
5/12/2009 Lê Tấn Luật 102
Hồi quy đơn: Oil theo Insulation
SUMMARY OUTPUT
Regression Statistics
Multiple R 0.47
R Square 0.22
Adjusted R Square 0.16
Standard Error 119
Observations 15
ANOVA
df SS MS F Significance F
Regression 1 51,076 51,076 3.59 0.08
Residual 13 185,059 14,235
Total 14 236,135
Coefficients Standard Error t Stat P-value Lower 95%Upper 95%
Intercept 345.38 74.69 4.62 0.00 184.02 506.74
Insulation -20.35 10.74 -1.89 0.08 -43.56 2.86
5/12/2009
52
Con người –Tầm nhìn mớiCon người –Tầm nhìn mới
5/12/2009 Lê Tấn Luật 103
Hồi quy bội: Oil theo Temp và Insulation
Quét Known’s X: cả Temp và InsulationSUMMARY OUTPUT
Regression Statistics
Multiple R 0.98
R Square 0.97
Adjusted R Square 0.96
Standard Error 26.01
Observations 15
ANOVA
df SS MS F Significance F
Regression 2 228015 114007 168 0.00
Residual 12 8121 677
Total 14 236135
Coefficients Standard Error t Stat P-value Lower 95% Upper 95%
Intercept 562.15 21.09 26.65 0.00 516.19 608.11
Temp -5.44 0.34 -16.17 0.00 -6.17 -4.70
Insulation -20.01 2.34 -8.54 0.00 -25.12 -14.91
Con người –Tầm nhìn mớiCon người –Tầm nhìn mới
5/12/2009 Lê Tấn Luật 104
Biến Insulation có cải thiện mô hình từ Oil
= f(Temp) không?
Kết quả tính toán cho Fc = 73
5/12/2009
53
Con người –Tầm nhìn mớiCon người –Tầm nhìn mới
5/12/2009 Lê Tấn Luật 105
Tra giá trị tới hạn của F: FINV
Kết quả tính toán F* = 4.75 F =73 > F*: 4.75 Kết luận: Insulation làm
tăng mức độ giải thích của mô hình.
Con người –Tầm nhìn mớiCon người –Tầm nhìn mới
5/12/2009 Lê Tấn Luật 106
Hồi quy bậc hai: Chuẩn bị số liệu
Temp2=Tem^2Oil (Gal) Temp Temp2
275.30 40 1600
363.80 27 729
164.30 40 1600
40.80 73 5329
94.30 64 4096
230.90 34 1156
366.70 9 81
300.60 8 64
237.80 23 529
121.40 63 3969
31.40 65 4225
203.50 41 1681
441.10 21 441
323.00 38 1444
52.50 58 3364
5/12/2009
54
Con người –Tầm nhìn mớiCon người –Tầm nhìn mới
5/12/2009 Lê Tấn Luật 107
Kết quả hồi quy
SUMMARY OUTPUT
Regression Statistics
Multiple R 0.88
R Square 0.78
Adjusted R Square 0.74
Standard Error 65.71
Observations 15
ANOVA
df SS MS F Significance F
Regression 2 184,324 92,162 21 0.00
Residual 12 51,811 4,318
Total 14 236,135
Coefficients Standard Error t Stat P-value Lower 95% Upper 95%
Intercept 372.33 67.60 5.51 0.00 225.04 519.62
Temp -1.26 3.75 -0.34 0.74 -9.44 6.91
Temp2 -0.05 0.05 -1.15 0.27 -0.15 0.05
Con người –Tầm nhìn mớiCon người –Tầm nhìn mới
5/12/2009 Lê Tấn Luật 108
Hồi quy với biến giả
TC = Tổng chi phí sản xuất
Q = Tổng sản lượng
CN = 1 cho các quý đã thay đổi công nghệ, 0 cho các quý
trước khi thay đổi công nghệ.
TCN = 0 cho các quý đã thay đổi công nghệ, 1 cho các quý
trước khi thay đổi công nghệ.
5/12/2009
55
Con người –Tầm nhìn mớiCon người –Tầm nhìn mới
5/12/2009 Lê Tấn Luật 109
Sai lầm -> Đa cộng tuyến hoàn hảoSUMMARY OUTPUT
Regression Statistics
Multiple R 0.94
R Square 0.87
Adjusted R Square 0.78
Standard Error 56.65
Observations 16
ANOVA
df SS MS F Significance F
Regression 3 291,681 97,227 45 0.00
Residual 13 41,727 3,210
Total 16 333,408
Coefficients Standard Error t Stat P-value Lower 95% Upper 95%
Intercept 521.80 122.46 4.26 0.00 257.24 786.35
Q 0.81 0.10 8.04 0.00 0.59 1.03
CN 0.00 0.00 65,535.00 #NUM! 0.00 0.00
TCN 210.63 52.80 3.99 0.00 96.55 324.70
Con người –Tầm nhìn mớiCon người –Tầm nhìn mới
5/12/2009 Lê Tấn Luật 110
Hồi quy với biến giả
SUMMARY OUTPUT
Regression Statistics
Multiple R 0.94
R Square 0.87
Adjusted R Square 0.86
Standard Error 56.65
Observations 16
ANOVA
df SS MS F Significance F
Regression 2 291,681 145,841 45.44 1.36E-06
Residual 13 41,727 3,210
Total 15 333,408
Coefficients Standard Error t Stat P-value Lower 95% Upper 95%
Intercept 732.42 79.51 9.21 0.00 560.65 904.20
Q 0.81 0.10 8.04 0.00 0.59 1.03
CN -210.63 52.80 -3.99 0.00 -324.70 -96.55
5/12/2009
56
Con người –Tầm nhìn mớiCon người –Tầm nhìn mới
5/12/2009 Lê Tấn Luật 111
Hồi quy với biến tƣơng tác
CNQ = CN*QSUMMARY OUTPUT
Regression Statistics
Multiple R 0.98
R Square 0.96
Adjusted R Square0.95
Standard Error 33.19
Observations 16
ANOVA
df SS MS F Significance F
Regression 3 320190 106730 96.90 1.11913E-08
Residual 12 13218 1102
Total 15 333408
Coefficients Standard Error t Stat P-value Lower 95% Upper 95%
Intercept 401.52 80.00 5.02 0.00 227.21 575.83
Q 1.24 0.10 11.98 0.00 1.02 1.47
CN 368.96 118.05 3.13 0.01 111.75 626.17
CNQ -0.64 0.13 -5.09 0.00 -0.92 -0.37
Con người –Tầm nhìn mớiCon người –Tầm nhìn mới
5/12/2009 Lê Tấn Luật 112
Ý nghĩa của biến giả và biến tƣơng tác
TC = 401 + 1.24*Q + 368*CN – 0.64CNQP (0.00) (0.00) (0.01) (0.00)R2 = 0.96Adjusted R2= 0.95n= 16Trước thay đổi công nghệ: CN=CNQ=0TC = 401 + 1.24*Q Sau thay đổi công nghệ: CN=1, CNQ=QTC = (401+368) + (1.24-0.68)*QTC = 769 + 0.56*QVậy thay đổi công nghệ làm định phí tăng nhưng biến
phí đơn vị giảm.
5/12/2009
57
Con người –Tầm nhìn mớiCon người –Tầm nhìn mới
5/12/2009 Lê Tấn Luật 113
Hồi quy với biến chuyển dạng log-log
Mô hình tuyến tính: Q=b1+b2*L+b3*KSUMMARY OUTPUT
Regression Statistics
Multiple R 0.99
R Square 0.99
Adjusted R Square 0.99
Standard Error 1,570.36
Observations 15
ANOVA
df SS MS F Significance F
Regression 2 2686989117 1.34E+09 545 1.67092E-12
Residual 12 29592539.09 2466045
Total 14 2716581656
Coefficients Standard Error t Stat P-value Lower 95% Upper 95%
Intercept -32,375.93 3,140.85 -10.31 0.00 -39,219.24 -25,532.61
L 2.62 6.43 0.41 0.69 -11.39 16.62
K 344.47 40.87 8.43 0.00 255.43 433.51
Con người –Tầm nhìn mớiCon người –Tầm nhìn mới
5/12/2009 Lê Tấn Luật 114
Chuyển dạng log-log
Hàm sản xuất Cobb-DouglasQ = A*L
a*K
b (1)
Không thể ước lượng trực tiếp hàm (1) ln(Q) = ln(A) + a*ln(L) + b*ln(K)Y = b0 + b1*X1 + b2*X2
Với b0 = ln(A); b1= a; b2=b; X1= ln(L); X2=ln(K)Chúng ta đã chuyển về dạng mô hình hồi quy tuyến tính thông
thường
5/12/2009
58
Con người –Tầm nhìn mớiCon người –Tầm nhìn mới
5/12/2009 Lê Tấn Luật 115
Chuẩn bị số liệu log-log: Hàm ln(Number)lnQ lnL lnK
9.10 5.64 4.79
9.29 5.65 4.81
9.32 5.67 4.83
9.31 5.93 4.86
9.45 5.93 4.88
9.70 6.00 4.90
9.88 6.17 4.93
9.96 6.32 4.99
10.05 6.42 5.04
10.17 6.54 5.10
10.29 6.67 5.18
10.42 6.70 5.24
10.55 6.74 5.33
10.76 6.77 5.40
10.90 6.91 5.48
Con người –Tầm nhìn mớiCon người –Tầm nhìn mới
5/12/2009 Lê Tấn Luật 116
Kết quả hồi quy
SUMMARY OUTPUT
Regression Statistics
Multiple R 0.99
R Square 0.98
Adjusted R Square 0.97
Standard Error 0.09
Observations 15
ANOVA
df SS MS F Significance F
Regression 2 4 2 267 1.13248E-10
Residual 12 0 0
Total 14 5
Coefficients Standard Error t Stat P-value Lower 95% Upper 95%
Intercept -0.38 0.78 -0.49 0.63 -2.07 1.31
lnL 0.67 0.17 3.85 0.00 0.29 1.04
lnK 1.22 0.34 3.56 0.00 0.47 1.96