06 tvu sta301_bai4_v1.00131012140

18
Bài 4: Mô hình hi quy bi STA301_Bài 4_v1.0013101214 47 BÀI 4. MÔ HÌNH HI QUY BI Mc tiêu Sau khi kết thúc bài, hc viên shiu được nhng vn đề sau đây: Mô hình hi quy bi có 2 biến và mô hình tng quát k biến. Ý nghĩa ca các hshi quy ước l ượng. Hsxác định bi và hsxác định bi đã hiu chnh. Khong tin cy và kim định githiết cho các hshi quy. Kim định vsphù hp ca mô hình hay nh hưởng ca tt ccác biến độc lp. Dbáo trong mô hình hi quy bi. Ni dung Hướng dn hc Mô hình hi quy bi gm 2 biến độc lp. Mô hình hi quy bi gm k biến (k-1 biến độc lp). Phương pháp OLS cho mô hình hi quy bi. Hsxác định bi và hsxác định bi đã hiu chnh. Ước lượng khong tin cy và kim định githuyết cho hshi quy. Kim định vsphù hp ca mô hình hi quy. Dbáo trong mô hình hi quy bi. Đề nghhc viên ôn li phn ước lượng và kim định githiết trong môn lý thuyết xác sut và thng kê toán. Theo dõi kbài ging. Xem các ví dcho mi phn bài ging. Làm các ví dvà tr l i câu hi tr c nghi m

Transcript of 06 tvu sta301_bai4_v1.00131012140

Page 1: 06 tvu sta301_bai4_v1.00131012140

Bài 4: Mô hình hồi quy bội

STA301_Bài 4_v1.0013101214 47

BÀI 4. MÔ HÌNH HỒI QUY BỘI

Mục tiêu

Sau khi kết thúc bài, học viên sẽ hiểu được những vấn đề sau đây:

Mô hình hồi quy bội có 2 biến và mô hình tổng quát k biến.

Ý nghĩa của các hệ số hồi quy ước lượng.

Hệ số xác định bội và hệ số xác định bội đã hiệu chỉnh.

Khoảng tin cậy và kiểm định giả thiết cho các hệ số hồi quy.

Kiểm định về sự phù hợp của mô hình hay ảnh hưởng của tất cả các biến độc lập.

Dự báo trong mô hình hồi quy bội.

Nội dung Hướng dẫn học

Mô hình hồi quy bội gồm 2 biến độc lập.

Mô hình hồi quy bội gồm k biến (k-1 biến độc lập).

Phương pháp OLS cho mô hình hồi quy bội.

Hệ số xác định bội và hệ số xác định bội đã hiệu chỉnh.

Ước lượng khoảng tin cậy và kiểm định giả thuyết cho hệ số hồi quy.

Kiểm định về sự phù hợp của mô hình hồi quy.

Dự báo trong mô hình hồi quy bội.

Đề nghị học viên ôn lại phần ước lượng và kiểm định giả thiết trong môn lý thuyết xác suất và thống kê toán.

Theo dõi kỹ bài giảng.

Xem các ví dụ cho mỗi phần bài giảng.

Làm các ví dụ và trả lời câu hỏi trắc nghiệm

Page 2: 06 tvu sta301_bai4_v1.00131012140

Bài 4: Mô hình hồi quy bội

48 STA301_Bài 4_v1.0013101214

TÌNH HUỐNG DẪN NHẬP

Tình huống

Hội đồng quản trị của công ty may Đức Giang đang muốn xem xét ảnh hưởng của 2 yếu tố đầu vào của sản xuất là Vốn (V, tỉ đồng) và Lao động (L, người) lên sản lượng (SL, triệu sản phẩm) của công ty. Cụ thể, họ muốn đưa ra quyết định về việc có nên tiếp tục mở rộng sản xuất, thu hẹp lại hay giữ nguyên như hiện tại. Để tiến hành nghiên cứu này, phòng kế hoạch của công ty thu thập số liệu về vốn đầu tư, lao động sử dụng và sản lượng sản xuất ra trong 30 tháng qua tại công ty (có n = 30 quan sát). Mô hình dùng để nghiên cứu có dạng

log(SLi) = β1 + β2log(Vi) + β3log(Li)+ui

Dùng số liệu của mẫu, ước lượng được hàm hồi quy mẫu có dạng,

i i ilog(SL ) 0.424816 0.7358log(V ) 0.9489log(L ).

Câu hỏi

Vậy công ty Đức Giang nên tăng, giảm hay giữ nguyên quy mô sản xuất?

Liệu cả 2 biến vốn và lao động cùng không có ảnh hưởng đến sản lượng có đúng không?

Giả sử trong tháng tới, công ty quyết định sử dụng lượng vốn là 10 tỉ đồng và lao động là 3000 thì sản lượng dự báo là bao nhiêu?

Page 3: 06 tvu sta301_bai4_v1.00131012140

Bài 4: Mô hình hồi quy bội

STA301_Bài 4_v1.0013101214 49

Trong bài trước chúng ta đã nghiên cứu mô hình hồi quy tuyến tính đơn giản, đó là hồi quy tuyến tính đơn, trong mô hình này chúng ta đã nghiên cứu các mối quan hệ giữa một biến được giải thích là Y và một biến giải thích X. Bài này chúng ta mở rộng nghiên cứu sang mô hình hồi quy tuyến tính bội với một biến được giải thích Y và (k – 1) biến giải thích 2 kX ,...,X . Trong thực tế

mô hình hồi quy tuyến tính bội được sử dụng rộng rãi vì đối với nhiều trường hợp nó giải thích về hành vi của biến phụ thuộc (biến được giải thích) Y tốt hơn mô hình hồi quy tuyến tính đơn.

Ví dụ trong bài trước chúng ta xét mối quan hệ giữa thu nhập và chi tiêu nhưng thực tế chi tiêu không chỉ phụ thuộc vào thu nhập mà nó còn phụ thuộc vào các yếu tố khác, chẳng hạn như: niềm tin vào nền kinh tế, độ tuổi, nghề nghiệp, địa lý… Vì vậy mô hình hồi quy đơn khó giải thích được hành vi của biến phụ thuộc Y. Do đó việc mở rộng mô hình hồi quy tuyến tính bội sẽ giúp chúng ta giải thích được rõ hơn về biến phụ thuộc Y.

BÀI TOÁN

Mô hình hồi quy tuyến tính bội là mô hình nghiên cứu mối quan hệ giữa một biến phụ thuộc Y và (k – 1) biến độc lập 2 3 kX ,X ,...,X có dạng:

i 1 2 2i 3 3i k k iY X X ... X u

Trong đó i i 2i 3i kiE(u ) 0,E(u | X ,X ,...,X ) 0

i jCov u ,u 0 i j

2i i 3i i ki iCov(X ,u ) 0;Cov(X ,u ) 0;...,Cov X ,u 0

2iVar(u ) , i .

4.1. Mô hình hồi quy với hai biến giải thích

Định nghĩa: Mô hình hồi quy tổng thể (PRF) với hai biến giải thích có dạng như sau:

i 1 2 2i 3 3i iY X X u (4.1)

với Y là biến phụ thuộc; 2 3X ,X là các biến độc lập, i 2i 3iY ,X ,X là các quan sát thứ i

của 2 3Y,X ,X ; u là nhiễu ngẫu nhiên, iu là nhiễu tại quan sát thứ i; 1 là hệ số chặn

(hệ số tự do), bằng giá trị trung bình của Y khi 2 3X X 0 ; 2 3, là các hệ số hồi

quy riêng hay còn gọi là hệ số của các biến độc lập, 2 chỉ sự thay đổi của Y khi 3X

cố định và 2X tăng hoặc giảm 1 đơn vị, còn 3 chỉ sự thay đổi của Y khi 3X tăng

hoặc giảm 1 đơn vị và 2X cố định.

Trong mô hình hồi quy hai biến (4.1) ta có các giả thiết sau:

i i 2i 3iE(u ) 0,E(u | X ,X ) 0.

Các iu không tương quan, tức là

i jCov(u ,u ) 0, i j.

iu không tương quan với 2i 3iX ,X , tức là

2i i 3i iCov(X ,u ) 0;Cov(X ,u ) 0.

iu có phương sai không thay đổi, tức là: 2iVar(u ) , i.

Page 4: 06 tvu sta301_bai4_v1.00131012140

Bài 4: Mô hình hồi quy bội

50 STA301_Bài 4_v1.0013101214

4.2. Ước lượng tham số của mô hình hồi quy

Tương tự trong bài 3, bài toán đặt ra là từ các dữ liệu quan sát chúng ta cần ước lượng các hệ số hồi quy 1 2 3, , của mô hình (4.1). Phương pháp ta sẽ sử dụng sau đó chính

là phương pháp bình phương tối thiểu OLS. Hàm hồi quy mẫu (SRF) được xây dựng từ n quan sát i 2 3(Y ,X ,X ) có dạng:

i 1 2 2i 3 3iˆ ˆ ˆY X X (4.2)

Và i 1 2 2i 3 3i i i iˆ ˆ ˆ ˆˆ ˆY X X u Y u

trong đó 1 2 3ˆ ˆ ˆ, , là ước lượng của 1 2 3, , , iu là ước lượng của iu , phần dư của

quan sát thứ i. Từ (4.2) ta có:

n n 2

2i i 1 2 2i 3 3i

i 1 i 1

ˆ ˆ ˆu Y X X

(4.3)

Ta cần xác định 1 2 3ˆ ˆ ˆ, , sao cho

n2i

i 1

u trong (4.3) đạt giá trị nhỏ nhất.

Theo lý thuyết giải tích nhiều biến, ta thấy để n

2i

i 1

u đạt giá trị nhỏ nhất thì 1 2 3

ˆ ˆ ˆ, ,

phải là nghiệm của hệ phương trình

1 2 2 3 3

n n n n2

1 2i 2 2i 3 2i 3i i 2ii 1 i 1 i 1 i 1

n n n n2

1 3i 2 2i 3i 3 3i i 3ii 1 i 1 i 1 i 1

ˆ ˆ ˆX X Y

ˆ ˆ ˆX X X X Y X

ˆ ˆ ˆX X X X Y X

(4.4)

trong đó n n

2 2i 3 3ii 1 i 1

1 1X X , X X

n n

n

ii 1

1Y Y .

n

Hệ phương trình (4.4) được gọi là hệ phương trình chuẩn và phương pháp xác định

1 2 3ˆ ˆ ˆ, , như trên được gọi là phương pháp bình phương tối thiểu (OLS).

Nghiệm của phương trình (4.4) là:

1 2 2 3 3ˆ ˆ ˆY X X

n n n n2

i 2i 3i i 3i 2i 3ii 1 i 1 i 1 i 1

2 2n n n2 22i 3i 2i 3i

i 1 i 1 i 1

y x x y x x xˆ

x x x x

n n n n

2i 3i 3i i 3i 2i 3i

i 1 i 1 i 1 i 13 n n n

2 2 22i 3i 2i 3i

i 1 i 1 i 1

y x x y x x xˆ

x x ( x x )

Page 5: 06 tvu sta301_bai4_v1.00131012140

Bài 4: Mô hình hồi quy bội

STA301_Bài 4_v1.0013101214 51

223

2 3n n

2 2 223 2i 3i

i 1 i 1

rˆ ˆCov ;

1 r x x

.

với i i 2i 2i 2 3i 3i 3y Y Y, x X X , x X X .

Ta thấy rằng 2 là phương sai của iu và 2 là chưa biết. Vì vậy ta thay 2 bằng ước

lượng không chênh lệch của nó là

n2i

2 i 1

uRSS

ˆn 3 n 3

.

CHÚ Ý

2 3

2n2

2i 3i2 3 2 3 i 12

23 2 2 n n2 2X X2i 3i

i 1 i 1

x xX X X Xr

S Sx x

4.3. Phương sai và độ lệch chuẩn của các ước lượng bình phương tối thiểu

Ta đã thu được các ước lượng cho các hệ số hồi quy bằng phương pháp OLS. Để tìm các ước lượng khoảng và tiến hành kiểm định các hệ số hồi quy, ta cần xác định phương sai và độ lệch chuẩn của các ước lượng thu được trên đây.

Phương sai và độ lệch chuẩn của các ước lượng hệ số hồi quy theo phương pháp bình phương tối thiểu được cho bởi các công thức

2

2 n2 22i 23

i 1

ˆVarx 1 r

; 2 2

ˆ ˆSe Var ;

2

3 n2 23i 23

i 1

ˆVarx 1 r

; 3 3

ˆ ˆSe Var ,

với 23r là hệ số tương quan giữa 2X và 3X .

4.4. Mô hình hồi quy bội

4.4.1. Khái niệm:

Mô hình hồi quy bội là mô hình có hàm hồi quy tổng thể (PRF) gồm một biến phụ thuộc Y và k – 1 biến độc

lập 2 3 kX ,X ,...,X có dạng như sau:

i 1 2 2i 3 3i k ki iY X X ... X u (4.5)

trong đó 1 là hệ số chặn, hệ số tự do, nó cho ta biết

trung bình của Y khi 2 3 kX ,X ,...,X bằng 0.

Page 6: 06 tvu sta301_bai4_v1.00131012140

Bài 4: Mô hình hồi quy bội

52 STA301_Bài 4_v1.0013101214

j ( j 1, 2,..., k) là các hệ số hồi quy riêng, nó cho ta biết sự thay đổi của Y khi jX

thay đổi một đơn vị còn các hX h j bằng 0,

iu là các nhiễu ngẫu nhiên.

Phương trình (4.5) có thể được viết chi tiết dưới dạng hệ phương trình sau:

1 1 2 21 3 31 k k1 1

2 1 2 22 3 32 k k2 2

n 1 2 2n 3 3n k kn n

Y X X ... X u

Y X X ... X u

...............................................................

Y X X ... X u

(4.6)

Đặt

21 31 k11

22 32 k22

2n 3n knn

1 X X ... XY

1 X X ... XY

Y ; X . . . ... ..

. . . ....

1 X X XY

1 1

2 2

n n

u

u

u ;. .

. .

u

khi đó hệ phương trình (4.6) có thể viết dưới dạng phương trình ma trận

Y X u (4.7)

4.4.2. Các giả thiết cơ bản

Ta đưa ra các giả thiết cơ bản cho mô hình hồi quy nội bội như sau:

Giả thiết 1:

Ma trận ngẫu nhiên u có kỳ vọng bằng 0, tức là:

1

2

n

E u 0

E u 0

E u . .

. .

E u 0

Giả thiết 2:

Các thành phần trong ma trận u là không tương quan, tức là: i jE u u 0 i j

2i iE u u

hoặc ta có thể viết dưới dạng: T 2E uu I , với I là ma trận đơn vị cấp n.

Page 7: 06 tvu sta301_bai4_v1.00131012140

Bài 4: Mô hình hồi quy bội

STA301_Bài 4_v1.0013101214 53

Giả thiết 3: Các iu có phân bố chuẩn 2N 0, i 1, n .

Giả thiết 4: Các 2 3 kX ,X ,...,X không có quan hệ tuyến tính.

4.4.3. Ước lượng các tham số bằng OLS

Với giả thiết trên, ta cần dựa vào dữ liệu

i 2i 3i kiY ,X ,X ,...,X , i 1,n quan sát được để tìm ước

lượng véc tơ hệ số T

1 2 k, ,..., của mô hình hồi quy

bội (4.7).

Ký hiệu T

1 2 kˆ ˆ ˆ ˆ, ,..., là ước lượng của , khi đó ta có

phương trình hồi quy mẫu (SRF)

i 1 2 2i 3 3i k ki iˆ ˆ ˆ ˆ ˆY X X ... X u i 1, n .

Ta cần tìm các hệ số 1 2 kˆ ˆ ˆ, ,..., sao cho tổng các phần dư

n2i

i 1

u đạt giá trị

nhỏ nhất.

Kết quả của phương pháp giải tích cho thấy véc tơ ước lượng trên đây thỏa mãn phương trình ma trận

ˆX X X Y (4.8)

trong đó X ,Y tương ứng là các ma trận chuyển vị của X và Y . Từ giả thiết 4 dẫn

đến sự tồn tại ma trận nghịch đảo của X X và do đó

1ˆ X X X Y.

Biểu thức này được gọi là phương trình cơ bản của phương pháp OLS.

4.5. Các tính chất của ước lượng bình phương nhỏ nhất

Xét mô hình hồi quy bội

i 1 2 2i 3 3i k ki iY X X ... X u .

Giống như mô hình hồi quy đơn, mô hình hồi quy bội này có các tính chất sau:

Đường hồi quy bội đi qua điểm 2 3 kY,X ,X ,...,X .

Y Y .

n

ii 1

u 0

.

iu không tương quan với piX , p 2,3,..., k , n

i pii 1

u X 0

.

Page 8: 06 tvu sta301_bai4_v1.00131012140

Bài 4: Mô hình hồi quy bội

54 STA301_Bài 4_v1.0013101214

Các iu không tương quan với iY : n

i ii 1

ˆu Y 0

.

i là các ước lượng tuyến tính không chệch và có phương sai nhỏ nhất cho các

i i 1, k .

4.6. Hệ số xác định bội R2 và hệ số xác định hiệu chỉnh

Trong mô hình hồi quy tuyến tính đơn ta đã đưa ra hệ số xác định

2 ESS RSSr 1

TSS TSS .

Từ công thức trên ta thấy khi 2r càng lớn thì tổng bình phương sai số dự báo càng nhỏ, do đó mô hình hồi quy

càng phù hợp. Vì vậy hệ số 2r còn được dùng để đo độ phù hợp của mô hình. Tương tự cho mô hình hồi quy bội ta cũng xây dựng hệ số xác

định ký hiệu là 2R được xác định bởi công thức: 2 ESS RSSR 1

TSS TSS .

Dễ dàng chứng minh được rằng

22

2

ˆ X Y nYR

Y Y nY

. (4.9)

Từ các công thức trên có thể thấy hệ số xác định 2R có tính chất sau:

20 R 1.

Nếu 2R 1 khi đó đường hồi quy giải thích 100% sự thay đổi của Y bởi vì khi đó: n

2i

i 1

u 0

.

Nếu 2R 0 khi đó mô hình không giải thích được sự thay đổi của Y.

Nếu số biến độc lập càng tăng thì hệ số 2R càng lớn, hay nói cách khác 2R là một hàm tăng theo các biến giải thích.

Như vậy, tính phù hợp của mô hình hồi quy tăng lên khi có nhiều biến giải thích trong mô hình hơn. Tuy nhiên, người ta luôn muốn dùng một số lượng biến giải thích vừa đủ sao cho vẫn có được mô hình phù hợp mà không quá tốn kém khi phải thu thập thông tin của quá nhiều biến giải thích. Hơn nữa, nhiều khi đưa thêm một số biến độc lập vào mô hình thì tác động riêng phần của các biến độc lập đó tới biến phụ thuộc lại không thực sự có ý nghĩa thống kê. Vậy cần có tiêu chuẩn đánh giá sự phù hợp của mô hình, trong đó có cân nhắc đến số lượng biến giải thích của mô hình. Một trong số các tiêu chuẩn như vậy

là hệ số xác định hiệu chỉnh 2R của 2R , cho bằng biểu thức

Page 9: 06 tvu sta301_bai4_v1.00131012140

Bài 4: Mô hình hồi quy bội

STA301_Bài 4_v1.0013101214 55

n2i

2 i 1n

2i

i 1

u /(n k)R 1

y /(n 1)

.

trong đó n là số quan sát, k – 1 là số biến độc lập trong mô hình.

Dễ dàng thấy có mối quan hệ giữa 2R và 2R , cụ thể là:

2 2 (n 1)R 1 (1 R )

(n k)

.

Từ đó 2R có các tính chất sau:

Nếu k > 1 thì 2 2R R 1 ;

Khi số biến độc lập k –1 tăng lên thì 2R cũng tăng lên nhưng tăng chậm hơn so với 2R ;

2R 0 , nhưng 2R có thể âm. Khi 2R nhận giá trị âm thì để cho tiện, thường thì người ta gán lại cho nó giá trị bằng 0.

Trong thực hành, khi muốn đánh giá sự phù hợp của mô hình thì 2R hay được dùng

hơn so với 2R , vì nếu dùng 2R ta dễ đưa ra một hình ảnh lạc quan quá mức về sự phù hợp của mô hình, nhất là đối với các bài toán mà số lượng biến giải thích không nhỏ hơn nhiều lắm so với số lượng quan sát. Tuy nhiên, quan điểm này còn được điều

chỉnh tùy theo bài toán cụ thể. Hơn nữa, ngoài hai thống kê 2R và 2R , người ta còn dùng một số tiêu chuẩn khác để đánh giá tính phù hợp của mô hình, chẳng hạn như: quy tắc thông tin Akaike hay quy tắc dự báo Amemiya.

4.7. Quan hệ giữa hệ số xác định và tiêu chuẩn kiểm định F

Xét mô hình hồi quy bội (4.5):

i 1 2 2i 3 3i k ki iY X X ... X u , i 1, n

Mô hình được gọi là không có hiệu lực giải thích, hay nói cách khác không giải thích được sự thay đổi của biến Y, nếu toàn bộ các hệ số hồi quy riêng đều bằng 0. Vì vậy để kiểm định sức mạnh hay mức ý nghĩa của mô hình ta cần kiểm định bài toán sau:

0 2 3 k

1 i

H : ... 0

H : 0

(4.10)

Để giải quyết bài toán kiểm định trên, ta dùng tiêu chuẩn thống kê sau: 2ˆ( X Y nY ) / k

F ~ F(k 1,n k)ˆ(Y Y X Y) /(n k 1)

Khi giả thiết thống kê F có phân phối Fisher với k – 1 và n – k bậc tự do. Vậy với mức ý nghĩa ta có quy tắc kiểm định:

Nếu qsF F k 1, n k thì bác bỏ 0H .

Nếu qsF F k 1, n k thì chưa bác bỏ 0H .

Quan hệ giữa hệ số xác định 2R và thống kê F được diễn giải như sau: Từ (4.5) và (4.9), ta thấy bài toán kiểm định (4.10) tương đương với bài toán kiểm định

20

21

H : R 0

H : R 0

(4.11)

Page 10: 06 tvu sta301_bai4_v1.00131012140

Bài 4: Mô hình hồi quy bội

56 STA301_Bài 4_v1.0013101214

Mặt khác: 2

22

ˆ X Y nYR

Y Y nY

.

Do đó ta có: 2

2

R / k 1F .

(1 R ) /(n k)

Vậy thống kê F cũng là tiêu chuẩn thống kê cho bài toán kiểm định (4.11).

Ví dụ 1

Một công ty muốn mở rộng thị trường kinh doanh tại một thành phố. Trước khi quyết định mở chi nhánh tại thành phố đó, công ty đã tiến hành nghiên cứu thị trường bằng cách tiến hành quảng cáo và chào bán sản phẩm của mình từ đó xem xét khả năng tiêu thụ sản phẩm. Thu thập số liệu trong 10 tuần về số sản phẩm

bán được trong một tuần, giá sản phẩm 2X và chi phí

cho quảng cáo 3X ta có bảng số liệu sau:

Giá sản phẩm Cho phí quảng cáo Số sản phẩm bán ra/tuần

4.92 4.79 425

5.5 3.61 467

5.54 5.49 296

5.11 2.78 626

5.62 5.74 165

5.24 1.34 515

4.15 5.81 270

4.02 3.39 689

5.77 3.74 413

4.57 3.59 561

Phân tích số liệu bằng Evievs ta thu được báo cáo:

Page 11: 06 tvu sta301_bai4_v1.00131012140

Bài 4: Mô hình hồi quy bội

STA301_Bài 4_v1.0013101214 57

Dựa vào kết quả báo cáo trong Evievs ta xây dựng được mô hình hồi quy tuyến tính 3

biến chỉ sự phụ thuộc của sản phẩm bán được Y với chi phí quảng cáo 3X và giá thành sản

phẩm 2X qua biểu thức

1 2 2 3 3ˆ ˆ ˆY X X

với 1ˆ 1360.84 , 2

ˆ 110.2952 , 3ˆ 89.82406 . Ngoài ra còn có hệ số xác định

bội 2R 0.772974 , hệ số xác định hiệu chỉnh (Adjusted R-Squared) 2R 0.708110 ,

giá trị tiêu chuẩn thống kê F (F-Static) 2qsF 11.91675 . Vậy mô hình hồi quy cụ thể là:

2 3Y 1360.84 110.2952X 89.82406X .

Đối với mô hình này, ta cần đặt ra câu hỏi: Với mức ý nghĩa 0.05 thì giá bán và

chi phí quảng cáo có ảnh hưởng đến số lượng sản phẩm bán ra hay không?

Để trả lời cho câu hỏi này, ta cần kiểm định bài toán:

0 2 3

1 2 3

H : 0

H : , 0

hoặc kiểm định bài toán tương đương là:

20

21

H : R 0

H : R 0

Cả hai bài toán trên đều có thể giải quyết bằng cách sử dụng thống kê F . Ta có

qsF 11.91675 . Với n = 10, k = 2, tra bảng phân phối Fisher hoặc dùng lệnh Excel ta

tìm được phân vị 0.05F 2;7 4.77 . Rõ ràng qs 0.05F F 2;7 , vậy ta bác bỏ 0H , kết

luận giá bán của sản phẩm và chi phí cho quảng cáo có ảnh hưởng đến số lượng sản phẩm bán ra.

Hai bài toán kiểm định trên còn có thể giải quyết bằng cách so sánh xác suất ý nghĩa tương ứng với mức ý nghĩa đã định. Kết quả của Eviews cho thấy xác suất ý nghĩa của thống kê F (Prob(F-statistic)) có giá trị bằng 0.005575, nhỏ hơn 0.05, vậy có thể bác

bỏ giả thuyết 0H .

4.8. Ước lượng khoảng cho hệ số hồi quy

Giả sử trong mô hình hồi quy (4.7), véc tơ nhiễu ngẫu nhiên u có phân phối chuẩn 2N(0; ) . Khi đó ta có véc tơ hệ số hồi quy có phân phối chuẩn 12N , X X

,

các thành phần của véc tơ đó cũng có phân phối chuẩn 2i

ˆ ~ N ; , (i 1, k) , với

2 chưa biết và nó có ước lượng không chệch là:

n

2 2i

i 1

ˆ u n k .

Page 12: 06 tvu sta301_bai4_v1.00131012140

Bài 4: Mô hình hồi quy bội

58 STA301_Bài 4_v1.0013101214

Các thống kê

i i

i

ˆt

ˆSe

đều có phân phối student với (n – k) bậc tự do. Do vậy, với

độ tin cậy 1 ta có khoảng ước lượng cho i là:

n k n ki i / 2 i i i / 2

ˆ ˆ ˆ ˆse( )t se( )t ; i 1, k (4.12)

trong đó n k/ 2t

là phân vị của phân phối Student với (n – k) bậc tự do ứng với mức ý

nghĩa / 2 , giá trị này có thể thu được bằng cách tra bảng hoặc dùng lệnh thích hợp trong Excel.

Ví dụ 2: Từ dữ liệu trong ví dụ 1 hãy tìm ước lượng khoảng của hệ số hồi quy riêng với độ tin cậy 95%.

Trong bảng kết quả của Eviews ta đã có:

1ˆ 1360.84 , 2

ˆ 110.2952 ,

3ˆ 89.82406

Trong cột Std.Error ta có:

1ˆSe 258.4298 , 2

ˆSe 47.91851 , 3ˆSe 20.69356 .

Ta thấy n 10 , k 3 , 1 0.95 0.05 . Từ đó tra bảng hoặc sử dụng Excel

(dùng lệnh Tinv(0.05,7)), ta sẽ có 70.025t 2.365 . Thay các thông số tương ứng vào

(4.12), ta thu được các ước lượng khoảng của 2 và 3 lần lượt là:

2110.2952 47.91851 2.365 110.2952 47.91851 2.365

2223.622 3.032 .

389.82406 20.69365 2.365 89.82406 20.69365 2.365

3138.765 40.8836 .

4.9. Kiểm định giả thuyết cho các hệ số hồi quy

Để so sánh các hệ số hồi quy với các giá trị giả định cho trước, ta có các giả thuyết *

0 i iH : (i 1, k)

đi kèm với một trong số các đối thuyết tương ứng *1 i iH : hoặc *

1 i iH : hoặc *

1 i iH : .

Với giả thuyết về sai số ngẫu nhiên u như trong phần 4.4 ta thấy thống kê

*i i

i

i

ˆt

ˆSe

có phân phối Student với n – k bậc tự do. Dựa vào kết quả đó ta có thể giải quyết một loạt bài toán kiểm định so sánh ước lượng của các hệ số trong mô hình hồi quy tuyến tính bội như sau:

Bài toán 1: *

0 i i

*1 i i

H :

H :

Miền bác bỏ: (n k) (n k)/ 2 / 2W ( ; t ) (t ; ).

Page 13: 06 tvu sta301_bai4_v1.00131012140

Bài 4: Mô hình hồi quy bội

STA301_Bài 4_v1.0013101214 59

Bài toán 2: *

0 i i

*1 i i

H :

H :

Miền bác bỏ: (n k)W (t ; ).

Bài toán 3: *

0 i i

*1 i i

H :

H :

Miền bác bỏ: (n k)W ( ; t )

Sử dụng phần mềm Eviews chúng ta có thể tính được ngay giá trị tiêu chuẩn của thống kê it và xác suất ý nghĩa p tương ứng, từ đó có thể giải quyết bài toán theo hai

cách sau:

Cách 1:

Tìm phân vị (n k)/ 2t

và miền bác bỏ W rồi so sánh tiêu chuẩn thống kê it với W để

đưa ra kết luận.

Cách 2:

So sánh xác suất ý nghĩa p với mức ý nghĩa đã định trước như sau:

o Đối với Bài toán 1, nếu p thì bác bỏ giả thuyết 0H , còn nếu p thì

chấp nhận 0H .

o Đối với các Bài toán 2 và 3, nếu p / 2 thì bác bỏ giả thuyết 0H , còn nếu

p / 2 thì chấp nhận 0H .

Ví dụ 3: Xét số liệu trong ví dụ 1, với mức ý nghĩa 0.05 có thể cho rằng khi giá sản phẩm tăng thì doanh số bán hàng sẽ giảm không?

Ta có phương trình hồi quy:

0 2 2 3 3Y X X u .

Nếu 2 âm thì Y phụ thuộc nghịch biến với 2X , tức là 2X tăng thì Y giảm. Vậy để

trả lời cho câu hỏi trên ta cần lập bài toán kiểm định giả thuyết

0 2

1 2

H : 0

H : 0

Với kết quả của Eviews đưa ra ở phần trên, ta có:

22

2

ˆ 110.2952t 2.30172

ˆ 47.91851se( )

.

Mặt khác, với n 10,k 3, 0.05 , ta có 7(n k)0.05t t 1.895

.

Vậy miền bác bỏ của bài toán này là

W ( ; 1.895) .

Rõ ràng ta có 2t W , do đó ta có thể bác bỏ giả thuyết 0H , chấp nhận 1H và đưa ra

kết luận 2 0 .

Page 14: 06 tvu sta301_bai4_v1.00131012140

Bài 4: Mô hình hồi quy bội

60 STA301_Bài 4_v1.0013101214

Nếu giải quyết theo Cách 2 thì ta có xác suất ý nghĩa p bằng 0.0549, vậy

p / 2 0.0549 / 2 0.05 .

Do đó có thể bác bỏ giả thuyết 0H .

4.10. Dự báo cho mô hình hồi quy tuyến tính bội

Một trong những ứng dụng quan trọng của hồi quy là dự báo, bài toán đặt ra là dựa vào mô hình hồi quy hãy

dự báo giá trị của Y khi biết giá trị của X là X . Xét mô hình hồi quy

1 2 2 k kˆ ˆ ˆ ˆY X ... X X .

với 2 3 kX (1,X ,X ,...,X ) ; 1 2 3 kˆ ˆ ˆ ˆ ˆ( , , ,..., ) ' .

Cho trước giá trị của các biến độc

lập 2 3 kX X (1,X ,X ,...,X ) , khi đó giá trị dự báo

của Y là Y :

2 3 k 1 2 2 3 3 k kˆ ˆ ˆ ˆY E(Y | X , X ,..., X ) X X ... X .

Ví dụ 4: Xét số liệu trong ví dụ 1, hãy dự báo doanh số bán hàng trung bình khi giá sản phẩm là 4.5 và chi phí quảng cáo là 3.2.

Ta có:

2 3Y 1360.84 110.2952X 89.824606X .

Vậy với 2X 4.5 và 3X 3.2 , ta có:

2 3Y E Y | X 4.5,X 3.2 1360.84 110.2952 4.5 89.824606 3.2 577.07 .

Page 15: 06 tvu sta301_bai4_v1.00131012140

Bài 4: Mô hình hồi quy bội

STA301_Bài 4_v1.0013101214 61

TÓM LƯỢC CUỐI BÀI

Mô hình hồi quy bội gồm 2 biến độc lập:

Giả sử nghiên cứu sự phụ thuộc của Y vào 2 biến X2 và X3. Mô hình có dạng:

2i 3i 1 2 2i 3 3iE Y / X , X X X

hoặc i 1 2 2i 3 3i iY X X u

1 là hệ số chặn (hệ số tự do): giá trị trung bình của Y khi X2 = X3 = 0,

2 và 3 là các hệ số hồi quy riêng, chỉ sự thay đổi của trung bình của Y khi riêng X2 và X3 tăng hoặc giảm 1 đơn vị và biến còn lại cố định.

Mô hình hồi quy bội gồm k biến (k–1 biến độc lập): i 1 2 2i 3 3i k ki iY X X ... X u .

Mô hình này có 1 biến phụ thuộc và k–1 biến độc lập (k biến)

Các hệ số hồi quy riêng βj thể hiện ảnh hưởng của riêng từng biến độc lập Xj lên trung bình của Y khi các biến khác được giữ không đổi.

Phương pháp OLS cho mô hình hồi quy bội.

Trong mô hình k biến chú ý công thức sau: n

2i

2 i 1

uRSS

ˆ .n k n k

Hệ số xác định bội R2 và hệ số xác định bội đã hiệu chỉnh.

Để đo độ phù hợp của hàm hồi quy, dùng R2. Giá trị của R2 cho biết bao nhiêu % sự biến thiên của biến phụ thuộc được giải thích bởi đồng thời các biến độc lập hoặc được giải thích bởi hàm hồi quy mẫu

2 ERR RSSR 1 .

TSS n k

Vì khi đưa thêm biến độc lập vào mô hình, R2 luôn luôn tăng lên nên người ta sử dụng hệ số xác định bội đã điều chỉnh để xem xét việc có nên đưa thêm biến mới vào mô hình hay không:

2 2

2 2 2

n 1R 1 1 R

n k

R R 0 R 1

Hệ số 2R có thể âm.

Khoảng tin cậy với độ tin cậy1 cho hệ số βi là:

n k n ki i i

2 2

ˆ ˆ ˆ ˆSe t Se t i 1, k .

Khoảng tin cậy này cho biết khi Xi tăng hoặc giảm 1 đơn vị thì trung bình của biến phụ thuộc sẽ thay đổi trong khoảng nào.

Kiểm định về sự phù hợp của mô hình hồi quy

Tiêu chuẩn kiểm định:

i ii

i

ˆt

ˆSe

Page 16: 06 tvu sta301_bai4_v1.00131012140

Bài 4: Mô hình hồi quy bội

62 STA301_Bài 4_v1.0013101214

Bài toán 1: *

0 i i

*1 i i

H :

H :

Miền bác bỏ: n k n k

2 2W= ; t t ; .

Bài toán 2: *

0 i i

*1 i i

H :

H :

Miền bác bỏ: n kW= t ; .

Bài toán 3: *

0 i i

*1 i i

H :

H :

Miền bác bỏ: n kW= ; t .

Page 17: 06 tvu sta301_bai4_v1.00131012140

Bài 4: Mô hình hồi quy bội

STA301_Bài 4_v1.0013101214 63

CÂU HỎI THƯỜNG GẶP

1. Trong mô hình hồi quy bội, các giả thiết của phương pháp OLS có khác gì so với mô hình

hồi quy đơn?

2. Vai trò của các hệ số hồi quy trong mô hình hồi quy bội khác thế nào so với mô hình hồi quy đơn?

3. Hệ số xác định bội trong mô hình hồi quy bội cho biết điều gì?

4. Tại sao lại cần đưa ra khái niệm hệ số xác định bội đã điều chỉnh trong hàm hồi quy bội?

5. Khi nào thi nên đưa thêm biến độc lập mới vào mô hình nếu sử dụng hệ số xác định bội đã

điều chỉnh?

6. Khi nào thi ta cần xây dựng khoảng tin cậy cho các hệ số hồi quy?

7. Khi nào thì dùng khoảng tin cậy đối xứng, bên phải hoặc bên trái?

8. Kiểm định giả thiết về một hệ số hồi quy bằng 0 có ý nghĩa gì, kiểm định hệ số hồi quy bằng

một giá trị cụ thể có ý nghĩa gì?

9. Kiểm định F về sự phù hợp của mô hình hồi quy có ý nghĩa gì?

CÂU HỎI TRẮC NGHIỆM

1. Cho mô hình hồi quy Y = 10 – 3X1 + 2.5X2. Điều khẳng định nào sau đây đúng?

A. X2 quan trọng hơn X1 vì dấu của hệ số là dương.

B. Khi X1 giảm 3 đơn vị, Y giảm 1 đơn vị.

C. Khi X2 giảm 2.5 đơn vị, Y giảm 1 đơn vị.

D. Khi X1 giảm 1 đơn vị, Y tăng 3 đơn vị.

2. Hệ số xác định bội đã điều chỉnh liên quan tới điều chỉnh R2 qua:

A. Tổng số tham số trong mô hình hồi quy.

B. Số biến phụ thuộc trong mô hình và kích thước mẫu.

C. Số biến độc lập trong mô hình và kích thước mẫu.

D. Hệ số tương quan và mức ý nghĩa.

3. Để kiểm định sự phù hợp của hàm hồi quy một mô hình gồm 5 biến độc lập và có 30 quan

sát, bậc tự do trong giá trị phân vị F là:

A. 5 và 30 B. 6 và 29

C. 5 và 24 D. 6 và 25

4. Mô hình hồi quy có dạng 1 2 3Y 8 3X 5X 4X . Khi X3 tăng 1 đơn vị, với X1 và X2 giữ

không đổi, Y sẽ:

A. Tăng 1 đơn vị. B. Tăng 12 đơn vị.

C. Giảm 4 đơn vị. D. Giảm 16 đơn vị.

Page 18: 06 tvu sta301_bai4_v1.00131012140

Bài 4: Mô hình hồi quy bội

64 STA301_Bài 4_v1.0013101214

5. Từ mô hình hồi quy với 3 biến độc lập và có 25 quan sát, tính được R2 = 0.769. Giá trị của

hệ số xác định bội đã hiệu chỉnh là:

A. 0.385 B. 0.877

C. 0.591 D. 0.736

6. Một mô hình hồi quy bội thì có:

A. Chỉ duy nhất 1 biến độc lập. B. Chỉ duy nhất 2 biến độc lập.

C. Nhiều hơn 1 biến độc lập. D. Nhiều hơn 1 biến phụ thuộc.

7. Cho mô hình hồi quy: 1 2 3Y 2 3X 4X 5X , 1 đơn vị tăng của X1, X2 và X3 giữ không

đổi, sẽ dẫn đến:

A. Tăng 3 đơn vị của Y. B. Giảm 3 đơn vị của Y.

C. Đơn vị 8 đơn vị của Y. D. Không có lựa chọn nào ở trên.

8. Để kiểm định sự phù hợp của mô hình hồi quy có 4 biến độc lập, giả thuyết H0 là:

A. 0 2 3 4 5H : 1. B. 0 1 2 3 4 5H : .

C. 0 2 3 4 5H : 0. D. 0 1 2 3 4 5H : 0.

9. Trong mô hình hồi quy bội, giá trị của hệ số R2 nằm trong khoảng:

A. 1 và +1. B. 0 và +1.

C. 1 và 0. D. không có lựa chọn nào ở trên.

10. Để kiểm định về sự phù hợp của mô hình hồi quy bội, ta kiểm định sự bằng không của tất cả các hệ số hồi quy bằng kiểm định:

A. Kiểm định t. B. Kiểm định z.

C. Kiểm định F. D. Không có lựa chọn nào ở trên.