07 tvu sta301_bai5_v1.00131012140

14
Bài 5: Đa cng tuyến STA301_Bài 5_v1.0013101214 65 BÀI 5. ĐA CNG TUYN Mc tiêu Sau khi kế t thúc bài, hc viên s hi u được nhng vn đề sau đây: Hin tượng đa cng tuyến (ĐCT) xy ra khi nào? Phân bit ĐCT hoàn ho và không hoàn ho. Hu quca ĐCT. Phát hin ĐCT. Các bin pháp khc phc ĐCT. Ni dung Hướng dn hc ĐCT là gì? Phân bit ĐCT hoàn ho và không hoàn ho. Hu quca ĐCT. Phát hin ĐCT. Khc phc ĐCT. Đọc tài liu để được nhng ý tưởng chính. Nghe tht kbài ging ca ging viên để nm được bn cht ca hin tượng. Tp trung vào phn khái nim, các bin pháp phát hin và khc phc.

Transcript of 07 tvu sta301_bai5_v1.00131012140

Bài 5: Đa cộng tuyến

STA301_Bài 5_v1.0013101214 65

BÀI 5. ĐA CỘNG TUYẾN

Mục tiêu

Sau khi kết thúc bài, học viên sẽ hiểu được những vấn đề sau đây:

Hiện tượng đa cộng tuyến (ĐCT) xảy ra khi nào?

Phân biệt ĐCT hoàn hảo và không hoàn hảo.

Hậu quả của ĐCT.

Phát hiện ĐCT.

Các biện pháp khắc phục ĐCT.

Nội dung Hướng dẫn học

ĐCT là gì?

Phân biệt ĐCT hoàn hảo và không hoàn hảo.

Hậu quả của ĐCT.

Phát hiện ĐCT.

Khắc phục ĐCT.

Đọc tài liệu để có được những ý tưởng chính.

Nghe thật kỹ bài giảng của giảng viên để nắm được bản chất của hiện tượng.

Tập trung vào phần khái niệm, các biện pháp phát hiện và khắc phục.

Bài 5: Đa cộng tuyến

66 STA301_Bài 5_v1.0013101214

TÌNH HUỐNG DẪN NHẬP

Tình huống

Các nhà quản lí siêu thị BigC, muốn xem xét việc giảm giá mặt hàng thịt gà để kích thích tiêu dùng. Để thực hiện điều này, các nghiên cứu viên muốn dùng phương pháp Kinh tế lượng trong đó biến phụ thuộc được chọn chính là tiêu dùng của mặt hàng thịt gà của dân chúng, các biến độc lập sẽ là thu nhập của người tiêu dùng, giá của thịt gà và giá của thịt lợn là mặt hàng cạnh tranh với thịt gà tại các thời điểm quan sát.

Vấn đề đặt ra trong nghiên cứu là chọn các biến độc lập vào trong mô hình. Vì lạm phát là tình trạng chung của cả nền kinh tế nên các mặt hàng thường có tình trạng cùng tăng giá hoặc cùng giảm giá, nhất là những mặt hàng thiết yếu như thịt gà và thịt lợn. Nếu như các nhà nghiên cứu chọn cả giá thịt gà và giá thịt lợn làm biến độc lập trong mô hình, chúng sẽ có quan hệ cùng tăng hoặc cùng giảm. Vì thế khi tiến hành phân tích bằng mô hình kinh tế lượng, sẽ khó để phân tách ảnh hưởng của từng biến này lên tiêu dùng về thị gà hoặc sẽ gây ra các hậu quả về mặt kỹ thuật trong quá trình phân tích.

Câu hỏi

Vậy trong tình huống như thế này thì các nhà nghiên cứu cần có biện pháp gì?

Trong bài học sau đây, học viên sẽ được xem xét một khuyết tật của mô hình kinh tế lượng trong tình huống nêu trên, đó là đa cộng tuyến. Làm thế nào để phát hiện và khắc phục hiện tượng này khi xem xét một mô hình với nhiều biến độc lập?

Bài 5: Đa cộng tuyến

STA301_Bài 5_v1.0013101214 67

Trong bài trước chúng ta xét mô hình hồi quy bội với giả thiết

các biến giải thích iX độc lập tuyến tính với nhau. Tiếp theo đây

chúng ta sẽ xét bài toán hồi quy bội khi giả thiết về tính độc lập tuyến tính đó bị phá vỡ và sẽ đưa ra cách thức phát hiện và biện pháp khắc phục hiện tượng giả thiết đó bị vi phạm.

Trong mô hình hồi quy ở bài trước thì các hệ số hồi quy đối với một biến cụ thể là số đo tác động riêng phần của biến tương ứng khi tất cả các biến khác trong mô hình được giữ cố định. Nếu tính độc lập bị phá vỡ, tức là các biến giải thích có tương quan thì chúng ta không thể chỉ cho một biến thay đổi và giữ các biến còn lại cố định. Do vậy chúng ta không thể tách biệt sự ảnh hưởng riêng phần của một biến nào đó.

5.1. Khái niệm đa cộng tuyến

5.1.1. Đa cộng tuyến hoàn hảo

Bài toán

Các biến 2 3 kX ,X ,...,X gọi là các đa cộng tuyến hoàn hảo hay còn gọi là đa cộng

tuyến chính xác nếu tồn tại 2 k,..., không đồng thời bằng không sao cho:

2 2 3 3 k kX X ... X 0 (5.1)

5.1.2. Đa cộng tuyến không hoàn hảo (gần đa cộng tuyến)

Bài toán

Các biến 2 3 kX ,X ,...,X gọi là các đa cộng tuyến không hoàn hảo nếu tồn tại 2 k,...,

không đồng thời bằng không sao cho:

2 2 3 3 k kX X ... X v 0 (5.2)

trong đó v là sai số ngẫu nhiên.

Trong (5.2) giả sử i 0 khi đó ta biểu diễn:

32 ki 2 3 k

i i i i

vX X X ... X

(5.3)

Từ (5.3) ta thấy hiện tượng đa cộng tuyến xảy ra khi một biến là tổ hợp tuyến tính của các biến còn lại và một sai số ngẫu nhiên, hay nói cách khác là có một biến biểu diễn xấp xỉ tuyến tính qua các biến còn lại.

Một số nguyên nhân gây ra hiện tượng đa cộng tuyến:

Các biến độc lập trong mô hình có tương quan cao;

Số quan sát nhỏ hơn số biến độc lập;

Phương pháp thu thập số liệu.

5.2. Ước lượng khi có đa cộng tuyến hoàn hảo

Chúng ta sẽ thấy rằng khi có hiện tượng đa cộng tuyến hoàn hảo thì các hệ số hồi quy có thể không xác định và sai số tiêu chuẩn của chúng có thể bằng vô cùng. Để đơn giản chúng ta xét mô hình hồi quy 3 biến

Bài 5: Đa cộng tuyến

68 STA301_Bài 5_v1.0013101214

i 1 2 2i 3 3i iˆ ˆ ˆY X X u , i 1, n . (5.4)

Đặt: i i 2i 2i 2 3i 3i 3y Y Y, x X X , x X X , ta có

i 2 2i 3 3i iˆ ˆy x x u (5.5)

Trong phần hồi quy bội ta đã có các ước lượng 2 3ˆ ˆ, là:

n n n n2

i 2i 3i i 3i 2i 3ii 1 i 1 i 1 i 1

2 2n n n2 22i 3i 2i 3i

i 1 i 1 i 1

y x x y x x xˆ

x x x x

(5.6)

n n n n2

i 3i 2i i 2i 2i 3ii 1 i 1 i 1 i 1

3 2n n n2 22i 3i 2i 3i

i 1 i 1 i 1

y x x y x x xˆ

x x x x

(5.7)

Nếu có hiện tượng đa cộng tuyến hoàn hảo thì ta có:

3i 2i 3i 2iX X x x .

Thay vào biểu thức (5.6) và (5.7), ta có:

2 3

0ˆ ˆ0

(5.8)

Rõ ràng (5.8) là không xác định.Vậy trường hợp đa cộng tuyến hoàn hảo chúng ta

không ước lượng được các hệ số hồi quy riêng 2 3ˆ ˆ, cho mô hình (5.4).

5.3. Ước lượng khi có đa cộng tuyến không hoàn hảo

Trong thực tế hiếm khi xảy ra trường hợp đa cộng tuyến hoàn hảo vì các biến độc lập hiếm khi có quan hệ thực sự tuyến tính với nhau. Vì vậy nếu có hiện tượng đa cộng tuyến thì thường chỉ xảy ra hiện tượng đa cộng tuyến không hoàn hảo. Để đơn giản, ta cũng xét mô hình hồi quy 3 biến với đa cộng tuyến không hoàn hảo

i 1 2 2i 3 3i iˆ ˆ ˆY X X u , i 1, n (5.9)

với iu là các nhiễu ngẫu nhiên không tương quan với các biến độc lập. Khi đó giữa

hai biến độc lập 2 3X ,X có sự đa cộng tuyến không hoàn hảo, nghĩa là

3i 2i iX X v (5.10)

với 0 , iv là các nhiễu ngẫu nhiên không tương quan với 2iX và 3iX , tức là n

2i ii 1

X v 0

, n

3i ii 1

X v 0.

Bài 5: Đa cộng tuyến

STA301_Bài 5_v1.0013101214 69

Từ (5.10) ta cũng có: 3i 2i ix x v (5.11)

và n

2i ii 1

x v 0

, n

3i ii 1

x v 0.

Ta có ước lượng cho 2̂ là:

n n n n n n2 2 2 2

i 2i 2i i i 2i i i 2ii 1 i 1 i 1 i 1 i 1 i 1

2 2n n n n2 2 2 2 22i 2i i 2i

i 1 i 1 i 1 i 1

y x x v y x y v xˆ

x x v x

(5.12)

Tương tự ta cũng có biểu thức của 3̂ .

5.4. Hậu quả của hiện tượng đa cộng tuyến

Ta xét trường hợp mô hình có hiện tượng đa cộng tuyến không hoàn hảo, tức là biến độc lập iX có thể

xấp xỉ tuyến tính theo các biến 2 3 kX ,X ,...,X . Đối với

mô hình hồi quy 3 biến thì 3X có thể xấp xỉ theo 2X ,

nghĩa là hệ số tương quan riêng 23r có giá trị tuyệt đối

xấp xỉ 1.

Trong chương mô hình hồi quy bội ta đã có biểu thức:

2

2 n2 22i 23

i 1

ˆVarx 1 r

(5.13)

2

3 n2 23i 23

i 1

ˆVarx 1 r

(5.14)

đồng thời với độ tin cậy 95% ta có khoảng ước lượng cho 2 3, là :

i i i i iˆ ˆ ˆ ˆ1.96Se ; 1.96Se (5.15)

với i iˆ ˆSe Var , i 2,3 .

Ta thấy rằng khi 23r xấp xỉ 1 thì:

Phương sai 2ˆVar , 3

ˆVar gần với ;

Khoảng ước lượng của 2 3, lớn, hay nói cách khác là khoảng ước lượng tiến tới

, . Vì vậy ước lượng hệ số trở lên khó có hiệu lực, tức là không có ý nghĩa,

vì khoảng ước lượng quá lớn.

Để kiểm định giả thuyết 0 iH : 0 , i 2,3 , ta dùng các tiêu chuẩn thống kê

ii

i

ˆt

ˆse( )

, i 2,3 .

Bài 5: Đa cộng tuyến

70 STA301_Bài 5_v1.0013101214

Tuy nhiên, cả hai thống kê này đều tiến dần tới 0 do iˆSe( ) , vì vậy khả năng

chấp nhận giả thuyết 0H sẽ rất lớn. Điều này mâu thuẫn với thực tế vì rõ ràng mức

tiêu dùng nội địa phụ thuộc vào các nguồn thu 2 3X ,X .

5.5. Phát hiện hiện tượng đa cộng tuyến

Ta đã thấy hậu quả của hiện tượng đa cộng tuyến trong mô hình hồi quy. Vì vậy vấn đề quan trọng là làm thế nào để phát hiện ra hiện tượng đa cộng tuyến và biện pháp khắc phục ra sao.

Một số quy tắc để phát hiện ra hiện tượng đa cộng tuyến:

Hệ số xác định 2R lớn nhưng giá trị của thống kê t lại nhỏ: Khi thấy trong mô

hình hồi quy có hệ số xác định 2R khá cao ( 2R > 0.8) nhưng các giá trị thống kê

it thấp và xác suất ý nghĩa tương ứng tương đối cao thì có thể kết luận đã có hiện

tượng đa cộng tuyến.

Hệ số tương quan giữa các biến độc lập có giá trị tuyệt đối lớn: Ta có thể tính các

hệ số tương quan ijr giữa các biến độc lập. Nếu ijr khá gần 1 thì kết luận có hiện

tượng đa cộng tuyến.

Ta xét ví dụ sau:

Ví dụ 1: Trong nghiên cứu của Klein và Golberger (1985) về mối quan hệ giữa tiêu

dùng nội địa Y, thu nhập từ lương 2X , thu nhập khác phi nông nghiệp 3X , thu nhập từ

nông nghiệp 4X của kinh tế Mỹ từ năm 1928 đến 1950, các số liệu năm 1942 và 1944

bị khuyết. Klein và Golberger thực hiện mô hình hồi quy của tiêu dùng nội địa Y theo

3 loại thu nhập 2 3 4X ,X ,X .

Năm Y X2 X3 X4

1928 52.8 39.21 17.73 4.39

1929 62.2 42.31 20.29 4.60

1930 58.6 40.37 18.83 3.25

1931 56.6 39.15 17.44 2.61

1932 51.6 34.00 14.76 1.67

1933 51.1 33.59 13.39 2.44

1934 54 36.88 13.93 2.39

1935 57.2 39.27 14.67 5.00

CHÚ Ý Nếu trong mô hình có hiện tượng đa cộng tuyến thì mô hình hồi quy không giải thích được mối quan hệ giữa các biến..

Bài 5: Đa cộng tuyến

STA301_Bài 5_v1.0013101214 71

1936 62.8 45.51 17.20 3.93

1937 65 46.06 17.15 5.48

1938 63.9 44.16 15.92 4.37

1939 67.5 47.68 17.59 4.51

1940 71.3 50.79 18.49 4.90

1941 76.6 57.78 19.18 6.37

1945 86.3 78.97 19.12 8.42

1946 95.7 73.54 19.76 9.27

1947 98.3 74.92 17.55 8.87

1948 100.3 74.01 19.17 9.30

1949 103.2 75.51 20.20 6.95

1950 108.9 80.97 22.12 7.15

Ta có mô hình hồi quy: 1 2 2 3 3 4 4ˆ ˆ ˆ ˆY X X X .

Rõ ràng giữa các biến thu nhập 2 3 4X ,X ,X có hiện tượng đa cộng tuyến vì khi kinh tế

tăng trưởng thì các loại thu nhập 2 3 4X ,X ,X cũng tăng.

Thực hiện các thủ tục tương ứng của phần mềm Eviews ta thu được kết quả trong bảng sau:

Theo kết quả trong bảng trên ta có mô hình ước lượng được như sau:

2 3 4Y 7.304002 1.135052X 0.4053X 0.405888X .

Bài 5: Đa cộng tuyến

72 STA301_Bài 5_v1.0013101214

Rõ ràng hệ số xác định của mô hình 2R 0.954028 là khá cao, trong khi đó các thống

kê it của các hệ số hồi quy 3 và 4 có giá trị rất thấp, cụ thể là 3t 0.628347,

4t 0.367274 với các xác suất ý nghĩa tương ứng bằng 0.5386 và 0.7182, do đó ta

phải chấp nhận các giả thuyết: 0 iH : 0 , i 3, 4 .

5.6. Biện pháp khắc phục hiện tượng đa cộng tuyến

Trong phần trước chúng ta đã thấy được hậu quả của hiện tượng đa cộng tuyến trong mô hình hồi quy và cách phát hiện hiện tượng đa cộng tuyến. Phần này đưa ra các biện pháp khắc phục.

Sử dụng thông tin tiên nghiệm

Mấu chốt của hiện tượng đa cộng tuyến là thông tin mẫu vì vậy một trong những biện pháp khắc phục là sử dụng thông tin tiên nghiệm (là các thông tin đã biết từ trước về mô hình) hoặc thông tin bên ngoài để ước lượng các hệ số hồi quy.

Ta xét ví dụ sau :

Thiết lập một phương trình sản xuất của một quá trình sản xuất ta có phương trình :

32 iui 1 i iY L K e (5.16)

trong đó iY là lượng sản phẩm được sản xuất ở thời kỳ thứ i, iL là lượng lao động

ở thời kỳ thứ i, iK là nguồn vốn có được trong thời kỳ thứ i, iU là nhiễu ngẫu

nhiên, 1 2 3, , là các hằng số cần ước lượng. Lấy lôgarit 2 vế của (5.16) ta có:

i 1 2 i 3 i iln Y ln ln L ln K u (5.17)

Đặt: * * *i i i i i iY ln Y ;L ln L ;K ln K , khi đó phương trình (5.16) chuyển thành

* * *i 1 2 i 3 i iY ln L K u (5.18)

Nếu tương quan giữa K và L cao, tức là có hiện tượng đa cộng tuyến, khi đó phương sai của các

ước lượng 2 3, sẽ lớn. Tuy nhiên, nếu ta lại

biết được từ nguồn thông tin bên ngoài là ngành sản xuất này có quy mô không đổi, tức là

2 3 const (chẳng hạn 2 3 1 ), thì khi

đó ta có:

* * *i 1 2 i 2 i iY ln L 1 K u

* * *1 2 i i i iln L K K u ,

* * * *i i 1 2 i i iY K ln L K u . (5.19)

Bài 5: Đa cộng tuyến

STA301_Bài 5_v1.0013101214 73

Đặt: ** * *i i iY Y K ; ** * *

i i iX L K , khi đó phương trình (5.16) được đưa về

** **i 1 2 i iY ln X u (5.20)

Rõ ràng (5.20) là phương trình hồi quy đơn, do đó ta có thể ước lượng được các hệ

số 1 2ln , và từ đó tính được ước lượng của 3 .

Loại bỏ biến đa cộng tuyến

Biện pháp bỏ biến trong mô hình đa cộng tuyến là biện pháp đơn giản nhất. Ta thấy rằng hiện tượng đa cộng tuyến xảy ra khi biến độc lập nào đó có biểu diễn tuyến tính hoặc gần tuyến tính qua các biến độc lập khác. Vì thế ta hãy loại biến đó ra khỏi mô hình, nhưng vấn đề đặt ra là không chỉ có một biến biểu diễn tuyến tính qua các biến khác mà có nhiều biến như vậy. Vì vậy ta cần dựa vào một số quy tắc để quyết định bỏ biến nào trong số các biến độc lập của mô hình. Hai quy tắc thường được áp dụng trước tiên khi gặp phải hiện tượng đa cộng tuyến là khảo sát hệ số tương quan cặp giữa các biến độc lập và sử dụng các mô hình hồi quy phụ. Cụ thể:

o Khi giữa hai biến độc lập nào đó có mối tương quan tuyến tính mạnh (hệ số tương quan giữa hai biến có giá trị tuyệt đối rất gần 1), ta có thể dựa vào ý nghĩa thực tế để cân nhắc loại bỏ một trong hai biến đó ra khỏi phương trình hồi quy.

o Các mô hình hồi quy phụ với một biến độc lập nào đó được hồi quy theo các biến độc lập còn lại có thể được sử dụng để xác định biến cần loại bỏ khỏi mô hình. Nếu hệ số xác định của mô hình hồi quy phụ có giá trị lớn (trên 80% chẳng hạn), ta có thể khẳng định biến được giải thích trong mô hình hồi quy phụ được xấp xỉ tuyến tính qua các biến độc lập còn lại, do đó có thể bị loại ra khỏi danh sách các biến độc lập của mô hình hồi quy chính.

Sử dụng sai phân cấp 1

Khi số liệu có cấu trúc chuỗi thời gian, ta có thể sử dụng phương pháp sai phân để giảm bớt tính đa cộng tuyến trong số liệu, chẳng hạn xét mô hình hồi quy 3 biến

t 1 2 2t 3 3t tY X X u (5.21)

trong đó t là chỉ số quan sát theo các thời điểm cách đều nhau. Giả sử giữa hai biến

độc lập 2tX và 3tX có hiện tượng cộng tuyến. Để giảm tính đa cộng tuyến ta có

thể sử dụng phương pháp sai phân như sau: Phương trình (5.13) cũng đúng với giai đoạn t-1, tức là:

t 1 1 2 2t 1 3 3t 1 t 1Y X X u (5.22)

Trừ (5.21) và (5.22) cho nhau, ta nhận được

t t 1 2 2t 2t 1 3 3t 3t 1 t t 1Y Y X X X X u u

Đặt:

t t t 1Y Y Y ;

2t 2t 2t 1X X X ;

Bài 5: Đa cộng tuyến

74 STA301_Bài 5_v1.0013101214

3t 3t 3t 1X X X ;

t t t 1U u u .

ta có: t 2 2t 3 3t tY X X u (5.23)

Mô hình (5.23) có thể khắc phục được hiện tượng đa cộng tuyến giữa các biến độc lập. Tuy nhiên giải pháp này có thể làm nảy sinh một vấn đề là sai số

ngẫu nhiên tu có thể không thỏa mãn giả thiết

của mô hình hồi quy là không tương quan với nhau. Vì vậy biện pháp này có thể gây ra hậu quả nghiêm trọng hơn.

Tăng quan sát :

Hiện tượng đa cộng tuyến có thể xuất hiện do cỡ mẫu nhỏ. Vì vậy chúng ta có thể tăng thêm số quan sát đủ lớn. Nhưng chúng ta biết rằng khi tăng thêm số quan sát thì chúng ta lại phải tăng thêm chi phí cũng như thời gian lấy mẫu.

Ví dụ 2: Thông tin về chi phí tiêu dùng Y, thu nhập 2X và tiền tích lũy 3X ta có bảng số

liệu sau :

Y 70 65 90 95 110 115 120 140 155 150

2X 80 100 120 140 160 180 200 220 240 260

3X 810 1009 1273 1425 1633 1876 2052 2201 2435 2686

Dùng thủ tục hồi quy của Eviews ta thu được phương trình hồi quy

i 2i 3iY 24.7747 0.941537X 0.042435X (5.24)

với các sai sô tiêu chuẩn

1ˆSe 6.7525;

2ˆSe 0.822898;

3ˆSe 0.808664 .

và giá trị của các thống kê

1 2 3t 3.668972, t 1.144172, t 0.526062

2 2R 0.963504, R 0.953077.

Ta thấy rằng hệ số xác định 2R của mô hình rất gần 1, trong khi đó thống kê t3 lại có giá trị rất gần 0, tương ứng với xác suất ý nghĩa khá lớn. Vậy hiện tượng đa cộng tuyến xảy ra trong mô hình này.

Bài 5: Đa cộng tuyến

STA301_Bài 5_v1.0013101214 75

Để tìm cách khắc phục hiện tượng đa cộng tuyến, ta xét mô hình hồi quy phụ của 2X

theo 3X , chạy thủ tục của Eviews thu được kết quả:

2 3X 0.368271 0.09792X u

2t 62.04047 , 22R 0.997926 .

Vậy ta thấy tương quan của 2X và 3X khá lớn. Điều này một mặt khẳng định một lần

nữa sự có mặt của hiện tượng đa cộng tuyến, mặt khác cũng gợi ý việc loại bỏ bớt biến độc lập ra khỏi mô hình là một giải pháp xử lý hiện tượng đa cộng tuyến.

Ta xét mô hình hồi quy sau khi lần lượt loại các biến độc lập 2 3X ,X ra khỏi mô hình:

Khi loại 2X ta có

Bài 5: Đa cộng tuyến

76 STA301_Bài 5_v1.0013101214

i 3iY 24.41104 0.049764X

1 1ˆSe 6.874097, t 3.551164

3 3ˆSe 0.003744, t 13.29166

2 21 1R 0.956679,R 0.951264

Loại 3X , ta có:

i 2iY 24.45455 0.509091X

1 1ˆSe 6.413817, t 3.812791

2 2ˆSe 0.035743, t 14.24317

2 22 2R 0.962062,R 0.957319 .

Ta thấy 2 21 2R R nên bỏ biến 3X ra khỏi mô hình là hợp lý.

Bài 5: Đa cộng tuyến

STA301_Bài 5_v1.0013101214 77

TÓM LƯỢC CUỐI BÀI

ĐCT là gì?

Mô hình nhiều biến độc lập:

i 1 2 2i k kiE(Y X ) X ... X (k 3)

Các biến độc lập có quan hệ cộng tuyến (ví dụ có quan hệ bậc nhất với nhau thì) mô hình có hiện tượng đa cộng tuyến (multicollinearity).

Phân biệt ĐCT hoàn hảo và không hoàn hảo

Xét mô hình: 1 2 2 3 3Y X X u.

Đa cộng tuyến hoàn hảo: nếu 2 3X X .

Đa cộng tuyến không hoàn hảo: nếu 2 3X X v.

Hậu quả của ĐCT

Ước lượng OLS khi có hiện tượng đa cộng tuyến cao:

Vẫn là ước lượng tuyến tính không chệch tốt nhất trong lớp các ước lượng tuyến tính không chệch.Tuy nhiên nó không tốt, như sau:

o Phương sai của các ước lượng lớn => Độ chính xác thấp.

o Khoảng tin cậy thường rộng.

o Tỷ số t thường nhỏ => Các hệ số không có ý nghĩa nhưng R2 vẫn lớn.

o Dấu hệ số ước lượng có thể sai.

Phát hiện ĐCT:

Dựa trên kết quả hồi quy; một số dấu hiệu sau đây có thể cho biết có ĐCT trong mô hình:

o R2 cao nhưng tỉ số t lại thấp (nhiều biến độc lập không có ý nghĩa.

o Dấu của hệ số ước lượng có thể sai so với kì vọng ban đầu.

o Hệ số tương quan riêng giữa các biến độc lập cao.

Các biện pháp khắc phục ĐCT:

o Thêm thông tin.

o Sử dụng thông tin tiên nghiệm.

o Bỏ bớt biến.

o Nếu không quá nghiêm trọng thì không cần khắc phục.

Bài 5: Đa cộng tuyến

78 STA301_Bài 5_v1.0013101214

CÂU HỎI THƯỜNG GẶP

1. Trong mô hình hồi quy đơn có xảy ra hiện tượng đa cộng tuyến hay không ?

2. Trong 2 loại đa cộng tuyến hoàn hảo và không hoàn hảo, loại nào thường gặp hơn trong thực tế và vì sao?

3. Có phải khi nào ta cũng có đa cộng tuyến trong mô hình hồi quy bội vì giữa các biến kinh tế thường tồn tại một quan hệ nào đó?

4. Các hậu quả của đa cộng tuyến gần hoàn hảo được thể hiện thế nào?

5. Đa cộng tuyến xảy ra có ảnh hưởng gì đến tính chất của các ước lượng của các hệ số hồi quy?

6. Có thể nhận biết được đa cộng tuyến xảy ra mà không cần thực hiện các kiểm định?

7. Khi thực hiện hồi quy phụ để phát hiện ra đa cộng tuyến, có nhất thiết phải thành lập tất cả các hàm hồi quy phụ có thể không?

8. Trong các biện pháp khắc phục đa cộng tuyến thì biện pháp nào phổ biến?

CÂU HỎI TRẮC NGHIỆM

1. Khi các biến độc lập tương quan với nhau trong mô hình hồi quy bội, hiện tượng này gọi là:

A. Phương sai của sai số thay đổi. B. Phương sai của sai số không đổi.

C. Đa cộng tuyến. D. Tự tương quan.

2. Nếu có đa cộng tuyến thì:

A. Khó phân tách ảnh hưởng của từng biến độc lập lên biến phụ thuộc.

B. Sai số tiêu chuẩn của các hệ số hồi quy lớn.

C. Các giá trị t quan sát trong kiểm định t nhỏ.

D. Tất cả các điều trên đều đúng.

3. Điều nào sau đây là đúng đối với đa cộng tuyến:

A. Nó xảy ra ở hầu hết các mô hình hồi quy bội.

B. Hầu hết đa cộng tuyến là không hoàn hảo hoặc gần hoàn hảo.

C. Là hiện tượng khi các biến độc lập tương quan với nhau.

D. Tất cả các điều trên là đúng.

4. Các phương pháp có thể dùng để khắc phụ đa cộng tuyến là:

A. Dùng phương trình sai phân cấp 1. B. Dùng thông tin tiên nghiệm.

C. Dùng cách bỏ biến. D. Các cách ở trên đều đúng.

5. Đa cộng tuyến có thể được phát hiện bằng các cách sau đây trừ:

A. Dùng hàm hồi quy phụ.

B. Dùng dấu hiệu nhận biết trong kết quả hồi quy.

C. Dùng đồ thị các phần dư.

D. Dùng ma trận hệ số tương quan của các biến độc lập.