B A I T A P T O N G H O P

31
BÀI TẬP KINH TẾ LƯỢNG MÔ HÌNH HỒI QUI BỘI Câu 1: Dữ liệu về nền kinh tế Maxico từ năm 1955-1972 trong Table 8-8 trong bộ dữ liệu của Gujarati với các định nghĩa biến như sau: GDP Employment = số lao động CAPITAL = Vốn Với mức ý nghĩa 5%, các anh/chị hãy: a) Viết phương trình hồi qui tổng thể và phân tích mối quan hệ giữa kỳ vọng của GDP với các biến khác trong dữ liệu. b) Ước lượng mô hình hồi qui đa biến bằng Eview. c) Với mô hình ước lượng ở câu b, các anh/chị hãy thực hiện kiểm định từng tham số và cho biết những biến nào không ảnh hưởng đến biến phụ thuộc GDP. d) Anh/chị hãy thực hiện lại bằng phép kiểm định Wald và cho biết các biến độc lập ở câu c có đồng thời không ảnh hưởng biến phụ thuộc không? e) Xây dựng mô hình theo phương pháp từ phức tạp đến đơn giản và cho biết mô hình nào là mô hình tối ưu. Vì sao? (có các kiểm định cần thiết) f) Giải thích ý nghĩa của mô hình tối ưu. Câu 2: Xem xét dữ liệu về tiêu dùng thịt gà ở Mỹ giai đọan 1960 đến 1982 được trình bày trong file Table 7.9 thuộc bộ dữ liệu của Gujarati. Trong đó: Y = lượng thịt gà tiêu thụ bình quân đầu người (pound)

Transcript of B A I T A P T O N G H O P

BÀI TẬP KINH TẾ LƯỢNG

MÔ HÌNH HỒI QUI BỘI

Câu 1:

Dữ liệu về nền kinh tế Maxico từ năm 1955-1972 trong Table 8-8 trong bộ dữ liệu của Gujarati với các định nghĩa biến như sau:

GDP

Employment = số lao động

CAPITAL = Vốn

Với mức ý nghĩa 5%, các anh/chị hãy:

a) Viết phương trình hồi qui tổng thể và phân tích mối quan hệ giữa kỳ vọng của GDP với các biến khác trong dữ liệu.

b) Ước lượng mô hình hồi qui đa biến bằng Eview.

c) Với mô hình ước lượng ở câu b, các anh/chị hãy thực hiện kiểm định từng tham số và cho biết những biến nào không ảnh hưởng đến biến phụ thuộc GDP.

d) Anh/chị hãy thực hiện lại bằng phép kiểm định Wald và cho biết các biến độc lập ở câu c có đồng thời không ảnh hưởng biến phụ thuộc không?

e) Xây dựng mô hình theo phương pháp từ phức tạp đến đơn giản và cho biết mô hình nào là mô hình tối ưu. Vì sao? (có các kiểm định cần thiết)

f) Giải thích ý nghĩa của mô hình tối ưu.

Câu 2:

Xem xét dữ liệu về tiêu dùng thịt gà ở Mỹ giai đọan 1960 đến 1982 được trình bày trong file Table 7.9 thuộc bộ dữ liệu của Gujarati. Trong đó:

Y = lượng thịt gà tiêu thụ bình quân đầu người (pound)

X2 = thu nhập khả dụng bình quân đầu người (USD)

X3 = Giá bán lẻ của thịt gà (cent/pound)

X4 = Giá bán lẻ của thịt bò (cent/pound)

X5 = Giá bán lẻ của thịt heo (cent/pound)

X6 = Giá bán lẻ bình quân có trọng số của thịt bò và thịt heo (cent/pound)

Với mức ý nghĩa 10%, các anh/chị hãy:

a) Viết phương trình hồi qui tổng thể và phân tích mối quan hệ giữa kỳ vọng của lượng thịt gà tiêu thụ bình quân đầu người với các biến khác trong dữ liệu.

b) Ước lượng mô hình hồi qui đa biến bằng Eview.

c) Với mô hình ước lượng ở câu b, các anh/chị hãy thực hiện kiểm định từng tham số và cho biết những biến nào không ảnh hưởng đến biến phụ thuộc lượng thịt gà tiêu thụ bình quân đầu người.

d) Anh/chị hãy thực hiện lại bằng phép kiểm định Wald và cho biết các biến độc lập ở câu c có đồng thời không ảnh hưởng biến phụ thuộc không?

e) Xây dựng mô hình theo phương pháp từ phức tạp đến đơn giản và cho biết mô hình nào là mô hình tối ưu. Vì sao? (có các kiểm định cần thiết)

f) Giải thích ý nghĩa của mô hình tối ưu.

Câu 3:

Dữ liệu trong Data 4-9 trong bộ dữ liệu của Ramanathan với các định nghĩa biến như sau:

DEP Độ sâu (m)

HLTH Chiều cao (m)

MPUBAS Vận tốc nước vào (m3/giây)

MSSEC Vận tốc nước ra (m3/giây)

RACE Giá thành đơn vị (đ/m3)

RETRD Chiều rộng (m)

UNEMP Kích thước vòi nước (mm)

Với mức ý nghĩa 5%, các anh/chị hãy:

a) Viết phương trình hồi qui tổng thể và phân tích mối quan hệ giữa kỳ vọng của Vận tốc nước ra với các biến khác trong dữ liệu.

b) Ước lượng mô hình hồi qui đa biến bằng Eview.

c) Với mô hình ước lượng ở câu b, các anh/chị hãy thực hiện kiểm định từng tham số và cho biết những biến nào không ảnh hưởng đến biến phụ thuộc MSSEC.

d) Anh/chị hãy thực hiện lại bằng phép kiểm định Wald và cho biết các biến độc lập ở câu c có đồng thời không ảnh hưởng biến phụ thuộc không?

e) Xây dựng mô hình theo phương pháp từ phức tạp đến đơn giản và cho biết mô hình nào là mô hình tối ưu. Vì sao? (có các kiểm định cần thiết)

f) Giải thích ý nghĩa của mô hình tối ưu.

Câu 4:

Dữ liệu trong Data 4-8 trong bộ dữ liệu của Ramanathan với các định nghĩa biến như sau:

sub = số đăng ký thuê bao được yêu cầu lắp đặt cho mỗi hệ thống cáp truyền hình (1000 khách hàng

home = số hộ gia đình mà mỗi hệ thống cáp truyền hình đi ngang qua (ngàn hộ)

inst = phí lắp đặt (đô la/ lần)

svc = phí dịch vụ cho mỗi hệ thống (đô la/tháng)

tv = số kênh truyền hình mà mỗi hệ thống cáp cung cấp (kênh/hệ thống cáp)

age = thời gian hệ thống đã hoạt động (năm)

air = số kênh truyền hình mà hộ gia đình nhận được từ hệ thống cáp

y = thu nhập bình quân đầu người (đô la/người)

Với mức ý nghĩa 10%, các anh/chị hãy:

a) Viết phương trình hồi qui tổng thể và phân tích mối quan hệ giữa kỳ vọng của số đăng ký thuê bao (sub) với các biến khác trong dữ liệu.

b) Ước lượng mô hình hồi qui đa biến bằng Eview.

c) Với mô hình ước lượng ở câu b, các anh/chị hãy thực hiện kiểm định từng tham số và cho biết những biến nào không ảnh hưởng đến biến phụ thuộc sub.

d) Anh/chị hãy thực hiện lại bằng phép kiểm định Wald và cho biết các biến độc lập ở câu c có đồng thời không ảnh hưởng biến phụ thuộc không?

e) Xây dựng mô hình theo phương pháp từ phức tạp đến đơn giản và cho biết mô hình nào là mô hình tối ưu. Vì sao? (có các kiểm định cần thiết)

f) Giải thích ý nghĩa của mô hình tối ưu.

Câu 5:

Xem xét dữ liệu về tiêu dùng thịt gà ở Mỹ giai đọan 1960 đến 1982 được trình bày trong file Table 7.9 thuộc bộ dữ liệu của Gujarati. Trong đó:

Y = lượng thịt gà tiêu thụ bình quân đầu người (pound)

X2 = thu nhập khả dụng bình quân đầu người (USD)

X3 = Giá bán lẻ của thịt gà (cent/pound)

X4 = Giá bán lẻ của thịt bò (cent/pound)

X5 = Giá bán lẻ của thịt heo (cent/pound)

X6 = Giá bán lẻ bình quân có trọng số của thịt bò và thịt heo (cent/pound)

Các anh/chị hãy:

a) Xây dựng mô hình theo phương pháp từ phức tạp đến đơn giản và cho biết mô hình nào là mô hình tối ưu. Giải thích quá trình thực hiện và các kiểm định cần thiết. (=5%)

b) Giải thích ý nghĩa các tham số của mô hình phù hợp nhất

Câu 6:

Xem xét dữ liệu về các yếu tố ảnh hưởng đền giá nhà trong file Data7-3 thuộc bộ dữ liệu Ramanathan. Trong đó:

Price = giá nhà

Baths = số phòng tắm

Bedrms = số phòng ngủ

Famroom = nhận giá trị 1 nếu nhà có phòng gia đình và giá trị 0 cho trường hợp ngược lại

Firepl = nhận giá trị 1 nếu nhà có phòng thiết bị báo cháy và giá trị 0 cho trường hợp ngược lại

Pool = nhận giá trị 1 nếu nhà có hồ bơi và giá trị 0 cho trường hợp ngược lại

Sqft = diện tích nhà

Các anh/chị hãy:

a) Xây dựng các mô hình sau theo phương pháp từ phức tạp đến đơn giản và cho biết mô hình nào là mô hình tối ưu (xem xét các mô hình tổng quát dưới đây). Giải thích quá trình thực hiện và các kiểm định cần thiết. (=5%)

1. Price = 1 + 2 Baths + 3Bedrms + 4Famroom + 5 Firepl + 6Pool + 7Sqft

2. Price = 1 + 2 Baths + 3Bedrms + 4Famroom + 5 Firepl + 6Pool + 7Sqft + 8 Firepl* Sqft

3. Price = 1 + 2 Baths + 3Bedrms + 4Famroom + 5 Firepl + 6Pool + 7Sqft + 8Famroom* Bedrms

4. Price = 1 + 2 Baths + 3Bedrms + 4Famroom + 5 Firepl + 6Pool + 7Sqft + 8Pool*Sqft

5. Price = 1 + 2 Baths + 3Bedrms + 4Famroom + 5 Firepl + 6Pool + 7Sqft + 8Famroom* Bedrms + 9 Firepl* Sqft + 10Pool*Sqft + 11Firepl*Bedrms+ 10Pool*Baths

b) Giải thích ý nghĩa các tham số của mô hình phù hợp nhất

BIẾN GIẢ VÀ ĐA CỘNG TUYẾN

Câu 7:

Nghiên cứu các yếu tố ảnh hưởng tiền lương (theo dữ liệu trong file Data7-2 thuộc bộ dữ liệu Ramanathan).

Trong đó:

WAGE = Thu nhập hằng tháng (triệu đồng/ tháng)

EXPER = Số năm kinh nghiệm

EDUC = Số năm đi học

AGE = tuổi (năm)

GENDER = Giới tính (mang giá trị 1 nếu là nam)

CLERICAL = Làm việc trong văn phòng (mang giá trị 1 nếu làm việc trong văn phòng)

a) Trước khi chạy hồi qui anh/chị hãy dự báo mối quan hệ của các biến EXPER, EDUC và AGE, GENDER, CLERICAL với biến WAGE. Lý giải sự lựa chọn của mình

b) Hãy xây dựng mô hình tuyến tính và ước lượng các hệ số trong mô hình.

Thực hiện tiếp các hồi qui sau:

EXPER = A1 + A2AGE + ui

EDUC = B1 + B2AGE + ui

Dựa trên các kết quả hồi quy có được, anh/ chị nhận xét gì về mức độ đa cộng tuyến trong bộ dữ liệu? Giải thích sự nhận xét của mình

Giải sử trong mô hình ban đầu có hiện tượng đa cộng tuyến nhưng các tham số đều có ý nghĩa về mặt thống kê ở mức ý nghĩa 5% và thống kê F cũng có ý nghĩa. Trong trường hợp này, chúng ta có nên lo lắng về hiện tượng đa cộng tuyến không?

Thực hiện tiếp việc xây dựng mô hình từ tổng quát đến đơn giản. Giải thích ý nghĩa của mô hình tối ưu.

c) Một sinh viên cho rằng nên bổ sung thêm biến chéo vào. Dạng mô hình đề nghị như sau :

WAGE = 1 + 2EXPER+ 3EDUC + 4AGE + 5GENDER +6CLERICAL + 7GENDER*EXPER +8GENDER*EDUC +12GENDER*AGE +9CLERICAL*EDUC + 10CLERICAL*EXPER + 11CLERICAL*AGE + ui

Chưa chạy mô hình, theo anh chị các biến chéo như vậy có phù hợp không? Tại sao? (giải thích ý nghĩa từng mô hình)

Hãy tìm các tham số của mô hình theo phương pháp xây dựng mô hình từ phức tạp đến đơn giản

d) Trong tất cả các mô hình tối ưu đã tính được ở trên, theo anh/chị mô hình nào phù hợp nhất để giải thích các yếu tố ảnh hưởng đến WAGE

e) Nếu anh, chị là người phải quyết định làm sao để tăng thu nhập bình quân hằng tháng của người dân. Dựa vào mô hình Anh/Chị sẽ giải quyết vấn đề trên như thế nào (xếp thứ tự ưu tiên từng phương án và giải thích lý do)

Câu 8:

Một sinh viên nghiên cứu mối quan hệ giữa số lượng tủ lạnh tiêu thụ (FRIG) theo giá bán trung bình hằng năm (DUR) và mùa (theo dữ liệu trong file table9.4.txt thuộc bộ dữ liệu của Gujarati).

Trong đó:

FRIG = số lượng tủ lạnh tiêu thụ

DUR = giá bán bình quân (USD)

D2 = Nhận giá trị 1 đối mùa hè và 0 cho các mùa còn lại

D3 = Nhận giá trị 1 đối mùa thu và 0 cho các mùa còn lại

D4 = Nhận giá trị 1 đối mùa đông và 0 cho các mùa còn lại

Mô hình tổng quát có dạng như sau:

FRIG = 1 + 2DUR + 3D2 + 4D3 + 5D4+ ui

a) Trước khi chạy hồi qui anh/chị hãy dự báo dấu kỳ vọng của 2, 3, 4, 5. Lý giải sự lựa chọn của mình

b) Hãy ước lượng các hệ số trong mô hình theo mô hình từ tổng quát đến đơn giản. Giải thích ý nghĩa của mô hình tối ưu.

c) Một sinh viên khác cho rằng mô hình phải như sau:

FRIG = 1 + 2DUR + 3D2 + 4D3 + 5D4 + 6D2*DUR + 7D3*DUR + 8D4*DUR + ui

Anh chị ước lượng các tham số trong mô hình này và cho nhận xét.

d) Có ý kiến cho rằng mô hình tại câu c bị đa cộng tuyến. Anh/chị hãy kiểm tra mô hình trên có bị đa cộng tuyến không? Giải thích và đưa các minh chứng cần thiết. Nếu mô hình bị đa cộng tuyến, anh/ chị hãy đưa ra cách giải quyết hợp lý.

e) Theo các anh chị trong 2 mô hình trên mô hình nào phù hợp hơn.

Câu 9:

Một sinh viên nghiên cứu mối quan hệ giữa tiền tiết kiệm trung bình hằng năm của Mỹ và thu nhập cũng như đảng cầm quyền (theo dữ liệu trong file table9.2.txt thuộc bộ dữ liệu của Gujarati).

Trong đó:

SAVINGS = Tiền tiết kiệm hằng năm của Mỹ (ngàn USD)

INCOME = Thu nhập hằng năm của Mỹ (ngàn USD)

DUM = Nhận giá trị 1 đối với đảng cầm quyền là Đảng Dân chủ và 0 cho Đảng Cộng hòa

Mô hình tổng quát có dạng như sau:

SAVINGS = 1 + 2INCOME + 3DUM + ui

a) Trước khi chạy hồi qui anh/chị hãy dự báo dấu kỳ vọng của 2, 3. Lý giải sự lựa chọn của mình

b) Hãy ước lượng các hệ số trong mô hình theo mô hình từ tổng quát đến đơn giản. Giải thích ý nghĩa của mô hình tối ưu.

c) Một sinh viên khác cho rằng mô hình tiền tiết kiệm phải như sau:

SAVINGS = 1 + 2INCOME + 3DUM + 4DUM*IBCOME +ui

Anh chị ước lượng các tham số trong mô hình này và cho nhận xét.

d) Theo các anh chị trong 2 mô hình trên mô hình nào phù hợp hơn

Câu 10:

Xem xét dữ liệu về các yếu tố ảnh hưởng đền giá nhà trong fike Data7-3 thuộc bộ dữ liệu Ramanathan. Trong đó:

Price = giá nhà

Baths = số phòng tắm

Bedrms = số phòng ngủ

Famroom = nhận giá trị 1 nếu nhà có phòng gia đình và giá trị 0 cho trường hợp ngược lại

Firepl = nhận giá trị 1 nếu nhà có phòng thiết bị báo cháy và giá trị 0 cho trường hợp ngược lại

Pool = nhận giá trị 1 nếu nhà có hồ bơi và giá trị 0 cho trường hợp ngược lại

Sqft = diện tích nhà

Các anh/chị hãy:

a) Phân tích mối quan hệ giữa kỳ vọng của giá nhà với các biến khác trong các mô hình sau:

1. Price = 1 + 2 Baths + 3Bedrms + 4Famroom + 5 Firepl + 6Pool + 7Sqft

2. Price = 1 + 2 Baths + 3Bedrms + 4Famroom + 5 Firepl + 6Pool + 7Sqft + 8Pool*Sqft

3. Price = 1 + 2 Baths + 3Bedrms + 4Famroom + 5 Firepl + 6Pool + 7Sqft + 8Famroom*Bedrms + 9Firepl*Sqft + 10Pool*Sqft + 11Firepl*Bedrms+ 12Pool*Baths

b) Ước lượng mô hình hồi qui đa biến bằng Eview. Anh/ chị hãy phân tích những dấu hiệu nào cho thấy mô hình tổng quát bị đa cộng tuyến/ đa cộng tuyến hoàn hảo

c) Một bạn sinh viên cho rằng mô hình trên bị đa cộng tuyến là do các quan hệ sau:

4. Sqft = 1 + 2Baths + 3Bedrms + 2Pool

5. Baths = 1 + 2Bedrms + 2Pool

Theo anh/ chị suy nghĩ trên của bạn sinh viên đó có đúng không? Tại sao? Nếu đúng anh/chị hãy chạy các mô hình hồi quy liên quan và cho biết kết luận.

d) Xây dựng mô hình theo phương pháp từ phức tạp đến đơn giản và cho biết mô hình nào là mô hình tối ưu. Vì sao? (có các kiểm định cần thiết)

e) Giải thích ý nghĩa của mô hình tối ưu. Với mô hình đó theo các anh chị, còn hiện tượng đa cộng tuyến hay không?

Câu 11:

Một sinh viên nghiên cứu các yếu tố ảnh hưởng tiền lương (theo dữ liệu trong file Data7-3 thuộc bộ dữ liệu Ramanathan).

Trong đó:

WAGE = TIền lương hằng tháng (triệu đồng/ tháng)

RACE = dân tộc: mang giá trị bằng 1 nếu dân tộc kinh và bằng 0 với những người là các dân tộc còn lại

MAINT = Dịch vụ cộng thêm (mang giá trị 1 nếu có được ăn trưa, trợ cấp tiền xe… và giá trị 0 cho trường hợp còn lại).

GENDER = Giới tính (mang giá trị 1 nếu là nam)

EXPER = Số năm kinh nghiệm

EDUC = Số năm đi học

CRAFTS = Nghề thủ công (mang giá trị 1 nếu công việc liên quan đến nghề thủ công và 0 cho các nghề còn lại)

CLERICAL = Văn phòng (mang giá trị 1 nếu làm việc trong văn phòng và bằng 0 cho các giá trị còn lại).

AGE = tuổi (năm)

Mô hình tổng quát có dạng như sau:

WAGE = 1 + 2EXPER+ 3EDUC + 4AGE + 5RACE + 6MAINT + 7GENDER +8CRAFTS +9CLERICAL + ui

a) Trước khi chạy hồi qui anh/chị hãy dự báo dấu kỳ vọng của các tham số. Lý giải sự lựa chọn của mình

b) Hãy ước lượng các hệ số trong mô hình theo mô hình từ tổng quát đến đơn giản. Giải thích ý nghĩa của mô hình tối ưu.

Sinh viên Hoa cho rằng mô hình tiền lương phải như sau:

WAGE = 1 + 2EXPER+ 3EDUC + 4AGE + 5GENDER +6CRAFTS + 7CLERICAL + 8GENDER*EXPER +9GENDER*EDUC +10CLERICAL*EDUC + 11CLERICAL*EXPER + 12CLERICAL*AGE + 13CRAFTS*EDUC + 14CRAFTS*EXPER + 15 CRAFTS*AGE + ui

c) Nhưng sinh viên Thu lại cho rằng mô hình của Hoa đưa ra chắc chắn bị đa cộng tuyến. Nếu là Thu, Anh/chị hãy chứng minh câu phát biểu trên.

d) Hoa phản đối cho rằng mô hình ban đầu của đề bài cho (ở câu 1) cũng bị đa cộng tuyến. Anh chị hãy cho biết trong 2 người Thu và Hoa ai đúng, ai sai? Tại sao? (đưa các chứng minh cần thiết).

e) Anh chị hãy xây dựng mô hình hồi quy do Hoa đề nghị theo phương pháp từ phức tạp đến đơn giản. Và giải thích ý nghĩa của mô hình tối ưu.

f) Nhằm giải hòa, Tuấn đưa ra phương án cho rằng cứ lập ma trận tương quan gồm tất cả các biến trong mô hình ban đầu và các biến chéo do Hoa đề nghị sau đó thực hiện chạy hồi quy với tất cả các biến trên, rồi sẽ tìm cách giải quyết đa cộng tuyến. Theo anh/ chị suy nghĩ trên của Tuấn có đúng không? Tại sao? Anh/ chị hãy dùng Eview để chạy mô hình Tuấn đề nghị để xem kết quả như thế nào? Giải thích ý nghĩa mô hình tìm được

g) Trong các mô hình tối ưu tìm được ở các câu trên. Theo anh/chị mô hình nào phù hợp nhất. Tại sao?

Câu 12:

Một sinh viên nghiên cứu mối quan hệ giữa thu nhập trung bình của các giáo viên ở Mỹ và chi phí bỏ ra cho việc đi học cũng như bằng cấp của họ đạt được (theo dữ liệu trong file table9.1.txt thuộc bộ dữ liệu của Gujarati).

Trong đó:

SALARY = Thu nhập trung bình của các giáo viên (USD/tháng)

SPENDING = Chi phí học tập nâng cao kiến thức (USD/năm)

D1= Nhận giá trị 1 đối với những người đã tốt nghiệp đại học và 0 cho giá trị ngược lại

D2= Nhận giá trị 1 đối với những người đã tốt nghiệp cao học và 0 cho giá trị ngược lại.

Mô hình tổng quát có dạng như sau:

SALARY = 1 + 2SPENDING + 3D1 + 4D2 + ui

a) Trước khi chạy hồi qui anh/chị hãy dự báo dấu kỳ vọng của 2, 3 và 4. Lý giải sự lựa chọn của mình

b) Hãy ước lượng các hệ số trong mô hình theo mô hình từ tổng quát đến đơn giản. Giải thích ý nghĩa của mô hình tối ưu.

c) Một sinh viên cho rằng sự khác biệt về lương của các đối tượng có các bằng tốt nghiệp đại học và cao học có thể do chi phí học tập nâng cao kiến thức tác động lên. Anh chị hãy đề nghị mô hình tổng quát chạy hồi qui ước lượng các tham số trong mô hình này và cho nhận xét.

Câu 13:

Xem xét dữ liệu về tiêu dùng thịt gà ở Mỹ giai đọan 1960 đến 1982 được trình bày trong file Table 7.9 thuộc bộ dữ liệu của Gujarati (hoặc file chicken demand). Trong đó:

Y = lượng thịt gà tiêu thụ bình quân đầu người (pound)

X2 = thu nhập khả dụng bình quân đầu người (USD)

X3 = Giá bán lẻ của thịt gà (cent/pound)

X4 = Giá bán lẻ của thịt bò (cent/pound)

X5 = Giá bán lẻ của thịt heo (cent/pound)

X6 = Giá bán lẻ bình quân có trọng số của thịt bò và thịt heo (cent/pound)

Với mức ý nghĩa 5%, các anh/chị hãy:

a) Viết phương trình hồi qui tổng thể và phân tích mối quan hệ giữa kỳ vọng của lượng thịt gà tiêu thụ bình quân đầu người với các biến khác trong dữ liệu.

b) Ước lượng mô hình hồi qui đa biến bằng Eview. Anh/ chị hãy phân tích những dấu hiệu nào cho thấy mô hình tổng quát bị đa cộng tuyến

c) Một bạn sinh viên cho rằng mô hình trên bị đa cộng tuyến là do các quan hệ sau:

Giá bán lẻ của thịt bò và giá bán lẻ của thịt heo sẽ ảnh hưởng đến Giá bán lẻ bình quân có trọng số của thịt bò và thịt heo.

Thu nhập khả dụng bình quân đầu người ảnh hưởng đến giá bán lẻ từng loại thịt (gà, bò, heo)

Theo anh/ chị suy nghĩ trên của bạn sinh viên đó có đúng không? Tại sao? Nếu đúng anh/chị hãy chạy các mô hình hồi quy liên quan và cho biết kết luận.

d) Xây dựng mô hình theo phương pháp từ phức tạp đến đơn giản và cho biết mô hình nào là mô hình tối ưu. Vì sao? (có các kiểm định cần thiết)

e) Giải thích ý nghĩa của mô hình tối ưu. Với mô hình đó theo các anh chị, còn hiện tượng đa cộng tuyến hay không?

ĐA CỘNG TUYẾN VÀ DẠNG HÀM

Câu 14:

Cho mô hình nhập khẩu của Hoa Kỳ giai đoạn 1970-1998 như sau:

Ln Importst = 1 + 2 ln GDPt + 3 ln CPIt + ut

(theo dữ liệu trong file T10-12.txt thuộc bộ dữ liệu của Gujarati).

Trong đó:

Inmpost = Giá trị nhập khẩu của Hoa Kỳ

GDP = Tổng sản phẩm quốc nội của Hoa Kỳ

CPI = Chỉ số giá tiêu dùng tại Hoa Kỳ

a) Trước khi chạy hồi qui anh/chị hãy dự báo dấu kỳ vọng của 2 và 3. Lý giải sự lựa chọn của mình.

b) Hãy ước lượng các hệ số trong mô hình.

c) Từ kết quả trên anh/chị có nghi ngờ có sự đa cộng tuyến trong mô hình không? Tại sao?.

d) Thực hiện tiếp các hồi qui sau:

Ln Importst = A1 + A2 ln GDPt

Ln Importst = B1 + B2 ln CPIt

Ln GDPt = C1 + C2 ln CPIt

Dựa trên các kết quả hồi quy có được, anh/ chị nhận xét gì về mức độ đa cộng tuyến trong bộ dữ liệu? Giải thích sự nhận xét của mình

e) Giải sử trong mô hình ban đầu (mô hình Ln Importst = 1 + 2 ln GDPt + 3 ln CPIt + ut có hiện tượng đa cộng tuyến nhưng 2 và 3 đều có ý nghĩa về mặt thống kê ở mức ý nghĩa 5% và thống kê F cũng có ý nghĩa. Trong trường hợp này, chúng ta có nên lo lắng về hiện tượng đa cộng tuyến không?

Câu 15:

Xem xét dữ liệu trong file Table7.3 thuộc bộ dữ liệu Gujarati. Trong đó:

Y = GDP thực hằng năm của khu vực nông nghiệp Đài Loan (triệu USD)

X2 = Số ngày lao động hằng năm của khu vực nông nghiệp Đài Loan (triệu ngày công lao động)

X3 = Vốn thực hằng năm của khu vực nông nghiệp Đài Loan (triệu USD)

Các anh/chị hãy:

a) Ước lượng hàm Cobb-Douglas có dạng Y=AX22X3

3eui.

b) Hãy giải thích các hệ số ước lượng 1, 2, 3 theo ý nghĩa kinh tế

c) Khu vực nông nghiệp Đài Loan có phát triển hiệu quả không? Giải thích vì sao anh/chị lại có nhận định như vậy. Ngoài những lý do phát triển do vốn và lao động các anh chị còn có giả thiết nào về các nguyên nhân khác tác động đến sự phát triển của khu vực nông nghiệp không ?

Câu 16:

Cho dữ liệu sản xuất của nền kinh tế Mexico từ năm 1955 đến năm 1974 (theo dữ liệu trong file T14.3.txt thuộc bộ dữ liệu của Gujarati).

Trong đó:

GDP = Tổng sản phẩm quốc nội (nghìn USD)

LABOR = Số lao động (nghìn người)

CAPITAL = Tổng nguồn vốn đầu tư (nghìn USD)

a) Trước khi chạy hồi qui anh/chị hãy dự báo mối quan hệ của các biến LABOR và CAPITAL với biến GDP. Lý giải sự lựa chọn của mình

b) Hãy xây dựng mô hình tuyến tính và ước lượng các hệ số trong mô hình.

Từ kết quả trên anh/chị có nghi ngờ có hiện tượng đa cộng tuyến trong mô hình không? Tại sao?

Thực hiện tiếp các hồi qui sau:

1. GDPi = A1 + A2 LABORi + ui

2. GDPi = B1 + B2 CAPITALi + ui

3. CAPITALi = C1 + C2 LABORi + ui

Dựa trên các kết quả hồi quy có được, anh/ chị nhận xét gì về mức độ đa cộng tuyến trong bộ dữ liệu? Giải thích sự nhận xét của mình

Giải sử trong mô hình tuyến tính ban đầu có hiện tượng đa cộng tuyến nhưng các tham số thống kê đều có ý nghĩa về mặt thống kê ở mức ý nghĩa 5% và thống kê F cũng có ý nghĩa. Trong trường hợp này, chúng ta có nên lo lắng về hiện tượng đa cộng tuyến không?

Giải thích ý nghĩa của các mô hình tối ưu.

c) Xây dựng lại bằng mô hình đa thức sau :

GDPi = 1 + 2 LABORi + 3 CAPITALi + 4(LABORi)2 + 4 (CAPITALi)2 + ui

Giải thích ý nghĩa của các mô hình tối ưu.

d) Có một bạn sinh viên cho rằng đây là mô hình Cobb-Douglas

Anh/chị hãy viết phương trình tổng thể của hàm Cobb-Douglas

Anh/ chị hãy ước lượng các tham số của mô hình trên.

Giải thích ý nghĩa của các mô hình tối ưu.

e) Một sinh viên cho rằng nên bổ sung thêm biến thời gian vào. Dạng mô hình đề nghị là một trong các mô hình sau :

GDPi = 1 + 2 LABORi + 3 CAPITALi + 4t + ut

GDPi = 1 + 2 LABORi + 3 CAPITALi + 4t + 5t2 + ut

Ln(GDPi) = 1 + 2 ln(LABORi) + 3 ln(CAPITALi) + 4t + ut

Ln(GDPi) = 1 + 2 ln(LABORi) + 3 ln(CAPITALi)+4ln(t) + ut

Anh/ chị hãy cho biết mô hình nào có ý nghĩa về mặt kinh tế? Tại sao?

f) Trong tất cả các mô hình tối ưu đã tính được ở trên. Anh/ chị hãy cho biết mô hình nào phù hợp nhất.

Câu 17:

Nghiên cứu các yếu tố ảnh hưởng tiền lương (theo dữ liệu trong file Data7-2 thuộc bộ dữ liệu Ramanathan).

Trong đó:

WAGE = Tiền lương hằng tháng (triệu đồng/ tháng)

EXPER = Số năm kinh nghiệm

EDUC = Số năm đi học

AGE = tuổi (năm)

GENDER = Giới tính (mang giá trị 1 nếu là nam)

a) Trước khi chạy hồi qui anh/chị hãy dự báo mối quan hệ của các biến EXPER, EDUC và AGE, GENDER với biến WAGE. Lý giải sự lựa chọn của mình

b) Hãy xây dựng mô hình tuyến tính và ước lượng các hệ số trong mô hình. Giải thích ý nghĩa của mô hình tối ưu.

c) Xây dựng lại bằng mô hình đa thức sau :

WAGEi = 1 + 2EXPER + 3(EXPER)2 + 4EDUC + 5AGE + 6(AGE)2 + ui

Giải thích ý nghĩa của mô hình tối ưu.

Anh/ chị hãy ước lượng các tham số của mô hình trên. Từ kết quả trên anh/chị có nghi ngờ có sự đa cộng tuyến trong mô hình không? Tại sao?

Thực hiện tiếp các hồi qui sau:

EXPER = A1 + A2AGE + ui

EDUC = B1 + B2AGE + ui

Dựa trên các kết quả hồi quy có được, anh/ chị nhận xét gì về mức độ đa cộng tuyến trong bộ dữ liệu? Giải thích sự nhận xét của mình

Giải sử trong mô hình ban đầu có hiện tượng đa cộng tuyến nhưng các tham số đều có ý nghĩa về mặt thống kê ở mức ý nghĩa 5% và thống kê F cũng có ý nghĩa. Trong trường hợp này, chúng ta có nên lo lắng về hiện tượng đa cộng tuyến không?

d) Anh/ chị hãy chạy hồi quy lại với mô hình log kép:

Ln WAGEi = 1 + 2 ln EXPER + 3 ln EDUC + 4 ln AGE + ut

Giải thích ý nghĩa của mô hình tối ưu.

e) Một sinh viên cho rằng nên bổ sung thêm biến giới tính (GENDER) vào. Dạng mô hình đề nghị là một trong các mô hình sau :

WAGEi = 1 + 2EXPER + 3EDUC + 4AGE + 5GENDER + ui

WAGEi = 1 + 2EXPER + 3EDUC + 4AGE + 5GENDER + 5(GENDER)2 +ui

Ln(WAGE) = 1 + 2 ln(EXPER) + 3 ln(EDUC) + 4 ln(AGE)+5GENDER + ut

Ln(WAGE) = 1 + 2 ln(EXPER) + 3 ln(EDUC) + 4 ln(AGE)+5 ln(GENDER) + ut

Anh/ chị hãy cho biết mô hình nào có ý nghĩa về mặt kinh tế? Tại sao?

f) Trong tất cả các mô hình tối ưu đã tính được ở trên, theo anh/chị mô hình nào phù hợp nhất để giải thích mối quan hệ của biến WAGE

Câu 18:

Cho mô hình đầu tư của 4 tập đoàn của Mỹ từ năm 1935 -1954 (theo dữ liệu trong file table 16.1.txt thuộc bộ dữ liệu của Gujarati).

Trong đó:

Y = Đầu tư ròng (tỷ USD)

X2 = Giá trị của doanh nghiệp (tỷ USD)

X3 = Vốn của doanh nghiệp(tỷ USD)

a) Trước khi chạy hồi qui anh/chị hãy dự báo mối quan hệ của các biến X2 và X3 với biến Y. Lý giải sự lựa chọn của mình

b) Hãy xây dựng mô hình tuyến tính và ước lượng các hệ số trong mô hình. Giải thích ý nghĩa của các mô hình tối ưu.

c) Xây dựng lại bằng mô hình đa thức sau :

Yi = 1 + 2X2 + 3X3+ 4(X2)2 +5(X3)2 + ui

d) Anh/ chị hãy chạy hồi quy lại với mô hình log kép:

Ln Yi = 1 + 2 ln X2 + 3 ln X3 + ut

Anh/ chị hãy ước lượng các tham số của mô hình trên. Từ kết quả trên anh/chị có nghi ngờ có sự đa cộng tuyến trong mô hình không? Tại sao?

Thực hiện tiếp các hồi qui sau:

Ln Yi = A1 + A2 ln X2 + ut

Ln Yi = B1 + B3 ln X3 + ut

Ln X2 = C1 + C3 ln X3 + ut

Dựa trên các kết quả hồi quy có được, anh/ chị nhận xét gì về mức độ đa cộng tuyến trong bộ dữ liệu? Giải thích sự nhận xét của mình

Giải sử trong mô hình ban đầu (mô hình Ln Yi = 1 + 2 ln X2 + 3 ln X3 + ut có hiện tượng đa cộng tuyến nhưng 2 và 3 đều có ý nghĩa về mặt thống kê ở mức ý nghĩa 5% và thống kê F cũng có ý nghĩa. Trong trường hợp này, chúng ta có nên lo lắng về hiện tượng đa cộng tuyến không?

e) Một sinh viên cho rằng nên bổ sung thêm biến thời gian vào. Dạng mô hình đề nghị là một trong các mô hình sau :

Yi = 1 + 2 X2 + 3 X3 +4t + ut

Yi = 1 + 2 X2 + 3 X3 +4t + 4t2 + ut

Ln(Yi) = 1 + 2 ln(X2) + 3 ln(X3)+4t + ut

Ln(Yi) = 1 + 2 ln(X2) + 3 ln(X3)+4ln(t) + ut

Anh/ chị hãy cho biết mô hình nào có ý nghĩa về mặt kinh tế? Tại sao?

f) Nếu có ý kiến cho rằng thương hiệu của doanh nghiệp có ảnh hưởng đến đầu tư ròng. Anh/ chị hãy gợi ý các mô hình cho ý kiến trên. Và thực hiện việc ước lượng và kiểm định cần thiết cho mô hình đề nghị.

g) Trong tất cả các mô hình tối ưu đã tính được ở trên. Anh/ chị hãy cho biết mô hình nào phù hợp nhất.

Câu 19:

Cho mô hình nhập khẩu của Hoa Kỳ giai đoạn 1970-1998 (theo dữ liệu trong file T10-12.txt thuộc bộ dữ liệu của Gujarati).

Trong đó:

Inmpost = Giá trị nhập khẩu của Hoa Kỳ

GDP = Tổng sản phẩm quốc nội của Hoa Kỳ

CPI = Chỉ số giá tiêu dùng tại Hoa Kỳ

a) Trước khi chạy hồi qui anh/chị hãy dự báo mối quan hệ của các biến GDP và CPI với biến Impost. Lý giải sự lựa chọn của mình

b) Hãy xây dựng mô hình tuyến tính và ước lượng các hệ số trong mô hình. Giải thích ý nghĩa của các mô hình tối ưu.

c) Xây dựng lại bằng mô hình đa thức sau :

Importst = 1 + 2 GDPt + 3 CPIt +4(CPIt)2 + ut

d) Anh/ chị hãy chạy hồi quy lại với mô hình log kep sẽ phù hơp hơn :

Ln Importst = 1 + 2 ln GDPt + 3 ln CPIt + ut

Anh/ chị hãy ước lượng các tham số của mô hình trên. Từ kết quả trên anh/chị có nghi ngờ có sự đa cộng tuyến trong mô hình không? Tại sao?

Thực hiện tiếp các hồi qui sau:

Ln Importst = A1 + A2 ln GDPt

Ln Importst = B1 + B2 ln CPIt

Ln GDPt = C1 + C2 ln CPIt

Dựa trên các kết quả hồi quy có được, anh/ chị nhận xét gì về mức độ đa cộng tuyến trong bộ dữ liệu? Giải thích sự nhận xét của mình

Giải sử trong mô hình ban đầu (mô hình Ln Importst = 1 + 2 ln GDPt + 3 ln CPIt

+ ut có hiện tượng đa cộng tuyến nhưng 2 và 3 đều có ý nghĩa về mặt thống kê ở mức ý nghĩa 5% và thống kê F cũng có ý nghĩa. Trong trường hợp này, chúng ta có nên lo lắng về hiện tượng đa cộng tuyến không?

e) Một sinh viên cho rằng nên bổ sung thêm biến thời gian vào. Dạng mô hình đề nghị là một trong các mô hình sau :

Importst = 1 + 2 GDPt + 3 CPIt +4t + ut

Importst = 1 + 2 GDPt + 3 CPIt +4t + 4t2 + ut

Ln(Importst) = 1 + 2 ln(GDPt) + 3 ln(CPIt)+4t + ut

Ln(Importst) = 1 + 2 ln(GDPt) + 3 ln(CPIt)+4ln(t) + ut

Anh/ chị hãy cho biết mô hình nào có ý nghĩa về mặt kinh tế? Tại sao?

f) Trong tất cả các mô hình tối ưu đã tính được ở trên. Anh/ chị hãy cho biết mô hình nào phù hợp nhất.

DẠNG HÀM VÀ PHƯƠNG SAI THAY ĐỔI

Câu 20:

Dữ liệu trong Data 4-8 trong bộ dữ liệu của Ramanathan với các định nghĩa biến như sau:

sub = số đăng ký thuê bao được yêu cầu lắp đặt cho mỗi hệ thống cáp truyền hình (1000 khách hàng

home = số hộ gia đình mà mỗi hệ thống cáp truyền hình đi ngang qua (ngàn hộ)

inst = phí lắp đặt (đô la/ lần)

svc = phí dịch vụ cho mỗi hệ thống (đô la/tháng)

tv = số kênh truyền hình mà mỗi hệ thống cáp cung cấp (kênh/hệ thống cáp)

age = thời gian hệ thống đã hoạt động (năm)

air = số kênh truyền hình mà hộ gia đình nhận được từ hệ thống cáp

y = thu nhập bình quân đầu người (đô la/người)

Với mức ý nghĩa 10%, các anh/chị hãy:

a) Hãy phân tích mối quan hệ giữa kỳ vọng của số đăng ký thuê bao (sub) với các biến khác trong dữ liệu.

b) Ước lượng mô hình kinh tế lượng theo mô hình tuyến tính. Nhận xét mô hình

c) Trong mô hình trên có hiện tượng phương sai thay đổi không? Tại sao? (chỉ dùng kiểm định White). Nếu có hãy khắc phục bằng phương pháp bình phương có trọng số

d) Có ý kiến cho rằng mô hình ở câu a nên bổ sung thêm các biến độc lập là bình phương các biến độc lập trong mô hình ở câu b. Anh/ chị hãy ước lượng thử xem mô hình này có tốt hơn mô hình ở câu b không? Giải thích các tác động biên của mô hình này.

e) Nếu thay các mô hình trên bằng mô hình Log kép thì mô hình có bị hiện tượng đa cộng tuyến hoặc hiện tượng phương sai thay đổi không? Giải thích ý nghĩa của mô hình mới.

f) Làm lại câu e với mô hình bán log

g) Trong các mô hình trên mô hình nào là mô hình phù hợp nhất với dữ liệu trên? Hãy giải thích tại sao?

Câu 21:

Cho mô hình mối quan hệ giữa thuế phụ thuộc như thế nào đối với thu nhập (theo dữ liệu trong file DATA3-4 thuộc bộ dữ liệu của Ramanathan).

Trong đó:

Tax = Số thuế mà công ty phải nộp

Income = thu nhập của doanh nghiệp

a) Trước khi chạy hồi qui anh/chị hãy dự báo mối quan hệ của thuế và thu nhập. Lý giải sự lựa chọn của mình.

b) Ước lượng các hệ số trong mô hình tuyến tính.

c) Hãy vẽ các đồ thị cần thiết và kiểm tra xem mô hình có bị HET không ?

d) Thực hiện kiểm định white để kiểm tra lại kết luận ở câu c.

e) Nếu mô hình trên bị HET theo các anh/chị làm cách nào để khắc phục. Đưa ra phương pháp mà anh chị cho là phù hợp và giải thích kết quả của mô hình.

Câu 22:

Xem xét dữ liệu về diện tích ảnh hưởng như thế nào đến giá nhà được trình bày trong file DATA3-1 thuộc bộ dữ liệu của Ramanathan. Trong đó:

PRICE = Giá nhà (lượng vàng)

SQRT = Diện tích nhà (m2)

Với mức ý nghĩa 5%, anh/chị hãy:

a) Hãy ước lượng các tham số trong mô hình tuyến tính. Anh/ chị hãy dùng các đồ thị cho biết mô hình trên có bị bệnh HET không ?

b) Thực hiện kiểm định white để kiểm tra lại kết luận ở câu b.

c) Nếu mô hình trên bị HET theo các anh/chị làm cách nào để khắc phục. Đưa ra phương pháp mà anh chị cho là phù hợp và giải thích kết quả của mô hình.

Câu 23:

Cho mô hình các yếu tố tác động đến lương (theo dữ liệu trong file DATA6-4 thuộc bộ dữ liệu của Ramanathan).

Trong đó:

Wage = Lương (triệu đồng/tháng)

Exper = Thâm niên (năm)

Educ = Thời gian đi học (năm)

Age = tuổi

a) Hãy thực hiện thống kê mô tả cho bộ dữ liệu trên

b) Hãy ước lượng các tham số trong mô hình tuyến tính. Anh/ chị hãy dùng các đồ thị cho biết mô hình trên có bị bệnh HET không ?

c) Thực hiện kiểm định white để kiểm tra lại kết luận ở câu b.

d) Nếu mô hình trên bị HET theo các anh/chị làm cách nào để khắc phục. Đưa ra phương pháp mà anh chị cho là phù hợp và giải thích kết quả của mô hình.

Câu 24:

Cho mô hình mối quan hệ giữa lương theo thâm niên (theo dữ liệu trong file DATA8-1 thuộc bộ dữ liệu của Ramanathan).

Trong đó:

Salary = Lương hiện tại

Year = Số năm làm việc

Giả sử mô hình hồi quy tổng thể có dạng

(PRF) : Salary = 1 + 2 Year + ut

a) Trước khi chạy hồi qui anh/chị hãy dự báo mối quan hệ của các hệ số 2, 3 . Lý giải sự lựa chọn của mình.

b) Ước lượng các hệ số trong mô hình.

c) Hãy vẽ các đồ thị cần thiết và kiểm tra xem mô hình có bị HET không ?

d) Thực hiện kiểm định white để kiểm tra lại kết luận ở câu c.

e) Nếu mô hình trên bị HET theo các anh/chị làm cách nào để khắc phục. Đưa ra phương pháp mà anh chị cho là phù hợp và giải thích kết quả của mô hình.

TƯƠNG QUAN CHUỖI

Câu 25:

Dùng dữ liệu trong Data 9-12 trong bộ dữ liệu của Ramanathan với các định nghĩa biến như sau:

PCECARS = Chỉ tiêu tiêu dùng cá nhân vào mua xe mới (tỷ USD)

PCDPY = Thu nhập cá nhân bình quân (ngàn USD)

POP = Dân số Mỹ (triệu người)

CPINEW = Chỉ số giá tiêu dùng cho xe hơi mới

Để ước lượng mô hình sau:

PRF: PCECARSt = 1 + 2PCDPYt + 3POPt + 4CPINEWt +ut

Với mức ý nghĩa 5%, các anh/chị hãy:

a) Viết phương trình hồi qui mẫu cho mô hình này.

b) Vẽ đồ thị phần dư của mô hình hồi qui ở câu a theo thời gian. Dựa vào đồ thị nói trên Anh/Chị có ý kiến gì về vấn đề tương quan chuỗi.

c) Cẩn thận hơn anh chị hãy kiểm định nhân tử Lagrange để kiểm định phần dư có tương quan chuỗi bậc 1 không?

d) Hãy khắc phục hiện tượng tương quan chuỗi trong phép hồi qui trên (nếu có). Đề nghị trình bày chi tiết cách thực hiện.

TỔNG HỢP

Câu 26:

Cho mô hình mối quan hệ giữa số phát minh sáng kiến theo chi phí dành cho việc phát minh (theo dữ liệu trong file DATA3-3 thuộc bộ dữ liệu của Ramanathan).

Trong đó:

Patents = Số phát minh sáng kiến

r_d = Chi phí dành cho việc nghiên cứu và phát triển

a) Trước khi chạy hồi qui anh/chị hãy dự báo mối quan hệ của các hệ số giữa các biến độc lập ảnh hưởng như thế nào đến biến phụ thuộc. Lý giải sự lựa chọn của mình.

b) Thực hiện vẽ đồ thị thể hiện mối quan hệ giữa biến độc lập và biến phụ thuộc. Anh/chị có nhận xét gì về kết quả trên thu được?

c) Anh/chị hãy ước lượng các tham số với mô hình tuyến tính. Theo anh/chị

Mô hình trên có bị đa cộng tuyến không ?

Mô hình trên có bị HET không?

Mô hình trên có bị AR không ?

Nếu có anh/chị hãy thực hiện các kiểm định cần thiết và khắc phục những hiện tượng này cho mô hình

e) Bạn An nói rằng nên thay mô hình trên bằng mô hình khác như log kép; Bạn Thủy nói rằng mô hình độ trễ sẽ phù hợp hơn vì số phát minh sáng kiến năm nay có khi phụ thuộc vào số tiền dành cho nghiên cứu phát triển của khoảng 3 năm về trước; bạn

Nam đồng ý với bạn Thủy về việc sử dụng mô hình độ trễ nhưng đề nghị mô hình nên thêm biến số phát minh sáng kiến của năm ngoái vì nếu số phát minh sáng kiến năm ngoái cũng có ảnh hưởng đến số phát minh sáng kiến năm nay. Nếu phải lựa chọn anh/chị sẽ chọn mô hình của bạn nào? Tại sao?

f) Trong các mô hình trên theo anh/chị mô hình nào là mô hình phù hợp nhất ? tại sao?

g) Theo anh/chị làm cách nào để tăng số phát minh sáng kiến.

Câu 27:

Bảng dữ liệu 4-8 trong bộ dữ liệu của Ramanathan cho dữ liệu về số đăng ký thuê bao được yêu cầu lắp đặt cho mỗi hệ thống cáp truyền hình (sub) ở bang California. Biến phụ thuộc là sub số đăng ký thuê bao được yêu cầu lắp đặt cho mỗi hệ thống cáp truyền hình (1000 khách hàng). Các biến độc lập bao gồm:

home = số hộ gia đình mà mỗi hệ thống cáp truyền hình đi ngang qua (ngàn hộ)

inst = phí lắp đặt (đô la/ lần)

svc = phí dịch vụ cho mỗi hệ thống (đô la/tháng)

tv = số kênh truyền hình mà mỗi hệ thống cáp cung cấp (kênh/hệ thống cáp)

age = thời gian hệ thống đã hoạt động (năm)

air = số kênh truyền hình mà hộ gia đình nhận được từ hệ thống cáp

y = thu nhập bình quân đầu người (đô la/người)

a) Trước khi chạy hồi qui anh/chị hãy dự báo mối quan hệ của các hệ số giữa các biến độc lập ảnh hưởng như thế nào đến biến phụ thuộc, và giữa các biến độc lập có mối quan hệ nào với nhau không. Lý giải sự lựa chọn của mình.

b) Lập ma trận tương quan giữa các biến. Anh/chị có nhận xét gì về kết quả thu được?

c) Anh/chị hãy ước lượng các tham số với mô hình tuyến tính. Theo anh/chị

Mô hình trên có bị đa cộng tuyến không ?

Mô hình trên có bị HET không?

Mô hình trên có bị AR không ?

Nếu có anh/chị hãy thực hiện việc khắc phục những hiện tượng trên.

d) Một bạn khác nói rằng nên thay mô hình trên bằng mô hình khác như đa thức, log kep, bán log, hoặc kết hợp cả 3 mô hình trên. Nếu phải lựa chọn anh/chị sẽ chọn mô hình nào? Tại sao?

e) Trong các mô hình trên theo anh/chị mô hình nào là mô hình phù hợp nhất ? tại sao?

f) Theo anh/chị có biện pháp nào để tăng lượng đăng ký thuê bao được yêu cầu lắp đặt cho mỗi hệ thống cáp truyền hình.

Câu 28:

Bảng dữ liệu 4-6 trong bộ dữ liệu của Ramanathan cho dữ liệu về các tỷ lệ nghèo khó và các yếu tố tác động đến những tỷ lệ này ở 58 địa hạt của California. Biến phụ thuộc là

POVRATE được xác định bằng phần trăm các gia đình có thu nhập dưới mức nghèo khó. Các biến độc lập bao gồm:

UNEMP = Tỷ lệ phần trăm thất nghiệp

URB = Phần trăm của tổng dân số thành thị

MEDINC = Giá trị trung vị của thu nhập gia đình tính theo đơn vị ngàn USD

HIGHSCHL = Phần trăm dân số từ 25 tuổi trở lên có trình độ học vấn bậc trung học

FAMSIZE = Số người trong một hộ gia đình

COLLEGE = Phần trăm dân số từ 25 tuổi trở lên đã hoàn tất chương trình cao đẳng

a) Trước khi chạy hồi qui anh/chị hãy dự báo mối quan hệ của các hệ số giữa các biến độc lập ảnh hưởng như thế nào đến biến phụ thuộc, và giữa các biến độc lập có mối quan hệ nào với nhau không. Lý giải sự lựa chọn của mình.

b) Lập ma trận tương quan giữa các biến. Anh/chị có nhận xét gì về kết quả thu được?

c) Anh/chị hãy ước lượng các tham số với mô hình tuyến tính. Theo anh/chị

Mô hình trên có bị đa cộng tuyến không ?

Mô hình trên có bị HET không?

Mô hình trên có bị AR không ?

Nếu có anh/chị hãy thực hiện việc khắc phục những hiện tượng trên.

d) Một bạn khác nói rằng nên thay mô hình trên bằng mô hình khác như đa thức, log kep, bán log, hoặc kết hợp cả 3 mô hình trên. Nếu phải lựa chọn anh/chị sẽ chọn mô hình nào ? Tại sao ?

e) Trong các mô hình trên theo anh/chị mô hình nào là mô hình phù hợp nhất ? tại sao?

f) Thống đốc bang California muốn giảm tỷ lệ nghèo khó ở bang mình. Nếu anh chị là trợ lý của thống đốc anh chị sẽ khuyên thống đốc nên chú trọng vào những công việc gì để giảm tỷ lệ nghèo xuống.

Câu 29:

Để xác định các yếu tố ảnh hưởng như thế nào đến chỉ tiêu tiêu dùng cá nhân vào mua xe mới (PCECARS), dùng dữ liệu trong Data 9-12 trong bộ dữ liệu của Ramanathan với các định nghĩa biến như sau:

PCECARS = Chỉ tiêu tiêu dùng cá nhân vào mua xe mới (tỷ USD)

PCDPY = Thu nhập cá nhân bình quân (ngàn USD)

POP = Dân số Mỹ (triệu người)

CPINEW = Chỉ số giá tiêu dùng cho xe hơi mới

a) Trước khi chạy hồi qui anh/chị hãy dự báo mối quan hệ của các hệ số giữa các biến độc lập ảnh hưởng như thế nào đến biến phụ thuộc, và giữa các biến độc lập có mối quan hệ nào với nhau không. Lý giải sự lựa chọn của mình.

b) Lập ma trận tương quan giữa các biến. Anh/chị có nhận xét gì về kết quả thu được?

c) Anh/chị hãy ước lượng các tham số với mô hình tuyến tính. Theo anh/chị

Mô hình trên có bị đa cộng tuyến không ?

Mô hình trên có bị HET không?

Mô hình trên có bị AR không ?

Nếu có anh/chị hãy thực hiện các kiểm định và biện pháp khắc phục cần thiết

d) Một bạn khác nói rằng nên thay mô hình trên bằng mô hình khác như đa thức, log kep, bán log, hoặc kết hợp cả 3 mô hình trên. Nếu phải lựa chọn anh/chị sẽ chọn mô hình nào ? Tại sao ?

e) Trong các mô hình trên theo anh/chị mô hình nào là mô hình phù hợp nhất ? tại sao?

f) Trong các yếu tố trên theo anh chỉ yếu tố nào vô cùng quan trọng ảnh hưởng đến việc mua xe mới của người dân. Nếu anh chị cần phải ra quyết định tăng số lượng xe mới bán ra trong thời gian tới anh/chị sẽ làm gì?

Câu 30:

Dùng dữ liệu trong Data 7-2 trong bộ dữ liệu của Ramanathan với các định nghĩa biến như sau:

CLERICAL = Nếu nghề nghiệp là nhân viên văn phòng bằng 1

CRAFTS = Nếu nghề nghiệp là thợ thủ công bằng 1

MAINT = Nếu nghề nghiệp nhân viên bảo trì bằng 1

GENDER = giới tính bằng 1 nếu là nam và bằng 0 nếu là nữ

RACE = màu da (da trắng là 1 và da màu là 0)

AGE = Độ tuổi của nhân viên

EDUC = Số năm đi học trên lớp 9 tại thời điểm mà người đó được thuê

EXPER = Số năm kinh nghiệm tại cơ quan đó

WAGE = Tiền lương của nhân viên

Với mức ý nghĩa 5%, Các anh chị hãy

a) Hãy phân tích mối quan hệ giữa kỳ vọng của tiền lương của nhân viên (wage) với các biến khác trong dữ liệu

b) Ước lượng mô hình kinh tế lượng trên theo mô hình tuyến tính. Trong mô hình trên có đa cộng tuyến hoặc hiện tượng phương sai thay đổi không? Tại sao? Nếu có các anh chị hãy đưa ra biện pháp khắc phục và giải thích ý nghĩa các hệ số của mô hình tốt nhất.

c) Anh A cho rằng mô hình tuyến tính không phù hợp mà mô hình tốt nhất phải là mô hình bán log. Theo các anh/chị tại sao anh A lại nói vậy? Các anh chị hãy ước lượng mô hình bán log của anh A và giải thích ý nghĩa các hệ số trong mô hình này.

d) Theo các anh chị hai mô hình câu b và c mô hình nào tốt nhất? Tại sao?