Đa cộng tuyến
Tương quan cao giữa các biến độc lập
Hậu quả:
- Gây ra sai số chuẩn của ước lượng lớn. Điều này dẫn đến việc
thống kê t sẽ nhỏ đi tức là khả năng bác bỏ Ho nhỏ đi
- Có phương sai và đồng phương sai lớn.
Dấu hiệu
- R2 rất cao mặc dù các biến ước lượng không có ý
nghĩa thống kê.
- Tương quan của các biến cao, dấu trái với dấu kỳ vọng.
- Khoảng tin cậy ước lượng rộng hơn (vì t nhỏ hơn)
Kiểm định vấn đề:
- Thực hiện hồi quy phụ kiểm định hồi quy phụ hoặc sử dụng
quy tắc kinh nghiệm của Klien (1962) xem xét R2 hồi quy phụ và R2
của mô hình, nếu hồi quy phụ cao hơn thì xảy ra vấn đề đa cộng tuyến.
- Xem xét chỉ số VIF, nếu VIF từ 10 thì chắc chắn xảy ra vấn
đề đa cộng tuyến, VIF >= 3 thì đủ cơ sở để nghi ngờ có hiện tượng đa cộng
tuyến trong mô hình.
VIF = 1/(1-r23^2)
- Xem xét giá đặc trưng và chỉ số điều kiện: CI = sqrt(k), nếu
CI nằm giữa 10 và 30 thì có đa cộng tuyến trung bình đến cao, nếu trên 30 thì
có đa cộng tuyến cao.
Có cần phải quan tâm đến đa cộng tuyến
- Nếu sử dụng mô hình cho mục tiêu dự báo thì không cần quan
tâm.
- R2 hồi quy phụ và R2 của mô hình, nếu
hồi quy phụ cao hơn thì có thể bỏ qua vấn đề đa cộng tuyến.
- Nếu các biến vẫn có ý nghĩa thống kê ( t>2) thì có thể
bỏ qua vấn đề đa cộng tuyến.
Nguyên nhân
- Vấn đề cỡ mẫu nhỏ hay đa cộng tuyến có hệ quả tương tự vấn
đề cỡ mẫu nhỏ ( Golberger trang 248-250)
Giải pháp
- Sử dụng thông tin đã có sẵn về mối liên hệ giữa các biến.
- Tăng cỡ mẫu, chọn mẫu đại diện.
- Xem xét loại bỏ biến tuy nhiên cần cẩn trọng vì có nguy cơ
mắc phải sai lầm đặc trưng trong mô hình,
- Sử dụng dữ liệu chéo kết hợp với dữ liệu chuỗi thời gian :
pooling the data , sử dụng dữ liệu bảng
- Thay đổi dạng hàm (ln)
- Thay đổi mô hình: phân tích nhân tố, hồi quy dạng sóng
(ridge regression). Chaterjee, Regression analysis by example.
0 comments:
Post a Comment