Đa cộng tuyến

Vấn đề:
Tương quan cao giữa các biến độc lập

Hậu quả: 


- Gây ra sai số chuẩn của ước lượng lớn. Điều này dẫn đến việc thống kê t sẽ nhỏ đi tức là khả năng bác bỏ Ho nhỏ đi
- Có phương sai và đồng phương sai lớn.

Dấu hiệu


- R2 rất cao mặc dù các biến ước lượng không có ý nghĩa thống kê.
- Tương quan của các biến cao, dấu trái với dấu kỳ vọng.
- Khoảng tin cậy ước lượng rộng hơn (vì t nhỏ hơn)

Kiểm định vấn đề:


- Thực hiện hồi quy phụ kiểm định hồi quy phụ hoặc sử dụng quy tắc kinh nghiệm của Klien (1962) xem xét R2 hồi quy phụ và R2 của mô hình, nếu hồi quy phụ cao hơn thì xảy ra vấn đề đa cộng tuyến.
- Xem xét chỉ số VIF, nếu VIF từ 10 thì chắc chắn xảy ra vấn đề đa cộng tuyến, VIF >= 3 thì đủ cơ sở để nghi ngờ có hiện tượng đa cộng tuyến trong mô hình.
VIF = 1/(1-r23^2)
- Xem xét giá đặc trưng và chỉ số điều kiện: CI = sqrt(k), nếu CI nằm giữa 10 và 30 thì có đa cộng tuyến trung bình đến cao, nếu trên 30 thì có đa cộng tuyến cao.

Có cần phải quan tâm đến đa cộng tuyến


- Nếu sử dụng mô hình cho mục tiêu dự báo thì không cần quan tâm.
- R2 hồi quy phụ và R2 của mô hình, nếu hồi quy phụ cao hơn thì có thể bỏ qua vấn đề đa cộng tuyến.
- Nếu các biến vẫn có ý nghĩa thống kê ( t>2) thì có thể bỏ qua vấn đề đa cộng tuyến.

Nguyên nhân

- Vấn đề cỡ mẫu nhỏ hay đa cộng tuyến có hệ quả tương tự vấn đề cỡ mẫu nhỏ ( Golberger trang 248-250)

Giải pháp

- Sử dụng thông tin đã có sẵn về mối liên hệ giữa các biến.
- Tăng cỡ mẫu, chọn mẫu đại diện.
- Xem xét loại bỏ biến tuy nhiên cần cẩn trọng vì có nguy cơ mắc phải sai lầm đặc trưng trong mô hình,
- Sử dụng dữ liệu chéo kết hợp với dữ liệu chuỗi thời gian : pooling the data , sử dụng dữ liệu bảng
- Thay đổi dạng hàm (ln)
- Thay đổi mô hình: phân tích nhân tố, hồi quy dạng sóng (ridge regression). Chaterjee, Regression analysis by example.


0 comments:

Post a Comment