CÁC VẤN ĐỀ TRONG
KIỂM ĐỊNH XỬ LÝ DỮ LIỆU BẢNG
Vấn đề đặt ra tại sao thông thường không nhận thấy
các kiểm định như trong mô hình OLS ta hay sử dụng để phát hiện các
hiện tượng:
1- Hiện tượng đa cộng tuyến – multi-colinear
2- Hiện tượng tự tương quan- autocorrelation
3- Hiện tượng phương sai thay đổi – heteroskedasticity
Để giải quyết vấn đề này đầu tiên ta đi vào cấu
trúc dữ liệu bảng và “ nguyên lý” đẩy chúng ta đến việc sử dụng
phân tích dữ liệu bảng.
I. Cấu trúc dữ liệu bảng
Như chúng ta đã biết, cấu trúc dữ liệu bảng được
kết hợp từ 2 thành phần: thành phần dữ liệu chéo ( cross – section)
và thành phần dữ liệu theo chuỗi thời gian ( time series). Việc kết hợp
2 loại dữ liệu có nhiều lợi thế và thuận lợi trong phân tích, đặc
biệt khi muốn quan sát, phân tích sự biến động của các nhóm đối
tượng nghiên cứu sau các biến cố hay theo thời gian cũng như phân tích
sự khác biệt giữa các giữa các nhóm đối tượng nghiên cứu.
Có 2 kiểu cấu trúc dữ liệu bảng: cân bằng và không
cân bằng ( unbalance ), dĩ nhiên, dữ liệu bảng không cân bằng (thiếu
thông tin) sẽ có những hạn chế trong các ước lượng. Điều này sẽ
được đề cập trong từng mô hình ước lượng cụ thể.
II. Hồi quy dữ liệu bảng
Đầu tiên, các vấn đề trong hồi quy dữ liệu bảng
trong phân tích cơ bản thường có các mô hình chính sau: POOL, FEM, REM
sau đó khi cần phân tích từng bước và sâu hơn người ta mới quan tâm
đến các mô hình SUR, IVs,…
Việc sử dụng các mô hình này phần nào đã giải
thích về việc dùng các kiểm định thống kê.
Mô hình POOL thực chất là mô hình OLS bình thường,
điều này xảy ra khi chúng ta sử dụng dữ liệu bảng như một đám mây
dữ liệu bình thường không phân biệt theo năm và như vậy khi hồi quy mô
hình POOL chính là mô hình OLS. Điều này cho thấy nếu như mô hình POOL
thực sự phù hợp với dữ liệu hơn 2 mô hình sau thì việc chúng ta sử
dụng phân tích bằng mô hình FEM, REM không còn nhiều ý nghĩa. Điều đó
dẫn đến trường hợp lúc này chúng ta chỉ cần xem xét mô hình OLS cho
dữ liệu có được và thực hiện các kiểm định bình thường ( 8 giả
định OLS). Đây là một cách giải thích cho sự thiếu vắng các kiểm
định trong các nghiên cứu về dữ liệu bảng khi mà các nhà nghiên cứu cần tập trung
vào các mô hình FEM, REM để phân tích. Mặc khác, đây cũng là gợi ý
cho các kiểm định phát hiện các vấn đề trước khi quyết định phân
tích theo các mô hình khác nhau.
Thứ 2, mô hình FEM tự bản thân chỉ quan đến những
khác biệt mang tính cá nhân đóng góp vào mô hình nên sẽ không có
hiện tượng tự tương quan trong mô hình
Thứ 3, mô hình REM quan tâm đến cả vấn đề về những
khác biệt của riêng các đối tượng phân tích qua thời gian đóng góp
vào mô hình do đó tự tương quan là một vấn đề tiềm tàng trong mô
hình này cần phải giải quyết ( được giải quyết bằng phân tích động
dữ liệu bảng – dynamic panel data analysis) đồng thời nó lại loại bỏ
tốt yếu tố phương sai thay đổi ( có thể kiểm tra trong thực tế bằng
cách lấy hàm log rồi chạy mô hình sẽ thấy kết quả ko thay đổi
nhiều).
III. Các kiểm định khuyến nghị
1. Đầu tiên là việc xem xét mô hình OLS và thực hiện
kiểm định thử để phát hiện các vấn đề.
2. Kiểm định quan trọng nhất là kiểm định lựa chọn:
Hausman test. Đây là kiểm định với giả thiết Ho là có sự khác biệt
trong chính cá nhân đó – REM)
3. Có thể kiểm định thêm các vấn đề:
- Thứ nhất, kiểm
định phương sai thay đổi cho mô hinh FEM bằng packages được xây dựng thêm
trong stata: xttest3
- Thứ 2, kiểm định phát hiện tác động ngẫu nhiên :
Lagrange multiplier với giả định Ho là không có tác động.
Ngoài ra, khi phát
hiện có các hiện tượng về biến nội sinh thì chuyển sang các mô hình
2SLS, IVs, GMM,…
Mình muốn hỏi là làm thế nào để phát hiện ra biến nội sinh trong panel data
ReplyDeletenữa là khi chạy panel thì vấn đề dummy có còn quan trọng nữa ko vì khi mình chạy với fe thì coefficient của dummy đều bằng 0
Cảm ơn bạn
Bạn ơi, bạn có thể trình bày rõ hơn về các fix tự tương quan trong Panel Data được không? Cảm ơn bạn rất nhiều
ReplyDelete