CÁC VẤN ĐỀ TRONG KIỂM ĐỊNH XỬ LÝ DỮ LIỆU BẢNG
Vấn đề đặt ra tại sao thông thường không nhận thấy các kiểm định như trong mô hình OLS ta hay sử dụng để phát hiện các hiện tượng:
1- Hiện tượng đa cộng tuyến – multi-colinear
2- Hiện tượng tự tương quan- autocorrelation
3- Hiện tượng phương sai thay đổi – heteroskedasticity
Để giải quyết vấn đề này đầu tiên ta đi vào cấu trúc dữ liệu bảng và “ nguyên lý” đẩy chúng ta đến việc sử dụng phân tích dữ liệu bảng.
I. Cấu trúc dữ liệu bảng
Như chúng ta đã biết, cấu trúc dữ liệu bảng được kết hợp từ 2 thành phần: thành phần dữ liệu chéo ( cross – section) và thành phần dữ liệu theo chuỗi thời gian ( time series). Việc kết hợp 2 loại dữ liệu có nhiều lợi thế và thuận lợi trong phân tích, đặc biệt khi muốn quan sát, phân tích sự biến động của các nhóm đối tượng nghiên cứu sau các biến cố hay theo thời gian cũng như phân tích sự khác biệt giữa các giữa các nhóm đối tượng nghiên cứu.
Có 2 kiểu cấu trúc dữ liệu bảng: cân bằng và không cân bằng ( unbalance ), dĩ nhiên, dữ liệu bảng không cân bằng (thiếu thông tin) sẽ có những hạn chế trong các ước lượng. Điều này sẽ được đề cập trong từng mô hình ước lượng cụ thể.
II. Hồi quy dữ liệu bảng
Đầu tiên, các vấn đề trong hồi quy dữ liệu bảng trong phân tích cơ bản thường có các mô hình chính sau: POOL, FEM, REM sau đó khi cần phân tích từng bước và sâu hơn người ta mới quan tâm đến các mô hình SUR, IVs,…
Việc sử dụng các mô hình này phần nào đã giải thích về việc dùng các kiểm định thống kê.
Mô hình POOL thực chất là mô hình OLS bình thường, điều này xảy ra khi chúng ta sử dụng dữ liệu bảng như một đám mây dữ liệu bình thường không phân biệt theo năm và như vậy khi hồi quy mô hình POOL chính là mô hình OLS. Điều này cho thấy nếu như mô hình POOL thực sự phù hợp với dữ liệu hơn 2 mô hình sau thì việc chúng ta sử dụng phân tích bằng mô hình FEM, REM không còn nhiều ý nghĩa. Điều đó dẫn đến trường hợp lúc này chúng ta chỉ cần xem xét mô hình OLS cho dữ liệu có được và thực hiện các kiểm định bình thường ( 8 giả định OLS). Đây là một cách giải thích cho sự thiếu vắng các kiểm định trong các nghiên cứu về dữ liệu bảng  khi mà các nhà nghiên cứu cần tập trung vào các mô hình FEM, REM để phân tích. Mặc khác, đây cũng là gợi ý cho các kiểm định phát hiện các vấn đề trước khi quyết định phân tích theo các mô hình khác nhau.
Thứ 2, mô hình FEM tự bản thân chỉ quan đến những khác biệt mang tính cá nhân đóng góp vào mô hình nên sẽ không có hiện tượng tự tương quan trong mô hình
Thứ 3, mô hình REM quan tâm đến cả vấn đề về những khác biệt của riêng các đối tượng phân tích qua thời gian đóng góp vào mô hình do đó tự tương quan là một vấn đề tiềm tàng trong mô hình này cần phải giải quyết ( được giải quyết bằng phân tích động dữ liệu bảng – dynamic panel data analysis) đồng thời nó lại loại bỏ tốt yếu tố phương sai thay đổi ( có thể kiểm tra trong thực tế bằng cách lấy hàm log rồi chạy mô hình sẽ thấy kết quả ko thay đổi nhiều).
III. Các kiểm định khuyến nghị
1. Đầu tiên là việc xem xét mô hình OLS và thực hiện kiểm định thử để phát hiện các vấn đề.
2. Kiểm định quan trọng nhất là kiểm định lựa chọn: Hausman test. Đây là kiểm định với giả thiết Ho là có sự khác biệt trong chính cá nhân đó – REM)
3. Có thể kiểm định thêm các vấn đề:
 - Thứ nhất, kiểm định phương sai thay đổi cho mô hinh FEM bằng packages được xây dựng thêm trong stata: xttest3
- Thứ 2, kiểm định phát hiện tác động ngẫu nhiên : Lagrange multiplier với giả định Ho là không có tác động.
 Ngoài ra, khi phát hiện có các hiện tượng về biến nội sinh thì chuyển sang các mô hình 2SLS, IVs, GMM,…

2 comments:

  1. Mình muốn hỏi là làm thế nào để phát hiện ra biến nội sinh trong panel data
    nữa là khi chạy panel thì vấn đề dummy có còn quan trọng nữa ko vì khi mình chạy với fe thì coefficient của dummy đều bằng 0
    Cảm ơn bạn

    ReplyDelete
  2. Bạn ơi, bạn có thể trình bày rõ hơn về các fix tự tương quan trong Panel Data được không? Cảm ơn bạn rất nhiều

    ReplyDelete