Xử lý các vấn đề trong dữ liệu bảng (cơ bản)

Trong các phần trước về dữ liệu bảng, chúng ta đã đề cập đến vấn đề ước lượng dữ liệu bảng (link), kiểm định dữ liệu bảng (link1, link2).
Khá nhiều bạn khi xử lý các dữ liệu bảng cơ bản gặp vấn đề là khi xảy ra các hiện tượng này ( tương quan chuỗi hay phương sai sai số thay đổi) thì phải xử lý tiếp theo thế nào.
Trong bài viết này chúng ta sẽ thảo luận vấn đề xử lý ( ở mức cơ bản) nếu gặp phải các hiện tượng này xảy ra trong model:
1. Nguyên tắc xử lý
Nếu xảy ra các hiện tượng không mong muốn trong mô hình làm cho mô hình không còn hiệu quả tối ưu nữa thì chúng ta nên thực hiện các xử lý sau:
- Xem lại dữ liệu: missing, dữ liệu của chúng ta ( cách tính, công thức tính). Đây là vấn đề đầu tiên chúng ta nên xem lại trước khi đi đến các vấn đề khác, model có thể cải thiện đáng kể từ việc xem xét điều chỉnh lại dữ liệu  do cách tính của chúng ta ( xem lại có các cách đo lường biến khác không, hay xem lại từng bước xem có lỗi gì xảy ra làm sai lệch cách tính của chúng ta). Tuy nhiên, chúng ta nên hạn chế việc loại bỏ dữ liệu trong mẫu ( đặc biệt các mẫu thứ cấp).
- Điều chỉnh các biến: việc thực hiện các biến mới bằng các cách tính như Ln có thể giúp ích rất nhiều trong việc cải thiện hiệu quả model, chúng ta cũng cần xem lại mối tương quan giữa các biến trong model, xem xét tính liên kết giữa các biến đôi khi vấn đề nằm ở đây.
- Thực hiện các bước chuyển đổi sang các model khác để xử lý vấn đề: bước này chúng ta sẽ hiệu chỉnh model bằng cách thực hiện các option trong ước lượng hay chuyển sang ước lượng các model khác để xử lý các vấn đề trong model hiện tại.
2. Giới thiệu các ước lượng khắc phục hiện tượng phương sai sai số thay đổi
- Cách đơn giản nhất để thực hiện khắc phực hiện tượng phương sai sai số thay đổi là thực hiện ước lượng vững trong model (robust) - trong stata chúng ta có thể thực hiện ước lượng vững bằng option robust.
- Cách tiếp theo để thực hiện khắc phục hiện tượng này là thực hiện chuyển sang các model khác như GLS, hay GMM.
3. Hiện tượng phương sai sai số thay đổi
- Có thể thực hiện xem xét đưa biến dừng vào để tăng tính hiệu quả cho model.
- Thực hiện chuyển sang các model khác trong dữ liệu bảng: GLS, FD hay GMM ( xtabond,..)

0 comments:

Post a Comment