Nobel Kinh tế 2021: Các ý tưởng cơ bản của David Card, Joshua Angrist & Guido Imbens
Hôm bữa có bạn hỏi sao Tú là dân labor economics mà viết nhiều về randomized controlled trials (RCT) trong nghiên cứu vaccine. Thực ra, mình chỉ quan tâm đến thiết kế nghiên cứu và phương pháp phân tích. Chẳng hạn, một điểm “mới mẻ” đó là Pfizer/BioNTech sử dụng phân tích Bayesian đánh giá hiệu quả vaccine. Vì sao “mới”? Mặc dù phương pháp không mới, nhưng được ứng dụng vào lĩnh vực được coi là cực kỳ nghiêm ngặt về tiêu chuẩn nghiên cứu.
Mặc dù RCT được công nhận là phương pháp lý tưởng (gold standard) để suy luận nhân quả. Tuy nhiên, trong lĩnh vực khoa học xã hội, đặc biệt là kinh tế học, cực kỳ khó và trong nhiều trường hợp là hầu như không thể áp dụng RCT để đánh giá tác động chính sách. Do đó, người nghiên cứu kinh tế phải sử dụng các phương pháp thay thế, chẳng hạn như natural experiment hay quasi-experiment.
Các phương án thiết kế thí nghiệm và phi thí nghiệm nói trên có những đặc điểm tương đồng với RCT. Do đó, kinh nghiệm và phương pháp nghiên cứu RCT trong lĩnh vực y dược cũng ảnh hưởng đến các phương pháp nghiên cứu trong kinh tế.
Năm 2019, mình đã lý giải ý nghĩa công trình nghiên cứu của Abhijit Banerjee, Esther Duflo & Michael Kremer thông qua ứng dụng field experiments trong kinh tế phát triển và chính sách xóa đói giảm nghèo (link: https://bit.ly/3lusD9v)
Năm nay, giải Nobel Kinh tế 2021 thuộc về ba nhà kinh tế lao động David Card, Joshua Angrist & Guido Imbens bởi đóng góp về phương pháp luận trong việc phân tích các mối quan hệ nhân quả bằng cách ứng dụng "natural experiments" trong phân tích về thị trường lao động.
THẾ NÀO LÀ "NATURAL EXPERIMENT"?
Phải nhấn mạnh rằng, cách gọi "natural experiments" (trang tin chính thức của giải Nobel và các tờ báo uy tín như WSJ cũng dùng cụm từ này) ở đây là mơ hồ. Không có một định nghĩa thống nhất về thuật ngữ "natural experiment:"
- Quan điểm phổ biến cho rằng: "Tự nhiên" được hiểu như là nguyên nhân gây ra bởi "các lực lượng tự nhiên." Chẳng hạn như thiên tai, hoặc các biến độc lập như giới tính sinh học, chủng tộc.
- Quan điểm thứ hai xem "tự nhiên" nghĩa là không liên quan đến việc cố tình ảnh hưởng đến các biến độc lập để phục vụ cho mục đích nghiên cứu. Nghĩa là, quan điểm này chấp nhận các nguyên nhân do con người tạo ra. Ví dụ điển hình nhất của trường hợp này là nghiên cứu tác động của chính sách thuế đến hành vi tiêu dùng (chính sách được áp đặt bởi chính phủ, chứ không phải người nghiên cứu).
- Quan điểm thứ ba: "Natural experiments" cũng có thể được coi là một trường hợp đặc biệt của quasi-experiment. Điểm khác biệt đó là ở "natural experiments", quá trình phân công đối tượng vào các nhóm đối chứng và nhóm can thiệp về cơ bản là ngẫu nhiên (as-if randomization) (Dunning, 2012)
- Mặt khác, "natural experiments" được dùng để chỉ các nghiên cứu về sự kiện có tính chất ngoại sinh, không được hoạch định trước. Trong khi đó, quasi-experiment đánh giá các sự kiện can thiệp có kế hoạch, nhưng có tính chất ngoại sinh (không được kiểm soát bởi người nghiên cứu) (Remler & Van Ryzin, 2014, pp. 467–500).
Tóm lại, hiện nay tồn tại ít nhất 4 mô hình phân loại để phân biệt giữa "natural experiment," quasi-experiment, và randomized experiment. Tuy vậy, các cách phân loại này cũng không rõ ràng.
Sự khác biệt nền tảng giữa natural experiments và RCT đó là: Ở natural experiments, quá trình phân công đối tượng vào các nhóm đối chứng và nhóm can thiệp không được kiểm soát bởi người nghiên cứu.
ĐÓNG GÓP CỦA CARD, ANGRIST & IMBENS CHO KINH TẾ HỌC THỰC NGHIỆM
Đối với RCT trong nghiên cứu vaccine, người nghiên cứu có thể phân công đối tượng vào hai nhóm bằng chọn mẫu ngẫu nhiên.
Tuy nhiên, nghiên cứu kinh tế là chuyện hoàn toàn khác. Chẳng hạn, khi nghiên cứu hành vi giữa người vay vốn và người không vay vốn. Không thể phân loại người vay vốn là nhóm treatment, còn nhóm control là những người không vay vốn. Điều này sai về thiết kế nghiên cứu.
- Thứ nhất, người vay vốn và người không đi vay khác nhau về động lực, hoàn cảnh kinh tế.
- Thứ hai, sự phân loại này hiển nhiên không phải là quá trình ngẫu nhiên.
- Thứ ba, người nghiên cứu không thể áp đặt chọn mẫu ngẫu nhiên để gán nhóm bởi vì khi đó: Người cần vay sẽ không được cho vay, và người không có nhu cầu vay lại được cho vay ("non-compliance" problem).
Vấn đề "non-compliance" là một trong các vấn đề cơ bản của nghiên cứu kinh tế bởi vì hiện tượng này phát sinh ngay cả khi người nghiên cứu không áp đặt quá trình phân công đối tượng. Chẳng hạn, trong nghiên cứu xóa đói giảm nghèo, tăng trợ cấp không nhất thiết sẽ dẫn đến hành vi tích cực (e.g. tiết kiệm, đầu tư cho giáo dục, tăng chi tiêu thực phẩm). Hiển nhiên, bởi vì bias, ước lượng average treatment effect (ATE) sẽ không chính xác. Khi ngoại hiệu lực (external validity) không đảm bảo, chúng ta sẽ không thể khái quát hóa kết quả nghiên cứu trong dân số chung.
Trước năm 1994, trong lĩnh vực kinh tế lượng, để xác định average treatment effect (ATE) chủ yếu thông qua biến công cụ (instrumental variables). Quá trình này đôi khi được xem là "partial identification." Lí do? Vấn đề "non-compliance" đã nói ở trên.
Sau đó, Angrist & Imbens (1995) khắc phục vấn đề xác định ATE bằng cách đề xuất local average treatment effect (LATE).
Đóng góp quan trọng nhất của Angrist cho kinh tế học thực nghiệm nói riêng, và khoa học xã hội nói chung phải kể đến 2SLS/TSLS (two stage least squares) (Angrist, 1991) Trước đó, các mô hình chính sách thường giả định chỉ tồn tại một biến công cụ. Tuy nhiên, trong thực tế, chúng ta thường gặp phải tình huống: Có hơn 2 biến ngoại sinh nằm ngoài mô hình cấu trúc. Về cơ bản, 2SLS là sự mở rộng của OLS để cho phép nhiều biến công cụ hơn.
Nếu đóng góp lớn nhất cho ngành kinh tế lượng của Angrist & Imbens là IV estimation và 2SLS, thì không thể không nói đến đóng góp của David Card vào các mô hình DID (Difference in differences) & DDD (Difference in difference in differences).
DID (hay "khác biệt trong khác biệt") là phương pháp tiêu chuẩn, cơ bản nhất, và được ứng dụng rộng rãi nhất để xác định average treatment effect (ATE). Ý tưởng cơ bản của DID đó là cung cấp một giải pháp sở hữu những đặc điểm tương đồng với các nghiên cứu RCT. Đây là lí do vì sao người nghiên cứu kinh tế nói chung cần hiểu rõ randomized controlled trials.
Sử dụng DID, Card & Krueger (1994) đã chứng minh rằng: Trái ngược với quan điểm truyền thống của kinh tế học lý thuyết về mức lương tối thiểu, họ không tìm thấy bằng chứng cho thấy tăng lương tối thiểu làm giảm việc làm tại các nhà hàng fast-food ở New Jersey. Mô hình nghiên cứu về lương tối thiểu của David Card là ví dụ cơ bản, và điển hình nhất khi nghiên cứu về DID.
Lí do mà Card & Krueger chọn các nhà hàng fast-food để khảo sát bởi vì đặc điểm của người lao động, người tuyển dụng, và tính chất công việc tương đối đồng nhất. Chẳng hạn, hầu hết người phục vụ ở các nhà hàng fast-food là người lao động thu nhập thấp. Các nhà hàng fast-food tuân theo quy định lương tối thiểu. Ảnh hưởng của tiền tips trong lương thấp hơn so với các nhà hàng truyền thống, do đó dễ đo lường tác động của lương tối thiểu.
Ý tưởng và phương pháp của David Card, Joshua Angrist & Guido Imbens đã góp phần hoàn thiện phương pháp suy luận nhân quả trong môi trường phi thí nghiệm (non-experimental), tạo nền tảng vững chắc cho kinh tế học ứng dụng.
Ngoài ra, ảnh hưởng này còn thể hiện rõ ở: Khoa học chính trị (political sciences). Về mặt lịch sử, sự hài hòa giữa lý thuyết và thực nghiệm ở khoa học chính trị tương đối mất cân bằng hơn kinh tế học. Thách thức hơn dữ liệu kinh tế, các sự kiện chính trị nói chung là khó tái lập và đo lường. Do đó, xu hướng chính trị học thực nghiệm áp dụng các mô hình kế thừa từ kinh tế học là một điều tích cực.
Trong thời đại Machine Learning & AI, giải Nobel Kinh tế đã được trao cho những đóng góp dựa trên phương thức nền tảng: ordinary least squares (OLS). Gần 30 năm, các ý tưởng, kỹ thuật và mô hình David Card, Joshua Angrist & Guido Imbens đứng vững với thời gian và trở thành tri thức thiết yếu trong nghiên cứu kinh tế lượng nói riêng, và khoa học xã hội nói chung.
References
Angrist, J. D. (1991). Grouped-data estimation and testing in simple labor-supply models. Journal of Econometrics, 47(2-3), 243–266. https://doi.org/10.1016/0304-4076(91)90101-i
Angrist, J. D., & Imbens, G. W. (1995, February 1). Identification and Estimation of Local Average Treatment Effects. National Bureau of Economic Research. https://www.nber.org/papers/t0118
Card, D., & Krueger, A. B. (1994). Minimum Wages and Employment: A Case Study of the Fast-Food Industry in New Jersey and Pennsylvania. The American Economic Review, 84(4), 772–793. https://www.jstor.org/stable/2118030
Dunning, T. (2012). Natural Experiments in the Social Sciences: A Design-Based Approach. In Cambridge University Press. Cambridge University Press. https://www.cambridge.org/core/books/natural-experiments-in-the-social-sciences/96A64CBDC2A2952DC1C68AF77DE675AF
Remler, D. K., & Van Ryzin, G. G. (2014). Research methods in practice - Strategies for description and causation (2nd ed., pp. 467–500). SAGE Publications, Inc.