Saturday, April 4, 2009

Gian lận trong khoa học

Thỉnh thoảng lại thấy rộ lên một vụ gian lận trong khoa học quốc tế. (Trong khoa học Việt Nam tôi nghe thấy nhiều hơn, không rõ có phải vì thực sự có nhiều gian lận hơn so với quốc tế, hay vì tôi chú ý đến thông tin Việt Nam, và dễ cập nhật về thông tin Việt Nam hơn.) Sự kiện gần đây nhất là vụ bê bối của Scott Reuben, được thông báo trên Scientific American. Chuyện nghe tương đối "phi thực tế" (unreal) trong giới khoa học; rất tiếc, nó cho thấy hệ thống đăng tải nghiên cứu, dù dựa vào đánh giá của đồng nghiệp (peer review), vẫn có những lỗ hổng ghê gớm.

Tôi đồ rằng trong những ngành khoa học mà việc đăng kết quả chính thức sớm có ảnh hưởng lớn, thì dễ có những vụ bê bối hơn. Lý do là vì quá trình đăng báo chịu nhiều sức ép hơn, và vì thế dễ để lọt những kết quả giả tạo hoặc sai sót.

Tôi thử so sánh hệ thống đăng báo và đánh giá đồng nghiệp của ngành Y với ngành Kinh tế. Các báo lớn trong ngành Y (tôi được giải thích tường tận về báo New England Journal of Medicine, một trong những báo hàng đầu ngành Y) có tổ chức và mức độ hoạt động rất mạnh: NEJM có nguyên một cơ sở, thuê nhiều người làm bồi bút, việc văn phòng, vv. để giục và đảm bảo quá trình đánh giá bài viết (refereeing) diễn ra đúng tiến độ. Thường bài viết trong ngành được thông báo và đăng trong vòng vài tuần, chậm lắm thì đến bốn tháng nửa năm. Các báo hàng đầu trong ngành Kinh tế cũng chỉ có một bộ phận nhỏ giáo sư biên tập (editor). Ví dụ, báo Quarterly Journal of Economics có 3 người làm biên tập, trong khi có hàng ngàn bài được gửi đến hàng năm. Báo có thể sử dụng thời gian của một, hai thư ký, vốn là nhân viên của khoa kinh tế trường Harvard, và chỉ làm nửa thời gian (part-time) cho báo. Tất nhiên, việc xuất bản cuối cùng thuộc về phía nhà xuất bản MIT (MIT Press), song phải nói là với lực lượng của báo rất ít, có ít động cơ để người làm đánh giá thực hiện việc của mình nhanh chóng.

Thành ra, một bài báo Kinh tế mất hàng năm trời mới ra được mặt báo. (Thời gian kéo dài 5-6 năm không phải là ít.) Trong suốt thời gian đó, bài báo đã được xào đi xào lại dưới dạng bài nghiên cứu (working paper), và được truyền tay (online) trong cộng đồng nghiên cứu. (Vì vẫn chưa được đăng, nên tác giả vẫn phải lấy thêm ý kiến từ nhiều hội thảo, seminar, vv.) Nhờ đó, khó có khả năng một kết quả sai sót có thể sống sót trong suốt quá trình này. Phải nói là bài làm lý thuyết dễ kiểm chứng hơn, song bài thực nghiệm cũng hay được kiểm chứng, khi mà các giáo sư có thể giao việc kiểm chứng như là bài tập cho nghiên cứu sinh những năm đầu. (Thường là dữ liệu của các bài được đăng báo phải có thể được sử dụng lại cho việc kiểm chứng.) Cũng có một vài ví dụ về kết quả sai sót được phát hiện ra, mà ví dụ nổi tiếng là hai bài báo của Steve Levitt, tác giả Freakonomics (cho dù là Levitt tuyên bố sau khi chỉnh sửa lại, vẫn có thể kết luận tương tự như trước). Tuy vậy, dễ thấy là rất khó có khả năng giả tạo hoàn toàn kết quả một cách có hệ thống như những gì Scott Reuben đã làm.

Tôi không nói sự chậm chạp của quá trình đăng báo là một việc đáng làm và nên làm trong ngành kinh tế. Đặc tính này bị hầu hết các nhà kinh tế học phàn nàn, vì nó làm quá trình xét duyệt biên chế (tenure decision) trở nên rất khó khăn và ngẫu nhiên. (Thử nghĩ, một phó giáo sư muốn có bài báo xét duyệt cho biên chế năm thứ 5, thì bài đó phải hoàn thành và gửi đi đăng từ năm thứ nhất !) Tuy vậy, qua ví dụ về gian lận và bê bối, tôi nghĩ hệ thống này cũng có điểm lợi thế.

2 comments:

  1. Nice blog QA.

    Thanh

    ReplyDelete
  2. Một lý do nữa theo tôi là các công trình trong kinh tế học (thực nghiệm) rất dễ replicate, chỉ cần có số liệu. Trong khi nhiều ngành khoa học khác có muốn cũng chưa chắc đã đủ điều kiện để làm.

    ReplyDelete